ES2763551T3 - Promotores y vectores recombinantes para la expresión de proteínas en el hígado y uso de los mismos - Google Patents

Promotores y vectores recombinantes para la expresión de proteínas en el hígado y uso de los mismos Download PDF

Info

Publication number
ES2763551T3
ES2763551T3 ES16720253T ES16720253T ES2763551T3 ES 2763551 T3 ES2763551 T3 ES 2763551T3 ES 16720253 T ES16720253 T ES 16720253T ES 16720253 T ES16720253 T ES 16720253T ES 2763551 T3 ES2763551 T3 ES 2763551T3
Authority
ES
Spain
Prior art keywords
seq
aav
itr
vector
nucleotides
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
ES16720253T
Other languages
English (en)
Inventor
Christopher Doering
Trent Spencer
Harrison Brown
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Childrens Heatlhcare Of Atlanta Inc
Emory University
Childrens Healthcare of Atlanta Inc
Original Assignee
Childrens Heatlhcare Of Atlanta Inc
Emory University
Childrens Healthcare of Atlanta Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Childrens Heatlhcare Of Atlanta Inc, Emory University, Childrens Healthcare of Atlanta Inc filed Critical Childrens Heatlhcare Of Atlanta Inc
Application granted granted Critical
Publication of ES2763551T3 publication Critical patent/ES2763551T3/es
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/48Hydrolases (3) acting on peptide bonds (3.4)
    • C12N9/50Proteinases, e.g. Endopeptidases (3.4.21-3.4.25)
    • C12N9/64Proteinases, e.g. Endopeptidases (3.4.21-3.4.25) derived from animal tissue
    • C12N9/6421Proteinases, e.g. Endopeptidases (3.4.21-3.4.25) derived from animal tissue from mammals
    • C12N9/6424Serine endopeptidases (3.4.21)
    • C12N9/644Coagulation factor IXa (3.4.21.22)
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K48/00Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K48/00Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy
    • A61K48/005Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy characterised by an aspect of the 'active' part of the composition delivered, i.e. the nucleic acid delivered
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K48/00Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy
    • A61K48/005Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy characterised by an aspect of the 'active' part of the composition delivered, i.e. the nucleic acid delivered
    • A61K48/0058Nucleic acids adapted for tissue specific expression, e.g. having tissue specific promoters as part of a contruct
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P7/00Drugs for disorders of the blood or the extracellular fluid
    • A61P7/02Antithrombotic agents; Anticoagulants; Platelet aggregation inhibitors
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P7/00Drugs for disorders of the blood or the extracellular fluid
    • A61P7/04Antihaemorrhagics; Procoagulants; Haemostatic agents; Antifibrinolytic agents
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/435Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
    • C07K14/745Blood coagulation or fibrinolysis factors
    • C07K14/755Factors VIII, e.g. factor VIII C (AHF), factor VIII Ag (VWF)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/85Vectors or expression systems specially adapted for eukaryotic hosts for animal cells
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/85Vectors or expression systems specially adapted for eukaryotic hosts for animal cells
    • C12N15/86Viral vectors
    • C12N15/861Adenoviral vectors
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/85Vectors or expression systems specially adapted for eukaryotic hosts for animal cells
    • C12N15/86Viral vectors
    • C12N15/864Parvoviral vectors, e.g. parvovirus, densovirus
    • C12N15/8645Adeno-associated virus
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/85Vectors or expression systems specially adapted for eukaryotic hosts for animal cells
    • C12N15/86Viral vectors
    • C12N15/867Retroviral vectors
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N7/00Viruses; Bacteriophages; Compositions thereof; Preparation or purification thereof
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y304/00Hydrolases acting on peptide bonds, i.e. peptidases (3.4)
    • C12Y304/21Serine endopeptidases (3.4.21)
    • C12Y304/21022Coagulation factor IXa (3.4.21.22)
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K38/00Medicinal preparations containing peptides
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2750/00MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssDNA viruses
    • C12N2750/00011Details
    • C12N2750/14011Parvoviridae
    • C12N2750/14111Dependovirus, e.g. adenoassociated viruses
    • C12N2750/14132Use of virus as therapeutic agent, other than vaccine, e.g. as cytolytic agent
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2750/00MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssDNA viruses
    • C12N2750/00011Details
    • C12N2750/14011Parvoviridae
    • C12N2750/14111Dependovirus, e.g. adenoassociated viruses
    • C12N2750/14141Use of virus, viral particle or viral elements as a vector
    • C12N2750/14143Use of virus, viral particle or viral elements as a vector viral genome or elements thereof as genetic vector
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2830/00Vector systems having a special element relevant for transcription
    • C12N2830/008Vector systems having a special element relevant for transcription cell type or tissue specific enhancer/promoter combination

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Engineering & Computer Science (AREA)
  • Organic Chemistry (AREA)
  • Zoology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Health & Medical Sciences (AREA)
  • Wood Science & Technology (AREA)
  • Biomedical Technology (AREA)
  • Biotechnology (AREA)
  • Biochemistry (AREA)
  • General Engineering & Computer Science (AREA)
  • Molecular Biology (AREA)
  • Medicinal Chemistry (AREA)
  • Microbiology (AREA)
  • Biophysics (AREA)
  • Pharmacology & Pharmacy (AREA)
  • Animal Behavior & Ethology (AREA)
  • Public Health (AREA)
  • Veterinary Medicine (AREA)
  • Plant Pathology (AREA)
  • Physics & Mathematics (AREA)
  • Epidemiology (AREA)
  • Hematology (AREA)
  • Virology (AREA)
  • Toxicology (AREA)
  • Gastroenterology & Hepatology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Diabetes (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • General Chemical & Material Sciences (AREA)
  • Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
  • Immunology (AREA)
  • Medicines That Contain Protein Lipid Enzymes And Other Medicines (AREA)
  • Medicines Containing Material From Animals Or Micro-Organisms (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)

Abstract

Una molécula de ácido nucleico recombinante, que comprende: un promotor específico de hígado que comprende un primer elemento de respuesta de no más de 160 nucleótidos de longitud que comprende: un sitio de unión al factor de transcripción (TF) HNF1a que comprende o que consiste en los nucleótidos 1-12 de la SEQ ID NO: 4, un sitio de unión al TF HNF1-1 que comprende o que consiste en los nucleótidos 16-23 de la SEQ ID NO: 4; un sitio de unión al TF HNF4 que comprende o que consiste en los nucleótidos 26-36 de la SEQ ID NO: 4; un sitio de unión al TF HNF3a que comprende o que consiste en los nucleótidos 39-45 de la SEQ ID NO: 4; un sitio de unión al TF HNF1-2 que comprende o que consiste en los nucleótidos 48-62 de la SEQ ID NO: 4; un sitio de unión al TF HNF3-2 que comprende o que consiste en los nucleótidos 65-71 de la SEQ ID NO: 4 un sitio de unión al TF HP1 que comprende o que consiste en los nucleótidos 75-87 de la SEQ ID NO: 4; una caja TATA que comprende o que consiste en los nucleótidos 108-114 de la SEQ ID NO: 4; y un Sitio de Inicio de la Transcripción que comprende o que consiste en los nucleótidos 116-146 de la SEQ ID NO: 4.

Description

DESCRIPCIÓN
Promotores y vectores recombinantes para la expresión de proteínas en el hígado y uso de los mismos
Campo de la divulgación
La presente invención se refiere a promotores y vectores recombinantes de expresión transgénica, así como a moléculas de ácidos nucleicos recombinantes que codifican nuevos factores de coagulación.
Antecedentes
Las mutaciones en el gen del factor de coagulación VIII (fVIII) dan como resultado una proteína disminuida o defectuosa del factor de coagulación (fVIII) que da lugar a la hemofilia A, que se caracteriza por un sangrado incontrolado. La hemofilia B se asocia de manera similar con el factor de coagulación IX (fIX). El tratamiento de la hemofilia A generalmente implica una infusión intravenosa de varias semanas de por vida de producto de fVIII derivado de plasma humano o recombinante. Debido al alto coste, menos del 30% de la población mundial con hemofilia A recibe esta forma de tratamiento. Además, alrededor del 25 % de los pacientes tratados con productos de reemplazo de fVIII desarrollan anticuerpos neutralizantes que hacen que el tratamiento futuro sea ineficaz. Por lo tanto, existe la necesidad de identificar terapias mejoradas.
Las terapias génicas se basan generalmente en virus genéticamente modificados diseñados para suministrar transgenes funcionales al paciente para que sus propias células puedan biosintetizar las proteínas carentes o defectuosas. Se han realizado avances clínicos usando vectores de virus adenoasociados recombinantes (rAAV) para la expresión de fIX en el hígado; sin embargo, el uso de rAAV para la expresión de fVIII en pacientes con hemofilia A ha sido un desafío debido a la biosíntesis ineficaz de fVIII humano (hfVIII). Los vectores víricos adenoasociados recombinantes (rAAV) producen cápsides que tienen un espacio limitado para encapsular ácidos nucleicos. El FVIII es una glicoproteína grande, y las secuencias de rAAV necesarias para codificar y expresar fVIII generalmente exceden la capacidad de empaquetamiento de la cápside.
Sumario
En el presente documento se divulgan realizaciones de una nueva molécula de ácido nucleico recombinante que comprende un promotor que se ha optimizado para tener una longitud mínima y promover la expresión de proteínas específicas de tejido. En la invención, el promotor es un promotor específico de hígado que promueve sustancialmente más expresión de proteínas en el hígado y en las células hepáticas que en otros tipos de tejidos. En algunas realizaciones, el promotor puede incluirse en un vector vírico (tal como un vector de virus adenoasociado) en combinación operativa con una secuencia del ácido nucleico heterólogo que codifica una proteína de interés para promover la expresión de la proteína de interés, por ejemplo en tejido y/o células del hígado.
Por lo tanto, la invención proporciona una molécula de ácido nucleico recombinante que comprende un promotor específico de hígado que comprende un primer elemento de respuesta de no más de 160 nucleótidos de longitud que comprende: un sitio de unión al factor de transcripción (TF, por sus siglas en inglés) HNF1a que comprende o que consiste en los nucleótidos 1-12 de la SEQ ID NO: 4, un sitio de unión al TF HNF1-1 que comprende o que consiste en los nucleótidos 16-23 de la SEQ ID NO: 4, un sitio de unión al TF HNF4 que comprende o que consiste en los nucleótidos 26-36 de la SEQ ID NO: 4, un sitio de unión al TF HNF3a que comprende o que consiste en los nucleótidos 39-45 de la SEQ ID NO: 4, un sitio de unión al TF HNF1-2 que comprende o que consiste en los nucleótidos 48-62 de la SEQ ID NO: 4, un sitio de unión al TF HNF3-2 que comprende o que consiste en los nucleótidos 65-71 de la SEQ ID NO: 4, un sitio de unión al TF HP1 que comprende o que consiste en los nucleótidos 75-87 de la SEQ ID NO: 4, una caja TATA que comprende o que consiste en los nucleótidos 108-114 de la SEQ ID NO: 4, y un Sitio de Inicio de la Transcripción que comprende o que consiste en los nucleótidos 116-146 de la SEQ ID NO: 4. El primer elemento de respuesta es de no más de 160 nucleótidos de longitud (tal como no más de 150 nucleótidos de longitud, tal como de 146 nucleótidos de longitud).
En algunas realizaciones, el primer elemento de respuesta comprende, de 5' a 3', el sitio de unión al TF HNF1a, el sitio de unión al TF HNF1-1, el sitio de unión al TF HNF4, el sitio de unión al TF HNF3a, el sitio de unión al TF HNF1-2, el sitio de unión al TF HNF3-2, el sitio de unión al TF HP1, la caja TATA y el Sitio de Inicio de la Transcripción (TSS, por sus siglas en inglés).
En algunas realizaciones, la molécula de ácido nucleico recombinante comprende un promotor que comprende o que consiste en la secuencia del ácido nucleico establecida como la SEQ ID NO: 4 (HCB), o una secuencia al menos un 90 % idéntica a la misma.
En algunas realizaciones, la molécula de ácido nucleico recombinante puede comprender un promotor que comprende el primer elemento de respuesta de la invención, y puede comprender además un segundo elemento de respuesta. El segundo elemento de respuesta puede comprender, por ejemplo, un elemento de respuesta HSh (por ejemplo, que comprende o que consiste en la secuencia de nucleótidos establecida como la SEQ ID NO: 111, o una secuencia al menos un 90 % idéntica a la misma), un elemento de respuesta 5'HS (por ejemplo, que comprende o que consiste en la secuencia de nucleótidos establecida como los nucleótidos 6-32 de la s Eq ID NO: 111, o una secuencia al menos un 90 % idéntica a la misma), o un elemento de respuesta 3'HS ( por ejemplo, que comprende o que consiste en la secuencia de nucleótidos establecida como los nucleótidos 44-68 de la SEQ ID NO: 111, o una secuencia al menos un 90 % idéntica a la misma).
En algunas realizaciones, la molécula de ácido nucleico recombinante comprende un promotor que comprende o que consiste en la secuencia del ácido nucleico establecida como una de las SEQ ID NO: 102 (HSh-HCB), SEQ ID NO: 104 (5'HSh-HCB), o SEQ ID NO: 103 (3'HSh-HCB), o una secuencia al menos un 90 % idéntica a una de las SEQ ID NO: 102 (HSh-HCB), SEQ ID NO: 104 (5'HSh-HCB), o SEQ ID NO: 103 (3'HSh-HCB). En aspectos adicionales de la presente divulgación, una molécula de ácido nucleico recombinante puede comprender un promotor que comprende o que consiste en la secuencia del ácido nucleico establecida como una de las SEQ ID NO: 5 (shortABP-HPl-God-TSS), SEQ ID NO: 7 (ABP-HP1-God-TSS), SEQ ID NO: 105 (HSh-SynO-TSS), SEQ ID NO: 106 (sHS-SynO-TSS), SEQ ID NO: 107 (Agro), SEQ ID NO: 108 (HS-SynO-TSS), o SEQ ID NO: 112 (HNF1-Short- ABPExact-SynO-TSS-Int), o una secuencia al menos un 90 % idéntica a una de las SEQ ID NO: 5 (shortABP-HP1-God-TSS), SEQ ID NO: 7 (ABP-HP1-God-TSS), SEQ ID NO: 105 (HSh-SynO-TSS), SEQ ID NO: 106 (sHS-SynO-TSS), SEQ ID NO: 107 (Agro), SEQ ID NO: 108 (HS-SynO-TSS), o SEQ ID NO: 112 (HNF1-ShortABPExact-SynO-TSS-Int).
En algunas realizaciones, el promotor de la invención puede incluirse en un vector, tal como un vector vírico (por ejemplo, un vector de virus adenoasociado). En algunas realizaciones, el promotor se incluye en el vector en combinación operativa con una secuencia del ácido nucleico heterólogo que codifica una proteína de interés para promover la expresión de la proteína de interés, por ejemplo en tejido y/o células del hígado. En algunas realizaciones, la proteína de interés puede ser un factor de coagulación, tal como 1VIII o fIX o una variante de los mismos, tal como una variante de fVIII que comprende los dominios A1, A2, A3, C1 y C2 de fVIII, con los dominios A2 y A3 unidos por un enlazador peptídico y deleción del dominio B de fVIII. En algunas realizaciones, la proteína de interés puede ser una variante de fVIII y la molécula de ácido nucleico heterólogo puede comprender o consistir en la secuencia del ácido nucleico establecida como la SEQ ID NO: 2, SEQ ID NO: 11, SEQ ID NO: 12, SEQ ID NO: 125, o SEQ ID NO: 126, o una secuencia del ácido nucleico al menos un 90 % idéntica a la SEQ ID NO: 2, SEQ ID NO: 11, SEQ ID NO: 12, SEQ ID NO: 125 o SEQ ID NO: 126. En algunas realizaciones, la proteína de interés puede ser un fIX y la molécula de ácido nucleico heterólogo puede comprender o consistir en la secuencia del ácido nucleico establecida como la SEQ ID NO: 8, SEQ ID NO: 9, SEQ ID NO: 10, SEQ ID NO: 124, o SEQ ID NO: 127, o una secuencia del ácido nucleico al menos un 90 % idéntica a la SEQ ID NO: 8, SEQ ID NO: 9, SEQ ID NO: 10, SEQ ID NO: 124 o SEQ ID NO: 127.
En algunas realizaciones, el vector puede ser un vector AAV recombinante que comprende un genoma que comprende una molécula de ácido nucleico que codifica cualquiera de los promotores específicos de hígado de la invención (tal como el promotor HCB, SEQ ID NO: 4) operativamente unido a una molécula de ácido nucleico heterólogo que codifica una variante de fVIII, en donde la molécula de ácido nucleico heterólogo comprende o consiste en la secuencia del ácido nucleico establecida como la SEQ ID NO: 2, SEQ ID NO: 11, SEQ ID NO: 12, SEQ ID NO: 125, o SEQ ID NO: 126, o una secuencia del ácido nucleico al menos un 90 % idéntica a la SEQ ID NO: 2, SEQ ID NO: 11, SEQ ID NO: 12, SEQ ID NO: 125 o SEQ ID NO: 126. En varias de tales realizaciones, el genoma de AAV recombinante (de 5 'a 3' ITR) no tiene más de 5,1, 5,0, 4,9, 4,8, 4,7, 4,6 o 4,5 kb de longitud.
En algunas realizaciones, el vector puede ser un vector AAV recombinante que comprende un genoma que comprende una molécula de ácido nucleico que codifica cualquiera de los promotores específicos del hígado de la invención (tal como el promotor HCB, SEQ ID NO: 4) operativamente unido a una molécula de ácido nucleico heterólogo que codifica una variante de fIX, en donde la molécula de ácido nucleico heterólogo comprende o consiste en la secuencia del ácido nucleico establecida como la SEQ ID NO: 8, SEQ ID NO: 9, SEQ ID NO: 10, SEQ ID NO: 124, o SEQ ID NO: 127, o una secuencia del ácido nucleico al menos un 90 % idéntica a la SEQ ID NO: 8, SEQ ID NO: 9, SEQ ID NO: 10, SEQ ID NO: 124 o SEQ ID NO: 127. En varias de tales realizaciones, el genoma de AAV recombinante (de 5 'a 3' ITR) no tiene más de 5,1, 5,0, 4,9, 4,8, 4,7, 4,6 o 4,5 kb de longitud.
La invención también proporciona un vector o composición de la invención para su uso en un método para inducir la coagulación de la sangre en un sujeto que lo necesite. El método comprende administrar al sujeto una cantidad terapéuticamente eficaz de un vector (tal como un vector AAV) que codifica un factor de coagulación como se describe en el presente documento. En algunas realizaciones, el sujeto es un sujeto con un trastorno de la coagulación, tal como hemofilia A o hemofilia B. En algunas realizaciones, el trastorno de la coagulación es hemofilia A y al sujeto se le administra un vector que comprende una molécula de ácido nucleico que codifica una proteína con actividad de fVIII. En otras realizaciones, el trastorno de la coagulación es hemofilia B y al sujeto se le administra un vector que comprende una molécula de ácido nucleico que codifica una proteína con actividad de fIX.
Las características y ventajas anteriores y otras de la presente divulgación serán más evidentes a partir de la siguiente descripción detallada de varias realizaciones que procede con referencia a las figuras adjuntas.
Breve descripción de las figuras
Las FIG. 1A y 1B ilustran una alineación de secuencia de los dominios A1 y A3 para ortólogos humanos y porcinos de la proteína variante ET3 de fVIII. (FIG. 1A) Alineación de la secuencia del dominio A1 para la variante ET3 humana (secuencia superior, SEQ ID NO: 13) y porcina (secuencia media, SEQ ID NO: 14) de fVIII. La secuencia inferior muestra restos idénticos. Se muestran las alineaciones de la secuencia de aminoácidos para el péptido señal (barra N-terminal), el dominio ácido de cadena pesada (barra C-terminal), el fVIII humano (arriba) y ET3 (abajo). Los enlaces disulfuro se señalan por las líneas que conectan los restos de cisteína. Los lugares donde bien la secuencia humana, ET3 o ambas secuencias codifican un sitio de unión por glicosilación ligada a N (N-X-S/T) se delinean con un recuadro. (FIG. 1B) Alineación de la secuencia del dominio A3 para la variante ET3 humana (secuencia superior, SEQ ID NO: 15) y porcina (secuencia media, SEQ ID NO: 16) de fVIII. La secuencia inferior muestra restos idénticos. Se muestran las alineaciones de la secuencia de aminoácidos para el péptido de activación (barra), fVIII humano (arriba) y ET3 (abajo). Los enlaces disulfuro se señalan por las líneas que conectan los restos de cisteína. Los lugares donde bien el humano, ET3 o ambas secuencias codifican un sitio de unión por glicosilación ligada a N (N-X-S/T) se delinean con un recuadro.
Las FIG. 2A-2C muestra tablas de preferencia codónica específica de hígado, humana completa y mieloide. La FIG. 3A muestra datos de expresión in vitro en células HepG2 que indican que la optimización de codones específicos de hígado mejora la expresión para las variantes h Sq y ET3 de la proteína fVIII.
La FIG. 3B muestra datos in vivo para HSQ y ET3 con codones optimizados que indican una mayor expresión de fVIII después de la inyección hidrodinámica de un vector AAV que codifica variantes con codones de hígado optimizados de la proteína HSQ y ET3 fVIII en ratones.
La FIG. 4 ilustra vectores AAV que codifican variantes de fVIII.
La FIG. 5 muestra datos de expresión in vitro en células HepG2 que indican que la optimización de codones específicos de hígado, pero no la optimización de codones específicos mieloides, mejora la expresión de las variantes HSQ y ET3 de la proteína fVIII en las células de hígado.
La FIG. 6 muestra datos de expresión in vitro en células HepG2 que indican que la optimización de codones específicos de hígado, pero no la optimización de codones específicos mieloides, mejora la expresión de las variantes HSQ y ET3 de la proteína fVIII en las células de hígado.
La FIG. 7 muestra datos de expresión in vitro en células HepG2 que indican que la optimización de codones específicos de hígado, pero no la optimización de codones específicos humanos, mejora la expresión de la proteína fIX en células de hígado.
La FIG. 8 ilustra promotores que comprenden un potenciador ABP o un potenciador ABP acortado (shortABP). Las FIG. 9A y 9B muestran datos sobre el uso de vectores AAV que contienen los promotores indicados para la expresión de fVIII. (FIG. 9A) Datos de expresión in vitro en células HepG2. (FIG. 9B) Expresión in vivo de fVIII después de la inyección hidrodinámica de un vector AAV.
La FIG. 10 ilustra secuencias de elementos de respuesta y componentes de los elementos de respuesta indicados. Las FIG. 11A y 11B ilustran secuencias promotoras y componentes de los promotores indicados.
Las FIG. 12A y 12B muestran datos sobre el uso de vectores AAV que contienen los promotores indicados para la expresión de fVIII. (FIG. 12A) Datos de expresión in vitro en células HepG2. (FIG. 12B) Expresión in vivo de fVIII después de la inyección hidrodinámica de un vector AAV.
La FIG. 13 ilustra secuencias promotoras y componentes de los promotores indicados.
Las FIG. 14A y 14B muestran datos sobre el uso de vectores a Av que contienen los promotores indicados para la expresión de fVIII. (FIG. 14A) Datos de expresión in vitro en células HepG2. (FIG. 14B) Expresión in vivo de fVIII después de la inyección hidrodinámica de un vector AAV.
Las FIG. 15 y 16 muestran diagramas esquemáticos que ilustran la estructura de potenciadores específicos de hígado (FIG. 15) y promotores que incluyen los potenciadores específicos de hígado (FIG. 16).
La FIG. 17 muestra datos de ensayos in vitro relacionados con el uso de vectores AAV que contienen los promotores indicados para la expresión de fVIII en células HepG2.
La FIG. 18 ilustra unos vectores AAV que codifican una variante de fVIII.
La FIG. 19 es un gráfico que muestra que la transducción de ratones con el vector AAV2-HCB-ET3-LCO-NCG-SpA (SEQ ID NO: 130) que codifica ET3 con codones de hígado optimizados con motivos CpG eliminados conduce a un aumento significativo de la actividad de fVIII en ratones transducidos.
Descripción detallada
Existe la necesidad de desarrollar una estrategia de transferencia de genes segura y eficaz para el tratamiento de la hemofilia, tal como hemofilia A y B, y hemofilia adquirida. En el contexto de las terapias génicas para el tratamiento de la hemofilia A, varios obstáculos han dificultado el desarrollo del uso de un vector vírico adenoasociado como vehículo de suministro génico, tal como la capacidad limitada de empaquetamiento de ADN del virus adenoasociado para el transgén de fVIII grande y la biosíntesis ineficaz de fVIII humano. En el presente documento se informa de un sistema de suministro de transgenes basado en AAV que utiliza mejoras para la expresión de fVIII en el contexto de la transferencia de genes por AAV dirigidos al hígado. Estos incluyen: 1) El uso de una secuencia de nucleótidos codificante que tiene una preferencia de uso de codones mejorada para la célula hepática humana en comparación con la secuencia de nucleótidos de origen natural de fVIII; 2) Optimización del uso de codones para eliminar los dinucleótidos 5'-CG-3' y otros motivos de ADN de acción en cis dañinos, por ejemplo, sitios de corte y empalme crípticos, cajas TATA, señal terminal, estructura secundaria de ARNm, señales prematuras de poliA, motivos de inestabilidad de ARN, sitios internos de unión al ribosoma; y 3) promotores dirigidos al hígado de tamaño mínimo para reducir el tamaño del transgén para que pueda usarse en el entorno de tamaño limitado del sistema de vectores víricos adenoasociados. Las mejoras pueden generalizarse para la expresión mejorada de cualquier transgén de AAV. En algunas realizaciones, el vector AAV suministra una expresión eficaz de fVIII a dosis víricos que no se predice que causen toxicidad en seres humanos.
En algunas realizaciones, estas mejoras también se pueden aplicar a fIX, especialmente para diseños de vectores fIX autocomplementarios. Los diseños autocomplementarios tienen la mitad de la capacidad de empaquetamiento que los diseños monocatenarios, por lo que las limitaciones de tamaño de los vectores (~ 2,4kb) se convierten en una preocupación incluso para fIX.
El trabajo previo sugirió que el tratamiento de ratones con deficiencia en fVIII (hemofilia A) con un vector AAV que codifica una forma modificada de fVIII (dominio B eliminado) denominada ET3 a dosis de vector que varían de 5x1011-2x1013 pv/ kg podría corregir teóricamente su deficiencia de fVIII y fenotipo hemorrágico (véase Brown et al., "Bioengineered Factor FVIII Enables Long-Term Correction of Murine Hemophilia A Following Liver-Directed Adeno-Associated Viral Vector Delivery", Molecular Therapy - Methods and Clinical Development. 1:14036, 2014). Sin embargo, debido al genoma de gran tamaño de ET3, el vector sufría una baja fabricación de títulos y una heterogeneidad sustancial entre partículas. El gran tamaño del genoma ET3-AAV con codones optimizados seguía siendo incompatible con el empaquetamiento eficaz del vector vírico. Para los vectores AVV, se prefiere un tamaño de genoma de AAV de no más de 4,7-5,0 kb para obtener un mayor rendimiento y consistencia que los genomas que exceden de 5,0kb. La secuencia codificante de ET3 con el dominio B eliminado es de 4,4 kb. Sin embargo, con la adición de los elementos de control vírico y regulador necesarios, los genomas de fVIII ET3-AAV excedieron sustancialmente la capacidad de empaquetamiento.
Por primera vez se divulga en el presente documento un genoma fVIII (ET3 u otra variante con dominio B eliminado) -AAV de menos de 5,0 kb de longitud que se desarrolló para permitir tanto la expresión mejorada de fVIII (o variante del mismo) como un empaquetamiento vírico eficaz. Se siguieron múltiples etapas para reducir el tamaño del genoma de AAV a niveles aceptables. Por ejemplo, se utilizó un enfoque de ensamblaje del sitio de unión al factor de transcripción combinatorio para crear un conjunto de promotores específicos de hígado que varían en tamaño. Estos promotores representan una reducción de tamaño del 30-90 % sobre los promotores específicos de hígado utilizados actualmente, tal como HLP y HCR-hAAT, que varían en tamaño de 250 a más de 700 bases. Algunos de estos promotores impulsan niveles de expresión y especificidad transgénica comparables o mejores a los observados con HLP y HCR-hAAT.
Una barrera importante para el desarrollo de terapias clínicas exitosas basadas en la transferencia de genes es la disponibilidad de elementos genéticos de origen natural o sintéticos capaces de expresión funcional, y a menudo dirigida o restringida por el tipo celular, en el contexto de un casete de ácido nucleico suministrado por vectores ( véase, por ejemplo, Papadakis et al., "Promoters and control elements: designing expression cassettes for gene therapy", Curr Gene Ther., 4( 1):89-113, 2004). En general, se cree que los promotores existentes naturalmente han sido perfeccionados por la evolución para impulsar la expresión finamente sintonizada a través de la combinación de múltiples secuencias reguladoras en cis. En la mayoría de los organismos vivos, y especialmente en eucariotas con grandes tamaños de genoma, no parece haber una fuerza impulsora para limitar el tamaño del promotor y, por lo tanto, la mayoría de los promotores endógenos se extienden en cientos, y más a menudo miles, de pares de bases de ADN (pb). Debido a su tamaño, estos promotores de genes naturales endógenos generalmente no son susceptibles de inclusión en productos de terapia génica debido a limitaciones de tamaño.
Los promotores víricos endógenos, por otro lado, han evolucionado para poseer una eficacia de fuerza y tamaño que los hace atractivos para su uso en tecnologías de transferencia de genes. Los ejemplos más destacados incluyen el promotor temprano inmediato (IE, por sus siglas en inglés) de citomegalovirus (CMV), el promotor tardío principal de adenovirus (Ad), el promotor del virus simio 40 (SV40) y la repetición terminal larga (LTR por sus siglas en inglés) del virus de la leucemia murina de Moloney (MoMLV). Cada uno de estos promotores puede impulsar la transcripción de alto nivel de transgenes heterólogos exógenos en una variedad de tipos de células eucariotas. Sin embargo, de manera no sorprendente, las células eucariotas han desarrollado mecanismos de defensa celular para detectar e inactivar eficazmente (es decir, silenciar) los promotores víricos y, por lo tanto, estos promotores funcionan más eficazmente en sistemas modelo de cultivo celular que las aplicaciones de terapia génica in vivo.
Por estas razones, ha habido un interés significativo en el desarrollo de promotores sintéticos, ya sea genéricos (véase, por ejemplo, Juven-Gershon et al., "Rational design of a super core promoter that enhances gene expression", Nat Methods, 3(11):917-22, 2006; Schlabach et al., "Synthetic design of strong promoters". PNAS, 2010;107(6):2538-43, 2010), o adaptados a aplicaciones específicas de terapia génica, incluidas la hemofilia A y B (véase, por ejemplo, McIntosh et al., "Therapeutic levels of FVIII following a single peripheral vein administration of rAAV vector encoding a novel human factor VIII variant", Blood, 121(17):3335-44, 2013; Nair et al., "Computationally designed liver-specific transcriptional modules and hyperactive factor IX improve hepatic gene therapy", Blood, 123(20):3195-9, 2014).
El conocimiento de los promotores y las mejoras sigue siendo limitado y actualmente no es posible diseñar por ordenador un promotor óptimo con ninguna confianza. Estudios como los descritos por Juven-Gershon y Kadonaga han avanzado en la definición de diseños optimizados de promotores centrales, como su Super Core Promoter 1 (SCP1) y son informativos en el campo. Sin embargo, como se muestra en los promotores descritos en los ejemplos ene l presente documento, que no contienen una gran similitud con SCP1 en el dominio del promotor central, estas secuencias no son necesarias para una función promotora fuerte, al menos en el contexto de aplicaciones de terapia génica dirigida al hígado (véase también, Juven-Gershon et al., "Rational design of a super core promoter that enhances gene expression", Nat Methods, 3(11):917-22, 2006).
El desarrollo del promotor más genérico se ha centrado en lograr un equilibrio óptimo de potencia transcripcional con un tamaño mínimo. En el campo del diseño de promotores dirigidos al hígado, el uso de enfoques de diseño racional por McIntosh et al. y Nair et al. (supra) condujo a la identificación de promotores para su uso en enfoques de terapia génica con AAV-fVIII y AAV-fIX. Sin embargo, a pesar del extenso estudio, ambos grupos describen diseños de promotores que son significativamente más grandes (> 252 pb) y no más (o menos) potentes que los descritos en el presente documento, tal como la SEQ ID NO: 4 (HCB). De hecho, dados los intentos previos para optimizar el diseño de promotores, fue particularmente sorprendente identificar promotores tales como los descritos en el presente documento que son más pequeños que los promotores de la técnica anterior (tal como el promotor HLP), pero potencia equivalente o mejorada para impulsar la transcripción, particularmente en el contexto de aplicaciones de terapia génica in vivo.
I. Términos
A menos que se indique otra cosa, los términos técnicos se usan según su uso convencional. Pueden encontrarse definiciones de términos comunes sobre biología molecular en Benjamin Lewin, Genes V, publicado por Oxford University Press, 1994 (ISBN 0-19-854287-9); Kendrew et al. (eds.), The Encyclopedia of Molecular Biology, publicado por Blackwell Science Ltd., 1994 (ISBN 0-632-02182-9); y Robert A. Meyers (ed.), Molecular Biology and Biotechnology: a Comprehensive Desk Reference, publicado por VCH Publishers, Inc., 1995 (ISBN 1-56081-569-8).
Para facilitar la revisión de las diversas realizaciones de la divulgación, se proporcionan las siguientes explicaciones de términos específicos:
5' y/o 3': Se dice que las moléculas de ácido nucleico (tal como el ADN y el ARN) tienen "extremos 5'" y "extremos 3'" porque los mononucleótidos se hacen reaccionar para formar polinucleótidos de manera tal que el fosfato 5' de un anillo de pentosa mononucleotídico esté unido al oxígeno 3' de su vecino en una dirección a través de un enlace fosfodiéster. Por lo tanto, un extremo de un polinucleótido lineal se denomina "extremo 5 '" cuando su fosfato 5' no está unido al oxígeno 3'de un anillo de pentosa mononucleotídico. El otro extremo de un polinucleótido se denomina "extremo 3'" cuando su oxígeno 3' no está unido a un fosfato 5' de otro anillo de pentosa mononucleotídico. A pesar de que un fosfato 5' de un anillo de pentosa mononucleotídico está unido al oxígeno 3' de su vecino, también se puede decir que una secuencia interna de un ácido nucleico tiene extremos 5 'y 3'.
En una molécula de ácido nucleico lineal o circular, los elementos internos discretos se denominan "cadena arriba" o 5' de los elementos "cadena abajo" o 3'. Con respecto al ADN, esta terminología refleja que la transcripción procede en una dirección de 5' a 3' a lo largo de una cadena de ADN. Los elementos promotores y potenciadores, que transcriben directamente un gen unido, generalmente se localizan 5' o cadena arriba de la región codificante. Sin embargo, los elementos potenciadores pueden ejercer su efecto incluso cuando se localizan 3' del elemento promotor y de la región codificante. Las señales de terminación de la transcripción y de poliadenilación se encuentran a 3' o cadena abajo de la región codificante.
Virus Adenoasociados (AVV): Un virus pequeño, defectuoso en la replicación, sin envoltura que infecta a los seres humanos y algunas otras especies de primates. No se sabe que el AAV cause enfermedad y provoca una respuesta inmunitaria muy leve. Los vectores de terapia génica que utilizan AAV pueden infectar tanto las células en división como las quiescentes y pueden persistir en un estado extracromosómico sin integrarse en el genoma de la célula hospedadora. Estas características hacen que AAV sea un vector vírico atractivo para terapia génica. Actualmente hay 11 serotipos reconocidos de AAV (AAV1-11).
Adm inistración/Adm inistrar: Proporcionar o dar a un sujeto un agente, tal como un agente terapéuticos (por ejemplo, un AVV recombinante), mediante cualquier vía eficaz. Las vías de administración ejemplares incluyen, aunque sin limitación, inyección ( tal como subcutánea, intramuscular, intradérmica, intraperitoneal e intravenosa), vía oral, intraductal, sublingual, rectal, transdérmica, intranasal, vaginal y por inhalación.
Ensayo de Tiempo de Sangrado: Un análisis utilizado para medir la cantidad de tiempo que tarda la sangre de un sujeto en coagularse. Se coloca un manguito de presión arterial en la parte superior del brazo y se infla. Se hacen dos incisiones en la parte inferior del brazo. Estas tienen aproximadamente 10 mm (menos de 1/2 pulgada) de largo y 1 mm de profundidad (solo lo suficientemente profundo como para causar un sangrado mínimo). El manguito de presión arterial se desinfla inmediatamente. El papel secante se hace tocar los cortes cada 30 segundos hasta que se detiene el sangrado. Se registra el tiempo que tardan los cortes en detener el sangrado. En individuos normales, no hemofílicos, el sangrado se detiene en aproximadamente uno a diez minutos y puede variar de un laboratorio a otro, dependiendo de cómo se mida el ensayo. Por el contrario, los hemofílicos graves que tienen menos del 1 % de los niveles normales del factor de coagulación apropiado tienen un tiempo de coagulación de la sangre total mayor de 60 minutos. En ratones, el tiempo de sangrado se analiza seccionando la punta de la cola y tocando periódicamente con un papel secante hasta que se forme un coágulo en la punta de la cola. El tiempo normal de sangrado es entre 2-4 minutos. Por el contrario, los ratones hemofílicos que tienen menos del 1 % de los niveles normales del factor de coagulación apropiado tienen un tiempo de sangrado de más de 15 minutos.
ADNc (AND complementario): Un fragmento de ADN que carece de segmentos internos no codificantes (intrones) y secuencias reguladoras que determinan la transcripción. El ADNc se sintetiza en el laboratorio por transcripción inversa del ARN mensajero extraído de las células. El ADNc también puede contener regiones no traducidas (UTR por sus siglas en inglés) que son responsables del control traduccional en la molécula de ARN correspondiente.
Trastorno de la coagulación: Un término general para una amplia gama de problemas médicos que conducen a una mala coagulación de la sangre y sangrado continuo. Los médicos también se refieren a los trastornos de la coagulación por términos como, por ejemplo, coagulopatía, sangrado anormal y trastornos hemorrágicos. Los trastornos de la coagulación incluyen cualquier defecto congénito, adquirido o inducido que dé como resultado un sangrado anormal (o patológico). Los ejemplos incluyen, aunque sin limitación, trastornos de coagulación insuficiente o hemostasia, tal como hemofilia A (una deficiencia en fVIII), hemofilia B (una deficiencia en fIX), hemofilia C (una deficiencia en el Factor XI), otras deficiencias en factores de coagulación (tal como Factor VII o fXIII), niveles anormales de inhibidores de factores de coagulación, trastornos plaquetarios, trombocitopenia, deficiencia de vitamina K y enfermedad de von Willebrand.
Algunos trastornos de coagulación están presentes al nacer y en algunos casos son trastornos hereditarios. Ejemplos específicos incluyen, pero sin limitación: hemofilia A, hemofilia B, deficiencia de proteína C y enfermedad de Von Willebrand. Algunos trastornos de la coagulación se desarrollan durante determinadas enfermedades (tal como la deficiencia de vitamina K, enfermedad hepática grave) o tratamientos (tal como el uso de fármacos anticoagulantes o el uso prolongado de antibióticos).
Factor de coagulación: Incluye cualquier proteína que promueva la hemostasia adecuada. En una realización, un factor de coagulación es fVIII o fIX, o una variante o fragmento de los mismos que conserva su actividad hemostática, por ejemplo, como se mide usando un ensayo APTT o un ensayo de tiempo de sangrado. En algunas realizaciones, cuando se administra en una cantidad terapéuticamente eficaz, el factor de coagulación aumenta la hemostasia en un sujeto que padece un trastorno de la coagulación, tal como hemofilia.
Factor de Coagulación VIII (fVIII): El fVIII es una proteína necesaria para la coagulación eficaz de la sangre y funciona en la coagulación como cofactor en la activación del factor X por fIX. Una concentración de aproximadamente 100 ng/ml para fVIII en la sangre se considera en el intervalo normal. La deficiencia de fVIII está asociada con la hemofilia A, y pueden producirse formas graves de la enfermedad cuando un sujeto tiene menos del 1 % de la cantidad normal de fVIII (es decir, menos de aproximadamente 1 ng de fVIII por ml de sangre). El fVIII se sintetiza como una proteína precursora de cadena sencilla de 2351 aminoácidos, que se procesa proteolíticamente. El gen del factor VIII humano (186.000 pares de bases) consta de 26 exones que varían en tamaño de 69 a 3.106 pb e intrones de hasta 32,4 kilobases (kb). Ejemplos de secuencias del ácido nucleico y proteína fVIII están disponibles públicamente (por ejemplo, véanse los números de acceso de Genbank: K01740, M14113 y E00527). En el presente documento se proporcionan variantes de fVIII que conservan la actividad de fVIII para la coagulación de la sangre pero se reducen en tamaño, tal como las variantes de fVIII que carecen del dominio B de fVIII. Variantes de fVIII ejemplares incluyen las variantes HSQ y ET3.
Factor de Coagulación IX (fIX): fIX es una proteína dependiente de la vitamina K necesaria para la coagulación eficaz de la sangre, y funciona en la coagulación como un activador del factor X. Una concentración de aproximadamente 1­ 5 |jg/ml de fIX en la sangre se considera en el intervalo normal. La deficiencia de fIX está asociada con la hemofilia B, y se producen casos graves cuando la concentración de fIX es inferior a aproximadamente el 1 % de la concentración normal de fIX (es decir, inferior a aproximadamente 0,01-0,05 jg de fIX por ml de sangre). Las secuencias del ácido nucleico y proteína fX están disponibles públicamente (por ejemplo, véanse Kurachi et al., 1982. Proc. Natl. Acad. Sci. U.S.A. 79(21):6461-4; Números de acceso de GenBank: J00136, XM045316, K02402, J00137 y M11309.
Codones optim izados: Un ácido nucleico "con codones optimizados" se refiere a una secuencia de ácido nucleico que se ha alterado de tal manera que los codones son óptimos para la expresión en un sistema particular (tal como una especie o grupo de especies particulares). Por ejemplo, una secuencia de ácido nucleico puede optimizarse para la expresión en células de mamífero o en una especie de mamífero particular (tal como las células humanas). La optimización de codones no altera la secuencia de aminoácidos de la proteína codificada.
El término "codones de aminoácidos específicos de hígado" se refiere a codones que se utilizan de manera diferencial representados en genes altamente expresados dentro del hígado humano en comparación con el uso de codones de toda la región codificante del genoma humano. Una estrategia que usa una cantidad máxima de codones de aminoácidos específicos de hígado busca evitar los codones que están subrepresentados, por ejemplo, debido a las bajas cantidades de ARNt con coincidencia de codones en las células del hígado que dan como resultado una traducción de proteínas más lenta.
Control: Un patrón de referencia. El control puede ser una muestra de control negativo obtenida de un paciente sano. En otros casos, el control es una muestra de control positivo obtenida de un paciente diagnosticado con hemofilia. En aún otros casos, el control es un control histórico o un valor de referencia patrón o un intervalo de valores (tal como una muestra de control previamente probada, tal como un grupo de pacientes con hemofilia A con pronóstico o resultado conocido, o un grupo de muestras que representan valores basales o normales).
Una diferencia entre una muestra de prueba y un control puede ser un aumento o, por el contrario, una disminución. La diferencia puede ser una diferencia cualitativa o una diferencia cuantitativa, por ejemplo, una diferencia estadísticamente significativa. En algunos ejemplos, una diferencia es un aumento o disminución, en relación con un control, de al menos aproximadamente un 5 %, tal como al menos aproximadamente un 10 %, al menos aproximadamente un 20 %, al menos aproximadamente un 30 %, al menos aproximadamente un 40 %, al menos aproximadamente un 50 %, al menos aproximadamente un 60 %, al menos aproximadamente un 70 %, al menos aproximadamente un 80 %, al menos aproximadamente un 90 %, al menos aproximadamente un 100 %, al menos aproximadamente un 150 %, al menos aproximadamente un 200 %, al menos aproximadamente un 250 %, al menos aproximadamente un 300 %, al menos aproximadamente un 350 %, al menos aproximadamente un 400 %, al menos aproximadamente un 500 % o más del 500 %.
ADN (ácido desoxirribonucleico): El ADN es un polímero de cadena larga que comprende el material genético de la mayoría de los organismos vivos (algunos virus tienen genes que comprenden ácido ribonucleico (ARN)). Las unidades que se repiten en los polímeros de ADN son cuatro nucleótidos diferentes, cada uno de los cuales comprende una de las cuatro bases, adenina (A), guanina (G), citosina (C) y timina (T) unidas a un azúcar desoxirribosa al cual se fija un grupo fosfato. Los tripletes de nucleótidos (denominados codones) codifican para cada aminoácido en un polipéptido, o para una señal de parada. El término codón también se usa para las secuencias correspondientes (y complementarias) de tres nucleótidos en el ARNm en el que se transcribe la secuencia de ADN.
A menos que se especifique lo contrario, cualquier referencia a una molécula de ADN está destinada a incluir el complemento inverso de esa molécula de ADN. Excepto cuando el texto en el presente documento necesite una hebra simple, las moléculas de ADN, aunque escritas para representar solamente una hebra simple, abarcan ambas hebras de una molécula de ADN bicatenario. Por lo tanto, una referencia a la molécula de ácido nucleico que codifica una proteína específica, o un fragmento de la misma, abarca tanto la cadena en sentido como su complemento inverso. Por ejemplo, es apropiado generar sondas o cebadores a partir de la secuencia del complemento inverso de las moléculas de ácido nucleico divulgadas.
Potenciador: Una secuencia de ácido nucleico que aumenta la velocidad de transcripción al aumentar la actividad de un promotor.
Flanqueante: Cerca o al lado de, también, incluyendo adyacente, por ejemplo, en un polinucleótido lineal o circular, tal como una molécula de ADN.
Gen: Una secuencia de un ácido nucleico, generalmente una secuencia de ADN, que comprende secuencias de control y codificantes necesarias para la transcripción de un ARN, ya sea un ARNm o no. Por ejemplo, un gen puede comprender un promotor, uno o más potenciadores o silenciadores, una secuencia de un ácido nucleico que codifica un ARN y/o un polipéptido, secuencias reguladoras cadena abajo y, posiblemente, otras secuencias de los ácidos nucleicos involucradas en la regulación de la expresión de un ARNm.
Como es bien conocido en la técnica, la mayoría de los genes eucariotas contienen tanto exones como intrones. El término "exón" se refiere a una secuencia de un ácido nucleico encontrada en el ADN genómico que se predice bioinformáticamente y/o se confirma experimentalmente que contribuye a una secuencia contigua a un transcrito de ARNm maduro. El término "intrón" se refiere a una secuencia de un ácido nucleico encontrada en el ADN genómico que se predice y/o confirma que no contribuye a un transcrito de ARNm maduro, sino que se "corta y empalma" durante el procesamiento de la transcripción.
Terapia génica: La introducción de una molécula de ácido nucleico heterólogo en una o más células receptoras, en donde la expresión del ácido nucleico heterólogo en la célula receptora afecta la función de la célula y produce un efecto terapéutico en un sujeto. Por ejemplo, la molécula heteróloga de ácido nucleico puede codificar una proteína, que afecta la función de la célula receptora.
Hemofilia: Un trastorno de la coagulación de la sangre causado por una actividad deficiente del factor de coagulación, que disminuye la hemostasia. Las formas graves se producen cuando la concentración del factor de coagulación es inferior a aproximadamente el 1 % de la concentración normal del factor de coagulación en un sujeto normal. En algunos sujetos, la hemofilia se debe a una mutación genética que da como resultado una expresión alterada de un factor de coagulación. En otros, la hemofilia es un trastorno autoinmunitario, denominado hemofilia adquirida, en el que los anticuerpos que se generan contra un factor de coagulación en un sujeto provocan una disminución de la hemostasia.
La hemofilia A es el resultado de una deficiencia del fVIII de coagulación funcional, mientras que la hemofilia B es el resultado de una deficiencia del fIX de coagulación funcional. Estas afecciones que se deben a una mutación genética son causadas por un rasgo recesivo hereditario ligado al sexo con el gen defectuoso ubicado en el cromosoma X, y esta enfermedad, por lo tanto, generalmente se encuentra solo en varones. La gravedad de los síntomas puede variar con esta enfermedad, y las formas graves se hacen evidentes desde el principio. El sangrado es el sello distintivo de la enfermedad y generalmente se produce cuando se circuncida a un bebé varón. Otras manifestaciones hemorrágicas aparecen cuando el bebé se vuelve capaz de desplazarse. Los casos leves pueden pasar desapercibidos hasta más adelante en la vida cuando se producen en respuesta a una cirugía o trauma. El sangrado interno puede producirse en cualquier lugar, y es común el sangrado en las articulaciones.
Hemostasia: Detención de sangre hemorrágica por formación de coágulos sanguíneos. El tiempo de coagulación de la sangre es el tiempo que tarda la sangre periférica en coagularse utilizando un ensayo de tiempo de tromboplastina parcial activado (APTT) o midiendo el tiempo de sangrado. En una realización particular, el tiempo de coagulación de la sangre disminuye al menos un 50 %, por ejemplo, al menos un 60 %, al menos un 70 %, al menos un 75 %, al menos un 80 %, al menos un 90 %, al menos un 95 %, al menos un 98 %, al menos un 99 % o incluso aproximadamente un 100 % (es decir, el tiempo de coagulación sanguínea es similar al observado para un sujeto normal) en comparación con el tiempo de coagulación sanguínea del sujeto antes de la administración de un vector terapéutico que codifica el factor de coagulación apropiado como se describe en el presente documento. En otra realización más, el tiempo de coagulación sanguínea en el sujeto afectado se corrige de aproximadamente el 50 % de un sujeto normal, a aproximadamente el 75 % de un sujeto normal, a aproximadamente el 90 % de un sujeto normal, a aproximadamente el 95 %, por ejemplo, aproximadamente el 100 %, después de la administración oral de una cantidad terapéuticamente eficaz del factor de coagulación apropiado. Como se usan en el presente documento, "aproximadamente" se refiere a más o menos el 5 % de un valor de referencia. Por lo tanto, aproximadamente el 50 % se refiere de 47,5 % a 52,5 %.
Intrón: Un tramo de ADN dentro de un gen que no contiene información codificante para una proteína. Los intrones se eliminan antes de la traducción de un ARN mensajero.
Repetición term inal invertida (ITR): Secuencias simétricas del ácido nucleico en el genoma de virus adenoasociados necesarias para una replicación eficaz. Las secuencias ITR se encuentran en cada extremo del genoma de ADN de AAV. Las iTr sirven como los orígenes de replicación para la síntesis de ADN vírico y son componentes en cis esenciales para generar vectores integradores de AAV.
Aislado: Un componente biológico "aislado" (tal como una molécula de ácido nucleico, proteína, virus o célula) se ha separado o purificado sustancialmente de otros componentes biológicos en la célula o en el tejido del organismo, o en el propio organismo, en el que el componente se produce naturalmente, tal como otros ADN y ARN cromosómicos y extracromosómicos, proteínas y células. Las moléculas de ácido nucleico y las proteínas que se han "aislado" incluyen los purificados por métodos de purificación convencionales. El término también abarca moléculas de ácido nucleico y proteínas preparados por expresión recombinante en una célula hospedadora, así como moléculas de ácido nucleico y proteínas sintetizados químicamente.
Moléculas de ácido nucleico: Una forma polimérica de nucleótidos, que puede incluir cadenas de ARN, ADNc, ADN genómico tanto en sentido como antisentido y formas sintéticas y polímeros mixtos de los anteriores. Un nucleótido se refiere a un ribonucleótido, desoxinucleótido o una forma modificada de cualquier tipo de nucleótido. La expresión "molécula de ácido nucleico" como se usa en el presente documento es sinónimo de "ácido nucleico" y "polinucleótido". Una molécula de ácido nucleico suele tener al menos 10 bases de longitud, a menos que se especifique otra cosa. El término incluye formas de ADN monocatenarias y bicatenarias. Un polinucleótido puede incluir bien uno o ambos nucleótidos de origen natural y modificados unidos entre sí por enlaces nucleotídicos de origen natural y/o no de origen natural. "ADNc" se refiere a un ADN que es complementario o idéntico a un ARNm, en forma monocatenaria o bicatenaria. "Codificación" se refiere a la propiedad inherente de secuencias específicas de nucleótidos en un polinucleótido, tal como un gen, un ADNc o un ARNm, para servir como plantillas para la síntesis de otros polímeros y macromoléculas en procesos biológicos que tienen una secuencia definida de nucleótidos (es decir, ARNr, ARNt y ARNm) o una secuencia definida de aminoácidos y las propiedades biológicas resultantes de los mismos.
Nucleótido: Este término incluye, aunque sin limitación, un monómero que incluye una base unida a un azúcar, tal como una pirimidina, purina o análogos sintéticos de las mismas, o una base unida a un aminoácido, tal como en un ácido nucleico peptídico (PNA). Un nucleótido es un monómero en un polinucleótido. Una secuencia de nucleótidos se refiere a la secuencia de bases en un polinucleótido.
Unido operativamente: Una primera secuencia de un ácido nucleico está operativamente unida con una segunda secuencia de un ácido nucleico cuando la primera secuencia de un ácido nucleico se coloca en una relación funcional con la segunda secuencia de un ácido nucleico. Por ejemplo, un promotor está unido operativamente a una secuencia codificante si el promotor afecta la transcripción o expresión de la secuencia codificante. Por lo general, las secuencias de ADN unidas operativamente son contiguas y, cuando es necesario unir dos regiones codificantes de proteínas, en el mismo marco de lectura.
ORF (marco de lectura abierto): Una serie de tripletes de nucleótidos (codones) que codifican aminoácidos. Estas secuencias son generalmente traducibles en un péptido.
Transportadores farmacéuticamente aceptables: Los transportadores farmacéuticamente aceptables para su uso son convencionales. Remington's Pharmaceutical Sciences, por E. W. Martin, Mack Publishing Co., Easton, PA, 19a edición, 1995, describe composiciones y formulaciones adecuadas para el suministro farmacéutico de los vectores divulgados.
En general, la naturaleza del transportador dependerá del modo particular de administración que se emplee. Por ejemplo, las formulaciones parenterales generalmente comprenden líquidos inyectables que incluyen líquidos farmacéuticamente y fisiológicamente aceptables tales como agua, solución salina fisiológica, soluciones salinas equilibradas, dextrosa acuosa, glicerol o similares como vehículo. Para las composiciones sólidas (por ejemplo, formas en polvo, píldora, comprimido o cápsula), los transportadores sólidos no tóxicos convencionales pueden incluir, por ejemplo, grados farmacéuticos de manitol, lactosa, almidón y estearato de magnesio. Además de transportadores bilógicamente neutros, las composiciones farmacéuticas (tales como las composiciones de vectores) a administrar pueden contener cantidades menores de sustancias auxiliares no tóxicas, tales como agentes humectantes o emulsionantes, conservantes y agentes tamponadores del pH y similares, por ejemplo, acetato de sodio o monolaurato de sorbitán. En realizaciones particulares, el transportador adecuado para la administración a un sujeto puede ser estéril y/o estar suspendido o contenido en una forma de dosificación unitaria que contiene una o más dosis medidas de la composición adecuada para inducir la respuesta inmunitaria deseada. También puede ir acompañado de medicamentos para su uso con fines de tratamiento. La forma de dosificación unitaria puede ser, por ejemplo, en un vial sellado que contiene contenido estéril o una jeringa para inyección en un sujeto, o liofilizado para su posterior solubilización y administración o en una dosificación de liberación controlada o sólida.
Polipéptido: Cualquier cadena de aminoácidos, independientemente de la longitud o la modificación postraduccional (p. ej., glucosilación o fosforilación). "Polipéptido" se aplica a los polímeros de aminoácidos, incluidos los polímeros de aminoácidos de origen natural y polímeros de aminoácidos de origen no natural, así como en los que uno o más restos de aminoácidos es un aminoácido no natural, por ejemplo, un mimético químico artificial de un aminoácido de origen natural correspondiente. Un "resto" se refiere a un aminoácido o mimético de aminoácido incorporado en un polipéptido por un enlace amida o un mimético de enlace amida. Un polipéptido tiene un extremo amino terminal (N-terminal) y un extremo carboxilo terminal (C-terminal). "Polipéptido" se usa indistintamente con péptido o proteína, y se usa en el presente documento para referirse a un polímero de restos de aminoácidos.
Prevenir, tratar o mejorar una enfermedad: Prevenir "una enfermedad (tal como la hemofilia) se refiere a inhibir el desarrollo completo de una enfermedad. "Tratar" se refiere a una intervención terapéutica que mejora un signo o síntoma de una enfermedad o afección patológica después de haber comenzado a desarrollarse. Mejorar "se refiere a la reducción en el número o la gravedad de los signos o síntomas de una enfermedad.
Promotor: Una región de ADN que dirige/inicia la transcripción de un ácido nucleico (por ejemplo, un gen). Un promotor incluye secuencias de un ácido nucleico necesarias cerca del sitio de inicio de la transcripción. Generalmente, los promotores se localizan cerca de los genes que transcriben. Un promotor también incluye opcionalmente elementos potenciadores o represores distales que pueden ubicarse hasta varios miles de pares de bases desde el sitio de inicio de la transcripción. Un promotor específico de tejido es un promotor que dirige/inicia la transcripción principalmente en un solo tipo de tejido o célula. Por ejemplo, un promotor específico de hígado es un promotor que dirige/inicia la transcripción en el tejido hepático en un grado sustancialmente mayor que otros tipos de tejidos.
Proteína: Una molécula biológica expresada por un gen u otro ácido nucleico codificante (por ejemplo, un ADNc) y compuesta de aminoácidos.
Purificado: El término "purificado" no requiere pureza absoluta; si no que, se concibe como un término relativo. Por lo tanto, por ejemplo, un péptido, proteína, virus u otro compuesto activo purificado es uno que está aislado total o parcialmente de proteínas y otros contaminantes asociados naturalmente. En determinadas realizaciones, la expresión "sustancialmente purificado" se refiere a un péptido, proteína, virus u otro compuesto activo que ha sido aislado de una célula, medio de cultivo celular u otra preparación en bruto y sometido a fraccionamiento para eliminar varios componentes de la preparación inicial, tales como proteínas, residuos celulares y otros componentes.
Recombinante: Una molécula de ácido nucleico recombinante es aquella que tiene una secuencia que no es de origen natural, por ejemplo, incluye una o más sustituciones, eliminaciones o inserciones en ácidos nucleicos, y/o tiene una secuencia que está hecha por una combinación artificial de dos segmentos de secuencia separados de otra manera. Esta combinación artificial se puede lograr mediante síntesis química o, más habitualmente, mediante la manipulación artificial de segmentos aislados de ácidos nucleicos, por ejemplo, mediante técnicas de ingeniería genética.
Un virus recombinante es uno que incluye un genoma que incluye una molécula de ácido nucleico recombinante. Como se usan en el presente documento, "AAV recombinante" se refiere a una partícula de AAV en la que se ha empaquetado una molécula de ácido nucleico recombinante (tal como una molécula de ácido nucleico recombinante que codifica un factor de coagulación).
Una proteína recombinante es aquella que tiene una secuencia que no es de origen natural o tiene una secuencia que está hecha por una combinación artificial de dos segmentos de secuencia separados de otra manera. En varias realizaciones, una proteína recombinante está codificada por un ácido nucleico heterólogo (por ejemplo, recombinante) que se ha introducido en una célula hospedadora, tal como una célula bacteriana o eucariota, o en el genoma de un virus recombinante.
Elemento de respuesta (RE): Una secuencia de ADN incluida en un promotor al que uno o más factores de transcripción pueden unirse y conferir un aspecto de control de la expresión génica.
Identidad de secuencia: La identidad o similitud más secuencias de los ácidos nucleicos o dos o más secuencias de aminoácidos, se expresa en términos de identidad o similitud entre las secuencias. La identidad de secuencia puede medirse en términos de porcentaje de identidad; cuanto mayor sea el porcentaje, más idénticas son las secuencias. La similitud de secuencia puede medirse en términos de porcentaje de similitud (que tiene en cuenta sustituciones de aminoácidos conservativas); cuanto mayor sea el porcentaje, más similares son las secuencias. Los homólogos y ortólogos de secuencias de los ácidos nucleicos o de aminoácidos poseen un grado relativamente alto de identidad/similitud de secuencia cuando se alinean usando métodos convencionales. Esta homología es más significativa cuando las proteínas o ADNc ortólogos proceden de especies que están más estrechamente relacionadas (tales como secuencias humanas y de ratón), en comparación con especímenes más remotamente relacionados (tales como secuencias humanas y de C. elegans).
Los métodos de alineación de secuencias para la comparación son bien conocidos en la técnica. Se describen diversos programas y algoritmos de alineación en: Smith & Waterman, Adv. Appl. Math. 2:482, 1981; Needleman & Wunsch, J. Mol. Biol. 48:443, 1970; Pearson & Lipman, Proc. Natl. Acad. Sci. UsA 85:2444, 1988; Higgins & Sharp, Gene, 73:237-44, 1988; Higgins & Sharp, CABIOS 5:151-3, 1989; Corpet et al., Nuc. Acids Res. 16:10881-90, 1988; Huang et al. Computer Appls. in the Biosciences 8, 155-65, 1992; y Pearson et al., Meth. Mol. Bio. 24:307-31, 1994. Altschul et al., J. Mol. Biol. 215:403-10, 1990, presenta una consideración detallada de métodos de alineación de secuencias y cálculos de homología.
La Basic Local Alignment Search Tool (BLAST) del NCBI (Altschul y col., J. Mol. Biol. 215:403-10, 1990) está disponible a partir de varias fuentes, entre los que se incluye el Centro Nacional de Información Biológica (NCBI) y en internet, para su uso en conexión con los programas de análisis de secuencias blastp, blastn, blastx, blastn y tblastx. Puede encontrarse información adicional en la página web del NCBI.
Como se usan en el presente documento, referencia a "al menos un 90 % de identidad" se refiere a "al menos un 90 %, al menos un 91 %, al menos un 92 %, al menos un 93 %, al menos un 94 %, al menos un 95 %, al menos un 96 %, al menos un 97 %, al menos un 98 %, al menos un 99 % o incluso al menos un 100 % de identidad" con una secuencia de referencia especificada.
Sujeto: Organismos vertebrados multicelulares vivos, una categoría que incluye mamíferos humanos y no humanos.
Sintético: Producido por medios artificiales en un laboratorio, por ejemplo, un ácido nucleico sintético puede sintetizarse químicamente en un laboratorio.
Caja TATA: Una secuencia de ADN que se encuentra en la región promotora de un gen que puede unirse mediante la proteína de unión a TATA y el factor de transcripción II D durante el desenrollado y unión de ADN por la ARN polimerasa II. Una secuencia de caja TATA generalmente incluye una secuencia t AtAAA y a menudo incluye nucleótidos de adenina 3' adicionales. Se proporciona una secuencia de caja TATA ejemplar como los nucleótidos 108-114 de la SEQ ID NO: 4.
Cantidad terapéuticamente eficaz: Una cantidad de un agente farmacéutico o terapéutico especificado (por ejemplo, un AAV recombinante) suficiente para lograr un efecto deseado en un sujeto, o en una célula, que se está tratando con el agente. La cantidad eficaz del agente dependerá de varios factores, incluyendo, pero sin limitación, el sujeto o las células a tratar, y la forma de administración de la composición terapéutica.
Factor de transcripción (TF): Una proteína que se une a secuencias de ADN específicas y, por lo tanto, controla la transferencia (o transcripción) de información genética del ADN al ARN. Los TF realizan esta función solos o con otras proteínas en un complejo, promoviendo (como activador) o bloqueando (como represor) el reclutamiento de ARN polimerasa (la enzima que realiza la transcripción de información genética de ADN a ARN) para genes específicos. Las secuencias de ADN específicas a las que se une un TF se conocen como elemento de respuesta (RE) o elemento regulador. Otros nombres incluyen elemento en cis y elemento regulador transcripcional de acción en cis.
Los factores de transcripción interactúan con sus sitios de unión usando una combinación de fuerzas electrostáticas (de las cuales los enlaces de hidrógeno son un caso especial) y de Van der Waals. Debido a la naturaleza de estas interacciones químicas, la mayoría de los factores de transcripción se unen al ADN de una manera específica de secuencia. Sin embargo, no todas las bases en el sitio de unión al factor de transcripción pueden interactuar realmente con el factor de transcripción. Además, algunas de estas interacciones pueden ser más débiles que otras. Por lo tanto, muchos factores de transcripción no se unen a una sola secuencia, sino que son capaces de unir un subconjunto de secuencias estrechamente relacionadas, cada una con una fuerza de interacción diferente.
Por ejemplo, aunque el sitio de unión consenso para la proteína de unión a TATA (TBP) es TATAAAA; sin embargo, el factor de transcripción de TBP también puede unir secuencias similares como TATATAT o
TATATAA
Los factores de transcripción (TF) se clasifican en función de muchos aspectos. Por ejemplo, las estructuras secundarias, terciarias y cuaternarias de la proteína estructuran la secuencia y las propiedades de unión al ADN, la interacción con la doble hélice del ADN y el metal y otras características de unión. La base de datos JASPAR y TRANSFAC (TRANSFAC® 7.0 Public 2005) son dos bases de datos de factores de transcripción basadas en la web, sus sitios de unión probados experimentalmente y genes regulados.
HNF1a: También denominado caja homeótica A de HNF1 A o HNF1, la proteína HNF1a es un factor de transcripción necesario para la expresión de varios genes específicos de hígado. HNF1a forma un homodímero que se une a secuencias promotoras particulares. Los sitios de unión de TF HNF1a ejemplares incluyen el sitio de unión al TF "HNF1a" proporcionado como los nucleótidos 1-12 de la SEQ ID NO: 4, el sitio de unión al TF "HNF1-1" proporcionado como los nucleótidos 16-23 de la SEQ ID NO: 4, y el sitio de unión al TF "HNF1-2" proporcionado como los nucleótidos 48-62 de la SEQ ID NO: 4. (Véanse, por ejemplo, PubMed Gene ID NO. 6927; Chi et al., "Diabetes mutations delineate an atypical POU domain in HNF-1alpha", Mol. Cell., 10:1129-1137, 2002; y Rose et al., "Structural basis of dimerization, coactivator recognition and MODY3 mutations in HNF-1alpha", Nat. Struct. Biol. 7:744-748, 2000).
HNF3a: Un factor de transcripción necesario para la expresión de varios genes específicos de hígado. HNF3a se une a secuencias promotoras particulares. Se proporciona un sitio de unión al TF HNF3a ejemplar como los nucleótidos 39-45 de la SEQ ID NO: 4. Se proporciona un sitio de unión al TF HNF3-2 ejemplar como los nucleótidos 65-71 de la SEQ ID NO: 4. (véase, por ejemplo, Laganiere et al., "Location analysis of estrogen receptor alpha target promoters reveals that FOXA1 defines a domain of the estrogen response", Proc. Natl. Acad. Sci. U.S.A. 102:11651-11656, 2005; Williamson et al., "BRCA1 and FOXA1 proteins coregulate the expression of the cell cycle-dependent kinase inhibitor p27(Kip1)", Oncogene 25:1391-1399, 2006; Lupien et al., "FoxA1 translates epigenetic signatures into enhancer-driven lineage-specific transcription", Cell 132:958-970, 2008; Song et al., "Role of Foxa1 in regulation of bcl2 expression during oxidative-stress-induced apoptosis in A549 type II pneumocytes", Cell Stress Chaperones, 14:417-425, 2009); and Malik et al., "Histone deacetylase 7 and FoxA1 in estrogen-mediated repression of RPRM", Mol. Cell. Biol. 30:399-412, 2010).
HNF4: Un factor de transcripción necesario para la expresión de varios genes específicos de hígado. HNF4 se une a secuencias promotoras particulares. Se proporciona un sitio de unión al TF HNF4 ejemplar como los nucleótidos 26-36 de la SEQ ID NO: 4. (Véanse, por ejemplo, Wang et al., " Hepatocyte nuclear factor-4a interacts with other hepatocyte nuclear factors in regulating transthyretin gene expression", f Eb S J., 277(19):4066-75, 2010).
HP1: Un factor de transcripción necesario para la expresión de varios genes específicos de hígado. HP1 se une a secuencias promotoras particulares. Se proporciona un sitio de unión al TF HP1 ejemplar como los nucleótidos 75­ 87 de la SEQ ID NO: 4. (Véanse, por ejemplo, Schorpp et al., "Hepatocyte-specific promoter element HP1 of the Xenopus albumin gene interacts with transcriptional factors of mammalian hepatocytes", J Mol Biol., 202(2):307-20, 1988)
Sitio de Inicio de Transcripción: La ubicación donde comienza la transcripción en el extremo 5 'de una secuencia génica. Se proporciona un Sitio de Inicio de Transcripción ejemplar como los nucleótidos 116-146 de la SEQ ID NO: 4.
Cantidad terapéuticamente eficaz: La cantidad de agente, tal como un vector AAV recombinante divulgado que codifica un factor de coagulación, que es suficiente para prevenir, tratar (incluida la profilaxis), reducir y/o mejorar los síntomas y/o las causas subyacentes de un trastorno o enfermedad, por ejemplo para prevenir, inhibir y/o tratar la hemofilia. Por ejemplo, esta puede ser la cantidad necesaria para inhibir o prevenir la replicación vírica o para alterar de manera medible los síntomas externos de la enfermedad o afección.
En un ejemplo, una respuesta deseada es reducir el tiempo de coagulación en un sujeto (tal como un sujeto con hemofilia), por ejemplo, medido usando un ensayo de tiempo de sangrado. El tiempo de coagulación no necesita ser completamente restaurado al de los sujetos sanos normales sin hemofilia para que el método sea eficaz. Por ejemplo, la administración de una cantidad terapéuticamente eficaz de un vector (tal como un vector que codifica fVIII) como se divulga en el presente documento puede disminuir el tiempo de coagulación (u otro síntoma de la hemofilia) en una cantidad deseada, por ejemplo, al menos 20 %, al menos un 30 %, al menos un 40 %, al menos un 50 %, al menos un 60 %, al menos un 70 %, al menos un 80 %, al menos un 90 %, al menos un 95 %, al menos un 98 %, al menos un 100 % o más, en comparación con un control adecuado.
Se entiende que para obtener una respuesta terapéutica a la enfermedad o afección puede necesitarse múltiples administraciones del agente. Por lo tanto, una cantidad terapéuticamente eficaz abarca una dosis fraccionaria que contribuye en combinación con administraciones anteriores o posteriores para lograr un resultado terapéutico en el paciente. Por ejemplo, se puede administrar una cantidad terapéuticamente eficaz de un agente en una dosis única o en varias dosis, por ejemplo diariamente, durante un ciclo de tratamiento. Sin embargo, la cantidad terapéuticamente eficaz puede depender del sujeto a tratar, la gravedad y el tipo de la afección a tratar, y la forma de administración. Se puede empaquetar una forma de dosificación unitaria del agente en una cantidad terapéutica, o en múltiplos de la cantidad terapéutica, por ejemplo, en un vial (por ejemplo, con una tapa perforable) o una jeringa que tiene componentes estériles.
Vector: Un vector es una molécula de ácido nucleico que permite la inserción de ácido nucleico extraño sin alterar la capacidad del vector para replicarse y/o integrarse en una célula hospedadora. Un vector puede incluir secuencias de un ácido nucleico que le permiten replicarse en una célula hospedadora, tal como un origen de replicación. Un vector también puede incluir uno o más genes marcadores seleccionables y otros elementos genéticos. Un vector de expresión es un vector que contiene las secuencias reguladoras necesarias para permitir la transcripción y traducción del gen o genes insertados. En algunas realizaciones en el presente documento, el vector es un vector de virus adenoasociado (AAV). En algunas realizaciones, el vector es un vector gamma retrovírico, un vector lentivírico o un vector adenovírico.
A menos que se indique lo contrario, todos los términos técnicos y científicos utilizados en el presente documento tienen el mismo significado que el que entiende comúnmente una persona normalmente experta en la técnica a la cual pertenece la presente divulgación. Los términos en singular "un", "uno", "una", y "el/la" incluyen las referencias en plural a menos que el contexto dicte claramente lo contrario. "Que comprende A o B" significa que incluye A, o B, o A y B. Se entiende además que todos los tamaños de bases o los tamaños de aminoácidos, y todos los valores de pesos moleculares o masas moleculares, proporcionados para los ácidos nucleicos o polipéptidos son aproximados, y se proporcionan para la descripción. Aunque los métodos y materiales similares o equivalentes a los descritos en el presente documento pueden usarse en la práctica o prueba de la presente divulgación, a continuación se describen métodos y materiales adecuados. En caso de conflicto, prevalecerá la presente memoria descriptiva, incluidas las explicaciones de términos. Además, los materiales, métodos y ejemplos son solamente ilustrativos y no pretenden ser limitantes.
II. Promotores Optimizados para la Transcripción Dirigida al Hígado
En el presente documento, se proporcionan nuevos promotores para promover la transcripción en tejido y/o células del hígado. Como se analiza en el Ejemplo 2, los nuevos promotores se diseñaron usando un enfoque iterativo que finalmente identificó varias secuencias promotoras que proporcionan niveles de transcripción inesperadamente altos (como se analiza midiendo la actividad de la proteína expresada), y son sustancialmente más cortas que las secuencias promotoras anteriores, como la secuencia promotora HLP.
En la invención, se proporciona una molécula de ácido nucleico recombinante que comprende un promotor que comprende un primer elemento de respuesta que comprende un conjunto de sitios de unión a factores de transcripción (TF), que incluyen: un sitio de unión al TF HNF1a, un sitio de unión al TF HNF1-1, un sitio de unión al TF HNF4, un sitio de unión al TF HNF3a, un sitio de unión al TF HNF1-2, un sitio de unión al TF HNF3-2, un sitio de unión al TF HP1, una caja TATA; y un Sitio de Inicio de la Transcripción. Estos son los sitios de unión al factor de transcripción incluidos en el promotor HCB.
En la invención, el primer elemento de respuesta puede comprender una secuencia de nucleótidos que no tiene más de 160 nucleótidos de longitud (tal como no más de 150 nucleótidos de longitud, tal como de 146 nucleótidos de longitud).
En la invención, el sitio de unión al TF HNF1a comprende o consiste en los nucleótidos 1-12 de la SEQ ID NO: 4; el sitio de unión al TF HNF1-1 comprende o consiste en los nucleótidos 16-23 de la SEQ ID NO: 4; el sitio de unión al TF HNF4 comprende o consiste en los nucleótidos 26-36 de la SEQ ID NO: 4; el sitio de unión al TF HNF3a comprende o consiste en los nucleótidos 39-45 de la SEQ ID NO: 4; el sitio de unión al TF HNF1-2 comprende o consiste en los nucleótidos 48-62 de la SEQ ID NO: 4; el sitio de unión al TF HNF3-2 comprende o consiste en los nucleótidos 65-71 de la SEQ ID NO: 4; el sitio de unión al TF HP1 comprende o consiste en los nucleótidos 75-87 de la SEQ ID NO: 4; la caja TATA comprende o consiste en los nucleótidos 108-114 de la SEQ ID NO: 4; y el Sitio de Inicio de la Transcripción (TSS) comprende o consiste en los nucleótidos 116-146 de la SEQ ID NO: 4.
En algunas realizaciones, el primer elemento de respuesta comprende, de 5' a 3', el sitio de unión al TF HNF1a, el sitio de unión al TF HNF1-1, el sitio de unión al TF h Nf -4, el sitio de unión al TF HNF3a, el sitio de unión al TF HNF1-2, el sitio de unión al TF HNF3-2, el sitio de unión al TF HP1, la caja TATA y el Sitio de Inicio de la Transcripción (TSS, por sus siglas en inglés).
En algunas realizaciones, la molécula de ácido nucleico recombinante comprende un promotor que comprende o que consiste en la secuencia del ácido nucleico establecida como la SEQ ID NO: 4 (HCB), o una secuencia al menos un 90 % (tal como, al menos un 91 %, al menos un 92 %, al menos un 93 %, al menos un 94 %, al menos un 95 %, al menos un 98 % o al menos un 99 %) idéntica a la misma.
En algunas realizaciones, la molécula de ácido nucleico recombinante puede comprender un promotor que comprende el primer elemento de respuesta como se analiza anteriormente, y puede comprender además un segundo elemento de respuesta.
En algunas realizaciones, el segundo elemento de respuesta puede comprender un elemento de respuesta HSh. Por ejemplo, un elemento de respuesta HSh que comprende o que consiste en la secuencia de nucleótidos establecida como la SEQ ID NO: 111, o una secuencia de al menos un 90 % (tal como al menos 91%, al menos 92%, al menos un 93 %, al menos un 94 %, al menos un 95 %, al menos un 98 % o al menos un 99 %) idéntica a la misma.
En algunas realizaciones, el segundo elemento de respuesta puede comprender un elemento de respuesta 5'HS. Por ejemplo, un elemento de respuesta 5'HS que comprende o que consiste en la secuencia de nucleótidos establecida como los nucleótidos 6-32 de SEQ ID NO: 111, o una secuencia al menos un 90 % (tal como al menos 91%, al menos
92%, al menos un 93 %, al menos un 94 %, al menos un 95 %, al menos un 98 % o al menos un 99 %) idéntica a la misma.
En algunas realizaciones, el segundo elemento de respuesta puede comprender un elemento de respuesta 3'HS. Por ejemplo, un elemento de respuesta 3'HS que comprende o que consiste en la secuencia de nucleótidos establecida como los nucleótidos 44-68 de SEQ ID NO: 111, o una secuencia al menos un 90 % (tal como al menos 91%, al menos
92%, al menos un 93 %, al menos un 94 %, al menos un 95 %, al menos un 98 % o al menos un 99 %) idéntica a la misma.
En algunas realizaciones, la molécula de ácido nucleico recombinante comprende un promotor que comprende o que consiste en la secuencia del ácido nucleico establecida como la SEQ ID NO: 102 (HSh-HCB), o una secuencia al menos un 90 % (tal como, al menos un 91 %, al menos un 92 %, al menos un 93 %, al menos un 94 %, al m 95 %, al menos un 98 % o al menos un 99 %) idéntica a la misma.
En algunas realizaciones, la molécula de ácido nucleico recombinante comprende un promotor que comprende o que consiste en la secuencia del ácido nucleico establecida como la SEQ ID NO: 104 (5'HSh-HCB), o una secuencia al menos un 90 % (tal como, al menos un 91 %, al menos un 92 %, al menos un 93 %, al menos un 94 %, al m 95 %, al menos un 98 % o al menos un 99 %) idéntica a la misma.
En algunas realizaciones, la molécula de ácido nucleico recombinante comprende un promotor que comprende o que consiste en la secuencia del ácido nucleico establecida como la SEQ ID NO: 103 (3'HSh-HCB),
En algunos aspectos de la divulgación, la molécula de ácido nucleico recombinante comprende un promotor que comprende o que consiste en la secuencia del ácido nucleico establecida como la SEQ ID NO: 7 (ABP-HP1-God-TSS), o una secuencia al menos un 90 % (tal como, al menos un 91 %, al menos un 92 %, al menos un 93 %, al menos un 94 %, al menos un 95 %, al menos un 98 % o al menos un 99 %) idéntica a la misma.
En algunos aspectos de la divulgación, la molécula de ácido nucleico recombinante comprende un promotor que comprende o que consiste en la secuencia del ácido nucleico establecida como la SEQ ID NO: 105 (HSh-SynO-TSS), o una secuencia al menos un 90 % (tal como, al menos un 91 %, al menos un 92 %, al menos un 93 %, al menos un
94 %, al menos un 95 %, al menos un 98 % o al menos un 99 %) idéntica a la misma.
En algunos aspectos de la divulgación, la molécula de ácido nucleico recombinante comprende un promotor que comprende o que consiste en la secuencia del ácido nucleico establecida como la SEQ ID NO: 106 (sHS-SynO-TSS), o una secuencia al menos un 90 % (tal como, al menos un 91 %, al menos un 92 %, al menos un 93 %, al menos un
94 %, al menos un 95 %, al menos un 98 % o al menos un 99 %) idéntica a la misma.
En algunos aspectos de la divulgación, la molécula de ácido nucleico recombinante comprende un promotor que comprende o que consiste en la secuencia del ácido nucleico establecida como la SEQ ID NO: 107 (Agro), o una secuencia al menos un 90 % (tal como, al menos un 91 %, al menos un 92 %, al menos un 93 %, al menos un 94 %, al menos un 95 %, al menos un 98 % o al menos un 99 %) idéntica a la misma.
En algunos aspectos de la divulgación, la molécula de ácido nucleico recombinante comprende un promotor que comprende o que consiste en la secuencia del ácido nucleico establecida como la SEQ ID NO: 108 (HS-SynO-TSS), o una secuencia al menos un 90 % (tal como, al menos un 91 %, al menos un 92 %, al menos un 93 %, al menos un
94 %, al menos un 95 %, al menos un 98 % o al menos un 99 %) idéntica a la misma.
En algunos aspectos de la divulgación, la molécula de ácido nucleico recombinante comprende un promotor que comprende o que consiste en la secuencia del ácido nucleico establecida como la s Eq ID NO: 112 (HNF1-ShortABPExact-SynO-TSS-Int), o una secuencia al menos un 90 % (tal como, al menos un 91 %, al menos un 92 %, al menos un 93 %, al menos un 94 %, al menos un 95 %, al menos un 98 % o al menos un 99 %) idéntica a la misma.
En algunos aspectos de la divulgación, la molécula de ácido nucleico recombinante comprende un promotor que comprende o que consiste en la secuencia del ácido nucleico establecida como la SEQ ID NO: 5 (shortABP-HP1-God-TSS), o una secuencia al menos un 90 % (tal como, al menos un 91 %, al menos un 92 %, al menos un 93 %, al menos un 94 %, al menos un 95 %, al menos un 98 % o al menos un 99 %) idéntica a la misma.
En algunos aspectos de la divulgación, la molécula de ácido nucleico recombinante comprende un promotor que comprende o que consiste en la secuencia del ácido nucleico establecida como la SEQ ID NO: 7 (ABP-HP1-God-TSS), o una secuencia al menos un 90 % (tal como, al menos un 91 %, al menos un 92 %, al menos un 93 %, al menos un 94 %, al menos un 95 %, al menos un 98 % o al menos un 99 %) idéntica a la misma.
Los promotores divulgados pueden utilizarse en cualquier situación en la que se desee la transcripción específica del hígado. En varias realizaciones, cualquiera de los promotores de la invención puede incluirse en un vector (tal como un vector AAV) para métodos de terapia génica en los que se desea la expresión específica de hígado de un transgén, tal como la expresión específica de hígado de un factor de coagulación como se divulga en el presente documento.
III. Moléculas de Ácido Nucleico Recombinante que Codifican Factores de Coagulación
El sistema de coagulación de la sangre es una cascada proteolítica. Los factores de coagulación sanguínea están presentes en el plasma como un zimógeno, en otras palabras, en forma inactiva, que al activarse sufre una escisión proteolítica para liberar el factor activo de la molécula precursora. El objetivo final es producir trombina. La trombina convierte el fibrinógeno en fibrina, que forma un coágulo.
El factor X es la primera molécula de la vía común y se activa mediante un complejo de moléculas que contienen fIX activado, fVIII, calcio y fosfolípidos que se encuentran sobre la superficie de las plaquetas. El FVIII es activado por la trombina, y facilita la activación del factor X por flXa. FVIII, contiene múltiples dominios (A1-A2-B-ap-A3-C1-C2) y circula en la sangre en forma inactiva unido al factor von Willebrand (VWF, por sus siglas en inglés). El dominio C2 está implicado en la unión de fVIII a VWF. La trombina escinde el fVIII causando disociación con el VWF, conduciendo, finalmente a la formación de fibrina a través del fIX. La hemofilia A congénita está asociada con mutaciones genéticas en el gen fVIII y da como resultado una coagulación alterada debido a niveles de fVIII circulantes inferiores a lo normal. La hemofilia B se asocia de manera similar con mutaciones genéticas en el gen fIX.
Los límites del dominio FVIII se refieren a la numeración de la secuencia de aminoácidos de fVIII humano como sigue; restos 1-19 (Secuencia Señal), 20-391 (A1), 392-759 (A2), 760-1667 (B), 1668-1708 (ap), 1709-2038 (A3), 2039-2191 (C1) y 2192-2351 (C2) (véase Gitschier et al., Nature, 1984, 312, 326-330) de la SEQ ID NO: 1:
MQIELSTCFFLCLLRFCFSATRRYYLGAVELSWDYMQSDLGELPVDARFPPRVPKSFPFNTSWYKKTLFVEFTDHLF
NIAKPRPPWMGLLGPTIQAEVYDTWITLKNMASHPVSLHAVGVSYWKASEGAEYDDQTSQREKEDDKVFPGGSHTYV
WQVLKENGPMASDPLCLTYSYLSHVDLVKDLNSGLIGALLVCREGSLAKEKTQTLHKFILLFAVFDEGKSWHSETKNS
LMQDRDAASARAWPKMHTVNGYVNRSLPGLIGCHRKSVYWHVIGMGTTPEVHSIFLEGHTFLVRNHRQASLEISPITF
LTAQTLLMDLGQFLLFCHISSHQHDGMEAYVKVDSCPEEPQLRMKNNEEAEDYDDDLTDSEMDWRFDDDNSPSFIQI
RSVAKKHPKTWVHYIAAEEEDWDYAPLVLAPDDRSYKSQYLNNGPQRIGRKYKKVRFMAYTDETFKTREAIQHESGIL
GPLLYGEVGDTLLIIFKNQASRPYNIYPHGITDVRPLYSRRLPKGVKHLKDFPILPGEIFKYKWTVTVEDGPTKSDPR
CLTRYYSSFVNMERDLASGLIGPLLICYKESVDQRGNQIMSDKRNVILFSVFDENRSWYLTENIQRFLPNPAGVQLED
PEFQASNIMHSINGYVFDSLQLSVCLHEVAYWYILSIGAQTDFLSVFFSGYTFKHKMVYEDTLTLFPFSGETVFMSME
NPGLWILGCHNSDFRNRGMTALLKVSSCDKNTGDYYEDSYEDISAYLLSKNNAIEPRSFSQNSRHPSTRQKQFNATTI
PENDIEKTDPWFAHRTPMPKIQNVSSSDLLMLLRQSPTPHGLSLSDLQEAKYETFSDDPSPGAIDSNNSLSEMTHFRP
QLHHSGDMVFTPESGLQLRLNEKLGTTAATELKKLDFKVSSTSNNLISTIPSDNLAAGTDNTSSLGPPSMPVHYDSQL
DTTLFGKKSSPLTESGGPLSLSEENNDSKLLESGLMNSQESSWGKNVSSTESGRLFKGKRAHGPALLTKDNALFKVSI
SLLKTNKTSNNSATNRKTHIDGPSLLIENSPSVWQNILESDTEFKKVTPL1HDRMLMDKNATALRLNHMSNKTTSSKN
MEMVQQKKEGPIPPDAQNPDMSFFKMLFLPESARWIQRTHGKNSLNSGQGPSPKQLVSLGPEKSVEGQNFLSEKNKW
VGKGEFTKDVGLKEMVFPSSRNLFLTNLDNLHENNTHNQEKKIQEEIEKKETLIQENWLPQ1HTVTGTKNFMKNLFL
LSTRQNVEGSYDGAYAPVLQDFRSLNDSTNRTKKHTAHFSKKGEEENLEGLGNQTKQIVEKYACTTRISPNTSQQNFV
TQRSKRALKQFRLPLEETELEKRIIVDDTSTQWSKNMKHLTPSTLTQIDYNEKEKGAITQSPLSDCLTRSHSIPQANR
SPLPIAKVSSFPSIRPIYLTRVLFQDNSSHLPAASYRKKDSGVQESSHFLQGAKKNNLSLAILTLEMTGDQREVGSLG
TSATNSVTYKKVENTVLPKPDLPKTSGKVELLPKVHIYQKDLFPTETSNGSPGHLDLVEGSLLQGTEGAIKWNEANRP
GKVPFLRVATESSAKTPSKLLDPLAWDNHYGTQIPKEEWKSQEKSPEKTAFKKKDTILSLNACESNHAIAAINEGQNK
PEIEVTWAKQGRTERLCSQNPPVLKRHQREITRTTLQSDQEEIDYDDTISVEMKKEDFDIYDEDENQSPRSFQKKTRH
YFIAAVERLWDYGMSSSPHVLRNRAQSGSVPQFKKWFQEFTDGSFTQPLYRGELNEHLGLLGPYIRAEVEDNIMVTF
RNQASRPYSFYSSLISYEEDQRQGAEPRKNFVKPNETKTYFWKVQHHMAPTKDEFDCKAWAYFSDVDLEKDVHSGLIG
PLLVCHTNTLNPAHGRQVTVQEFALFFTIFDETKSWYFTENMERNCRAPCNIQMEDPTFKENYRFHAINGYIMDTLPG
LVMAQDQRIRWYLLSMGSNEN1HS1HFSGHVFTVRKKEEYKMALYNLYPGVFETVEMLPSKAGIWRVECLIGEHLHAG
MSTLFLVYSNKCQTPLGMASGHIRDFQITASGQYGQWAPKLARLHYSGSINAWSTKEPFSWIKVDLLAPMI1HGIKTQ
GARQKFSSLYISQFIIMYSLDGKKWQTYRGNSTGTLMVFFGNVDSSGIKHNIFNPPIIARYIRLHPTHYSIRSTLRME
LMGCDLNSCSMPLGMESKAISDAQITASSYFTNMFATWSPSKARLHLQGRSNAWRPQVNNPKEWLQVDFQKTMKVTGV
TTQGVKSLLTSMYVKEFLISSSQDGHQWTLFFQNGKVKVFQGNQDSFTPWNSLDPPLLTRYLR1HPQSWVHQIALRM
EVLGCEAQDLY
Como se analiza en el Ejemplo 1, las secuencias de nucleótidos de ADNc que codifican las variantes de fVIII ET3 y HSQ se mejoraron implementando una preferencia de uso de codones específicos para la célula hepática humana en comparación con la secuencia de nucleótidos de origen natural que codifica la secuencia sin codones optimizados correspondiente para un ser humano. También se realizaron cambios adicionales para mejorar la eficacia de la traducción, tal como la optimización del contenido en GC, estructura secundaria de ARNm, sitios de PoliA prematuros, motivo de inestabilidad de ARN, energía libre estable de ARNm, sitios chi internos, motivos de inestabilidad de ARN, sitios de unión a ribosomas, sitios de corte y empalme crípticos, islas CpG negativas, secuencia SD, cajas TATA y señales terminales crípticas.
Además, se eliminaron los motivos de ADN de CpG porque pueden conducir a la metilación y silenciamiento de genes. Véase Bird, DNA methylation and the frequency of CpG in animal DNA, 1980, Nucleic Acids Res, 8: 1499-1504. Los codones se sustituyeron con la alternativa humana/hepática más utilizada que no dio como resultado la formación de un dinucleótido 5'-CG-3' en la secuencia. La eliminación de CpG también puede reducir cualquier respuesta inmunitaria a un vector, incluido el transgén modificado, potenciando la seguridad y la eficacia del vector. Véase J Clin Invest.
2013, 123(7):2994-3001, titulado "CpG-depleted adeno-associated virus vectors evade immune detection".
ET3 es un fVIII híbrido con el dominio B eliminado (BDD) que contiene dominios humanos y porcinos, es decir, la secuencia (A1 y A3 porcinos, véanse las FIG. 1A y 1B) con un enlazador en el dominio B eliminado. ET3 utiliza una secuencia enlazadora OL derivada de una secuencia porcina de 24 aminoácidos, es decir, la secuencia SFAQNSRPPSASAPKPPVLRRHQR (SEQ ID NO: 23) derivada de la porcina. HSQ es una variante de fVIII humano en donde la proteína fVIII humana b Dd se sustituye con un enlazador SQ, SFSQNPPVLKRHQR (SEQ ID NO: 22) derivado humano de 14 aminoácidos. La secuencia de aminoácidos de HSQ se proporciona como la SEQ ID NO: 3. Tanto HSQ como ET3 contienen la secuencia de reconocimiento RHQR (SEQ iD NO: 24) para la secuencia de procesamiento PACE/furina para el dominio B.
Como se analiza en el Ejemplo 1, la secuencia de nucleótidos que codifica ET3 tenía codones optimizados para la expresión en hígado humano. Se proporciona una secuencia de ET3 con codones de hígado optimizados ejemplar como la SEQ ID NO: 12. En algunos aspectos de la divulgación, se proporciona una molécula de ácido nucleico recombinante que comprende la secuencia de nucleótidos establecida como la SEQ ID NO: 12, o una secuencia al menos un 90 % (tal como al menos un 95 %) idéntica a la misma. Adicionalmente, se eliminaron los motivos CpG dentro de la secuencia de ET3 con codones optimizados, para proporcionar la secuencia de ET3 con codones de hígado optimizados con CpG eliminados establecida como la SEQ ID NO: 11. En algunos aspectos de la divulgación, se proporciona una molécula de ácido nucleico recombinante que comprende la secuencia de nucleótidos establecida como la SEQ ID NO: 11, o una secuencia al menos un 90 % (tal como al menos un 95 %) idéntica a la misma.
Como se analiza en el Ejemplo 1, la secuencia de nucleótidos que codifica HSQ tenía codones optimizados para la expresión en hígado humano. Adicionalmente, se eliminaron los motivos CpG dentro de la secuencia de h Sq con codones optimizados, para proporcionar la secuencia de HSQ con codones de hígado optimizados con CpG eliminados establecida como la SEQ ID NO: 2. En algunos aspectos de la divulgación, se proporciona una molécula de ácido nucleico recombinante que comprende la secuencia de nucleótidos establecida como la SEQ ID NO: 2, o una secuencia al menos un 90 % (tal como al menos un 95 %) idéntica a la misma.
Adicionalmente, las secuencias de nucleótidos que codifican ET3 y HSQ se optimizaron para la expresión en células mieloides. Se proporciona una secuencia de ET3 con codones mieloides optimizados con CpG eliminados ejemplar como la SEQ ID NO: 125. En algunos aspectos de la divulgación, se proporciona una molécula de ácido nucleico recombinante que comprende la secuencia de nucleótidos establecida como la SEQ ID NO: 125, o una secuencia al menos un 90 % (tal como al menos un 95 %) idéntica a la misma. Se proporciona una secuencia de HSQ con codones mieloides optimizados con CpG eliminados ejemplar como la SEQ ID NO: 126. En algunos aspectos de la divulgación, se proporciona una molécula de ácido nucleico recombinante que comprende la secuencia de nucleótidos establecida como la SEQ ID NO: 126, o una secuencia al menos un 90 % (tal como al menos un 95 %) idéntica a la misma.
En aspectos adicionales de la presente divulgación, se proporcionan variantes de secuencias codificantes de flX que están diseñadas para altos niveles de expresión cuando el transgén se expresa por el hígado, que es el tejido diana de muchas estrategias de terapia génica dirigidas a flX. Para crear esta secuencia codificante, se utiliza una estrategia de optimización de codones dirigida al hígado.
Como se analiza en el Ejemplo 1, la secuencia de nucleótidos que codifica para flX se optimizó implementando una preferencia de uso de codones específicos para la célula hepática humana en comparación con la secuencia de nucleótidos de origen natural que codifica la secuencia correspondiente sin optimización de condones para un ser humano. También se realizaron cambios adicionales para mejorar la eficacia de la Traducción, tal como la optimización del contenido en GC, estructura secundaria de ARNm, sitios de PoliA prematuros, motivo de inestabilidad de ARN, energía libre estable de ARNm, sitios chi internos, motivos de inestabilidad de ARN, sitios de unión a ribosomas, sitios de corte y empalme crípticos, islas CpG negativas, secuencia SD, cajas TATA y señales terminales crípticas.
Además de ajustar preferencia de uso de codones, las secuencias resultantes se modifican adicionalmente para eliminar los motivos CpG que pueden inhibir la expresión eficaz del transgén. Adicionalmente, en algunos aspectos, la molécula de ácido nucleico flX recombinante puede codificar flX con la mutación K5A (Darrel Stafford collagen binding mutation, Gui et al. Blood. 2002, 100(1): 153-8). En determinados aspectos, la molécula de ácido nucleico de fIX recombinante puede codificar flX con la mutación R338L (mutación de Padua), que es una ganancia de origen natural de mutación de la función que se ha demostrado que mejora la actividad específica de fIX en 8 veces. Las variantes de secuencia se crearon adicionalmente para reflejar dos polimorfismos principales de fIX en el resto 148, que incluyen alanina o treonina. En algunos aspectos, estas secuencias de fIX pueden injertarse en AAV dirigidos al hígado como diseños transgénicos monocatenarios o bicatenarios autocomplementarios.
En el Ejemplo 1, se analizan secuencias del ácido nucleico recombinante ejemplares que codifican proteínas fVIII o fIX, o variantes de las mismas, que se modifican para la expresión específica de tejido.
La SEQ ID NO: 12 proporciona una secuencia de ET3con codones de hígado optimizados ejemplar. En algunos aspectos de la divulgación, se proporciona una molécula de ácido nucleico recombinante que comprende o que consiste en la secuencia del ácido nucleico establecida como la SEQ ID NO: 12, o una secuencia al menos un 90 % (tal como al menos un 95 %) idéntica a la misma.
La SEQ ID NO: 11 proporciona una secuencia de ET3 con codones de hígado optimizados con CpG eliminados ejemplar. En algunos aspectos de la divulgación, se proporciona una molécula de ácido nucleico recombinante que comprende o que consiste en la secuencia del ácido nucleico establecida como la SEQ ID NO: 11, o una secuencia al menos un 90 % (tal como al menos un 95 %) idéntica a la misma.
La SEQ ID NO: 2 proporciona una secuencia de HSQ con codones de hígado optimizados con CpG eliminados ejemplar. En algunos aspectos de la divulgación, se proporciona una molécula de ácido nucleico recombinante que comprende o que consiste en la secuencia del ácido nucleico establecida como la SEQ ID NO: 2, o una secuencia al menos un 90 % (tal como al menos un 95 %) idéntica a la misma.
La SEQ ID NO: 125 proporciona una secuencia de ET3 con codones mieloides optimizados con CpG eliminados ejemplar. En algunos aspectos de la divulgación, se proporciona una molécula de ácido nucleico recombinante que comprende o que consiste en la secuencia del ácido nucleico establecida como la SEQ ID NO: 125, o una secuencia al menos un 90 % (tal como al menos un 95 %) idéntica a la misma.
La SEQ ID NO: 126 proporciona una secuencia de HSQ con codones mieloides optimizados con CpG eliminados ejemplar. En algunos aspectos de la divulgación, se proporciona una molécula de ácido nucleico recombinante que comprende o que consiste en la secuencia del ácido nucleico establecida como la SEQ ID NO: 125, o una secuencia al menos un 90 % (tal como al menos un 95 %) idéntica a la misma.
En el Ejemplo 1, se analizan secuencias del ácido nucleico recombinante ejemplares que codifican proteínas fIX, o variantes de las mismas, que se modifican para la expresión específica de tejido.
La SEQ ID NO: 124 proporciona una secuencia de fIX con codones de hígado optimizados ejemplar con mutaciones Padua/Malmo y sin CpG. En algunos aspectos de la divulgación, se proporciona una molécula de ácido nucleico recombinante que comprende o que consiste en la secuencia del ácido nucleico establecida como la SEQ ID NO: 124, o una secuencia al menos un 90 % (tal como al menos un 95 %) idéntica a la misma.
La SEQ ID NO: 8 proporciona una secuencia de fIX con codones de hígado optimizados ejemplar sin CpG y que codifica modificaciones A582. En algunos aspectos de la divulgación, se proporciona una molécula de ácido nucleico recombinante que comprende o que consiste en la secuencia del ácido nucleico establecida como la SEQ ID NO: 8, o una secuencia al menos un 90 % (tal como al menos un 95 %) idéntica a la misma.
La SEQ ID NO: 9 proporciona una secuencia de fIX con codones de hígado optimizados ejemplar sin CpG y que incluye modificaciones Padua y A582. En algunos aspectos de la divulgación, se proporciona una molécula de ácido nucleico recombinante que comprende o que consiste en la secuencia del ácido nucleico establecida como la SEQ ID NO: 9, o una secuencia al menos un 90 % (tal como al menos un 95 %) idéntica a la misma.
La SEQ ID NO: 10 proporciona una secuencia de fIX con codones de hígado optimizados ejemplar con mutaciones Padua/Malmo y sin CpG. En algunos aspectos de la divulgación, se proporciona una molécula de ácido nucleico recombinante que comprende o que consiste en la secuencia del ácido nucleico establecida como la SEQ ID NO: 10, o una secuencia al menos un 90 % (tal como al menos un 95 %) idéntica a la misma.
La SEQ ID NO: 127 proporciona una secuencia de fIX con codones humanos optimizados ejemplar con mutaciones Padua/Malmo y sin CpG. En algunos aspectos de la divulgación, se proporciona una molécula de ácido nucleico recombinante que comprende o que consiste en la secuencia del ácido nucleico establecida como la SEQ ID NO: 127, o una secuencia al menos un 90 % (tal como al menos un 95 %) idéntica a la misma.
Cualquiera de las moléculas de ácidos nucleicos recombinantes analizadas anteriormente que codifican una proteína fVIII o fIX, o una variante de las mismas, puede incluirse en un vector (tal como un vector AAV) como se describe en el presente documento para realizaciones donde es de interés la expresión de una proteína fVIII o FIX o variante de las mismas.
En algunos aspectos de la divulgación, se proporciona una proteína aislada que comprende una secuencia de aminoácidos codificada por una de las SEQ ID NO: 8, 9 o 10, tal como las secuencias de aminoácidos establecidas como las SEQ ID NO: 17-18 a continuación. En algunos aspectos de la divulgación, se proporciona una proteína aislada que comprende una secuencia de aminoácidos establecida como la SEQ ID NO: 17, o una secuencia de aminoácidos al menos un 90 % (tal como al menos un 95 %) idéntica a la misma que tiene actividad fIX. En algunos aspectos de la divulgación, se proporciona una proteína aislada que comprende una secuencia de aminoácidos establecida como la SEQ ID NO: 18, o una secuencia de aminoácidos al menos un 90 % (tal como al menos un 95 %) idéntica a la misma que tiene actividad fIX. En algunos aspectos de la divulgación, se proporciona una proteína aislada que comprende una secuencia de aminoácidos establecida como la SEQ ID NO: 19, o una secuencia de aminoácidos al menos un 90 % (tal como al menos un 95 %) idéntica a la misma que tiene actividad fIX.
La SEQ ID NO: 8 codifica la secuencia de aminoácidos establecida como la SEQ ID NO: 17:
MQRVNMIMAESPGLITICLLGYLLSAECTVFLDHENANKILNRPKRYNSGKLEEFVQGNLERECMEEKCSFEEAREVF
ENTERTTEFWKQYVDGDQCESNPCLNGGSCKDDINSYECWCPFGFEGKNCELDVTCNIKNGRCEQFCKNSADNKWCS
CTEGYRLAENQKSCEPAVPFPCGRVSVSQTSKLTRAEAVFPDVDYVNSTEAETILDNITQSTQSFNDFTRWGGEDAK
PGQFPWQWLNGKVDAFCGGSIVNEKWIVTAAHCVETGVKITWAGEHNIEETEHTEQKRNVIRIIPHHNYNAAINKY
NHDIALLELDEPLVLNSYVTPICIADKEYTNIFLKFGSGYVSGWGRVFHKGRSALVLQYLRVPLVDRATCLRSTKFTI
YNNMFCAGFHEGGRDSCQGDSGGPHVTEVEGTSFLTGIISWGEECAMKGKYGIYTKVSRYVNWIKEKTKLT
La SEQ ID NO: 9 codifica la secuencia de aminoácidos establecida como la SEQ ID NO: 18:
MQRVNMIMAESPGLITICLLGYLLSAECTVFLDHENANKILNRPKRYNSGKLEEFVQGNLERECMEEKCSFEEAREVF
ENTERTTEFWKQYVDGDQCESNPCLNGGSCKDDINSYECWCPFGFEGKNCELDVTCNIKNGRCEQFCKNSADNKWCS
CTEGYRLAENQKSCEPAVPFPCGRVSVSQTSKLTRAEAVFPDVDYVNSTEAETILDNITQSTQSFNDFTRWGGEDAK
PGQFPWQWLNGKVDAFCGGSIVNEKWIVTAAHCVETGVKITWAGEHNIEETEHTEQKRNVIRIIPHHNYNAAINKY
NHDIALLELDEPLVLNSYVTPICIADKEYTNIFLKFGSGYVSGWGRVFHKGRSALVLQYLRVPLVDRATCLLSTKFTI
YNNMFCAGFHEGGRDSCQGDSGGPHVTEVEGTSFLTGIISWGEECAMKGKYGIYTKVSRYVNWIKEKTKLT
La SEQ ID NO: 10 codifica la secuencia de aminoácidos establecida como la SEQ ID NO: 19:
MQRVNMIMAESPGLITICLLGYLLSAECTVFLDHENANKILNRPKRYNSGKLEEFVQGNLERECMEEKCSFEEAREVF
ENTERTTEFWKQYVDGDQCESNPCLNGGSCKDDINSYECWCPFGFEGKNCELDVTCNIKNGRCEQFCKNSADNKWCS
CTEGYRLAENQKSCEPAVPFPCGRVSVSQTSKLTRAETVFPDVDYVNSTEAETILDNITQSTQSFNDFTRWGGEDAK
PGQFPWQWLNGKVDAFCGGSIVNEKWIVTAAHCVETGVKITWAGEHNIEETEHTEQKRNVIRIIPHHNYNAAINKY
NHDIALLELDEPLVLNSYVTPICIADKEYTNIFLKFGSGYVSGWGRVFHKGRSALVLQYLRVPLVDRATCLLSTKFTI
YNNMFCAGFHEGGRDSCQGDSGGPHVTEVEGTSFLTGIISWGEECAMKGKYGIYTKVSRYVNWIKEKTKLT
Los ácidos nucleicos ejemplares pueden prepararse mediante técnicas de clonación, o pueden generarse sintéticamente. Se conocen ejemplos de técnicas apropiadas de clonación y secuenciación, e instrucciones suficientes para dirigir a los expertos a través de muchos ejercicios de clonación (véase, p. ej., Sambrook et al. (Molecular Cloning: A Laboratory Manual, 4a Ed, Cold Spring Harbor, Nueva York, 2012) y Ausubel et al. (In Current Protocols in Molecular Biology, John Wiley and Sons, Nueva York, a través del suplemento 104, 2013). La información del producto de los fabricantes de reactivos biológicos y equipos experimentales también proporciona información útil. Dichos fabricantes incluyen SIGMA Chemical Company (Saint Louis, MO), R&D Systems (Minneapolis, MN), Pharmacia Amersham (Piscataway, NJ), CLONTECH Laboratories, Inc. (Palo Alto, CA), Chem Genes Corp., Aldrich Chemical Company (Milwaukee, WI), Glen Research, Inc., GIBCO BRL Life Technologies, Inc. (Gaithersburg, MD), Fluka Chemica-Biochemika Analytika (Fluka Chemie AG, Buchs, Switzerland), Invitrogen (Carlsbad, CA), y Applied Biosystems (Foster City, CA), así como muchas otras fuentes comerciales conocidas por un experto.
Los ácidos nucleicos también se pueden preparar por métodos de amplificación. Los métodos de amplificación incluyen la reacción en cadena de la polimerasa (PCR), la reacción en cadena de la ligasa (LCR), el sistema de amplificación basado en la transcripción (TAS), el sistema de replicación de secuencias autosostenida (3SR). Los expertos en la materia conocen bien una amplia variedad de métodos de clonación, células hospedadoras y metodologías de amplificación in vitro.
IV. Vectores Recombinantes y Aplicaciones de Terapia Génica
Las secuencias de los ácidos nucleicos y promotores divulgadas en el presente documento son útiles en la producción de vectores (tales como vectores rAAV), y también son útiles como vectores de suministro antisentido, vectores de terapia génica o vectores de vacuna. En determinadas realizaciones, la invención proporciona vectores de suministro de genes que contienen las secuencias de los ácidos nucleicos de la invención. En algunas realizaciones, el vector seleccionado puede suministrarse a un sujeto por cualquier método adecuado, incluyendo inyección intravenosa, transducción ex vivo, transfección, electroporación, suministro en liposomas, técnicas de fusión de membranas, microgránulos recubiertos con ADN de alta velocidad, infección vírica o fusión de protoplastos, para introducir un transgén en el sujeto.
En determinados aspectos, la divulgación se refiere a partículas de virus, por ejemplo, cápsides, que contienen las secuencias de los ácidos nucleicos que codifican los promotores y las proteínas divulgados en el presente documento. Las partículas víricas, las cápsides y los vectores recombinantes son útiles en el suministro de un gen heterólogo u otras secuencias de los ácidos nucleicos a una célula diana. Los ácidos nucleicos se pueden utilizar fácilmente en una variedad de sistemas de vectores, cápsides y células hospedadoras. En determinadas realizaciones, los ácidos nucleicos están en vectores contenidos dentro de una cápside que comprende proteínas de protección terminal, incluidas las proteínas de la cápside de AAV vp1, vp2, vp3 y las regiones hipervariables.
En determinadas realizaciones, los ácidos nucleicos de la invención pueden ser parte de cualquier elemento genético (vector) que se pueda suministrar a una célula hospedadora, por ejemplo, ADN desnudo, un plásmido, fago, transposón, cósmido, episoma, una proteína en un vehículo de suministro no vírico (por ejemplo, un transportador basado en lípidos), virus, etc. que transfieren las secuencias portadas sobre los mismos.
En determinadas realizaciones, un vector puede ser un vector basado en lentivirus (que contiene genes o secuencias lentivíricos), por ejemplo, que tiene secuencias de los ácidos nucleicos derivadas de pseudotipos VSVG o GP64 o de ambos. En determinadas realizaciones, las secuencias de los ácidos nucleicos derivadas de los pseudotipos VSVG o GP64 pueden ser al menos uno o dos o más genes o fragmentos de genes de más de 1000, 500, 400, 300, 200, 100, 50 o 25 nucleótidos continuos o secuencias de nucleótidos con más de 50, 60, 70, 80, 90, 95 o 99 % de identidad con el gen o fragmento.
La invención también proporciona un vector o composición de la invención para el uso de un método para inducir la coagulación de la sangre en un sujeto que lo necesite. El método comprende administrar al sujeto una cantidad terapéuticamente eficaz del vector (tal como un vector AAV) que codifica un factor de coagulación como se describe en el presente documento. En algunas realizaciones, el sujeto es un sujeto con un trastorno de la coagulación, tal como hemofilia A o hemofilia B. En algunas realizaciones, el trastorno de la coagulación es hemofilia A y al sujeto se le administra un vector que comprende una molécula de ácido nucleico que codifica una proteína con actividad de fVIII. En otras realizaciones, el trastorno de la coagulación es hemofilia B y al sujeto se le administra un vector que comprende una molécula de ácido nucleico que codifica una proteína con actividad de fIX.
En algunas realizaciones, las secuencias de los ácidos nucleicos y promotores de la invención son útiles en la producción de vectores AAV. El AAV pertenece a la familia Parvoviridae y al género Dependovirus. El AAV es un virus pequeño sin envoltura que empaqueta un genoma de ADN lineal de cadena sencilla. Las cadenas de ADN de AAV tanto en sentido como antisentido se empaquetan en cápsides de AAV con la misma frecuencia.
El genoma de AAV se caracteriza por dos repeticiones terminales invertidas (ITR) que flanquean dos marcos de lectura abiertos (ORF). En el genoma de AAV2, por ejemplo, los primeros 125 nucleótidos de la ITR son un palíndromo, que se pliega sobre sí mismo para maximizar el emparejamiento de bases y forma una estructura de horquilla en forma de T. Las otras 20 bases de la ITR, llamadas secuencia D, permanecen sin emparejar. Las ITR son secuencias de acción en cis importantes para la replicación del ADN del AAV; la ITR es el origen de la replicación y sirve como cebador para la síntesis de la segunda cadena por la ADN polimerasa. El ADN bicatenario formado durante esta síntesis, que se llama monómero de forma replicante, se usa para una segunda ronda de replicación autocebadora y forma un dímero de forma replicante. Estos intermedios de doble cadena se procesan mediante un mecanismo de desplazamiento de cadena, lo que da como resultado un ADN de cadena sencilla que se usa para el empaquetamiento y un ADN de bicatenario que se usa para la transcripción. Ubicados dentro de la ITR se encuentran los elementos de unión a Rep y un sitio de resolución terminal (TRS). Estas características son utilizadas por la proteína reguladora vírica Rep durante la replicación de AAV para procesar los intermedios bicatenarios. Además de su papel en la replicación del AAV, la ITR también es esencial para el empaquetamiento del genoma del AAV, transcripción, regulación negativa en condiciones no permisivas y la integración específica de sitio (Daya y Berns, Clin Microbiol Rev 21 (4): 583-593, 2008).
El ORF izquierdo del AAV contiene el gen Rep, que codifica cuatro proteínas: Rep78, Rep 68, Rep52 y Rep40. El ORF derecho contiene el gen Cap, que produce tres proteínas de la cápside vírica (VP1, VP2 y VP3). La cápside del AAV contiene 60 proteínas de la cápside vírica dispuestas en una simetría icosaédrica. VP1, VP2 y VP3 están presentes en una relación molar 1:1:10 (Daya y Berns, Clin Microbiol Rev 21 (4): 583-593, 2008).
Los vectores AAV generalmente contienen un casete de expresión transgénica entre las ITR que reemplaza los genes rep y cap. Las partículas del vector se producen por la cotransfección de células con un plásmido que contiene el genoma del vector y una construcción de empaquetamiento/auxiliar que expresa las proteínas rep y cap en trans. Durante la infección, los genomas de los vectores AAV ingresan al núcleo celular y pueden persistir en múltiples estados moleculares. Un resultado común es la conversión del genoma de AAV a un episoma circular de doble cadena mediante síntesis de la segunda cadena o apareamiento con la cadena complementaria.
En el contexto de los vectores AAV, los vectores divulgados tienen generalmente un genoma recombinante que comprende la siguiente estructura:
(5'ITR de AAV) -(promotor) -(transgén) -(3' ITR de AAV)
Como se analiza anteriormente, estos vectores AAV recombinantes contienen un casete de expresión transgénica entre las ITR que reemplaza los genes rep y cap. Las partículas de vector se producen, por ejemplo, mediante la cotransfección de células con un plásmido que contiene el genoma del vector recombinante y una construcción de empaquetamiento/auxiliar que expresa las proteínas rep y cap en trans. Por ejemplo, en algunos aspectos, el vector AAV recombinante puede tener un genoma con una estructura establecida como una de:
(5' ITR de AAV) -(HCB) -(transgén) -(3' ITR de AAV)
(5' ITR de AAV) -(HCB) -(fVIII) -(3' ITR de AAV)
(5' ITR de AAV) -(HCB) -(fVIII-dominio B eliminado) -(3' ITR de AAV)
(5' ITR de AAV) -(HCB) -(ET3) -(3' ITR de AAV)
(5' ITR de AAV) -(HCB) -(ET3, Seq_12) -(3' ITR de AAV)
(5' ITR de AAV) -(HCB) -(ET3, Seq_11) -(3' ITR de AAV)
(5' ITR de AAV) -(HCB) -(HSQ) -(3' ITR de AAV)
(5' ITR de AAV) -(HCB) -(HSQ, Seq_2) -(3' ITR de AAV)
(5' ITR de AAV) -(HCB) -(fIX) -(3' ITR de AAV)
(5' ITR de AAV) -(HCB) -(fIx, Seq_124) -(3' ITR de AAV)
(5' ITR de AAV) -(HCB) -(fIX, Seq_8) -(3' ITR de AAV)
(5' ITR de AAV) -(HCB) -(fIX, Seq_9) -(3' ITR de AAV)
(5' ITR de AAV) -(HCB) -(fIX, Seq_10) -(3' ITR de AAV)
(5' ITR de AAV) -(HSh-HCB) -(transgén) -(3' ITR de AAV)
(5' ITR de AAV) -(HSh-HCB) -(fVIII) -(3' ITR de AAV)
(5' ITR de AAV) -(HSh-HCB) -(fVIII-dominio B eliminado) -(3' ITR de AAV)
(5' ITR de AAV) -(HSh-HCB) -(ET3) -(3' ITR de AAV)
(5' ITR de AAV) -(HSh-HCB) -(ET3, Seq_12) -(3' ITR de AAV)
(5' ITR de AAV) -(HSh-HCB) -(ET3, Seq_11) -(3' ITR de AAV)
(5' ITR de AAV) -(HSh-HCB) -(HSQ) -(3' ITR de AAV)
(5' ITR de AAV) -(HSh-HCB) -(HSQ, Seq_2) -(3' ITR de AAV)
(5' ITR de AAV) -(HSh-HCB) -(fIX) -(3' ITR de AAV)
(5' ITR de AAV) -(HSh-HCB) -(fIX, Seq_124) -(3' ITR de AAV)
(5' ITR de AAV) -(HSh-HCB) -(fIX, Seq_8) -(3' ITR de AAV)
(5' ITR de AAV) -(HSh-HCB) -(fIX, Seq_9) -(3' ITR de AAV)
(5' ITR de AAV) -(HSh-HCB) -(fIX, Seq_10) -(3' ITR de AAV)
(5' ITR de AAV) -(5'HSh-HCB) -(transgén) -(3' ITR de AAV)
(5' ITR de AAV) -(5'HSh-HCB) -(fVIII-dominio B eliminado) -(3' ITR de AAV)
(5' ITR de AAV) -(5'HSh-HCB) -(ET3) -(3' ITR de AAV)
(5' ITR de AAV) -(5'HSh-HCB) -(ET3, Seq_12) -(3' ITR de AAV)
(5' ITR de AAV) -(5'HSh-HCB) -(ET3, Seq_11) -(3' ITR de AAV)
(5' ITR de AAV) -(5'HSh-HCB) -(HSQ) -(3' ITR de AAV)
(5' ITR de AAV) -(5'HSh-HCB) -(HSQ, Seq_2) -(3' ITR de AAV)
(5' ITR de AAV) -(5'HSh-HCB) -(fIX) -(3' ITR de AAV)
(5' ITR de AAV) -(5'HSh-HCB) -(fIX, Seq_124) -(3' ITR de AAV)
(5' ITR de AAV) -(5'HSh-HCB) -(fIX, Seq_8) -(3' ITR de AAV)
(5' ITR de AAV) -(5'HSh-HCB) -(fIX, Seq_9) -(3' ITR de AAV)
(5' ITR de AAV) -(5'HSh-HCB) -(fIX, Seq_10) -(3' ITR de AAV)
(5' ITR de AAV) -(3'HSh-HCB) -(transgén) -(3' ITR de AAV)
(5' ITR de AAV) -(3'HSh-HCB) -(fVIII) -(3' ITR de AAV)
(5' ITR de AAV) -(3'HSh-HCB) -(fVIII-dominio B eliminado) -(3' ITR de AAV)
(5' ITR de AAV) -(3'HSh-HCB) -(ET3) -(3' ITR de AAV)
(5' ITR de AAV) -(3'HSh-HCB) -(ET3, Seq_12) -(3' ITR de AAV)
(5' ITR de AAV) -(3'HSh-HCB) -(ET3, Seq_11) -(3' ITR de AAV)
(5' ITR de AAV) -(3'HSh-HCB) -(HSQ) -(3' ITR de AAV)
(5' ITR de AAV) -(3'HSh-HCB) -(HSQ, Seq_2) -(3' ITR de AAV)
(5' ITR de AAV) -(3'HSh-HCB) -(fIX) -(3' ITR de AAV)
(5' ITR de AAV) -(3'HSh-HCB) -(fIX, Seq_124) -(3' ITR de AAV)
(5' ITR de AAV) -(3'HSh-HCB) -(fIX, Seq_8) -(3' ITR de AAV)
(5' ITR de AAV) -(3'HSh-HCB) -(fIX, Seq_9) -(3' ITR de AAV)
(5' ITR de AAV) -(3'HSh-HCB) -(fIX, Seq_10) -(3' ITR de AAV)
(5' ITR de AAV) -(ABP-HP1-God-TSS) -(transgén) -(3' ITR de AAV)
(5' ITR de AAV) -(ABP-HPI-God-TSS) -(fVIII) -(3' ITR de AAV)
(5' ITR de AAV) -(ABP-HP1-God-TSS) -(fVIII-dominio B eliminado) -(3' ITR de AAV)
(5' ITR de AAV) -(ABP-HP1-God-TSS) -(ET3) -(3' ITR de AAV)
(5' ITR de AAV) -(ABP-HP1-God-TSS) -(ET3, Seq_12) -(3' ITR de AAV)
(5' ITR de AAV) -(ABP-HP1-God-TSS) -(ET3, Seq_11) -(3' ITR de AAV)
(5' ITR de AAV) -(ABP-HPI-God-TSS) -(HSQ) -(3' ITR de AAV)
(5' ITR de AAV) -(ABP-HPI-God-TSS) -(HSQ, Seq_2) -(3' ITR de AAV)
(5' ITR de AAV) -(ABP-HP1-God-TSS) -(fIX) -(3' ITR de AAV)
(5' ITR de AAV) -(ABP-HP1-God-TSS) -(fIX, Seq_124) -(3' ITR de AAV)
(5' ITR de AAV) -(ABP-HP1-God-TSS) -(fIX, Seq_8) -(3' ITR de AAV)
(5' ITR de AAV) -(ABP-HP1-God-TSS) -(fIX, Seq_9) -(3' ITR de AAV)
(5' ITR de AAV) -(ABP-HP1-God-TSS) -(fIX, Seq_10) -(3' ITR de AAV)
(5' ITR de AAV) -(HSh-SynO-TSS) -(transgén) -(3' ITR de AAV)
(5' ITR de AAV) -(HSh-SynO-TSS) -(fVIII) -(3' ITR de AAV)
(5' ITR de AAV) -(HSh-SynO-TSS) -(fVIII-dominio B eliminado) -(3' ITR de AAV)
(5' ITR de AAV) -(HSh-SynO-TSS) -(ET3) -(3' ITR de AAV)
(5' ITR de AAV) -(HSh-SynO-TSS) -(ET3, Seq_12) -(3' ITR de AAV)
(5' ITR de AAV) -(HSh-SynO-TSS) -(ET3, Seq_11) -(3' ITR de AAV)
(5' ITR de AAV) -(HSh-SynO-TSS) -(HSQ) -(3' ITR de AAV)
(5' ITR de AAV) -(HSh-SynO-TSS) -(HSQ, Seq_2) -(3' ITR de AAV)
(5' ITR de AAV) -(HSh-SynO-TSS) -(fIX) -(3' ITR de AAV)
(5' ITR de AAV) -(HSh-SynO-TSS) -(fIX, Seq_124) -(3' ITR de AAV)
(5' ITR de AAV) -(HSh-SynO-TSS) -(fIX, Seq_8) -(3' ITR de AAV)
(5' ITR de AAV) -(HSh-SynO-TSS) -(fIX, Seq_9) -(3' ITR de AAV)
(5' ITR de AAV) -(HSh-SynO-TSS) -(fIX, Seq_10) -(3' ITR de AAV)
(5' ITR de AAV) -(sHS-SynO-TSS) -(transgén) -(3' ITR de AAV)
(5' ITR de AAV) -(sHS-SynO-TSS) -(fVIII) -(3' ITR de AAV)
(5' ITR de AAV) -(sHS -SynO-TSS) -(fVIII-dominio B eliminado) -(3' ITR de AAV)
(5' ITR de AAV) -(sHS -SynO-TSS) -(ET3) -(3' ITR de AAV)
(5' ITR de AAV) -(sHS -SynO-TSS) -(ET3, Seq_12) -(3' ITR de AAV)
(5' ITR de AAV) -(sHS -SynO-TSS) -(ET3, Seq_11) -(3' ITR de AAV)
(5' ITR de AAV) -(sHS -SynO-TSS) -(HSQ) -(3' ITR de AAV)
(5' ITR de AAV) -(sHS -SynO-TSS) -(HSQ, Seq_2) -(3' ITR de AAV)
(5' ITR de AAV) -(sHS -SynO-TSS) -(fIX) -(3' ITR de AAV)
(5' ITR de AAV) -(sHS -SynO-TSS) -(fIX, Seq_124) -(3' ITR de AAV)
(5' ITR de AAV) -(sHS -SynO-TSS) -(fIX, Seq_8) -(3' ITR de AAV)
(5' ITR de AAV) -(sHS -SynO-TSS) -(fIX, Seq_9) -(3' ITR de AAV)
(5' ITR de AAV) -(sHS -SynO-TSS) -(fIX, Seq_10) -(3' ITR de AAV)
El transgén puede estar flanqueado por secuencias reguladoras tales como una secuencia Kozak 5' y/o una señal de poliadenilación 3'. Por ejemplo, en algunos casos, el vector AAV recombinante puede tener un genoma con una estructura establecida como una de:
(5' ITR de AAV) -(HCB) -(Kozak) -(transgén) -(señal de poliA) -(señal de poliA)
Figure imgf000021_0001
- (3' ITR de AAV) (5' ITR de AAV) -(HCB) -(Kozak) -(fVIII) -(señal de poliA) -(3' ITR de AAV)
(5' ITR de AAV) -(HCB) -(Kozak) -(fVIII-dominio B eliminado) - (señal de poliA) -
Figure imgf000021_0002
(3' ITR de AAV) (5' ITR de AAV) -(HCB) -(Kozak) -(ET3) -(señal de poliA) -(3' ITR de AAV)
(5' ITR de AAV) -(HCB) -(Kozak) -(ET3, Seq_12) -(señal de poliA) -(3' ITR de AAV)
(5' ITR de AAV) -(HCB) -(Kozak) -(ET3, Seq_11) -(señal de poliA) -(3' ITR de AAV)
(5' ITR de AAV) -(HCB) -(Kozak) -(HSQ) -(señal de poliA) -(3' ITR de AAV)
(5' ITR de AAV) -(HCB) -(Kozak) -(HSQ, Seq_2) -(señal de poliA) -(3' ITR de AAV)
(5' ITR de AAV) -(HCB) -(Kozak) -(fIX) -(señal de poliA) -(3' ITR de AAV)
(5' ITR de AAV) -(HCB) -(Kozak) -(fIX, Seq_124) -(señal de poliA) -(3' ITR de AAV)
(5' ITR de AAV) -(HCB) -(Kozak) -(fIX, Seq_8) -(señal de poliA) -(3' ITR de AAV)
(5' ITR de AAV) -(HCB) -(Kozak) -(fIX, Seq_9) -(señal de poliA) -(3' ITR de AAV)
(5' ITR de AAV) -(HCB) -(Kozak) -(fIX, Seq_10) -(señal de poliA) -(3' ITR de AAV)
(5' ITR de AAV) -(HSh-HCB) -(Kozak) -(transgén) -(señal de poliA) -(3' ITR de AAV)
(5' ITR de AAV) -(HSh-HCB) -(Kozak) -(fVIII) -(señal de poliA) -(3' ITR de AAV)
(5' ITR de AAV) -(HSh-HCB) -(Kozak) -(fVIII-dominio B eliminado) -(señal de poliA) -(3' ITR de AAV) (5' ITR de AAV) -(HSh-HCB) -(Kozak) -(ET3) -(señal de poliA) -(3' ITR de AAV)
(5' ITR de AAV) -(HSh-HCB) -(Kozak) -(ET3, Seq_12) -(señal de poliA) -(3' ITR de AAV)
(5' ITR de AAV) -(HSh-HCB) -(Kozak) -(ET3, Seq_11) -(señal de poliA) -(3' ITR de AAV)
(5' ITR de AAV) -(HSh-HCB) -(Kozak) -(HSQ) -(señal de poliA) -(3' ITR de AAV)
(5' ITR de AAV) -(HSh-HCB) -(Kozak) -(HSQ, Seq_2) -(señal de poliA) -(3' ITR de AAV)
(5' ITR de AAV) -(HSh-HCB) -(Kozak) -(fIX) -(señal de poliA) -(3' ITR de AAV)
(5' ITR de AAV) -(HSh-HCB) -(Kozak) -(fIX, Seq_124) -(señal de poliA) -(3' ITR de AAV)
(5' ITR de AAV) -(HSh-HCB) -(Kozak) -(fIX, Seq_8) -(señal de poliA) -(3' ITR de AAV)
(5' ITR de AAV) -(HSh-HCB) -(Kozak) -(fIX, Seq_9) -(señal de poliA) -(3' ITR de AAV)
(5' ITR de AAV) -(HSh-HCB) -(Kozak) -(fIX, Seq_10) -(señal de poliA) -(3' ITR de AAV)
(5' ITR de AAV) -(5'HSh-HCB) -(Kozak) -(transgén) -(señal de poliA) -(3' ITR de AAV)
(5' ITR de AAV) -(5'HSh-HCB) -(Kozak) -(fVIII) -(señal de poliA) -(3' ITR de AAV)
h-HCB) -(Kozak) -(fVIII-dominio B eliminado) -(señal de poliA) - (3' ITR de AAV)
(5' ITR de AAV) - (5'HSh-HCB) -(Kozak) -(ET3) -(señal de poliA) -(3' ITR de AAV)
(5' ITR de AAV) -(5'HSh-HCB) -(Kozak) -(ET3, Seq_12) -(señal de poliA) -(3' ITR de AAV)
(5' ITR de AAV) -(5'HSh-HCB) -(Kozak) -(ET3, Seq_11) -(señal de poliA) -(3' ITR de AAV)
(5' ITR de AAV) -(5'HSh-HCB) -(Kozak) -(HSQ) -(señal de poliA) -(3' ITR de AAV)
(5' ITR de AAV) -(5'HSh-HCB) -(Kozak) -(HSQ, Seq_2) -(señal de poliA) -(3' ITR de AAV)
(5' ITR de AAV) -(5'HSh-HCB) -(Kozak) -(fIX) -(señal de poliA) -(3' ITR de AAV)
(5' ITR de AAV) -(5'HSh-HCB) -(Kozak) -(fIX, Seq_124) -(señal de poliA) -(3' ITR de AAV)
(5' ITR de AAV) -(5'HSh-HCB) -(Kozak) -(fIX, Seq_8) -(señal de poliA) -(3' ITR de AAV)
(5' ITR de AAV) -(5'HSh-HCB) -(Kozak) -(fIX, Seq_9) -(señal de poliA) -(3' ITR de AAV)
(5' ITR de AAV) -(5'HSh-HCB) -(Kozak) -(fIX, Seq_10) -(señal de poliA) -(3' ITR de AAV)
(5' ITR de AAV) -(3'HSh-HCB) -(Kozak) -(transgén) -(señal de poliA) -(3' ITR de AAV)
(5' ITR de AAV) - (3'HSh-HCB) -(Kozak) -(fVIII) -(señal de poliA -(3' ITR de AAV
Figure imgf000022_0001
de AAV)
(5' ITR de AAV) -(ABP-HP1-God-TSS) -(Kozak) -(fIX, Seq_10) -(señal de poliA) -(3' ITR de AAV)
(5' ITR de AAV) -(HSh-SynO-TSS) -(Kozak) -(transgén) -(señal de poliA) -(3' ITR de AAV)
(5' ITR de AAV) -(HSh-SynO-TSS) -(Kozak) -(fVIII) -(señal de poliA) -(3' ITR de AAV)
(5' ITR de AAV) -(HSh-SynO-TSS) -(Kozak) -(fVIII-dominio B eliminado) -(señal de poliA) -(3' ITR de AAV)
(5' ITR de AAV) -(HSh-SynO-TSS) -(Kozak) -(ET3) -(señal de poliA) -(3' ITR de AAV)
(5' ITR de AAV) -(HSh-SynO-TSS) -(Kozak) -(ET3, Seq_12) -(señal de poliA) -(3' ITR de AAV)
(5' ITR de AAV) -(HSh-SynO-TSS) -(Kozak) -(ET3, Seq_11) -(señal de poliA) -(3' ITR de AAV)
(5' ITR de AAV) -(HSh-SynO-TSS) -(Kozak) -(HSQ) -(señal de poliA) -(3' ITR de AAV)
(5' ITR de AAV) -(HSh-SynO-TSS) -(Kozak) -(HSQ, Seq_2) -(señal de poliA) -(3' ITR de AAV)
(5' ITR de AAV) -(HSh-SynO-TSS) -(Kozak) -(fIX) -(señal de poliA) -(3' ITR de AAV)
(5' ITR de AAV) -(HSh-SynO-TSS) -(Kozak) -(fIX, Seq_124) -(señal de poliA) -(3' ITR de AAV)
(5' ITR de AAV) -(HSh-SynO-TSS) -(Kozak) -(fIX, Seq_8) -(señal de poliA) -(3' ITR de AAV)
(5' ITR de AAV) -(HSh-SynO-TSS) -(Kozak) -(fIX, Seq_9) -(señal de poliA) -(3' ITR de AAV)
(5' ITR de AAV) - (HSh-SynO-TSS) -(Kozak) -(fIX, Seq_10) -(señal de poliA) -(3' ITR de AAV)
(5' ITR de AAV) - (sHS-SynO-TSS) -(Kozak) -(transgén) -(señal de poliA) -(3' ITR de AAV)
(5' ITR de AAV) -(sHS-SynO-TSS) -(Kozak) -(fVIII) -(señal de poliA) -(3' ITR de AAV)
(5' ITR de AAV) - (sHS -SynO-TSS) -(Kozak) -(fVIII-dominio B eliminado) -(señal de poliA) -(3' ITR de AAV) (5' ITR de AAV) - (sHS -SynO-TSS) -(Kozak) -(ET3) -(señal de poliA) -(3' ITR de AAV)
(5' ITR de AAV) -(sHS -SynO-TSS) -(Kozak) -(ET3, Seq_12) -(señal de poliA) -(3' ITR de AAV)
(5' ITR de AAV) -(sHS -SynO-TSS) -(Kozak) -(ET3, Seq_11) -(señal de poliA) -(3' ITR de AAV)
(5' ITR de AAV) -(sHS -SynO-TSS) -(Kozak) -(HSQ) -(señal de poliA) -(3' ITR de AAV)
(5' ITR de AAV) -(sHS -SynO-TSS) -(Kozak) -(HSQ, Seq_2) -(señal de poliA) -(3' ITR de AAV)
(5' ITR de AAV) -(sHS -SynO-TSS) -(Kozak) -(fIX) -(señal de poliA) -(3' ITR de AAV)
(5' ITR de AAV) -(sHS -SynO-TSS) -(Kozak) -(fIX, Seq_124) -(señal de poliA) -(3' ITR de AAV)
(5' ITR de AAV) -(sHS -SynO-TSS) -(Kozak) -(fIX, Seq_8) -(señal de poliA) -(3' ITR de AAV)
(5' ITR de AAV) -(sHS -SynO-TSS) -(Kozak) -(fIX, Seq_9) -(señal de poliA) -(3' ITR de AAV)
(5' ITR de AAV) -(sHS -SynO-TSS) -(Kozak) -(fIX, Seq_10) -(señal de poliA) -(3' ITR de AAV)
Las ITR de AAV, y otros componentes de AAV seleccionados descritos en el presente documento, pueden seleccionarse fácilmente entre cualquier serotipo de AAV, incluyendo, sin limitación, AAV1, AAV2, AAV3, AAV4, AAV5, AAV6, AAV7, AAV8, AAV9 y variantes de función de los mismos. Estas ITR u otros componentes de AAV pueden aislarse fácilmente utilizando técnicas disponibles para los expertos en la materia a partir de un serotipo de AAV. Dicho AAV puede aislarse u obtenerse de fuentes académicas, comerciales o públicas (por ejemplo, la American Type Culture Collection, Manassas, Va.). De manera alternativa, las secuencias de AAV pueden obtenerse a través de medios sintéticos u otros medios adecuados por referencia a secuencias publicadas como las que están disponibles en la bibliografía o en bases de datos tales como, por ejemplo, GenBank, PubMed o similares.
En algunas realizaciones, el vector puede ser un vector AAV recombinante que comprende un genoma que comprende una molécula de ácido nucleico que codifica cualquiera de los promotores específicos de hígado de la invención (tal como el promotor HCB, SEQ ID NO: 4) operativamente unido a una molécula de ácido nucleico heterólogo que codifica una variante de fVIII, en donde la molécula de ácido nucleico heterólogo comprende o consiste en la secuencia del ácido nucleico establecida como la SEQ ID NO: 2, SEQ ID NO: 11, SEQ ID NO: 12, SEQ ID NO: 125, o SEQ ID NO: 126, o una secuencia del ácido nucleico al menos un 90 % idéntica a la SEQ ID NO: 2, SEQ ID NO: 11, SEQ ID NO: 12, SEQ ID NO: 125 o SEQ ID NO: 126. En varias de tales realizaciones, el genoma de AAV recombinante (de 5 'a 3' ITR) no tiene más de 5,1, 5,0, 4,9, 4,8, 4,7, 4,6 o 4,5 kb de longitud.
En algunas realizaciones, el vector puede ser un vector AAV recombinante que comprende un genoma que comprende una molécula de ácido nucleico que codifica cualquiera de los promotores específicos del hígado de la invención (tal como el promotor HCB, SEQ ID NO: 4) operativamente unido a una molécula de ácido nucleico heterólogo que codifica una variante de fIX, en donde la molécula de ácido nucleico heterólogo comprende o consiste en la secuencia del ácido nucleico establecida como la SEQ ID NO: 8, SEQ ID NO: 9, SEQ ID NO: 10, SEQ ID NO: 124, o SEQ ID NO: 127, o una secuencia del ácido nucleico al menos un 90 % idéntica a la SEQ ID NO: 8, SEQ ID NO: 9, SEQ ID NO: 10, SEQ ID NO: 124 o SEQ ID NO: 127. En varias de tales realizaciones, el genoma de AAV recombinante (de 5 'a 3' ITR) no tiene más de 5,1, 5,0, 4,9, 4,8, 4,7, 4,6 o 4,5 kb de longitud.
El AAV es actualmente uno de los virus más utilizados para terapia génica. Aunque el AAV infecta a los seres humanos y a algunas otras especies de primates, no se sabe que cause enfermedad y provoca una respuesta inmunitaria muy leve. Los vectores de terapia génica que utilizan AAV pueden infectar tanto las células en división como las quiescentes y persisten en un estado extracromosómico sin integrarse en el genoma de la célula hospedadora. Debido a las características ventajosas del AAV, la presente divulgación contempla el uso del AAV para las moléculas de ácidos nucleicos recombinantes y los métodos divulgados en el presente documento.
El AAV posee varias características deseables para un vector de terapia génica, incluida la capacidad de unirse y entrar en las células diana, ingresar al núcleo, la capacidad de expresarse en el núcleo durante un período prolongado de tiempo y baja toxicidad. Sin embargo, el pequeño tamaño del genoma del AAV limita el tamaño del ADN heterólogo que se puede incorporar. Para minimizar este problema, se han construido vectores AAV que no codifican Rep ni el elemento de eficacia de integración (IEE, por sus siglas en inglés). Las ITR se conservan ya que son señales en cis requeridas para el empaquetamiento (Daya y Berns, Clin Microbiol Rev 21 (4): 583-593, 2008).
Se conocen métodos para producir rAAV adecuados para terapia génica (véase, por ejemplo, las Solicitudes de Patente de EE. UU. N.° 2012/0100606; 2012/0135515; 2011/0229971; y 2013/0072548; y Ghosh et al., Gene Ther 13(4):321-329, 2006), y pueden utilizarse con las moléculas de ácidos nucleicos recombinantes y los métodos divulgados en el presente documento.
En algunas realizaciones, los ácidos nucleicos de la invención son parte de un casete de expresión o transgén. Véase por ejemplo, la publicación de solicitud de Patente de Estados Unidos 20150139953. El casete de expresión se compone de un transgén y secuencias reguladoras, por ejemplo, por ejemplo un promotor y repeticiones terminales invertidas (ITR) del AVV 5 'y 3'. En una realización deseable, se utilizan las ITR del serotipo 2 u 8 del AAV. Sin embargo, se pueden seleccionar ITR de otros serotipos adecuados. Un casete de expresión se empaqueta generalmente en una proteína de la cápside y se suministra a una célula hospedadora seleccionada.
En algunos aspectos, la divulgación proporciona un método para generar un virus adenoasociado (AAV) recombinante que tiene una cápside de serotipo del AAV, o una porción de la misma. Tal método implica el cultivo de una célula hospedadora que contiene una secuencia del ácido nucleico que codifica una proteína de la cápside del serotipo de virus adenoasociados (AAV); un gen rep funcional; un casete de expresión compuesto por repeticiones terminales invertidas (ITR) de AAV y un transgén; y suficiente funciones auxiliares para permitir el empaquetamiento del casete de expresión en la proteína de la cápside del AAV. Véase por ejemplo, la publicación de solicitud de Patente de Estados Unidos 20150139953.
Los componentes para el cultivo en la célula hospedadora para empaquetar un casete de expresión de AAV en una cápside de AAV pueden proporcionarse a la célula hospedadora en trans. De manera alternativa, uno o más de los componentes (por ejemplo, casete de expresión, secuencias rep, secuencias cap y/o funciones auxiliares) pueden proporcionarse mediante una célula hospedadora estable que se ha modificado por ingeniería para contener uno o más de los componentes requeridos utilizando métodos conocidos por los expertos en la materia. De forma más adecuada, dicha célula hospedadora estable contendrá los componente(s) bajo el control de un promotor inducible. Sin embargo, los componente(s) requeridos pueden estar bajo el control de un promotor constitutivo. En otra alternativa más, una célula hospedadora estable seleccionada puede contener componente(s) seleccionados bajo el control de un promotor constitutivo y otros componente(s) seleccionados bajo el control de uno o más promotores inducibles. Por ejemplo, se puede generar una célula hospedadora estable que deriva de células 293 (que contienen funciones E1 auxiliares bajo el control de un promotor constitutivo), pero que contiene las proteínas rep y/o cap bajo el control de promotores inducibles. Un experto en la materia puede generar otras células hospedadoras estables adicionales.
En algunas realizaciones, la invención se refiere a vectores recombinantes que comprenden una secuencia del ácido nucleico del promotor específico de hígado de la invención en combinación operativa con el transgén. El transgén es una secuencia de un ácido nucleico, heteróloga a las secuencias del vector que flanquean el transgén, que codifica una proteína u otro producto de interés. La secuencia codificante del ácido nucleico está operativamente unida a componentes reguladores de una manera que permite la transcripción, traducción y/o expresión transgénica en una célula hospedadora.
Un transgén típico es una secuencia que codifica un producto que es útil en biología y medicina, tales como proteínas, péptidos, ARN, enzimas, mutantes negativos dominantes o ARN catalíticos. Las moléculas de ARN deseables incluyen ARNm, ARNt, ARNbc, ARN ribosómico, ARN catalíticos, ARNip, microARN, ARN de horquilla pequeña, ARN de corte y empalme en trans y ARN antisentido. Un ejemplo de una secuencia de ARN útil es una secuencia que inhibe o extingue la expresión de una secuencia del ácido nucleico dirigida en el animal tratado. Generalmente, las secuencias diana adecuadas incluyen dianas oncológicas y enfermedades víricas.
El transgén puede usarse para corregir o mejorar las deficiencias genéticas, que pueden incluir deficiencias en las que los genes normales se expresan a niveles inferiores a los normales o deficiencias en las que el producto génico funcional no se expresa. Un tipo preferido de secuencia transgénica codifica una proteína o polipéptido terapéutico que se expresa en una célula hospedadora. La divulgación además contempla el uso de múltiples transgenes, por ejemplo, para corregir o mejorar un defecto genético causado por una proteína de múltiples subunidades. En determinadas situaciones, se puede usar un transgén diferente para codificar cada subunidad de una proteína, o para codificar diferentes péptidos o proteínas. Esto es deseable cuando el tamaño del ADN que codifica la subunidad de la proteína es grande, por ejemplo, para una inmunoglobulina, el factor de crecimiento derivado de plaquetas o una proteína distrofina. Para que la célula produzca la proteína de múltiples subunidades, se infecta una célula con el virus recombinante que contiene cada una de las diferentes subunidades. De manera alternativa, diferentes subunidades de una proteína pueden estar codificadas por el mismo transgén. En este caso, un solo transgén incluye el ADN que codifica cada una de las subunidades, con el ADN de cada subunidad separado por un sitio interno de entrada al ribosoma (IRES). Esto es deseable cuando el tamaño del ADN que codifica cada una de las subunidades y las regiones de control reguladoras en cis tal como un promotor, intrón, señal de poliA, es pequeño, por ejemplo, el tamaño total del ADN que codifica las subunidades y los IRES y las regiones de control regulador en cis es menor de cinco kilobases. Como alternativa a un IRES, el ADN puede estar separado por secuencias que codifican un péptido 2A, que se autoescinde en un evento postraduccional. Véanse, por ejemplo, M. L. Donnelly, et al., J. Gen. Virol., 78(Pt 1):13-21 (Enero de 1997); Furler, S., et al, Gene Ther., 8(11):864-873 (Junio de 2001); Klump H., et al., Gene Ther., 8(10):811-817 (Mayo de 2001). En determinadas realizaciones, los rAAV que portan los transgenes o subunidades deseados se administran conjuntamente para permitirles concatamerizar in vivo para formar un genoma de vector único. En dicha una realización, un primer AAV puede portar un casete de expresión que expresa un solo transgén y un segundo AAV puede portar un casete de expresión que expresa un transgén diferente para la coexpresión en la célula hospedadora. Sin embargo, el transgén seleccionado puede codificar cualquier producto biológicamente activo u otro producto, por ejemplo, un producto deseable para estudio.
El casete de expresión se puede portar en cualquier vector adecuado, por ejemplo, un plásmido, que se suministra a una célula hospedadora. Los plásmidos útiles en la presente divulgación pueden modificarse por ingeniería de modo que sean adecuados para la replicación y, opcionalmente, la integración en células procariotas, células de mamífero o ambas. Estos plásmidos (u otros vectores que portan la 5' ITR de AAV-molécula heteróloga-3' ITR) contienen secuencias que permiten la replicación del casete de expresión en eucariotas y/o procariotas y marcadores de selección para estos sistemas. Preferentemente, La molécula que porta el casete de expresión se transfecta en la célula, donde puede existir de forma transitoria. De manera alternativa, el casete de expresión (que porta la 5' ITR de AAV-molécula heteróloga-3' ITR) puede integrarse de manera estable en el genoma de la célula hospedadora, ya sea cromosómicamente o como un episoma. En determinadas realizaciones, el casete de expresión puede estar presente en múltiples copias, opcionalmente en concatámeros cabeza a cabeza, cabeza a cola o cola a cola. Se conocen técnicas de transfección adecuadas y se pueden utilizar fácilmente para suministrar el casete de expresión a la célula hospedadora.
Por lo general, cuando se suministra el vector que comprende el casete de expresión por transfección, pueden ajustarse el vector y las cantidades relativas de ADN del vector a las células hospedadoras, teniendo en cuenta factores tales como el vector seleccionado, el método de suministro y las células hospedadoras seleccionadas. Además del casete de expresión, la célula hospedadora contiene las secuencias que impulsan la expresión de la proteína de la cápside del AAV en la célula hospedadora y las secuencias rep del mismo serotipo que el serotipo de las ITR del AAV encontrados en el casete de expresión, o de un serotipo de complemento cruzado. Aunque las moléculas que proporcionan rep y cap pueden existir en la célula hospedadora de forma transitoria (es decir, a través de la transfección), se prefiere que una o ambas proteínas rep y cap y el (los) promotor(es) que controlan su expresión se expresen de manera estable en la célula hospedadora, por ejemplo, como un episoma o por integración en el cromosoma de la célula hospedadora.
La célula hospedadora de empaquetamiento generalmente también contiene funciones auxiliares para empaquetar el rAAV de la divulgación. Opcionalmente, estas funciones pueden suministrarse por un herpesvirus. De manera más deseable, las funciones auxiliares necesarias se proporcionan cada una de una fuente de adenovirus de primates humanos o no humanos, tal como las descritas anteriormente y/o están disponibles en una variedad de fuentes, incluida la American Type Culture Collection (ATCC), Manassas, Va. (EE.UU). Las funciones auxiliares deseadas, se pueden proporcionar utilizando cualquier medio que permita su expresión en una célula.
La introducción en la célula hospedadora del vector se puede lograr por cualquier medio conocido en la técnica o como se divulga anteriormente, incluyendo transfección, infección, electroporación, suministro en liposomas, técnicas de fusión de membranas, microgránulos recubiertos con ADN de alta velocidad, infección vírica o fusión de protoplastos, entre otros. Uno o más de los genes adenovíricos pueden integrarse de manera estable en el genoma de la célula hospedadora, expresarse de manera estable como episomas o expresarse de manera transitoria. Todos los productos génicos pueden expresarse de manera transitoria, en un episoma o integrarse de manera estable, o algunos de los productos génicos pueden expresarse de manera estable mientras que otros se expresan de manera transitoria. Además, los promotores para cada uno de los genes adenovíricos pueden seleccionarse independientemente de un promotor constitutivo, un promotor inducible o un promotor adenovírico natural. Los promotores pueden estar regulados por un estado fisiológico específico del organismo o la célula (es decir, por el estado de diferenciación o en células en replicación o quiescentes) o por factores añadidos exógenamente, por ejemplo.
La introducción de las moléculas (como plásmidos o virus) en la célula hospedadora se puede lograr utilizando técnicas conocidas por el experto en la materia. En una realización preferida, se usan técnicas de transfección convencionales, por ejemplo, transfección o electroporación con CaPO4, y/o infección por vectores híbridos de adenovirus/AAV en líneas celulares tales como la línea celular de riñón embrionario humano HEK 293 (una línea celular de riñón humano que contiene genes E1 de adenovirus funcionales que proporcionan proteínas E1 de acción en trans).
Un experto en la materia comprenderá fácilmente que las técnicas de AAV pueden adaptarse para su uso en estos y otros sistemas de vectores víricos para el suministro de genes in vitro, ex vivo o in vivo. En determinadas realizaciones, la divulgación contempla el uso de ácidos nucleicos y vectores divulgados en el presente documento en una variedad de sistemas de vectores rAAV y no rAAV. Tales sistemas de vectores pueden incluir, por ejemplo, lentivirus, retrovirus, poxvirus, virus vaccinia y sistemas adenovíricos, entre otros.
Se contempla que las partículas víricas, los ácidos nucleicos y los vectores divulgados en el presente documento sean útiles para una variedad de propósitos, incluido el suministro de moléculas terapéuticas para la expresión génica de proteínas terapéuticas.
Las proteínas terapéuticas codificadas por los ácidos nucleicos (p. ej., operativamente en combinación con los promotores) informadas en el presente documento incluyen las utilizadas para el tratamiento de la hemofilia, incluida la hemofilia B (incluyendo el fIX) y la hemofilia A (incluyendo el fVIII y sus variantes, tal como la cadena ligera y cadena pesada del heterodímero y con el dominio B eliminado; Patente de Estados Unidos N.° 6.200.560 y Patente de Estados Unidos N.° 6.221.349). El gen del Factor VIII codifica 2351 aminoácidos y la proteína tiene seis dominios, designados desde el extremo amino al carboxilo terminal como A1-A2-B-A3-C1-C2 [Wood et al, Nature, 312:330 (1984); Vehar et al., Nature 312:337 (1984); y Toole et al, Nature, 342:337 (1984)]. El fVIII humano se procesa dentro de la célula para producir un heterodímero que comprende principalmente una cadena pesada que contiene los dominios A1, A2 y B y una cadena ligera que contiene los dominios A3, C1 y C2. Tanto el polipéptido de cadena única como el heterodímero circulan en el plasma como precursores inactivos, hasta que se activan mediante la escisión por trombina entre los dominios A2 y B, que libera el dominio B y da como resultado una cadena pesada que consiste en los dominios A1 y A2. El dominio B se elimina en la forma procoagulante activada de la proteína. Adicionalmente, en la proteína natural, dos cadenas polipeptídicas ("a" y "b"), que flanquean el dominio B, están unidas a un catión de calcio divalente.
Una opción de tratamiento para un paciente diagnosticado con hemofilia A es la administración exógena de fVIII recombinante, a veces denominada terapia de reemplazo de fVIII. En algunos pacientes, esta terapia puede conducir al desarrollo de anticuerpos que se unen a la proteína fVIII administrada. Posteriormente, los conjugados unidos fVIII-anticuerpo, generalmente conocidos como inhibidores, interfieren o retrasan la capacidad de fVIII para causar la coagulación sanguínea. Los autoanticuerpos inhibitorios también se producen a veces espontáneamente en un sujeto que no está genéticamente en riesgo de tener hemofilia, denominada hemofilia adquirida. Los ensayos de anticuerpos inhibitorios se realizan generalmente antes del tratamiento exógeno con fVIII para determinar si la terapia anticoagulante será eficaz.
Históricamente, se ha utilizado un "ensayo Bethesda" para cuantificar la dosificación inhibitoria de la concentración de anticuerpos de unión a fVIII. En el ensayo, se preparan diluciones en serie de plasma de un paciente, por ejemplo, antes de someterse a cirugía, y cada dilución se mezcla con un volumen igual de plasma normal como fuente de fVIII. Después de incubar durante un par de horas, se miden las actividades de fVIII en cada una de las mezclas diluidas. Tener concentraciones de inhibidor de anticuerpos que evitan la actividad de coagulación de fVIII después de múltiples diluciones repetidas indica un mayor riesgo de sangrado incontrolado. Se cree que es poco probable que los pacientes con títulos de inhibidores después de aproximadamente diez diluciones respondan a infusiones exógenas de fVIII para detener el sangrado. Un título Bethesda se define como el valor recíproco de la dilución que da como resultado una inhibición del 50 % de la actividad de FVIII presente en el plasma humano normal. Un título Bethesda superior a 10 se considera el umbral de respuesta a la terapia de reemplazo de FVIII.
En determinadas realizaciones, la invención se refiere a una partícula vírica o cápside que comprende un vector de la invención que comprende un ácido nucleico que codifica un factor de coagulación sanguínea como se divulga en el presente documento para usar en métodos para inducir la coagulación sanguínea, comprendiendo dicho método administrar una cantidad eficaz a un sujeto que lo necesite.
En determinadas realizaciones, el sujeto es diagnosticado con hemofilia A o B o hemofilia adquirida o es poco probable que responda a infusiones exógenas de fVIII.
En algunas realizaciones, la invención se refiere a un vector vírico adenoasociado (AAV) que codifica fIX humano como el vehículo de suministro génico para su uso en métodos de transferencia génica para el tratamiento de la hemofilia B. Si bien varias de estas terapias génicas basadas en AAV para la hemofilia B se han incorporado en ensayos clínicos en seres humanos, se han visto obstaculizadas por la baja expresión de la proteína terapéutica, fIX de coagulación, después de la administración del virus, lo que da como resultado solamente una corrección parcial de la enfermedad. La toxicidad del vector AAV limita la dosis del virus que puede administrarse de manera segura. Para una transición exitosa a una terapia clínicamente viable, un vector debe proporcionar una expresión eficaz de fIX a dosis víricas por debajo del umbral de toxicidad.
El tratamiento de pacientes con inhibidores de fVIII también se ha logrado mediante métodos de inducción de tolerancia inmunitaria (ITI, por sus siglas en inglés) que generalmente implican la infusión diaria de fVIII hasta que disminuyen los niveles de inhibidor/anticuerpo circulante. Sin embargo, un 20-30 % de los pacientes no se vuelven tolerantes después de una terapia de inducción de tolerancia inmunitaria (ITI). La persistencia de los inhibidores de fVIII se asocia con riesgos de morbilidad y mortalidad aumentados. En determinados aspectos, la divulgación se refiere a métodos de inducción de tolerancia inmunitaria que comprenden administrar una cantidad eficaz de un vector o una cápside como se divulga en el presente documento a un sujeto que lo necesite.
En algunas realizaciones, las proteínas terapéuticas codificadas por los ácidos nucleicos (p. ej., operativamente en combinación con promotores) indicadas en el presente documento comprenden los primeros 57 pares de bases de la cadena pesada de fVIII que codifica la secuencia señal de 10 aminoácidos, así como la secuencia de poliadenilación de beta globina humana o la secuencia de poliadenilación de la hormona de crecimiento (hGH). En realizaciones alternativas, los dominios A1 y A2, así como 5 aminoácidos del extremo N del dominio B y/u 85 aminoácidos del extremo C del dominio B, así como los dominios A3, C1 y C2. En otras realizaciones más, los ácidos nucleicos que codifican la cadena pesada y la cadena ligera de fVIII se proporcionan en un único ácido nucleico separado por 42 ácidos nucleicos que codifican 14 aminoácidos del dominio B. Véase la patente de EE.UU. n.° 6.200.560.
Como se usan en el presente documento, una cantidad terapéuticamente eficaz es una cantidad de vector AAV que produce cantidades suficientes de fVIII para disminuir el tiempo que tarda la sangre de un sujeto en coagularse. Por lo general, los hemofílicos graves que tienen menos del 1 % de los niveles normales de fVIII tienen un tiempo de coagulación de la sangre total de más de 60 minutos en comparación con aproximadamente 10 minutos para los no hemofílicos.
La presente divulgación no se limita a ninguna secuencia específica de fVIII o fIX u otra proteína indicada en el presente documento. Se han aislado y generado muchas formas naturales y recombinantes de fVIII. Se pueden encontrar ejemplos de formas de origen natural y recombinantes de fVII en la bibliografía científica y de patentes que incluye, patente de los EE.UU. n.° 5.563.045, patente de los EE.UU. n.° 5.451.521, patente de los EE.UU. n.° 5.422.260, patente de los EE.UU. n.° 5.004.803, patente de los EE.UU. n.° 4.757.006, patente de los EE.UU. n.° 5.661.008, patente de los EE.UU. n.° 5.789.203, patente de los EE.UU. n.° 5.681.746, patente de los EE.UU. n.° 5.595.886, patente de los EE.UU. n.° 5.045.455, patente de los EE.UU. n.° 5.668.108, patente de los EE.UU. n.° 5.633.150, patente de los EE.UU. n.° 5.693.499, patente de los EE.UU. n.° 5.587.310, patente de los EE.UU. n.° 5.171.844, patente de los EE.UU. n.° 5.149.637, patente de los EE.UU. n.° 5.112.950, patente de los EE.UU. n.° 4.886.876, el documento WO 94/11503, el documento WO 87/07144, el documento WO 92/16557, el documento WO 91/09122, el documento WO 97/03195, el documento WO 96/21035, el documento WO 91/07490, el documento EP 0672 138, el documento EP 0270 618, el documento EP 0 182448, el documento EP 0 162 067, el documento EP 0786 474, el documento EP 0533 862, el documento EP 0506 757, el documento EP 0 874 057, el documento EP 0795 021, el documento EP 0 670 332, el documento EP 0 500 734, el documento EP 0232 112, el documento EP 0 160 457, Sanberg et al., Int. Congress of the World Fed. Of Hemophilia (1992), y Lind et al., Eur. J. Biochem., 232:19 (1995).
Además, la divulgación no se limita al fVIII humano. De hecho, se pretende que la presente divulgación abarque fVIII de animales que no sean humanos, incluidos, entre otros, animales de compañía (por ejemplo, canino, felinos y equinos), ganado (por ejemplo, bovinos, caprinos y ovinos), animales de laboratorio, mamíferos marinos, grandes felinos, etc.
Los vectores AAV pueden contener un ácido nucleico que codifica fragmentos de fVIII que en sí mismo no es biológicamente activo, sin embargo, cuando se administra al sujeto mejora o restaura el tiempo de coagulación de la sangre. Por ejemplo, la proteína fVIII comprende dos cadenas polipeptídicas: una cadena pesada y una cadena ligera separadas por un dominio B que se escinde durante el procesamiento. La transducción conjunta de células receptoras con las cadenas pesada y ligera de FVIII conducen a la expresión de fVIII biológicamente activo. La administración de solamente la cadena defectuosa se contempla en pacientes porque la mayoría de los hemofílicos contienen una mutación o deleción en una sola de las cadenas (p. ej., cadena pesada o ligera).
Por lo tanto, en determinadas realizaciones, la divulgación se refiere a vectores de la invención que tienen ácidos nucleicos que codifican una cadena ligera que contiene los dominios A3, C1 y C2 o una cadena pesada que consiste en los dominios A1 y A2.
Descripción adicional de vectores recombinantes y modalidades terapéuticas
Los vectores recombinantes divulgados en el presente documento (por ejemplo, un vector AAV recombinante) se pueden usar en varias aplicaciones terapéuticas diferentes, dependiendo de la proteína de interés codificada por el vector recombinante.
En determinados aspectos, los usos son para el tratamiento de la hemocromatosis hereditaria (HH), un trastorno importante de sobrecarga de hierro, enfermedad de Wilson, un trastorno genético de sobrecarga de cobre y deficiencia de alfal-antitripsina (a1-AT). En determinados aspectos, la proteína es alfal-antitripsina humana (a1-AT, Registro: P01009.3), proteína HFE (Registro NP_000401.1 o Q3020l) o proteína hepática ATP7B (registro P35670.4) o variantes con más de 50, 60, 70, 80, 90, 95 o 95 de identidad o similitud de secuencia.
En determinados aspectos, el uso es para el tratamiento de hipercolesterolemia utilizando un promotor del presente documento en combinación operativa con un ácido nucleico que codifica para fenilalanina hidroxilasa humana (Registro: P00439.1) o variantes con más de 50, 60, 70, 80, 90, 95 o 95 de identidad o similitud de secuencia.
En determinados aspectos, el uso es para el tratamiento de tirosinemia tipo 1 usando un promotor del presente documento en combinación operativa con un ácido nucleico que codifica para fumarilacetoacetato hidrolasa de humana (Registro: P16930.2) o variantes con más de 50, 60, 70, 80, 90, 95 o 95 de identidad o similitud de secuencia.
En determinados aspectos, el uso es para el tratamiento de tirosinemia Tipo 2 utilizando un promotor del presente documento en combinación operativa con un ácido nucleico que codifica para tirosina aminotransferasa humana (Registro: P17735.1) o variantes con más de 50, 60, 70, 80, 90, 95 o 95 de identidad o similitud de secuencia.
En determinados aspectos, el uso es para el tratamiento de homocistinuria utilizando un promotor del presente documento en combinación operativa con un ácido nucleico que codifica para metilentetrahidrofolato reductasa humana (Registro: P42898.3) o variantes con más de 50, 60, 70, 80, 90, 95 o 95 de identidad o similitud de secuencia.
En determinados aspectos, el uso es para el tratamiento de hiperlipidemia e hipercolesterolemia utilizando un promotor del presente documento en combinación operativa con un ácido nucleico que codifica para acil-CoA deshidrogenasa de cadena media humana (Registro: P11310.1) o variantes con más de 50, 60, 70, 80, 90, 95 o 95 de identidad o similitud de secuencia.
En determinados aspectos, el uso es para el tratamiento de Galactosemia utilizando un promotor del presente documento en combinación operativa con un ácido nucleico que codifica para galactosa-1-fosfato uridiltransferasa humana (Registro: P07902.3) o variantes con más de 50, 60, 70, 80, 90, 95 o 95 de identidad o similitud de secuencia.
En determinados aspectos, el uso es para el tratamiento del síndrome de Lesch-Nyhan utilizando un promotor del presente documento en combinación operativa con un ácido nucleico que codifica para hipoxantina fosforribosiltransferasa humana (Registro: P00492.2) o variantes con más de 50, 60, 70, 80, 90, 95 o 95 de identidad o similitud de secuencia.
En determinados aspectos, el uso es para el tratamiento de la enfermedad de Gaucher utilizando un promotor del presente documento en combinación operativa con un ácido nucleico que codifica para cerebrosidasa humana (Registro: P07602.2, Registro: P04062.3) o variantes con más de 50, 60, 70, 80, 90, 95 o 95 de identidad o similitud de secuencia.
En determinados aspectos, el uso es para el tratamiento dela enfermedad de Tay-Sachs utilizando un promotor del presente documento en combinación operativa con un ácido nucleico que codifica para beta-hexosaminidasa humana (Registro: P06865.2) o variantes con más de 50, 60, 70, 80, 90, 95 o 95 de identidad o similitud de secuencia.
En determinados aspectos, el uso es para el tratamiento de la enfermedad de Fabry utilizando un promotor del presente documento en combinación operativa con un ácido nucleico que codifica para a-galactosidasa humana (Registro: P06280.1) o variantes con más de 50, 60, 70, 80, 90, 95 o 95 de identidad o similitud de secuencia.
En determinados aspectos, el uso es para el tratamiento del síndrome de Hunter utilizando un promotor del presente documento en combinación operativa con un ácido nucleico que codifica para iduronato sulfatasa humana (Registro: P22304.1) o variantes con más de 50, 60, 70, 80, 90, 95 o 95 de identidad o similitud de secuencia.
En determinados aspectos, el uso es para el tratamiento de la enfermedad por almacenamiento de glucógeno Ia utilizando un promotor en combinación operativa con un ácido nucleico que codifica para glucosa-6-fosfatasa humana (Registro: P35575.2) o variantes con más de 50, 60, 70, 80, 90, 95 o 95 de identidad o similitud de secuencia.
En determinados aspectos, el uso es para el tratamiento del metabolismo del amoniaco utilizando un promotor en combinación operativa con un ácido nucleico que codifica para ornitina transcarbamilasa humana (Registro: P00480.3) 0 variantes con más de 50, 60, 70, 80, 90, 95 o 95 de identidad o similitud de secuencia.
En determinados aspectos, el uso es para el tratamiento de fenilcetonuria utilizando un promotor en combinación operativa con un ácido nucleico que codifica para el receptor de lipoproteínas de baja densidad humano (Registro: P01130.1) o variantes con más de 50, 60, 70, 80, 90, 95 o 95 de identidad o similitud de secuencia.
En determinados aspectos, el uso es para el tratamiento de acidemia propiónica utilizando un promotor en combinación operativa con un ácido nucleico que codifica para propionil-coenzima A carboxilasa, ya sea PCCA y/o PCCB (Registro: P05166.3 beta, NP_000273.2 alfa, NP_001121164.1 alfa) o variantes con más de 50, 60, 70, 80, 90, 95 o 95 de identidad o similitud de secuencia.
También se contemplan usos en regímenes de vacuna, por ejemplo, para el suministro conjunto de una citocina o para el suministro de un inmunógeno o antígeno.
Las partículas víricas recombinantes, las cápsides o los vectores que comprenden los ácidos nucleicos divulgados en el presente documento pueden suministrarse al hígado a través de la arteria hepática, la vena porta o intravenosamente para producir niveles terapéuticos de proteínas terapéuticas o de factores de coagulación en la sangre. La cápside o vector se suspende preferentemente en un transportador fisiológicamente compatible, pudiendo administrarse a un paciente mamífero humano o no humano. Un experto en la materia puede seleccionar fácilmente transportadores s adecuados a la vista de la indicación para la cual se dirige el virus de transferencia. Por ejemplo, un transportador adecuado incluye una solución salina, que puede formularse con una variedad de soluciones tamponantes (por ejemplo, solución salina tamponada con fosfato). Otros transportadores ilustrativos incluyen solución salina estéril, lactosa, sacarosa, fosfato de calcio, gelatina, dextrano, agar, pectina, aceite de sésamo y agua.
Opcionalmente, las composiciones de la divulgación pueden contener otros excipientes farmacéuticamente aceptables, tales como conservantes, o estabilizantes químicos. Conservantes ejemplares adecuados incluyen clorobutanol, sorbato de potasio, ácido sórbico, dióxido de azufre, galato de propilo, los parabenos, etil vainillina, glicerina, fenol y paraclorofenol. Estabilizantes químicos adecuados incluyen gelatina y albúmina.
Las partículas, cápsides o vectores de virus recombinantes se administran en cantidades suficientes para transfectar las células y proporcionar niveles suficientes de transferencia y expresión génica para proporcionar un beneficio terapéutico sin efectos adversos indebidos, o con efectos fisiológicos médicamente aceptables, que se pueden determinar por los expertos en las materias médicas. Las vías de administración convencional y farmacéuticamente aceptables incluyen, aunque sin limitación, suministro directo a un órgano deseado (por ejemplo, el hígado (opcionalmente a través de la arteria hepática) o el pulmón), vía oral, inhalación, intranasal, intratraqueal, intraarterial, intraocular, intravenosa, intramuscular, subcutánea, intradérmica y otras vías de administración parenteral. Las vías de administración pueden combinarse, si se desea.
Las dosis de las partículas, cápsides o vectores de virus recombinantes dependerán principalmente de factores tales como la afección a tratar, la edad, el peso y la salud del paciente, y por lo tanto pueden variar entre los pacientes. Por ejemplo, una dosificación de un ser humano terapéuticamente eficaz del vector vírico está generalmente en el intervalo de aproximadamente 0,1 ml a aproximadamente 100 ml de solución que contiene concentraciones de aproximadamente 1x109 a 1x1016 genomas del vector del virus.
Otras proteínas terapéuticas útiles codificadas por los ácidos nucleicos (p. ej., operativamente en combinación con promotores) indicadas en el presente documento incluyen hormonas y factores de crecimiento y diferenciación que incluyen, sin limitación, insulina, glucagón, hormona del crecimiento (GH), hormona paratiroidea (PTH), factor liberador de la hormona del crecimiento (GRF), hormona foliculoestimulante (FSH), hormona luteinizante (LH), gonadotropina coriónica humana (hCG), factor de crecimiento endotelial vascular (VEGF), angiopoyetinas, angiostatina, factor estimulante de colonias de granulocitos (GCSF), eritropoyetina (EPO), factor de crecimiento del tejido conectivo (CTGF), factor de crecimiento fibroblástico básico (bFGF), factor de crecimiento fibroblástico ácido (aFGF), factor de crecimiento epidérmico (EGF), factor de crecimiento derivado de plaquetas (PDGF), factores de crecimiento insulínico 1 y II (IGF-I e IGF-II), cualquiera de la superfamilia alfa del factor de crecimiento transformante, incluyendo TGFalfa, activinas, inhibinas o cualquiera de las BMP 1-15 de las proteínas morfogenéticas óseas (BMP), cualquiera de la familia del factor de diferenciación de heregluina/neuregulina/ARIA/neu (NDF) de los factores de crecimiento, factor de crecimiento nervioso (NGF), factor neurotrófico derivado del cerebro (BDNF), neurotrofinas NT-3 y NT-4/5, factor neurotrófico ciliar (CNTF), factor neurotrófico derivado de la línea de células gliales (GDNF), neurturina, agrina, cualquiera de la familia de semaforinas/colapsinas, netrina-1 y netrina-2, factor de crecimiento de hepatocitos (HGF), efrinas, nogina, sonic hedgehog y tirosina hidroxilasa.
Otras proteínas terapéuticas codificadas por los ácidos nucleicos (p. ej., operativamente en combinación con promotores) indicadas en el presente documento incluyen aquellas que regulan el sistema inmunitario, incluyendo, sin limitación, citocinas y linfocinas tales como trombopoyetina (TPO), interleucinas (IL) IL-1 a IL-25 (incluidas IL-2, IL-4, IL-12 e IL-18), proteína quimioatrayente de monocitos, factor inhibidor de la leucemia, factor estimulante de colonias de granulocitos-macrófagos, ligando Fas, factores de necrosis tumoral alfa y beta, interferones alfa, beta y gamma, factor de células madre, ligando flk-2/flt3. Las proteínas producidas por el sistema inmunitario también son útiles. Estas incluyen, sin limitaciones, inmunoglobulinas IgG, IgM, IgA, IgD e IgE, inmunoglobulinas quiméricas, anticuerpos humanizados, anticuerpos monocatenarios, receptores de linfocitos T, receptores de linfocitos T quiméricos, receptores de linfocitos T de cadena sencilla, moléculas MHC de clase I y clase II, así como inmunoglobulinas y moléculas MHC modificadas por ingeniería. Las proteínas útiles también incluyen proteínas reguladoras del complemento tales como proteínas reguladoras del complemento, proteína cofactor de membrana (MCP), factor acelerador de la descomposición (DAF), CR1, CF2 y CD59.
Otras proteínas terapéuticas codificadas por los ácidos nucleicos (p. ej., operativamente en combinación con promotores) indicadas en el presente documento son receptores para las hormonas, factores de crecimiento, citocinas, linfocinas, proteínas reguladoras y proteínas del sistema inmunitario. La divulgación abarca los receptores para la regulación del colesterol y/o la modulación de los lípidos, incluidos el receptor de lipoproteínas de baja densidad (LDL), el receptor de lipoproteínas de alta densidad (HDL), el receptor de lipoproteínas de muy baja densidad (VLDL) y los receptores neutralizantes. La divulgación también abarca proteínas tales como miembros de la superfamilia de receptores de hormonas esteroideas, incluidos los receptores de glucocorticoides y los receptores de estrógenos, los receptores de vitamina D y otros receptores nucleares. Además, proteínas útiles incluyen factores de transcripción como jun, fos, max, mad, factor de respuesta sérica (SRF), AP-1, AP2, myb, MyoD y miogenina, proteínas que contienen caja ETS, TFE3, E2F, ATF1, ATF2, ATF3, ATF4, ZF5, NFAT, CREB, HNF-4, C/EBP, SP1, proteínas de unión a caja CCAAT, factor de regulación de interferón (IRF-1), proteína tumoral de Wilms, proteína de unión a ETS, STAT, proteínas de unión a caja GATA, por ejemplo, GATA-3 y la familia forkhead de proteínas de hélice alada.
Otras proteínas útiles incluyen, carbamoil sintetasa I, ornitina transcarbamilasa, arginosuccinato sintetasa, arginosuccinato liasa, arginasa, fumarilacetoacetato hidrolasa, fenilalanina hidroxilasa, alfa-1 antitripsina, glucosa- 6-fosfatasa, porfobilinógeno desaminasa, cistatión beta-sintasa, cetoácido descarboxilasa de cadena ramificada, albúmina, isovaleril-CoA deshidrogenasa, propionil CoA carboxilasa, metil malonil CoA mutasa, glutaril CoA deshidrogenasa, insulina, beta-glucosidasa, piruvato carboxilasa, fosforilasa hepática, fosforilasa cinasa, glicina descarboxilasa, proteína H, proteína T, una secuencia reguladora transmembrana de fibrosis quística (CFTR) y una secuencia de ADNc de distrofina. Aún otras proteínas útiles incluyen enzimas tales como las que pueden ser útiles en la terapia de reemplazo enzimático, que es útil en una variedad de afecciones que son el resultado de una actividad deficiente de la enzima. Por ejemplo, las enzimas que contienen manosa-6-fosfato pueden utilizarse en terapias para enfermedades por almacenamiento lisosómico (por ejemplo, un gen adecuado incluye el que codifica la betaglucuronidasa (GUSB)).
Otras proteínas útiles incluyen polipéptidos de origen no natural, tales como polipéptidos quiméricos o híbridos que tienen una secuencia de aminoácidos de origen no natural que contiene inserciones, deleciones o sustituciones de aminoácidos. Por ejemplo, las inmunoglobulinas modificadas por ingeniería de cadena sencilla podrían ser útiles en determinados pacientes inmunocomprometidos. Otros tipos de secuencias génicas de origen no natural incluyen moléculas antisentido y ácidos nucleicos catalíticos, tal como ribozimas, que podrían usarse para reducir la sobreexpresión de una diana.
La reducción y/o modulación de la expresión de una proteína es particularmente deseable para el tratamiento de afecciones hiperproliferativas caracterizadas por células en hiperproliferación, como son los cánceres y la psoriasis. Los polipéptidos diana incluyen aquellos polipéptidos que se producen exclusivamente o a niveles más altos en células hiperproliferativas en comparación con las células normales. Los antígenos diana incluyen polipéptidos codificados por oncogenes tales como myb, myc, fyn, y el gen de translocación bcr/abl, ras, src, P53, neu, trk y EGRF. Además de los productos oncogénicos como antígenos diana, los polipéptidos diana para tratamientos y regímenes protectores contra el cáncer incluyen regiones variables de anticuerpos producidos por linfomas de linfocitos B y regiones variables de receptores de linfocitos T de linfomas de linfocitos T que, en algunas realizaciones, también se usan como antígenos diana para una enfermedad autoinmunitaria. Se pueden usar otros polipéptidos asociados a tumores como polipéptidos diana tales como polipéptidos que se encuentran a niveles más altos en células tumorales que incluyen el polipéptido reconocido por el anticuerpo monoclonal 17-1A y los polipéptidos de unión a folato.
Otros polipéptidos y proteínas terapéuticos adecuados incluyen aquellos que pueden ser útiles para tratar individuos que padecen enfermedades y trastornos autoinmunitarios al conferir una respuesta inmunitaria protectora de base amplia contra dianas que están asociadas con la autoinmunidad, incluidos los receptores celulares y las células que producen anticuerpos "autodirigidos". Las enfermedades autoinmunitarias mediadas por linfocitos T incluyen artritis reumatoide (AR), esclerosis múltiple (EM), síndrome de Sjogren, sarcoidosis, diabetes mellitus dependiente de insulina (I DDM), tiroiditis autoinmunitaria, artritis reactiva, espondilitis anquilosante, esclerodermia, polimiositis, dermatomiositis, psoriasis, vasculitis, granulomatosis de Wegener, enfermedad de Crohn y colitis ulcerosa. Cada una de estas enfermedades se caracteriza por receptores de linfocitos T (TCR) que se unen a antígenos endógenos e inician la cascada inflamatoria asociada con las enfermedades autoinmunitarias.
Los vectores indicados en el presente documento pueden formularse de una manera que permita la expresión de una proteína transportada por los vectores para inducir una respuesta inmunitaria a un antígeno seleccionado. Por ejemplo, para promover una respuesta inmunitaria, el antígeno puede expresarse a partir de un promotor divulgado en el presente documento, el vector puede adyuvarse como se describe en el presente documento, y/o el vector puede introducirse en tejido degenerado.
Ejemplos de antígenos inmunogénicos adecuados incluyen los seleccionados de una variedad de familias víricas. Ejemplos de familias víricas deseables contra las cuales sería deseable una respuesta inmunitaria incluyen, la familia de los picornavirus, que incluye los géneros rinovirus, que son responsables de aproximadamente el 50 % de los casos del resfriado común; los géneros enterovirus, que incluyen los poliovirus, coxsackievirus, ecovirus y enterovirus humanos, tal como el virus de la hepatitis A; y los géneros apthovirus, que son responsables de las enfermedades de la fiebre aftosa, principalmente en animales no humanos. Dentro de la familia de los virus picornavirus, los antígenos diana incluyen VP1, VP2, VP3, VP4 y VPG. Otras familias víricas incluyen los astrovirus y la familia del calcivirus. La familia del calcivirus abarca el grupo de virus Norwalk, que son un importante agente causante de la gastroenteritis epidémica. Aún otra familia vírica deseable para su uso en el direccionamiento de antígenos para inducir respuestas inmunitarias en seres humanos y animales no humanos es la familia de togavirus, que incluye los géneros alfavirus, que incluyen virus Sindbis, virus RossRiver y Encefalitis Equina Venezolana, Oriental y Occidental, y rubivirus, incluyendo el virus de la rubéola. La familia flaviviridae incluye dengue, fiebre amarilla, encefalitis japonesa, encefalitis de St. Louis y virus de la encefalitis transmitida por garrapatas. Se pueden generar otros antígenos diana a partir de la hepatitis C o la familia de coronavirus, que incluye una serie de virus no humanos, tales como el virus de la bronquitis infecciosa (aves de corral), el virus gastroentérico transmisible porcino (cerdo), el virus de la encefalomielitis hemaglutinatina porcina (cerdo), virus de peritonitis infecciosa felino (gatos), coronavirus entérico felino (gato), coronavirus canino (perro) y coronavirus respiratorios humanos, que pueden causar el resfriado común y/o hepatitis no A, B o C, y que incluyen la supuesta causa de síndrome respiratorio agudo repentino (SRAS). Dentro de la familia de los coronavirus, los antígenos diana incluyen la glucoproteína E1 (también llamada proteína M o de matriz), E2 (también llamada proteína S o Spike), E3 (también llamada HE o hemaglutina-elterosa) (no presente en todos los coronavirus) o N (nucleocápside). Aún otros antígenos se pueden dirigir contra la familia de arterivirus y la familia de rabdovirus. La familia de los rabdovirus incluye los géneros vesiculovirus (p. ej., El Virus de la Estomatitis Vesicular) y los géneros lisisavirus (p. ej., rabia). Dentro de la familia de los rabdovirus, los antígenos adecuados pueden derivar de la proteína G o la proteína N. La familia filoviridae, que incluye virus de la fiebre hemorrágica los como el virus de Marburg y el Ébola, puede ser una fuente adecuada de antígenos. La familia de paramixovirus incluye el Virus paragripal Tipo 1, el Virus paragripal Tipo 3, el Virus paragripal Tipo 3 bovino, rubulavirus (virus de las paperas, el Virus paragripal Tipo 2, el Virus paragripal Tipo 4, el virus de la enfermedad de Newcastle (pollos), peste bovina, el morbillivirus, que incluye sarampión y moquillo canino y neumovirus, que incluye el virus sincitial respiratorio. El virus de la gripe se clasifica dentro de la familia de ortomixovirus y es una fuente adecuada de antígenos (por ejemplo, la proteína HA, la proteína N1). La familia de los bunyavirus incluye los géneros bunyavirus (encefalitis de California, La Crosse), flebovirus (fiebre del Valle del Rift), hantavirus puremala es el virus de la fiebre de hemahagina), nairovirus (enfermedad de las ovejas de Nairobi) y varios bungavirus no asignados. La familia arenavirus proporciona una fuente de antígenos contra LCM y contra el virus de la fiebre de Lassa. Otra fuente de antígenos es la familia bornavirus. La familia reovirus incluye los géneros reovirus, rotavirus (que causa gastroenteritis aguda en niños), orbinivirus, y cultivirus (virus de la garrapata de Colorado, Lebombo (seres humanos), encefalosis equina, lengua azul). La familia retrovirus incluye la subfamilia oncovirinal que abarca enfermedades humanas y veterinarias tales como el virus de la leucemia felina, HTLVI y HTLVII, lentivirus (que incluye el VIH, el virus de inmunodeficiencia de simios, el virus de inmunodeficiencia felina, el virus de anemia infecciosa equina, y espumavirinal). La familia papovavirus incluye la subfamilia de poliomavirus (virus BKU y JCU) y la subfamilia papilomavirus (asociados con cánceres o progresión maligna de papiloma). La familia adenovirus incluye los virus (EX, AD7, ARD, O.B.) que causan enfermedad respiratoria y/o enteritis. El papovirus felino de la familia de los parvovirus (enteritis felina), el panleucovirus felino, el parvovirus canino, y el parvovirus porcino. La familia herpesvirus incluye la subfamilia alfaherpesvirinae, la cual abarca los géneros simplexvirus (HSVI, HSVII), varicelovirus (pseudorabias, varicela zóster) y la subfamilia betaherpesvirinae, la cual incluye los géneros citomegalovirus (HCMV, muromegalovirus) y la subfamilia gammaherpesvirinae, la cual incluye los géneros linfocriptovirus, EBV (linfoma de Burkitts), herpesvirus 6A humanos, 6B y 7, herpesvirus asociados con sarcoma de Kaposi y cercopithecine herpesvirus (virus B), rinotraqueitis infecciosa, virus de la enfermedad de Marek y radinovirus. La familia de los poxvirus incluye la subfamilia cordopoxvirinae, que abarca los géneros ortopoxvirus (Variola major (Viruela) y Vaccinia (viruela bovina), parapoxvirus, avipoxvirus, capripoxvirus, leporipoxvirus, suipoxvirus y la subfamilia entomopoxvirinae. La familia de los hepadnavirus incluye el virus de la hepatitis B. Un virus no clasificado que puede ser una fuente adecuada de antígenos es el virus de la hepatitis delta, el virus de la hepatitis E y los priones. Otro virus que es una fuente de antígenos es el virus Nipan. Aún otras fuentes víricas pueden incluir el virus de la enfermedad infecciosa de la bolsa aviar y el virus del síndrome respiratorio y reproductivo porcino. La familia de alfavirus incluye el virus de la arteritis equina y varios virus de encefalitis.
La presente divulgación también puede abarcar inmunógenos basados en proteínas que son útiles para inmunizar un animal humano o no humano contra otros patógenos, incluyendo bacterias, hongos, microorganismos parásitos o parásitos multicelulares que infectan vertebrados humanos y no humanos, o de una célula cancerosa o célula tumoral. Los ejemplos de patógenos bacterianos incluyen cocos grampositivos patógenos incluyendo neumococos; estafilococos (y las toxinas producidas por ellos, p.ej., enterotoxina B); y estreptococos. Los cocos patógenos gramnegativos incluyen meningococo; gonococo. Los bacilos gramnegativos entéricos patógenos incluyen enterobacterias; pseudomonas, acinetobacterias y eikenella; melioidosis; salmonella; shigella; haemophilus; moraxella; H. ducreyi (que causa chancroide); especies de brucella (brucelosis); Francisella tularensis (que causa tularemia); Yersinia pestis (peste) y otras Yersinia (pasteurella); streptobacillus moniliformis y spirillum; Los bacilos grampositivos incluyen listeria monocytogenes; erysipelothrix rhusiopathiae; Corynebacterium diphtheriae (difteria); cólera; B. anthracis (ántrax); donovanosis (granuloma inguinal); y bartonelosis. Las enfermedades causadas por bacterias anaerobias patógenas incluyen el tétanos; botulismo (Clostridium botulinum y su toxina); Clostridium perfringens y su toxina épsilon; otros clostridios; tuberculosis; lepra; y otras micobacterias. Las enfermedades por espiroquetas patógenas incluyen sífilis; treponematosis: pian, sífilis endémica y pinta; y leptospirosis. Otras infecciones causadas por bacterias patógenas superiores y hongos patógenos incluyen muermo (Burkholderia mallei); actinomicosis; nocardiosis; criptococosis, blastomicosis, histoplasmosis y coccidioidomicosis; candidiasis, aspergilosis y mucormicosis; esporotricosis; paracoccidiodomicosis, petrielidiosis, torulopsosis, micetoma y cromomicosis; y dermatofitosis. Las infecciones por rickettsia incluyen fiebre tifoidea, fiebre maculosa de las Montañas Rocosas, Fiebre Q (Coxiella burnetti) y viruela rickettsiósica. Ejemplos de micoplasma e infecciones por clamidias incluyen: mycoplasma pneumoniae; linfogranuloma venéreo; psitacosis; e infecciones perinatales por clamidias. Los eucariotas patógenos abarcan protozoos y helmintos patógenos, y las infecciones producidas incluyen: amebiasis; malaria; leishmaniosis; tripanosomiasis; toxoplasmosis; Pneumocystis carinii; Trichans; Toxoplasma gondii; babesiosis; giardiasis; triquinosis; filariasis; esquistosomiasis; nematodos; trematodos o duelas; e infecciones por cestodos (tenia).
Muchos de estos organismos y/o las toxinas producidas por los mismos han sido identificados por los Centros para el Control de Enfermedades [(CDC), Departamento de Salud y Servicios Humanos, EE. UU.], como agentes que pueden usarse en ataques biológicos. Por ejemplo, algunos de estos agentes biológicos, incluyen, Bacillus anthracia (ántrax), Clostridium botulinum y su toxina (botulismo), Yersinia pestis (peste), variola mayor (viruela), Francisella tularensis (tularemia) y fiebres hemorrágicas víricas [filovirus (p. ej., Ébola, Marburg] y arenavirus [por ejemplo, Lassa, Machupo]), todos los cuales están actualmente clasificados como agentes de Categoría A; Coxiella burnetti (fiebre Q); especies de Brucella (brucelosis), Burkholderia mallei (muermo), Burkholderia pseudomallei (meloidosis), Ricinus communis y su toxina (toxina ricina), Clostridium perfringens y su toxina (toxina épsilon), Especies de estafilococos y sus toxinas (enterotoxina B), Chlamydia psittaci (psitacosis), amenazas a la seguridad del agua (p. ej., Vibrio cholerae, Crytosporidium parvum), fiebre tifoidea (Richettsia powazekii) y encefalitis vírica (alfavirus, por ejemplo, encefalitis equina Venezolana; encefalitis equina del este; encefalitis equina del oeste); todos los cuales están actualmente clasificados como agentes de Categoría B; y virus Nipan y hantavirus, que actualmente están clasificados como agentes de Categoría C. Además, otros organismos, que se clasifican así o de manera diferente, pueden identificarse y/o usarse para tal fin en el futuro. Se entenderá fácilmente que los vectores víricos y otras construcciones descritas en el presente documento son útiles para suministrar antígenos de estos organismos, virus, sus toxinas u otros subproductos, que evitarán y/o tratarán infecciones u otras reacciones adversas con estos agentes biológicos.
En determinados aspectos, una proteína para la expresión en un vector de la divulgación es un segmento de una región variable de linfocitos T que desencadena una respuesta inmunitaria, es decir, para eliminar los linfocitos T citotóxicos. En artritis reumatoide (AR), se han caracterizado varias regiones variables específicas de TCR que están implicadas en la enfermedad. Estos TCR incluyen V-3, V-14, V-17 y V-17. Por lo tanto, el suministro de una secuencia del ácido nucleico que codifica al menos uno de estos polipéptidos desencadenará una respuesta inmunitaria que se dirigirá a los linfocitos T implicados en la AR. En esclerosis múltiple (EM), se han caracterizado varias regiones variables específicas de TCR que están implicadas en la enfermedad. Estos TCR incluyen V-7 y V-10. Por lo tanto, el suministro de una secuencia del ácido nucleico que codifica al menos uno de estos polipéptidos desencadenará una respuesta inmunitaria que se dirigirá a los linfocitos T implicados en la EM. En escleroderma, se han caracterizado varias regiones variables específicas de TCR que están implicadas en la enfermedad. Estos TCR incluyen V-6, V-8, V-14 y V-16, V-3C, V-7, V-14, V-15, V-16, V-28 y V-12. Por lo tanto, el suministro de una molécula de ácido nucleico que codifica al menos uno de estos polipéptidos desencadenará una respuesta inmunitaria que se dirigirá a los linfocitos T implicados en escleroderma.
Los vectores víricos recombinantes de la divulgación proporcionan un vehículo de transferencia génica eficaz que puede suministrar proteínas seleccionadas a una célula hospedadora seleccionada in vivo o ex vivo incluso cuando el organismo tiene anticuerpos neutralizantes de la proteína. En un aspecto, los vectores descritos en el presente documento y las células se mezclan ex vivo; las células infectadas se cultivan usando metodologías convencionales; y las células transducidas se vuelven a infundir en el paciente.
Realizaciones adicionales
En determinadas realizaciones, la invención se refiere a vectores víricos recombinantes que comprenden una secuencia del ácido nucleico de un promotor específico de hígado de la invención en combinación operativa con una secuencia del ácido nucleico heterólogo que codifica una proteína. Generalmente, la secuencia del ácido nucleico que codifica la proteína comprende un mayor porcentaje de codones de aminoácidos específicos de células hepáticas en comparación con el uso general de codones humanos. En determinados aspectos, la divulgación se refiere a métodos para tratar a un sujeto diagnosticado con un rasgo genético que da como resultado la expresión de una proteína no funcional mutada o truncada mediante la administración de una cantidad eficaz de un vector divulgado en el presente documento configurado para expresar una proteína funcional del hígado.
En determinadas realizaciones, el vector comprende una secuencia de un ácido nucleico vírico de más de 10, 20, 30, 40, 50, 100 o 200 nucleótidos. En determinadas realizaciones, la secuencia de un ácido nucleico vírico es un segmento del virus adenoasociado humano (hAAV) de los serotipos 1, 2, 3B, 4, 5, 6, 7, 8, 9 o combinaciones o variantes de los mismos, que generalmente comprende una repetición terminal invertida de AAV.
En determinados aspectos, la divulgación se refiere a una partícula vírica, por ejemplo, cápside que comprende un vector divulgado en el presente documento, por ejemplo, el vector empaquetado en una cápside. La cápside puede ser una cápside o partícula recombinante o quimérica, por ejemplo, una cápside que tiene secuencias de aminoácidos que son una combinación de pseudotipos de AAV para VP 1, 2 o 3. Un VP de cápside de AAV puede derivar de un gen humano o gen de AAV animal, o combinaciones con alteraciones genéticamente modificadas, es decir, AAV aislado de células humanas o un primate no humano infectados. Los AAV de animales incluyen los derivados de aves, bovino, porcino, ratones, etc. En determinados aspectos, la cápside puede tener secuencias de aminoácidos que son genéticamente modificados o cápsides sintéticas identificadas mediante métodos como la evolución dirigida o el diseño racional.
En determinadas realizaciones, los vectores divulgados en el presente documento son un ácido nucleico monocatenario o bicatenario o un ácido nucleico autocomplementario de menos de 5,1, 5,0, 4,9, 4,8, 4,7, 4,6 o 4,5 kb de nucleótidos en total. En determinadas realizaciones, el vector es incompetente para la replicación dentro de un hospedador humano, por ejemplo, el vector no codifica una polimerasa vírica.
En determinados aspectos, la secuencia promotora específica de hígado comprende una secuencia que tiene al menos un 50, 60, 70, 80, 85, 90, 95, 96, 97, 98, 99 o 100 % de identidad de secuencia con GTTAATTTTTGTGGCCCTTGCGATGTTTGCTCTGGTTA (SEQ ID NO: 21) ATAATCTCAGGACAAACA (SEQ ID NO: 43) y/o TATAAAAGGCCAGCAGCAGCCTGACCACATCT- CATCCTC (SEQ ID NO: 20).
En determinados aspectos, la SEQ ID NO: 20 es 3' o posterior a la SEQ ID NO: 21 entre un enlazador nucleotídico, por ejemplo, conectado con un enlazador como se ilustra: 5'- SEQ ID NO: 21 seguida de un enlazador seguido de SEQ ID NO: 20-3'. El enlazador puede ser de entre 0 a 200 nucleótidos, de 10 a 100 nucleótidos, de 20 a 70 nucleótidos, de 30 a 60 nucleótidos, de 30 a 40 nucleótidos, de 32 a 36 nucleótidos. En determinados aspectos, la secuencia promotora específica de hígado comprende una secuencia que tiene al menos un 50, 60, 70, 80, 85, 90, 95, 96, 97, 98, 99, o 100 % de identidad de secuencia con la SEQ ID n O: 4, 5, 6, o 7.
Como se usan en el presente documento, el promotor específico de hígado se refiere a las secuencias en la dirección 5' del sitio de inicio de la transcripción de la proteína a producir. Las secuencias promotoras divulgadas en el presente documento pueden contener combinaciones de otros promotores, potenciadores, otras secuencias y fragmentos de los mismos conocidos. Por ejemplo, la SEQ ID NO: 21 es la secuencia del potenciador ABP acortado. Por sí solo no funciona como un promotor, sirve para potenciar la expresión conferida por el promotor central, SEQ ID NO: 20, SynO, que por sí solo no confiere una expresión génica eficaz. Se contemplan secuencias potenciadoras adicionales que pueden reemplazar o aumentar el potenciador short ABP.
En determinados aspectos, la secuencia promotora específica de hígado comprende una secuencia que tiene al menos un 50, 60, 70, 80, 85, 90, 95, 96, 97, 98, 99 o 100 % de identidad de secuencia con CGGAGGAGCAAACAGGG (SEQ ID NO: 97) y/o TATAAAAG- GCCAGCAGCAGCCTGACCACATCTCATCCTC (SEQ ID NO: 20).
En determinados aspectos, la SEQ ID NO: 20 es 3' o posterior a la SEQ ID NO: 97 entre un enlazador nucleotídico, por ejemplo, conectado con un enlazador como se ilustra: 5'- SEQ ID NO: 97 seguida de un enlazador seguido de SEQ ID NO: 20-3'. El enlazador puede ser de entre 0 a 200 nucleótidos, de 10 a 100 nucleótidos, de 20 a 70 nucleótidos, de 30 a 60 nucleótidos, de 30 a 40 nucleótidos, de 32 a 36 nucleótidos.
En determinados aspectos, la secuencia promotora específica de hígado comprende una secuencia que tiene al menos un 50, 60, 70, 80, 85, 90, 95, 96, 97, 98, 99 o 100 % de identidad de secuencia con CGGAGGAGCAAACAGGGGCTAAGTCCAC (SEQ ID NO: 98) y/o TATAAAAGGCCAGCAGCAGCCTGACCACATCTCATCCTC (SEQ ID NO: 20).
En determinados aspectos, la SEQ ID NO: 20 es 3' o posterior a la SEQ ID NO: 98 entre un enlazador nucleotídico, por ejemplo, conectado con un enlazador como se ilustra: 5'- SEQ ID NO: 98 seguida de un enlazador seguido de SEQ ID NO: 20-3'. El enlazador puede ser de entre 0 a 200 nucleótidos, de 10 a 100 nucleótidos, de 20 a 70 nucleótidos, de 30 a 60 nucleótidos, de 30 a 40 nucleótidos, de 32 a 36 nucleótidos.
En determinados aspectos, la secuencia promotora específica de hígado comprende una secuencia que tiene al menos un 50, 60, 70, 80, 85, 90, 95, 96, 97, 98, 99 o 100 % de identidad de secuencia con GGCTGCTGGTGAATATTAACCAAGGTC (SEQ ID NO: 99) y/o TATAAAAGGCCAGCAGCAGCCTGACCACATCTCATCCTC (SEQ ID NO: 20).
En determinados aspectos, la SEQ ID NO: 20 es 3' o posterior a la SEQ ID NO: 99 entre un enlazador nucleotídico, por ejemplo, conectado con un enlazador como se ilustra: 5'- SEQ ID NO: 99 seguida de un enlazador seguido de SEQ ID NO: 20-3'. El enlazador puede ser de entre 0 a 200 nucleótidos, de 10 a 100 nucleótidos, de 20 a 70 nucleótidos, de 30 a 60 nucleótidos, de 30 a 40 nucleótidos, de 32 a 36 nucleótidos.
En determinados aspectos, la secuencia promotora específica de hígado comprende una secuencia que tiene al menos un 50, 60, 70, 80, 85, 90, 95, 96, 97, 98, 99 o 100 % de identidad de secuencia con GGGGAGGCTGCTGGTGAATATTAACCAAGGTCACCCCAGT- TATCGGAGGAGCAAACAGGGG CTAAGTCCAC (SEQ ID NO: 100) y/o TATAAAAGGCCAGCAGCAGCCTGAC- CACATCTCATCCTC (SEQ ID NO: 20).
En determinados aspectos, la SEQ ID NO: 20 es 3' o posterior a la SEQ ID NO: 100 entre un enlazador nucleotídico, por ejemplo, conectado con un enlazador como se ilustra: 5'- SEQ ID NO: 100 seguida de un enlazador seguido de SEQ ID NO: 20-3'. El enlazador puede ser de entre 0 a 200 nucleótidos, de 10 a 100 nucleótidos, de 20 a 70 nucleótidos, de 30 a 60 nucleótidos, de 30 a 40 nucleótidos, de 32 a 36 nucleótidos.
En determinados aspectos, la secuencia promotora específica de hígado comprende una secuencia que tiene al menos un 50, 60, 70, 80, 85, 90, 95, 96, 97, 98, 99 o 100 % de identidad de secuencia con GGGGAGGCTGCTGGTGAATATTAACCAAGGTCACCCCAGT- TATCGGAGGAGCAAACAGGGA CTAAGTCCAC (SEQ ID NO: 101) y/o TATAAAAGGCCAGCAGCAGCCTGAC- CACATCTCATCCTC (SEQ ID NO: 20).
En determinados aspectos, la SEQ ID NO: 20 es 3' o posterior a la SEQ ID NO: 101 entre un enlazador nucleotídico, por ejemplo, conectado con un enlazador como se ilustra: 5'- SEQ ID NO: 101 seguida de un enlazador seguido de SEQ ID NO: 20-3'. El enlazador puede ser de entre 0 a 200 nucleótidos, de 10 a 100 nucleótidos, de 20 a 70 nucleótidos, de 30 a 60 nucleótidos, de 30 a 40 nucleótidos, de 32 a 36 nucleótidos.
En determinados aspectos, la secuencia promotora específica de hígado comprende una secuencia que tiene al menos un 50, 60, 70, 80, 85, 90, 95, 96, 97, 98, 99, o 100 % de identidad de secuencia con la SEQ ID n O: 4, 5, 6, 7, 102, 103, 104, 105, 106, 107 o 108.
En determinados aspectos, la secuencia del ácido nucleico del promotor específico de hígado es inferior a 205 o 250 nucleótidos. Las expresiones "menos de 205 o 250 nucleótidos" se refieren a la longitud de una cadena sencilla o la longitud de pares de bases de cadena doble. El promotor funcional es bicatenario después de la conversión intracelular posterior a una infección vírica. No funcionaría si fuera monocatenario.
En determinados aspectos, la divulgación contempla que el primer nucleótido de la secuencia promotora es la 5' "G" en el sitio de unión al TF HFNla, GTTAAT (SEQ iD NO: 25), por ejemplo, el promotor es 5' - SEQ ID NO: 21, seguido de un enlazador y seguido adicionalmente por un sitio de inicio de la transcripción (TSS), por ejemplo TCATCCTC (SEQ ID NO: 109), en donde el último nucleótido en el sitio de inicio de la transcripción es el final de la secuencia promotora. En determinados aspectos, el enlazador comprende una caja TATAA (SEQ ID NO: 26) y un espaciador rico en GC. En determinadas realizaciones, la divulgación contempla que el primer nucleótido de la secuencia promotora es una 5' "G" en GTTAA (SEQ ID NO: 27), GTTA (SEQ ID NO: 28), GTT (SEQ ID NO: 29). En determinados aspectos, el primer nucleótido de la secuencia promotora es una 5' "T" en TTAAT (SEQ ID NO: 30), TTAA (SEQ ID NO: 31), TTA (SEQ ID NO: 32). En determinados aspectos, el primer nucleótido de la secuencia promotora es una 5' "A" en AAT (SEQ ID NO: 33).
En determinados aspectos, la divulgación contempla un promotor que comprende 5'-SEQ ID NO: 21 o 97 o 98 o 99 o 100 o 101 opcionalmente seguido de un enlazador, seguido de una caja TATAA, seguido de un espaciador rico en GC seguido de un sitio de inicio de la transcripción. En determinados aspectos, el espaciador rico en GC es una secuencia en donde más del 60, 70, 80 o 90 % de los nucleótidos son G o C, por ejemplo, en una ventana de 5 a 35 nucleótidos, de 10 a 30 nucleótidos, o de 15 a 40 nucleótidos, o de 5 a 50 o 60 nucleótidos. En determinados aspectos, el espaciador rico en GC es GGCCAGCAGCAGCCTGACCACATC (SEQ ID NO: 110). En determinadas realizaciones, la secuencia promotora específica de hígado comprende una secuencia que tiene al menos un 50, 60, 70, 80, 85, 90, 95, 96, 97, 98, 99, o 100 % de identidad de secuencia con la SEQ ID n O: 110.
En determinados aspectos, la secuencia promotora específica de hígado comprende una secuencia que tiene al menos un 50, 60, 70, 80, 85, 90, 95, 96, 97, 98, 99, o 100 % de identidad de secuencia con una de:
la SEQ ID NO: 34: GTTAATTTTTGTGGCCCTTGCGATGTTTGCTCTGGTTAATAATCT CAGGACAAACA;
la SEQ ID NO: 35: TTAATTTTTGTGGCCCTTGCGATGTTTGCT CTGGTTAATAATCTCAGGACAAACA;
la SEQ ID NO: 36: TAATTTTTGTGGCCCTTGCGATGTTTGCTCTGGTTAATAATCTCAGGACAAACA;
la SEQ ID NO: 37: AATTTTTGTGGCCCTTGCGATGTTTGCTCTGGTTAATAATCTCAGGACAAACA;
la SEQ ID NO 38 ATTTTTGTGGCCCTTGCGATGTTTGCT CTGGTTAAT AATCTCAGGACAAACA;
la SEQ ID NO: 39 TTTTTGTGGCCCTTGCGATGTTTGCT CTGGTTAAT AATCTCAGGACAAACA;
la SEQ ID NO: 40 TTTTGTGGCCCTTGCGATGTTTGCTCTGGTTAATAATCTCAGGACAAACA;
la SEQ ID NO: 41 TTTGTGGCCCTTGCGATGTTTGCTCTGGTTAAT AATCTCAGGACAAACA;
la SEQ ID NO: 42 TTGTGGCCCTTGCGAT GTTT GCTCT GGTTAAT AAT CTCAGGACAAACA;
la SEQ ID NO: 44 TGTGGCCCTTGCGATGTTTGCTCTGGTTAATAATCTCAGGACAAACA;
la SEQ ID NO: 45 GTGGCCCTTGCGATGTTTGCTCTGGTTAATAATCTCAGGACAAACA;
la SEQ ID NO: 46 TGGCCCTTGCGATGTTTGCTCTGGTTAATAATCTCAGGACAAACA;
la SEQ ID NO 47 GCCCTTGCGATGTTTGCTCTGGTTAATAATCTCAGGACAAACA;
la SEQ ID NO: 48 CCCTTGCGATGTTTGCTCTGGTTAATAATCTCAGGACAAACA;
la SEQ ID NO: 49 CCTTGCGATGTTTGCTCTGGTTAATAATCTCAGGACAAACA;
la SEQ ID NO 50 CTTGCGATGTTTGCTCTGGTTAATAATCTCAGGACAAACA;
la SEQ ID NO 51 GTTAATTTTTGTGGCCCTTGCGATGTTTGCTCTGGTTAATAATCTCAGGACAAAC la SEQ ID NO 52 GTTAATTTTTGTGGCCCTTGCGATGTTTGCTCTGGTTAATAATCTCAGGACAAA;
la SEQ ID NO 53 GTTAATTTTTGTGGCCCTTGCGATGTTTGCTCTGGTTAATAATCTCAGGACAA;
la SEQ ID NO 54 GTTAATTTTTGTGGCCCTTGCGATGTTTGCTCTGGTTAATAATCTCAGGACAA;
la SEQ ID NO 55 GTTAATTTTTGTGGCCCTTGCGATGTTTGCTCTGGTTAATAATCTCAGGACA;
la SEQ ID NO 56 GTTAATTTTTGTGGCCCTTGCGATGTTTGCTCTGGTTAATAATCTCAGGAC;
la SEQ ID NO 57 GTTAATTTTTGTGGCCCTTGCGATGTTTGCTCTGGTTAATAATCTCAGGA;
la SEQ ID NO 58 GTTAATTTTTGTGGCCCTTGCGATGTTTGCTCTGGTTAATAATCTCAGG;
la SEQ ID NO 59 GTTAATTTTTGTGGCCCTTGCGATGTTTGCTCTGGTTAATAATCTCAG;
la SEQ ID NO: 60 GTTAATTTTTGTGGCCCTTGCGATGTTTGCTCTGGTTAATAATCTCA;
la SEQ ID NO: 61 GTTAATTTTTGTGGCCCTTGCGATGTTTGCTCTGGTTAATAATCTC;
la SEQ ID NO: 62 GTTAATTTTTGTGGCCCTTGCGATGTTTGCTCTGGTTAATAATCT;
la SEQ ID NO: 63 GTTAATTTTTGTGGCCCTTGCGATGTTTGCTCTGGTTAATAATC;
la SEQ ID NO: 64 GTTAATTTTTGTGGCCCTTGCGATGTTTGCTCTGGTTAATAAT;
la SEQ ID NO: 65 GTTAATTTTTGTGGCCCTTGCGATGTTTGCTCTGGTTAATAA;
la SEQ ID NO: 66 GTTAATTTTTGTGGCCCTTGCGATGTTTGCTCTGGTTAATAATCTCAGGACAAAC la SEQ ID NO: 67 TTAATTTTTGTGGCCCTTGCGATGTTTGCTCTGGTTAATAATCTCAGGACAAA;
la SEQ ID NO: 68 TAATTTTTGTGGCCCTTGCGATGTTTGCTCTGGTTAATAATCTCAGGACAA;
la SEQ ID NO: 69 AATTTTTGTGGCCCTTGCGATGTTTGCTCTGGTTAATAATCTCAGGACA;
la SEQ ID NO: 70 ATTTTTGTGGCCCTTGCGATGTTTGCTCTGGTTAATAATCTCAGGAC;
la SEQ ID NO: 71 TTTTTGTGGCCCTTGCGATGTTTGCTCTGGTTAATAATCTCAGGA;
la SEQ ID NO: 72 TTTTGTGGCCCTTGCGATGTTTGCTCTGGTTAATAATCTCAGG;
la SEQ ID NO 73 TTTGTGGCCCTTGCGATGTTTGCTCTGGTTAATAATCTCAG;
la SEQ ID NO 74 TTGTGGCCCTTGCGATGTTTGCTCTGGTTAATAATCTCA;
la SEQ ID NO: 75 TGTGGCCCTTGCGATGTTTGCTCTGGTTAATAATCTC;
la SEQ ID NO: 76 GTGGCCCTTGCGATGTTTGCTCTGGTTAATAATCT;
la SEQ ID NO: 77 TGGCCCTTGCGATGTTTGCTCTGGTTAATAATC;
la SEQ ID NO: 78 GCCCTTGCGATGTTTGCTCTGGTTAATAAT;
la SEQ ID NO: 79 CCCTTGCGATGTTTGCTCTGGTTAATAA;
la SEQ ID NO: 80 CCTTGCGATGTTTGCTCTGGTTAAT A;
la SEQ ID NO: 81 CTTGCGATGTTT GCTCTGGTTAAT;
la SEQ ID NO: 82 TTAATTTTTGTGGCCCTTGCGATGTTTGCTCTGGTTAATAATCTCAGGACAAAC;
la SEQ ID NO: 83 TAATTTTTGTGGCCCTTGCGATGTTTGCTCTGGTTAATAATCTCAGGACAAA;
la SEQ ID NO: 84 AATTTTTGTGGCCCTTGCGATGTTTGCTCTGGTTAATAATCTCAGGACAA;
la SEQ ID NO: 85 ATTTTTGTGGCCCTTGCGATGTTTGCTCTGGTTAATAATCTCAGGACAA;
la SEQ ID NO: 86 TTTTTGTGGCCCTTGCGATGTTTGCTCTGGTTAATAATCTCAGGACA;
la SEQ ID NO: 87 TTTTGTGGCCCTTGCGATGTTTGCTCTGGTTAATAATCTCAGGAC;
la SEQ ID NO: 88 TTTGTGGCCCTTGCGATGTTTGCTCTGGTTAATAATCTCAGGA;
la SEQ ID NO 89 TTGTGGCCCTTGCGATGTTTGCTCTGGTTAATAATCTCAGG;
la SEQ ID NO: 90 TGTGGCCCTTGCGATGTTTGCTCTGGTTAATAATCTCAG;
la SEQ ID NO: 91 TGGCCCTTGCGATGTTTGCTCTGGTTAATAATCTCA;
la SEQ ID NO: 92 GGCCCTTGCGATGTTTGCTCTGGTTAATAATCTC;
la SEQ ID NO: 93 GCCCTTGCGATGTTTGCTCTGGTTAATAATCT;
la SEQ ID NO: 94 CCCTTGCGATGTTTGCTCTGGTTAATAATC;
la SEQ ID NO: 95 CCTTGCGATGTTTGCTCTGGTTAATAAT; o
la SEQ ID NO 96 CTTGCGATGTTTGCTCTGGTTAATAA.
En determinados aspectos, el promotor puede comenzar con el primer nucleótido 5' de la SEQ ID NO: 34-96 y terminar con el último nucleótido del t Ss .
En determinadas realizaciones, la proteína es un fVIII o fIX o una variante de los mismos. En determinadas realizaciones, los esquemas de optimización de codones y promotores divulgados en el presente documento podrían usarse para cualquier terapia génica con AAV dirigida al hígado. Se contemplan otras enfermedades metabólicas causadas por deficiencias de enzimas hepáticas y la expresión de esas proteínas funcionales.
En determinadas realizaciones, la variante de fVIII comprende un dominio A1, un dominio A2, una secuencia RHQR (SEQ ID NO: 24), un dominio A3, un dominio C1 y un dominio C2. En determinadas realizaciones, la variante de fVIII comprende un domino B eliminado.
En determinadas realizaciones, la variante de fVIII comprende un enlazador de entre dos y cincuenta, o dos y veinticinco, o dos y quince aminoácidos entre el dominio A2 y el dominio A3.
En determinadas realizaciones, la variante de fVIII comprende un dominio A1, un dominio A2, un dominio de péptido de activación (ap, por sus siglas en inglés), un dominio A3, un dominio C1 y un dominio C2. En determinadas realizaciones, la variante de fVIII comprende un domino B eliminado.
En determinadas realizaciones, la variante de fVIII comprende un enlazador de entre dos y cincuenta, o dos y veinticinco, o dos y quince aminoácidos entre el dominio A2 y el un dominio de péptido de activación (ap).
En determinadas realizaciones, la variante de fVIII comprende una secuencia que tiene al menos un 50, 60, 70, 80, 85, 90, 95, 96, 97, 98, 99, o 100 % de identidad de secuencia con la SEQ ID NO: 3.
En determinadas realizaciones, a variante de fVIII comprende una secuencia que tiene al menos un 50, 60, 70, 80, 85, 90, 95, 96, 97, 98, 99, o 100 % de identidad de secuencia con la SEQ ID NO: 13, 14, 15 o 16.
En determinados aspectos, la divulgación se refiere a métodos en los que el uso de codones de un gen se ajusta de acuerdo con el tejido en que se expresará, por ejemplo, tejido hepático. En determinados aspectos, la secuencia del ácido nucleico que codifica una proteína comprende codones que se utilizan o representan de manera diferencial en genes altamente expresados dentro del hígado u otro tejido específico en comparación con el uso de codones de toda la región de codificación del genoma humano y evita los codones que están subrepresentados en el hígado o en otro tejido específico.
En determinadas realizaciones, la secuencia del ácido nucleico que codifica la proteína comprende codones para más del 50, 60, 70, 80, 90 o 95 % o 100 % de los aminoácidos que se prefieren como se proporciona en la Figura 2.
En determinadas realizaciones, la secuencia del ácido nucleico que codifica una proteína que comprende un mayor porcentaje de codones de aminoácidos específicos de células hepáticas en comparación con el uso general de codones humanos es una secuencia que tiene al menos un 50, 60, 70, 80, 85, 90, 95, 96, 97, 98, 99, o 100 % de identidad de secuencia con la SEQ ID NO: 1.
En determinadas realizaciones, la variante de fIX comprende una secuencia que tiene al menos un 50, 60, 70, 80, 85, 90, 95, 96, 97, 98, 99, o 100 % de identidad de secuencia con la SEQ ID NO: 17, 18 o 19.
En determinadas realizaciones, la secuencia del ácido nucleico que codifica una proteína que comprende un mayor porcentaje de codones de aminoácidos específicos de células hepáticas en comparación con el uso general de codones humanos es una secuencia que tiene al menos un 50, 60, 70, 80, 85, 90, 95, 96, 97, 98, 99, o 100 % de identidad de secuencia con la SEQ ID NO: 8, 9 o 10.
En determinadas realizaciones, la secuencia del ácido nucleico que codifica la proteína comprende al menos uno de a) a g) en donde,
a) un codón ATC es en más del 50 % o 52 % para Ile;
b) un codón ATC es en más del 38 % o 40 % para Thr;
c) un codón TTC es en más del 57 % o 59 % para Phe;
d) un codón GAG es en más del 60 % o 62 % para Glu;
e) un codón CTG es en más del 43 % o 45 % para Leu;
f) un codón AAG es en más del 60 % o 62 % para Lys; y/o
g) un codón GAC es en más del 56 % o 58 % para Asp.
En determinadas realizaciones, la secuencia del ácido nucleico que codifica la proteína comprende al menos dos o más, o tres o más, o cuatro o más, cinco o más, cinco o más, seis o más, o todos de a), b), c), d), e), f) y g).
En determinadas realizaciones, la secuencia del ácido nucleico que codifica la proteína comprende menos de 100, 50, 30, 25, 20, 15, 10, 9, 8, 7, 6, 5, 4, 3, 2 o ningún dinucleótido 5'-CG-3'.
La invención proporciona composiciones farmacéuticas que comprenden un vector de la invención y un excipiente farmacéuticamente aceptable.
La invención también proporciona un vector o composición de la invención para su uso en un método para inducir la coagulación de la sangre, comprendiendo dicho método administrar una cantidad eficaz del vector o composición a un sujeto que lo necesite.
En determinadas realizaciones, el sujeto es diagnosticado con hemofilia A o B o hemofilia adquirida o es poco probable que responda a infusiones exógenas de fVIII.
En determinadas realizaciones, el vector, la partícula vírica o cápside se administra en combinación con un agente inmunosupresor, por ejemplo, ciclosporina, tacrolimus, sirolimus, ciclofosfamida, metotrexato, azatioprina, mercaptopurina, fluorouracilo, ácido micofenólico, dactinomicina, fingolimod, anticuerpo o proteína de unión a receptores de linfocitos T, muromonab-CD3, anticuerpo o proteína de unión al receptor de IL-2, basiliximab, daclizumab, IFN-beta recombinante, anticuerpo o proteína de unión a TNF-alfa, infliximab, etanorcept, adalimumab o combinaciones de los mismos.
En determinados aspectos, la divulgación se refiere a sistemas de expresión que comprenden ácidos nucleicos o vectores que comprenden ácidos nucleicos divulgados en el presente documento.
Los siguientes ejemplos se proporcionan para ilustrar determinadas características particulares y/o realizaciones. Estos ejemplos no deben interpretarse como limitantes de la divulgación a las características particulares o realizaciones descritas.
Ejemplos
Ejemplo 1
Optimización de los factores de coagulación y su ADN codificante
Este ejemplo ilustra la optimización de las secuencias codificantes para las proteínas fVIII y fIX para mejorar su utilidad para la expresión in vivo y la terapia génica.
La secuencia de nucleótidos del ADNc que codifica para fVIII y fIX se optimizó inicialmente implementando una preferencia de uso de codones específicos para la célula hepática humana en comparación con la secuencia de nucleótidos de origen natural que codifica la secuencia correspondiente sin optimización de condones para un ser humano.
La adaptabilidad de una secuencia de nucleótidos que codifica fVIII al uso de codones de las células hepáticas humanas puede expresarse como índice de adaptación de codones hepáticos (LCAI por sus siglas en inglés). Un índice de adaptación de codones se define como una medida de la adaptabilidad relativa del uso de codones de un gen hacia el uso de codones de genes altamente expresados en el hígado humano. La adaptabilidad relativa de cada codón es la relación entre el uso de cada codón, y el del codón más abundante para el mismo aminoácido. El CAI se define como la media geométrica de estos valores de adaptabilidad relativa. Se excluyen los codones no sinónimos y los codones de terminación (dependientes del código genético). Los valores de CAI varían de 0 a 1, indicando los valores más altos una mayor proporción de los codones más abundantes. Usando las secuencias de 43 genes altamente expresados en el hígado humano, se construyó una tabla personalizada de preferencia de uso de codones específica para el hígado humano (véase la Figura 2A) que difiere sustancialmente de los codones más prevalentes usados en secuencias codificantes humanas totales (Figura. 2B). La secuencia codificante optimizada de las variantes de fVIII ET3 y HSQ se desarrolló con los codones estadísticamente más prevalentes identificados por el análisis de preferencia de uso en el hígado.
ET3 es un fVIII híbrido con el dominio B eliminado (BDD) que contiene dominios humanos y porcinos, es decir, secuencia (A1 y A3 porcino, véase la Figura 1A y 1B) con un enlazador en el dominio B eliminado. ET3 utiliza una secuencia enlazadora OL derivada de una secuencia porcina de 24 aminoácidos, es decir, la secuencia SFAQNSRPPSASAPKPPVLRRHQR (SEQ ID NO: 23) derivada de la porcina. La secuencia de aminoácidos de ET3 es la SEQ ID NO: 123:
MQLELSTCVFLCLLPLGFSAIRRYYLGAVELSWDYRQSELLRELHVDTRFPATAPGALPLGPSVLYKKTVFVEFTDQL
FSVARPRPPWMGLLGPTIQAEVYDTVWTLKNMASHPVSLHAVGVSFWKSSEGAEYEDHTSQREKEDDKVLPGKSQTY
VWQVLKENGPTASDPPCLTYSYLSHVDLVKDLNSGLIGALLVCREGSLTRERTQNLHEFVLLFAVFDEGKSWHSARND
SWTRAMDPAPARAQPAMHTVNGYVNRSLPGLIGCHKKSVYWHVIGMGTSPEVHSIFLEGHTFLVRHHRQASLEISPLT
FLTAQTFLMDLGQFLLFCHISSHHHGGMEAHVRVESCAEEPQLRRKADEEEDYDDNLYDSDMDWRLDGDDVSPFIQI
RSVAKKHPKTWVHYIAAEEEDWDYAPLVLAPDDRSYKSQYLNNGPQRIGRKYKKVRFMAYTDETFKTREAIQHESGIL
GPLLYGEVGDTLLIIFKNQASRPYNIYPHGITDVRPLYSRRLPKGVKHLKDFPILPGEIFKYKWTVTVEDGPTKSDPR
CLTRYYSSFVNMERDLASGLIGPLLICYKESVDQRGNQIMSDKRNVILFSVFDENRSWYLTENIQRFLPNPAGVQLED
PEFQASNIMHSINGYVFDSLQLSVCLHEVAYWYILSIGAQTDFLSVFFSGYTFKHKMVYEDTLTLFPFSGETVFMSME
NPGLWILGCHNSDFRNRGMTALLKVSSCDKNTGDYYEDSYEDISAYLLSKNNAIEPRSFAQNSRPPSASAPKPPVLRR
HQRDISLPTFQPEEDKMDYDDIFSTETKGEDFDIYGEDENQDPRSFQKRTRHYFIAAVEQLWDYGMSESPRALRNRAQ
NGEVPRFKKWFREFADGSFTQPSYRGELNKHLGLLGPYIRAEVEDNIMVTFKNQASRPYSFYSSLISYPDDQEQGAE
PRHNFVOPNETRTYFWKVOHHMAPTEDEFDCKAWAYFSDVDLEKDVHSGLIGPLLICRANTLNAAHGRQVTVQEFALF
FTIFDETKSWYFTENVERNCRAPCHLQMEDPTLKENYRFHAINGYVMDTLPGLVMAQNQRIRWYLLSMGSNEN1HS1H
FSGHVFSVRKKEEYKMAVYNLYPGVFETVEMLPSKVGIWRIECLIGEHLQAGMSTTFLVYSKKCQTPLGMASGHIRDF
QITASGQYGQWAPKLARLHYSGSINAWSTKEPFSWIKVDLLAPMI1HGIKTQGARQKFSSLYISQFIIMYSLDGKKWQ
TYRGNSTGTLMVFFGNVDSSGIKHNIFNPPIIARYIRLHPTHYSIRSTLRMELMGCDLNSCSMPLGMESKAISDAQIT
ASSYFTNMFATWSPSKARLHLQGRSNAWRPQVNNPKEWLQVDFQKTMKVTGVTTQGVKSLLTSMYVKEFLISSSQDGH
QWTLFFQNGKVKVFQGNQDSFTPWNSLDPPLLTRYLR1HPQSWVHQIALRMEVLGCEAQDLY
HSQ es una variante de fVIII humano en donde la proteína fVIII humana BDD se sustituye con un enlazador SQ, SFSQNPPVLKRHQR (SEQ ID NO: 22) derivado humano de 14 aminoácidos. La secuencia de aminoácidos de HSQ es la SEQ ID NO: 3:
MQIELSTCFFLCLLRFCFSATRRYYLGAVELSWDYMQSDLGELPVDARFPPRVPKSFPFNTSWYKKTLFVEFTVHLF NIAKPRPPWMGLLGPTIQAEVYDTWITLKNMASHPVSLHAVGVSYWKASEGAEYDDQTSQREKEDDKVFPGGSHTYV WQVLKENGPMASDPLCLTYSYLSHVDLVKDLNSGLIGALLVCREGSLAKEKTQTLHKFILLFAVFDEGKSWHSETKNS LMQDRDAASARAWPKMHTVNGYVNRSLPGLIGCHRKSVYWHVIGMGTTPEVHSIFLEGHTFLVRNHRQASLEISPITF LTAQTLLMDLGQFLLFCHISSHQHDGMEAYVKVDSCPEEPQLRMKNNEEAEDYDDDLTDSEMDWRFDDDNSPSFIQI RSVAKKHPKTWVHYIAAEEEDWDYAPLVLAPDDRSYKSQYLNNGPQRIGRKYKKVRFMAYTDETFKTREAIQHESGIL GPLLYGEVGDTLLIIFKNQASRPYNIYPHGITDVRPLYSRRLPKGVKHLKDFPILPGEIFKYKWTVTVEDGPTKSDPR CLTRYYSSFVNMERDLASGLIGPLLICYKESVDQRGNQIMSDKRNVILFSVFDENRSWYLTENIQRFLPNPAGVQLED PEFQASNIMHSINGYVFDSLQLSVCLHEVAYWYILSIGAQTDFLSVFFSGYTFKHKMVYEDTLTLFPFSGETVFMSME NPGLwILGCHNSDFRNRGMTALLKVSSCDKNTGD'Y'YEDSYEDISA'YLLSKNNAIEPRSFSQNPPVLKRHQREITRTTL QSDQEEIDYDDTISVEMKKEDFDIYDEDENQSPRSFQKKTRHYFIAAVERLWDYGMSSSPHVLRNRAQSGSVPQFKKV VFQEFTDGSFTQPLYRGELNEHLGLLGPYIRAEVEDNIMVTFRNQASRPYSFYSSLISYEEDQRQGAEPRKNFVKPNE TKTYFWKVQHHMAPTKDEFDCKAWAYFSDVDLEKDVHSGLIGPLLVCHTNTLNPAHGRQVTVQEFALFFTIFDETKSW YFTENMERNCRAPCNIQMEDPTFKENYRFHAINGYIMDTLPGLVMAQDQRIRWYLLSMGSNEN1HS1HFSGHVFTVRK KEEYKMALYNLYPGVFETVEMLPSKAGIWRVECLIGEHLHAGMSTLFLVYSNKCQTPLGMASGHIRDFQITASGQYGQ WAPKLARLHYSGSINAWSTKEPFSWIKVDLLAPMI1HGIKTQGARQKFSSLYISQFIIMYSLDGKKWQTYRGNSTGTL MVFFGNVDSSGIKHNIFNPPIIARYIRLHPTHYSIRSTLRMELMGCDLNSCSMPLGMESKAISDAQITASSYFTNMFA TWSPSKARLHLQGRSNAWRPQVNNPKEWLQVDFQKTMKVTGVTTQGVKSLLTSMYVKEFLISSSQDGHQWTLFFQNGK VKVFQGNQDSFTPWNSLDPPLLTRYLR1HPQSWVHQIALRMEVLGCEAQDLY
Tanto HSQ como ET3 contienen la secuencia de reconocimiento RHQR (SEQ ID NO: 24) para la secuencia de procesamiento PACE/furina para el dominio B.
La secuencia de ET3 con codones de hígado optimizados es (SEQ ID NO: 12)
ATGCAGCTGGAACTGTCTACCTGTGTGTTTCTGTGTCTGCTGCCTCTGGGGTTTTCTGCTATCCGCCGCTACTATCTG
GGAGCCGTGGAGCTGTCCTGGGACTACAGGCAGAGCGAGCTGCTGAGAGAACTGCACGTGGATACCAGATTCCCAGCT
ACCGCTCCAGGAGCTCTGCCTCTGGGCCCATCCGTGCTGTACAAGAAAACCGTCTTCGTGGAGTTTACCGACCAGCTG
TTCAGCGTGGCCAGGCCAAGACCACCTTGGATGGGACTGCTGGGACCAACCATCCAGGCTGAGGTGTACGATACCGTG
GTCGTGACCCTGAAAAACATGGCCTCCCATCCCGTGAGCCTGCACGCTGTCGGGGTGTCCTTCTGGAAGTCCAGCGAG
GGAGCCGAGTACGAAGACCATACCTCCCAGCGCGAGAAAGAAGACGATAAGGTGCTGCCTGGCAAAAGCCAGACCTAT
GTCTGGCAGGTGCTGAAGGAGAACGGACCAACCGCTAGCGACCCACCATGCCTGACCTACTCTTATCTGTCCCACGTC
GATCTGGTGAAGGACCTGAATTCCGGACTGATCGGAGCTCTGCTGGTGTGTAGAGAGGGAAGCCTGACCAGAGAAAGA
ACCCAGAACCTGCATGAGTTCGTCCTGCTGTTCGCCGTGTTTGACGAAGGGAAGAGCTGGCACTCTGCCCGCAATGAC
TCCTGGACCAGAGCTATGGATCCAGCTCCTGCTAGAGCTCAGCCTGCTATGCACACCGTCAACGGCTACGTGAATCGG
TCTCTGCCAGGACTGATCGGCTGCCATAAGAAAAGCGTCTATTGGCACGTGATCGGAATGGGCACCAGCCCCGAGGTG
CATTCTATCTTCCTGGAAGGCCACACCTTTCTGGTCAGGCACCATAGACAGGCCTCTCTGGAGATCTCCCCTCTGACC
TTCCTGACCGCTCAGACCTTTCTGATGGACCTGGGGCAGTTCCTGCTGTTTTGCCATATCTCTTCCCACCATCACGGA
GGAATGGAGGCTCACGTCAGGGTGGAATCCTGTGCTGAGGAACCACAGCTGAGAAGAAAGGCTGATGAGGAAGAGGAC
TACGACGATAACCTGTATGACAGCGATATGGACGTCGTGCGCCTGGACGGCGACGATGTCAGCCCTTTCATCCAGATC
CGGTCTGTGGCCAAGAAACATCCAAAGACCTGGGTCCACTACATCGCCGCTGAAGAGGAAGATTGGGACTATGCCCCC
CTGGTGCTGGCTCCTGACGATAGATCCTACAAAAGCCAGTATCTGAACAATGGGCCCCAGCGCATCGGACGGAAGTAC
AAGAAAGTGAGGTTCATGGCCTATACCGACGAGACCTTTAAGACCAGAGAGGCTATCCAGCACGAATCCGGGATCCTG
GGACCTCTGCTGTACGGCGAAGTGGGGGATACCCTGCTGATCATCTTCAAGAACCAGGCCTCCAGGCCATACAATATC
TATCCCCATGGCATCACCGACGTGAGACCACTGTACAGCAGGAGACTGCCCAAGGGGGTCAAACACCTGAAGGATTTC CCCATCCTGCCTGGAGAGATCTTTAAGTATAAATGGACCGTCACCGTGGAAGACGGGCCTACCAAGTCCGATCCACGC TGCCTGACCCGGTACTATAGCTCTTTCGTGAACATGGAGAGAGACCTGGCTAGCGGACTGATCGGACCCCTGCTGATC TGTTACAAAGAGAGCGTGGACCAGAGGGGCAACCAGATCATGTCTGATAAGAGAAATGTCATCCTGTTCTCCGTGTTT GACGAGAACCGCAGCTGGTACCTGACCGAGAACATCCAGCGGTTCCTGCCAAATCCAGCTGGAGTGCAGCTGGAGGAC CCAGAATTTCAGGCTTCCAACATCATGCATAGCATCAATGGCTACGTGTTCGATAGCCTGCAGCTGTCTGTCTGCCTG CACGAGGTGGCCTACTGGTATATCCTGTCCATCGGCGCTCAGACCGACTTCCTGTCCGTGTTCTTTAGCGGGTACACC TTTAAGCATAAAATGGTGTATGAGGATACCCTGACCCTGTTCCCCTTTTCTGGCGAGACCGTGTTCATGTCCATGGAA AACCCTGGCCTGTGGATCCTGGGGTGCCACAACAGCGACTTCAGGAATAGAGGAATGACCGCCCTGCTGAAAGTGTCC AGCTGTGATAAGAATACCGGCGATTACTATGAGGACTCTTACGAAGATATCTCCGCTTATCTGCTGAGCAAGAACAAT GCCATCGAGCCCAGGTCTTTCGCTCAGAACTCCAGACCTCCAAGCGCTTCTGCTCCTAAGCCACCTGTGCTGAGAAGA CATCAGAGGGACATCTCCCTGCCTACCTTCCAGCCAGAGGAAGATAAAATGGACTACGACGATATCTTCAGCACCGAG ACCAAGGGGGAAGATTTTGACATCTATGGAGAGGACGAAAACCAGGATCCAAGATCCTTCCAGAAGAGAACCAGACAC TACTTTATCGCCGCTGTGGAGCAGCTGTGGGACTATGGGATGTCCGAAAGCCCACGGGCCCTGAGGAACAGAGCTCAG AATGGAGAGGTGCCCCGCTTCAAGAAAGTCGTGTTCCGGGAGTTTGCCGACGGCAGCTTTACCCAGCCATCTTACAGG GGGGAGCTGAACAAGCATCTGGGGCTGCTGGGACCCTATATCAGAGCCGAGGTCGAAGATAACATCATGGTGACCTTC AAGAATCAGGCTTCTCGCCCCTACTCCTTTTATTCTTCCCTGATCTCCTACCCTGACGATCAGGAGCAGGGCGCCGAA CCTAGGCACAACTTCGTGCAGCCAAATGAGACCAGAACCTACTTTTGGAAGGTGCAGCATCACATGGCTCCCACCGAG GATGAATTCGACTGCAAAGCTTGGGCCTATTTTTCCGATGTCGACCTGGAGAAGGACGTGCATAGCGGCCTGATCGGG CCTCTGCTGATCTGTCGCGCCAACACCCTGAATGCTGCTCACGGAAGACAGGTCACCGTGCAGGAGTTCGCTCTGTTC TTTACCATCTTTGACGAAACCAAGAGCTGGTACTTCACCGAGAACGTGGAAAGGAATTGCAGAGCCCCCTGTCATCTG CAGATGGAGGACCCTACCCTGAAGGAAAACTACAGGTTCCACGCCATCAATGGATATGTCATGGATACCCTGCCCGGC CTGGTCATGGCTCAGAACCAGCGCATCCGGTGGTACCTGCTGTCTATGGGATCCAACGAGAATATCCATAGCATCCAC TTCTCTGGCCATGTCTTTTCCGTGAGGAAGAAAGAGGAATACAAAATGGCCGTGTACAATCTGTATCCTGGGGTCTTC GAGACCGTGGAAATGCTGCCAAGCAAAGTGGGAATCTGGAGAATCGAGTGCCTGATCGGCGAACACCTGCAGGCCGGG ATGAGCACCACCTTCCTGGTGTACTCTAAGAAATGTCAGACCCCACTGGGGATGGCCTCCGGACATATCCGCGACTTC CAGATCACCGCTAGCGGACAGTACGGACAGTGGGCTCCAAAGCTGGCTAGACTGCACTATTCTGGCTCCATCAACGCC TGGTCTACCAAAGAGCCATTCTCCTGGATCAAGGTGGACCTGCTGGCCCCCATGATCATCCACGGAATCAAAACCCAG GGCGCTAGGCAGAAGTTCAGCTCTCTGTACATCTCCCAGTTTATCATCATGTATAGCCTGGACGGGAAGAAATGGCAG ACCTACAGAGGCAATTCCACCGGGACCCTGATGGTCTTCTTTGGAAACGTGGATTCCAGCGGCATCAAGCACAACATC TTCAATCCACCCATCATCGCCCGCTACATCCGGCTGCATCCTACCCACTATAGCATCAGGTCTACCCTGAGAATGGAG CTGATGGGATGCGACCTGAACAGCTGTTCTATGCCACTGGGCATGGAGTCCAAGGCTATCAGCGATGCCCAGATCACC GCTTCTTCCTACTTCACCAATATGTTTGCTACCTGGTCCCCAAGCAAGGCTAGACTGCACCTGCAGGGAAGATCCAAC GCTTGGAGACCCCAGGTGAACAATCCTAAGGAGTGGCTGCAGGTCGACTTCCAGAAAACCATGAAGGTCACCGGGGTG ACCACCCAGGGAGTGAAATCTCTGCTGACCTCCATGTACGTCAAGGAGTTCCTGATCAGCTCTTCCCAGGACGGCCAC CAGTGGACCCTGTTCTTTCAGAACGGCAAGGTCAAAGTGTTCCAGGGGAATCAGGACTCTTTTACCCCCGTCGTGAAC TCCCTGGATCCTCCACTGCTGACCAGGTACCTGAGAATCCATCCTCAGAGCTGGGTGCACCAGATCGCTCTGAGAATG GAGGTCCTGGGATGCGAAGCT CAGGACCTGTATTGA
Además, los motivos de ADN CpG en la secuencia codificante con codones de hígado optimizados para ET3 y HSQ se eliminaron porque pueden conducir a la metilación y silenciamiento de genes. Véase Bird, DNA methylation and the frequency of CpG in animal DNA, 1980, Nucleic Acids Res, 8: 1499-1504. Los codones se sustituyeron con la alternativa humana/hepática más utilizada (basada en el análisis de preferencia de uso en el hígado analizada anteriormente) que no dio como resultado la formación de un dinucleótido 5'-CG-3 'en la secuencia. Estas modificaciones eliminaron 174 y 175 CpG de las secuencias de ET3 y HSQ con codones de hígado optimizados, respectivamente. La eliminación de CpG también ayuda al vector a evadir la detección inmunitaria, potenciando la seguridad y la eficacia del vector. Véase J Clin Invest. 2013, 123(7):2994-3001, titulado "CpG-depleted adenoassociated virus vectors evade immune detection".
La secuencia de ET3 con codones de hígado optimizados con CpG eliminados es la SEQ ID NO: 11:
ATGCAGCTGGAACTGTCTACCTGTGTGTTTCTGTGTCTGCTGCCTCTGGGGTTTTCTGCTATCAGGAGATACTATCTG
GGAGCTGTGGAGCTGTCCTGGGACTACAGGCAGTCTGAGCTGCTGAGAGAACTGCATGTGGATACCAGATTCCCAGCT
ACAGCTCCAGGAGCTCTGCCTCTGGGCCCATCTGTGCTGTACAAGAAAACAGTCTTTGTGGAGTTTACAGACCAGCTG
TTCTCTGTGGCCAGGCCAAGACCACCTTGGATGGGACTGCTGGGACCAACCATCCAGGCTGAGGTGTATGATACAGTG
GTGGTGACCCTGAAAAACATGGCCTCCCATCCTGTGAGCCTGCATGCTGTGGGGGTGTCCTTCTGGAAGTCCTCTGAG
GGAGCTGAGTATGAAGACCATACCTCCCAGAGGGAGAAAGAAGATGATAAGGTGCTGCCTGGCAAAAGCCAGACCTAT
GTCTGGCAGGTGCTGAAGGAGAATGGACCAACTGCTTCTGACCCACCATGCCTGACCTACTCTTATCTGTCCCATGTG GATCTGGTGAAGGACCTGAATTCTGGACTGATTGGAGCTCTGCTGGTGTGTAGAGAGGGAAGCCTGACCAGAGAAAGA ACCCAGAACCTGCATGAGTTTGTCCTGCTGTTTGCTGTGTTTGATGAAGGGAAGAGCTGGCACTCTGCCAGGAATGAC TCCTGGACCAGAGCTATGGATCCAGCTCCTGCTAGAGCTCAGCCTGCTATGCACACAGTCAATGGCTATGTGAATAGG TCTCTGCCAGGACTGATTGGCTGCCATAAGAAATCTGTCTATTGGCATGTGATTGGAATGGGCACCAGCCCTGAGGTG CATTCTATCTTCCTGGAAGGCCACACCTTTCTGGTCAGGCACCATAGACAGGCCTCTCTGGAGATCTCCCCTCTGACC TTCCTGACAGCTCAGACCTTTCTGATGGACCTGGGGCAGTTCCTGCTGTTTTGCCATATCTCTTCCCACCATCATGGA GGAATGGAGGCTCATGTCAGGGTGGAATCCTGTGCTGAGGAACCACAGCTGAGAAGAAAGGCTGATGAGGAAGAGGAC TATGATGATAACCTGTATGACTCTGATATGGATGTGGTGAGGCTGGATGGGGATGATGTCAGCCCTTTCATCCAGATC AGGTCTGTGGCCAAGAAACATCCAAAGACCTGGGTCCACTACATTGCTGCTGAAGAGGAAGATTGGGACTATGCCCCC CTGGTGCTGGCTCCTGATGATAGATCCTACAAAAGCCAGTATCTGAACAATGGGCCCCAGAGGATTGGAAGGAAGTAC AAGAAAGTGAGGTTCATGGCCTATACAGATGAGACCTTTAAGACCAGAGAGGCTATCCAGCATGAATCTGGGATCCTG GGACCTCTGCTGTATGGAGAAGTGGGGGATACCCTGCTGATCATCTTCAAGAACCAGGCCTCCAGGCCATACAATATC TATCCCCATGGCATCACAGATGTGAGACCACTGTACAGCAGGAGACTGCCCAAGGGGGTCAAACACCTGAAGGATTTC CCCATCCTGCCTGGAGAGATCTTTAAGTATAAATGGACAGTCACAGTGGAAGATGGGCCTACCAAGTCTGATCCAAGG TGCCTGACCAGATACTATAGCTCTTTTGTGAACATGGAGAGAGACCTGGCTTCTGGACTGATTGGACCCCTGCTGATC TGTTACAAAGAGTCTGTGGACCAGAGGGGCAACCAGATCATGTCTGATAAGAGAAATGTCATCCTGTTCTCTGTGTTT GATGAGAACAGGAGCTGGTACCTGACAGAGAACATCCAGAGGTTCCTGCCAAATCCAGCTGGAGTGCAGCTGGAGGAC CCAGAATTTCAGGCTTCCAACATCATGCATAGCATCAATGGCTATGTGTTTGATAGCCTGCAGCTGTCTGTCTGCCTG CATGAGGTGGCCTACTGGTATATCCTGTCCATTGGAGCTCAGACAGACTTCCTGTCTGTGTTCTTTAGTGGGTACACC TTTAAGCATAAAATGGTGTATGAGGATACCCTGACCCTGTTCCCCTTTTCTGGGGAGACAGTGTTCATGTCCATGGAA AACCCTGGCCTGTGGATCCTGGGGTGCCACAACTCTGACTTCAGGAATAGAGGAATGACAGCCCTGCTGAAAGTGTCC AGCTGTGATAAGAATACAGGGGATTACTATGAGGACTCT TATGAAGATATCTCTGCTTATCTGCTGAGCAAGAACAAT GCCATTGAGCCCAGGTCTTTTGCTCAGAACTCCAGACCTCCATCTGCTTCTGCTCCTAAGCCACCTGTGCTGAGAAGA CATCAGAGGGACATCTCCCTGCCTACCTTCCAGCCAGAGGAAGATAAAATGGACTATGATGATATCTTCAGCACAGAG ACCAAGGGGGAAGATTTTGACATCTATGGAGAGGATGAAAACCAGGATCCAAGATCCTTCCAGAAGAGAACCAGACAC TACTTTATTGCTGCTGTGGAGCAGCTGTGGGACTATGGGATGTCTGAAAGCCCAAGGGCCCTGAGGAACAGAGCTCAG AATGGAGAGGTGCCCAGATTCAAGAAAGTGGTGTTCAGAGAGTTTGCTGATGGCAGCTTTACCCAGCCATCTTACAGG GGGGAGCTGAACAAGCATCTGGGGCTGCTGGGACCCTATATCAGAGCTGAGGTGGAAGATAACATCATGGTGACCTTC AAGAATCAGGCTTCTAGGCCCTACTCCTTTTATTCTTCCCTGATCTCCTACCCTGATGATCAGGAGCAGGGAGCTGAA CCTAGGCACAACTTTGTGCAGCCAAATGAGACCAGAACCTACTTTTGGAAGGTGCAGCATCACATGGCTCCCACAGAG GATGAATTTGACTGCAAAGCTTGGGCCTATTTTTCTGATGTGGACCTGGAGAAGGATGTGCATTCTGGCCTGATTGGG CCTCTGCTGATCTGTAGGGCCAACACCCTGAATGCTGCTCATGGAAGACAGGTCACAGTGCAGGAGTTTGCTCTGTTC TTTACCATCTTTGATGAAACCAAGAGCTGGTACTTCACAGAGAATGTGGAAAGGAATTGCAGAGCCCCCTGTCATCTG CAGATGGAGGACCCTACCCTGAAGGAAAACTACAGGTTCCATGCCATCAATGGATATGTCATGGATACCCTGCCTGGC CTGGTCATGGCTCAGAACCAGAGGATCAGATGGTACCTGCTGTCTATGGGATCCAATGAGAATATCCATAGCATCCAC TTCTCTGGCCATGTCTTTTCTGTGAGGAAGAAAGAGGAATACAAAATGGCTGTGTACAATCTGTATCCTGGGGTCTTT GAGACAGTGGAAATGCTGCCAAGCAAAGTGGGAATCTGGAGAATTGAGTGCCTGATTGGGGAACACCTGCAGGCTGGG ATGAGCACCACCTTCCTGGTGTACTCTAAGAAATGTCAGACCCCACTGGGGATGGCCTCTGGACATATCAGGGACTTC CAGATCACAGCTTCTGGACAGTATGGACAGTGGGCTCCAAAGCTGGCTAGACTGCACTATTCTGGCTCCATCAATGCC TGGTCTACCAAAGAGCCATTCTCCTGGATCAAGGTGGACCTGCTGGCCCCCATGATCATCCATGGAATCAAAACCCAG GGAGCTAGGCAGAAGTTCAGCTCTCTGTACATCTCCCAGTTTATCATCATGTATAGCCTGGATGGGAAGAAATGGCAG ACCTACAGAGGCAATTCCACTGGGACCCTGATGGTCTTCTTTGGAAATGTGGATTCCTCTGGCATCAAGCACAACATC TTCAATCCACCCATCATTGCCAGGTACATCAGGCTGCATCCTACCCACTATAGCATCAGGTCTACCCTGAGAATGGAG CTGATGGGATGTGACCTGAACAGCTGTTCTATGCCACTGGGCATGGAGTCCAAGGCTATCTCTGATGCCCAGATCACA GCTTCTTCCTACTTCACCAATATGTTTGCTACCTGGTCCCCAAGCAAGGCTAGACTGCACCTGCAGGGAAGATCCAAT GCTTGGAGACCCCAGGTGAACAATCCTAAGGAGTGGCTGCAGGTGGACTTCCAGAAAACCATGAAGGTCACAGGGGTG ACCACCCAGGGAGTGAAATCTCTGCTGACCTCCATGTATGTCAAGGAGTTCCTGATCAGCTCTTCCCAGGATGGCCAC CAGTGGACCCTGTTCTTTCAGAATGGCAAGGTCAAAGTGTTCCAGGGGAATCAGGACTCTTTTACCCCAGTGGTGAAC TCCCTGGATCCTCCACTGCTGACCAGGTACCTGAGAATCCATCCTCAGAGCTGGGTGCACCAGATTGCTCTGAGAATG GAGGTCCTGGGATGTGAAGCTCAGGACCTGTATTGA.
La secuencia de HSQ con codones de hígado optimizados con CpG eliminados es la SEQ ID NO: 2:
ATGCAGATTGAACTGTCTACCTGTTTCTTTCTGTGCCTGCTGAGGTTTTGTTTTTCTGCTACCAGAAGATACTACCTG GGAGCTGTGGAACTGAGCTGGGATTACATGCAGTCTGACCTGGGAGAGCTGCCTGTGGATGCTAGATTCCCACCTAGA GTCCCTAAGTCCTTCCCCTTCAACACCTCTGTGGTCTACAAGAAAACCCTGTTTGTGGAGTTTACAGACCACCTGTTC AACATTGCTAAGCCTAGACCACCATGGATGGGACTGCTGGGACCAACCATCCAGGCAGAGGTGTATGACACAGTGGTC ATCACCCTGAAAAACATGGCTTCTCACCCTGTGTCCCTGCATGCTGTGGGAGTCTCCTACTGGAAGGCCTCTGAAGGG GCTGAGTATGATGATCAGACCAGCCAGAGGGAAAAAGAGGATGATAAGGTGTTCCCTGGAGGGTCCCATACCTATGTG TGGCAGGTCCTGAAGGAGAATGGACCAATGGCTTCTGACCCTCTGTGCCTGACCTACTCTTATCTGTCCCATGTGGAC CTGGTCAAGGATCTGAACTCTGGCCTGATTGGGGCTCTGCTGGTGTGTAGGGAAGGGTCCCTGGCCAAGGAGAAAACC CAGACCCTGCATAAGTTCATCCTGCTGTTTGCTGTGTTTGATGAAGGAAAAAGCTGGCACTCTGAGACCAAGAACTCT CTGATGCAGGACAGGGATGCTGCTTCTGCCAGAGCTTGGCCCAAGATGCACACAGTGAATGGCTATGTCAATAGGAGC
CTGCCTGGACTGATTGGCTGCCACAGAAAGTCTGTGTATTGGCATGTCATTGGAATGGGCACCACCCCTGAAGTGCAC
AGCATCTTCCTGGAGGGGCATACCTTTCTGGTCAGGAACCACAGGCAGGCTAGCCTGGAGATCTCTCCAATCACCTTC
CTGACAGCCCAGACCCTGCTGATGGACCTGGGACAGTTCCTGCTGTTTTGCCACATCTCCAGCCACCAGCATGATGGC
ATGGAGGCTTATGTGAAAGTGGACTCCTGTCCTGAGGAACCTCAGCTGAGGATGAAGAACAATGAGGAAGCTGAAGAC
TATGATGATGACCTGACAGACTCTGAGATGGATGTGGTCAGGTTTGATGATGATAACTCTCCCTCCTTTATCCAGATC
AGGTCTGTGGCCAAGAAACACCCTAAGACCTGGGTCCATTACATTGCTGCTGAGGAAGAGGACTGGGATTATGCTCCA
CTGGTGCTGGCCCCTGATGATAGATCCTACAAAAGCCAGTATCTGAACAATGGACCCCAGAGGATTGGCAGAAAGTAC
AAGAAAGTGAGGTTCATGGCTTATACAGATGAGACCTTTAAGACCAGAGAAGCCATCCAGCATGAGTCTGGGATCCTG
GGACCTCTGCTGTATGGGGAAGTGGGGGACACCCTGCTGATCATCTTCAAGAACCAGGCCAGCAGGCCTTACAATATC
TATCCACATGGCATCACAGATGTGAGACCTCTGTACTCCAGGAGGCTGCCAAAGGGGGTGAAACACCTGAAGGACTTC
CCAATCCTGCCTGGGGAAATCTTTAAGTATAAATGGACAGTCACAGTGGAGGATGGGCCCACCAAGTCTGACCCTAGG
TGCCTGACCAGATACTATTCTTCCTTTGTGAATATGGAGAGAGACCTGGCTTCTGGACTGATTGGACCCCTGCTGATC
TGTTACAAAGAGTCTGTGGATCAGAGGGGCAACCAGATCATGTCTGACAAGAGGAATGTGATCCTGTTCTCTGTCTTT
GATGAAAACAGGTCTTGGTACCTGACAGAGAACATCCAGAGGTTCCTGCCTAATCCAGCTGGAGTGCAGCTGGAAGAT
CCTGAGTTCCAGGCCTCTAACATCATGCATTCCATCAATGGCTATGTGTTTGACTCCCTGCAGCTGTCTGTGTGCCTG
CATGAGGTGGCTTACTGGTATATCCTGAGCATTGGAGCCCAGACAGATTTCCTGTCTGTGTTCTTTTCTGGCTACACC
TTTAAGCATAAAATGGTGTATGAGGACACCCTGACCCTGTTCCCATTTTCTGGAGAAACTGTGTTCATGAGCATGGAG
AATCCTGGGCTGTGGATCCTGGGATGCCACAACTCTGATTTCAGGAATAGAGGGATGACAGCCCTGCTGAAAGTGAGC
TCTTGTGACAAGAACACAGGAGACTAC TATGAAGATAGCTATGAGGACATC TCTGCTTATCTGCTGTCCAAAAACAAT
GCCATTGAGCCCAGGAGCTTCTCTCAGAACCCTCCAGTGCTGAAGAGGCACCAGAGGGAGATCACCAGAACCACCCTG
CAGTCTGATCAGGAAGAGATTGACTAT GATGATACCATCTCTGTGGAAATGAAGAAAGAGGAC TTTGATATCTATGAT
GAAGATGAGAACCAGTCTCCCAGGTCCTTCCAGAAGAAAACCAGACATTACTTTATTGCTGCTGTGGAGAGGCTGTGG
GACTATGGCATGTCCAGCTCTCCTCATGTGCTGAGAAATAGAGCTCAGTCTGGATCTGTCCCACAGTTCAAGAAAGTG
GTCTTCCAGGAGTTTACAGATGGAAGCTTTACCCAGCCACTGTACAGGGGAGAACTGAATGAGCACCTGGGGCTGCTG
GGACCCTATATCAGGGCTGAAGTGGAGGATAACATCATGGTCACCTTCAGGAATCAGGCCAGCAGACCCTACTCTTTT
TATTCCAGCCTGATCTCCTATGAAGAGGACCAGAGACAGGGAGCTGAACCAAGAAAAAACTTTGTGAAGCCTAATGAG
ACCAAAACCTACTTTTGGAAGGTGCAGCACCATATGGCCCCTACCAAAGATGAGTTTGATTGCAAGGCCTGGGCTTAT
TTTTCTGATGTGGATCTGGAGAAGGATGTCCACTCTGGCCTGATTGGGCCACTGCTGGTGTGTCATACCAACACCCTG
AATCCAGCTCATGGAAGGCAGGTGACAGTCCAGGAATTTGCCCTGTTCTTTACCATCTTTGATGAGACCAAGAGCTGG
TACTTCACAGAAAACATGGAGAGGAATTGCAGAGCCCCATGTAACATCCAGATGGAAGACCCCACCTTCAAGGAGAAC
TACAGATTTCATGCTATCAATGGGTATATCATGGATACCCTGCCAGGACTGGTCATGGCTCAGGACCAGAGGATCAGA
TGGTACCTGCTGAGCATGGGGTCTAATGAGAATATCCACTCCATCCATTTCTCTGGACATGTGTTTACAGTAAGGAAG
AAAGAAGAGTACAAGATGGCCCTGTACAACCTGTATCCTGGGGTGTTTGAAACAGTGGAGATGCTGCCTTCCAAGGCT
GGGATCTGGAGGGTGGAATGCCTGATTGGGGAGCACCTGCATGCTGGAATGTCTACCCTGTTCCTGGTGTACTCCAAT
AAGTGTCAGACCCCCCTGGGGATGGCTTCTGGACATATCAGGGACTTCCAGATCACAGCTTCTGGACAGTATGGACAG
TGGGCTCCTAAGCTGGCTAGACTGCACTATTCTGGCTCCATCAATGCTTGGTCTACCAAAGAGCCTTTCTCCTGGATC
AAGGTGGACCTGCTGGCTCCAATGATCATCCATGGCATCAAAACCCAGGGGGCCAGGCAGAAGTTCTCTTCCCTGTAC
ATCAGCCAGTTTATCATCATGTATTCTCTGGATGGGAAGAAATGGCAGACCTACAGAGGCAATTCCACAGGGACCCTG
ATGGTGTTCTTTGGCAATGTGGACAGCTCTGGGATCAAGCACAACATCTTCAATCCCCCTATCATTGCCAGGTACATC
AGACTGCACCCAACCCATTATTCCATCAGGAGCACCCTGAGAATGGAGCTGATGGGGTGTGATCTGAACAGCTGTTCT
ATGCCCCTGGGAATGGAGTCTAAGGCCATCTCTGATGCTCAGATCACAGCCTCCAGCTACTTCACCAATATGTTTGCT
ACCTGGTCCCCAAGCAAGGCTAGACTGCATCTGCAGGGAAGAAGCAATGCTTGGAGACCACAGGTGAACAATCCCAAG
GAGTGGCTGCAGGTGGACTTCCAGAAAACCATGAAGGTGACAGGAGTCACCACCCAGGGAGTGAAAAGCCTGCTGACC
TCTATGTATGTCAAGGAGTTCCTGATCTCTTCCAGCCAGGATGGGCACCAGTGGACCCTGTTCTTTCAGAATGGAAAG
GTGAAAGTCTTCCAGGGCAATCAGGATTCCTTTACCCCTGTGGTCAACAGCCTGGACCCACCCCTGCTGACCAGGTAC
CTGAGAATCCACCCACAGTCCTGGGTGCATCAGATTGCTCTGAGGATGGAAGTCCTGGGCTGTGAGGCCCAGGACCTG
TATTGA
Este enfoque aumentó el LCAI de 0,62 a 0,86 para fVIII humano (HSQ) con dominio B eliminado. La expresión in vitro de las secuencias optimizadas de fVIII se evaluó en células HepG2 transfectadas transitoriamente con los plásmidos de expresión de fVIII correspondientes. La optimización de codones en la secuencia del ácido nucleico que codifica para HSQ aumentó la expresión de HSQ 7,4 veces, y se expresó de manera tan eficaz como ET3 sin codones optimizados (Figura 3A). La optimización de codones en la secuencia del ácido nucleico que codifica para HSQ aumentó la expresión de ET3 5,6 veces. Cuando se probó in vivo mediante inyección hidrodinámica de plásmido que portaba las variantes de fVIII con codones optimizados en ratones, la actividad de HSQ aumentó a niveles que podrían detectarse mediante el ensayo que eran casi equivalentes a los niveles de fVIII observados en la ET3 sin codones optimizados (Figura 3B). Adicionalmente, se observó un aumento de 17 veces en la actividad para la ET3 con codones optimizados (Figura 3B).
La eficacia de la traducción a veces también puede mejorarse mediante la optimización del contenido de GC, estructura secundaria de ARNm, sitios de PoliA prematuros, motivo de inestabilidad de ARN, energía libre estable de ARNm, sitios chi internos, motivos de inestabilidad de ARN, sitios de unión a ribosomas, sitios de corte y empalme crípticos, islas CpG negativas, secuencia SD, cajas TATA y señales terminales crípticas, etc. La FIG. 4 ilustra los cambios que se realizaron en un casete AAV que codifica la secuencia de ET3 con codones optimizados y CpG eliminados para aumentar su producción. Varios elementos de acción en cis dentro de la secuencia de HSQ se modificaron adicionalmente para aumentar la expresión de fVIII, tal como se resume en la siguiente tabla.
Elementos de Acción en CIS Optimizado Original
Corte y empalme(GGTAAG) 0 2
Corte y empalme (GGTGAT) 0 1
PoliA(AATAAA) (4789 - AATAAA) 1 1
PoliA(ATTAAA) 0 0 Desestabilizante(ATTTA) 0 6
PoliT(TTTTTT) (4827 - TTTTTT) 1 2
PoliA(AAAAAAA) 0 1
Además de las secuencias con codones de hígado optimizados proporcionadas anteriormente, la secuencia codificante para las proteínas ET3 y HSQ fVIII se optimizó con codones para la expresión en células mieloides. Usando las secuencias de genes altamente expresados en las células mieloides humanas, se construyó una tabla personalizada de preferencia de uso de codones específica para el hígado humano (véase la Figura 2C) que difiere sustancialmente de los codones más prevalentes usados en secuencias codificantes humanas totales (Figura. 2B). La secuencia codificante optimizada de las variantes de fVIII ET3 y HSQ se desarrolló con los codones estadísticamente más prevalentes identificados por el análisis de preferencia de uso en el hígado. Además, los motivos de ADN CpG en la secuencia codificante con codones mieloides optimizados para ET3 y HSQ se eliminaron porque pueden conducir a la metilación y silenciamiento de genes.
La secuencia de ET3 con codones mieloides optimizados con CpG eliminados es la SEQ ID NO: 125:
ATGCAGCTGGAGCTCTCAACCTGTGTGTTCCTCTGCCTGCTCCCCCTGGGATTTTCAGCTATCAGGAGATAC TATCTGGGAGCAGTGGAACTGTCCTGGGACTACAGGCAGTCAGAGCTGCTCAGAGAACTGCATGTGGATACTAGGTTC CCTGCAACAGCTCCTGGAGCACTGCCACTGGGACCTTCAGTGCTGTACAAGAAAACTGTCTTTGTGGAGTTTACAGAC CAGCTGTTCAGTGTGGCCAGGCCCAGGCCCCCCTGGATGGGGCTGCTGGGACCCACCATCCAGGCTGAAGTGTATGAT ACTGTGGTGGTGACCCTGAAAAACATGGCCTCTCATCCAGTCAGCCTGCATGCTGTGGGAGTGAGCTTCTGGAAGAGC AGTGAGGGAGCTGAGTATGAAGACCATACCTCACAGAGGGAGAAAGAAGATGATAAGGTGCTGCCAGGAAAAAGCCAG ACCTATGTGTGGCAGGTGCTGAAGGAGAATGGCCCTACAGCTTCAGATCCTCCCTGCCTCACATACTCTTATCTGAGC CATGTGGATCTGGTGAAGGACCTCAATAGTGGCCTGATTGGGGCACTGCTGGTGTGCAGAGAGGGGTCCCTCACAAGG GAAAGAACTCAGAACCTGCATGAGTTTGTCCTGCTCTTTGCTGTGTTTGATGAGGGAAAGTCCTGGCACTCAGCAAGG AATGACAGCTGGACCAGGGCTATGGACCCAGCACCAGCCAGAGCTCAGCCAGCTATGCACACTGTCAATGGCTATGTG AATAGGTCCCTGCCTGGACTCATTGGCTGCCATAAGAAATCAGTCTATTGGCATGTGATTGGAATGGGCACCAGCCCA GAGGTGCATTCCATCTTCCTGGAAGGCCACACATTTCTGGTCAGGCACCATAGACAGGCCAGCCTGGAGATCAGCCCA CTGACTTTCCTCACAGCACAGACATTTCTGATGGACCTGGGGCAGTTCCTGCTCTTTTGCCATATCTCAAGTCACCAT CATGGAGGGATGGAGGCTCATGTCAGGGTGGAAAGCTGTGCAGAGGAACCTCAGCTGAGGAGGAAGGCAGATGAGGAA GAGGACTATGATGATAACCTGTATGACTCAGATATGGATGTGGTGAGGCTGGATGGAGATGATGTCAGCCCATTCATC CAGATCAGGTCAGTGGCTAAGAAACACCCTAAGACCTGGGTCCACTACATTGCAGCTGAAGAGGAAGATTGGGACTAT GCACCCCTGGTGCTGGCCCCAGATGATAGAAGTTACAAATCTCAGTATCTGAACAATGGGCCCCAGAGGATTGGAAGG AAGTACAAGAAAGTGAGGTTCATGGCTTATACTGATGAGACCTTTAAGACAAGAGAGGCAATCCAGCATGAAAGTGGC ATCCTGGGACCACTGCTCTATGGAGAAGTGGGGGATACCCTGCTCATCATCTTCAAGAACCAGGCCTCAAGGCCTTAC AATATCTATCCCCATGGCATCACAGATGTGAGGCCTCTCTACAGCAGGAGACTGCCCAAGGGAGTCAAACACCTCAAG GATTTCCCCATCCTGCCAGGGGAAATCTTCAAGTATAAATGGACAGTCACTGTGGAAGATGGGCCAACTAAGTCAGAT CCTAGGTGCCTGACCAGGTACTATTCTAGCTTTGTGAACATGGAGAGGGACCTGGCTTCAGGACTGATTGGACCTCTG CTCATCTGCTACAAAGAATCAGTGGACCAGAGGGGCAACCAGATCATGAGTGATAAGAGAAATGTCATCCTGTTCTCA GTGTTTGATGAGAATAGGAGTTGGTATCTGACAGAAAACATCCAGAGGTTCCTGCCTAATCCTGCAGGAGTGCAGCTG GAGGACCCAGAATTTCAGGCTTCAAACATCATGCATAGTATCAATGGCTATGTGTTTGATAGTCTGCAGCTCTCTGTC TGCCTGCATGAGGTGGCCTACTGGTATATCCTCAGCATTGGAGCTCAGACTGACTTCCTGAGTGTGTTCTTTTCAGGC TACACATTCAAGCATAAGATGGTCTATGAAGATACCCTGACACTCTTCCCCTTTTCTGGGGAGACTGTGTTTATGAGC ATGGAAAACCCAGGCCTGTGGATTCTGGGGTGCCACAACAGTGACTTCAGGAATAGAGGGATGACTGCTCTGCTCAAA GTGTCCTCATGTGATAAGAATACTGGAGATTACTATGAGGACTCTTATGAAGATATCAGTGCATATCTGCTCTCCAAA AACAATGCCATTGAGCCCAGGTCATTTGCTCAGAACAGTAGACCACCTTCTGCAAGTGCACCAAAGCCTCCAGTGCTG AGGAGACACCAGAGGGACATCAGCCTGCCAACCTTCCAGCCTGAGGAAGATAAAATGGACTATGATGATATCTTCTCC ACTGAGACCAAGGGGGAAGATTTTGACATCTATGGAGAGGATGAAAACCAGGACCCCAGGTCCTTCCAGAAGAGGACC AGACACTACTTTATTGCAGCTGTGGAGCAGCTGTGGGACTATGGCATGTCTGAATCACCTAGAGCTCTGAGGAACAGA GCACAGAATGGGGAGGTGCCCAGGTTCAAGAAAGTGGTGTTCAGAGAATTTGCAGATGGCTCTTTTACCCAGCCTAGC TACAGGGGGGAGCTCAACAAGCATCTGGGGCTGCTGGGACCCTATATCAGAGCAGAGGTGGAAGATAACATCATGGTG ACATTCAAGAATCAGGCCTCAAGACCCTACAGTTTTTATAGTTCTCTGATCAGCTACCCAGATGATCAGGAGCAGGGG GCTGAACCAAGGCACAACTTTGTGCAGCCTAATGAGACAAGAACTTACTTTTGGAAGGTCCAGCATCACATGGCTCCC ACAGAGGATGAGTTTGACTGCAAGGCCTGGGCATATTTTTCTGATGTGGACCTGGAGAAGGATGTGCATAGTGGCCTC ATTGGGCCACTGCTCATCTGCAGGGCAAACACACTGAATGCTGCACATGGCAGGCAGGTCACTGTGCAGGAGTTTGCC CTGTTCTTTACAATCTTTGATGAAACTAAGTCCTGGTACTTCACAGAGAATGTGGAAAGGAATTGCAGAGCCCCCTGC CATCTCCAGATGGAGGACCCAACTCTGAAGGAAAACTACAGGTTCCATGCTATCAATGGATATGTCATGGATACACTG CCAGGCCTGGTGATGGCACAGAACCAGAGGATCAGGTGGTATCTGCTCAGCATGGGGTCCAATGAGAATATCCATTCT ATCCACTTCTCAGGACATGTCTTTTCAGTGAGGAAGAAAGAGGAATATAAAATGGCTGTGTACAATCTGTATCCAGGG GTCTTTGAGACAGTGGAAATGCTGCCTAGCAAAGTGGGGATCTGGAGAATTGAGTGCCTCATTGGAGAACACCTGCAG GCAGGGATGTCCACCACATTTCTGGTGTACTCAAAGAAATGCCAGACTCCCCTGGGGATGGCAAGTGGACATATCAGG GACTTCCAGATCACTGCATCAGGACAGTATGGACAGTGGGCACCAAAGCTGGCTAGGCTCCACTATAGTGGCTCTATC AATGCTTGGAGTACCAAAGAGCCTTTCTCTTGGATCAAGGTGGATCTGCTGGCCCCCATGATCATCCATGGAATCAAA ACACAGGGAGCTAGACAGAAGTTCAGCTCCCTGTACATCAGTCAGTTTATCATCATGTATTCTCTGGATGGGAAGAAA TGGCAGACCTACAGGGGCAATAGCACTGGGACACTGATGGTCTTCTTTGGAAATGTGGATTCAAGTGGCATCAAGCAC AACATCTTCAATCCTCCCATCATTGCCAGGTACATCAGACTGCATCCCACACACTATTCAATCAGGAGTACTCTCAGA ATGGAGCTGATGGGGTGTGACCTCAACAGCTGCTCCATGCCACTGGGAATGGAATCCAAGGCAATCTCAGATGCCCAG ATCACTGCTTCTAGCTACTTCACCAATATGTTTGCAACATGGTCACCCAGTAAAGCAAGGCTGCACCTCCAGGGAAGG TCCAATGCTTGGAGACCCCAGGTGAACAATCCAAAGGAGTGGCTGCAGGTGGACTTTCAGAAAACCATGAAGGTCACA GGGGTGACTACCCAGGGAGTGAAAAGTCTGCTCACCTCTATGTATGTCAAGGAGTTCCTGATCTCCTCAAGTCAGGAT GGCCACCAGTGGACACTGTTCTTTCAGAATGGCAAGGTCAAAGTGTTCCAGGGGAATCAGGACAGCTTTACACCAGTG GTGAACAGCCTGGACCCCCCTCTGCTCACTAGATATCTGAGAATCCATCCACAGAGCTGGGTGCACCAGATTGCACTC AGAATGGAGGTCCTGGGCTGTGAAGCCCAGGACCTGTATTGA
La secuencia de HSQ con codones mieloides optimizados con CpG eliminados es la SEQ ID NO: 126:
ATGCAGATTGAGCTCAGCACCTGCTTCTTTCTGTGCCTGCTCAGGTTCTGCTTTTCAGCCACAAGGAGATACTATCTG
GGAGCTGTGGAACTGTCATGGGATTACATGCAGAGTGACCTGGGAGAGCTCCCTGTGGATGCTAGGTTCCCCCCAAGG
GTCCCAAAGTCTTTCCCTTTTAATACCAGTGTGGTCTATAAGAAAACACTCTTTGTGGAATTTACTGATCACCTGTTC
AACATTGCAAAGCCAAGGCCTCCCTGGATGGGACTGCTGGGACCTACCATCCAGGCTGAGGTGTATGACACTGTGGTC
ATCACACTGAAAAACATGGCATCTCACCCTGTCAGCCTGCATGCAGTGGGAGTCAGCTACTGGAAGGCTTCAGAAGGG
GCAGAGTATGATGATCAGACAAGCCAGAGAGAAAAAGAGGATGATAAGGTGTTCCCAGGAGGGAGCCATACTTATGTG
TGGCAGGTCCTGAAGGAGAATGGCCCAATGGCCAGTGACCCACTGTGCCTCACCTACTCATATCTGAGTCATGTGGAC
CTGGTCAAGGATCTCAACTCAGGCCTGATTGGGGCACTGCTGGTGTGCAGGGAAGGCTCACTGGCCAAGGAGAAAACC
CAGACACTGCATAAGTTCATCCTGCTCTTTGCTGTGTTTGATGAAGGGAAATCTTGGCACAGTGAGACCAAGAACAGT
CTGATGCAGGACAGGGATGCTGCTTCTGCCAGAGCTTGGCCCAAGATGCACACAGTGAATGGATATGTCAATAGGTCC
CTGCCAGGACTCATTGGCTGCCACAGAAAGTCAGTGTATTGGCATGTCATTGGAATGGGCACCACACCAGAAGTGCAC
AGCATCTTCCTGGAGGGGCATACCTTTCTGGTCAGGAACCACAGGCAGGCCAGCCTGGAGATCAGCCCAATCACCTTC
CTGACAGCCCAGACTCTGCTCATGGATCTGGGGCAGTTCCTGCTCTTTTGCCACATCAGCTCCCACCAGCATGATGGA
ATGGAGGCATATGTGAAAGTGGACTCCTGCCCAGAGGAACCACAGCTGAGGATGAAGAACAATGAGGAAGCTGAAGAC
TATGATGATGACCTGACAGACTCAGAGATGGATGTGGTCAGGTTTGATGATGATAACAGCCCCTCCTTTATCCAGATC
AGAAGTGTGGCCAAGAAACACCCAAAGACATGGGTCCATTACATTGCAGCTGAGGAAGAGGACTGGGATTATGCACCT
CTGGTGCTGGCCCCAGATGATAGATCCTACAAATCACAGTATCTGAACAATGGACCCCAGAGGATTGGCAGAAAGTAC
AAGAAAGTGAGGTTCATGGCCTATACTGATGAAACATTTAAGACTAGAGAAGCTATCCAGCATGAGTCAGGCATCCTG
GGACCACTGCTCTATGGAGAAGTGGGGGACACCCTGCTCATCATCTTCAAGAACCAGGCTTCCAGGCCATACAATATC
TATCCTCATGGCATCACAGATGTGAGACCACTCTACTCAAGGAGACTGCCTAAGGGAGTCAAACACCTCAAGGACTTC
CCTATCCTGCCAGGGGAAATCTTTAAGTATAAATGGACTGTGACAGTGGAGGATGGGCCCACTAAGAGTGACCCAAGG
TGCCTGACCAGATACTATTCAAGTTTTGTGAATATGGAAAGGGATCTGGCATCAGGACTGATTGGACCTCTGCTCATC
TGCTACAAAGAGAGTGTGGATCAGAGGGGCAACCAGATCATGTCAGACAAGAGGAATGTGATCCTGTTCAGTGTCTTT
GATGAAAACAGGTCTTGGTATCTGACAGAGAACATCCAGAGATTCCTGCCAAATCCTGCAGGGGTGCAGCTGGAAGAT
CCAGAGTTTCAGGCCTCAAACATCATGCATAGTATCAATGGATATGTGTTTGACAGTCTGCAGCTCTCTGTGTGCCTG
CATGAAGTGGCCTACTGGTATATCCTGTCCATTGGAGCTCAGACAGATTTCCTGAGTGTGTTCTTTTCAGGCTACACT
TTTAAGCATAAAATGGTCTATGAGGACACACTGACTCTCTTCCCTTTTAGTGGGGAAACAGTGTTTATGAGCATGGAG
AATCCAGGGCTGTGGATTCTGGGATGCCACAACAGTGATTTCAGGAATAGAGGCATGACTGCTCTGCTCAAAGTGTCT
AGCTGTGACAAGAACACAGGGGACTACTATGAAGATTCT TATGAGGACATCAGTGCTTATCTGCTCTCCAAAAACAAT GCAATTGAACCCAGATCATTCAGTCAGAATCCACCTGTGCTGAAGAGGCACCAGAGAGAGATCACTAGGACTACCCTG CAGT CAGATCAGGAAGAGATTGACTATGATGATACCATCTCAGTGGAAATGAAGAAAGAGGACTTTGATATCTATGAT GAAGATGAGAACCAGAGTCCAAGGTCTTTCCAGAAGAAAACCAGACATTACTTTATTGCTGCAGTGGAGAGGCTGTGG GATTATGGAATGTCCTCAAGTCCACATGTGCTGAGGAATAGGGCACAGTCTGGCAGTGTCCCTCAGTTCAAGAAAGTG GTCTTCCAGGAGTTTACAGATGGCAGCTTCACTCAGCCTCTGTACAGGGGAGAACTCAATGAGCACCTGGGGCTGCTG GGACCCTATATCAGAGCTGAAGTGGAGGATAACATCATGGTCACCTTCAGGAATCAGGCTTCAAGACCCTACAGTTTT
TATTCTAGCCTGATCAGCTATGAAGAGGACCAGAGGCAGGGAGCTGAACCTAGGAAAAACTTTGTGAAGCCAAATGAG
ACCAAAACATACTTTTGGAAGGTCCAGCACCACATGGCACCAACCAAAGATGAGTTTGATTGCAAGGCATGGGCCTAT
TTTTCAGATGTGGATCTGGAGAAGGATGTCCACAGTGGCCTCATTGGGCCTCTGCTGGTGTGCCATACTAACACCCTG
AATCCAGCTCATGGCAGGCAGGTGACAGTCCAGGAGTTTGCACTGTTCTTTACCATCTTTGATGAGACAAAGTCCTGG
TACTTCACTGAAAACATGGAGAGGAATTGCAGAGCTCCTTGCAACATCCAGATGGAAGACCCCACCTTCAAGGAGAAC
TACAGATTTCATGCAATCAATGGGTATATCATGGATACACTGCCAGGACTGGTGATGGCCCAGGACCAGAGGATCAGA
TGGTATCTGCTCAGCATGGGGTCCAATGAGAATATCCACTCTATCCATTTCAGTGGACATGTGTTTACAGTCAGAAAG
AAAGAAGAGTATAAAATGGCCCTGTACAACCTCTATCCAGGAGTGTTTGAAACAGTGGAGATGCTGCCAAGCAAGGCT GGGATCTGGAGGGTGGAATGCCTCATTGGGGAGCACCTGCATGCAGGAATGTCAACCCTGTTTCTGGTCTACAGTAAT AAGTGCCAGACACCTCTGGGAATGGCAAGTGGACATATCAGGGATTTCCAGATCACTGCTAGTGGACAGTATGGACAG
TGGGCACCAAAGCTGGCTAGACTCCACTATTCAGGCTCAATCAATGCTTGGTCCACCAAAGAGCCATTCTCATGGATC
AAGGTGGACCTGCTGGCTCCTATGATCATCCATGGCATCAAAACACAGGGGGCAAGGCAGAAGTTCTCCTCACTGTAC ATCTCTCAGTTTATCATCATGTATAGCCTGGATGGCAAGAAATGGCAGACCTACAGGGGCAATAGCACAGGGACTCTG ATGGTGTTCTTTGGCAATGTGGACAGCAGTGGGATCAAGCACAACATCTTCAATCCCCCAATCATTGCAAGGTACATC AGACTGCACCCCACCCATTATTCAATCAGGAGTACACTCAGGATGGAACTGATGGGGTGTGATCTCAACAGTTGCTCT ATGCCACTGGGAATGGAGTCCAAGGCAATCTCAGATGCCCAGATCACTGCTAGCTCCTACTTCACTAATATGTTTGCT ACCTGGAGCCCCTCCAAAGCAAGGCTGCACCTCCAGGGAAGGAGCAATGCATGGAGGCCTCAGGTGAACAATCCCAAG GAATGGCTGCAGGTGGATTTCCAGAAAACTATGAAGGTGACTGGAGTCACAACTCAGGGAGTGAAAAGTCTGCTCACT
TCTATGTATGTCAAGGAGTTCCTGATCTCAAGTTCTCAGGATGGCCACCAGTGGACCCTGTTCTTTCAGAATGGAAAG
GTGAAAGTCTTCCAGGGCAATCAGGATTCCTTTACACCAGTGGTCAACTCACTGGACCCTCCCCTGCTCACTAGATAT CTGAGAATCCACCCTCAGAGCTGGGTGCATCAGATTGCTCTCAGAATGGAAGTCCTGGGCTGTGAGGCACAGGACCTG TATTGA
La expresión in vitro de las secuencias de fVIII no optimizadas, optimizadas para hígado y optimizadas para mieloides se evaluó en células HepG2 transfectadas transitoriamente con los plásmidos de expresión de fVIII correspondientes FIG.5). La optimización específica del tejido conduce a una mayor actividad de FVIII en las células HepG2 (hepáticas) que expresan el fVIII optimizado para el hígado en comparación con las formas no optimizadas u optimizadas para mieloides de ET3 o HSQ. Estos resultados muestran que la optimización para el hígado beneficia específicamente la expresión en células derivadas de hepatocitos y que la expresión de FVIII optimizado para mieloides no beneficia la expresión en células HepG2.
Adicionalmente, cuando estos experimentos se repitieron utilizando células no humanas (células de riñón de hámster recién nacido), se descubrió que la optimización de la secuencia específica de seres humanos condujo a una disminución de la expresión en las células no humanas (FIG. 6).
Factor IX
Similar a la optimización con codones para el fVIII de coagulación analizada anteriormente, las secuencias de fIX también fueron optimizadas con codón de expresión en hepatocitos usando las mismas tablas de optimización de codones usadas para el factor de coagulación fVIII. Las secuencias de fIX seleccionadas para la optimización incluyen fIX con la mutación protrombogénica "Padua" R338L ("fIX Padua" véase Paolo et al, "X-Linked Thrombophilia with a Mutant Factor IX" N Engl J Med; 361:1671-1675, 2009) y fIX con la variante trombofélica "Malmo" 148T (fIX Malmo, " véase Graham et al, "The Malmo Polymorphism of Coagulation Factor IX, An Immunologic Polymorphism Due to Dimorphism of Residue 148 That Is in Linkage Disequilibrium with Two Other FIX Polymorphisms", Am. J. Hum. Genet.
42:573-580, 1988)
Los ADNc de fIX optimizados para hígado y mieloide se diseñaron y optimizaron de acuerdo con las tablas de hígado y mieloide mostradas en la FIG. 2. Todas los casos de "cg" en su secuencia se eliminan mediante la sustitución de codones sinónimos. Ambos ADNc incorporan las sustituciones de Padua y Malmo.
FIX optimizado con codones de hígado con mutaciones Padua/Malmo y sin CpG (Versión 1) (SEQ ID NO: 124) ATGCAGAGGGTCAATATGATCATGGCTGAATCTCCTGGGCTGATCACCATTTGCCTGCTGGGATACCTGCTGTCTGCT GAGTGTACAGTGTTCCTGGACCATGAGAATGCCAATAAGATCCTGAACAGGCCCAAAAGATACAATTCTGGAAAGCTG GAGGAATTTGTGCAGGGCAACCTGGAGAGGGAATGCATGGAGGAAAAGTGTAGCTTTGAGGAAGCTAGGGAGGTGTTT GAAAACACAGAGAGGACCACAGAATTCTGGAAGCAGTATGTGGATGGAGATCAGTGTGAGTCCAACCCCTGTCTGAAT GGAGGGTCTTGCAAAGATGATATCAACTCCTATGAGTGCTGGTGTCCTTTTGGATTTGAAGGCAAAAATTGTGAGCTG GATGTGACCTGTAACATCAAGAATGGCAGGTGTGAGCAGTTCTGTAAAAACTCTGCTGATAATAAGGTGGTCTGCAGC TGTACAGAAGGCTATAGGCTGGCTGAGAACCAGAAGAGCTGTGAACCAGCTGTGCCCTTCCCTTGTGGGAGGGTGTCT GTCAGCCAGACCTCTAAGCTGACCAGAGCTGAGACTGTGTTCCCAGATGTGGATTATGTCAACTCCACAGAGGCTGAA ACCATCCTGGACAACATCACCCAGTCTACCCAGTCCTTCAATGACTTTACCAGAGTGGTGGGAGGAGAGGATGCCAAA CCAGGCCAGTTCCCCTGGCAGGTGGTCCTGAATGGGAAGGTGGATGCTTTTTGTGGGGGATCCATTGTGAATGAGAAA TGGATTGTCACAGCTGCTCACTGTGTGGAGACAGGGGTCAAGATCACTGTGGTGGCTGGAGAGCACAACATTGAGGAA ACAGAACATACTGAGCAGAAGAGGAATGTGATCAGAATCATCCCTCACCATAACTACAATGCTGCTATCAACAAATAT AATCATGACATTGCCCTGCTGGAACTGGATGAGCCTCTGGTGCTGAACAGCTATGTCACCCCAATCTGCATTGCTGAC AAAGAGTATACCAATATCTTCCTGAAGTTTGGATCTGGATATGTGTCTGGATGGGGAAGGGTCTTCCACAAGGGCAGG TCTGCCCTGGTGCTGCAGTATCTGAGGGTGCCTCTGGTGGACAGAGCTACCTGCCTGCTGTCTACCAAGTTCACCATC TACAACAATATGTTCTGTGCTGGATTTCATGAGGGAGGCAGGGACTCCTGTCAGGGGGATTCTGGAGGCCCACATGTG ACAGAGGTGGAAGGCACCAGCTTCCTGACTGGCATCATCTCTTGGGGGGAGGAATGTGCTATGAAGGGGAAATATGGA ATCTACACCAAAGTGAGCAGGTATGTGAACTGGATCAAAGAGAAGACCAAACTGACCTGA
FIX optimizado con codones de hígado sin CpG que codifican modificaciones A582 (SEQ ID NO: 8)
ATGCAGAGGGTGAACATGATCATGGCTGAGTCTCCTGGACTGATCACCATCTGCCTGCTGGGCTATCTGCTGTCTGCT GAGTGTACAGTGTTCCTGGACCATGAAAATGCTAATAAAATCCTGAACAGGCCAAAGAGGTACAATTCTGGGAAACTG GAGGAATTTGTGCAGGGAAACCTGGAGAGGGAATGCATGGAGGAAAAGTGTAGCTTTGAGGAAGCCAGGGAGGTGTTT GAAAATACAGAGAGGACCACAGAGTTCTGGAAACAGTATGTGGATGGGGATCAGTGTGAGTCCAACCCCTGTCTGAAT GGAGGGTCTTGCAAGGATGATATCAACTCCTATGAGTGCTGGTGTCCTTTTGGATTTGAAGGCAAGAATTGTGAGCTG GATGTGACCTGTAACATCAAAAATGGGAGGTGTGAGCAGTTCTGTAAGAACTCTGCTGATAATAAAGTGGTCTGCAGC TGTACAGAAGGCTACAGGCTGGCTGAGAACCAGAAGAGCTGTGAACCAGCTGTGCCCTTCCCTTGTGGGAGGGTGTCT GTCAGCCAGACCAGCAAGCTGACCAGAGCTGAGGCTGTGTTTCCTGATGTGGATTATGTCAACTCTACAGAGGCTGAA ACCATCCTGGACAACATCACCCAGTCTACCCAGTCCTTCAATGACTTTACCAGGGTGGTGGGAGGGGAGGATGCTAAG CCAGGACAGTTCCCCTGGCAGGTGGTCCTGAATGGCAAAGTGGATGCTTTTTGTGGGGGCTCCATTGTGAATGAGAAG TGGATTGTCACAGCTGCTCACTGTGTGGAAACTGGGGTCAAGATCACAGTGGTGGCTGGAGAGCACAACATTGAGGAA ACTGAACATACAGAGCAGAAAAGGAATGTGATCAGAATCATCCCCCACCATAACTACAATGCTGCTATCAACAAGTAT AATCATGACATTGCCCTGCTGGAACTGGATGAGCCTCTGGTGCTGAACAGCTATGTCACCCCAATCTGCATTGCTGAC AAGGAGTATACCAATATCTTCCTGAAATTTGGGTCTGGATATGTGTCTGGGTGGGGAAGGGTCTTCCACAAGGGAAGG TCTGCTCTGGTGCTGCAGTATCTGAGGGTGCCCCTGGTGGACAGAGCTACCTGCCTGAGGAGCACCAAGTTCACCATC TACAACAATATGTTCTGTGCTGGATTTCATGAGGGAGGGAGGGACTCCTGTCAGGGAGATTCTGGAGGCCCTCATGTG ACAGAGGTGGAAGGCACCAGCTTCCTGACTGGCATCATCTCTTGGGGGGAGGAATGTGCTATGAAGGGGAAATAT GGA ATCTATACCAAGGTGTCCAGATATGTCAACTGGATCAAGGAGAAAACCAAGCTGACCTGA
FIX optimizado con codones de hígado sin CpG incluyendo modificaciones de Padua y A582 (SEQ ID NO: 9)
ATGCAGAGGGTGAACATGATCATGGCTGAGTCTCCTGGACTGATCACCATCTGCCTGCTGGGCTATCTGCTGTCTGCT GAGTGTACAGTGTTCCTGGACCATGAAAATGCTAATAAAATCCTGAACAGGCCAAAGAGGTACAATTCTGGGAAACTG GAGGAATTTGTGCAGGGAAACCTGGAGAGGGAATGCATGGAGGAAAAGTGTAGCTTTGAGGAAGCCAGGGAGGTGTTT GAAAATACAGAGAGGACCACAGAGTTCTGGAAACAGTATGTGGATGGGGATCAGTGTGAGTCCAACCCCTGTCTGAAT GGAGGGTCTTGCAAGGATGATATCAACTCCTATGAGTGCTGGTGTCCTTTTGGATTTGAAGGCAAGAATTGTGAGCTG GATGTGACCTGTAACATCAAAAATGGGAGGTGTGAGCAGTTCTGTAAGAACTCTGCTGATAATAAAGTGGTCTGCAGC TGTACAGAAGGCTACAGGCTGGCTGAGAACCAGAAGAGCTGTGAACCAGCTGTGCCCTTCCCTTGTGGGAGGGTGTCT GTCAGCCAGACCAGCAAGCTGACCAGAGCTGAGGCTGTGTTTCCTGATGTGGATTATGTCAACTCTACAGAGGCTGAA ACCATCCTGGACAACATCACCCAGTCTACCCAGTCCTTCAATGACTTTACCAGGGTGGTGGGAGGGGAGGATGCTAAG CCAGGACAGTTCCCCTGGCAGGTGGTCCTGAATGGCAAAGTGGATGCTTTTTGTGGGGGCTCCATTGTGAATGAGAAG TGGATTGTCACAGCTGCTCACTGTGTGGAAACTGGGGTCAAGATCACAGTGGTGGCTGGAGAGCACAACATTGAGGAA ACTGAACATACAGAGCAGAAAAGGAATGTGATCAGAATCATCCCCCACCATAACTACAATGCTGCTATCAACAAGTAT AATCATGACATTGCCCTGCTGGAACTGGATGAGCCTCTGGTGCTGAACAGCTATGTCACCCCAATCTGCATTGCTGAC
AAGGAGTATACCAATATCTTCCTGAAATTTGGGTCTGGATATGTGTCTGGGTGGGGAAGGGTCTTCCACAAGGGAAGG TCTGCTCTGGTGCTGCAGTATCTGAGGGTGCCCCTGGTGGACAGAGCTACCTGCCTGCTGAGCACCAAGTTCACCATC TACAACAATATGTTCTGTGCTGGATTTCATGAGGGAGGGAGGGACTCCTGTCAGGGAGATTCTGGAGGCCCTCATGTG ACAGAGGTGGAAGGCACCAGCTTCCTGACTGGCATCATCTCTTGGGGGGAGGAATGTGCTATGAAGGGGAAATATGGA ATCTATACCAAGGTGTCCAGATATGTCAACTGGATCAAGGAGAAAACCAAGCTGACCTGA
Además, se construyeron otras dos variantes. La primera es una variante optimizada para hígado, Padua, 148T que es muy similar a la secuencia optimizada para hígado anterior, excepto que se sintetizó usando una versión alternativa del algoritmo de optimización de codones.
FIX optimizado con codones de hígado con mutaciones Padua/Malmo y sin CpG (Versión 2) (SEQ ID NO: 10)
ATGCAGAGGGTGAACATGATCATGGCTGAGTCTCCTGGACTGATCACCATCTGCCTGCTGGGCTATCTGCTGTCTGCT
GAGTGTACAGTGTTCCTGGACCATGAAAATGCTAATAAAATCCTGAACAGGCCAAAGAGGTACAATTCTGGGAAACTG
GAGGAATTTGTGCAGGGAAACCTGGAGAGGGAATGCATGGAGGAAAAGTGTAGCTTTGAGGAAGCCAGGGAGGTGTTT
GAAAATACAGAGAGGACCACAGAGTTCTGGAAACAGTATGTGGATGGGGATCAGTGTGAGTCCAACCCCTGTCTGAAT
GGAGGGTCTTGCAAGGATGATATCAACTCCTATGAGTGCTGGTGTCCTTTTGGATTTGAAGGCAAGAATTGTGAGCTG
GATGTGACCTGTAACATCAAAAATGGGAGGTGTGAGCAGTTCTGTAAGAACTCTGCTGATAATAAAGTGGTCTGCAGC
TGTACAGAAGGCTACAGGCTGGCTGAGAACCAGAAGAGCTGTGAACCAGCTGTGCCCTTCCCTTGTGGGAGGGTGTCT
GTCAGCCAGACCAGCAAGCTGACCAGAGCTGAGACAGTGTTTCCTGATGTGGATTATGTCAACTCTACAGAGGCTGAA
ACCATCCTGGACAACATCACCCAGTCTACCCAGTCCTTCAATGACTTTACCAGGGTGGTGGGAGGGGAGGATGCTAAG
CCAGGACAGTTCCCCTGGCAGGTGGTCCTGAATGGCAAAGTGGATGCTTTTTGTGGGGGCTCCATTGTGAATGAGAAG
TGGATTGTCACAGCTGCTCACTGTGTGGAAACTGGGGTCAAGATCACAGTGGTGGCTGGAGAGCACAACATTGAGGAA
ACTGAACATACAGAGCAGAAAAGGAATGTGATCAGAATCATCCCCCACCATAACTACAATGCTGCTATCAACAAGTAT
AATCATGACATTGCCCTGCTGGAACTGGATGAGCCTCTGGTGCTGAACAGCTATGTCACCCCAATCTGCATTGCTGAC
AAGGAGTATACCAATATCTTCCTGAAATTTGGGTCTGGATATGTGTCTGGGTGGGGAAGGGTCTTCCACAAGGGAAGG
TCTGCTCTGGTGCTGCAGTATCTGAGGGTGCCCCTGGTGGACAGAGCTACCTGCCTGCTGAGCACCAAGTTCACCATC
TACAACAATATGTTCTGTGCTGGATTTCATGAGGGAGGGAGGGACTCCTGTCAGGGAGATTCTGGAGGCCCTCATGTG
ACAGAGGTGGAAGGCACCAGCTTCCTGACTGGCATCATCTCTTGGGGGGAGGAATGTGCTATGAAGGGGAAATATGGA
ATCTATACCAAGGTGTCCAGATATGTCAACTGGATCAAGGAGAAAACCAAGCTGACCTGA
Además, se optimizó una secuencia de fIX con mutaciones Padua/Malmo y sin CpG de acuerdo con la tabla patrón de optimización de codones humanos (véase la FIG. 2B).
FIX optimizado con codones humanos con mutaciones Padua/Malmo y sin CpG (SEQ ID NO: 127)
ATGCAGAGGGTGAATATGATTATGGCTGAGTCCCCTGGGCTGATTACCATTTGCCTGCTGGGATACCTGCTGTCTGCT GAGTGTACAGTGTTCCTGGACCATGAGAATGCAAATAAGATCCTGAACAGGCCCAAAAGATATAATAGTGGAAAGCTG GAGGAATTTGTGCAGGGCAACCTGGAGAGAGAATGCATGGAGGAAAAGTGTAGCTTTGAGGAAGCCAGGGAGGTGTTT GAAAATACAGAGAGAACCACAGAATTCTGGAAGCAGTATGTGGATGGAGATCAGTGTGAGAGCAACCCCTGTCTGAAT GGAGGGAGTTGCAAAGATGATATCAACTCATATGAATGCTGGTGTCCTTTTGGATTTGAAGGCAAAAATTGTGAGCTG GATGTGACCTGTAACATTAAGAATGGGAGGTGTGAGCAGTTTTGTAAAAACTCTGCTGATAATAAGGTGGTCTGCAGT TGTACAGAAGGGTATAGACTGGCTGAGAACCAGAAGTCCTGTGAACCAGCTGTGCCCTTCCCTTGTGGAAGGGTGTCT GTCTCCCAGACTTCAAAACTGACCAGAGCTGAGACTGTGTTTCCTGATGTGGATTATGTCAACAGCACAGAGGCTGAA ACTATCCTGGACAACATTACTCAGTCTACCCAGAGTTTCAATGACTTTACCAGAGTGGTGGGAGGAGAGGATGCTAAA CCAGGCCAGTTCCCCTGGCAGGTGGTCCTGAATGGGAAGGTGGATGCATTTTGTGGGGGATCTATTGTGAATGAGAAA TGGATTGTCACAGCTGCTCACTGTGTGGAAACTGGGGTCAAGATCACAGTGGTGGCTGGAGAGCACAACATTGAGGAA ACAGAACATAC TGAGCAGAAGAGGAATGTGATCAGAATCAT TCCTCACCATAACTACAATGCAGCCATCAACAAATAT AATCATGACATTGCCCTGCTGGAACTGGATGAGCCTCTGGTGCTGAACAGCTATGTCACACCAATCTGCATTGCTGAC AAGGAGTACACTAACATCTTCCTGAAGTTTGGGTCAGGATATGTGTCTGGATGGGGAAGAGTCTTCCACAAGGGCAGG TCTGCACTGGTGCTGCAGTATCTGAGAGTGCCTCTGGTGGATAGGGCCACTTGTCTGCTGTCTACCAAGTTCACCATC TACAACAATATGTTCTGTGCTGGATTTCATGAGGGAGGGAGAGACTCCTGTCAGGGAGATTCTGGAGGCCCACATGTG ACAGAGGTGGAAGGC ACCAGCTTCCTGACAGGCATCATTTCC TGGGGGGAGGAATGTGCAATGAAGGGGAAATAT GGA ATCTACACCAAAGTGAGCAGGTATGTGAACTGGATCAAGGAAAAGACCAAACTGACATGA
La expresión in vitro de la secuencia de fIX optimizada para el hígado (SEQ ID NO: 10) y la secuencia de fIX optimizada para humanos (SEQ ID NO: 127) se evaluó en células HepG2 transfectadas de forma transitoria con los correspondientes plásmidos de expresión de fVIII (FIG. 7). La optimización específica del tejido conduce a una mayor actividad de fIX en las células HepG2 (hepáticas) que expresan el fIX optimizado para el hígado en comparación con el fIX optimizado para humanos. Estos resultados muestran que la optimización para hígado beneficia específicamente la expresión en células derivadas de hepatocitos.
Ejemplo 2
Desarrollo de Promotores
Este ejemplo describe el desarrollo iterativo de secuencias promotoras optimizadas para la expresión de proteínas en el tejido y las células del hígado.
Los promotores se sintetizaron de novo y se clonaron en un plásmido de expresión que conduce la expresión del fVIII de coagulación. La actividad de FVIII se midió 48 horas después de la transfección mediante un ensayo de coágulo de una etapa. Como comparador, se utilizó el promotor híbrido de hígado (HLP). HLP representa uno de los promotores dirigidos al hígado más cortos pero más potentes descritos hasta la fecha. El promotor HLP y su uso se describen en McIntosh et al., "Therapeutic levels of FVIII following a single peripheral vein administration of rAAV vector encoding a novel human fVIII variant", Blood, 25;121(17):3335-44, 2013. La secuencia de HLP se proporciona como la SEQ ID NO: 128:
TGTTTGCTGCTTGCAATGTTTGCCCATTTTAGGGTGGACACAGGACGCTGTGGTTTCTGAGCCAGGGGGCGACTCAGA
TCCCAGCCAGTGGACTTAGCCCCTGTTTGCTCCTCCGATAACTGGGGTGACCTTGGTTAATATTCACCAGCAGCCTCC
CCCGTTGCCCCTCTGGATCCACTGCTTAAATACGGACGAGGACAGGGCCCTGTCTCCTCAGCTTCAGGCACCACCACT
GACCTGGGACAGTGAATC
Diseño In ic ia l de Promotores (Promotores de f Generación)
Para comenzar la construcción de promotores sintéticos dirigidos al hígado, se seleccionaron dos promotores mínimos dirigidos al hígado que fueron plataformas diseñadas para modificaciones adicionales. Estos dos promotores se designan "ABP-SynO" (SEQ ID No : 131) y "ABP-HPl-God". Estos promotores son fusiones novedosas de elementos de control regulador previamente descritos. ABP "es una región agrupada de sitios de unión a factores de transcripción, " HP1 "es un sitio de unión a factores de transcripción específico, "God" es una región similar a un potenciador que funciona en proximidad directa al sitio de inicio de la transcripción, y "SynO "es un promotor mínimo que contiene el sitio de unión al factor de transcripción HP1 y una caja TATA. Para todas las construcciones, donde no se proporciona dentro del contexto natural, se agregó o se completó una secuencia TATA (TATAAA) inmediatamente 3' de la región promotora.
El promotor inicial diseñado se basó en el elemento "ABP", que se describe, por ejemplo, en Rouet et al., "A potent enhancer made of clustered liver-specific elements in the transcription control sequences of human alpha 1-microglobulin/bikunin gene", J Biol Chem., 267(29):20765-73, 1992. ABP comprende la secuencia de nucleótidos establecida como elemento ABP (SEQ ID NO: 113):
GTTAATTTTTAAAAAGCAGTCAAAAGTCCAAGTGGCCCTTGCGAGCATTTACTCTCTCTGTTTGCTCTGGTTAATAAT
CTCAGGAGCACAAACA
Como se ilustra en la Figura 8, ABP comprende los siguientes sitios de unión al TF: TF HNF-1-1 (nucleótidos 16-23 de la SEQ ID NO: 4), HNF-4 (nucleótidos 26-36 de la SEQ ID NO: 4), HNF-3a (nucleótidos 39-45 de la SEQ ID NO: 4), HNF1-2 (nucleótidos 48-62 de la SEQ ID NO: 4) y HNF-3-2 TF (nucleótidos 65-71 de la SEQ ID NO: 4).
Varios de los promotores divulgados incluyen un sitio de unión al TF HP1 (GTTAATAATTTTC, nucleótidos 75-87 de la SEQ ID NO: 4). El elemento HP1 se describe, por ejemplo, en Schorpp et al., "Hepatocyte-specific promoter element HP1 of the Xenopus albumin gene interacts with transcriptional factors of mammalian hepatocytes", J Mol Biol., 202(2):307-20, 1988. El sitio de unión al TF HP1 está incluido en el elemento SynO (incluido en varios de los promotores divulgados), que también incluye una caja TATA. La secuencia del elemento SynO se proporciona como elemento SynO GAGGTTAATAATTTTCCAGATCTCTCTGAGCAATAGTATAAAA (SEQ ID NO: 114)
El elemento SynO se describe, por ejemplo, en Ryffel et al., "Liver cell specific gene transcription in vitro: the promoter elements HP1 and TATA box are necessary and sufficient to generate a liver-specific promoter". Nucleic Acids Res., 17(3): 939-953, 1989.
Varios de los promotores divulgados incluyen un "God" que comprende la secuencia establecida como: elemento God AGTCATATGTTTGCTCACTGAAGGTTACTAGTTAACAGGCATCCCTTAAACAGGA (SEQ ID NO: 115)
El elemento God se describe, por ejemplo, en Godbout et al., "Multiple regulatory elements in the intergenic region between the alpha-fetoprotein and albumin genes", Mol Cell Biol., 6(2):477-87, 1986.
Los elementos ABP, SynO y God se combinaron para formar dos nuevos promotores, "ABP-SynO" y "ABP-HP1-God" como sigue (véase la FIG. 8):
prom otor ABP-SynO (SEQ ID NO: 131)
GTTAATTTTTAAAAAGCAGTCAAAAGTCCAAGTGGCCCTTGCGAGCATTTACTCTCTCTGTTTGCTCTGGTTAATAAT CTCAGGAGCACAAACAGAGGTTAATAATTTTCCAGATCTCTCTGAGCAATAGTATAAAA
prom otor ABP-Hp1-God (SEQ ID NO: 6)
GTTAATTTTTAAAAAGCAGTCAAAAGTCCAAGTGGCCCTTGCGAGCATTTACTCTCTCTGTTTGCTCTGGTTAATAAT
CTCAGGAGCACAAACAGAGGTTAATAATTTTCAGTCATATGTTTGCTCACTGAAGGTTACTAGTTAACAGGCATCCCT
TAAACAGGATATAAAA
La expresión in vitro de FVIII se ensayó en células HepG2 transfectadas transitoriamente con plásmidos de expresión de FVIII impulsados por el promotor ABP-SynO o ABP-Hp1-God (FIG. 9A). Adicionalmente, la actividad in vivo de fVIII en ratones se ensayó mediante plásmido desnudo hidrodinámicamente suministrado que expresaba FVIII impulsado por el promotor ABP-SynO o ABP-Hp1-God (FIG. 9B). A partir de los resultados, se muestra que los promotores tanto ABP-Syno como ABP-Hp1-God impulsan la expresión de fVIII in vitro e in vivo. Sin embargo, estos diseños iniciales no impulsan la expresión de fVIII de manera tan fuerte como el promotor HLP in vitro, y que la expresión in vivo disminuye rápidamente en relación con HLP.
Optimización In ic ia l (Promotores de 2a Generación)
Para aumentar la fuerza transcripcional de los promotores ABP-SynO y ABP-Hp1-God, se siguieron múltiples estrategias para la optimización. Esto incluye alterar los sitios de unión a factores de transcripción para reflejar la secuencia de unión consenso, eliminar el espacio intermedio entre los sitios de unión a factores de transcripción, agregar sitios de unión del factor de transcripción adicionales, añadir un motivo del sitio de inicio de la transcripción e incluir el intrón de SV40.
Se generó una variante de ABP que contiene sitios de unión a TF consenso, como sigue:
ABP-exact (sitios de unión a factores de transcripción consenso) (SEQ ID NO: 116)
GTTAATCATTAACTTAAAAAGCAGTCAAAAGTCCAAAGGTCAAAGGTCAGAGCATTTACTCTCTCCAATGTTGACTCT
CGTTAATGATTAAGGAGCAATTGTTGACTT
Como se ilustra en la Figura 8, ABP-exact comprende los siguientes sitios de unión a TF consenso: HNF-1-1 consenso, HNF-4 consenso, HNF-3a consenso, HNF1-2 consenso y HNF-3-2 consenso. Se generó una versión condensada de Apb-exact que incluye los mismos sitios de unión a TF consenso, pero una secuencia general más corta, denominada Short-ABP-exact, cuya secuencia se establece como:
Short-ABP-exact (SEQ ID NO: 117) GTTAATCATTAACTTAGGTCAAAGGTCAGACAATGTTGACTCTCGTTAAT-GATTAACCGGAATTGTTGACTT
Las siguientes características se incluyeron adicionalmente en algunos de los promotores divulgados: Un sitio de inicio de la transcripción (TSS), que contiene un 23 que contiene un espaciador rico en GC y se colocó inmediatamente después de una caja TATA en el promotor para un espaciado óptimo con el motivo de inicio de la transcripción inmediatamente después del espaciador (véase FIG. 10). La secuencia de TSS ensayada incluye la secuencia establecida como: GCCAGCAGCAGCCTGACCACATCTCATCCTC (nucleótidos 116-146 de la SEQ ID NO: 4) Un sitio de unión al factor de transcripción HNF1a. HNF1a es un factor de transcripción dirigido al hígado: GTTAATCATTAA (nucleótidos 1-12 de la SEQ ID NO: 4)
Un sitio de unión al factor de transcripción Sp1. Sp1 es un factor de transcripción dirigido al hígado: TGGGCGGAGT (nucleótidos 1-10 de la SEQ ID NO: 121)
Una secuencia de intrón SV40 establecida como: CTCTAAGGTAAATATAAAATTTTTAAGTGTATAATGTGTTAAACTACTGATTCTAATTGTTTGTGTATTTTAGATTCC AACCTATGGAACTGA (nucleótidos 163-225 de la SEQ ID NO:112)
Estos elementos se combinaron para formar varios promotores nuevos, como sigue (véase la FIG. 11):
ABP-exact-SynO (SEQ ID NO: 118)
GTTAATCATTAACTTAAAAAGCAGTCAAAAGTCCAAAGGTCAAAGGTCAGAGCATTTACTCTCTCCAATGTTGACTCT
CGTTAATGATTAAGGAGCAATTGTTGACTTGAGGTTAATAATTTTCCAGATCTCTCTGAGCAATAGTATAAAA
ShortABP-exact-SynO (SEQ ID NO: 119)
GTTAATCATTAACTTAGGTCAAAGGTCAGACAATGTTGACTCTCGTTAATGATTAACCGGAATTGTTGACTTGAGGTT
AATAATTTTCCAGATCTCTCTGAGCAATAGTATAAAA
ABP-HP1-God-TSS (SEQ ID NO: 7)
GTTAATTTTTAAAAAGCAGTCAAAAGTCCAAGTGGCCCTTGCGAGCATTTACTCTCTCTGTTTGCTCTGGTTAATAAT
CTCAGGAGCACAAACAGAGGTTAATAATTTTCAGTCATATGTTTGCTCACTGAAGGTTACTAGTTAACAGGCATCCCT
TAAACAGGATATAAAAGGCCAGCAGCAGCCTGACCACATCTCATCCTC
HNF1a-ABP-SynO (SEQ ID NO: 120)
GTTAATCATTAAGTCGTTAATTTTTAAAAAGCAGTCAAAAGTCCAAGTGGCCCTTGCGAGCATTTACTCTCTCTGTTT
GCTCTGGTTAATAATCTCAGGAGCACAAACAGAGGTTAATAATTTTCCAGATCTCTCTGAGCAATAGTATAAAA
Sp1-ABP-SynO (SEQ ID NO: 121)
TGGGCGGAGTGTCGTTAATTTTTAAAAAGCAGTCAAAAGTCCAAGTGGCCCTTGCGAGCATTTACTCTCTCTGTTTGC
TCTGGTTAATAATCTCAGGAGCACAAACAGAGGTTAATAATTTTCCAGATCTCTCTGAGCAATAGTATAAAA
HNF1-ShortABPExact-SynO-TSS-Int (SEQ ID NO: 112)
GTTAATCATTAAGTCGTTAATCATTAACTTAGGTCAAAGGTCAGACAATGTTGACTCTCGTTAATGATTAACCGGAAT
TGTTGACTTGAGGTTAATAATTTTCCAGATCTCTCTGAGCAATAGTATAAAAGGCCAGCAGCAGCCTGACCACATCTC
ATCCTCCTCTAAGGTAAATATAAAATTTTTAAGTGTATAATGTGTTAAACTACTGATTCTAATTGTTTGTGTATTTTA
GATTCCAACCTATGGAACTGA
Los promotores se sintetizaron de novo y se clonaron en un plásmido de expresión que conduce la expresión del fVIII de coagulación. La actividad de FVIII se midió 48 horas después de la transfección mediante un ensayo de coágulo de una etapa. Como comparador, el promotor de hígado híbrido (HLP) se utiliza en este y otros experimentos.
La expresión in vitro de FVIII se ensayó en células HepG2 transfectadas transitoriamente con plásmidos de expresión de FVIII impulsados por el respectivo promotor (FIG. 12A). Adicionalmente, la actividad in vivo de fVIII en ratones se ensayó mediante plásmido desnudo hidrodinámicamente suministrado que expresaba FVIII impulsado por el respectivo promotor (FIG. 12B). A partir de estos datos, se muestra que la adición del motivo de sitio de inicio de la transcripción sintético, nuevo mejora sustancialmente la expresión. Adicionalmente, la adición de sitios de unión a factores de transcripción fuera de su contexto genómico natural tuvo impactos inesperados e impredecibles en la expresión. Cuando se añaden directamente proximal al elemento potenciador ABP, los sitios de unión al factor de transcripción HNF1 y Sp1 anulan completamente la expresión. Cuando se añadió el sitio de unión al factor de transcripción HNF1 directamente proximal al potenciador shortABPExact, la expresión fue fuerte. Este hallazgo ilustra que las complejas interacciones espacio temporales de los factores de transcripción, ya sea en su contexto genómico natural o no natural, es difícil de modelar o predecir. Además, la alteración de los sitios de unión a factores de transcripción en las secuencias de unión consenso anuló la expresión génica. Sin embargo, la adición del sitio de unión al factor de transcripción HNF1, el sitio de inicio de la transcripción y el intrón SV40 fue suficiente para rescatar la expresión del diseño del promotor shortABPExact-SynO complementado con HNF1. Como se ilustra en la FIG. 12B, ABP-Hp1-God-TSS y HNF1-shortABPExact-SynO-TSS-Int, mantuvieron ambos una expresión más alta que el promotor HLP durante el transcurso del experimento, lo que demuestra que la adición del sitio de inicio de la transcripción, el sitio de unión al factor de transcripción HNF1, el ajuste de la secuencia ABP a la secuencia consenso y la eliminación del ADN intermedio entre los sitios de unión al factor de transcripción, y/o la adición del intrón SV40 podría mejorar la durabilidad y la fuerza de expresión in vivo.
Optimización Adicional (Promotores de 3a Generación)
Si bien el diseño del promotor ABP-Hpl-God-TSS probado excedió con creces la fuerza del promotor HLP, su tamaño (204 pares de bases) permaneció incompatible con algunos empaquetamientos completos de vectores AAV, tal como los que contienen transgenes de fVIII de longitud completa. La reducción adicional en el tamaño del promotor se dirigió por la selección de los elementos más prometedores probados y descritos anteriormente, así como un elemento nuevo, shortABP, que es el potenciador ABP donde se conservan las secuencias de los sitios de unión a factores de transcripción genómico natural, pero se han truncado las secuencias intermedias entre ellos.
shortABP (nucleótidos 16-71 de la SEQ ID NO: 4): GTTAATTTTTGTGGCCCTTGCGATGTTTGCTCTGGT-TAATAATCTCAGGACAAACA
Como se ilustra en la Figura 13, shortABP contiene los siguientes sitios de unión a TF: TF HNF-1-1 (nucleótidos 16­ 23 de la SEQ ID NO: 4), HNF-4 (nucleótidos 26-36 de la SEQ ID NO: 4), HNF-3a (nucleótidos 39-45 de la SEQ ID NO: 4), HNF1-2 (nucleótidos 48-62 de la SEQ ID NO: 4) y HNF-3-2 TF (nucleótidos 65-71 de la SEQ ID NO: 4).
Como se ilustra en la Figura 13, el sitio de unión al TF HNF1, el elemento SynO (que contiene un sitio de unión al TF HP1 y una caja TATA), y un sitio de inicio de la transcripción se unieron a shortABP para formar el HNF1-shortABP-SynO-TSS (designado el Paquete Combinatorio Hepático, o HCB), como sigue:
HNF1-shortABP-SynO-TSS (también denominado Paquete Combinatorio Hepático, o HCB) (SEQ ID NO: 4)
GTTAATCATTAAGTCGTTAATTTTTGTGGCCCTTGCGATGTTTGCTCTGGTTAATAATCTCAGGACAAACAGAGGTTA
ATAATTTTCCAGATCTCTCTGAGCAATAGTATAAAAGGCCAGCAGCAGCCTGACCACATCTCATCCTC
Como se ilustra en la Figura 13, se unieron el sitio de unión al TF HNF1, el elemento God, una caja TATA y un sitio de inicio de la transcripción a shortABP para formar shortABP-HP1-God-TSS, como sigue:
shortABP-HP1-God-TSS (SEQ ID NO: 5)
GTTAATTTTTGTGGCCCTTGCGATGTTTGCTCTGGTTAATAATCTCAGGACAAACATACATTTTCAGTCATATGTTTG
CTCACTGAAGGTTACTAGTTAACAGGCATCCCTTAAACAGGATATAAAAGGCCAGCAGCAGCCTGACCACATCTCATC
CTC
Los promotores se sintetizaron de novo y se clonaron en un plásmido de expresión que conduce la expresión del fVIII de coagulación. La actividad de FVIII se midió 48 horas después de la transfección mediante un ensayo de coágulo de una etapa. La expresión in v ito de FVIII se ensayó en células HepG2 transfectadas transitoriamente con plásmidos de expresión de FVIII impulsados por el respectivo promotor mostrado en la FIG. 14A. Adicionalmente, la actividad in vivo de fVIII en ratones se ensayó mediante plásmido desnudo hidrodinámicamente suministrado que expresaba FVIII impulsado por el respectivo promotor (FIG. 14). A partir de estos datos, se muestra que el promotor HNF1-shortABP-SynO-TSS (HCB) promueve una mayor expresión de fVIII en comparación con la de HLP tanto in vivo como in vitro, mientras mantiene una expresión duradera 4-14 veces mayor que la de HLP in vivo, a pesar de que el HNF1-shortABP-SynO-TSS es un 42 % más pequeño que HLP.
Optimización Complementaria (Promotores de 4a Generación)
Recientemente se construyó un potente potenciador dirigido al hígado, designado el módulo regulador específico de hepatocitos informático (HSCRM8 o "HS") combinando las secuencias de varias especies en un nuevo potenciador construido por ordenador (Véase, por ejemplo, Nair et al., "Computationally designed liver-specific transcriptional modules and hyperactive fIX improve hepatic gene therapy", Blood, 23(20): 3195-3199, 2014). La secuencia del potenciador HS y los sitios de unión a los factores de transcripción correspondientes se proporcionan como sigue: HS (secuencia potenciadora no humana HSCRM8) (SEQ ID NO: 101) GGGGAGGCTGCTGGTGAATATTAACCAAGGTCACCCCAGTTATCGGAGGAGCAAACAGGGACTAAGTCCAC
El elemento de respuesta HS incluye los siguientes sitios de unión a TF:
MYOD GGCTGCTGGTGAATATT, nucleótidos 5-22 de la SEQ ID NO: 101
CEBP GCTGCTGGTGAA, nucleótidos 7-18 de la SEQ ID NO: 101
Nhf1 GCTGGTGAATATTAACCA, nucleótidos 10-27 de la SEQ ID NO: 101
Lef1/TCF1 TTAACCAAGGT, nucleótidos 21-31 de la SEQ ID NO: 101
CEBP CGGAGGAGCAAA, nucleótidos 44-55 de la SEQ ID NO: 101
Forkhead GGAGCAAACAGGG, nucleótidos 48-60 de la SEQ ID NO: 101
Lef1/TCF1 AGGGACTAAG, nucleótidos 57-66 de la SEQ ID NO: 101
El genoma humano se examinó para determinar las secuencias humanas correspondientes a las del elemento HS y se modificó el elemento HS para contener solo secuencias humanas para generar una secuencia potenciadora completamente humana denominada "HSh". La secuencia del potenciador HSh y los sitios de unión a factores de transcripción correspondientes se proporcionan como sigue (véase también la FIG. 15):
HSh (secuencia genómica humana) (SEQ ID NO: 111) GGGGAGGCTGCTGGTGAATATTAACCAAGGTCACCCCAGT- TATCGGAGGAGCAAACAGGGGCTAAGTCCAC
El elemento de respuesta HSh incluye los siguientes sitios de unión a TF:
MYOD GGCTGCTGGTGAATATT, nucleótidos 5-22 de la SEQ ID NO: 101
CEBP GCTGCTGGTGAA, nucleótidos 7-18 de la SEQ ID NO: 101
Nhf1 GCTGGT GAATATTAACCA, nucleótidos 10-27 de la SEQ ID NO: 101
(continuación)
Lef1/TCF1 TTAACCAAGGT, nucleótidos 21-31 de la SEQ ID NO: 101
CEBP CGGAGGAGCAAA, nucleótidos 44-55 de la SEQ ID NO: 101
Forkhead GGAGCAAACAGGG, nucleótidos 48-60 de la SEQ ID NO: 101
Lef1/TCF1 AGGGGCTAAG, nucleótidos 57-66 de la SEQ ID NO: 111
También se utilizaron partes del potenciador HSh, como sigue:
5'HSh (porción 5' de HSCRM8h) (nucleótidos 6-32 de la SEQ ID NO: 111) GGCTGCTGGTGAATATTAACCAAGGTC
El elemento de respuesta 5'HSh incluye los siguientes sitios de unión a TF:
MYOD GGCTGCTGGTGAATATT, nucleótidos 5-22 de la SEQ ID NO: 101
CEBP GCTGCTGGTGAA, nucleótidos 7-18 de la SEQ ID NO: 101
Nhf1 GCTGGTGAATATTAACCA, nucleótidos 10-27 de la SEQ ID NO: 101
Lef1/TCF1 TTAACCAAGGT, nucleótidos 21-31 de la SEQ ID NO: 101
3'HSh (porción 3' de HSCRM8h) (nucleótidos 44-68 de la SEQ ID NO: 111) CGGAGGAGCAAACAG- GGGCTAAGTC
El elemento de respuesta 3'HSh incluye los siguientes sitios de unión a TF:
CEBP CGGAGGAGCAAA, nucleótidos 44-55 de la SEQ ID NO: 101
Forkhead GGAGCAAACAGGG, nucleótidos 48-60 de la SEQ ID NO: 101
Lef1/TCF1 AGGGGCTAAG nucleótidos 57-66 de la SEQ ID NO:
111
sHS (short HS, se ha eliminado el espacio intermedio entre los grupos 5' y 3' de los sitios de unión a factores de transcripción) (nucleótidos 1-54 de la SEQ ID NO: 106) GGCTGCTGGT GAATATTAACCAAGGTCATCGGAGGAG-CAAACAGGGACTAAGTC
El elemento de respuesta sHS incluye los siguientes sitios de unión a TF:
MYOD GGCTGCTGGTGAATATT, nucleótidos 5-22 de la SEQ ID NO: 101
CEBP GCTGCTGGTGAA, nucleótidos 7-18 de la SEQ ID NO: 101
Nhf1 GCTGGT GAATATTAACCA, nucleótidos 10-27 de la SEQ ID NO: 101 Lef1/TCF1 TTAACCAAGGT, nucleótidos 21-31 de la SEQ ID NO: 101
CEBP CGGAGGAGCAAA, nucleótidos 44-55 de la SEQ ID NO: 101
Forkhead GGAGCAAACAGGG, nucleótidos 48-60 de la SEQ ID NO: 101
Lef1/TCF1 AGGGACTAAG, nucleótidos 57-66 de la SEQ ID NO: 111
Adicionalmente, se construyó una forma modificada del promotor shortABP, denominada "supershortABP'', eliminando adicionalmente los nucleótidos y reorganizando los sitios de unión a TF. La secuencia del elemento de respuesta supershortABP y los sitios de unión a factores de transcripción correspondientes se proporcionan como sigue: Super short ABP (elemento más corto basado en A b P) (SEQ ID NO: 122) CCCTTGCTGGTTAATAATCTCAGT-TAATTTGTTTGCACAAACA
El elemento de respuesta supershortABP incluye los siguientes sitios de unión a TF:
HNF4 CCCTTGC, nucleótidos 1-7 de la SEQ ID NO: 122
TGGTTAATAATCTCA, nucleótidos 8-22 de la SEQ ID NO:
HNF1b 122
HNF1 GTTAATT, nucleótidos 23-29 de la SEQ ID NO: 122
HNF3 TGTTTGC, nucleótidos 30-36 de la SEQ ID NO: 122
HNF3b ACAAACA, nucleótidos 37-43 de la SEQ ID NO: 122
Como se ilustra en la Figura 16, los elementos anteriores se combinaron para formar varios promotores nuevos, como sigue (véase la FIG. 11):
Agro (SEQ ID NO: 107)
GGCTGCTGGTGAATATTAACCAAGGTCCCCTTGCTGGTTAATAATCTCAGTTAATTTGTTTGCACAAACACGGAGGAG CAAACAGGGGAGGTTAATAATTTTCTATAAAAGGCCAGCAGCAGCCTGACCACATCTCATCCTC
La secuencia Agro incluye 5'HS (nucleótidos 1-27 de la SEQ ID NO: 107), Super short ABP (nucleótidos 28-70 de la SEQ ID NO: 107), 3'HSh (nucleótidos 71-87 de la SEQ ID NO: 107), SynO (nucleótidos 88-110 de la SEQ ID NO: 107), y TSS (nucleótidos 111-142 de la SEQ ID NO: 107)
HSh-HCB (SEQ ID NO: 102)
GGGGAGGCTGCTGGTGAATATTAACCAAGGTCACCCCAGTTATCGGAGGAGCAAACAGGGGCTAAGTCCACTAGGTTA ATCATTAAGTCGTTAATTTTTGTGGCCCTTGCGATGTTTGCTCTGGTTAATAATCTCAGGACAAACAGAGGTTAATAA TTTTCCAGATCTCTCTGAGCAATAGTATAAAAGGCCAGCAGCAGCCTGACCACATCTCATCCTC
5'HSh-HCB (SEQ ID NO: 104)
GGCTGCTGGTGAATATTAACCAAGGTCGTTAATCATTAAGTCGTTAATTTTTGTGGCCCTTGCGATGTTTGCTCTGGT
TAATAATCTCAGGACAAACAGAGGTTAATAATTTTCCAGATCTCTCTGAGCAATAGTATAAAAGGCCAGCAGCAGCCT
GACCACATCTCATCCTC
3'HSh-HCB (SEQ ID NO: 103)
CGGAGGAGCAAACAGGGGCTAAGTCGTTAATCATTAAGTCGTTAATTTTTGTGGCCCTTGCGATGTTTGCTCTGGTTA
ATAATCTCAGGACAAACAGAGGTTAATAATTTTCCAGATCTCTCTGAGCAATAGTATAAAAGGCCAGCAGCAGCCTGA
CCACATCTCATCCTC
HSh-SynO-TSS (SEQ ID NO: 105)
GGGGAGGCTGCTGGTGAATATTAACCAAGGTCACCCCAGTTATCGGAGGAGCAAACAGGGGCTAAGTCCACGAGGTTA
ATAATTTTCCAGATCTCTCTGAGCAATAGTATAAAAGGCCAGCAGCAGCCTGACCACATCTCATCCTC
HS-SynO-TSS (SEQ ID NO: 108)
GGGGAGGCTGCTGGTGAATATTAACCAAGGTCACCCCAGTTATCGGAGGAGCAAACAGGGACTAAGTCCACGAGGTTA
ATAATTTTCCAGATCTCTCTGAGCAATAGTATAAAAGGCCAGCAGCAGCCTGACCACATCTCATCCTC
sHS-SynO-TSS (SEQ ID NO: 106)
GGCTGCTGGTGAATATTAACCAAGGTCATCGGAGGAGCAAACAGGGACTAAGTCGAGGTTAATAATTTTCCAGATCTC
TCTGAGCAATAGTATAAAAGGCCAGCAGCAGCCTGACCACATCTCATCCTC
Los promotores se sintetizaron de novo y se clonaron en un plásmido de expresión que conduce la expresión del fVIII de coagulación. La actividad de FVIII se midió 48 horas después de la transfección mediante un ensayo de coágulo de una etapa. La expresión in vitro de FVIII se ensayó en células HepG2 transfectadas transitoriamente con plásmidos de expresión de FVIII impulsados por el respectivo promotor mostrado en la FIG. 17. Estos resultados demuestran que la fuerza in vivo del promotor HCB puede aumentarse mediante la adición de unas secuencias potenciadoras complementarias. El mayor beneficio se observó cuando se añadió el potenciador HSh humano completo al extremo 5' del promotor HCB. Complementar solo las porciones de 5 'o 3' del HSh atenuó la expresión mejorada ligeramente en comparación con el módulo HSh completo. Adicionalmente, cuando se eliminó el potenciador shortABP del diseño de HCB y se reemplazó con potenciadores bien HSh o HS, la expresión de fVIII disminuyó ligeramente de los niveles observados en el promotor HSh-HCB, que contiene el potenciador shortABP. Sin embargo, cuando el plásmido sHS-SynO se administró hidrodinámicamente a ratones, no se observó expresión, lo que demuestra que el módulo potenciador shortABP puede ser un potenciador más adecuado para una expresión in vivo duradera.
Ejemplo 3
Vector AVV Recombinante para la Expresión de fVIII
Este ejemplo ilustra vectores AAV recombinantes ejemplares que codifican una variante de fVIII que comprende un genoma dimensionado para una expresión óptima de proteínas basada en vectores AAV (es decir, un genoma de 5 kb o menos pb).
La FIG. 4 representa vectores basados en AAV para la expresión de variantes de fVIII que carecen del dominio B. Sin embargo, las construcciones mostradas en la FIG. 4 están por encima del límite de 5,0 kb para la expresión óptima de proteínas de un vector AAV. La eliminación del ADN genómico vírico no esencial y los restos de clonación, y la sustitución con secuencias promotoras más cortas (como el promotor HCB (SEQ ID NO: 4, 146 pb), permitieron el desarrollo de un genoma de fVIII-AAV de alta expresión de aproximadamente 4,9 kb de longitud.
En la FIG. 18 se representa un vector AAV ejemplar con dicho genoma. Esta figura ilustra un vector AAV que incluye ITR 5' y 3', el promotor HCB (SEQ ID NO: 4), una molécula de ácido nucleico que codifica una proteína fVIII variante que carece del dominio B (tal como cualquiera de las secuencias ET3 o HSQ con CpG eliminados y codones de hígado optimizados proporcionadas en el presente documento) y una secuencia de poli A sintética.
Una secuencia ejemplar de un casete AAV como se muestra en la FIG. 18 se proporciona como la SEQ ID NO: 129, que tiene la siguiente estructura:
(5'AAV2 ITR) - RE -(promotor HCB) - Kozak -(región codificante HSQ) - RE -(señal de poliadenilación) - RE -(3'ITR de AAV2)
Los elementos del casete AAV de la SEQ ID NO: 129 son los siguientes:
Figure imgf000053_0001
Los sitios de restricción pueden eliminarse opcionalmente del casete para proporcionar un genoma de AAV recombinante acortado. Adicionalmente, el transgén se puede sustituir según sea necesario. La eliminación de los elementos de los sitios de restricción generaría un vector de 4885 pares de bases (ET3) o 4855 (HSQ).
SEQ ID NO: 129:
CCTGCAGGCAGCTGCGCGCTCGCTCGCTCACTGAGGCCGCCCGGGCAAAGCCCGGGCGTCGGGCGACCTTTGGTCGCC
CGGCCTCAGTGAGCGAGCGAGCGCGCAGAGAGGGAGTGGCCAACTCCATCACTAGGGGTTCCTACCGGTGTTAATCAT
TAAGTCGTTAATTTTTGTGGCCCTTGCGATGTTTGCTCTGGTTAATAATCTCAGGACAAACAGAGGTTAATAATTTTC
CAGATCTCTCTGAGCAATAGTATAAAAGGCCAGCAGCAGCCTGACCACATCTCATCCTCGTCGAGCCACCATGCAGAT
CGAACTGTCTACCTGTTTCTTTCTGTGCCTGCTGCGGTTTTGTTTTTCCGCTACCAGAAGATACTACCTGGGAGCCGT
CGAACTGAGCTGGGATTACATGCAGTCTGACCTGGGAGAGCTGCCCGTGGACGCTAGATTCCCACCTAGAGTCCCTAA
GTCCTTCCCCTTCAACACCAGCGTGGTCTACAAGAAAACCCTGTTCGTGGAGTTTACCGACCACCTGTTCAACATCGC
TAAGCCTAGACCACCATGGATGGGACTGCTGGGACCAACCATCCAGGCCGAGGTGTACGACACCGTGGTCATCACCCT
GAAAAACATGGCTTCTCACCCCGTGTCCCTGCATGCTGTGGGCGTCTCCTACTGGAAGGCCAGCGAAGGGGCTGAGTA TGACGATCAGACCAGCCAGCGGGAAAAAGAGGACGATAAGGTGTTCCCTGGCGGGTCCCATACCTACGTGTGGCAGGT CCTGAAGGAGAATGGACCAATGGCTTCCGACCCTCTGTGCCTGACCTACTCTTATCTGTCCCACGTGGACCTGGTCAA GGATCTGAACAGCGGCCTGATCGGGGCTCTGCTGGTGTGTCGCGAAGGGTCCCTGGCCAAGGAGAAAACCCAGACCCT GCATAAGTTCATCCTGCTGTTCGCCGTGTTTGACGAAGGAAAAAGCTGGCACTCTGAGACCAAGAACTCTCTGATGCA GGACAGGGATGCCGCTTCCGCCAGAGCTTGGCCCAAGATGCACACCGTGAACGGCTACGTCAATAGGAGCCTGCCTGG ACTGATCGGCTGCCACAGAAAGTCCGTGTATTGGCATGTCATCGGAATGGGCACCACCCCTGAAGTGCACAGCATCTT CCTGGAGGGGCATACCTTTCTGGTCCGCAACCACCGGCAGGCTAGCCTGGAGATCTCTCCAATCACCTTCCTGACCGC CCAGACCCTGCTGATGGACCTGGGACAGTTCCTGCTGTTTTGCCACATCTCCAGCCACCAGCATGATGGCATGGAGGC TTACGTGAAAGTCGACTCCTGTCCCGAGGAACCTCAGCTGAGGATGAAGAACAATGAGGAAGCCGAAGACTATGACGA TGACCTGACCGACAGCGAGATGGATGTGGTCCGCTTCGATGACGATAACTCTCCCTCCTTTATCCAGATCCGGTCCGT GGCCAAGAAACACCCTAAGACCTGGGTCCATTACATCGCCGCTGAGGAAGAGGACTGGGATTATGCTCCACTGGTGCT GGCCCCCGACGATAGATCCTACAAAAGCCAGTATCTGAACAATGGACCCCAGAGGATCGGCAGAAAGTACAAGAAAGT GAGGTTCATGGCTTATACCGATGAGACCTTTAAGACCAGAGAAGCCATCCAGCACGAGTCCGGGATCCTGGGACCTCT GCTGTACGGCGAAGTGGGGGACACCCTGCTGATCATCTTCAAGAACCAGGCCAGCAGGCCTTACAATATCTATCCACA TGGCATCACCGATGTGAGACCTCTGTACTCCCGCCGGCTGCCAAAGGGCGTGAAACACCTGAAGGACTTCCCAATCCT GCCCGGGGAAATCTTTAAGTATAAATGGACCGTCACCGTCGAGGATGGGCCCACCAAGAGCGACCCTAGGTGCCTGAC CAGATACTATTCTTCCTTCGTGAATATGGAGAGAGACCTGGCTTCCGGACTGATCGGACCCCTGCTGATCTGTTACAA AGAGAGCGTGGATCAGCGCGGCAACCAGATCATGTCTGACAAGCGGAATGTGATCCTGTTCAGCGTCTTTGACGAAAA CCGCTCTTGGTACCTGACCGAGAACATCCAGCGGTTCCTGCCTAATCCAGCTGGAGTGCAGCTGGAAGATCCCGAGTT CCAGGCCTCTAACATCATGCATTCCATCAATGGCTACGTGTTCGACTCCCTGCAGCTGAGCGTGTGCCTGCACGAGGT CGCTTACTGGTATATCCTGAGCATCGGAGCCCAGACCGATTTCCTGTCTGTGTTCTTTTCCGGCTACACCTTTAAGCA
GCTGTGGATCCTGGGATGCCACAACTCCGATTTCAGGAATAGAGGGATGACCGCCCTGCTGAAAGTGAGCTCTTGTGA CAAGAACACCGGAGACTACTATGAAGATAGCTACGAGGACATCTCTGCTTATCTGCTGTCCAAAAACAATGCCATCGA GCCCAGGAGCTTCTCTCAGAACCCTCCAGTGCTGAAGCGCCACCAGCGGGAGATCACCAGAACCACCCTGCAGAGCGA TCAGGAAGAGATCGACTACGACGATACCATCTCCGTGGAAATGAAGAAAGAGGACTTCGATATCTATGACGAAGATGA GAACCAGTCTCCCAGGTCCTTCCAGAAGAAAACCAGACATTACTTTATCGCCGCTGTGGAGCGGCTGTGGGACTATGG CATGTCCAGCTCTCCTCACGTGCTGAGAAATAGAGCTCAGTCCGGAAGCGTCCCACAGTTCAAGAAAGTGGTCTTCCA GGAGTTTACCGACGGAAGCTTTACCCAGCCACTGTACCGCGGCGAACTGAACGAGCACCTGGGGCTGCTGGGACCCTA TATCCGGGCTGAAGTGGAGGATAACATCATGGTCACCTTCAGGAATCAGGCCAGCAGACCCTACTCTTTTTATTCCAG CCTGATCTCCTACGAAGAGGACCAGAGACAGGGAGCTGAACCAAGAAAAAACTTCGTGAAGCCTAATGAGACCAAAAC CTACTTTTGGAAGGTGCAGCACCATATGGCCCCTACCAAAGACGAGTTCGATTGCAAGGCCTGGGCTTATTTTAGCGA
r' m r'r* 7\ m r ’ m r , r i T\ r'~r\ 7\ r'r'~r\r*r* m r* 7\ m p r i r i P p r < ' A ir TCACGGAAGGCAGGTGACCGTCCAGGAATTCGCCCTGTTCTTTACCATCTTTGATGAGACCAAGAGCTGGTACTTCAC CGAAAACATGGAGAGGAATTGCAGAGCCCCATGTAACATCCAGATGGAAGACCCCACCTTCAAGGAGAACTACAGATT TCATGCTATCAATGGGTATATCATGGATACCCTGCCAGGACTGGTCATGGCTCAGGACCAGAGGATCAGATGGTACCT GCTGAGCATGGGGTCTAACGAGAATATCCACTCCATCCATTTCAGCGGACACGTGTTTACCGTCCGCAAGAAAGAAGA GTACAAGATGGCCCTGTACAACCTGTATCCCGGCGTGTTCGAAACCGTCGAGATGCTGCCTTCCAAGGCTGGGATCTG GCGGGTGGAATGCCTGATCGGGGAGCACCTGCATGCCGGAATGTCTACCCTGTTCCTGGTGTACTCCAATAAGTGTCA GACCCCCCTGGGGATGGCTAGCGGACATATCCGCGACTTCCAGATCACCGCTTCCGGACAGTACGGACAGTGGGCTCC TAAGCTGGCTAGACTGCACTATTCTGGCTCCATCAACGCTTGGTCTACCAAAGAGCCTTTCTCCTGGATCAAGGTGGA CCTGCTGGCTCCAATGATCATCCATGGCATCAAAACCCAGGGGGCCAGGCAGAAGTTCTCTTCCCTGTACATCAGCCA GTTTATCATCATGTATTCTCTGGATGGGAAGAAATGGCAGACCTACAGAGGCAATTCCACCGGGACCCTGATGGTGTT CTTTGGCAACGTCGACAGCTCTGGGATCAAGCACAACATCTTCAATCCCCCTATCATCGCCCGCTACATCCGGCTGCA CCCAACCCATTATTCCATCCGCAGCACCCTGCGGATGGAGCTGATGGGGTGCGATCTGAACAGCTGTTCTATGCCCCT GGGAATGGAGTCTAAGGCCATCTCCGACGCTCAGATCACCGCCTCCAGCTACTTCACCAATATGTTTGCTACCTGGTC CCCAAGCAAGGCTAGACTGCATCTGCAGGGAAGAAGCAACGCTTGGAGACCACAGGTGAACAATCCCAAGGAGTGGCT GCAGGTCGACTTCCAGAAAACCATGAAGGTGACCGGAGTCACCACCCAGGGCGTGAAAAGCCTGCTGACCTCTATGTA CGTCAAGGAGTTCCTGATCTCTTCCAGCCAGGACGGGCACCAGTGGACCCTGTTCTTTCAGAACGGAAAGGTGAAAGT CTTCCAGGGCAATCAGGATTCCTTTACCCCTGTGGTCAACAGCCTGGACCCACCCCTGCTGACCAGGTACCTGAGAAT CCACCCACAGTCCTGGGTGCATCAGATCGCTCTGAGGATGGAAGTCCTGGGCTGCGAGGCCCAGGACCTGTATTGAGC GGCCGCAATAAAATATCTTTATTTTCATTACATCTGTGTGTTGGTTTTTTGTGTGCAATTGAGGAACCCCTAGTGATG GAGTTGGCCACTCCCTCTCTGCGCGCTCGCTCGCTCACTGAGGCCGGGCGACCAAAGGTCGCCCGACGCCCGGGCTTT GCCCGGGCGGCCTCAGTGAGCGAGCGAGCGCGCAGCTGCCTGCAGG
Otro vector AAV ejemplar que incluye un transgén de fVIII impulsado por el promotor HCB se proporciona como la SEQ ID NO: 130, que proporciona un diseño prototípico de un casete de AAV que codifica un transgén terapéutico bajo el control del promotor HCB. Cada elemento está separado por uno o dos sitios de enzimas de restricción (RE, por sus siglas en inglés), que permiten una sustitución fácil de estos elementos. En la SEQ ID NO: 130, el orden de los elementos es como sigue:
(5'ITR de AAV2) - RE -(promotor HCB) - RE -(intrón de MVM) - RE - Kozak -(región codificante de ET3) - RE -(señal de poliadenilación) - RE -(3'ITR de AAV2)
AAV2-HCB-ET3-LCO-NCG-SpA
Figure imgf000055_0001
El intrón y los sitios de restricción pueden eliminarse opcionalmente del casete para proporcionar un genoma de AAV recombinante acortado. Adicionalmente, el transgén se puede sustituir según sea necesario. La eliminación del intrón y de los elementos de los sitios de restricción generaría un vector de 4885 pares de bases (ET3) o 4855 (HSQ).
Se generaron partículas de virus AAV2-HCB-ET3-LCO-NCG-SpA y se usaron para transducir ratones. La actividad de fVIII en suero se ensayó en varios puntos temporales después de la transducción (véase la FIG. 19). El ensayo de terapia génica in vivo se realizó sustancialmente como se describe en Brown et al. ("Bioengineered Factor FVIII Enables Long-Term Correction of Murine Hemophilia A Following Liver-Directed Adeno-Associated Viral Vector Delivery", Molecular Therapy - Methods and Clinical Development. 1:14036, 2014).
SEQ ID NO: 130:
CCTGCAGGCAGCTGCGCGCTCGCTCGCTCACTGAGGCCGCCCGGGCAAAGCCCGGGCGTCGGGCGACCTTTGGTCGCC CGGCCTCAGTGAGCGAGCGAGCGCGCAGAGAGGGAGTGGCCAACTCCATCACTAGGGGTTCCTACCGGTGTTAATCAT TAAGTCGTTAATTTTTGTGGCCCTTGCGATGTTTGCTCTGGTTAATAATCTCAGGACAAACAGAGGTTAATAATTTTC CAGATCTCTCTGAGCAATAGTATAAAAGGCCAGCAGCAGCCTGACCACATCTCATCCTCGTCGACTTAATTAAAAGAG GTAAGGGTTTAAGGGATGGTTGGTTGGTGGGGTATTAATGTTTAATTACCTGGAGCACCTGCCTGAAATCACTTTTTT TCAGGTTGGCTCGAGCCACCATGCAGCTGGAACTGTCTACCTGTGTGTTTCTGTGTCTGCTGCCTCTGGGGTTTTCTG CTATCAGGAGATAC TATCTGGGAGCTGTGGAGCTGTCCTGGGACTACAGGCAGTCTGAGCTGCTGAGAGAACTGCATG TGGATACCAGATTCCCAGCTACAGCTCCAGGAGCTCTGCCTCTGGGCCCATCTGTGCTGTACAAGAAAACAGTCTTTG TGGAGTTTACAGACCAGCTGTTCTCTGTGGCCAGGCCAAGACCACCTTGGATGGGACTGCTGGGACCAACCATCCAGG CTGAGGTGTATGATACAGTGGTGGTGACCCTGAAAAACATGGCCTCCCATCCTGTGAGCCTGCATGCTGTGGGGGTGT CCTTCTGGAAGTCCTCTGAGGGAGCTGAGTATGAAGACCATACCTCCCAGAGGGAGAAAGAAGATGATAAGGTGCTGC CTGGCAAAAGCCAGACCTATGTCTGGCAGGTGCTGAAGGAGAATGGACCAACTGCTTCTGACCCACCATGCCTGACCT ACTCTTATCTGTCCCATGTGGATCTGGTGAAGGACCTGAATTCTGGACTGATTGGAGCTCTGCTGGTGTGTAGAGAGG GAAGCCTGACCAGAGAAAGAACCCAGAACCTGCATGAGTTTGTCCTGCTGTTTGCTGTGTTTGATGAAGGGAAGAGCT GGCACTCTGCCAGGAATGACTCCTGGACCAGAGCTATGGATCCAGCTCCTGCTAGAGCTCAGCCTGCTATGCACACAG TCAATGGCTATGTGAATAGGTCTCTGCCAGGACTGATTGGCTGCCATAAGAAATCTGTCTATTGGCATGTGATTGGAA TGGGCACCAGCCCTGAGGTGCATTCTATCTTCCTGGAAGGCCACACCTTTCTGGTCAGGCACCATAGACAGGCCTCTC TGGAGATCTCCCCTCTGACCTTCCTGACAGCTCAGACCTTTCTGATGGACCTGGGGCAGTTCCTGCTGTTTTGCCATA TCTCTTCCCACCATCATGGAGGAATGGAGGCTCATGTCAGGGTGGAATCCTGTGCTGAGGAACCACAGCTGAGAAGAA AGGCTGATGAGGAAGAGGACTATGATGATAACCTGTATGACTCTGATATGGATGTGGTGAGGCTGGATGGGGATGATG TCAGCCCTTTCATCCAGATCAGGTCTGTGGCCAAGAAACATCCAAAGACCTGGGTCCACTACATTGCTGCTGAAGAGG AAGATTGGGACTATGCCCCCCTGGTGCTGGCTCCTGATGATAGATCCTACAAAAGCCAGTATCTGAACAATGGGCCCC AGAGGATTGGAAGGAAGTACAAGAAAGTGAGGTTCATGGCCTATACAGATGAGACCTTTAAGACCAGAGAGGCTATCC AGCATGAATCTGGGATCCTGGGACCTCTGCTGTATGGAGAAGTGGGGGATACCCTGCTGATCATCTTCAAGAACCAGG CCTCCAGGCCATACAATATCTATCCCCATGGCATCACAGATGTGAGACCACTGTACAGCAGGAGACTGCCCAAGGGGG TCAAACACCTGAAGGATTTCCCCATCCTGCCTGGAGAGATCTTTAAGTATAAATGGACAGTCACAGTGGAAGATGGGC CTACCAAGTCTGATCCAAGGTGCCTGACCAGATACTATAGCTCTTTTGTGAACATGGAGAGAGACCTGGCTTCTGGAC TGATTGGACCCCTGCTGATCTGTTACAAAGAGTCTGTGGACCAGAGGGGCAACCAGATCATGTCTGATAAGAGAAATG TCATCCTGTTCTCTGTGTTTGATGAGAACAGGAGCTGGTACCTGACAGAGAACATCCAGAGGTTCCTGCCAAATCCAG CTGGAGTGCAGCTGGAGGACCCAGAATTTCAGGCTTCCAACATCATGCATAGCATCAATGGCTATGTGTTTGATAGCC TGCAGCTGTCTGTCTGCCTGCATGAGGTGGCCTACTGGTATATCCTGTCCATTGGAGCTCAGACAGACTTCCTGTCTG TGTTCTTTAGTGGGTACACCTTTAAGCATAAAATGGTGTATGAGGATACCCTGACCCTGTTCCCCTTTTCTGGGGAGA CAGTGTTCATGTCCATGGAAAACCCTGGCCTGTGGATCCTGGGGTGCCACAACTCTGACTTCAGGAATAGAGGAATGA CAGCCCTGCTGAAAGTGTCCAGCTGTGATAAGAATACAGGGGATTACTATGAGGACTCTTATGAAGATATCTCTGCTT ATCTGCTGAGCAAGAACAATGCCATTGAGCCCAGGTCTTTTGCTCAGAACTCCAGACCTCCATCTGCTTCTGCTCCTA AGCCACCTGTGCTGAGAAGACATCAGAGGGACATCTCCCTGCCTACCTTCCAGCCAGAGGAAGATAAAATGGACTATG ATGATATCTTCAGCACAGAGACCAAGGGGGAAGATT T TGACATCTATGGAGAGGATGAAAACCAGGATCCAAGATCCT TCCAGAAGAGAACCAGACACTACTTTATTGCTGCTGTGGAGCAGCTGTGGGACTATGGGATGTCTGAAAGCCCAAGGG CCCTGAGGAACAGAGCTCAGAATGGAGAGGTGCCCAGATTCAAGAAAGTGGTGTTCAGAGAGTTTGCTGATGGCAGCT TTACCCAGCCATCTTACAGGGGGGAGCTGAACAAGCATCTGGGGCTGCTGGGACCCTATATCAGAGCTGAGGTGGAAG ATAACATCATGGTGACCTTCAAGAATCAGGCTTCTAGGCCCTACTCCTTTTATTCTTCCCTGATCTCCTACCCTGATG ATCAGGAGCAGGGAGCTGAACCTAGGCACAACTTTGTGCAGCCAAATGAGACCAGAACCTACTTTTGGAAGGTGCAGC ATCACATGGCTCCCACAGAGGATGAATTTGACTGCAAAGCTTGGGCCTATTTTTCTGATGTGGACCTGGAGAAGGATG TGCATTCTGGCCTGATTGGGCCTCTGCTGATCTGTAGGGCCAACACCCTGAATGCTGCTCATGGAAGACAGGTCACAG TGCAGGAGTTTGCTCTGTTCTTTACCATCTTTGATGAAACCAAGAGCTGGTACTTCACAGAGAATGTGGAAAGGAATT GCAGAGCCCCCTGTCATCTGCAGATGGAGGACCCTACCCTGAAGGAAAACTACAGGTTCCATGCCATCAATGGATATG TCATGGATACCCTGCCTGGCCTGGTCATGGCTCAGAACCAGAGGATCAGATGGTACCTGCTGTCTATGGGATCCAATG AGAATATCCATAGCATCCACTTCTCTGGCCATGTCTTTTCTGTGAGGAAGAAAGAGGAATACAAAATGGCTGTGTACA ATCTGTATCCTGGGGTCTTTGAGACAGTGGAAATGCTGCCAAGCAAAGTGGGAATCTGGAGAATTGAGTGCCTGATTG GGGAACACCTGCAGGCTGGGATGAGCACCACCTTCCTGGTGTACTCTAAGAAATGTCAGACCCCACTGGGGATGGCCT CTGGACATAT CAGGGACTTCCAGATCACAGCTTCTGGACAGT ATGGACAGTGGGCTCCAAAGCTGGC TAGACTGCACT ATTCTGGCTCCATCAATGCCTGGTCTACCAAAGAGCCATTCTCCTGGATCAAGGTGGACCTGCTGGCCCCCATGATCA TCCATGGAATCAAAACCCAGGGAGCTAGGCAGAAGTTCAGCTCTCTGTACATCTCCCAGTTTATCATCATGTATAGCC TGGATGGGAAGAAATGGCAGACCTACAGAGGCAATTCCACTGGGACCCTGATGGTCTTCTTTGGAAATGTGGATTCCT CTGGCATCAAGCACAACATCTTCAATCCACCCATCATTGCCAGGTACATCAGGCTGCATCCTACCCACTATAGCATCA GGTCTACCCTGAGAATGGAGCTGATGGGATGTGACCTGAACAGCTGTTCTATGCCACTGGGCATGGAGTCCAAGGCTA TCTCTGATGCCCAGATCACAGCTTCTTCCTACTTCACCAATATGTTTGCTACCTGGTCCCCAAGCAAGGCTAGACTGC ACCTGCAGGGAAGATCCAATGCTTGGAGACCCCAGGTGAACAATCCTAAGGAGTGGCTGCAGGTGGACTTCCAGAAAA CCATGAAGGTCACAGGGGTGACCACCCAGGGAGTGAAATCTCTGCTGACCTCCATGTATGTCAAGGAGTTCCTGATCA GCTCTTCCCAGGATGGCCACCAGTGGACCCTGTTCTTTCAGAATGGCAAGGTCAAAGTGTTCCAGGGGAATCAGGACT CTTTTACCCCAGTGGTGAACTCCCTGGATCCTCCACTGCTGACCAGGTACCTGAGAATCCATCCTCAGAGCTGGGTGC ACCAGATTGCTCTGAGAATGGAGGTCCTGGGATGTGAAGCTCAGGACCTGTATTGAGCGGCCGCAATAAAATATCTTT ATTTTCATTACATCTGTGTGTTGGTTTTTTGTGTGCAATTGAGGAACCCCTAGTGATGGAGTTGGCCACTCCCTCTCT GCGCGCTCGCTCGCTCACTGAGGCCGGGCGACCAAAGGTCGCCCGACGCCCGGGCTTTGCCCGGGCGGCCTCAGTGAG CGAGCGAGCGCGCAGCTGCCTGCAGG
Ejemplo 4
Tratamiento de la hemofilia A humana usando terapia génica basada en AAV
Este ejemplo describe un método ejemplar para el uso clínico de vectores AAV que codifican fVIII para el tratamiento de la hemofilia A.
Se selecciona un paciente diagnosticado con hemofilia A para el tratamiento. Al paciente se le administra una cantidad terapéuticamente eficaz de un AAV recombinante que codifica la variante de ET3 o HSQ fVIII, tal como AAV-ET3 o AAV-HSQ bajo el control de un promotor HCB como se divulga en el presente documento. El AAV recombinante puede administrarse por vía intravenosa. El médico puede seleccionar una dosis terapéutica adecuada. En algunos casos, la dosis terapéuticamente eficaz está en el intervalo de 1 x 10101 a 1 x 101415partículas víricas (pv)/kg, tal como aproximadamente 1 x 1012 *pv/kg. En la mayoría de los casos, al paciente se le administra una dosis única. La salud del sujeto se puede monitorizar con el tiempo para determinar la eficacia del tratamiento.

Claims (14)

REIVINDICACIONES
1. Una molécula de ácido nucleico recombinante, que comprende:
un promotor específico de hígado que comprende un primer elemento de respuesta de no más de 160 nucleótidos de longitud que comprende:
un sitio de unión al factor de transcripción (TF) HNF1a que comprende o que consiste en los nucleótidos 1-12 de la SEQ ID NO: 4, un sitio de unión al TF HNF1-1 que comprende o que consiste en los nucleótidos 16-23 de la SEQ ID NO: 4;
un sitio de unión al TF HNF4 que comprende o que consiste en los nucleótidos 26-36 de la SEQ ID NO: 4; un sitio de unión al TF HNF3a que comprende o que consiste en los nucleótidos 39-45 de la SEQ ID NO: 4;
un sitio de unión al TF HNF1-2 que comprende o que consiste en los nucleótidos 48-62 de la SEQ ID NO: 4; un sitio de unión al TF HNF3-2 que comprende o que consiste en los nucleótidos 65-71 de la SEQ ID NO: 4 un sitio de unión al TF HP1 que comprende o que consiste en los nucleótidos 75-87 de la SEQ ID NO: 4; una caja TATA que comprende o que consiste en los nucleótidos 108-114 de la SEQ ID NO: 4; y
un Sitio de Inicio de la Transcripción que comprende o que consiste en los nucleótidos 116-146 de la SEQ ID NO: 4.
2. La molécula de ácido nucleico recombinante de la reivindicación 1, en donde:
(a) el primer elemento de respuesta comprende, de 5' a 3', el sitio de unión al TF HNF1a, el sitio de unión al TF HNF1-1, el sitio de unión al TF HNF4, el sitio de unión al TF HNF3a, el sitio de unión al TF HNF1-2, el sitio de unión al TF HNF3-2, el sitio de unión al TF HP1, la caja TATA y el Sitio de Inicio de la Transcripción (TSS); y/o (b) el primer elemento de respuesta no tiene más de 150 nucleótidos de longitud, en donde, opcionalmente, el primer elemento de respuesta tiene 146 nucleótidos de longitud; y/o
(c) el primer elemento de respuesta comprende o consiste en una secuencia de nucleótidos al menos un 90 % idéntica a la SEQ ID NO: 4, en donde, opcionalmente, el primer elemento de respuesta comprende o consiste en la secuencia de nucleótidos establecida como la SEQ ID NO: 4; y/o
(d) el promotor consiste en el primer elemento de respuesta.
3. La molécula de ácido nucleico recombinante de la reivindicación 1 o 2, que comprende adicionalmente un segundo elemento de respuesta cadena arriba del primer elemento de respuesta, comprendiendo el segundo elemento de respuesta uno de:
un elemento de respuesta HSh que comprende o que consiste en una secuencia de nucleótidos al menos un 90 % idéntica a la SEQ ID NO: 111;
un elemento de respuesta 5'HS que comprende o que consiste en una secuencia de nucleótidos al menos un 90 % idéntica a los nucleótidos 6-32 de la s Eq ID NO: 111; o
un elemento de respuesta 3'HS que comprende o que consiste en una secuencia de nucleótidos al menos un 90 % idéntica a los nucleótidos 44-68 de la SEQ ID NO: 111,
en donde, opcionalmente
el elemento de respuesta HSh comprende o consiste en la secuencia de nucleótidos establecida como la SEQ ID NO: 111;
el elemento de respuesta 5'HS comprende o consiste en los nucleótidos 6-32 de la SEQ ID NO: 111; o el elemento de respuesta 3'HS comprende o consiste en los nucleótidos 44-68 de la SEQ ID NO: 111.
4. La molécula de ácido nucleico recombinante de la reivindicación 3, en donde el promotor recombinante comprende o consiste en una secuencia de nucleótidos al menos un 90 % idéntica a una de la SEQ ID NO: 102 (HSh-HCB), SEQ ID NO: 104 (5'HSh-HCB) o SEQ ID NO: 103 (3'HSh-HCB), en donde, opcionalmente, el promotor recombinante comprende o consiste en la secuencia de nucleótidos establecida como la SEQ ID NO: 102 (HSh-HCB), SEQ ID NO: 104 (5'HSh-HCB) o SEQ ID NO: 103 (3'HSh- HCB).
5. Un vector que comprende la molécula de ácido nucleico recombinante de una cualquiera de las reivindicaciones anteriores.
6. El vector de la reivindicación 5, en donde el vector es un vector vírico, en donde, opcionalmente, el vector vírico es un vector AAV, un vector gamma retrovírico, un vector lentivírico o un vector adenovírico.
7. El vector de la reivindicación 5 o 6, que comprende una molécula de ácido nucleico que codifica un factor de coagulación que está operativamente unido al promotor.
8. El vector de la reivindicación 7, en donde:
(a) el factor de coagulación es fVIII, o una variante de fVIII ET3 o humana con el dominio B eliminado (HSQ), en donde, opcionalmente, el fVIII comprende la secuencia del ácido nucleico establecida como la SEQ ID NO: 2, SEQ ID NO: 11, SEQ ID NO: 12, SEQ iD NO: 125, o SEQ ID NO: 126, o una secuencia del ácido nucleico al menos un 90 % idéntica a la SEQ ID NO: 2, SEQ ID NO: 11, SEQ ID NO: 12, la SEQ ID NO: 125 o la SEQ ID NO: 126; o (b) el factor de coagulación es fIX, en donde, opcionalmente, el fIX comprende la secuencia del ácido nucleico establecida como la SEQ ID NO: 8, SEQ ID NO: 9, SEQ ID NO: 10, SEQ ID NO: 124, o SEQ ID NO: 127, o una secuencia del ácido nucleico al menos un 90 % idéntica a la SEQ ID NO: 8, SEQ ID NO: 9, SEQ ID NO: 10, SEQ ID NO: 124 o SEQ ID NO: 127.
9. Una composición que comprende el vector de una cualquiera de las reivindicaciones 5-8 en un transportador farmacéuticamente aceptable.
10. El vector de la reivindicación 7 u 8, o la composición de la reivindicación 9, para su uso en un método para inducir la coagulación de la sangre en un sujeto que lo necesite, comprendiendo dicho método administrar al sujeto una cantidad terapéuticamente eficaz del vector o composición.
11. El vector de la reivindicación 7 u 8, o la composición de la reivindicación 9, para su uso en un método de tratamiento de un sujeto con un trastorno de la coagulación, comprendiendo dicho método seleccionar un sujeto con el trastorno de la coagulación y administrar al sujeto una cantidad terapéuticamente eficaz del vector o la composición.
12. El vector o composición para su uso en el método de la reivindicación 11, en donde el trastorno de la coagulación es:
hemofilia A y al sujeto se le administra un vector que comprende una molécula de ácido nucleico que codifica una proteína con actividad de fVIII; o
hemofilia B y al sujeto se le administra un vector que comprende una molécula de ácido nucleico que codifica una proteína con actividad de fIX.
13. El vector o composición para su uso en el método de una cualquiera de las reivindicaciones 10-12, en donde: (a) el vector se administra por vía intravenosa; o
(b) el vector es un vector Aa V.
14. El vector o composición para su uso en el método de una cualquiera de las reivindicaciones 10-13, en donde el vector se administra en combinación con un agente inmunosupresor, en donde, opcionalmente, el agente inmunosupresor es ciclosporina, tacrolimus, sirolimus, ciclofosfamida, metotrexato, azatioprina, mercaptopurina, fluorouracilo, ácido micofenólico, dactinomicina, fingolimod, anticuerpo o proteína de unión a receptores de linfocitos T, muromonab-CD3, anticuerpo o proteína de unión al receptor de IL-2, basiliximab, daclizumab, IFN-beta recombinante, anticuerpo o proteína de unión a TNF-alfa, infliximab, etanercept o adalimumab.
ES16720253T 2015-04-16 2016-04-15 Promotores y vectores recombinantes para la expresión de proteínas en el hígado y uso de los mismos Active ES2763551T3 (es)

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
US201562148696P 2015-04-16 2015-04-16
US201562202133P 2015-08-06 2015-08-06
US201562212634P 2015-09-01 2015-09-01
PCT/US2016/027931 WO2016168728A2 (en) 2015-04-16 2016-04-15 Recombinant promoters and vectors for protein expression in liver and use thereof

Publications (1)

Publication Number Publication Date
ES2763551T3 true ES2763551T3 (es) 2020-05-29

Family

ID=55910372

Family Applications (1)

Application Number Title Priority Date Filing Date
ES16720253T Active ES2763551T3 (es) 2015-04-16 2016-04-15 Promotores y vectores recombinantes para la expresión de proteínas en el hígado y uso de los mismos

Country Status (6)

Country Link
US (3) US10058624B2 (es)
EP (2) EP3626274A3 (es)
CN (3) CN115074366A (es)
ES (1) ES2763551T3 (es)
HK (1) HK1250021A1 (es)
WO (1) WO2016168728A2 (es)

Families Citing this family (45)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
LT2956477T (lt) 2013-02-15 2021-02-10 Bioverativ Therapeutics Inc. Optimizuotas faktoriaus viii genas
WO2015191508A1 (en) 2014-06-09 2015-12-17 Voyager Therapeutics, Inc. Chimeric capsids
WO2016004113A1 (en) * 2014-06-30 2016-01-07 Biogen Ma Inc. Optimized factor ix gene
JP6401871B2 (ja) 2014-11-05 2018-10-10 ボイジャー セラピューティクス インコーポレイテッドVoyager Therapeutics,Inc. パーキンソン病の治療のためのaadcポリヌクレオチド
GB201420139D0 (en) 2014-11-12 2014-12-24 Ucl Business Plc Factor IX gene therapy
KR20230169197A (ko) 2014-11-14 2023-12-15 보이저 테라퓨틱스, 인크. 근위축성 측삭 경화증(als)을 치료하는 조성물 및 방법
KR102584655B1 (ko) 2014-11-14 2023-10-06 보이저 테라퓨틱스, 인크. 조절성 폴리뉴클레오티드
US11697825B2 (en) 2014-12-12 2023-07-11 Voyager Therapeutics, Inc. Compositions and methods for the production of scAAV
CN115074366A (zh) * 2015-04-16 2022-09-20 埃默里大学 用于肝脏中蛋白质表达的重组启动子和载体及其用途
SG11201806398YA (en) 2016-02-01 2018-08-30 Bioverativ Therapeutics Inc Optimized factor viii genes
WO2017189964A2 (en) 2016-04-29 2017-11-02 Voyager Therapeutics, Inc. Compositions for the treatment of disease
WO2017189959A1 (en) 2016-04-29 2017-11-02 Voyager Therapeutics, Inc. Compositions for the treatment of disease
SG11201809699XA (en) 2016-05-18 2018-12-28 Voyager Therapeutics Inc Modulatory polynucleotides
WO2017201258A1 (en) 2016-05-18 2017-11-23 Voyager Therapeutics, Inc. Compositions and methods of treating huntington's disease
US10724050B1 (en) 2016-08-09 2020-07-28 Emory University CAS9 nucleic acid molecules and their use
CN110650673B (zh) 2016-08-30 2024-04-09 加利福尼亚大学董事会 用于生物医学靶向和递送的方法以及用于实践该方法的装置和***
AU2018207259B2 (en) * 2017-01-10 2023-11-09 Children's Medical Research Institute Polynucleotides and vectors for the expression of transgenes
AU2018261790A1 (en) 2017-05-05 2019-11-28 Voyager Therapeutics, Inc. Compositions and methods of treating amyotrophic lateral sclerosis (ALS)
EP3619308A4 (en) 2017-05-05 2021-01-27 Voyager Therapeutics, Inc. COMPOSITIONS AND METHODS OF TREATMENT FOR HUNTINGTON'S MORBUS
US11633504B2 (en) 2017-05-09 2023-04-25 Emory University Nucleic acids encoding clotting factor variants and their use
JOP20190269A1 (ar) 2017-06-15 2019-11-20 Voyager Therapeutics Inc بولي نوكليوتيدات aadc لعلاج مرض باركنسون
CN111132626B (zh) 2017-07-17 2024-01-30 沃雅戈治疗公司 轨迹阵列引导***
CA3071519A1 (en) * 2017-08-01 2019-02-07 Spark Therapeutics, Inc. Factor viii (fviii) gene therapy methods
TWI832036B (zh) 2017-08-03 2024-02-11 美商航海家醫療公司 用於aav之遞送之組合物及方法
US20200237799A1 (en) 2017-10-16 2020-07-30 Voyager Therapeutics, Inc. Treatment of amyotrophic lateral sclerosis (als)
US11434502B2 (en) 2017-10-16 2022-09-06 Voyager Therapeutics, Inc. Treatment of amyotrophic lateral sclerosis (ALS)
US10610606B2 (en) 2018-02-01 2020-04-07 Homology Medicines, Inc. Adeno-associated virus compositions for PAH gene transfer and methods of use thereof
US11306329B2 (en) 2018-02-19 2022-04-19 City Of Hope Adeno-associated virus compositions for restoring F8 gene function and methods of use thereof
WO2019210187A1 (en) * 2018-04-26 2019-10-31 The University Of North Carolina At Chapel Hill Methods and compositions for treatment of hemophilia
CN108795986A (zh) * 2018-05-31 2018-11-13 深圳市免疫基因治疗研究院 一种a型血友病慢病毒载体、慢病毒及其制备方法和应用
MX2021001375A (es) * 2018-08-03 2021-04-19 Sangamo Therapeutics Inc Parametros clinicos mejorados por la expresion del factor viii.
US10842885B2 (en) 2018-08-20 2020-11-24 Ucl Business Ltd Factor IX encoding nucleotides
EP3880823A4 (en) * 2018-11-16 2022-08-17 Asklepios Biopharmaceutical, Inc. THERAPEUTIC ADENO-ASSOCIATED VIRUS FOR THE TREATMENT OF PUMP DISEASE
WO2020104424A1 (en) * 2018-11-19 2020-05-28 Uniqure Ip B.V. Liver-specific viral promoters and methods of using the same
EP3986481A2 (en) * 2019-06-20 2022-04-27 Takeda Pharmaceutical Company Limited Method of treatment with viral-based gene therapy
US20220325266A1 (en) * 2019-10-15 2022-10-13 The United States Of America,As Represented By The Secretary,Department Of Health And Human Services Synthetic genes for the treatment of propionic acidemia caused by mutations in propionyl-coa carboxylase beta
CN113088519B (zh) * 2019-12-23 2024-02-02 苏州华毅乐健生物科技有限公司 一种分离的核酸分子及其应用
TW202140791A (zh) 2020-01-13 2021-11-01 美商霍蒙拉奇醫藥公司 治療苯酮尿症之方法
KR20220139956A (ko) 2020-02-13 2022-10-17 테나야 테라퓨틱스, 인코포레이티드 심장 질환을 치료하기 위한 유전자 요법 벡터
US20230132582A1 (en) * 2020-03-11 2023-05-04 Shanghai Belief-Delivery Biomed Co., Ltd. Novel use of aspirin compound in increasing nucleic acid expression
CN112608921B (zh) * 2020-12-23 2022-04-08 武汉枢密脑科学技术有限公司 用于肝脏中蛋白质表达的重组启动子、载体及其应用
CA3203090A1 (en) * 2020-12-26 2022-06-30 Baodong Sun Compositions and methods for treating and/or preventing glycogen storage diseases
WO2022232049A1 (en) * 2021-04-26 2022-11-03 The Regents Of The University Of California High-throughput expression-linked promoter selection in eukaryotic cells
WO2023078220A1 (zh) * 2021-11-02 2023-05-11 苏州华毅乐健生物科技有限公司 分离的核酸分子及其应用
CN116555266A (zh) * 2023-06-09 2023-08-08 呈诺再生医学科技(北京)有限公司 肝脏特异性表达的重组启动子和载体及其在肝脏相关疾病治疗中的应用

Family Cites Families (53)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4886876A (en) 1983-03-31 1989-12-12 Scripps Clinic And Research Foundation Factor VIII coagulant polypeptides
US4757006A (en) 1983-10-28 1988-07-12 Genetics Institute, Inc. Human factor VIII:C gene and recombinant methods for production
WO1985001961A1 (en) 1983-10-28 1985-05-09 Genetics Institute Production of factor viii and related products
US5045455A (en) 1984-01-12 1991-09-03 Chiron Corporation Factor VIII:C cDNA cloning and expression
US4965199A (en) 1984-04-20 1990-10-23 Genentech, Inc. Preparation of functional human factor VIII in mammalian cells using methotrexate based selection
FI86885C (fi) 1984-04-20 1992-10-26 Genentech Inc Foerfarande foer framstaellning av human rekombinantfaktor viii och nukleinsyrasekvenser och vektorer anvaend daertill
EP0182448A3 (en) 1984-08-24 1987-10-28 Genetics Institute, Inc. Production of factor viii and related products
US5595886A (en) 1986-01-27 1997-01-21 Chiron Corporation Protein complexes having Factor VIII:C activity and production thereof
FI98829C (fi) 1986-01-27 1997-08-25 Chiron Corp Menetelmä rekombinoidun proteiinikompleksin valmistamiseksi, jolla on humaanitekijä VIII:C-aktiivisuutta
US5422260A (en) 1986-05-29 1995-06-06 Genetics Institute, Inc. -Legal Affairs Human factor VIII:c muteins
US5451521A (en) 1986-05-29 1995-09-19 Genetics Institute, Inc. Procoagulant proteins
US5149637A (en) 1987-04-06 1992-09-22 Scripps Clinic & Research Foundation Recombinant Factor VIIIC fragments
IE69026B1 (en) 1987-06-12 1996-08-07 Immuno Ag Novel proteins with factor VIII activity process for their preparation using genetically-engineered cells and pharmaceutical compositions containing them
FR2619314B1 (fr) 1987-08-11 1990-06-15 Transgene Sa Analogue du facteur viii, procede de preparation et composition pharmaceutique le contenant
US5004803A (en) 1988-11-14 1991-04-02 Genetics Institute, Inc. Production of procoagulant proteins
KR927003812A (ko) 1989-11-17 1992-12-18 노보 노르디스크 아크티에 셀스카브 인자 viii:c 활성을 갖는 단백질 복합체 및 그의 제조
SE465222C5 (sv) 1989-12-15 1998-02-10 Pharmacia & Upjohn Ab Ett rekombinant, humant faktor VIII-derivat och förfarande för dess framställning
US5661008A (en) 1991-03-15 1997-08-26 Kabi Pharmacia Ab Recombinant human factor VIII derivatives
SE468050C (sv) 1991-03-15 1998-04-27 Pharmacia & Upjohn Ab Rekombinant derivat av human faktor VIII
CA2078721A1 (en) 1991-09-24 1993-03-25 Hiroshi Yonemura Process for preparing human coagulation factor viii protein complex
US5563045A (en) 1992-11-13 1996-10-08 Genetics Institute, Inc. Chimeric procoagulant proteins
WO1994011013A1 (en) 1992-11-13 1994-05-26 Duke University Chimeric blood coagulation proteins
EP0629700A3 (en) 1993-06-10 1995-02-15 Miles Inc Vector and mammalian cell line having improved productivity.
US5681746A (en) 1994-12-30 1997-10-28 Chiron Viagene, Inc. Retroviral delivery of full length factor VIII
AU6486196A (en) 1995-07-11 1997-02-10 Chiron Corporation Novel factor viii:c polypeptide analogs with altered protease sites
US7378244B2 (en) * 1997-10-01 2008-05-27 Geron Corporation Telomerase promoters sequences for screening telomerase modulators
EP1036177A1 (en) * 1997-12-05 2000-09-20 The Immune Response Corporation Novel vectors and genes exhibiting increased expression
US6200560B1 (en) 1998-10-20 2001-03-13 Avigen, Inc. Adeno-associated virus vectors for expression of factor VIII by target cells
US6221349B1 (en) 1998-10-20 2001-04-24 Avigen, Inc. Adeno-associated vectors for expression of factor VIII by target cells
WO2001094600A2 (en) * 2000-06-06 2001-12-13 Genelabs Technologies, Inc. Promoters for regulated gene expression
US6808905B2 (en) * 2001-05-14 2004-10-26 Cell Genesys, Inc. Lentiviral vectors encoding clotting factors for gene therapy
CA2461443C (en) * 2001-10-05 2011-07-12 Emory University Nucleic acid and amino acid sequences encoding high-level expressor factor viii polypeptides and methods of use
CA2469785C (en) 2001-12-17 2014-04-22 The Trustees Of The University Of Pennsylvania Adeno-associated virus (aav) serotype 8 sequences, vectors containing same, and uses therefor
KR100446621B1 (ko) * 2001-12-18 2004-09-07 삼성전자주식회사 다중 중합효소 연쇄반응에 의한 mody3유전자의 증폭을 위한 프라이머 세트
ES2521682T3 (es) 2003-05-21 2014-11-13 Genzyme Corporation Procedimientos para producir preparaciones de viriones de AAV recombinantes sustancialmente exentas de cápsidas vacías
WO2006036502A2 (en) * 2004-09-22 2006-04-06 St. Jude Children's Research Hospital Improved expression of factor ix in gene therapy vectors
EP2848253A1 (en) * 2006-06-19 2015-03-18 Asklepios Biopharmaceutical, Inc. Modified factor VIII and factor IX genes and vectors for gene therapy
WO2009097129A1 (en) 2008-01-29 2009-08-06 Applied Genetic Technologies Corporation Recombinant virus production using mammalian cells in suspension
KR101190594B1 (ko) * 2008-02-14 2012-10-15 재단법인 목암생명공학연구소 유전자 치료용 코딩 서열의 발현에 적합한 발현 벡터
WO2010037593A1 (en) * 2008-10-01 2010-04-08 Tet Systems Holding Gmbh & Co.Kg Tetracycline inducible transcription control sequence
WO2010114948A2 (en) 2009-04-02 2010-10-07 University Of Florida Research Foundation, Inc. An inducible system for highly efficient production of recombinant adeno-associated virus (raav) vectors
US8829177B2 (en) 2009-06-05 2014-09-09 The General Hospital Corporation Enhanced engineered native promoters and uses thereof
GB0911870D0 (en) * 2009-07-08 2009-08-19 Ucl Business Plc Optimised coding sequence and promoter
BR112012018899A2 (pt) 2010-01-28 2015-09-15 Philadelphia Children Hospital "método para purificar partículas de vetor de vírus adeno-associado."
CN102028943A (zh) * 2010-12-08 2011-04-27 中国人民解放军军事医学科学院微生物流行病研究所 一种呼吸道合胞病毒样颗粒疫苗及其制备方法
JP6091435B2 (ja) 2011-02-22 2017-03-08 カリフォルニア インスティチュート オブ テクノロジー アデノ随伴ウイルス(aav)ベクターを用いたタンパク質の送達
GB201210357D0 (en) * 2012-06-12 2012-07-25 Ucl Business Plc Factor VIII sequences
CA2888931C (en) 2012-10-26 2023-09-05 Vrije Universiteit Brussel Vector for liver-directed gene therapy of hemophilia and methods and use thereof
LT2956477T (lt) * 2013-02-15 2021-02-10 Bioverativ Therapeutics Inc. Optimizuotas faktoriaus viii genas
US9504762B2 (en) * 2013-09-12 2016-11-29 Biomarin Pharmaceutical Inc. Adeno-associated virus factor VIII vectors
WO2016004113A1 (en) * 2014-06-30 2016-01-07 Biogen Ma Inc. Optimized factor ix gene
WO2016025764A2 (en) * 2014-08-13 2016-02-18 The Children's Hospital Of Philadelphia An improved expression cassette for packaging and expression of variant factor viii for the treatment of hemostasis disorders
CN115074366A (zh) * 2015-04-16 2022-09-20 埃默里大学 用于肝脏中蛋白质表达的重组启动子和载体及其用途

Also Published As

Publication number Publication date
HK1250021A1 (zh) 2018-11-23
WO2016168728A2 (en) 2016-10-20
EP3283126B1 (en) 2019-11-06
US10058624B2 (en) 2018-08-28
CN108093639A (zh) 2018-05-29
US20210128751A1 (en) 2021-05-06
US10898588B2 (en) 2021-01-26
EP3626274A3 (en) 2020-06-17
CN108093639B (zh) 2022-07-19
EP3283126A2 (en) 2018-02-21
WO2016168728A3 (en) 2016-11-24
CN115074366A (zh) 2022-09-20
EP3626274A2 (en) 2020-03-25
CN115094062A (zh) 2022-09-23
US20180344877A1 (en) 2018-12-06
US20170326256A1 (en) 2017-11-16

Similar Documents

Publication Publication Date Title
ES2763551T3 (es) Promotores y vectores recombinantes para la expresión de proteínas en el hígado y uso de los mismos
US20240132912A1 (en) Constructs and methods for deliverying molecules via viral vectors with blunted innate immune responses
US11396663B2 (en) Adeno-associated virus (AAV) serotype 8 sequences, vectors containing same, and uses therefor
ES2434723T3 (es) Método de incremento de la función de un vector AAV
ES2616016T3 (es) Clados de virus adeno-asociados (AAV), secuencias, vectores que las contienen y usos de los mismos
US20090317417A1 (en) Modified AAV Vectors Having Reduced Capsid Immunogenicity and Use Thereof
WO2020223236A1 (en) Novel aav capsids and compositions containing same
NZ574186A (en) Adeno-associated virus (AAV) serotype hu.11 clades, sequences, vectors containing same, and uses therefor