ES2753201T3 - Secuencias UTR 3' para la estabilización del ARN - Google Patents

Secuencias UTR 3' para la estabilización del ARN Download PDF

Info

Publication number
ES2753201T3
ES2753201T3 ES16778784T ES16778784T ES2753201T3 ES 2753201 T3 ES2753201 T3 ES 2753201T3 ES 16778784 T ES16778784 T ES 16778784T ES 16778784 T ES16778784 T ES 16778784T ES 2753201 T3 ES2753201 T3 ES 2753201T3
Authority
ES
Spain
Prior art keywords
nucleic acid
acid sequence
fragment
sequence
rna
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
ES16778784T
Other languages
English (en)
Other versions
ES2753201T8 (es
Inventor
Von Niessen Alexandra Orlandini
Stephanie Fesser
Britta Vallazza
Tim Beissert
Andreas Kuhn
Ugur Sahin
Marco Alexander Poleganov
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
TRON Translationale Onkologie an der Universitaetsmedizin der Johannes Gutenberg Universitaet Mainz gGmbH
Biontech RNA Pharmaceuticals GmbH
Original Assignee
TRON Translationale Onkologie an der Universitaetsmedizin der Johannes Gutenberg Universitaet Mainz gGmbH
Biontech RNA Pharmaceuticals GmbH
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by TRON Translationale Onkologie an der Universitaetsmedizin der Johannes Gutenberg Universitaet Mainz gGmbH, Biontech RNA Pharmaceuticals GmbH filed Critical TRON Translationale Onkologie an der Universitaetsmedizin der Johannes Gutenberg Universitaet Mainz gGmbH
Application granted granted Critical
Publication of ES2753201T3 publication Critical patent/ES2753201T3/es
Publication of ES2753201T8 publication Critical patent/ES2753201T8/es
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • AHUMAN NECESSITIES
    • A47FURNITURE; DOMESTIC ARTICLES OR APPLIANCES; COFFEE MILLS; SPICE MILLS; SUCTION CLEANERS IN GENERAL
    • A47BTABLES; DESKS; OFFICE FURNITURE; CABINETS; DRAWERS; GENERAL DETAILS OF FURNITURE
    • A47B13/00Details of tables or desks
    • A47B13/02Underframes
    • AHUMAN NECESSITIES
    • A47FURNITURE; DOMESTIC ARTICLES OR APPLIANCES; COFFEE MILLS; SPICE MILLS; SUCTION CLEANERS IN GENERAL
    • A47BTABLES; DESKS; OFFICE FURNITURE; CABINETS; DRAWERS; GENERAL DETAILS OF FURNITURE
    • A47B3/00Folding or stowable tables
    • A47B3/002Folding or stowable tables with foldable underframe
    • AHUMAN NECESSITIES
    • A47FURNITURE; DOMESTIC ARTICLES OR APPLIANCES; COFFEE MILLS; SPICE MILLS; SUCTION CLEANERS IN GENERAL
    • A47BTABLES; DESKS; OFFICE FURNITURE; CABINETS; DRAWERS; GENERAL DETAILS OF FURNITURE
    • A47B33/00Kitchen or dish-washing tables
    • AHUMAN NECESSITIES
    • A47FURNITURE; DOMESTIC ARTICLES OR APPLIANCES; COFFEE MILLS; SPICE MILLS; SUCTION CLEANERS IN GENERAL
    • A47BTABLES; DESKS; OFFICE FURNITURE; CABINETS; DRAWERS; GENERAL DETAILS OF FURNITURE
    • A47B43/00Cabinets, racks or shelf units, characterised by features enabling folding of the cabinet or the like
    • AHUMAN NECESSITIES
    • A47FURNITURE; DOMESTIC ARTICLES OR APPLIANCES; COFFEE MILLS; SPICE MILLS; SUCTION CLEANERS IN GENERAL
    • A47BTABLES; DESKS; OFFICE FURNITURE; CABINETS; DRAWERS; GENERAL DETAILS OF FURNITURE
    • A47B77/00Kitchen cabinets
    • A47B77/02General layout, e.g. relative arrangement of compartments, working surface or surfaces, supports for apparatus
    • A47B77/022Work tops
    • AHUMAN NECESSITIES
    • A47FURNITURE; DOMESTIC ARTICLES OR APPLIANCES; COFFEE MILLS; SPICE MILLS; SUCTION CLEANERS IN GENERAL
    • A47BTABLES; DESKS; OFFICE FURNITURE; CABINETS; DRAWERS; GENERAL DETAILS OF FURNITURE
    • A47B77/00Kitchen cabinets
    • A47B77/04Provision for particular uses of compartments or other parts ; Compartments moving up and down, revolving parts
    • A47B77/06Provision for particular uses of compartments or other parts ; Compartments moving up and down, revolving parts for incorporating sinks, with or without draining boards, splash-backs, or the like
    • AHUMAN NECESSITIES
    • A47FURNITURE; DOMESTIC ARTICLES OR APPLIANCES; COFFEE MILLS; SPICE MILLS; SUCTION CLEANERS IN GENERAL
    • A47BTABLES; DESKS; OFFICE FURNITURE; CABINETS; DRAWERS; GENERAL DETAILS OF FURNITURE
    • A47B77/00Kitchen cabinets
    • A47B77/04Provision for particular uses of compartments or other parts ; Compartments moving up and down, revolving parts
    • A47B77/08Provision for particular uses of compartments or other parts ; Compartments moving up and down, revolving parts for incorporating apparatus operated by power, including water power; for incorporating apparatus for cooking, cooling, or laundry purposes
    • AHUMAN NECESSITIES
    • A47FURNITURE; DOMESTIC ARTICLES OR APPLIANCES; COFFEE MILLS; SPICE MILLS; SUCTION CLEANERS IN GENERAL
    • A47BTABLES; DESKS; OFFICE FURNITURE; CABINETS; DRAWERS; GENERAL DETAILS OF FURNITURE
    • A47B77/00Kitchen cabinets
    • A47B77/04Provision for particular uses of compartments or other parts ; Compartments moving up and down, revolving parts
    • A47B77/16Provision for particular uses of compartments or other parts ; Compartments moving up and down, revolving parts by adaptation of compartments or drawers for receiving or holding foodstuffs; by provision of rotatable or extensible containers for foodstuffs
    • AHUMAN NECESSITIES
    • A47FURNITURE; DOMESTIC ARTICLES OR APPLIANCES; COFFEE MILLS; SPICE MILLS; SUCTION CLEANERS IN GENERAL
    • A47BTABLES; DESKS; OFFICE FURNITURE; CABINETS; DRAWERS; GENERAL DETAILS OF FURNITURE
    • A47B77/00Kitchen cabinets
    • A47B77/04Provision for particular uses of compartments or other parts ; Compartments moving up and down, revolving parts
    • A47B77/18Provision for particular uses of compartments or other parts ; Compartments moving up and down, revolving parts by special arrangements for accommodating removable containers
    • AHUMAN NECESSITIES
    • A47FURNITURE; DOMESTIC ARTICLES OR APPLIANCES; COFFEE MILLS; SPICE MILLS; SUCTION CLEANERS IN GENERAL
    • A47BTABLES; DESKS; OFFICE FURNITURE; CABINETS; DRAWERS; GENERAL DETAILS OF FURNITURE
    • A47B95/00Fittings for furniture
    • AHUMAN NECESSITIES
    • A47FURNITURE; DOMESTIC ARTICLES OR APPLIANCES; COFFEE MILLS; SPICE MILLS; SUCTION CLEANERS IN GENERAL
    • A47BTABLES; DESKS; OFFICE FURNITURE; CABINETS; DRAWERS; GENERAL DETAILS OF FURNITURE
    • A47B95/00Fittings for furniture
    • A47B95/008Suspension fittings for cabinets to be hung on walls
    • AHUMAN NECESSITIES
    • A47FURNITURE; DOMESTIC ARTICLES OR APPLIANCES; COFFEE MILLS; SPICE MILLS; SUCTION CLEANERS IN GENERAL
    • A47CCHAIRS; SOFAS; BEDS
    • A47C4/00Foldable, collapsible or dismountable chairs
    • AHUMAN NECESSITIES
    • A47FURNITURE; DOMESTIC ARTICLES OR APPLIANCES; COFFEE MILLS; SPICE MILLS; SUCTION CLEANERS IN GENERAL
    • A47CCHAIRS; SOFAS; BEDS
    • A47C4/00Foldable, collapsible or dismountable chairs
    • A47C4/04Folding chairs with inflexible seats
    • A47C4/08Folding chairs with inflexible seats having a frame made of wood or plastics
    • AHUMAN NECESSITIES
    • A47FURNITURE; DOMESTIC ARTICLES OR APPLIANCES; COFFEE MILLS; SPICE MILLS; SUCTION CLEANERS IN GENERAL
    • A47CCHAIRS; SOFAS; BEDS
    • A47C7/00Parts, details, or accessories of chairs or stools
    • A47C7/002Chair or stool bases
    • AHUMAN NECESSITIES
    • A47FURNITURE; DOMESTIC ARTICLES OR APPLIANCES; COFFEE MILLS; SPICE MILLS; SUCTION CLEANERS IN GENERAL
    • A47CCHAIRS; SOFAS; BEDS
    • A47C7/00Parts, details, or accessories of chairs or stools
    • A47C7/002Chair or stool bases
    • A47C7/006Chair or stool bases with castors
    • AHUMAN NECESSITIES
    • A47FURNITURE; DOMESTIC ARTICLES OR APPLIANCES; COFFEE MILLS; SPICE MILLS; SUCTION CLEANERS IN GENERAL
    • A47KSANITARY EQUIPMENT NOT OTHERWISE PROVIDED FOR; TOILET ACCESSORIES
    • A47K3/00Baths; Douches; Appurtenances therefor
    • A47K3/28Showers or bathing douches
    • A47K3/283Fixed showers
    • A47K3/284Pre-fabricated shower cabinets
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P31/00Antiinfectives, i.e. antibiotics, antiseptics, chemotherapeutics
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P31/00Antiinfectives, i.e. antibiotics, antiseptics, chemotherapeutics
    • A61P31/04Antibacterial agents
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P31/00Antiinfectives, i.e. antibiotics, antiseptics, chemotherapeutics
    • A61P31/10Antimycotics
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P31/00Antiinfectives, i.e. antibiotics, antiseptics, chemotherapeutics
    • A61P31/12Antivirals
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P33/00Antiparasitic agents
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P35/00Antineoplastic agents
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P35/00Antineoplastic agents
    • A61P35/02Antineoplastic agents specific for leukemia
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P35/00Antineoplastic agents
    • A61P35/04Antineoplastic agents specific for metastasis
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P37/00Drugs for immunological or allergic disorders
    • A61P37/02Immunomodulators
    • A61P37/06Immunosuppressants, e.g. drugs for graft rejection
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B60VEHICLES IN GENERAL
    • B60BVEHICLE WHEELS; CASTORS; AXLES FOR WHEELS OR CASTORS; INCREASING WHEEL ADHESION
    • B60B33/00Castors in general; Anti-clogging castors
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/113Non-coding nucleic acids modulating the expression of genes, e.g. antisense oligonucleotides; Antisense DNA or RNA; Triplex- forming oligonucleotides; Catalytic nucleic acids, e.g. ribozymes; Nucleic acids used in co-suppression or gene silencing
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/67General methods for enhancing the expression
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/87Introduction of foreign genetic material using processes not otherwise provided for, e.g. co-transformation
    • C12N15/90Stable introduction of foreign DNA into chromosome
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N5/00Undifferentiated human, animal or plant cells, e.g. cell lines; Tissues; Cultivation or maintenance thereof; Culture media therefor
    • C12N5/06Animal cells or tissues; Human cells or tissues
    • C12N5/0602Vertebrate cells
    • C12N5/0603Embryonic cells ; Embryoid bodies
    • C12N5/0606Pluripotent embryonic cells, e.g. embryonic stem cells [ES]
    • EFIXED CONSTRUCTIONS
    • E04BUILDING
    • E04HBUILDINGS OR LIKE STRUCTURES FOR PARTICULAR PURPOSES; SWIMMING OR SPLASH BATHS OR POOLS; MASTS; FENCING; TENTS OR CANOPIES, IN GENERAL
    • E04H1/00Buildings or groups of buildings for dwelling or office purposes; General layout, e.g. modular co-ordination or staggered storeys
    • E04H1/12Small buildings or other erections for limited occupation, erected in the open air or arranged in buildings, e.g. kiosks, waiting shelters for bus stops or for filling stations, roofs for railway platforms, watchmen's huts or dressing cubicles
    • E04H1/125Small buildings, arranged in other buildings
    • E04H1/1266Cubicles for dressing; Toilets
    • FMECHANICAL ENGINEERING; LIGHTING; HEATING; WEAPONS; BLASTING
    • F16ENGINEERING ELEMENTS AND UNITS; GENERAL MEASURES FOR PRODUCING AND MAINTAINING EFFECTIVE FUNCTIONING OF MACHINES OR INSTALLATIONS; THERMAL INSULATION IN GENERAL
    • F16CSHAFTS; FLEXIBLE SHAFTS; ELEMENTS OR CRANKSHAFT MECHANISMS; ROTARY BODIES OTHER THAN GEARING ELEMENTS; BEARINGS
    • F16C11/00Pivots; Pivotal connections
    • F16C11/04Pivotal connections
    • AHUMAN NECESSITIES
    • A47FURNITURE; DOMESTIC ARTICLES OR APPLIANCES; COFFEE MILLS; SPICE MILLS; SUCTION CLEANERS IN GENERAL
    • A47BTABLES; DESKS; OFFICE FURNITURE; CABINETS; DRAWERS; GENERAL DETAILS OF FURNITURE
    • A47B3/00Folding or stowable tables
    • A47B3/002Folding or stowable tables with foldable underframe
    • A47B2003/006Folding or stowable tables with foldable underframe having X/Y-crossed legs rotating around a central vertical axis
    • AHUMAN NECESSITIES
    • A47FURNITURE; DOMESTIC ARTICLES OR APPLIANCES; COFFEE MILLS; SPICE MILLS; SUCTION CLEANERS IN GENERAL
    • A47BTABLES; DESKS; OFFICE FURNITURE; CABINETS; DRAWERS; GENERAL DETAILS OF FURNITURE
    • A47B2200/00General construction of tables or desks
    • A47B2200/0011Underframes
    • A47B2200/0017Nodal leg assembly for table
    • A47B2200/0018Nodal leg assembly for table in two parts
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2310/00Structure or type of the nucleic acid
    • C12N2310/10Type of nucleic acid
    • C12N2310/11Antisense
    • C12N2310/113Antisense targeting other non-coding nucleic acids, e.g. antagomirs
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02ATECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
    • Y02A50/00TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE in human health protection, e.g. against extreme weather
    • Y02A50/30Against vector-borne diseases, e.g. mosquito-borne, fly-borne, tick-borne or waterborne diseases whose impact is exacerbated by climate change

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Genetics & Genomics (AREA)
  • Organic Chemistry (AREA)
  • Chemical & Material Sciences (AREA)
  • Biomedical Technology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Health & Medical Sciences (AREA)
  • Wood Science & Technology (AREA)
  • General Engineering & Computer Science (AREA)
  • Zoology (AREA)
  • Biotechnology (AREA)
  • Public Health (AREA)
  • Molecular Biology (AREA)
  • Veterinary Medicine (AREA)
  • Pharmacology & Pharmacy (AREA)
  • Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
  • Animal Behavior & Ethology (AREA)
  • Medicinal Chemistry (AREA)
  • General Chemical & Material Sciences (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Microbiology (AREA)
  • Biochemistry (AREA)
  • Physics & Mathematics (AREA)
  • Biophysics (AREA)
  • Plant Pathology (AREA)
  • Oncology (AREA)
  • Communicable Diseases (AREA)
  • Reproductive Health (AREA)
  • Architecture (AREA)
  • Developmental Biology & Embryology (AREA)
  • Gynecology & Obstetrics (AREA)
  • Immunology (AREA)
  • Mycology (AREA)
  • Mechanical Engineering (AREA)
  • Cell Biology (AREA)
  • Epidemiology (AREA)
  • Civil Engineering (AREA)
  • Sustainable Development (AREA)

Abstract

Una molécula de ácido nucleico que comprende en la dirección de transcripción 5 '→ 3': (a) un promotor; 5 (b) una secuencia de ácido nucleico transcribible o una secuencia de ácido nucleico para introducir una secuencia de ácido nucleico transcribible; y (c) una secuencia de ácido nucleico que, cuando se transcribe bajo el control del promotor (a), codifica para una región no traducida en 3' en el transcrito que no está naturalmente unida a la secuencia de ácido nucleico (b), dicha región no traducida en 3' comprende 10 (i) (c-4) la secuencia de ácido nucleico de la región no traducida en 3' del Potenciador de la Separación del Amino Terminal (AES) que comprende o consiste en una secuencia de ácido nucleico seleccionada del grupo que consiste en las SEC ID NOs: 86 a 89, preferentemente la SEQ ID NO: 86, un fragmento de esta, o una variante de dicha secuencia o fragmento de ácido nucleico que es al menos 90 % idéntica a dicha secuencia o fragmento de ácido nucleico; o 15 (ii) (c-8) cualquier combinación de (c-4) y una o más secuencias de ácido nucleico seleccionadas del grupo que consiste en: (c-1) la secuencia de ácido nucleico de la región no traducida en 3' del Fragmento Fc de IgG, Receptor, Transportador, Alfa (FCGRT) que comprende o consiste en una secuencia de ácido nucleico seleccionada del grupo que consiste en las SEC ID NOs: 1 a 50, preferentemente la SEQ ID NO: 27, un fragmento de esta, o una 20 variante de dicha secuencia o fragmento de ácido nucleico que es al menos 90 % idéntica a dicha secuencia o fragmento de ácido nucleico, (c-2) la secuencia de ácido nucleico de la región no traducida en 3' de la Proteína Específica de Linfocitos 1 (LSP1) que comprende o consiste en una secuencia de ácido nucleico seleccionada del grupo que consiste en las SEC ID NOs: 51 a 72, preferentemente la SEQ ID NO: 52, un fragmento de esta, o una variante de dicha secuencia o 25 fragmento de ácido nucleico que es al menos 90 % idéntica a dicha secuencia o fragmento de ácido nucleico, (c-3) la secuencia de ácido nucleico de la región no traducida en 3' del Ligando de Quimiocina 22 (CCL22) que comprende o consiste en una secuencia de ácido nucleico seleccionada del grupo que consiste en las SEC ID NOs: 73 a 85, preferentemente la SEQ ID NO: 79, un fragmento de esta, o una variante de dicha secuencia o fragmento de ácido nucleico que es al menos 90 % idéntica a dicha secuencia o fragmento de ácido nucleico, 30 (c-4) la secuencia de ácido nucleico de la región no traducida en 3' del Potenciador de la Separación del Amino Terminal (AES) que comprende o consiste en una secuencia de ácido nucleico seleccionada del grupo que consiste en las SEQ ID NOs: 86 a 89, preferentemente la SEQ ID NO: 86, un fragmento de esta, o una variante de dicha secuencia o fragmento de ácido nucleico que es al menos 90 % idéntica a dicha secuencia o fragmento de ácido nucleico, 35 (c-5) la secuencia de ácido nucleico de la región no traducida en 3' del Miembro 3 de la Familia de fosfolipasa D (PLD3) que comprende o consiste en una secuencia de ácido nucleico seleccionada del grupo que consiste en las SEC ID NOs: 90 a 104, preferentemente la SEQ ID NO: 96, un fragmento de esta, o una variante de dicha secuencia o fragmento de ácido nucleico que es al menos 90 % idéntica a dicha secuencia o fragmento de ácido nucleico, 40 (c-6) la secuencia de ácido nucleico del ARN no codificante del ARN 12S codificadomitocondrialmente (MT-RNR1) que comprende o consiste en una secuencia de ácido nucleico seleccionada del grupo que consiste en las SEC ID NOs: 105 a 121, preferentemente la SEQ ID NO: 115, un fragmento de esta, o una variante de dicha secuencia o fragmento de ácido nucleico que es al menos 90 % idéntica a dicha secuencia o fragmento de ácido nucleico, y (c-7) la secuencia nucleica de la región no traducida en 3' del Complejo Principal de Histocompatibilidad Clase II 45 DR Beta 4 (HLA-DRB4) que comprende o consiste en una secuencia de ácido nucleico seleccionada del grupo que consiste en las SEC ID NOs: 122 a 143, preferentemente la SEQ ID NO: 126, un fragmento de esta, o una variante de dicha secuencia o fragmento de ácido nucleico que es al menos 90 % idéntica a dicha secuencia o fragmento de ácido nucleico, en donde las secuencias de ácido nucleico (b) y (c) bajo el control del promotor (a) pueden transcribirse para 50 proporcionar un transcrito común en el que la secuencia de ácido nucleico transcrita a partir de la secuencia de ácido nucleico (c) está activa para aumentar la eficiencia de la traducción y/o la estabilidad de la secuencia de ácido nucleico transcrita a partir de la secuencia de ácido nucleico transcribible (b).

Description

DESCRIPCIÓN
Secuencias UTR 3' para la estabilización del ARN
El uso del ARN ofrece una alternativa atractiva respecto al ADN para sortear los riesgos potenciales de seguridad relacionados con el uso terapéutico del ADN. El ARN transcrito In vitro (IVT-ARN) es de particular interés en los enfoques terapéuticos. Las ventajas de un uso terapéutico del ARN incluyen la expresión transitoria y un carácter no transformante. El ARN no necesita ingresar al núcleo para expresarse y, además, no puede integrarse en el genoma del huésped, de esta manera elimina el riesgo de oncogénesis. Cuando se usa para la vacunación, la inyección del ARN puede inducir respuesta inmunitaria celular y humoral in vivo. Sin embargo, el uso del ARN para aplicaciones clínicas es muy restringido, especialmente por la corta vida media del ARN.
Los vectores IVT pueden usarse de manera estandarizada como molde para la transcripción in vitro. Tales vectores IVT pueden tener la siguiente estructura: un promotor 5' de la ARN polimerasa que permite la transcripción del ARN, seguido de un gen de interés que está flanqueado 3' y/o 5' por regiones no traducidas (UTR), y un casete de poliadenilo 3' que contiene nucleótidos de A. Antes de la transcripción in vitro el plásmido circular se linealiza en dirección 3' del casete de poliadenilo mediante enzimas de restricción de tipo II (la secuencia de reconocimiento corresponde al sitio de escisión). Por lo tanto, el casete de poliadenilo corresponde a la secuencia de poli(A) posterior en el transcrito.
Las células dendríticas inmaduras humanas (hiDC) se usan ampliamente para desarrollar y mejorar las inmunoterapias para el tratamiento del cáncer. Las hiDC cargadas con el ARNm transcrito in vitro (IVT), que codifica un antígeno tumoral específico (TA), pueden inducir una respuesta antitumoral eficaz. Sin embargo, un requisito previo para una respuesta inmunitaria eficaz, mediante el uso de vacunas contra el cáncer basadas en ARN, es la alta estabilidad y la eficiencia de la traducción del ARN. Ambas pueden mejorarse mediante modificaciones estructurales del 5'-CAP, la cola 3' poli(A), así como también las regiones no traducidas (UTR) en 5' y 3'. Los elementos de secuencia dentro de las UTR afectan la eficiencia de la traducción (principalmente 5'-UTR) y la estabilidad del ARN (principalmente UTR-3').
En trabajos anteriores demostramos que dos copias consecutivas de la UTR-3' de beta-globina humana (ahora llamada 2hBg; además, anteriormente 2pgUTR) contribuyen a una mayor estabilidad de la transcripción y eficiencia de la traducción (Holtkamp (2006) Blood 108:4009-4017). Sin embargo, la presencia de dos copias idénticas de la secuencia UTR-3' de la beta-globina humana en el ADN plasmídico, que finalmente se usa como molde para la transcripción del ARN in vitro conlleva el riesgo de recombinación durante su propagación en E. coli. De manera similar, cualquier enfoque de clonación, especialmente mediante el uso de amplificación basada en PCR, es muy difícil. Lo mismo es cierto para la amplificación basada en PCR de la región que codifica el ARN de 2hBg en el extremo 3' para usarse como molde para la transcripción in vitro, porque aquí se han observado errores de hibridación, que conducen a la omisión de una copia de UTR-3' de la beta-globina humana. Para evitar estos problemas, buscamos identificar secuencias novedosas que tengan un efecto estabilizador en el ARNm transcrito in vitro al menos similar a, idealmente incluso mejor que, la secuencia de 2hBg.
Xia y otros (International Journal of Molecular Medicine, 2013, 31(5):1081-1086) se refiere al gen "Potenciador de la Separación del Amino Terminal" (AES).
El objeto de la presente invención fue proporcionar ARN con aumento de la estabilidad y/o eficiencia de la traducción y los medios para obtener tal ARN. Debería ser posible obtener mayores grados de expresión mediante el uso de dicho ARN en la terapia.
Este objeto se logra de acuerdo con la invención mediante el contenido de las reivindicaciones.
La presente invención se refiere a la estabilización del ARN, en particular el ARNm, y un aumento en la traducción del ARNm. La presente invención se refiere particularmente a una modificación del ARN, en particular del ARN transcrito in vitro, que resulta en un aumento de la estabilidad del transcrito y/o de la eficiencia de la traducción.
De acuerdo con la invención, se demostró que determinadas secuencias en la región no traducida en 3' (UTR) de una molécula de ARN mejoran la estabilidad y la eficiencia de la traducción.
Mediante el uso del ARN modificado de acuerdo con la invención en la transfección de células dendríticas (DC), será posible, por ejemplo, aumentar la densidad de complejos de péptido/MHC específicos de antígeno sobre las células transfectadas y su capacidad para estimular y expandir las células T CD4+ y c D8+ específicas para un antígeno. Por lo tanto, la invención, en una modalidad, se refiere a una estrategia para optimizar las vacunas de ARN para transfectar DC o vacunas de DC transfectadas con ARN mediante el uso de ARN que se ha modificado por las modificaciones del ARN descritas de acuerdo con la invención.
De acuerdo con la invención, la modificación, y de esta manera la estabilización y/o el aumento en la eficiencia de la traducción, del ARN se logra, preferentemente, mediante la modificación genética de los vectores de expresión que, preferentemente, sirven como molde para la transcripción del ARN in vitro. Estos vectores de expresión permiten la transcripción del ARN con una región no traducida en 3' descrita de acuerdo con la invención, y, preferentemente, entre la secuencia codificante de un péptido o proteína (marco abierto de lectura) y la secuencia de poli(A).
Estos vectores pueden permitir, además, la transcripción del ARN con una secuencia de poli(A) que, preferentemente, tiene un extremo abierto en dicho ARN, es decir, no hay nucleótidos distintos de los nucleótidos A que flanquean dicha secuencia de poli(A) en su extremo 3'. Puede lograrse una secuencia de poli(A) de extremo abierto en el ARN mediante la introducción de un sitio de escisión de restricción de tipo IIS en un vector de expresión que permite transcribir el ARN bajo el control de un promotor de la ARN polimerasa 5' y que contiene un casete de poliadenilo, en donde la secuencia de reconocimiento se ubica en dirección 3' del casete de poliadenilo, mientras que el sitio de escisión se ubica en dirección 5' y, por lo tanto, dentro del casete de poliadenilo. La escisión por restricción en el sitio de escisión por restricción de tipo IIS permite que un plásmido se linealice dentro del casete de poliadenilo. El plásmido linealizado puede usarse después como molde para la transcripción in vitro, el transcrito resultante termina en una secuencia de poli(A) expuesta. Además, una interrupción opcional del casete de poliadenilo 3' por una secuencia de nucleótidos aleatoria, con una distribución igual de los 4 nucleótidos (enlazador), aumenta la estabilidad del casete de poliadenilo 3' en E. coli.
Resumen de la invención
En un aspecto, la invención se refiere a una molécula de ácido nucleico como se definió en la reivindicación 1 adjunta.
En una modalidad, la secuencia de ácido nucleico (c-8) comprende una combinación de (c-4) y (c-6). En una modalidad, (c-4) se ubica 5' respecto a (c-6). En una modalidad, la combinación de (c-4) y (c-6) comprende la secuencia de ácido nucleico de la SEQ ID NO: 174, un fragmento de esta, o una variante de dicha secuencia o fragmento de ácido nucleico que es al menos 90 % idéntica a dicha secuencia o fragmento de ácido nucleico.
En una modalidad, la molécula de ácido nucleico de la invención comprende además (d) una secuencia de ácido nucleico que, cuando se transcribe bajo el control del promotor (a), codifica para una secuencia de ácido nucleico que es una secuencia de poliadenilo que opcionalmente comprende dentro de la secuencia de poliadenilo una secuencia de uno o más nucleótidos consecutivos que contienen nucleótidos distintos de los nucleótidos A. En una modalidad, dicha secuencia de poliadenilo comprende al menos 20 nucleótidos A, preferentemente al menos 40, al menos 80, al menos 100 o al menos 120 nucleótidos A, preferentemente nucleótidos A consecutivos. En una modalidad, dicha secuencia de uno o más nucleótidos consecutivos que contienen nucleótidos distintos de los nucleótidos A es una secuencia, preferentemente, una secuencia arbitraria, de 2 o más nucleótidos consecutivos, en donde el primer y el último nucleótido de dicha secuencia de 2 o más nucleótidos consecutivos es un nucleótido distinto de un nucleótido A. En una modalidad, dicha secuencia de ácido nucleico (d) es una secuencia de ácido nucleico que, cuando se transcribe bajo el control del promotor (a), codifica para una secuencia de ácido nucleico que es una secuencia de poliadenilo que comprende dentro de la secuencia de poliadenilo una secuencia de uno o más nucleótidos consecutivos que contienen nucleótidos distintos de los nucleótidos A y que exhiben una mayor estabilidad tras la propagación de dicha molécula de ácido nucleico en Escherichia coli en comparación con una molécula de ácido nucleico que comprende en lugar de dicha secuencia de ácido nucleico (d) una secuencia de ácido nucleico (d)' que, cuando se transcribe bajo el control del promotor (a), codifica para una secuencia de poliadenilo de la misma longitud que dicha secuencia de ácido nucleico que es una secuencia de poliadenilo que comprende dentro de la secuencia de poliadenilo una secuencia de uno o más nucleótidos consecutivos que contienen nucleótidos distintos de nucleótidos A. En una modalidad, dicha secuencia de ácido nucleico que es una secuencia de poliadenilo que comprende opcionalmente dentro de la secuencia de poliadenilo una secuencia de uno o más nucleótidos consecutivos que contienen nucleótidos distintos de los nucleótidos A, comprende al menos 80 nucleótidos, preferentemente, al menos 90 o 100 nucleótidos. En una modalidad, dicha secuencia de ácido nucleico, que es una secuencia de poliadenilo, que comprende opcionalmente dentro de la secuencia de poliadenilo una secuencia de uno o más nucleótidos consecutivos que contienen nucleótidos distintos de nucleótidos A comprende al menos 90 nucleótidos, preferentemente al menos 100 nucleótidos, preferentemente al menos 110 nucleótidos. En una modalidad, dicha secuencia de ácido nucleico que es una secuencia de poliadenilo que comprende opcionalmente dentro de la secuencia de poliadenilo una secuencia de uno o más nucleótidos consecutivos que contienen nucleótidos distintos de los nucleótidos A comprende aproximadamente 120 nucleótidos. En modalidades particulares, dicha secuencia de ácido nucleico que es una secuencia de poliadenilo, que comprende opcionalmente dentro de la secuencia de poliadenilo una secuencia de uno o más nucleótidos consecutivos que contienen nucleótidos distintos de nucleótidos A, comprende hasta 200, preferentemente hasta 150, y, en particular, hasta 130 nucleótidos. En una modalidad, al menos 90 %, preferentemente al menos 92 %, preferentemente al menos 95 %, 97 % o 98 % de los nucleótidos de dicha secuencia de ácido nucleico que es una secuencia de poliadenilo que opcionalmente comprende dentro de la secuencia de poliadenilo una secuencia de uno o más nucleótidos consecutivos que contienen nucleótidos distintos de los nucleótidos A son nucleótidos A en dicha secuencia de poliadenilo (sin incluir los nucleótidos A en dicha secuencia de uno o más nucleótidos consecutivos que contienen nucleótidos distintos de los nucleótidos A).
En una modalidad, dicha secuencia de uno o más nucleótidos consecutivos que contienen nucleótidos distintos de los nucleótidos A se ubica dentro de una región desde la posición 21 a la posición 80, preferentemente desde la posición 21 a la posición 60, con mayor preferencia desde la posición 31 a la posición 50 de dicha secuencia de poliadenilo.
En una modalidad, dicha secuencia de uno o más nucleótidos consecutivos que contienen nucleótidos distintos de los nucleótidos A está precedida por al menos 20 residuos A, preferentemente al menos 30, 40 o 50 residuos A en dicha secuencia de poliadenilo. En modalidades particulares, dicha secuencia de uno o más nucleótidos consecutivos que contienen nucleótidos distintos de nucleótidos A está precedida por hasta 80 residuos A, preferentemente hasta 70 o 60 residuos A en dicha secuencia de poliadenilo.
En una modalidad, dicha secuencia de uno o más nucleótidos consecutivos que contienen nucleótidos distintos de los nucleótidos A es seguida por al menos 20 residuos A, preferentemente al menos 30, 40, 50, 60 o 70 residuos A en dicha secuencia de poliadenilo. En modalidades particulares, dicha secuencia de uno o más nucleótidos consecutivos que contienen nucleótidos distintos de los nucleótidos A es seguida por hasta 100 residuos A, preferentemente hasta 80 residuos A en dicha secuencia de poliadenilo.
En una modalidad, dicha secuencia de uno o más nucleótidos consecutivos que contienen nucleótidos distintos de los nucleótidos A está precedida por 20 a 50, preferentemente 30 a 40 residuos A en dicha secuencia de poliadenilo y es seguida por 30 a 80, preferentemente 40 a 70 residuos A en dicha secuencia de poliadenilo.
En una modalidad, dicha secuencia de uno o más nucleótidos consecutivos que contienen nucleótidos distintos de los nucleótidos A tiene una longitud de al menos 3, al menos 4, al menos 5, al menos 6, al menos 8, preferentemente al menos 10, con mayor preferencia al menos 15 nucleótidos.
En una modalidad, dicha secuencia de uno o más nucleótidos consecutivos que contienen nucleótidos distintos de nucleótidos A tiene una longitud de no más de 50, preferentemente no más de 30, con mayor preferencia no más de 20 nucleótidos.
En una modalidad, dicha secuencia de uno o más nucleótidos consecutivos que contienen nucleótidos distintos de los nucleótidos A no comprende más de 3, preferentemente no más de 2, preferentemente no hay residuos A consecutivos.
En una modalidad, las secuencias de ácido nucleico (b), (c) y (d) bajo el control del promotor (a) pueden transcribirse para dar un transcrito común. En una modalidad, las secuencias de ácido nucleico transcritas a partir de las secuencias de ácido nucleico (c) y opcionalmente (d) son activas para aumentar la eficiencia de traducción y/o la estabilidad de la secuencia de ácido nucleico transcrita a partir de la secuencia de ácido nucleico transcribible (b).
En una modalidad, en el transcrito dicha secuencia de ácido nucleico, que es una secuencia de poliadenilo que comprende opcionalmente dentro de la secuencia de poliadenilo una secuencia de uno o más nucleótidos consecutivos que contienen nucleótidos distintos de los nucleótidos A, se ubica en el extremo 3'.
En una modalidad, la molécula de ácido nucleico de la invención es una molécula de ADN. En una modalidad, dicha molécula de ácido nucleico es un vector de expresión o plásmido tal como un vector IVT.
En una modalidad, la molécula de ácido nucleico de la invención es una molécula circular cerrada o una molécula lineal.
En una modalidad, la secuencia de ácido nucleico transcribible comprende una secuencia de ácido nucleico que codifica para un péptido o proteína y la secuencia de ácido nucleico para introducir una secuencia de ácido nucleico transcribible es un sitio de clonación múltiple.
En una modalidad, la molécula de ácido nucleico de la invención comprende, además, uno o más miembros seleccionados del grupo que consiste en: (i) un gen reportero; (ii) un marcador de selección; y (iii) un origen de replicación.
En una modalidad, la molécula de ácido nucleico de la invención es adecuada, en particular después de la linealización, para la transcripción del ARN in vitro, en particular el ARNm.
Antes de la transcripción in vitro, los vectores circulares de IVT generalmente se linealizan en dirección 3' del casete de poliadenilo mediante enzimas de restricción de tipo II (la secuencia de reconocimiento corresponde al sitio de escisión). Por lo tanto, el casete de poliadenilo corresponde a la secuencia de poli(A) posterior en el transcrito. Como un resultado de este procedimiento, algunos nucleótidos permanecen como parte del sitio de escisión enzimática después de la linealización y extienden o enmascaran la secuencia de poli(A) en el extremo 3'. Sin embargo, se descubrió que el ARN que tiene una secuencia poli(A) de extremo abierto se traduce de manera más eficiente que el ARN que tiene una secuencia poli(A) con un terminal enmascarado.
En consecuencia, las moléculas de ácido nucleico de la invención cuando se usan como vectores de expresión permiten, preferentemente, la transcripción del ARN con una secuencia de poli(A) que, preferentemente, tiene un extremo abierto en dicho ARN, es decir, no hay nucleótidos distintos de los nucleótidos A que flanquean dicha secuencia de poli(A) en su extremo 3'. Una secuencia de poli(A) de extremo abierto en el ARN puede lograrse mediante la introducción de un sitio de escisión de restricción de tipo IIS en un vector de expresión que permite transcribir el ARN bajo el control de un promotor 5' de la ARN polimerasa y que contiene un casete de poliadenilo, en donde la secuencia de reconocimiento se ubica en dirección 3' del casete de poliadenilo, mientras que el sitio de escisión se ubica en dirección 5' y, por lo tanto, dentro del casete de poliadenilo. La escisión por restricción en el sitio de escisión por restricción de tipo IIS permite que un plásmido se linealice dentro del casete de poliadenilo. El plásmido linealizado puede usarse después como molde para la transcripción in vitro, el transcrito resultante termina en una secuencia de poli(A) expuesta.
En consecuencia, en una modalidad, se prefiere que la molécula de ácido nucleico de la invención pueda escindirse, preferentemente enzimáticamente o de otra manera bioquímica, dentro de la secuencia de ácido nucleico (d) de tal manera que dicha escisión resulte en una molécula de ácido nucleico que comprende, en la dirección de transcripción 5' ^ 3', el promotor (a), las secuencias de ácido nucleico (b) y (c), y al menos una parte de la secuencia de ácido nucleico (d), en donde la al menos una parte de la secuencia de ácido nucleico (d), cuando se transcribe bajo el control del promotor (a), codifica para dicha secuencia de ácido nucleico que es una secuencia de poliadenilo que comprende opcionalmente dentro de la secuencia de poliadenilo una secuencia de uno o más nucleótidos consecutivos que contienen nucleótidos distintos de los nucleótidos A y en donde en el transcrito el nucleótido terminal 3' es un nucleótido A de dicha secuencia de ácido nucleico que es una secuencia de poliadenilo que comprende opcionalmente dentro de la secuencia de poliadenilo una secuencia de uno o más nucleótidos consecutivos que contienen nucleótidos distintos de los nucleótidos A.
Preferentemente, después de la escisión, la molécula de ácido nucleico, en el extremo de la cadena que sirve como molde para la secuencia de ácido nucleico que es una secuencia de poliadenilo que comprende opcionalmente dentro de la secuencia de poliadenilo una secuencia de uno o más nucleótidos consecutivos que contienen nucleótidos distintos de los nucleótidos A, tiene un nucleótido T que es parte de la secuencia de ácido nucleico que sirve como molde para la secuencia de ácido nucleico que es una secuencia de poliadenilo que opcionalmente comprende dentro de la secuencia de poliadenilo una secuencia de uno o más nucleótidos consecutivos que contienen nucleótidos distintos de los nucleótidos A.
La molécula de ácido nucleico de la invención es, preferentemente, una molécula circular cerrada antes de la escisión y una molécula lineal después de la escisión.
Preferentemente, la escisión se realiza con la ayuda de un sitio de escisión de restricción que es, preferentemente, un sitio de escisión de restricción para una endonucleasa de restricción de tipo IIS.
En una modalidad, la secuencia de reconocimiento para la endonucleasa de restricción de tipo IIS se ubica en 5-26 pares de bases, preferentemente 24-26 pares de bases, en dirección 3' del extremo 3' de la secuencia de ácido nucleico (d).
En una modalidad, una molécula de ácido nucleico de acuerdo con la invención está en una conformación circular cerrada y, preferentemente, adecuada para la transcripción del ARN vitro, en particular el ARNm, en particular después de la linealización.
En aspectos adicionales, la invención se refiere al ARN que se obtiene mediante la transcripción, preferentemente, la transcripción in vitro, como se definió en la reivindicación 8 adjunta.
Por lo tanto, la invención en un aspecto se refiere al ARN como se definió en la reivindicación 9 adjunta.
En una modalidad, el ARN comprende además (d) una secuencia de ácido nucleico que es una secuencia de poliadenilo que comprende opcionalmente dentro de la secuencia de poliadenilo una secuencia de uno o más nucleótidos consecutivos que contienen nucleótidos distintos de los nucleótidos A. En una modalidad, dicha secuencia de ácido nucleico (d) se ubica en el extremo 3' de dicho ARN.
En una modalidad, las secuencias de ácido nucleico (c) y, opcionalmente, (d) son activas para aumentar la eficiencia de traducción y/o la estabilidad de la secuencia de ácido nucleico que codifica para un péptido o proteína.
En una modalidad, el ARN comprende además (e) un casquete 5'.
Las modalidades de la región no traducida en 3' y la secuencia de ácido nucleico, que es una secuencia de poliadenilo que comprende opcionalmente dentro de la secuencia de poliadenilo una secuencia de uno o más nucleótidos consecutivos que contienen nucleótidos distintos de los nucleótidos A, son como se describió anteriormente para las moléculas de ácido nucleico de la invención.
En un aspecto adicional, la invención se refiere a un método para obtener ARN como se definió en la reivindicación 12 adjunta.
En un aspecto adicional, la invención se refiere a un método para obtener un péptido o proteína como se definió en la reivindicación 13 adjunta.
En una modalidad, el método para obtener el ARN o el método para obtener un péptido o proteína comprende además, antes de la transcripción de la molécula de ácido nucleico, la escisión de la molécula de ácido nucleico.
En un aspecto adicional, la invención se refiere a un método para obtener ARN como se definió en la reivindicación 15 adjunta.
En una modalidad, el método comprende además el acoplamiento de una secuencia de ácido nucleico (c) que, cuando se transcribe, codifica para una secuencia de ácido nucleico que es una secuencia de poliadenilo que opcionalmente comprende dentro de la secuencia de poliadenilo una secuencia de uno o más nucleótidos consecutivos que contienen nucleótidos distintos de nucleótidos A, en el extremo 3' de la secuencia de ácido nucleico (b).
En una modalidad, las secuencias de ácido nucleico (a), (b), y (c) pueden transcribirse para proporcionar un transcrito común en el que las secuencias de ácido nucleico transcritas a partir de las secuencias de ácido nucleico (b) y, opcionalmente, (c) son activas para aumentar la eficiencia de la traducción y/o la estabilidad de la secuencia de ácido nucleico transcrita a partir de la secuencia de ácido nucleico transcribible (a).
Las modalidades de la región no traducida en 3' y la secuencia de ácido nucleico, que es una secuencia de poliadenilo que comprende opcionalmente dentro de la secuencia de poliadenilo una secuencia de uno o más nucleótidos consecutivos que contienen nucleótidos distintos de los nucleótidos A, son como se describió anteriormente para las moléculas de ácido nucleico de la invención.
En un aspecto adicional, la invención se refiere a un método para obtener un péptido o proteína como se definió en la reivindicación 17 adjunta.
En una modalidad de cualquiera de los métodos de la invención, la transcripción se realiza in vitro.
En una modalidad, el método para obtener el ARN o el método para obtener un péptido o proteína comprende además, antes de la transcripción de la molécula de ácido nucleico, la escisión de la molécula de ácido nucleico.
En una modalidad, la escisión está dentro de la secuencia de ácido nucleico que, cuando se transcribe, codifica para una secuencia de ácido nucleico que es una secuencia de poliadenilo que opcionalmente comprende dentro de la secuencia de poliadenilo una secuencia de uno o más nucleótidos consecutivos que contienen nucleótidos distintos de los nucleótidos A, de manera que la transcripción del ácido nucleico que se obtiene de esta manera genera un transcrito que tiene en su extremo terminal 3' dicha secuencia de ácido nucleico que es una secuencia de poliadenilo que opcionalmente comprende dentro de la secuencia de poliadenilo una secuencia de uno o más nucleótidos consecutivos que contienen nucleótidos distintos de nucleótidos A, en donde el nucleótido terminal 3' de dicho transcrito es un nucleótido A de la secuencia de ácido nucleico que es una secuencia de poliadenilo que comprende opcionalmente dentro de la secuencia de poliadenilo una secuencia de uno o más nucleótidos consecutivos que contienen nucleótidos distintos de los nucleótidos A.
En todos los aspectos de los métodos de acuerdo con la invención, la escisión se realiza, preferentemente, con la ayuda de un sitio de escisión de restricción que es, preferentemente, un sitio de escisión de restricción para una endonucleasa de restricción de tipo IIS.
En una modalidad, la secuencia de reconocimiento para la endonucleasa de restricción de tipo IIS es de 5-26 pares de bases, preferentemente, 24-26 pares de bases, en dirección 3' del extremo 3' de la secuencia de ácido nucleico que, cuando se transcribe, codifica para una secuencia de ácido nucleico que es una secuencia de poliadenilo que comprende opcionalmente dentro de la secuencia de poliadenilo una secuencia de uno o más nucleótidos consecutivos que contienen nucleótidos distintos de los nucleótidos A.
La invención se refiere, además, al ARN que se obtiene mediante los métodos de acuerdo con la invención para obtener ARN.
La invención puede utilizarse, por ejemplo, para aumentar la expresión de proteínas recombinantes en la transcripción y expresión celular. Más específicamente, es posible, cuando se producen proteínas recombinantes, usar los vectores de expresión de la invención para la transcripción de ácidos nucleicos recombinantes y la expresión de proteínas recombinantes en sistemas basados en células. Esto incluye, por ejemplo, la preparación de anticuerpos recombinantes, hormonas, citocinas, enzimas y similares. Esto permite, entre otros, disminuir los costos de producción.
Además, es posible usar las moléculas de ácido nucleico de la invención para las aplicaciones de terapia génica. En consecuencia, una molécula de ácido nucleico de la invención puede ser un vector de terapia génica y usarse para la expresión de un transgén. Para este fin, puede usarse cualquier sistema de vectores basado en ácido nucleico (ADN/ARN) (por ejemplo, plásmidos, adenovirus, vectores de poxvirus, vectores de virus de la influenza, vectores de alfavirus y similares). Las células pueden transfectarse in vitro con estos vectores, por ejemplo, en linfocitos o células dendríticas, o de otra manera in vivo mediante la administración directa.
El ARN de la invención (por ejemplo, que se obtiene mediante el uso de una molécula de ácido nucleico descrita en la presente descripción como un molde de transcripción) puede usarse, por ejemplo, para la expresión transitoria de genes, con posibles campos de aplicación que son vacunas basadas en ARN que se transfectan in vitro en células o se administran directamente en vivo, expresión transitoria in vitro de proteínas recombinantes funcionales, por ejemplo, para iniciar los procesos de diferenciación en las células o para estudiar las funciones de las proteínas, y la expresión transitoria in vivo, de proteínas recombinantes funcionales tales como la eritropoyetina, hormonas, inhibidores de la coagulación, etcétera, en particular como productos farmacéuticos.
El ARN de la invención puede usarse en particular para transfectar células presentadoras de antígeno y, por lo tanto, como una herramienta para suministrar el antígeno que se presentará y para cargar las células presentadoras de antígeno, con dicho antígeno para ser presentado que corresponde al péptido o proteína expresado a partir de dicho ARN o derivado del mismo, en particular por medio de procesamiento intracelular tal como escisión, es decir, el antígeno a presentarse es, por ejemplo, un fragmento del péptido o de la proteína que se expresa a partir del ARN. Tales células presentadoras de antígeno pueden usarse para estimular las células T, en particular las células T CD4+ y/o CD8+.
En consecuencia, en un aspecto adicional, la invención se refiere a un ARN de la invención para usar en un método para transfectar una célula huésped. En una modalidad, la célula huésped es una célula presentadora de antígeno, en particular una célula dendrítica, un monocito o un macrófago.
En un aspecto adicional, la invención se refiere a un ARN de la invención para usar en la terapia, en particular para usar en un método de vacunación.
En un aspecto adicional, la invención se refiere a una composición farmacéutica tal como una composición de vacuna que comprende el ARN de la invención.
En un aspecto adicional, la invención se refiere al ARN de la invención para los usos descritos en la presente descripción.
Descripción detallada de la invención
Aunque la presente invención se describe en detalle más abajo, debe entenderse que esta invención no se limita a las metodologías, protocolos y reactivos particulares descritos en la presente descripción, ya que estos pueden variar. Debe entenderse, también, que la terminología utilizada en la presente descripción es para el propósito de describir modalidades particulares solamente, y no pretende limitar el alcance de la presente invención la cual se limitará solamente por las reivindicaciones anexas. A menos que se defina de otra manera, todos los términos técnicos y científicos que se usan en la presente descripción tienen el mismo significado que el que entiende comúnmente un experto en la técnica.
A continuación, se describirán los elementos de la presente invención. Estos elementos se enumeran con modalidades específicas, sin embargo, debe entenderse que pueden combinarse de cualquier manera y en cualquier número para crear modalidades adicionales. Los ejemplos descritos de diversas maneras y las modalidades preferidas no deben interpretarse como que limitan la presente invención a solamente las modalidades descritas explícitamente. Debe entenderse que esta descripción sustenta y abarca modalidades que combinan las modalidades descritas explícitamente con cualquier cantidad de elementos descritos y/o preferidos. Además, cualquiera de las permutaciones y combinaciones de todos los elementos descritos en esta solicitud deben considerarse descritas por la descripción de la presente solicitud a menos que el contexto lo indique de cualquier otra manera. Por ejemplo, si en una modalidad preferida una secuencia de uno o más nucleótidos consecutivos que contienen nucleótidos distintos de nucleótidos A está precedida por al menos 20 residuos A en dicha secuencia de poliadenilo y si en otra modalidad preferida una secuencia de uno o más nucleótidos consecutivos que contienen nucleótidos distintos de los nucleótidos A es seguida por al menos 20 residuos A en dicha secuencia de poliadenilo, es una modalidad preferida contemplada que una secuencia de uno o más nucleótidos consecutivos que contienen nucleótidos distintos a los nucleótidos A sea precedida y seguida por al menos 20 residuos A en dicha secuencia de poliadenilo.
Preferentemente, los términos que se usan en la presente descripción se definen como se describe en "A multilingual glossary of biotechnological terms: (IUPAC Recommendations)", H.G.W. Leuenberger, B. Nagel, y H. Kolbl, Eds., Helvetica Chimica Acta, CH-4010 Basel, Suiza, (1995).
La práctica de la presente invención empleará, a menos que se indique de otra manera, métodos convencionales de química, bioquímica, biología celular, inmunología y técnicas de ADN recombinante que se explican en la literatura del campo (consultar, por ejemplo, Molecular Cloning: A Laboratory Manual, 2da Edición, J. Sambrook y otros eds., Cold Spring Harbor Laboratory Press, Cold Spring Harbor 1989).
A lo largo de esta descripción y de las reivindicaciones que siguen, a menos que el contexto lo requiera de cualquier otra manera, la palabra “comprender”, y variaciones tales como “comprende” y “que comprende”, se entenderán que implican la inclusión de un miembro, entero o etapa o grupo de miembros, enteros o etapas indicadas pero no la exclusión de cualquier otro miembro, entero o etapa o grupo de miembros, enteros o etapas. Los términos "un" y "una" y "el/la" y referentes similares usados en el contexto para describir la invención (especialmente en el contexto de las reivindicaciones) se deben interpretar para cubrir tanto el singular como el plural, a menos que se indique de cualquier otra forma en la presente descripción o claramente se contradiga por el contexto. La enumeración de los intervalos de valores en la presente descripción pretende servir simplemente como un método abreviado para referirse individualmente a cada valor separado que se encuentra dentro del intervalo. A menos que se indique de otra manera en la presente descripción, cada valor individual se incorpora en la descripción como si se enumerara individualmente en la presente descripción. Todos los métodos que se describen en la presente descripción pueden llevarse a cabo en cualquier orden adecuado a menos que se indique de otra manera en la presente descripción o que el contexto lo contradiga claramente de otra manera. El uso de cualquiera y de todos los ejemplos, o lenguaje ilustrativo (por ejemplo, “tal como”) que se proporciona en la presente descripción simplemente tiene el propósito de ilustrar mejor la invención y no representa una limitación en el alcance de la invención que se reivindica de otra manera. El lenguaje en la descripción no deberá interpretarse como indicación de cualquier elemento no reivindicado esencial para la práctica de la invención.
Se citan varios documentos a lo largo del texto de esta descripción. Nada debe interpretarse en la presente descripción como una admisión de que la invención no tiene derecho a preceder dicha descripción en virtud de una invención anterior.
La presente invención describe moléculas de ácido nucleico tales como plásmidos de ADN útiles como vectores de expresión de ARN que comprenden secuencias de ácido nucleico que codifican regiones no traducidas en 3' (UTR) modificadas en el a Rn que tienen un efecto estabilizador sobre el a Rn y/o aumentan la eficiencia de la traducción del ARN.
El término "secuencia de ácido nucleico que, cuando se transcribe, codifica para una región no traducida en 3' en el transcrito" se refiere a una secuencia de ácido nucleico que contiene una cadena molde que codifica para dicha región no traducida en 3'. Preferentemente, dicha secuencia de ácido nucleico comprende una cadena codificante que comprende la misma secuencia de ácido nucleico que dicha región no traducida en 3' del transcrito de ARN producido (aunque con timina sustituida por uracilo). Por lo tanto, de acuerdo con la invención, una "secuencia de ácido nucleico que, cuando se transcribe, codifica para una región no traducida en 3' en el transcrito", en una modalidad, comprende una cadena codificante que comprende una región no traducida en 3' como se especificó en la presente descripción (aunque con timina sustituida por uracilo).
El término "FCGRT" se refiere al fragmento Fc de IgG, receptor, transportador, alfa e incluye el gen FCGRT. Este gen codifica un receptor que se une a la región Fc de la inmunoglobulina G monomérica. La proteína codificada transfiere los anticuerpos de inmunoglobulina G de la madre al feto a través de la placenta. Esta proteína además se une a la inmunoglobulina G para proteger el anticuerpo de la degradación.
El término "secuencia de ácido nucleico de la región no traducida en 3' de FCGRT, un fragmento de esta, o una variante de dicha secuencia o fragmento de ácido nucleico" se refiere a una secuencia de ácido nucleico que comprende, preferentemente que consiste en una secuencia de ácido nucleico seleccionada del grupo que consiste en las SEQ ID NOs: 1 a 50 del listado de secuencias o un fragmento de esta, o una variante de dicha secuencia o fragmento de ácido nucleico. En una modalidad, el término se refiere a una secuencia de ácido nucleico que comprende, preferentemente que consiste en una secuencia de ácido nucleico que es al menos 90 %, preferentemente al menos 95 %, con mayor preferencia al menos 98 % idéntica a una secuencia de ácido nucleico seleccionada del grupo que consiste en las SEQ ID NOs: 1 a 50. En una modalidad particularmente preferida, el término se refiere a una secuencia de ácido nucleico que comprende, preferentemente, que consiste en la secuencia de ácido nucleico de la SEQ ID NO: 27 o que comprende, preferentemente que consiste en una secuencia de ácido nucleico que es al menos 90 %, preferentemente al menos 95 %, con mayor preferencia al menos 98 % idéntica a la secuencia de ácido nucleico de la s Eq ID NO: 27.
El término "LSP1" se refiere a la Proteína 1 Específica de Linfocitos e incluye el gen LSP1. Este gen codifica una proteína de unión a actina F intracelular. La proteína se expresa en linfocitos, neutrófilos, macrófagos y en el endotelio, y puede regular la motilidad de los neutrófilos, la adhesión a las proteínas de la matriz de fibrinógeno, y la migración transendotelial.
El término "secuencia de ácido nucleico de la región no traducida en 3' de LSP1, un fragmento de esta, o una variante de dicha secuencia o fragmento de ácido nucleico" se refiere a una secuencia de ácido nucleico que comprende, preferentemente que consiste en una secuencia de ácido nucleico seleccionada del grupo que consiste en las SEQ ID NOs: 51 a 72 del listado de secuencias o un fragmento de esta, o una variante de dicha secuencia o fragmento de ácido nucleico. En una modalidad, el término se refiere a una secuencia de ácido nucleico que comprende, preferentemente que consiste en una secuencia de ácido nucleico que es al menos 90 %, preferentemente al menos 95 %, con mayor preferencia al menos 98 % idéntica a una secuencia de ácido nucleico seleccionada del grupo que consiste en las SEQ ID NOs: 51 a 72. En una modalidad particularmente preferida, el término se refiere a una secuencia de ácido nucleico que comprende, preferentemente, que consiste en la secuencia de ácido nucleico de la SEQ ID NO: 52 o que comprende, preferentemente que consiste en una secuencia de ácido nucleico que es al menos 90 %, preferentemente al menos 95 %, con mayor preferencia al menos 98 % idéntica a la secuencia de ácido nucleico de la s Eq ID NO: 52.
El término "CCL22" se refiere al Ligando de Quimiocina 22 (motivo C-C) e incluye el gen CCL22. El producto de este gen se une al receptor de quimiocinas CCR4. Las quimiocinas pueden desempeñar un papel en el tráfico de los linfocitos T activados a los sitios inflamatorios y otros aspectos de la fisiología de los linfocitos T activados.
El término "secuencia de ácido nucleico de la región no traducida en 3' de CCL22, un fragmento de esta, o una variante de dicha secuencia o fragmento de ácido nucleico" se refiere a una secuencia de ácido nucleico que comprende, preferentemente que consiste en una secuencia de ácido nucleico seleccionada del grupo que consiste en las SEQ ID NOs: 73 a 85 del listado de secuencias o un fragmento de esta, o una variante de dicha secuencia o fragmento de ácido nucleico. En una modalidad, el término se refiere a una secuencia de ácido nucleico que comprende, preferentemente que consiste en una secuencia de ácido nucleico que es al menos 90 %, preferentemente al menos 95 %, con mayor preferencia al menos 98 % idéntica a una secuencia de ácido nucleico seleccionada del grupo que consiste en las SEQ ID NOs: 73 a 85. En una modalidad particularmente preferida, el término se refiere a una secuencia de ácido nucleico que comprende, preferentemente, que consiste en la secuencia de ácido nucleico de la SEQ ID NO: 79 o que comprende, preferentemente que consiste en una secuencia de ácido nucleico que es al menos 90 %, preferentemente al menos 95 %, con mayor preferencia al menos 98 % idéntica a la secuencia de ácido nucleico de la SEQ ID NO: 79.
El término "AES" se refiere al Potenciador de la Separación del Amino Terminal e incluye el gen AES. La proteína codificada por este gen pertenece a la familia de proteínas groucho/TLE, puede funcionar como un homooligómero o como un heterooligómero con otros miembros de la familia para reprimir de manera dominante la expresión de otros genes miembros de la familia.
El término "secuencia de ácido nucleico de la región no traducida en 3' de AES, un fragmento de esta, o una variante de dicha secuencia o fragmento de ácido nucleico" se refiere a una secuencia de ácido nucleico que comprende, preferentemente que consiste en una secuencia de ácido nucleico seleccionada del grupo que consiste en las SEQ ID NOs: 86 a 89 del listado de secuencias o un fragmento de esta, o una variante de dicha secuencia o fragmento de ácido nucleico. En una modalidad, el término se refiere a una secuencia de ácido nucleico que comprende, preferentemente que consiste en una secuencia de ácido nucleico que es al menos 90 %, preferentemente al menos 95 %, con mayor preferencia al menos 98 % idéntica a una secuencia de ácido nucleico seleccionada del grupo que consiste en las SEQ ID NOs: 86 a 89. En una modalidad particularmente preferida, el término se refiere a una secuencia de ácido nucleico que comprende, preferentemente, que consiste en la secuencia de ácido nucleico de la SEQ ID NO: 86 o que comprende, preferentemente que consiste en una secuencia de ácido nucleico que es al menos 90 %, preferentemente al menos 95 %, con mayor preferencia al menos 98 % idéntica a la secuencia de ácido nucleico de la SEQ ID NO: 86. En una modalidad particularmente preferida, el término se refiere a una secuencia de ácido nucleico que comprende, preferentemente que consiste en la secuencia de ácido nucleico de las posiciones 1 a 68, posiciones 1 a 102, posiciones 35 a 102, posiciones 35 a 136, o posiciones 68 a 136 de la SEQ ID NO: 86 o que comprende, preferentemente que consiste en una secuencia de ácido nucleico que es al menos 90 %, preferentemente al menos 95 %, con mayor preferencia al menos 98 % idéntica a la secuencia de ácido nucleico de las posiciones 1 a 68, posiciones 1 a 102, posiciones 35 a 102, posiciones 35 a 136, o posiciones 68 a 136 de la SEQ ID NO: 86.
El término "PLD3" se refiere al Miembro 3 de la Familia de Fosfolipasa D e incluye el gen PLD3. Este gen codifica un miembro de la familia de enzimas fosfolipasa D (PLD) que catalizan la hidrólisis de los fosfolípidos de membrana. La proteína codificada es una proteína de membrana de tipo II de un solo paso y contiene dos dominios de fosfodiesterasa PLD. Esta proteína influye en el procesamiento de la proteína precursora beta amiloide. Las mutaciones en este gen se asocian con el riesgo de enfermedad de Alzheimer.
El término "secuencia de ácido nucleico de la región no traducida en 3' de PLD3, un fragmento de esta, o una variante de dicha secuencia o fragmento de ácido nucleico" se refiere a una secuencia de ácido nucleico que comprende, preferentemente que consiste en una secuencia de ácido nucleico seleccionada del grupo que consiste en las SEQ ID NOs: 90 a 104 del listado de secuencias o un fragmento de esta, o una variante de dicha secuencia o fragmento de ácido nucleico. En una modalidad, el término se refiere a una secuencia de ácido nucleico que comprende, preferentemente que consiste en una secuencia de ácido nucleico que es al menos 90 %, preferentemente al menos 95 %, con mayor preferencia al menos 98 % idéntica a una secuencia de ácido nucleico seleccionada del grupo que consiste en las SEQ ID NOs: 90 a 104. En una modalidad particularmente preferida, el término se refiere a una secuencia de ácido nucleico que comprende, preferentemente, que consiste en la secuencia de ácido nucleico de la SEQ ID NO: 96 o que comprende, preferentemente que consiste en una secuencia de ácido nucleico que es al menos 90 %, preferentemente al menos 95 %, con mayor preferencia al menos 98 % idéntica a la secuencia de ácido nucleico de la s Eq ID NO: 96.
El término "MT_RNR1" se refiere al ARN 12S codificado mitocondrialmente e incluye el gen MT_RNR1. Este gen de ARN pertenece a la clase Mt_rRNA. Las enfermedades asociadas con MT-RNR1 incluyen cardiomiopatía restrictiva y neuropatía auditiva. Entre sus vías relacionadas se encuentran la biogénesis de los ribosomas en eucariotas y la fidelidad de la traducción de CFTR (mutaciones de clase I).
El término "secuencia de ácido nucleico de la región no traducida en 3' de MT_RNR1, un fragmento de esta, o una variante de dicha secuencia o fragmento de ácido nucleico" se refiere a una secuencia de ácido nucleico que comprende, preferentemente que consiste en una secuencia de ácido nucleico seleccionada del grupo que consiste en las SEQ ID NOs: 105 a 121 del listado de secuencias o un fragmento de esta, o una variante de dicha secuencia o fragmento de ácido nucleico. En una modalidad, el término se refiere a una secuencia de ácido nucleico que comprende, preferentemente que consiste en una secuencia de ácido nucleico que es al menos 90 %, preferentemente al menos 95 %, con mayor preferencia al menos 98 % idéntica a una secuencia de ácido nucleico seleccionada del grupo que consiste en las SEQ ID NOs: 105 a 121. En una modalidad particularmente preferida, el término se refiere a una secuencia de ácido nucleico que comprende, preferentemente, que consiste en la secuencia de ácido nucleico de la SEQ ID NO: 115 o que comprende, preferentemente que consiste en una secuencia de ácido nucleico que es al menos 90 %, preferentemente al menos 95 %, con mayor preferencia al menos 98 % idéntica a la secuencia de ácido nucleico de la SEQ ID NO: 115. En una modalidad particularmente preferida, el término se refiere a una secuencia de ácido nucleico que comprende, preferentemente que consiste en la secuencia de ácido nucleico de las posiciones 1 a 71, posiciones 1 a 107, posiciones 37 a 107, posiciones 37 a 142, o posiciones 71 a 142 de la SEQ ID NO: 115 o que comprende, preferentemente que consiste en una secuencia de ácido nucleico que es al menos 90 %, preferentemente al menos 95 %, con mayor preferencia al menos 98 % idéntica a la secuencia de ácido nucleico de las posiciones 1 a 71, posiciones 1 a 107, posiciones 37 a 107, posiciones 37 a 142, o posiciones 71 a 142 de la SEQ ID NO: 115.
El término "HLA-DRB4" se refiere al complejo principal de histocompatibilidad, clase II, DR Beta 4 e incluye el gen HLA-DRB4. HLA-DRB4 pertenece a los parálogos de la cadena beta de HLA clase II. Esta molécula de clase II es un heterodímero que consiste en una cadena alfa (DRA) y una cadena beta (DRB), ambas ancladas en la membrana. Desempeña un papel central en el sistema inmunitario mediante la presentación de los péptidos derivados de las proteínas extracelulares. Las moléculas de clase II se expresan en células presentadoras de antígeno (APC: linfocitos B, células dendríticas, macrófagos).
El término "secuencia de ácido nucleico de la región no traducida en 3' de HLA-DRB4, un fragmento de esta, o una variante de dicha secuencia o fragmento de ácido nucleico" se refiere a una secuencia de ácido nucleico que comprende, preferentemente que consiste en una secuencia de ácido nucleico seleccionada del grupo que consiste en las SEQ ID NOs: 122 a 143 del listado de secuencias o un fragmento de esta, o una variante de dicha secuencia o fragmento de ácido nucleico. En una modalidad, el término se refiere a una secuencia de ácido nucleico que comprende, preferentemente que consiste en una secuencia de ácido nucleico que es al menos 90 %, preferentemente al menos 95 %, con mayor preferencia al menos 98 % idéntica a una secuencia de ácido nucleico seleccionada del grupo que consiste en las SEQ ID NOs: 122 a 143. En una modalidad particularmente preferida, el término se refiere a una secuencia de ácido nucleico que comprende, preferentemente, que consiste en la secuencia de ácido nucleico de la SEQ ID NO: 126 o que comprende, preferentemente que consiste en una secuencia de ácido nucleico que es al menos 90 %, preferentemente al menos 95 %, con mayor preferencia al menos 98 % idéntica a la secuencia de ácido nucleico de la s Eq ID NO: 126.
El término "cualquier combinación de dos o más de las secuencias, fragmentos y/o variantes de ácido nucleico" con respecto a las secuencias de ácido nucleico de las regiones no traducidas en 3' de determinados genes, fragmentos de estos, o variantes de dichas secuencias o fragmentos de ácido nucleico significa que 2 o más, 3 o más, o 4 o más y preferentemente hasta 6 o hasta 5 de dichas secuencias, fragmentos y/o variantes de ácido nucleico están alineados cabeza a cola, opcionalmente separados por enlazadores. En una modalidad, la combinación de dos o más secuencias, fragmentos y/o variantes de ácido nucleico comprende dos o más secuencias, fragmentos y/o variantes de ácido nucleico diferentes y/o dos o más idénticas. En una modalidad, la combinación de dos o más secuencias, fragmentos y/o variantes de ácido nucleico comprende dos o más secuencias, fragmentos y/o variantes de ácido nucleico diferentes de la región no traducida en 3' de los mismos y/o diferentes genes.
En una modalidad, el término se refiere a una secuencia de ácido nucleico que comprende, preferentemente que consiste en una secuencia de ácido nucleico que es al menos 90 %, preferentemente al menos 95 %, con mayor preferencia al menos 98 % idéntica a una secuencia de ácido nucleico seleccionada del grupo que consiste en las s Eq ID NOs: 144 a 220, preferentemente las SEQ ID NOs: 174 y 208 a 220. En una modalidad, el término se refiere a una secuencia de ácido nucleico que comprende, preferentemente que consiste en una secuencia de ácido nucleico seleccionada del grupo que consiste en las SEQ ID NOs: 144 a 220, preferentemente las SEQ ID NOs: 174 y 208 a 220 o un fragmento de esta, o una variante de dicha secuencia de ácido nucleico o fragmento. En una modalidad particularmente preferida, el término se refiere a una secuencia de ácido nucleico que comprende, preferentemente, que consiste en la secuencia de ácido nucleico de la SEQ ID NO: 174 o que comprende, preferentemente que consiste en una secuencia de ácido nucleico que es al menos 90 %, preferentemente al menos 95 %, con mayor preferencia al menos 98 % idéntica a la secuencia de ácido nucleico de la SEQ ID NO: 174.
El término "enlazador" de acuerdo con la invención se refiere a una secuencia de ácido nucleico añadida entre dos secuencias de ácido nucleico para conectar dichas dos secuencias de ácido nucleico. No existe una limitación particular con respecto a la secuencia del enlazador.
De acuerdo con la invención, una molécula de ácido nucleico o una secuencia de ácido nucleico se refiere a un ácido nucleico que es, preferentemente, ácido desoxirribonucleico (ADN) o ácido ribonucleico (ARN). De acuerdo con la invención, los ácidos nucleicos comprenden ADN genómico, ADNc, ARNm, moléculas producidas recombinantemente y sintetizadas químicamente. De acuerdo con la invención, un ácido nucleico puede estar en la forma de una molécula monocatenaria o bicatenaria, y lineal o circular cerrada covalentemente.
En el contexto de la presente invención, el término "ARN" se refiere a una molécula que comprende residuos de ribonucleótidos y preferentemente está compuesta totalmente o esencialmente de residuos de ribonucleótidos. El término "ribonucleótido" se refiere a un nucleótido con un grupo hidroxilo en la posición 2' de un grupo p-D-ribofuranosa. El término "ARN" comprende ARN bicatenario, ARN monocatenario, ARN aislado tal como ARN purificado parcialmente o completamente, ARN esencialmente puro, ARN sintético, y ARN producido de manera recombinante tal como ARN modificado que difiere del ARN de origen natural por la adición, deleción, sustitución y/o alteración de uno o más nucleótidos. Dichas alteraciones pueden incluir la adición de material no nucleotídico, tal como al(los) extremo(s) de un ARN o internamente, por ejemplo, a uno o más nucleótidos del ARN. Los nucleótidos en las moléculas de ARN pueden comprender también nucleótidos no estándar, tales como nucleótidos que no son de origen natural o nucleótidos o desoxinucleótidos sintetizados químicamente. Estos ARN alterados pueden referirse como análogos, o particularmente análogos de los ARN de origen natural. De acuerdo con la invención, el ARN incluye ARNm.
El término "ARNm" significa "ARN mensajero" y se refiere a un transcrito que se genera mediante el uso de un molde de ADN y codifica para un péptido o proteína. Típicamente, el ARNm comprende una 5'-UTR, una región codificante de proteínas, una UTR-3' y una secuencia de poli(A). El ARNm puede generarse mediante la transcripción in vitro a partir de un molde de ADN. La metodología de la transcripción in vitro se conoce por el experto. Por ejemplo, existe una variedad de kits de transcripción in vitro disponibles comercialmente. De acuerdo con la invención, el ARNm puede modificarse mediante modificaciones de estabilización y protección adicionales, además de las modificaciones de acuerdo con la invención.
En una modalidad de la presente invención, el ARN es ARN autorreplicante, tal como ARN monocatenario autorreplicante. En una modalidad, el ARN autorreplicante es ARN monocatenario de sentido positivo. En una modalidad, el ARN autorreplicante es ARN viral o ARN derivado de ARN viral. En una modalidad, el ARN autorreplicante es un ARN genómico alfaviral o se deriva de un ARN genómico alfaviral. En una modalidad, el ARN autorreplicante es un vector de expresión génica viral. En una modalidad, el virus es el virus del bosque Semliki. En una modalidad, el ARN autorreplicante contiene uno o más transgenes. En una modalidad, si el ARN es ARN viral o derivado de ARN viral, los transgenes pueden reemplazar parcialmente o completamente las secuencias virales tal como las secuencias virales que codifican proteínas estructurales. En una modalidad, el ARN autorreplicante es el ARN transcrito in vitro.
El término "casquete 5'" se refiere a una estructura de casquete que se encuentra en el extremo 5' de una molécula de ARNm y consiste, generalmente, en un nucleótido de guanosina que se conecta al ARNm a través de un enlace trifosfato inusual 5' a 5'. En una modalidad, esta guanosina se metila en la posición 7. El término "casquete 5' convencional" se refiere a un ARN de origen natural con casquete en 5', preferentemente, a la metilguanosina con casquete en 7 (m7G). En el contexto de la presente invención, el término "casquete 5'" incluye un análogo del casquete en 5' que se asemeja a la estructura del casquete de ARN y se modifica para que posea la capacidad de estabilizar el ARN si se une a este, preferentemente, in vivo y/o en una célula. Proporcionar un ARN con un casquete 5' o análogo del casquete 5' puede lograrse mediante la transcripción in vitro de un molde de ADN en presencia de dicho casquete 5' o análogo del casquete 5', en donde dicho casquete 5' se incorpora cotranscripcionalmente en la cadena de a Rn generada, o el ARN puede generarse, por ejemplo, mediante la transcripción in vitro, y el casquete 5' puede generarse postranscripcionalmente mediante el uso de enzimas que añaden el casquete, por ejemplo, las enzimas del virus vaccinia que añaden el casquete.
El término "ácido nucleico" de acuerdo con la invención comprende, además, una derivatización química de un ácido nucleico en una base de nucleótidos, en el azúcar o en el fosfato, y ácidos nucleicos que contienen nucleótidos no naturales y análogos de nucleótidos.
Los términos "fragmento" o "fragmento de una secuencia de ácido nucleico" se refieren a una parte de una secuencia de ácido nucleico, es decir, una secuencia que representa la secuencia de ácido nucleico acortada en los extremos 5' y/o 3'. Preferentemente, un fragmento cuando reemplaza dicha secuencia de ácido nucleico en una molécula de ARN retiene la estabilidad del ARN y/o la eficiencia de la traducción. Preferentemente, un fragmento de una secuencia de ácido nucleico comprende al menos 80 %, preferentemente al menos 90 %, 95 %, 96 %, 97 %, 98 %, o 99 % de los residuos de nucleótidos de dicha secuencia de ácido nucleico.
El término "variante" con respecto a, por ejemplo, secuencias de ácido nucleico o aminoácidos, de acuerdo con la invención, incluye cualquiera de las variantes, en particular, mutantes, variantes de empalme, conformaciones, isoformas, variantes alélicas, variantes de especies y homólogos de especies, en particular aquellos que son de origen natural. Una variante alélica se refiere a una alteración en la secuencia normal de un gen, cuya relevancia frecuentemente no está clara. La secuenciación génica completa a menudo identifica numerosas variantes alélicas para un gen determinado. Un homólogo de especie es una secuencia de ácido nucleico o aminoácido con una especie de origen diferente de una secuencia determinada de un ácido nucleico o aminoácido.
De acuerdo con la invención, las variantes de ácido nucleico incluyen deleciones, adiciones, mutaciones y/o inserciones de nucleótidos, únicas o múltiples en comparación con el ácido nucleico de referencia. Las deleciones incluyen la eliminación de uno o más nucleótidos del ácido nucleico de referencia. Las variantes de adición comprenden fusiones terminales 5' y/o 3' de uno o más nucleótidos, tales como 1, 2, 3, 5, 10, 20, 30, 50, o más nucleótidos. Las mutaciones pueden incluir, pero no se limitan a sustituciones, en donde se elimina al menos un nucleótido en la secuencia y se inserta otro nucleótido en su lugar (tal como transversiones y transiciones), sitios abásicos, sitios de uniones cruzadas, y bases alteradas o modificadas químicamente. Las inserciones incluyen la adición de al menos un nucleótido en el ácido nucleico de referencia.
Con respecto a las moléculas de ácido nucleico, el término "variante" incluye secuencias de ácidos nucleicos degenerados, en donde un ácido nucleico degenerado de acuerdo con la invención es un ácido nucleico que difiere de un ácido nucleico de referencia en la secuencia de codones debido a la degeneración del código genético.
Preferentemente, el grado de identidad entre una secuencia de ácido nucleico dada y una secuencia de ácido nucleico que es una variante de dicha secuencia de ácido nucleico dada será al menos 70 %, preferentemente al menos 75 %, preferentemente al menos 80 %, con mayor preferencia al menos 85 %, incluso con mayor preferencia al menos 90 % o con la máxima preferencia al menos 95 %, 96 %, 97 %, 98 % o 99 %. El grado de identidad es dado, preferentemente, para una región de al menos aproximadamente 30, al menos aproximadamente 50, al menos aproximadamente 70, al menos aproximadamente 90, al menos aproximadamente 100, al menos aproximadamente 150, al menos aproximadamente 200, al menos aproximadamente 250, al menos aproximadamente 300, o al menos aproximadamente 400 nucleótidos. En modalidades preferidas, el grado de identidad está dado por la longitud completa de la secuencia del ácido nucleico de referencia.
"Similitud de secuencia" indica el porcentaje de aminoácidos que son idénticos o que representan sustituciones conservadoras de aminoácidos. "Identidad de secuencia" entre dos polipéptidos o secuencias de ácido nucleico indica el porcentaje de aminoácidos o nucleótidos que son idénticos entre las secuencias.
El término "% idéntico" pretende referirse, en particular, a un porcentaje de nucleótidos que son idénticos en un alineamiento óptimo entre dos secuencias a comparar, dicho porcentaje es puramente estadístico, y las diferencias entre las dos secuencias pueden distribuirse aleatoriamente en toda la longitud de la secuencia y la secuencia a compararse puede comprender adiciones o deleciones en comparación con la secuencia de referencia, para obtener un alineamiento óptimo entre dos secuencias. Las comparaciones de dos secuencias generalmente se realizan mediante la comparación de dichas secuencias, después de un alineamiento óptimo, con respecto a un segmento o "ventana de comparación", para identificar regiones locales de secuencias correspondientes. El alineamiento óptimo de las secuencias para una comparación puede realizarse manualmente o con la ayuda del algoritmo de homología local de Smith y Waterman, 1981, Ads App. Math. 2, 482, con la ayuda del algoritmo de homología local de Neddleman y Wunsch, 1970, J. Mol. Biol. 48, 443, y con la ayuda del algoritmo de búsqueda de similitud de Pearson y Lipman, 1988, Proc. Natl Acad. Sci. USA 85, 2444 , o con la ayuda de programas informáticos que usan dichos algoritmos (GAP, BESTFIT, FASTA, BLAST P, BLAST N y TFASTA en el paquete de programas informáticos de Wisconsin Genetics, Genetics Computer Group, 575 Science Drive, Madison, Wis.).
El porcentaje de identidad se obtiene mediante la determinación del número de posiciones idénticas en las que se corresponden las secuencias que se comparan, se divide este número entre el número de posiciones comparadas, y se multiplica este resultado por 100.
Por ejemplo, puede usarse el programa BLAST "BLAST 2 sequences" que está disponible en el sitio web http://www.ncbi.nlm.nih.gov/blast/bl2seq/wblast2.cgi.
Un ácido nucleico es "capaz de hibridarse" o "se hibrida" con otro ácido nucleico si las dos secuencias son complementarias entre sí. Un ácido nucleico es "complementario" a otro ácido nucleico si las dos secuencias son capaces de formar un dúplex estable entre sí. De acuerdo con la invención, la hibridación se realiza, preferentemente, en condiciones que permiten la hibridación específica entre polinucleótidos (condiciones rigurosas). Las condiciones rigurosas se describen, por ejemplo, en Molecular Cloning: A Laboratory Manual, J. Sambrook y otros, Editores, 2da Edición, Cold Spring Harbor Laboratory press, Cold Spring Harbor, Nueva York, 1989 o Current Protocols in Molecular Biology, F.M. Ausubel y otros, Editores, John Wiley & Sons, Inc., Nueva York y se refieren, por ejemplo, a una hibridación a 65 °C en un tampón de hibridación (3,5 x SSC, Ficoll al 0,02 %, polivinilpirrolidona al 0,02 %, albúmina de suero bovino al 0,02 %, NaH2PO42,5 mM (pH 7), SDS al 0,5 %, EDTA 2 mM). SSC es cloruro de sodio 0,15 M/citrato de sodio 0,15 M, pH 7. Después de la hibridación, se lava la membrana a la que se ha transferido el ADN, por ejemplo, en 2 x SSC a temperatura ambiente y después en 0,1-0,5 x SSC/0,1 x SDS a temperaturas de hasta 68 °C.
Un porcentaje de complementariedad indica el porcentaje de residuos contiguos en una molécula de ácido nucleico que pueden formar enlaces de hidrógeno (por ejemplo, apareamiento de bases de Watson-Crick) con una segunda secuencia de ácido nucleico (por ejemplo, 5, 6, 7, 8, 9, 10 de 10 que son 50 %, 60 %, 70 %, 80 %, 90 % y 100 % complementarias). "Perfectamente complementario" o "completamente complementario" significa que todos los residuos contiguos de una secuencia de ácido nucleico se unirán por enlaces de hidrógeno con la misma cantidad de residuos contiguos en una segunda secuencia de ácido nucleico. Preferentemente, el grado de complementariedad de acuerdo con la invención es al menos 70 %, preferentemente, al menos 75 %, preferentemente, al menos 80 %, con mayor preferencia, al menos 85 %, aún con mayor preferencia, al menos 90 % o con la máxima preferencia, al menos 95 %, 96 %, 97 %, 98 % o 99 %. Con la máxima preferencia, el grado de complementariedad de acuerdo con la invención es 100 %.
El término "derivado" comprende la formación de un derivado químico de un ácido nucleico en una base nucleótida, en el azúcar o en el fosfato. El término "derivado" comprende, además, ácidos nucleicos que contienen nucleótidos y análogos de nucleótidos que no son de origen natural. Preferentemente, la formación de un derivado de un ácido nucleico aumenta su estabilidad.
Los fragmentos o variantes de secuencias de ácido nucleico específicas o secuencias de ácido nucleico que tienen un grado particular de identidad con secuencias de ácido nucleico específicas tienen, preferentemente, al menos una propiedad funcional de dichas secuencias específicas y, preferentemente, son funcionalmente equivalentes a dichas secuencias específicas, por ejemplo, secuencias de ácido nucleico que presentan propiedades idénticas o similares a las de las secuencias de ácido nucleico específicas.
Una propiedad importante es retener o mejorar la estabilidad de una molécula de ARN y/o la eficiencia de la traducción e incluye en particular la capacidad de aumentar, en un enlace funcional a un ácido nucleico que puede transcribirse en ARN (secuencia de ácido nucleico transcribible) o una secuencia de ácido nucleico codificante para un péptido o proteína, la estabilidad y/o la eficiencia de la traducción del ARN producido a partir de este ácido nucleico o de la secuencia de ácido nucleico codificante para un péptido o proteína en la molécula completa de ARN.
En una modalidad, si una secuencia específica de ácido nucleico es activa a fines de aumentar la eficiencia de la traducción y/o la estabilidad de otra secuencia de ácido nucleico, un fragmento o variante de la secuencia de ácido nucleico específica o una secuencia de ácido nucleico que tiene un grado particular de identidad con la secuencia de ácido nucleico específica, además, es activa a fines de aumentar la eficiencia de la traducción y/o la estabilidad de la otra secuencia de ácido nucleico (cuando esta sustituye la secuencia de ácido nucleico específica). Un fragmento o variante de la secuencia de ácido nucleico específica o una secuencia de ácido nucleico que tiene un grado particular de identidad con la secuencia de ácido nucleico específica puede ser tan activa o más activa que la secuencia de ácido nucleico específica o la actividad de un fragmento o variante de la secuencia de ácido nucleico específica o de una secuencia de ácido nucleico que tiene un grado particular de identidad con la secuencia de ácido nucleico específica puede ser al menos 50 %, al menos 60 %, al menos 70 %, al menos 80 % o al menos 90 % de la actividad de la secuencia de ácido nucleico específica.
De acuerdo con la invención, "enlace funcional" o "unido funcionalmente" se refiere a una conexión dentro de una relación funcional. Un ácido nucleico está "unido funcionalmente" si este se relaciona funcionalmente con otra secuencia de ácido nucleico. Por ejemplo, un promotor está unido funcionalmente a una secuencia codificante si influye en la transcripción de dicha secuencia codificante. Los ácidos nucleicos unidos funcionalmente son típicamente adyacentes entre sí, cuando es apropiado, separados por secuencias de ácido nucleico adicionales, y, en modalidades particulares, se transcriben mediante la ARN polimerasa para proporcionar una molécula de ARN única (transcrito común). Preferentemente, una secuencia que es una variante con respecto a una secuencia específica, cuando sustituye la secuencia específica en una molécula de ARN retiene la estabilidad del ARN y/o la eficiencia de la traducción.
De acuerdo con la invención, una "secuencia de ácido nucleico que se deriva de una secuencia de ácido nucleico" se refiere a un ácido nucleico que es una variante del ácido nucleico del que se deriva.
El término "extremo 3' de un ácido nucleico" se refiere de acuerdo con la invención a ese extremo que tiene un grupo hidroxilo libre. En una representación esquemática de ácidos nucleicos bicatenarios, en particular ADN, el extremo 3' siempre está en el lado derecho. El término "extremo 5' de un ácido nucleico" se refiere de acuerdo con la invención a ese extremo que tiene un grupo fosfato libre. En una representación esquemática de ácidos nucleicos de doble cadena, en particular ADN, el extremo 5' siempre está en el lado izquierdo.
extremo 5' 5'--P-NNNNNNN-OH-3' extremo 3'
3'-HO-NNNNNNN-P--5'
En modalidades particulares, un ácido nucleico está unido funcionalmente de acuerdo con la invención a secuencias de control de la expresión que pueden ser homólogas o heterólogas con respecto al ácido nucleico.
Una secuencia de ácido nucleico transcribible, en particular una secuencia de ácido nucleico codificante para un péptido o proteína, y una secuencia de control de la expresión están unidas "funcionalmente" entre sí, si están unidas covalentemente entre sí de tal manera que la transcripción o expresión de la secuencia de ácido nucleico transcribible y en particular codificante está bajo el control o bajo la influencia de la secuencia de control de la expresión. Si la secuencia de ácido nucleico debe traducirse en un péptido o proteína funcional, la inducción de una secuencia de control de la expresión unida funcionalmente a la secuencia codificante resulta en la transcripción de dicha secuencia codificante, sin causar un corrimiento del marco en la secuencia codificante o la secuencia codificante es incapaz de traducirse en el péptido o proteína deseada.
El término "secuencia de control de la expresión" comprende, de acuerdo con la invención, promotores, secuencias de unión a ribosomas y otros elementos de control que controlan la transcripción de un gen o la traducción del ARN derivado. En modalidades particulares de la invención, pueden regularse las secuencias de control de la expresión. La estructura exacta de las secuencias de control de la expresión puede variar en dependencia de la especie o tipo de célula, pero generalmente incluye las secuencias no transcritas en 5' y las secuencias no traducidas en 5' y 3' involucradas en el inicio de la transcripción y la traducción, respectivamente, tales como caja TATA, secuencia de casquete, secuencia CAAT y similares. Más específicamente, las secuencias de control de la expresión no transcritas en 5' incluyen una región promotora que incluye una secuencia promotora para el control de la transcripción del gen unido funcionalmente. Las secuencias de control de la expresión pueden incluir, además, las secuencias potenciadoras o secuencias activadoras en dirección 5'.
Las secuencias de ácido nucleico especificadas en la presente descripción, en particular las secuencias de ácido nucleico transcribibles y codificantes, pueden combinarse con cualquier secuencia de control de la expresión, en particular promotores, que pueden ser homólogos o heterólogos a dichas secuencias de ácido nucleico, con el término "homólogo" que se refiere al hecho de que una secuencia de ácido nucleico además está unida funcionalmente de manera natural a la secuencia de control de la expresión, y el término "heterólogo" se refiere al hecho de que una secuencia de ácido nucleico no está unida funcionalmente de manera natural a la secuencia de control de la expresión.
El término "promotor" o "región promotora" se refiere a una secuencia de ADN en dirección 5' (5') de la secuencia codificante de un gen, que controla la expresión de dicha secuencia codificante porque proporciona un sitio de reconocimiento y de unión para la ARN polimerasa. La "región promotora" puede incluir sitios de reconocimiento o de unión adicionales para otros factores involucrados en la regulación de la transcripción de dicho gen. Un promotor puede controlar la transcripción de un gen procariótico o eucariótico. Un promotor puede ser "inducible" e iniciar la transcripción en respuesta a un inductor, o puede ser "constitutivo" si la transcripción no está controlada por un agente inductor. Un promotor inducible se expresa solo en un grado muy pequeño o nada en absoluto, si un inductor está ausente. En presencia del inductor, el gen se activa o aumenta el nivel de la transcripción. Esto está mediado, en general, por la unión de un factor de transcripción específico.
Los ejemplos de promotores preferidos de acuerdo con la invención son los promotores para la polimerasa SP6, T3 o T7.
De acuerdo con la invención, el término "expresión" se usa en su significado más general y comprende la producción de ARN o de ARN y proteína. Comprende también la expresión parcial de ácidos nucleicos. Además, la expresión puede ser transitoria o estable. Con respecto al ARN, el término "expresión" o "traducción" se refiere al proceso en los ribosomas de una célula mediante el cual una cadena de ARN mensajero dirige el ensamblaje de una secuencia de aminoácidos para producir un péptido o proteína.
El término "secuencias de ácido nucleico que pueden transcribirse para proporcionar un transcrito común" significa que dichas secuencias de ácido nucleico están unidas funcionalmente entre sí de tal manera que, cuando sea apropiado después de la linealización, tal como por la escisión, mediante enzima de restricción, de la molécula de ácido nucleico que comprende dichas secuencias de ácido nucleico, en particular de una molécula de ácido nucleico circular cerrada, la transcripción bajo el control de un promotor resulta en una molécula de ARN que comprende los transcritos de dichas secuencias de ácido nucleico unidos covalentemente entre sí, cuando sea apropiado, separados por secuencias ubicadas de por medio.
En el contexto de la presente invención, el término "transcripción" se refiere a un proceso, en donde el código genético en una secuencia de ADN se transcribe a ARN. Posteriormente, el ARN puede traducirse en proteína. De acuerdo con la presente invención, el término "transcripción" comprende la "transcripción in vitro", en donde el término "transcripción in vitro" se refiere a un proceso en donde el ARN, en particular el ARNm, se sintetiza in vitro en un sistema libre de células. Preferentemente, los vectores de clonación se aplican para la generación de transcritos. Estos vectores de clonación se designan generalmente como vectores de transcripción y se abarcan de acuerdo con la presente invención por el término "vector". De acuerdo con la presente invención, el ARN preferentemente es ARN transcrito in vitro (ARN-IVT) y puede obtenerse mediante la transcripción in vitro de un molde de ADN apropiado. El promotor para controlar la transcripción puede ser cualquier promotor para cualquier ARN polimerasa. Un molde de ADN para la transcripción in vitro puede obtenerse mediante la clonación de un ácido nucleico, en particular ADNc, y su introducción en un vector apropiado para la transcripción in vitro. El ADNc puede obtenerse mediante transcripción inversa del ARN.
El término "secuencia de ácido nucleico transcrita a partir de una secuencia de ácido nucleico" se refiere al ARN, cuando sea apropiado como parte de una molécula completa de ARN, que es un producto de la transcripción de la última secuencia de ácido nucleico.
El término "secuencia de ácido nucleico que es activa para aumentar la eficiencia y/o estabilidad de la traducción de una secuencia de ácido nucleico" significa que la primera secuencia de ácido nucleico es capaz de modificar, en un transcrito común con la segunda secuencia de ácido nucleico, la eficiencia de la traducción y/o la estabilidad de dicha segunda secuencia de ácido nucleico de tal manera que dicha eficiencia de la traducción y/o estabilidad se aumenta en comparación con la eficiencia de la traducción y/o estabilidad de dicha segunda secuencia de ácido nucleico sin dicha primera secuencia de ácido nucleico. En este contexto, el término "eficiencia de la traducción" se refiere a la cantidad de producto de traducción proporcionado por una molécula de ARN dentro de un período de tiempo particular y el término "estabilidad" se refiere a la vida media de una molécula de ARN.
La modificación, y de esta manera la estabilización y/o el aumento en la eficiencia de la traducción, del ARN puede lograrse de acuerdo con la invención mediante la modificación genética de la expresión de las moléculas de ácido nucleico de la invención cuando se usan como vectores de expresión de tal manera que permiten la transcripción del ARN con regiones no traducidas en 3' como se describe en la presente descripción en su extremo 3', y preferentemente entre la secuencia codificante para un péptido o proteína (marco abierto de lectura) y la secuencia de poli(A)
El término "región no traducida en 3'" se refiere a una región que se ubica en el extremo 3' de un gen, en dirección 3' del codón de terminación de una región codificante de proteína, y que se transcribe pero no se traduce en una secuencia de aminoácidos, o a la región correspondiente en una molécula de ARN.
De acuerdo con la invención, se considera que una primera región polinucleotídica se ubica en dirección 3' de una segunda región polinucleotídica, si el extremo 5' de dicha primera región polinucleotídica es la parte de dicha primera región polinucleotídica más cercana al extremo 3' de dicha segunda región polinucleotídica.
La región no traducida en 3' se extiende, típicamente, desde el codón de terminación para un producto de la traducción hasta la secuencia de poli(A) que generalmente se une después del proceso de transcripción. Las regiones no traducidas en 3' del ARNm de mamífero, típicamente, tienen una región de homología conocida como la secuencia de hexanucleótidos AAUAAA. Presumiblemente, esta secuencia es la señal de unión de poli(A) y se ubica frecuentemente de 10 a 30 bases en dirección 5' del sitio de unión de poli(A).
Las regiones no traducidas en 3' pueden contener una o más repeticiones invertidas que pueden plegarse para dar estructuras de bucle y tallo que actúan como barreras para las exoribonucleasas o interactúan con proteínas que se conocen que aumentan la estabilidad del ARN (por ejemplo, proteínas de unión al ARN).
Las regiones no traducidas en 5' y/o en 3' pueden, de acuerdo con la invención, unirse funcionalmente a un ácido nucleico transcribible y en particular codificante, para que estas regiones se asocien con el ácido nucleico de tal manera que aumente la estabilidad y/o la eficiencia de la traducción del ARN transcrito a partir de dicho ácido nucleico transcribible.
Las regiones no traducidas en 3' de los ARNm de inmunoglobulinas son relativamente cortas (menos de aproximadamente 300 nucleótidos), mientras que las regiones no traducidas en 3' de otros genes son relativamente largas. Por ejemplo, la región no traducida en 3' del tPA es aproximadamente 800 nucleótidos de longitud, la del factor VIII es aproximadamente 1800 nucleótidos de longitud y la de la eritropoyetina es aproximadamente 560 nucleótidos de longitud.
De acuerdo con la invención puede determinarse, si una región no traducida en 3' o una secuencia de ácido nucleico derivada de esta aumenta la estabilidad y/o la eficiencia de la traducción del ARN, mediante la incorporación de la región no traducida en 3' o la secuencia de ácido nucleico derivada de esta en la región no traducida en 3' de un gen y medir si dicha incorporación aumenta la cantidad de proteína sintetizada.
Lo anterior se aplica en consecuencia al caso en el que, de acuerdo con la invención, un ácido nucleico comprende dos o más regiones no traducidas en 3' que, preferentemente, se acoplan secuencialmente con o sin un enlazador intermedio, preferentemente en una "relación de cabeza a cola" (es decir, las regiones no traducidas en 3' tienen la misma orientación, preferentemente, la orientación de origen natural en un ácido nucleico).
De acuerdo con la invención, el término "gen" se refiere a una secuencia de ácido nucleico particular que es responsable de producir uno o más productos celulares y/o lograr una o más funciones intercelulares o intracelulares. Más específicamente, dicho término se refiere a una sección de ADN que comprende un ácido nucleico codificante para una proteína específica o una molécula de ARN funcional o estructural.
La poliadenilación es la adición de una secuencia o cola de poli(A) a un transcrito de ARN primario. La secuencia de poli(A) consiste en múltiples monofosfatos de adenosina. En otras palabras, es un tramo de ARN que solo tiene bases de adenina. En eucariotas, la poliadenilación es parte del proceso que produce ARN mensajero maduro (ARNm) para la traducción. Este, por lo tanto, forma parte del proceso más amplio de expresión génica. El proceso de poliadenilación comienza cuando la transcripción de un gen finaliza, o termina. El segmento más 3' del pre-ARNm recién creado se escinde primero mediante un conjunto de proteínas; después estas proteínas sintetizan la secuencia de poli(A) en el extremo 3' del ARN. La secuencia de poli(A) es importante para la exportación nuclear, la traducción, y la estabilidad del ARNm. La secuencia se acorta con el tiempo y, cuando es lo suficientemente corta, el ARNm se degrada enzimáticamente.
Los términos "secuencia de poliadenilo", "secuencia de poli(A)" o "cola de poli(A)" se refieren a una secuencia de residuos de adenilo que se ubica, típicamente, en el extremo 3' de una molécula de ARN. La invención proporciona que tal secuencia se una durante la transcripción del ARN por medio de un molde de ADN sobre la base de residuos repetidos de timidilo en la cadena complementaria a la cadena codificante, mientras que dicha secuencia normalmente no está codificada en el ADN pero se une al extremo 3' libre del ARN mediante una ARN polimerasa independiente del molde después de la transcripción, en el núcleo. De acuerdo con la invención, en una modalidad, una secuencia de poli(A) tiene al menos 20, preferentemente al menos 40, preferentemente al menos 80, preferentemente al menos 100 y preferentemente hasta 500, preferentemente hasta 400, preferentemente hasta 300, preferentemente hasta 200, y en particular hasta 150, nucleótidos A, preferentemente nucleótidos A consecutivos, y en particular aproximadamente 120 nucleótidos A. El término "nucleótidos A" o "A" se refiere a residuos de adenilo.
En una modalidad preferida, una molécula de ácido nucleico de acuerdo con la invención es un vector. El término "vector" se usa en la presente en su significado más general y comprende cualquier vehículo intermediario para un ácido nucleico que, por ejemplo, permite que dicho ácido nucleico se introduzca en células huésped procariotas y/o eucariotas y, cuando sea apropiado, se integre en un genoma. Preferentemente, tales vectores se replican y/o se expresan en la célula. Los vectores comprenden plásmidos, fagémidos o genomas virales. El término "plásmido", como se usa en la presente descripción, se refiere generalmente a una construcción de material genético extracromosómico, generalmente un ADN dúplex circular, que puede replicarse independientemente del ADN cromosómico.
Los ácidos nucleicos descritos en la presente descripción pueden ser moléculas recombinantes y/o aisladas.
Una "molécula aislada" como se usa en la presente descripción, pretende referirse a una molécula que es sustancialmente libre de otras moléculas tal como otro material celular. El término "ácido nucleico aislado" significa de acuerdo con la invención que el ácido nucleico se (i) amplificó in vitro, por ejemplo mediante reacción en cadena de la polimerasa (PCR), (ii) se produjo por vía recombinante mediante clonación, (iii) se purificó, por ejemplo, mediante escisión y fraccionamiento electroforético en gel, o (iv) se sintetizó, por ejemplo, mediante síntesis química. Un ácido nucleico aislado es un ácido nucleico disponible para su manipulación mediante las técnicas del ADN recombinante.
El término "recombinante" en el contexto de la presente invención significa "hecho a través de ingeniería genética". Preferentemente, un "objeto recombinante" tal como una célula recombinante en el contexto de la presente invención no es de origen natural.
El término "de origen natural", como se usa en la presente descripción, se refiere al hecho de que un objeto puede encontrarse en la naturaleza. Por ejemplo, es de origen natural un péptido o ácido nucleico que está presente en un organismo (lo que incluye los virus) y que puede aislarse a partir de una fuente en la naturaleza y que no se ha modificado intencionalmente por el hombre en el laboratorio.
De acuerdo con la invención, el término "célula huésped" se refiere a cualquier célula que puede transformarse o transfectarse con un ácido nucleico exógeno. El término "célula huésped" comprende, de acuerdo con la invención, células procariotas (por ejemplo, E. Coli) o eucariotas (por ejemplo, células de levadura y células de insectos). Se prefieren particularmente células de mamífero, tales como células de humanos, ratones, hámsteres, cerdos, cabras y primates. Las células pueden derivarse de una multiplicidad de tipos de tejidos y comprenden células primarias y líneas celulares. Los ejemplos específicos incluyen queratinocitos, leucocitos de sangre periférica, células madre de médula ósea y células madre embrionarias. En otras modalidades, la célula huésped es una célula presentadora de antígeno, en particular una célula dendrítica, un monocito o un macrófago. Un ácido nucleico puede estar presente en la célula huésped en una sola copia o en varias copias y, en una modalidad se expresa en la célula huésped.
E. Coli es una bacteria gramnegativa, facultativamente anaeróbica, en forma de bastón del género Escherichia que se encuentra comúnmente en el intestino inferior de los organismos de sangre caliente. La bacteria puede cultivarse fácilmente y económicamente en un entorno de laboratorio, y se ha investigado intensamente durante más de 60 años. E. coli es el organismo modelo procariota más estudiado, y una especie importante en los campos de la biotecnología y la microbiología, donde sirvió como el organismo huésped para la mayoría del trabajo con el ADN recombinante. Las cepas de E. coli de acuerdo con la invención incluyen: AG1, AB1157, B2155, BL21, Bn N93, BNN97, BW26434, C600, CSH50, D1210, DB3.1, DH1, DH5a, DH10B, DH12S, DM1, E. cloni(r), E.coli K12 ER2738, ER2566, ER2267, HB101, IJ1126, IJ1127, JM83, JM101, JM103, JM105, JM106, JM107, JM108, JM109, JM110, JM2.300, LE392, Machi, MC1061, MC4100, MFDpir, MG1655, OmniMAX2, RR1, RV308, SOLR, SS320, STBL2, STBL3, STBL4, SURE, SURE2, TG1, TOP10, Top10F', W3110, WM3064, XLI-Blue, XL2-Blue, XLI-Red y XL10-Gold.
De acuerdo con la presente invención, el término "péptido" comprende oligo- y polipéptidos y se refiere a las sustancias que comprenden dos o más, preferentemente 3 o más, preferentemente 4 o más, preferentemente 6 o más, preferentemente 8 o más, preferentemente 10 o más, preferentemente 13 o más, preferentemente 16 o más, preferentemente 20 o más, y hasta, preferentemente 50, preferentemente 100 o preferentemente 150, aminoácidos consecutivos unidos entre sí a través de enlaces peptídicos. El término "proteína" se refiere a péptidos grandes, preferentemente, péptidos que tienen al menos 151 aminoácidos, pero los términos "péptido" y "proteína" se usan en la presente descripción generalmente como sinónimos.
Los términos "péptido" y "proteína" comprenden de acuerdo con la invención sustancias que no solo contienen componentes de aminoácidos sino además componentes no aminoácidos tales como estructuras de azúcares y fosfatos, y además comprenden sustancias que contienen enlaces tales como enlaces éster, tioéter o disulfuro.
De acuerdo con la presente invención, un ácido nucleico tal como el ARN puede codificar un péptido o proteína. En consecuencia, una secuencia de ácido nucleico transcribible o un transcrito de esta pueden contener un marco abierto de lectura (ORF) que codifica un péptido o proteína. Dicho nucleico puede expresar el péptido o proteína codificado. Por ejemplo, dicho ácido nucleico puede ser un ácido nucleico que codifica y expresa un antígeno o un péptido o proteína farmacéuticamente activo tal como un compuesto inmunológicamente activo (que preferentemente no es un antígeno).
De acuerdo con la invención, el término "ácido nucleico que codifica un péptido o proteína" significa que el ácido nucleico, si está presente en el entorno apropiado, preferentemente dentro de una célula, puede dirigir el ensamblaje de aminoácidos para producir el péptido o proteína durante el proceso de traducción. Preferentemente, el ARN de acuerdo con la invención es capaz de interactuar con la maquinaria de traducción celular y permitir la traducción del péptido o proteína.
De acuerdo con la invención, en una modalidad, el ARN comprende o consiste en ARN farmacéuticamente activo. Un "ARN farmacéuticamente activo" puede ser ARN que codifica un péptido o proteína farmacéuticamente activo.
Un "péptido o proteína farmacéuticamente activo" tiene un efecto positivo o ventajoso sobre la afección o el estado de enfermedad de un sujeto cuando se administra al sujeto en una cantidad con eficacia terapéutica. Preferentemente, un péptido o proteína farmacéuticamente activo tiene propiedades curativas o paliativas y puede administrarse para mejorar, aliviar, mitigar, revertir, retrasar el inicio o disminuir la gravedad de uno o más síntomas de una enfermedad o trastorno. Un péptido o proteína farmacéuticamente activo puede tener propiedades profilácticas y puede usarse para retrasar el comienzo de una enfermedad o para disminuir la gravedad de tal enfermedad o afección patológica. El término "péptido o proteína farmacéuticamente activo" incluye proteínas o polipéptidos completos, y además puede referirse a fragmentos farmacéuticamente activos de estos. Además, puede incluir análogos farmacéuticamente activos de un péptido o proteína. El término "péptido o proteína farmacéuticamente activo" incluye péptidos y proteínas que son antígenos, es decir, el péptido o proteína provoca una respuesta inmunitaria en un sujeto, que puede ser terapéutica o parcial o totalmente protectora.
Los ejemplos de proteínas farmacéuticamente activas incluyen, pero no se limitan a, citocinas y proteínas del sistema inmunitario tales como compuestos inmunológicamente activos (por ejemplo, interleucinas, factor estimulante de colonias (CSF), factor estimulante de colonias de granulocitos (G-CSF), factor estimulantes de colonias de granulocitos y macrófagos (GM-CSF), eritropoyetina, factor de necrosis tumoral (TNF), interferones, integrinas, adresinas, selectinas, receptores de direccionamiento a tejidos, receptores de células T, inmunoglobulinas, antígenos solubles del complejo principal de histocompatibilidad, antígenos inmunológicamente activos tales como antígenos bacterianos, parasitarios o virales, alérgenos, autoantígenos, anticuerpos), hormonas (insulina, hormona tiroidea, catecolaminas, gonadotrofinas, hormonas tróficas, prolactina, oxitocina, dopamina, somatotropina bovina, leptinas y similares), hormonas de crecimiento (por ejemplo, hormona de crecimiento humana), factores de crecimiento (por ejemplo, factor de crecimiento epidérmico, factor de crecimiento nervioso, factor de crecimiento similar a la insulina y similares), receptores de factor de crecimiento, enzimas (activador tisular del plasminógeno, estreptoquinasa, enzimas de la síntesis o degradación del colesterol, enzimas esteroidogénicas, quinasas, fosfodiesterasas, metilasas, desmetilasas, deshidrogenasas, celulasas, proteasas, lipasas, fosfolipasas, aromatasas, citocromos, adenilato o guanilato ciclasas, neuramidasas y similares) receptores (receptores de hormonas esteroideas, receptores de péptidos), proteínas de unión (proteínas de unión a la hormona del crecimiento o a factores de crecimiento y similares), factores de transcripción y traducción, proteínas supresoras del crecimiento tumoral (por ejemplo, proteínas que inhiben la angiogénesis), proteínas estructurales (tales como colágeno, fibroína, fibrinógeno, elastina, tubulina, actina, y miosina), proteínas de la sangre (trombina, albúmina sérica, Factor VII, Factor VIII, insulina, Factor IX, Factor X, activador tisular del plasminógeno, proteína C, factor von Wilebrand, antitrombina III, glucocerebrosidasa, eritropoyetina factor estimulante de colonias de granulocitos (GCSF) o Factor VIII modificado, anticoagulantes y similares.
En una modalidad, la proteína farmacéuticamente activa de acuerdo con la invención es una citocina que está implicada en la regulación de la homeostasis linfoide, preferentemente una citocina que está implicada en, y preferentemente, induce o mejora el desarrollo, activación, expansión, diferenciación y/o supervivencia de las células T. En una modalidad, la citocina es una interleucina. En una modalidad, la proteína farmacéuticamente activa de acuerdo con la invención es una interleucina seleccionada del grupo que consiste en IL-2, IL-7, IL-12, IL-15 e IL-21.
El término "compuesto inmunológicamente activo" se refiere a cualquier compuesto que altera una respuesta inmunitaria, preferentemente mediante la inducción y/o supresión de la maduración de las células inmunitarias, mediante la inducción y/o supresión de la biosíntesis de citocinas, y/o mediante la alteración de la inmunidad humoral a través de la estimulación de la producción de anticuerpos por las células B. Los compuestos inmunológicamente activos poseen una actividad inmunoestimulante potente que incluye, pero no se limita a, actividad antiviral y antitumoral, y además pueden regular negativamente otros aspectos de la respuesta inmunitaria, por ejemplo, cambiar la respuesta inmunitaria de una respuesta inmunitaria TH2, que es útil para tratar una amplia gama de enfermedades mediadas por TH2. Los compuestos inmunológicamente activos pueden ser útiles como adyuvantes de vacunas.
Si, de acuerdo con la presente invención, es conveniente inducir o mejorar una respuesta inmunitaria mediante el uso de ARN como se describe en la presente descripción, la respuesta inmunitaria puede activarse o potenciarse mediante el ARN. Por ejemplo, las proteínas o péptidos codificados por los ARN o productos de procesión de estos pueden presentarse mediante las proteínas del complejo principal de histocompatibilidad (MHC) expresadas en las células presentadoras de antígeno. El complejo MHC péptido puede ser reconocido por las células inmunitarias, tal como las células T, lo que conducen a su activación.
En una modalidad, el ARN que codifica para un antígeno, tal como un antígeno asociado a la enfermedad, se administra a un mamífero, en particular si es conveniente tratar a un mamífero que tiene una enfermedad que involucra el antígeno. El ARN es tomado por las células presentadoras de antígeno del mamífero (monocitos, macrófagos, células dendríticas u otras células). Se forma un producto antigénico de la traducción del ARN y el producto se presenta en la superficie de las células para su reconocimiento por las células T. En una modalidad, el antígeno se presenta sobre la superficie celular para su reconocimiento por las células T CAR modificadas genéticamente dirigidas al antígeno. En una modalidad, el antígeno o un producto producido mediante procesión opcional de este se presenta en la superficie celular en el contexto de las moléculas del m Hc para el reconocimiento por las células T a través de su receptor de células T.
Alternativamente, la presente invención prevé modalidades en donde el ARN que expresa un antígeno se introduce en células presentadoras de antígeno ex vivo, por ejemplo, células presentadoras de antígeno tomadas de un paciente, y las células presentadoras de antígeno, opcionalmente propagadas clonalmente ex vivo, se trasplantan nuevamente en el mismo paciente. Las células transfectadas pueden reintroducirse en el paciente mediante el uso de cualquier medio conocido en la técnica, preferentemente en forma estéril mediante administración intravenosa, intracavitaria, intraperitoneal o intratumoral.
Los métodos de la invención pueden implicar una célula presentadora de antígeno para expresar el ARN que codifica el antígeno. Para este fin, los métodos de la invención pueden implicar la introducción del a Rn que codifica los antígenos en células presentadoras de antígeno tales como las células dendríticas. Para la transfección de las células presentadoras de antígeno tales como células dendríticas, puede usarse una composición farmacéutica que comprende el ARN que codifica el antígeno. Puede administrarse a un paciente un vehículo de suministro que direcciona el ARN a una célula dendrítica o a otra célula presentadora de antígeno, lo que resulta en la transfección que ocurre en vivo.
De acuerdo con la invención, se prefiere usar formulaciones del ARN codificante de un antígeno las que suministran el ARN con alta selectividad a las células presentadoras de antígeno tales como las células dendríticas (DC) en el bazo después de la administración sistémica. Por ejemplo, formulaciones nanoparticuladas de ARN con un tamaño de partícula definido en donde la carga neta de las partículas es cercana a cero o negativa, tal como los lipoplejos de ARN, cargados negativamente o electro neutros, y liposomas, por ejemplo, los lipoplejos que comprenden d Ot m A y DOPE o DOTMA y colesterol, conducen a la expresión sustancial del ARN en las DC de bazo después de la administración sistémica. Se determinó una fuerte expresión en las células diana (bazo) mientras que la expresión en otros órganos fue baja.
Como se usa en la presente descripción, el término "nanopartícula" se refiere a cualquier partícula que tiene un diámetro que la haga adecuada para la administración sistémica, en particular parenteral, de, en particular, ácidos nucleicos, típicamente, un diámetro de menos que 1000 nanómetros (nm). En algunas modalidades, una nanopartícula tiene un diámetro de menos que 600 nm. En algunas modalidades, una nanopartícula tiene un diámetro de menos que 400 nm.
Como se usa en la presente descripción, el término "formulación nanoparticulada" o los términos similares se refieren a cualquier sustancia que contiene al menos una nanopartícula. En algunas modalidades, una composición nanoparticulada es una colección uniforme de nanopartículas. En algunas modalidades, las composiciones nanoparticuladas son dispersiones o emulsiones. En general, una dispersión o emulsión se forma cuando se combinan al menos dos materiales inmiscibles.
El término "lipoplejo" o "lipoplejo de ácido nucleico", en particular "lipoplejo de ARN", se refiere a un complejo de lípidos y ácidos nucleicos, en particular ARN. Los lipoplejos se forman espontáneamente cuando los liposomas catiónicos, que además a menudo incluyen un lípido "auxiliar" neutro, se mezclan con ácidos nucleicos.
Si la presente invención se refiere a una carga tal como una carga positiva, carga negativa o carga neutra o un compuesto catiónico, compuesto negativo o compuesto neutro, esto significa generalmente que la carga mencionada está presente a un pH seleccionado, tal como un pH fisiológico. Por ejemplo, el término "lípido catiónico" significa un lípido que tiene una carga neta positiva a un pH seleccionado, tal como un pH fisiológico. El término "lípido neutro" significa un lípido que no tiene carga neta positiva o negativa y puede presentarse en la forma de un ion anfótero no cargado o neutro a un pH seleccionado, tal como un pH fisiológico. Por "pH fisiológico" se entiende, en la presente descripción, un pH de aproximadamente 7,5.
Los vehículos nanoparticulados tales como los vehículos lipídicos contemplados para usar en la presente invención incluyen cualquier sustancia o vehículo con el que pueda asociarse un ácido nucleico, tal como el ARN, por ejemplo mediante la formación de complejos con el ácido nucleico o mediante la formación de vesículas en las que el ácido nucleico está encerrado o encapsulado. Esto puede resultaren una mayor estabilidad del ácido nucleico en comparación con el ácido nucleico desnudo. En particular, la estabilidad del ácido nucleico en la sangre puede aumentarse.
Los lípidos catiónicos, los polímeros catiónicos y otras sustancias con cargas positivas pueden formar complejos con los ácidos nucleicos cargados negativamente. Estas moléculas catiónicas pueden usarse para formar complejos de ácidos nucleicos, de esta manera forman, por ejemplo, los llamados lipoplejos o poliplejos, respectivamente, y se ha demostrado que estos complejos suministran ácidos nucleicos a las células.
Las preparaciones de ácido nucleico nanoparticuladas para usar en la presente invención pueden obtenerse mediante diversos protocolos y a partir de diversos compuestos complejantes de ácido nucleico. Los lípidos, polímeros, oligómeros o anfifílos son agentes complejantes típicos. En una modalidad, el compuesto complejante comprende al menos un agente seleccionado del grupo que consiste en protamina, polietilenimina, una poli-L-lisina, una poli-L-arginina o una histona.
De acuerdo con la invención, la protamina es útil como agente vehículo catiónico. El término "protamina" se refiere a cualquiera de varias proteínas fuertemente básicas de peso molecular relativamente bajo que son ricas en arginina y se encuentran asociadas especialmente con el ADN en lugar de histonas somáticas en las células espermáticas de varios animales (como los peces). En particular, el término "protamina" se refiere a proteínas que se encuentran en los espermatozoides de los peces que son fuertemente básicas, solubles en agua, no se coagulan por calor, y producen principalmente arginina después de la hidrólisis. En forma purificada, se usan en una formulación de insulina de acción prolongada y para neutralizar los efectos anticoagulantes de la heparina.
De acuerdo con la invención, el término "protamina" como se usa en la presente descripción significa que comprende cualquier secuencia de aminoácidos de protamina que se obtiene o se deriva a partir de fuentes naturales o biológicas que incluyen fragmentos de esta y formas multiméricas de dicha secuencia de aminoácidos o fragmento de esta. Además, el término abarca polipéptidos (sintetizados) que son artificiales y diseñados específicamente para fines específicos y no pueden aislarse de fuentes naturales o biológicas.
La protamina usada de acuerdo con la presente invención puede ser protamina sulfatada o hidrocloruro de protamina. En una modalidad preferida, la fuente de protamina usada para la producción de las nanopartículas descritas en la presente descripción es la protamina 5000 que contiene protamina a más de 10 mg/mL (5000 unidades neutralizantes de heparina por mL) en una solución de sales isotónica.
Los liposomas son vesículas lipídicas microscópicas que a menudo tienen una o más bicapas de un lípido formador de vesículas, tal como un fosfolípido, y son capaces de encapsular un fármaco. En el contexto de la presente invención pueden emplearse diferentes tipos de liposomas, que incluyen, sin limitarse a estos, vesículas multilamelares (MLV), vesículas unilamelares pequeñas (SUV), vesículas unilamelares grandes (LUV), liposomas estabilizados estéricamente (SSL), vesículas multivesiculares (MV), y grandes vesículas multivesiculares (LMV), así como también otras formas de bicapa conocidas en la técnica. El tamaño y la lamelaridad del liposoma dependerán de la forma de preparación y la selección del tipo de vesículas a usarse dependerá del modo de administración preferido. Existen numerosas otras formas de organización supramolecular en las que los lípidos pueden estar presentes en un medio acuoso, que comprenden fases lamelares, fases hexagonales y fases hexagonales inversas, fases cúbicas, micelas, micelas inversas compuestas de monocapas. Estas fases pueden obtenerse, además, en combinación con ADN o ARN, y la interacción con ARN y ADN puede afectar sustancialmente el estado de la fase. Las fases descritas pueden estar presentes en las formulaciones nanoparticuladas del ácido nucleico de la presente invención.
Para la formación de lipoplejos de ácido nucleico a partir de ácido nucleico y liposomas, puede usarse cualquier método adecuado para formar liposomas siempre que proporcione los lipoplejos de ácido nucleico previstos. Los liposomas pueden formarse mediante el uso de métodos estándar tales como el método de evaporación inversa (REV), el método de inyección de etanol, el método de deshidratación-rehidratación (DRV), sonicación u otros métodos adecuados.
Después de la formación de liposomas, los liposomas pueden dimensionarse para obtener una población de liposomas que tienen un intervalo de tamaños sustancialmente homogéneo.
Los lípidos formadores de bicapa tienen, típicamente, dos cadenas hidrocarbonadas, particularmente cadenas de acilo, y un grupo cabeza, ya sea polar o no polar. Los lípidos formadores de bicapa están compuestos de lípidos de origen natural o de origen sintético, que incluyen los fosfolípidos, tales como fosfatidilcolina, fosfatidiletanolamina, ácido fosfatídico, fosfatidilinositol, y esfingomielina, donde las dos cadenas hidrocarbonadas son, típicamente, entre aproximadamente 14­ 22 átomos de carbono de longitud, y tienen diversos grados de insaturación. Otros lípidos adecuados para usar en la composición de la presente invención incluyen glicolípidos y esteroles tales como colesterol y sus diversos análogos, que además pueden usarse en los liposomas.
Los lípidos catiónicos, típicamente, tienen una porción lipofílica, tal como un esterol, una cadena de acilo o diacilo, y tienen una carga neta general positiva. El grupo cabeza del lípido, típicamente, lleva la carga positiva. El lípido catiónico tiene, preferentemente, una carga positiva de 1 a 10 valencias, con mayor preferencia una carga positiva de 1 a 3 valencias, y con mayor preferencia una carga positiva de 1 valencia. Los ejemplos de lípidos catiónicos incluyen, pero no se limitan a 1,2-di-O-octadecenil-3-trimetilamonio propano (DOTMA); dimetildioctadecilamonio (DDAB); 1,2-dioleoil-3-trimetilamoniopropano (DOTAP); 1,2-dioleoil-3-dimetilamonio-propano (DODAP); 1,2-diaciloxi-3-dimetilamonio propanos; 1,2-dialquiloxi-3-dimetilamonio propanos; cloruro de dioctadecildimetilamonio (DODAC), 1,2-dimiristoiloxipropil-1,3-dimetilhidroxietil-amonio (DMRIE) y trifluoroacetato de 2,3-dioleoiloxi-N- [[2(espermina carboxamida)etil]-N,N-dimetil-1-propanamio (DOSPA). Los preferidos son DOTMA, DOTAP, DODAC, y d Os PA. El más preferido es Do TMA.
Además, las nanopartículas descritas en la presente descripción incluyen, además, preferentemente un lípido neutro en vista de la estabilidad estructural, y similares. El lípido neutro puede seleccionarse apropiadamente en vista de la eficiencia del suministro del complejo ácido nucleico-lípido. Los ejemplos de lípidos neutros incluyen, pero no se limitan a, 1,2-di-(9Z-octadecenoil)-sn-glicero-3-fosfoetanolamina (DOPE), 1,2-dioleoil-sn-glicero-3-fosfocolina (DOPC), diacilfosfatidilcolina, diacilfosfatidil etanolamina, ceramida, esfingomielina, cefalina, esterol, y cerebrósido. El preferido e DOPE y/o DOPC. El más preferido es DOPE. En el caso en que un liposoma catiónico incluye tanto un lípido catiónico como un lípido neutro, la relación molar del lípido catiónico con respecto al lípido neutro puede determinarse apropiadamente en vista de la estabilidad del liposoma y similares.
De acuerdo con una modalidad, las nanopartículas descritas en la presente descripción pueden comprender fosfolípidos. Los fosfolípidos pueden ser un glicerofosfolípido. Los ejemplos de glicerofosfolípido incluyen, sin limitación, tres tipos de lípidos: (i) fosfolípidos zwitteriónicos, que incluyen, por ejemplo, fosfatidilcolina (PC), fosfatidilcolina de yema de huevo, PC derivada de soja en forma natural, parcialmente hidrogenada o totalmente hidrogenada, dimiristoil fosfatidilcolina (DMPC) esfingomielina (SM); (ii) fosfolípidos cargados negativamente: que incluyen, por ejemplo, fosfatidilserina (PS), fosfatidilinositol (PI), ácido fosfatídico (PA), fosfatidilglicerol (PG) dipalmipoil pG, dimiristoil fosfatidilglicerol (DMPG); derivados sintéticos en los que el conjugado produce un fosfolípido zwitteriónico cargado negativamente, tal es el caso de metoxi-polietileno, glicol-diestearoil fosfatidiletanolamina (mPEG-DSPE); y (iii) fosfolípidos catiónicos, que incluyen, por ejemplo, fosfatidilcolina o esfingomielina de los cuales el fosfomonoéster fue O-metilado para formar los lípidos catiónicos.
La asociación del ácido nucleico con el portador lípido puede ocurrir, por ejemplo, mediante el llenado de espacios intersticiales del portador con el ácido nucleico, de manera que el portador atrapa físicamente al ácido nucleico, o mediante enlace covalente, iónico, o de hidrógeno, o por medio de adsorción mediante enlaces no específicos. Cualquiera que sea el modo de asociación, el ácido nucleico debe retener sus propiedades terapéuticas, es decir, las que codifican el antígeno.
El término "enfermedad" se refiere a una afección anormal que afecta el cuerpo de un individuo. Una enfermedad a menudo se interpreta como una afección médica que se asocia con signos y síntomas específicos. Una enfermedad puede causarse por factores originalmente de una fuente externa, tal como enfermedad infecciosa, o puede causarse por disfunciones internas, tal como enfermedades autoinmunitarias.
De acuerdo con la invención, el término "enfermedad" además se refiere a enfermedades cancerosas. Los términos "enfermedad cancerosa" o "cáncer" (término médico: neoplasia maligna) se refieren a una clase de enfermedades en las que un grupo de células muestra un crecimiento incontrolado (división más allá de los límites normales), invasión (intrusión y destrucción de tejidos adyacentes) y, a veces, metástasis (propagación a otras localizaciones en el cuerpo a través de la linfa o la sangre). Estas tres propiedades malignas de los cánceres los diferencian de los tumores benignos, que son autolimitados y no invaden ni hacen metástasis. La mayoría de los cánceres forman un tumor, es decir, una inflamación o lesión formada por un crecimiento anormal de células (llamadas células neoplásicas o células tumorales), pero algunos, como la leucemia, no lo hacen. Los ejemplos de cánceres incluyen, pero no se limitan a, carcinoma, linfoma, blastoma, sarcoma, glioma y leucemia. Más particularmente, los ejemplos de tales cánceres incluyen cáncer óseo, cáncer sanguíneo, cáncer de pulmón, cáncer de hígado, cáncer de páncreas, cáncer de piel, cáncer de la cabeza o cuello, melanoma maligno cutáneo o intraocular, cáncer uterino, cáncer de ovarios, cáncer rectal, cáncer de la región anal, cáncer de estómago, cáncer de colon, cáncer de mama, cáncer de próstata, cáncer uterino, carcinoma de los órganos sexuales y reproductivos, Enfermedad de Hodgkin, cáncer del esófago, cáncer del intestino delgado, cáncer del sistema endocrino, cáncer de la glándula tiroides, cáncer de la glándula paratiroides, cáncer de la glándula adrenal, sarcoma de tejidos blandos, cáncer de la vejiga, cáncer de los riñones, carcinoma celular renal, carcinoma de la pelvis renal, neoplasias del sistema nervioso central (CNS), cáncer neuroectodérmico, tumores del eje espinal, glioma, meningioma, y adenoma pituitario. El término "cáncer" de acuerdo con la invención también comprende, las metástasis del cáncer.
El término "enfermedad infecciosa" se refiere a cualquier enfermedad que puede transmitirse de individuo a individuo o de organismo a organismo, y es causada por un agente microbiano (por ejemplo, resfriado común). Los ejemplos de enfermedades infecciosas incluyen enfermedades infecciosas virales, tales como SIDA (HIV), hepatitis A, B o C, herpes, herpes zoster (varicela), sarampión alemán (virus de la rubéola), fiebre amarilla, dengue, etcétera, flavivirus, virus de la gripe, enfermedades infecciosas hemorrágicas (virus de Marburg o Ébola), y síndrome respiratorio agudo severo (SRAS), enfermedades infecciosas bacterianas, tales como la enfermedad del legionario (Legionella), enfermedades de transmisión sexual (por ejemplo clamidia o gonorrea), úlcera gástrica (Helicobacter), cólera (Vibrio), tuberculosis, difteria, infecciones por E.coli, Staphylococci, Salmonella o Streptococci (tetanus); infecciones por protozoarios patógenos tal como malaria, enfermedad del sueño, leismaniasis; toxoplasmosis, es decir, infecciones por Plasmodium, Trypanosoma, Leishmania y Toxoplasma; o infecciones fúngicas, que son causadas, por ejemplo, por Cryptococcus neoformans, Histoplasma capsulatum, Coccidioides immitis, Blastomyces dermatitidis o Candida albicans.
El término "enfermedad autoinmunitaria" se refiere a cualquier enfermedad en la cual el cuerpo produce una respuesta inmunogénica (es decir, sistema inmunitario) a algún componente de sus propios tejidos. En otras palabras, el sistema inmunitario pierde su capacidad de reconocer algunos tejidos o sistemas dentro del cuerpo como propios y direcciona y ataca estos como si fueran extraños. Las enfermedades autoinmunitarias pueden clasificarse en aquellas en las que predominantemente se afecta un órgano (por ejemplo, anemia hemolítica y tiroiditis autoinmunitaria), y aquellas en las que el proceso de la enfermedad autoinmunitaria se difunde a través de muchos tejidos (por ejemplo, lupus eritematoso sistémico). Por ejemplo, se cree que la esclerosis múltiple es causada por las células T que atacan las vainas que rodean las fibras nerviosas del cerebro y la médula espinal. Esto resulta en pérdida de la coordinación, debilidad, y visión borrosa. Las enfermedades autoinmunitarias son conocidas en la técnica e incluyen, por ejemplo, tiroiditis de Hashimoto, enfermedad de Grave, lupus, esclerosis múltiple, artritis reumatoide, anemia hemolítica, tiroiditis autoinmunitaria, lupus eritematoso sistémico, enfermedad celíaca, enfermedad de Crohn, colitis, diabetes, esclerodermia, psoriasis y similares.
De acuerdo con la invención, puede estimularse una respuesta inmunitaria mediante la introducción en un sujeto de un ARNm adecuado que codifica para un antígeno o un fragmento de este, por ejemplo, un antígeno asociado a la enfermedad.
El término "antígeno" se refiere a un agente que comprende un epítopo contra el que se genera una respuesta inmunitaria. El término "antígeno" incluye en particular proteínas, péptidos, polisacáridos, ácidos nucleicos, especialmente ARN y ADN, y nucleótidos. El término "antígeno" también incluye agentes, que se convierten en antigénicos - y sensibilizantes - solo a través de la transformación (por ejemplo de manera intermedia en la molécula o por terminación con la proteína del cuerpo). Un antígeno es, preferentemente, presentado por las células del sistema inmunitario, tales como las células presentadoras de antígeno, como las células dendríticas o los macrófagos. Adicionalmente, un antígeno o un producto procesado de éste, preferentemente, se reconoce por un receptor de células T o B, o por una molécula de inmunoglobulina, tal como un anticuerpo. En una modalidad preferida, el antígeno es un antígeno asociado a la enfermedad, tal como un antígeno asociado a tumores, un antígeno viral, o un antígeno bacteriano.
El término "antígeno asociado a la enfermedad" se usa en su sentido más amplio para referirse a cualquier antígeno asociado con una enfermedad. Un antígeno asociado a la enfermedad es una molécula que contiene epítopos que estimularán el sistema inmunitario del huésped para producir una respuesta inmunitaria celular específica al antígeno y/o una respuesta humoral de anticuerpos contra la enfermedad. Por lo tanto, el antígeno asociado a la enfermedad puede usarse con fines terapéuticos. Los antígenos asociados a la enfermedad se asocian, preferentemente, con infección por microbios, típicamente, antígenos microbianos, o asociados con cáncer, típicamente, tumores.
El término "enfermedad que involucra un antígeno" se refiere a cualquier enfermedad que involucre un antígeno, por ejemplo, una enfermedad que se caracteriza por la presencia y/o la expresión de un antígeno. La enfermedad que involucra un antígeno puede ser una enfermedad infecciosa, una enfermedad autoinmunitaria, o una enfermedad cancerosa o simplemente cáncer. Como se mencionó anteriormente, el antígeno puede ser un antígeno asociado a la enfermedad, tal como un antígeno asociado a tumor, un antígeno viral, o un antígeno bacteriano.
En una modalidad, un antígeno asociado a la enfermedad es un antígeno asociado a tumor. En esta modalidad, la presente invención puede ser útil en el tratamiento del cáncer o de la metástasis del cáncer. Preferentemente, el órgano o tejido enfermo se caracteriza por células enfermas tales como células cancerosas que expresan un antígeno asociado a la enfermedad y/o se caracterizan por la asociación de un antígeno asociado a la enfermedad con su superficie. La inmunización con antígenos intactos o sustancialmente intactos asociados a tumores o fragmentos de estos, tales como péptidos o ácidos nucleicos de MHC clase I y clase II, en particular el ARNm, que codifica tal antígeno o fragmento hace posible producir una respuesta de tipo MHC clase I y/o una de clase II y, por lo tanto, estimular células T tales como linfocitos T citotóxicos CD8+, que son capaces de destruir las células cancerosas, y/o células T CD4+. Tal inmunización puede provocar, además, una respuesta inmunitaria humoral (respuesta de células B) que resulta en la producción de anticuerpos contra el antígeno asociado a tumor. Además, las células presentadoras de antígenos (APC) tales como las células dendríticas (DC) pueden cargarse con péptidos presentados por MHC de clase I mediante transfección con ácidos nucleicos que codifican antígenos tumorales in vitro y administrarse a un paciente. En una modalidad, el término "antígeno asociado a tumor" se refiere a un constituyente de las células cancerosas que puede derivarse del citoplasma, la superficie celular y el núcleo celular. En particular, se refiere a aquellos antígenos que se producen, preferentemente en gran cantidad, intracelularmente o como antígenos de superficie en las células tumorales. Los ejemplos de antígenos tumorales incluyen HER2, EGFR, VEGF, antígeno CAMPATH1, CD22, CA-125, HLA-DR, linfoma de Hodgkin o mucina-1, pero no se limitan a estos.
De acuerdo con la presente invención, un antígeno asociado a tumor comprende, preferentemente, cualquier antígeno que es característico para tumores o cánceres, así como también para células tumorales o cancerosas con respecto al tipo y/o nivel de expresión. En una modalidad, el término "antígeno asociado a tumor" se refiere a proteínas que en condiciones normales, es decir, en un sujeto saludable, se expresan específicamente en un número limitado de tejidos y/u órganos o en etapas específicas del desarrollo, por ejemplo, el antígeno asociado a tumor puede expresarse en condiciones normales específicamente en tejido de estómago, preferentemente, en la mucosa gástrica, en órganos reproductores, por ejemplo, en testículos, en tejido trofoblástico, por ejemplo, en la placenta, o en células de la línea germinal, y se expresan o se expresan de manera aberrante en uno o más tejidos tumorales o cancerosos. En este contexto, "un número limitado" significa, preferentemente, no más de 3, con mayor preferencia no más de 2 o 1. Los antígenos asociados a tumores en el contexto de la presente invención incluyen, por ejemplo, antígenos de diferenciación, preferentemente, antígenos de diferenciación de tipo celular específico, es decir, proteínas que en condiciones normales se expresan específicamente en un cierto tipo de célula, en cierta etapa de diferenciación, antígenos de cáncer/testículos, es decir, proteínas que en condiciones normales se expresan específicamente en testículos y algunas veces en la placenta, y antígenos específicos de línea germinal. En el contexto de la presente invención, el antígeno asociado a tumor, preferentemente, no se expresa, o solo rara vez, en tejidos normales o está mutado en células tumorales. Preferentemente, el antígeno asociado a tumor o la expresión aberrante del antígeno asociado a tumor identifica las células cancerosas. En el contexto de la presente invención, el antígeno asociado a tumor que se expresa por una célula cancerosa en un sujeto, por ejemplo, un paciente que padece una enfermedad cancerosa, es preferentemente una proteína propia en dicho sujeto. En modalidades preferidas, el antígeno asociado a tumor en el contexto de la presente invención se expresa en condiciones normales específicamente en un tejido u órgano que no es esencial, es decir, tejidos u órganos que cuando son dañados por el sistema inmunitario no conducen a la muerte del sujeto, o en órganos o estructuras del cuerpo que no son, o son difícilmente asequibles por el sistema inmunitario. Preferentemente, un antígeno asociado a tumor se presenta en el contexto de las moléculas de MHC por una célula cancerosa en la que se expresa.
Los ejemplos de antígenos de diferenciación que cumplen idealmente los criterios para antígenos asociados a tumor como se contempla por la presente invención como estructuras diana en la inmunoterapia tumoral, en particular, en la vacunación tumoral son las proteínas de superficie celular de la familia Claudina, tales como CLDN6 y CLDN18.2. Estos antígenos de diferenciación se expresan en tumores de diversos orígenes, y son particularmente adecuados como estructuras diana en relación con la inmunoterapia del cáncer mediada por anticuerpos, debido a su expresión selectiva (sin expresión en un tejido normal de toxicidad relevante) y a su localización en la membrana plasmática.
Otros ejemplos de antígenos que pueden ser útiles en la presente invención son p53, ART-4, BAGE, beta-catenina/m, Bcr-abL CAMEL, CAP-1, CASP-8, CDC27/m, CDK4/m, CEA, CLAUDIN-12, c-MYC, CT, Cyp-B, DAM, ELF2M, ETV6-AML1, G250, GAGE, GnT-V, Gap100, HAGE, HER-2/neu, HPV-E7, HPV-E6, HAST-2, hTERT (o hTRT), LAGE, LDLR/FUT, MAGE-A, preferentemente, MAGE-A1, MAGE-A2, MAGE-A3, MAGE-A4, MAGE-A5, MAGE-A6, MAGE-A7, MAGE-A8, MAGE-A9, MAGE-A10, MAGE-A11, o MAGE-A12, MAGE-B, MAGE-C, MART-1/Melan-A, MC1R, Myosin/m, MUC1, MUM-1, -2, -3, NA88-A, NF1, NY-ESO-1, NY-BR-1, p190 menor BCR-abL, Pm1/RARa, PRAME, proteinasa 3, PSA, PSM, RAGE, RU1 o RU2, SAGE, SART-1 o SART-3, SCGB3A2, SCP1, SCP2, SCP3, SSX, SURVIVIN, TEL/AML1, TPI/m, TRP-1, TRP-2, TRP-2/INT2, TPTE y WT, preferentemente, WT-1.
El término "antígeno viral" se refiere a cualquier componente viral que tiene propiedades antigénicas, es decir, que es capaz de provocar una respuesta inmunitaria en un individuo. El antígeno viral puede ser una ribonucleoproteína viral o una proteína de envoltura.
El término "antígeno bacteriano" se refiere a cualquier componente bacteriano que tiene propiedades antigénicas, es decir, que es capaz de provocar una respuesta inmunitaria en un individuo. El antígeno bacteriano puede derivarse de la pared celular o de la membrana del citoplasma de la bacteria.
El "procesamiento del antígeno" se refiere a la degradación de un antígeno en productos de procesión, que son fragmentos de dicho antígeno (por ejemplo, la degradación de una proteína en péptidos) y la asociación de uno o más de estos fragmentos (por ejemplo, mediante unión) con las moléculas MHC para la presentación por células, preferentemente células presentadoras de antígeno, a células T específicas.
El término "respuesta inmunitaria", como se usa en la presente descripción, se refiere a una reacción del sistema inmunitario tal como a organismos inmunogénicos, tales como bacterias o virus, células o sustancias. El término "respuesta inmunitaria" incluye la respuesta inmunitaria innata y la respuesta inmunitaria adaptativa. Preferentemente, la respuesta inmunitaria está relacionada con una activación de células inmunitarias, una inducción de la biosíntesis de citocinas y/o la producción de anticuerpos. Se prefiere que la respuesta inmunitaria comprenda las etapas de activación de las células presentadoras de antígeno, tales como células dendríticas y/o macrófagos, la presentación de un antígeno o fragmento de este por dichas células presentadoras de antígeno y la activación de células T citotóxicas debido a esta presentación.
El término "tratar" o "tratamiento" se refiere a cualquier tratamiento que mejora el estado de salud y/o prolonga (aumenta) la esperanza de vida de un individuo. Dicho tratamiento puede eliminar la enfermedad en un individuo, detener o enlentecer el desarrollo de una enfermedad en un individuo, inhibir o enlentecer el desarrollo de una enfermedad en un individuo, disminuir la frecuencia o gravedad de los síntomas en un individuo, y/o disminuir la recurrencia en un individuo quien actualmente tiene o quien previamente tuvo una enfermedad.
En particular, el término "tratamiento de una enfermedad" incluye curar, acortar la duración, mejorar, retrasar o inhibir la progresión o el empeoramiento de una enfermedad o los síntomas de ésta.
El término "inmunoterapia" se refiere a un tratamiento que involucra, preferentemente, una reacción inmunitaria específica y/o una(s) función inmunitaria efectora.
El término "inmunización" o "vacunación" describe el proceso de tratamiento de un sujeto por razones terapéuticas o profilácticas.
El término "sujeto" o "individuo", como se usa en la presente descripción, se refiere, preferentemente, a mamíferos. Por ejemplo, los mamíferos en el contexto de la presente invención son humanos, primates no humanos, animales domesticados tales como perros, gatos, ovejas, vacuno, cabras, cerdos, caballos, etcétera, animales de laboratorio tales como ratones, ratas, conejos, conejillos de indias, etcétera, así como también animales en cautiverio, tal como animales de los zoológicos. En una modalidad preferida, el sujeto es un humano.
El término "célula presentadora de antígeno" (APC) se refiere a una célula de una variedad de células capaces de exponer, adquirir, y/o presentar al menos un antígeno o fragmento antigénico sobre (o en) su superficie celular. Las células presentadoras de antígeno pueden distinguirse en células presentadoras de antígeno profesionales y células presentadoras de antígeno no profesionales.
El término "células presentadoras de antígeno profesionales" se refiere a las células presentadoras de antígeno que expresan constitutivamente las moléculas del complejo principal de histocompatibilidad clase II (MHC clase II) requeridas para la interacción con las células T vírgenes. Si una célula T interactúa con el complejo de la molécula MHC de clase II en la membrana de la célula presentadora de antígeno, la célula presentadora de antígeno produce una molécula coestimuladora que induce la activación de la célula T. Las células presentadoras de antígeno profesionales comprenden células dendríticas y macrófagos.
El término "células presentadoras de antígenos no profesionales" se refiere a células presentadoras de antígenos que no expresan constitutivamente las moléculas de MHC de clase II, sino que son estimuladas por determinadas citocinas tales como el interferón gamma. Las células presentadoras de antígeno no profesionales ilustrativas incluyen fibroblastos, células epiteliales tímicas, células epiteliales tiroideas, células gliales, células beta pancreáticas o células endoteliales vasculares.
El término "complejo principal de histocompatibilidad" y la abreviatura "MHC" incluyen las moléculas MHC de clase I y MHC de clase II y se refiere a un complejo de genes que se producen en todos los vertebrados. Las proteínas o moléculas del MHC son importantes para la señalización entre linfocitos y células presentadoras de antígeno o células enfermas en reacciones inmunitarias, en donde las proteínas o moléculas del MHC se unen a péptidos y los presentan para su reconocimiento por los receptores de células T. Las proteínas codificadas por el MHC se expresan en la superficie de las células y muestran tanto antígenos propios (fragmentos de péptidos de la propia célula) como antígenos no propios (por ejemplo, fragmentos de microorganismos invasores) a una célula T.
De acuerdo con la invención el término "receptor de antígeno quimérico (CAR)" es sinónimo de los términos "receptor de célula T quimérico" y "receptor de células T artificial".
Estos términos se refieren a receptores ingenierizados, que confieren una especificidad arbitraria tal como la especificidad de un anticuerpo monoclonal en una célula inmunitaria efectora tal como una célula T. De esta forma, pueden generarse un gran número de células T específicas de cáncer para la transferencia adoptiva de células. Por lo tanto, un CAR puede estar presente en las células T, por ejemplo, en lugar de, o además de, el propio receptor de células T de las células T. Tales células T no requieren necesariamente el procesamiento y la presentación de un antígeno para el reconocimiento de la célula diana si no que pueden reconocer preferentemente con especificidad cualquier antígeno presente en una célula diana. Preferentemente, dicho CAR se expresa en la superficie de las células. Para el propósito de la presente invención las células T que comprenden un CAR se comprenden por el término "célula T" como se usa en la presente descripción.
De acuerdo con la invención, el término "CAR" (o "receptor de antígeno quimérico") se refiere a un receptor artificial que comprende una sola molécula o un complejo de moléculas que reconoce, es decir, que se unen a, una estructura diana (por ejemplo, un antígeno) sobre una célula diana tal como una célula cancerosa (por ejemplo, mediante la unión de un dominio de unión a antígeno con un antígeno expresado en la superficie de la célula diana) y puede conferir especificidad a una célula efectora inmunitaria tal como una célula T que expresa dicho CAR en la superficie celular. Preferentemente, el reconocimiento de la estructura diana mediante un c Ar resulta en la activación de una célula efectora inmunitaria que expresa dicho CAR. Un CAR puede comprender una o más unidades de proteína, dichas unidades de proteína comprenden uno o más dominios como se describió en la presente descripción. El término "CAR" no incluye los receptores de células T.
En una modalidad, un fragmento variable de cadena sencilla (scFv) derivado de un anticuerpo monoclonal se fusiona a CD3-zeta transmembranal y de endodominio. Tales moléculas resultan en la transmisión de una señal zeta en respuesta al reconocimiento por el scFv de su diana antigénica en una célula diana y la muerte de la célula diana que expresa el antígeno diana. Los dominios de reconocimiento de antígenos que pueden usarse además, incluyen entre otros las cadenas sencillas alfa y beta del receptor de célula T (TCR). De hecho, casi cualquier cosa que se una a una diana determinada con alta afinidad puede usarse como un dominio de reconocimiento de antígenos.
Seguido del reconocimiento de los antígenos, los receptores se agrupan y se transmite una señal a la célula. A este respecto, un "dominio de señalización de células T" es un dominio, preferentemente un endodominio, que transmite una señal de activación a la célula T después que se une el antígeno. El componente de endodominio más utilizado es CD3-zeta.
La terapia de transferencia adoptiva de células con células T ingenierizadas con CAR que expresan receptores de antígeno quiméricos es un terapéutico anticancerígeno prometedor debido a que las células T modificadas con CAR pueden ingenierizarse para hacer diana virtualmente cualquier antígeno tumoral. Por ejemplo, las células T de los pacientes pueden modificarse genéticamente (genéticamente modificadas) para expresar CAR dirigidos específicamente hacia los antígenos en las células tumorales de los pacientes, después se inyectan nuevamente al paciente.
De acuerdo con la invención, un CAR puede sustituir la función de un receptor de célula T y, en particular, puede conferir reactividad tal como la actividad citolítica a una célula tal como una célula T. Sin embargo, en contraste con la unión del receptor de células T a un complejo antígeno péptido-MHC, un CAR puede unirse a un antígeno, en particular cuando se expresa en la superficie celular.
De acuerdo con la invención, los CAR pueden comprender generalmente tres dominios.
El primer dominio es el dominio de unión que reconoce y se une al antígeno.
El segundo dominio es el dominio de coestimulación. El dominio de coestimulación sirve para potenciar la proliferación y supervivencia de los linfocitos citotóxicos después de la unión del CAR a una porción diana. La identidad del dominio de coestimulación está limitada solo porque este tiene la capacidad de potenciar la proliferación celular y la supervivencia después de la unión de la porción diana mediante el CAR. Los dominios de coestimulación adecuados incluyen CD28, CD137 (4-1BB), un miembro de la familia de receptores del factor de necrosis tumoral (TNF), CD134 (OX40), un miembro de la superfamilia de receptores TNFR y CD278 (ICOS), una molécula coestimuladora de la superfamilia CD28 expresada en células T activadas. La persona experta comprenderá que las variantes de secuencia de estos dominios de coestimulación observados pueden usarse sin afectar negativamente a la invención, donde las variantes tienen la misma actividad o actividad similar que el dominio en el que se modelan. Tales variantes tendrán al menos aproximadamente 80 % de identidad de secuencia con la secuencia de aminoácidos del dominio del que se derivan. En algunas modalidades de la invención, las construcciones CAR comprenden dos dominios de coestimulación. Si bien las combinaciones particulares incluyen todas las variaciones posibles de los cuatro dominios señalados, los ejemplos específicos incluyen CD28+CD137 (4-1BB) y CD28+CD134 (OX40).
El tercer dominio es el dominio de señalización de activación (o dominio de señalización de células T). El dominio de señalización de activación sirve para activar linfocitos citotóxicos después de la unión del CAR al antígeno. La identidad del dominio de señalización de activación se limita solamente en que este tiene la capacidad de inducir la activación del linfocito citotóxico seleccionado después de la unión del antígeno por el CAR. Los dominios de señalización de activación adecuados incluyen la cadena CD3 [zeta] de células T y el receptor Fc [gamma]. El experto a entenderá que las variantes de secuencia de estos dominios de señalización de activación observados pueden usarse sin afectar negativamente a la invención, donde las variantes tienen la misma actividad o actividad similar que el dominio en el que se modelan. Tales variantes tendrán al menos aproximadamente 80 % de identidad de secuencia con la secuencia de aminoácidos del dominio del que se derivan.
Los CAR pueden comprender los tres dominios, juntos en forma de una proteína de fusión. Tales proteínas de fusión generalmente comprenderán un dominio de unión, uno o más dominios de coestimulación, y un dominio de señalización de activación, unido en una dirección N-terminal a C-terminal. Sin embargo, los CAR no se limitan a esta disposición y otras disposiciones son aceptables e incluyen un dominio de unión, un dominio de señalización de activación, y uno o más dominios de coestimulación. Se debe entender que debido a que el dominio de unión debe ser libre para unirse al antígeno, la colocación del dominio de unión en la proteína de fusión generalmente será tal que se logre la exposición de la región sobre el exterior de la célula. De la misma manera, debido a que los dominios de coestimulación y señalización de activación sirven para inducir la actividad y la proliferación de los linfocitos citotóxicos, la proteína de fusión generalmente presentará estos dos dominios en el interior de la célula. Los CAR pueden incluir elementos adicionales, tales como un péptido señal para garantizar la exportación adecuada de la proteína de fusión a la superficie de las células, un dominio transmembrana para garantizar que la proteína de fusión se mantenga como una proteína integral de membrana y un dominio de bisagra (o región espaciadora) que imparte flexibilidad al dominio de unión y permite una unión fuerte al antígeno.
Las células usadas junto con el sistema CAR de la presente invención son preferentemente células T, en particular linfocitos citotóxicos, preferentemente seleccionados de células T citotóxicas, células asesinas naturales (NK), y células asesinas activadas por linfocinas (LAK). Después de la activación, cada uno de estos linfocitos citotóxicos desencadena la destrucción de las células diana. Por ejemplo, las células T citotóxicas desencadenan la destrucción de las células diana por uno o ambos de los siguientes medios. Primero, después de la activación, las células T liberan citotoxinas tales como perforina, granzimas, y granulisina. La perforina y la granulisina crean poros en la célula diana, y las granzimas entran en la célula y desencadenan una cascada de caspasas en el citoplasma que induce la apoptosis (muerte celular programada) de la célula. Segundo, la apoptosis puede inducirse mediante la interacción de los ligando Fas-Fas entre las células T y las células diana. Los linfocitos citotóxicos serán, preferentemente, células autólogas, aunque pueden usarse células heterólogas o células alogénicas.
Pueden usarse una diversidad de métodos para introducir construcciones CAR en las células T, que incluyen la transfección de ADN no viral, los sistemas basados en transposones y los sistemas basados en virus. La transfección de ADN no viral tiene un bajo riesgo de mutagénesis insercional. Los sistemas basados en transposones pueden integrar los transgenes de manera más eficiente que los plásmidos que no contienen un elemento de integración. Los sistemas basados en virus incluyen el uso de retrovirus y y vectores lentivirales. Los retrovirus y son relativamente fáciles de producir, transducen de manera eficiente y permanente las células T, y preliminarmente han demostrado su seguridad desde el punto de vista de la integración en las células T humanas primarias. Los vectores lentivirales además transducen de manera eficiente y permanente las células T, pero su fabricación es más costosa. Además, son potencialmente más seguros que los sistemas basados en retrovirus.
El ARN descrito en la presente descripción (por ejemplo, que se obtiene mediante el uso de una molécula de ácido nucleico descrita en la presente descripción como un molde de transcripción) es útil además en la reprogramación o la desdiferenciación de células somáticas en células similares a las células madre, es decir, células que tienen características de células madre, in vitro o en vivo. Esto puede implicar la expresión transitoria de factores de reprogramación in vitro o en vivo para iniciar los procesos de reprogramación o desdiferenciación en las células. Por lo tanto, en una modalidad, el péptido o la proteína codificada por un ácido nucleico tal como el ARN descrito en la presente descripción es un factor que permite la reprogramación de células somáticas en células que tienen características de células madre. Las células similares a células madre pueden proporcionarse de acuerdo con la invención sin generar embriones o fetos. La desdiferenciación de las células somáticas en células que tienen características de células madre, en particular la pluripotencia, puede realizarse mediante la introducción del ARN codificante para factores que inducen la desdiferenciación de las células somáticas en las células somáticas (además denominados factores de transcripción de reprogramación (rTF)) y mediante el cultivo de las células somáticas que permiten que las células se desdiferencien. Después de desdiferenciarse, las células podrían inducirse a rediferenciarse en el mismo o diferente tipo de célula somática tal como neuronal, hematopoyética, muscular, epitelial, y otros tipos de células. Por lo tanto, tales células similares a células madres tienen aplicaciones médicas para el tratamiento de enfermedades degenerativas mediante "terapia celular" y pueden usarse en estrategias terapéuticas novedosas en el tratamiento de trastornos cardíacos, neurológicos, endocrinos, vasculares, retinianos, dermatológicos, musculoesqueléticos, y otras enfermedades.
En consecuencia, la invención se refiere, además, a un método para proporcionar células que tienen características de células madre que comprende las etapas de (i) proporcionar una población celular que comprende células somáticas, (ii) introducir el ARN de la invención capaz de expresar uno o más factores que permiten la reprogramación de las células somáticas a células que tienen características de células madre en las células somáticas, y (iii) permitir el desarrollo de células que tienen características de células madre. En una modalidad, el método comprende, además, introducir en las células somáticas miARN que potencia la reprogramación de las células somáticas a células que tienen características de células madre.
En una modalidad, el uno o más factores comprenden OCT4 y SOX2. El uno o más factores pueden comprender, además, KLF4 y/o c-MYC y/o NANOG y/o LIN28. En una modalidad, el uno o más factores comprenden OCT4, SOX2, KLF4 y c-MYC y pueden comprender, además, LIN28 y opcionalmente NANOG. En una modalidad, el uno o más factores comprenden OCT4, SOX2, NANOG y LIN28.
En una modalidad, el método comprende, además, la etapa de cultivar las células somáticas en presencia de al menos un inhibidor de histona desacetilasa, en donde el al menos un inhibidor de histona desacetilasa comprende, preferentemente, ácido valproico, butirato de sodio, tricostatina A y/o scriptaid.
En una modalidad, la etapa (iii) comprende cultivar las células somáticas en condiciones de cultivo de células madre embrionarias.
En una modalidad, las características de las células madre comprenden una morfología de células madre embrionarias.
En una modalidad, las células que tienen características de células madre tienen cariotipos normales, expresan actividad de telomerasa, expresan marcadores de superficie celular que son característicos para células madre embrionarias y/o expresan genes que son característicos para células madre embrionarias.
En una modalidad, las células que tienen características de células madre exhiben un estado pluripotente.
En una modalidad, las células que tienen características de células madre tienen el potencial de desarrollo para diferenciarse en derivados avanzados de todas las tres capas germinales primarias.
En una modalidad, las células somáticas son fibroblastos tales como fibroblastos de pulmón, fibroblastos de prepucio o fibroblastos dérmicos. Preferentemente, las células somáticas son células humanas.
En una modalidad, el ARN se introduce en las células somáticas mediante electroporación o lipofección. En una modalidad, el ARN se introduce en las células somáticas repetitivamente.
En una modalidad, la introducción de ARN capaz de expresar determinados factores, como se describió en la presente descripción, en células somáticas resulta en la expresión de dichos factores durante un período prolongado de tiempo, preferentemente, durante al menos 10 días, preferentemente, durante al menos 11 días y con mayor preferencia durante al menos 12 días. Para lograr tal expresión a largo plazo, el ARN se introduce preferentemente periódicamente (es decir, repetitivamente) en las células más de una vez, preferentemente, mediante el uso de electroporación. Preferentemente, el ARN se introduce en las células al menos dos veces, con mayor preferencia al menos 3 veces, con mayor preferencia al menos 4 veces, incluso con mayor preferencia al menos 5 veces hasta, preferentemente, 6 veces, con mayor preferencia hasta 7 veces o incluso hasta 8, 9 o 10 veces, preferentemente durante un período de tiempo de al menos 10 días, preferentemente durante al menos 11 días y con mayor preferencia durante al menos 12 días para asegurar la expresión de uno o más factores durante un período de tiempo prolongado. Preferentemente, los períodos de tiempo transcurridos entre las introducciones repetidas del ARN son de 24 horas a 120 horas, preferentemente de 48 horas a 96 horas. En una modalidad, los períodos de tiempo que transcurren entre las introducciones repetidas del ARN no son más de 72 horas, preferentemente no más de 48 horas o 36 horas. En una modalidad, antes de la siguiente electroporación, se permite que las células se recuperen de la electroporación previa. En cualquier caso, las condiciones deben seleccionarse de manera que los factores se expresen en las células en cantidades y durante períodos de tiempo que sustenten el proceso de reprogramación.
Una "célula madre" es una célula con la capacidad de autorrenovarse, permanecer indiferenciada, y diferenciarse. Una célula madre puede dividirse sin límite, durante al menos el tiempo de vida del animal en el que reside naturalmente. Una célula madre no está terminalmente diferenciada; no está en la etapa final de una vía de diferenciación. Cuando una célula madre se divide, cada célula hija puede permanecer como una célula madre o embarcarse en un curso que conduce a la diferenciación terminal.
Las células madre totipotentes son células que tienen propiedades de diferenciación totipotencial y que son capaces de desarrollarse en un organismo completo. Esta propiedad es poseída por las células hasta la etapa de 8 células después de la fertilización del ovocito por los espermatozoides. Cuando estas células se aíslan y se trasplantan al útero, pueden convertirse en un organismo completo.
Las células madre pluripotentes son células capaces de desarrollarse en diversas células y tejidos derivados de las capas ectodérmica, mesodérmica y endodérmica. Las células madre pluripotentes que se derivan de la masa celular interna ubicada en el interior del blastocisto, que se generan 4-5 días después de la fertilización se denominan "células madre embrionarias" y pueden diferenciarse en células de diversos tejidos, pero no pueden formar nuevos organismos vivos.
Las células madre multipotentes son células madre que se diferencian normalmente solo en tipos de células específicas de su tejido y órgano de origen. Las células madre multipotentes están involucradas no solo en el crecimiento y el desarrollo de diversos tejidos y órganos durante los períodos fetal, neonatal y adulto, sino además en el mantenimiento de la homeostasis del tejido adulto y la función de inducir la regeneración después del daño tisular. Las células multipotentes específicas de tejido se denominan colectivamente "células madre adultas".
Una "célula madre embrionaria" o "ESC" es una célula madre que está presente o se aísla de un embrión. Puede ser pluripotente, que tiene la capacidad de diferenciarse en todas y cada una de las células presentes en el organismo, o multipotente, con la capacidad de diferenciarse en más de un tipo de célula.
Como se usa en la presente descripción, "embrión" se refiere a un animal en las primeras etapas de su desarrollo. Estas etapas se caracterizan por la implantación y la gastrulación, donde se definen y establecen las tres capas germinales y mediante la diferenciación de las capas germinales en los órganos y sistemas de órganos respectivos. Las tres capas germinales son el endodermo, el ectodermo y el mesodermo.
Un "blastocisto" es un embrión en una etapa temprana del desarrollo en el que el óvulo fertilizado experimenta la escisión, y se forma o se ha formado una capa esférica de células que rodean una cavidad llena de líquido. Esta capa esférica de células es el trofoectodermo. Dentro del trofoectodermo hay un grupo de células denominado masa celular interna (ICM). El trofoectodermo es el precursor de la placenta, y la ICM es la precursora del embrión.
Una célula madre adulta, llamada además célula madre somática, es una célula madre que se encuentra en un adulto. Una célula madre adulta se encuentra en un tejido diferenciado, puede autorrenovarse, y puede diferenciarse, con algunas limitaciones, para producir tipos de células especializadas de su tejido de origen. Los ejemplos incluyen células madre mesenquimales, células madre hematopoyéticas, y células madre neurales.
Una "célula diferenciada" es una célula madura que ha experimentado cambios progresivos en el desarrollo a una forma o función más especializada. La diferenciación celular es el proceso que experimenta una célula a medida que madura a un tipo de célula claramente especializado. Las células diferenciadas tienen características distintas, realizan funciones específicas, y tienen menos probabilidades de dividirse que sus contrapartes menos diferenciadas.
Una célula "indiferenciada", por ejemplo, una célula inmadura, embrionaria, o primitiva, típicamente tiene una apariencia inespecífica, puede realizar múltiples actividades no específicas, y puede desempeñarse mal, si es que lo hace, en funciones realizadas típicamente por células diferenciadas.
"Célula somática" se refiere a todas y cada una de las células diferenciadas y no incluye células madre, células germinales, o gametos. Preferentemente, "célula somática" como se usa en la presente descripción se refiere a una célula diferenciada terminalmente.
Como se usa en la presente descripción, "comprometido" se refiere a las células que se consideran comprometidas permanentemente con una función específica. Las células comprometidas además se denominan "células diferenciadas terminalmente".
Como se usa en la presente descripción, "diferenciación" se refiere a la adaptación de las células para una forma o función particular. En las células, la diferenciación conduce a una célula más comprometida.
Como se usa en la presente descripción, "desdiferenciación" se refiere a la pérdida de especialización en forma o función. En las células, la desdiferenciación conduce a una célula menos comprometida.
Como se usa en la presente descripción, "reprogramación" se refiere al restablecimiento del programa genético de una célula. Una célula reprogramada exhibe, preferentemente, pluripotencia.
Los términos "desdiferenciada" y "reprogramada" o términos similares se usan indistintamente en la presente descripción para designar células derivadas de células somáticas que tienen características de células madre. Sin embargo, dichos términos no pretenden limitar el tema descrito en la presente descripción por consideraciones mecanísticas o funcionales.
El término "ARN que induce el desarrollo de características de células madre" o "ARN capaz de expresar uno o más factores que permiten la reprogramación de las células somáticas a células que tienen características de células madre" se refiere al ARN que cuando se introduce en una célula somática induce a la célula a desdiferenciarse.
Como se usa en la presente descripción, "célula germinal" se refiere a una célula reproductiva tal como un espermatocito o un ovocito, o una célula que se convertirá en una célula reproductiva.
Como se usa en la presente descripción, "pluripotente" se refiere a células que pueden dar lugar a cualquier tipo de célula, excepto las células de la placenta u otras células de soporte del útero.
Los términos tales como "célula que tiene características de células madre", "célula que tiene propiedades de células madre" o "célula similar a células madre" se usan en la presente descripción para designar células que, aunque derivan de células somáticas diferenciadas que no son células madre, exhiben una o más características típicas de células madre, en particular de células madre embrionarias. Tales características incluyen una morfología de células madre embrionarias, tal como colonias compactas, alta relación de núcleo a citoplasma y nucléolos prominentes, cariotipos normales, expresión de actividad de telomerasa, expresión de marcadores de superficie celular que son característicos de células madre embrionarias, y/o la expresión de genes que son característicos de las células madre embrionarias. Los marcadores de superficie celular que son característicos de las células madre embrionarias se seleccionan, por ejemplo, del grupo que consiste en antígeno embrionario específico de etapa 3 (SSEA-3), SSEA-4, antígeno relacionado con tumores 1-60 (TRA-1-60), TRA-1-81, y TRA-2-49/6E. Los genes que son característicos de las células madre embrionarias se seleccionan, por ejemplo, del grupo que consiste en OCT4 endógeno, NANOG endógeno, factor de crecimiento y diferenciación 3 (GDF3), expresión reducida 1 (REX1), factor de crecimiento de fibroblastos 4 (FGF4), gen específico de células embrionarias 1 (ESG1), asociado al desarrollo pluripotencial 2 (DPPA2), DPPA4, y telomerasa transcriptasa inversa (TERT). En una modalidad, la una o más características típicas de las células madre incluyen la pluripotencia.
En una modalidad de la invención, las características de las células madre comprenden una morfología de células madre embrionarias, en donde dicha morfología de células madre embrionarias comprende, preferentemente, criterios morfológicos seleccionados del grupo que consiste en colonias compactas, alta relación de núcleo a citoplasma y nucléolos prominentes. En determinadas modalidades, las células que tienen características de células madre tienen cariotipos normales, expresan actividad de telomerasa, expresan marcadores de superficie celular que son característicos de células madre embrionarias y/o expresan genes que son característicos de células madre embrionarias. Los marcadores de superficie celular que son característicos de las células madre embrionarias pueden seleccionarse del grupo que consiste en antígeno embrionario específico de etapa 3 (SSEA-3), SSEA-4, antígeno relacionado con tumores 1-60 (TRA-1-60), TRA-1-81, y TRA-2-49/6E y los genes que son característicos de las células madre embrionarias pueden seleccionarse del grupo que consiste en OCT4 endógeno, NANOG endógeno, factor de crecimiento y diferenciación 3 (GDF3), expresión reducida 1 (REX1), factor de crecimiento de fibroblastos 4 (FGF4), gen específico de células embrionarias 1 (ESG1), asociado al desarrollo pluripotencial 2 (DPPA2), DPPA4 y telomerasa transcriptasa inversa (TERT).
Preferentemente, las células que tienen características de células madre son células somáticas desdiferenciadas y/o reprogramadas. Preferentemente, las células que tienen características de células madre exhiben las características esenciales de las células madre embrionarias tal como un estado pluripotente. Preferentemente, las células que tienen características de células madre tienen el potencial de desarrollo para diferenciarse en derivados avanzados de todas las tres capas germinales primarias. En una modalidad, la capa germinal primaria es el endodermo y el derivado avanzado es el tejido epitelial similar al intestino. En una modalidad adicional, la capa germinal primaria es el mesodermo y el derivado avanzado es el músculo estriado y/o el cartílago. Aún en una modalidad adicional, la capa germinal primaria es el ectodermo y el derivado avanzado es el tejido neural y/o el tejido epidérmico. En una modalidad preferida, las células que tienen características de células madre tienen el potencial de desarrollo para diferenciarse en células neuronales y/o células cardíacas.
En una modalidad, las células somáticas son células madre embrionarias derivadas de células somáticas con un fenotipo mesenquimatoso. En una modalidad preferida, las células somáticas son fibroblastos tales como fibroblastos fetales o fibroblastos postnatales o queratinocitos, preferentemente, queratinocitos derivados del folículo piloso. En modalidades adicionales, los fibroblastos son fibroblastos de pulmón, fibroblastos de prepucio o fibroblastos dérmicos. En modalidades particulares, los fibroblastos son fibroblastos como los depositados en la Colección Americana de Tipos de Cultivos (ATCC) bajo el núm. de Catálogo CCL-186, como los depositados en la Colección Americana de Tipos de Cultivos (ATCC) bajo el núm. de Catálogo CRL-2097 o como los depositados en la Colección Americana de Tipos de Cultivos (ATCC) bajo el núm. de Catálogo CRL-2522, o como los distribuidos por System Biosciences bajo el núm. de catálogo. PC501A-HFF. En una modalidad, los fibroblastos son fibroblastos dérmicos humanos adultos. Preferentemente, las células somáticas son células humanas. De acuerdo con la presente invención, las células somáticas pueden modificarse genéticamente.
El término "factor" de acuerdo con la invención cuando se usa junto con la expresión de este por ARN incluye proteínas y péptidos, así como también derivados y variantes de estos. Por ejemplo, el término "factor" comprende OCT4, SOX2, NANOG, LIN28, KLF4 y c-MYC.
Los factores pueden ser de cualquier especie animal; por ejemplo, mamíferos y roedores. Los ejemplos de mamíferos incluyen, pero no se limitan a humanos y primates no humanos. Los primates incluyen, pero no se limitan a humanos, chimpancés, babuinos, monos cynomolgus, y cualquiera de los otros monos del Nuevo o Viejo Mundo. Los roedores incluyen, pero no se limitan a ratón, rata, conejillo de indias, hámster y jerbo.
De acuerdo con la presente invención, uno o más factores capaces de permitir la reprogramación de células somáticas a células que tienen características de células madre comprenden un conjunto de factores seleccionados del grupo que consiste en (i) OCT4 y SOX2, (ii) OCT4, SOX2 y uno o ambos de NANOG y LIN28, (iii) OCT4, SOX2 y uno o ambos de KLF4 y c-MYC. En una modalidad, dicho uno o más factores capaces de expresarse por el ARN comprenden OCT4, SOX2, NANOG y LIN28 u OCT4, SOX2, KLF4 y c-MYC. Preferentemente, el ARN se introduce en dichas células somáticas mediante electroporación o microinyección. Preferentemente, la invención comprende, además, permitir el desarrollo de células que tienen características de células madre, por ejemplo, mediante el cultivo de la célula somática en condiciones de cultivo de células madre embrionarias, preferentemente, en condiciones adecuadas para mantener células madre pluripotentes en un estado indiferenciado.
OCT4 es un factor de transcripción de los factores de transcripción eucariota POU y un indicador de pluripotencia de las células madre embrionarias. Es una proteína de unión a Octómero expresada por vía materna. Se ha observado que está presente en los ovocitos, la masa celular interna de los blastocitos y además en la célula germinal primordial. El gen POU5F1 codifica la proteína OCT4. Los sinónimos del nombre del gen incluyen OCT3, OCT4, OTF3 y MGC22487. La presencia de OCT4 en concentraciones específicas es necesaria para que las células madre embrionarias permanezcan indiferenciadas. Preferentemente, la "proteína OCT4" o simplemente "OCT4" se refiere a OCT4 humano.
Sox2 es un miembro de la familia de genes Sox (caja HMG relacionada con SRY) que codifica los factores de transcripción con un único dominio de unión al ADN de HMG. Se ha encontrado que SOX2 controla las células progenitoras neurales mediante la inhibición de su capacidad para diferenciarse. La represión del factor resulta en la delaminación de la zona ventricular, que es seguida por una salida del ciclo celular. Estas células, además, comienzan a perder su carácter progenitor a través de la pérdida de marcadores progenitores y de diferenciación neuronal temprana. Preferentemente, la "proteína SOX2" o simplemente "SOX2" se refiere a SOX2 humano.
NANOG es un gen de homeodominio de tipo NK-2, y se ha propuesto que desempeña un papel clave en el mantenimiento de la pluripotencia de las células madre presumiblemente mediante la regulación de la expresión de genes críticos para la renovación y diferenciación de células madre embrionarias. NANOG se comporta como un activador de la transcripción con dos dominios de activación inusualmente fuertes integrados en su extremo terminal C. La disminución de la expresión de NANOG induce la diferenciación de las células madre embrionarias. Preferentemente, la "proteína NANOG" o simplemente "NANOG" se refiere a NANOG humano.
LIN28 es una proteína citoplasmática conservada con un apareamiento inusual de motivos de unión a ARN: un dominio de choque frío y un par de dedos de zinc CCHC de tipo retroviral. En los mamíferos, es abundante en diversos tipos de células indiferenciadas. En células pluripotentes de mamíferos, se observó LIN28 en complejos sensibles a RNasa con la Proteína de Unión a poli(A), y en fracciones polisomales de gradientes de sacarosa, lo que sugiere que está asociado con la traducción de los ARNm. Preferentemente, la "proteína LIN28" o simplemente "LIN28" se refiere a LIN28 humano.
El factor similar a Krueppel (KLF4) es un factor de transcripción de dedos de zinc, que se expresa fuertemente en las células epiteliales postmitóticas de diferentes tejidos, por ejemplo, el colon, el estómago y la piel. KLF4 es esencial para la diferenciación terminal de estas células y se involucra en la regulación del ciclo celular. Preferentemente, la "proteína KLF4" o simplemente "KLF4" se refiere a KLF4 humano.
MYC (cMYC) es un protooncogén, que se sobreexpresa en una amplia gama de cánceres humanos. Cuando es mutado específicamente, o se sobreexpresa, aumenta la proliferación celular y funciona como un oncogén. El gen MYC codifica para un factor de transcripción que regula la expresión del 15 % de todos los genes a través de la unión en las secuencias de Caja Potenciadora (Cajas-E) y el reclutamiento de las histonas acetiltransferasas (HAT). MYC pertenece a la familia de factores de transcripción MYC, que además incluye los genes N-MYC y L-MYC. Los factores de transcripción de la familia MYC contienen el dominio bHLH/LZ (cremallera básica de leucina Hélice-Bucle-Hélice). Preferentemente, la "proteína cMYC" o simplemente "cMYC" se refiere a cMYC humano.
Una referencia, en la presente descripción a factores específicos tales como OCT4, SOX2, NANOG, LIN28, KLF4 o c-MYC debe comprenderse a fin de que además se incluyan todas las variantes de estos factores. En particular, debe comprenderse a fin de que además se incluyan todas las variantes de empalme, variantes modificadas postraduccionalmente, conformaciones, isoformas y especies homólogas de estos factores que las células expresan de manera natural.
El término "miARN" (microARN) se relaciona con los ARN no codificantes de 21-23 nucleótidos de longitud que se encuentran en las células eucariotas que, mediante la inducción de la degradación y/o la prevención de la traducción de los ARNm diana, modulan una gran cantidad de funciones celulares, que incluyen las relacionadas con la autorenovación/diferenciación de las ESC y progresión del ciclo celular. Los miARN son reguladores postranscripcionales que se unen a secuencias complementarias en los transcriptos de ARN mensajero diana (ARNm), que generalmente resulta en la represión de la traducción o en la degradación de la diana y en el silenciamiento génico. Se ha encontrado que los miARN en la combinación correcta son capaces de inducir la reprogramación celular directa de células somáticas a células que tienen características de células madre in vitro. Por ejemplo, se ha observado que el conglomerado de miARN 302-367 potencia la reprogramación de células somáticas.
Preferentemente, la etapa de permitir el desarrollo de células que tienen características de células madre comprende cultivar las células somáticas en condiciones de cultivo de células madre embrionarias, preferentemente condiciones adecuadas para mantener células madre pluripotentes en un estado indiferenciado.
Preferentemente, para permitir el desarrollo de células que tienen características de células madre, las células se cultivan en presencia de uno o más inhibidores de la ADN metiltransferasa y/o uno o más inhibidores de la histona desacetilasa. Los compuestos preferidos se seleccionan del grupo que consiste en 5'-azacitidina (5'-azaC), ácido suberoilanilida hidroxámico (SAHA), dexametasona, tricostatina A (TSA), butirato de sodio (NaBu), Scriptaid y ácido valproico (VPA). Preferentemente, las células se cultivan en presencia de ácido valproico (VPA), preferentemente, en una concentración de entre 0,5 y 10 mM, con mayor preferencia entre 1 y 5 mM, con la máxima preferencia en una concentración de aproximadamente 2 mM.
Los métodos de la presente invención pueden usarse para efectuar la desdiferenciación de cualquier tipo de célula somática. Las células que pueden usarse incluyen células que pueden ser desdiferenciadas o reprogramadas por los métodos de la presente invención, particularmente células que están total o parcialmente diferenciadas, con mayor preferencia completamente diferenciadas. Preferentemente, la célula somática es una célula diploide derivada de organismos multi-celulares pre-embrionarios, embrionarios, fetales y postnatales. Los ejemplos de células, que pueden usarse incluyen pero no se limitan a fibroblastos, tales como fibroblastos fetales y neonatales o fibroblastos adultos, queratinocitos, en particular queratinocitos primarios, con mayor preferencia queratinocitos derivados de pelo, células adiposas, células epiteliales, células epidérmicas, condrocitos, células del cúmulus, células neurales, células gliales, astrocitos, células cardíacas, células esofágicas, células musculares, melanocitos, células hematopoyéticas, osteocitos, macrófagos, monocitos y células mononucleares.
Las células con las que los métodos de la invención pueden usarse pueden ser de cualquier especie animal; por ejemplo, mamíferos y roedores. Los ejemplos de células de mamífero que pueden ser desdiferenciadas y re-diferenciadas por la presente invención incluyen, pero no se limitan a células de primates humanos y no humanos. Las células de primates con la que la invención puede realizarse incluyen pero no se limitan a las células de seres humanos, chimpancés, babuinos, monos cynomolgus, y cualquiera de los otros monos del Nuevo o Viejo Mundo. Las células de roedores con la que la invención puede realizarse incluyen, pero no se limitan a células de ratón, rata, conejillo de indias, hámster y jerbo.
Las células desdiferenciadas preparadas de acuerdo con la presente invención se espera que muestren muchos de los mismos requisitos que las células madre pluripotentes y puedan expandirse y mantenerse en condiciones usadas para las células madre embrionarias, por ejemplo, medio celular ES o cualquier medio que sustente el crecimiento de las células embrionarias. Las células madre embrionarias retienen su pluripotencia in vitro cuando se mantienen sobre fibroblastos fetales inactivados tales como fibroblastos embrionarios de ratón o fibroblastos humanos irradiados (por ejemplo, fibroblastos de prepucio humano, fibroblastos de piel humana, fibroblastos de endometrio humano, fibroblastos de oviducto humano) en cultivo. En una modalidad, las células alimentadoras humanas pueden ser células alimentadoras autólogas derivadas del mismo cultivo de células reprogramadas por diferenciación directa.
Además, las células madre embrionarias humanas pueden propagarse con éxito sobre Matrigel en un medio condicionado con fibroblastos fetales de ratón. Las células madre humanas pueden crecer en cultivo durante un período de tiempo prolongado y permanecer indiferenciadas en condiciones de cultivo específicas.
En determinadas modalidades, las condiciones de cultivo celular pueden incluir poner en contacto las células con factores que pueden inhibir la diferenciación o de cualquier otra manera potenciar la desdiferenciación de las células, por ejemplo, prevenir la diferenciación de células en células no-ES, trofoectodermo u otros tipos de células.
Las células desdiferenciadas preparadas de acuerdo con la presente invención pueden evaluarse mediante los métodos que incluyen supervisar los cambios en el fenotipo de las células y caracterizar su expresión génica y proteica. La expresión génica puede determinarse mediante RT-PCR, y los productos de traducción pueden determinarse mediante inmunocitoquímica e transferencia Western. Particularmente, las células desdiferenciadas pueden caracterizarse para determinar el patrón de expresión génica y si las células reprogramadas presentan un patrón de expresión génica similar al patrón de expresión esperado de las células de control pluripotentes indiferenciadas, tal como las células madre embrionarias, mediante el uso de procedimientos bien conocidos en la técnica, que incluyen la transcriptómica.
La expresión de los siguientes genes de células desdiferenciadas puede evaluarse al respecto: OCT4, NANOG, factor de crecimiento y diferenciación 3 (GDF3), expresión reducida 1 (REX1), factor de crecimiento de fibroblastos 4 (FGF4), gen específico de la célula embrionaria 1 (ESG1), asociado al desarrollo pluripotencial 2 (DPPA2), DPPA4, telomerasa transcriptasa inversa (TERT), antígeno embrionario 3 (SSEA-3), SSEA-4, antígeno asociado a tumor-1-60 (TRA-1-60), TRA-1-81, y TRA-2-49/6E.
Las células madre embrionarias o indiferenciadas con las que pueden compararse las células reprogramadas pueden ser de la misma especie que las células somáticas diferenciadas. Alternativamente, las células madre indiferenciadas o embrionarias con las que pueden compararse las células reprogramadas pueden ser de una especie diferente como las células somáticas diferenciadas.
En algunas modalidades, existe una similitud en el patrón de expresión génica entre una célula reprogramada y una célula indiferenciada, por ejemplo, célula madre embrionaria, si determinados genes expresados específicamente en una célula indiferenciada se expresan, además, en la célula reprogramada. Por ejemplo, determinados genes, por ejemplo, telomerasa, que son típicamente indetectables en las células somáticas diferenciadas pueden usarse para controlar la extensión de la reprogramación. Del mismo modo, para determinados genes, la ausencia de expresión puede usarse para evaluar la extensión de la reprogramación.
La capacidad de auto-renovación, marcada por la inducción de la actividad de la telomerasa, es otra de las características de las células madre que pueden supervisarse en las células desdiferenciadas.
El análisis del cariotipo puede realizarse por medio de las extensiones de los cromosomas a partir de las células mitóticas, cariotipado espectral, ensayos de la longitud del telómero, hibridación genómica total, u otros procedimientos bien conocidos en la técnica.
Mediante el uso de la presente invención, el ARN codificante de los factores apropiados se incorpora en una o más células somáticas, por ejemplo, mediante electroporación. Después de la incorporación, las células se cultivan preferentemente mediante el uso de condiciones que sustentan el mantenimiento de las células desdiferenciadas (es decir, condiciones de cultivo de las células madre). Las células desdiferenciadas pueden expandirse después e inducir que se re-diferencien en diferentes tipos de células somáticas que se necesitan para la terapia celular. Las células desdiferenciadas que se obtienen de acuerdo con la presente invención pueden inducirse a diferenciarse, in vitro o in vivo, en uno o más tipos de células somáticas deseadas.
Preferentemente, las células desdiferenciadas que se obtienen de acuerdo con la presente invención pueden dar lugar a células de cualquiera de las tres capas germinales embrionarias, es decir, endodermo, mesodermo, y ectodermo. Por ejemplo, las células desdiferenciadas pueden diferenciarse en músculo esquelético, esqueleto, dermis de la piel, tejido conectivo, sistema urogenital, corazón, sangre (células linfáticas), y bazo (mesodermo); estómago, colon, hígado, páncreas, vejiga urinaria; revestimiento de la uretra, partes epiteliales de la tráquea, pulmones, faringe, tiroides, paratiroides, intestino (endodermo); o del sistema nervioso central, retina y cristalino, cráneo y sensorial, ganglios y nervios, células de pigmento, tejido conectivo de la cabeza, epidermis, pelo, glándulas mamarias (ectodermo). Las células desdiferenciadas que se obtienen de acuerdo con la presente invención pueden re-diferenciarse in vitro o in vivo mediante el uso de procedimientos conocidos en la técnica.
En una modalidad de la presente invención, las células reprogramadas que resultan de los métodos de esta invención se usan para producir una progenie diferenciada. Por lo tanto, en un aspecto, la presente invención proporciona un método para producir células diferenciadas, que comprende: (i) obtener células reprogramadas mediante el uso de los métodos de esta invención; e (ii) inducir la diferenciación de las células reprogramadas para producir células diferenciadas. La etapa (ii) puede realizarse in vivo o in vitro. Además, la diferenciación puede inducirse a través de la presencia de factores de diferenciación apropiados, que pueden o bien añadirse o están presentes in situ, por ejemplo, en un cuerpo, un órgano o tejido en el que se introdujeron las células reprogramadas. Las células diferenciadas pueden usarse para derivar las células, tejidos y/u órganos que se usan ventajosamente en el área de trasplante de células, tejidos y/u órganos. Si se desea, las modificaciones genéticas pueden introducirse, por ejemplo, en células somáticas antes de la reprogramación. Las células diferenciadas de la presente invención preferentemente no poseen la pluripotencia de una célula madre embrionaria, o una célula germinal embrionaria, y son, en esencia, células específicas de tejido parcial o totalmente diferenciadas.
Una ventaja de los métodos de la presente invención es que las células reprogramadas que se obtienen mediante la presente invención pueden diferenciarse sin previa selección o purificación o establecimiento de una línea celular. En consecuencia, en determinadas modalidades, una población heterogénea de células que comprenden células reprogramadas se diferencian en un tipo celular deseado. En una modalidad, una mezcla de células que se obtienen a partir de los métodos de la presente invención se expone a uno o más factores de diferenciación y se cultivan in vitro.
Los métodos de diferenciación de las células reprogramadas que se obtienen por los métodos descritos en la presente descripción pueden comprender una etapa de permeabilización de la célula reprogramada. Por ejemplo, las células generadas mediante las técnicas de reprogramación descritas en la presente descripción, o alternativamente una mezcla heterogénea de células que comprenden células reprogramadas, pueden permeabilizarse antes de la exposición a uno o más factores de diferenciación o extracto celular u otra preparación que comprende factores de diferenciación.
Por ejemplo, las células diferenciadas pueden obtenerse mediante el cultivo de las células reprogramadas indiferenciadas en presencia de al menos un factor de diferenciación y seleccionarse de células diferenciadas a partir del cultivo. La selección de células diferenciadas puede basarse en el fenotipo, tal como la expresión de ciertos marcadores celulares presentes en las células diferenciadas, o mediante ensayos funcionales (por ejemplo, la capacidad de realizar una o más funciones de un tipo de célula diferenciada en particular).
En otra modalidad, las células reprogramadas de acuerdo con la presente invención se modifican genéticamente mediante la adición, deleción, o modificación de su(s) secuencia(s) de ADN.
Las células reprogramadas o desdiferenciadas preparadas de acuerdo con la presente invención o las células derivadas de las células reprogramadas o desdiferenciadas son útiles en la investigación y en la terapia. Las células pluripotentes reprogramadas pueden diferenciarse en cualquiera de las células en el cuerpo, que incluyen, sin limitación, células de la piel, cartílago, músculo esquelético óseo, músculo cardiaco, renales, hepáticas, sangre y formadoras de la sangre, precursoras vasculares y endotelio vascular, beta pancreáticas, neuronas, glías, retinales, neuronales, intestinales, pulmonares, y hepáticas.
Las células reprogramadas son útiles para la terapia regenerativa/reparadora y pueden trasplantarse a un paciente que lo necesite. En una modalidad, las células son autólogas con el paciente.
Las células reprogramadas proporcionadas de acuerdo con la presente invención pueden usarse, por ejemplo, en las estrategias terapéuticas en el tratamiento de trastornos cardíacos, neurológicos, endocrinos, vasculares, retineanos, dermatológicos, muscular-esqueléticos, y otras enfermedades.
Por ejemplo, y sin pretender ser una limitación, las células reprogramadas de la presente invención pueden usarse para reponer las células en animales cuyas células naturales se agotaron debido a la edad o a la terapia de ablación tales como radioterapia y quimioterapia del cáncer. En otro ejemplo no limitante, las células reprogramadas de la presente invención son útiles en la regeneración de órganos y en la reparación de tejidos. En una modalidad de la presente invención, las células reprogramadas pueden usarse para revitalizar el tejido muscular dañado que incluye los músculos distróficos y los músculos dañados por eventos isquémicos, tales como infartos de miocardio. En otra modalidad de la presente invención, las células reprogramadas descritas en la presente descripción pueden usarse para mejorar la cicatrización en los animales, que incluyen los humanos, después de una lesión traumática o de la cirugía. En esta modalidad, las células reprogramadas de la presente invención se administran sistémicamente, tal como por vía intravenosa, y migran al sitio del tejido recién traumatizado reclutadas por las citoquinas circulantes que se secretan por las células dañadas. En otra modalidad de la presente invención, las células reprogramadas pueden administrarse localmente a un sitio de tratamiento que lo necesita o en reparación o regeneración.
En una modalidad de la invención, los ácidos nucleicos tal como el ARN se administran a un paciente mediante métodos ex vivo, es decir, mediante la extracción de células de un paciente, la modificación genética de dichas células y la reintroducción de las células modificadas en el paciente. La transfección y los métodos de transducción se conocen por el experto en la técnica.
El término "transfección" se refiere a la introducción de ácidos nucleicos, en particular ARN, en una célula. Para los propósitos de la presente invención, el término "transfección" también incluye la introducción de un ácido nucleico en una célula o la captación de un ácido nucleico portal célula, en donde la célula puede estar presente en un sujeto, por ejemplo, un paciente. Por lo tanto, de acuerdo con la presente invención, una célula para la transfección de un ácido nucleico descrito en la presente descripción puede estar presente in vitro o in vivo, por ejemplo, la célula puede formar parte de un órgano, un tejido y/o un organismo de un paciente. De acuerdo con la invención, la transfección puede ser transitoria o estable. Para algunas aplicaciones de la transfección, es suficiente si el material genético transfectado se expresa solo transientemente. Como el ácido nucleico que se introduce en el proceso de transfección no se integra usualmente en el genoma nuclear, el ácido nucleico extraño se diluirá a través de la mitosis o se degradará. Las células que permiten la amplificación episomal de ácido nucleicos reducen grandemente la tasa de la dilución. Si se desea que el ácido nucleico transfectado permanezca realmente en el genoma de la célula y sus células hijas, debe ocurrir una transfección estable. El ARN puede transfectarse en las células para expresar transientemente su proteína codificada.
De acuerdo con la presente invención, puede usarse cualquier técnica útil para introducir, es decir, transferir o transfectar ácidos nucleicos en las células. Preferentemente, el ARN se transfecta en células mediante técnicas estándar. Tales técnicas incluyen electroporación, lipofección y microinyección. En una modalidad particularmente preferida de la presente invención, el ARN se introduce en las células mediante electroporación. La electroporación o electropermeabilización se refiere a un aumento significativo en la conductividad eléctrica y la permeabilidad de la membrana plasmática celular causada por un campo eléctrico aplicado externamente. Por lo general, se usa en biología molecular como una vía para introducir alguna sustancia en una célula. De acuerdo con la invención, se prefiere que la introducción de ácido nucleico codificante para una proteína o péptido en las células resulte en la expresión de dicha proteína o péptido.
De acuerdo con la invención, los ácidos nucleicos pueden dirigirse a células particulares. En tales modalidades, un vehículo usado para la administración de un ácido nucleico a una célula (por ejemplo, un retrovirus o un liposoma) puede tener una molécula de direccionamiento. Por ejemplo, una molécula, tal como un anticuerpo específico para una proteína de la superficie de la membrana en la célula diana, o un ligando para un receptor en la célula diana puede incorporarse en, o unirse al vehículo de ácido nucleico. Si se desea la administración de un ácido nucleico mediante liposomas, en la formulación del liposoma pueden incorporarse proteínas que se unen a una proteína de la superficie de la membrana asociada con la endocitosis para facilitar el direccionamiento y/o la absorción. Tales proteínas incluyen proteínas de la cápsida o fragmentos de estas que son específicas para un tipo particular de células, anticuerpos para proteínas que se internalizan, y proteínas que se dirigen a un sitio intracelular, y similares.
El término "reportero" se refiere a una molécula, típicamente un péptido o proteína, que está codificada por un gen reportero y se mide en un ensayo reportero. Los sistemas convencionales usualmente emplean un reportero enzimático y miden la actividad de dicho reportero.
El término "sitio de clonación múltiple" se refiere a una región de ácido nucleico que contiene sitios de enzimas de restricción, cualquiera de los cuales puede usarse para la escisión de, por ejemplo, un vector y la inserción de un ácido nucleico.
De acuerdo con la invención, dos elementos tales como nucleótidos o aminoácidos son consecutivos, si están directamente adyacentes entre sí, sin ninguna interrupción. Por ejemplo, una secuencia de x nucleótidos consecutivos N se refiere a la secuencia (N)x.
La "endonucleasa de restricción" o "enzima de restricción" se refiere a una clase de enzimas que escinden los enlaces fosfodiéster en ambas cadenas de una molécula de ADN dentro de secuencias de bases específicas. Estas reconocen sitios de unión específicos, denominados secuencias de reconocimiento, en una molécula de ADN de doble cadena. Los sitios en los que dichos enlaces fosfodiéster en el ADN son escindidos por dichas enzimas se denominan como sitios de escisión. En el caso de las enzimas tipo IIS, el sitio de escisión se ubica a una distancia definida del sitio de unión al ADN. De acuerdo con la invención, el término "endonucleasa de restricción" comprende, por ejemplo, las enzimas SapI, EciI, BpiI, AarI, AloI, BaeI, BbvCI, PpiI y PsrI, BsrD1, BtsI, EarI, BmrI, BsaI, BsmBI, FauI, BbsI, BciVI, BfuAI, BspMI, BseRI, EciI, BtgZI, BpuEI, BsgI, MmeI, CspCI, BaeI, BsaMI, Mva1269I, PctI, Bse3DI, BseMI, Bst6I, Eam1104I, Ksp632I, BfiI, Bso31I, BspTNI, Eco31I, Esp3I, BfuI, Acc36I, AarI, Eco57I, Eco57MI, GsuI, AloI, Hin4I, PpiI, y PsrI.
El término "estabilidad" del ARN se refiere a la "vida media" del ARN. La "vida media" se refiere al período de tiempo que se necesita para eliminar la mitad de la actividad, cantidad, o número de moléculas. En el contexto de la presente invención, la vida media de un ARN es indicativa de la estabilidad de dicho ARN.
Los ácidos nucleicos tales como el ARN descrito en la presente descripción, en particular cuando se usan para los tratamientos descritos en la presente descripción, pueden presentarse en forma de una composición farmacéutica o kit que comprende el ácido nucleico y, opcionalmente, uno o más vehículos, diluyentes y/o excipientes aceptables farmacéuticamente.
Las composiciones farmacéuticas son, preferentemente, estériles y contienen una cantidad eficaz del ácido nucleico.
Las composiciones farmacéuticas se proporcionan usualmente en una forma de dosificación uniforme y pueden prepararse de una manera conocida en la técnica. La composición farmacéutica puede estar, por ejemplo, en forma de una solución o suspensión.
La composición farmacéutica puede comprender sales, sustancias tamponantes, conservantes, portadores, diluyentes y/o excipientes los que son, preferentemente, aceptables farmacéuticamente. El término "aceptable farmacéuticamente" se refiere a la no toxicidad de un material que no interfiere con la acción del componente activo de la composición farmacéutica.
Las sales que no son aceptables farmacéuticamente pueden usarse para preparar sales farmacéuticamente aceptables y se incluyen en la invención. Las sales aceptables farmacéuticamente de este tipo comprenden, de manera no limitante, aquellas preparadas a partir de los ácidos siguientes: ácidos clorhídrico, bromhídrico, sulfúrico, nítrico, fosfórico, maleico, acético, salicílico, cítrico, fórmico, malónico, succínico y similares. Las sales aceptables farmacéuticamente pueden prepararse además como sales de metales alcalinos o sales de metales alcalinotérreos, tales como sales de sodio, sales de potasio o sales de calcio.
Las sustancias tamponantes adecuadas para usar en la composición farmacéutica incluyen ácido acético en una sal, ácido cítrico en una sal, ácido bórico en una sal y ácido fosfórico en una sal.
Los conservantes adecuados para usar en la composición farmacéutica incluyen cloruro de benzalconio, clorobutanol, parabeno ytimerosal.
El término "vehículo" se refiere a un componente orgánico o inorgánico, de una naturaleza natural o no natural (sintética), con el que el componente activo se combina para facilitar, potenciar o permitir la aplicación. De acuerdo con la invención, el término "vehículo" incluye además uno o más agentes de relleno sólidos o líquidos, diluyentes o sustancias de encapsulación, que son adecuadas para la administración a un paciente.
Las sustancias vehículos posibles para la administración parenteral son, por ejemplo, agua estéril, solución de glucosa, Ringer, lactato de Ringer, solución de cloruro de sodio estéril, polialquilenglicoles, naftalenos hidrogenados y, en particular, polímeros biocompatibles de lactida, copolímeros de lactida/glicolida o copolímeros de polioxietileno/polioxipropileno.
El término "excipiente" cuando se usa en la presente descripción pretende indicar todas las sustancias que pueden presentarse en una composición farmacéutica y que no son ingredientes activos tales como, por ejemplo, vehículos, aglutinantes, lubricantes, espesantes, agentes activos de superficie, conservantes, emulsionantes, tampones, agentes saborizantes, o colorantes.
Las composiciones farmacéuticas descritas en la presente descripción pueden administrarse por cualquier vía convencional, tal como por administración parenteral que incluye la inyección o la infusión. La administración es preferentemente parenteral, por ejemplo, intravenosa, intraarterial, subcutánea, en el nódulo linfático, intradérmica o intramuscular.
Las composiciones adecuadas para la administración parenteral comprenden usualmente una preparación acuosa o no acuosa estéril del compuesto activo, que es, preferentemente, isotónica con respecto a la sangre del receptor. Los ejemplos de portadores y solventes compatibles son la solución de Ringer y la solución de cloruro de sodio isotónica. Adicionalmente, se usan aceites fijados, usualmente estériles, como solución o medio de suspensión.
Los agentes y composiciones descritos en la presente descripción se administran, preferentemente, en cantidades eficaces. Una "cantidad eficaz" se refiere a la cantidad que logra una reacción deseada o un efecto deseado solo o junto con dosis adicionales. En el caso del tratamiento de una enfermedad particular o de una afección particular, la reacción deseada se relaciona, preferentemente, con la inhibición del curso de la enfermedad. Esto comprende ralentizar el progreso de la enfermedad y, en particular, interrumpir o revertir el progreso de la enfermedad. La reacción deseada en un tratamiento de una enfermedad o de una afección puede ser también un retraso en la aparición o una prevención de la aparición de dicha enfermedad o de dicha afección.
Una cantidad eficaz de un agente o composición descrito en la presente descripción dependerá de la afección a tratar, la gravedad de la enfermedad, los parámetros individuales del paciente, que incluyen la edad, la condición fisiológica, la talla y el peso, la duración del tratamiento, el tipo de una terapia de acompañamiento (si se presenta), la vía específica de administración y factores similares. En consecuencia, las dosis administradas de los agentes descritos en la presente descripción pueden depender de varios de estos parámetros. En el caso que una reacción en un paciente sea insuficiente con una dosis inicial pueden usarse dosis más altas (o dosis eficazmente mayores alcanzadas por una vía de administración diferente, más localizada).
La presente invención se describe en detalle mediante las siguientes figuras y ejemplos que deben interpretarse solamente a modo de ilustración y no por medio de limitación. Sobre la base de la descripción y los ejemplos, otras modalidades son accesibles para el trabajador experto y están igualmente dentro del alcance de la invención.
Figuras
Figura 1: Resumen del proceso de selección in vivo
Para preparar la biblioteca de partida, se cultivaron células dendríticas inmaduras humanas en presencia de actinomicina D, un inhibidor de la transcripción, durante cinco horas para preseleccionar los ARN estables. El ARNm celular restante se extrajo y se purificó mediante el uso del kit Poly(A)Purist (Ambion) y luego se fragmentó con Nuclease P1 (Roche). Para esto, 10 yg de ARN se incubaron durante 45 minutos con 0,3 U NP-1 en 8yL 50 mM de tampón de NaAc (pH 5,5) en un volumen de reacción total de 24 yL. Después de la purificación con columnas RNeasy (Qiagen), los fragmentos estaban listos para retrotranscribirse en ADNc. Se realizó la síntesis de la primera y segunda cadena mediante el uso y el seguimiento del protocolo del kit de síntesis de la 1era cadena de ADNc RevertAid Premium (Fermentas) y un cebador hexámero con una secuencia de cebador definida y un sitio de restricción NotI. Para rellenar los voladizos en 5' y eliminar los voladizos en 3', el ADNc se incubó a continuación con 12,5 U de ADN polimerasa T4 durante 5 minutos a 15 °C. La reacción se terminó mediante la adición de 5 yL EDTA 0,5 mM, pH 8,0 y el ADNc se purificó mediante el uso de columnas NucleoBond (Macherey-Nagel). La digestión de la biblioteca de ADNc con NotI (NEB) produjo fragmentos con un extremo romo y pegajoso. Los fragmentos se seleccionaron adicionalmente por tamaño a través de la preparación de gel para asegurar la eliminación de todos los fragmentos más pequeños de 150 pb. Para la clonación de la biblioteca, el vector se digirió con EcoRV y NotI, como se muestra en el panel A, dejando un extremo romo y pegajoso, respectivamente. En la siguiente etapa, la biblioteca se ligó en el vector mediante el uso de la ADN ligasa T4 (Fermentas). La mezcla de ligación se usó directamente como molde para la PCR como se proporciona en la Tabla 4 mediante el uso de la ADN polimerasa Phusion™ de alta fidelidad de inicio en caliente (Finnzymes). Después de la purificación, se usó el producto de PCR como molde para la transcripción de T7 como se muestra en la Tabla 5. La incubación se realizó a 37° C. Después de 30 min se añadieron a la reacción 0.75 yL de GTP 100 mM. La reacción se detuvo después de 2.5 h mediante la adición de TURBO DNasa (2U/yL, Ambion) y se incubó durante otros 15 min a 37 °C. La reacción finalmente se limpió mediante columnas RNeasy (Qiagen). La biblioteca de ARN podría entonces usarse para el procedimiento de selección que comienza con la electroporación del ARN en hiDC como se describió anteriormente (Kuhn y otros, 2010). Después del cultivo para la selección, la extracción y purificación del ARN se realizó mediante el uso de columnas RNeasy (Qiagen) y siguiendo las instrucciones del fabricante. El ARN se usó seguidamente como molde para la síntesis de ADNc mediante el uso de la transcriptasa inversa Superscript II (Invitrogen) y siguiendo las instrucciones del fabricante y un cebador dT18. Posteriormente se usó el ADNc como molde para la PCR como se describió anteriormente. Finalmente, los productos de la PCR podrían usarse como molde para la transcripción-T7 (ver arriba) para comenzar la siguiente ronda de selección (panel B). Los controles de calidad de las muestras de ADN/ADNc y ARN se realizaron mediante gel de agarosa y bioanalizador AGILENT 2100, respectivamente.
Figura 2: Esquema de la apariencia de la muestra dentro del vector luc2CPmut
(A) Un elemento único o dos elementos (en dirección 5' y 3') se clonaron como UTR-3' en el vector como se indica. Además se presentan las muestras de control NEG (control negativo sin inserción de una UTR 3'), hBg y 2hBg. Preparación de ARN para rondas de selección. (B) Para la electroporación en hiDC se usó el vector como molde para la PCR mediante el uso de cebadores alargados que comprenden el promotor T7 y la cola poli(A). El producto de la PCR se usó posteriormente como molde para la síntesis de T7 in vitro para producir el respectivo IVT-RNA.
Figura 3: Efecto de las secuencias seleccionadas sobre la estabilidad de los ARN que codifican luc2Cpmut
Los resultados muestran la actividad de la luciferasa, la vida media y la proteína total, a lo largo del tiempo, de los ARN que contienen las secuencias seleccionadas como UTR 3' en comparación con nuestro estándar de oro 2hBg después de la electroporación en células dendríticas inmaduras humanas (el NEG es como se definió en la Figura 2). El panel superior proporciona los cursos de tiempo de tres ARN ilustrativos con las UTR 3' como se indicó. En el panel inferior izquierdo, se muestra la vida media de los ARN con la UTR 3' respectiva como se indicó en relación con un ARN con 2hBg. De manera similar, la expresión relativa de proteína total en comparación con un ARN con 2hBG se proporciona en el panel inferior derecho.
Figura 4: Actividad de luciferasa representativa mediante el uso de luc2mut como gen reportero y UTR-3' recién seleccionadas. Después de la electroporación de ARN con UTR 3' como se indicó, en células dendríticas inmaduras humanas, se midió la actividad de luciferasa durante 72 h.
Figura 5: Resultados representativos de la electroporación con ARN-IVT en fibroblastos
panel izquierdo: vector basado en luc2CPmut. panel derecho: vector basado en luc2mut
Figura 6: Resultados representativos de la electroporación con ARN-IVT en células T
El panel más a la izquierda proporciona la expresión relativa de proteína total de un ARN con FI UTR 3' en comparación con un ARN con 2hBG, en células T CD4+ y CD8+. De manera similar, la eficiencia de la traducción relativa y la vida media del ARNm de un ARN con FI UTR 3' en comparación con un ARN con 2hBG en células T CD4+ y CD8+ se proporciona en el panel central y en el panel más a la derecha, respectivamente.
Figura 7: Arquitectura del ARN e integridad para evaluar los ARN con nucleótidos modificados
A: Los ARN usados en los ensayos de luciferasa se construyeron como se representa aquí. Como casquete 5' se usó p-S-ARCA (D2). Como 5'UTR se usó la 5'UTR de alfa globina humana, que incluye una secuencia de Kozak. Después del gen de luciferasa de luciérnaga, se clonaron las dos 3'UTR para compararse. Como cola poliA, se usó una secuencia A30L70.
B: Antes de la transfección, se verificó la integridad de los ARN en un Bioanalizador 2100 (Agilent). Todos los ARN tenían una integridad suficientemente alta y comparable además y, por lo tanto, podían usarse en los experimentos.
Figura 8: Efecto de FI UTR 3' sobre la estabilidad y funcionalidad del ARN in vivo
La luciferasa y el ARNm de gp70 que contenían FI UTR 3' o 2hBg 3'UTR se formularon con F12 y se administraron i.v. en ratones BALB/c. Después de la administración del ARNm de Luciferasa, la expresión se controló después de 6 h y 24 h; El ARNm de gp70 se administró en el día 0 y el día 6 y la activación inmunitaria se analizó en el día 1o mediante tinción de CD8 y gp70 tet+.
A) Muestra los niveles de expresión de luciferasa a las 6h y 24h después de la inyección de ARNm no modificado y ARNm modificado m1Y que contiene FI 3'UTR o la 2hBg 3'UTR. Tanto el ARNm de Luciferasa no modificado como el m1Y modificado que contiene la FI 3'UTR muestran niveles de expresión comparables como el ARNm correspondiente que contiene la 2hBg 3'UTR.
B) Muestra el porcentaje de células T CD8 específicas de gp70 en respuesta al ARNm de gp70 que contiene la FI 3'UTR o la 2hBg 3'u Tr . Las dos 3'UTR se desempeñan igualmente bien en la inducción de inmunidad específica de antígeno después de dos inmunizaciones, con un aumento significativo de las células T CD8 específicas de antígeno en el bazo de aquellos ratones que recibieron ARNm gp70 que contiene la FI 3'UTR.
Estadísticas: ANOVA de una vía seguido de la prueba de Tukey, * p <0.05.
Figura 9: Efecto de las UTR estabilizadoras sobre la estabilidad del ARN autorreplicante
La Luciferasa desestabilizada (Luc2CP) se clonó inmediatamente en dirección 5' del elemento de secuencia conservada en 3' de un ARN autorreplicante (replicón) derivado del virus Semliki Forest no citotóxico. El replicón de ARN se preparó mediante la transcripción in vitro de un plásmido linealizado correspondiente y se electroporó en las células. La expresión de luciferasa se midió mediante la adición de sustrato luminiscente durante 96 a 120 h. (A) Curso temporal de la expresión de luciferasa en un experimento representativo con células BHK21. (B) Curso temporal de la expresión de luciferasa en un experimento representativo con fibroblastos de prepucio humano (HFF). Para reducir la citotoxicidad de los interferones tipo I liberados, se cotransfectó el ARNm del virus Vaccinia B18R en cada muestra. Para inhibir la activación de la proteína quinasa R y aumentar el nivel general de traducción, se cotransfectó el ARNm del virus Vaccinia E3 en cada muestra.
Figura 10: tramos de homología en el elemento FI.
Se predijo que los tramos de secuencia subrayados se aparearían entre sí. Para la construcción "mutación 8nt", se mutó el primer elemento por aaagggcu para interrumpir las interacciones con el segundo elemento.
Figura 11: Artefactos en la IVT basado en los moldes de PCR mediante el uso de 2hBgUTR.
A: Representación esquemática de la generación del molde para IVT mediante PCR. El cebador 5' se hibrida en dirección 5' del promotor T7, el cebador 3' contiene una cola de poliA de 120 nt y se hibrida con el poliA codificado por el plásmido y parte de la 3'UTR. En el caso de 2hBgUTR, puede producirse un error de hibridación mediante la hibridación a la primera repetición. B: Productos de PCR de un plásmido que contiene el 2hBgUTR. La flecha roja representa el producto secundario, que representa un truncamiento de 1hBg. C: Por lo tanto, el ARN transcrito de un producto de PCR además presenta un subproducto acortado (flecha). D: Productos de PCR de un plásmido que contiene el elemento FI como 3'UTR. No hay productos secundarios visibles. E: El ARNm resultante tiene la alta integridad esperada, sin picos laterales adicionales.
Figura 12: Representación esquemática de los elementos UTR truncados y la vida media de las construcciones de ARNm correspondientes.
El panel superior de la figura A muestra una representación esquemática de los elementos UTR truncados en referencia a las posiciones de ácido nucleico de la secuencia de longitud completa del elemento F de la SEQ ID NO: 86 cubierto por esas variantes truncadas.
El panel inferior de la figura A muestra la vida media relativa del ARNm que comprende el UTR truncado en referencia al ARNm que comprende la secuencia de longitud completa del elemento F de la SEQ ID NO: 86. Los ARNm codificantes de un reportero de luciferasa se electroporaron en hiDC y se siguió su expresión en el tiempo mediante las mediciones de luciferasa para determinar la vida media relativa del a Rn .
El panel superior de la Figura B muestra una representación esquemática de los elementos UTR truncados en referencia a las posiciones de ácido nucleico de la secuencia de longitud completa del elemento I de la SEQ ID NO: 115 cubierta por esas variantes truncadas.
El panel inferior de la Figura B muestra la vida media relativa del ARNm que comprende el UTR truncado en referencia al ARNm que comprende la secuencia de longitud completa del elemento I de la SEQ ID NO: 115. Los ARNm codificantes de un reportero de luciferasa se electroporaron en hiDC y se siguió su expresión en el tiempo mediante las mediciones de luciferasa para determinar la vida media relativa del a Rn .
Figura 13: Vida media relativa y expresión de proteínas a partir de construcciones de ARNm que comprenden elementos F, I o FI hacia UTR aleatorias.
La Figura 13 muestra la vida media relativa y la expresión de proteínas a partir de construcciones de ARNm que comprenden elementos F, I o FI hacia UTR aleatorias. Para esta longitud completa, los elementos individuales F e I, así como también la combinación de FI, se compararon hacia una UTR 3' aleatoria (257nt de longitud). Todos los elementos se clonaron en construcciones codificantes para luciferasa, se transcribieron a ARNm in vitro, se electroporaron en hiDC, se midió la expresión de luciferasa a lo largo del tiempo, y se calcularon las vidas medias relativas y la expresión de proteínas totales.
Figura 14: Elementos UTR para reprogramación celular.
La Figura 14A muestra la línea de tiempo para la reprogramación de fibroblastos de prepucio humano primarios. Se sembraron 40,000 células en una placa de 12 pocillos y se lipofectaron durante tres (3x) o cuatro (4x) días consecutivos con mezclas de ARNm que estaban compuestas de 0.33 yg de ARN sin modificar transcrito in vitro (IVT) que codifica la reprogramación TF OCT4, SOX2, KLF4, cMYC, NANOG y LIN28 (OSKMNL) (1:1:1:1:1:1) con 0.08 yg decadaB18R, E3 y K3 (EKB) y 0.17yg de una mezcla de miARN compuesta de miARN 302a-d y 367 (1:1:1:1:1:1). De esta manera, las construcciones de ARN solo diferían en su 3'UTR que consiste en una repetición en tándem de la 3'UTR de la p-globina humana (2hBg), el elemento F-I (FI) o el elemento I-F (IF). Desde el día 9 en adelante, se observó la formación de colonias y el análisis de colonias se realizó en el d11.
La Figura 14B muestra una tinción de fosfatasa alcalina (AP) de las colonias establecidas y la Figura 14C muestra un gráfico de barras correspondiente que representa el recuento numérico de las colonias positivas de AP.
La Figura 14D muestra la morfología de las colonias de células iPS resultantes mediante el uso de los ARN que contienen la FI-UTR. Era como células semejantes a hES, con células pequeñas muy compactas en colonias distintas y bordes bien definidos.
La Figura 14E muestra las colonias preparadas como en D teñidas positivas para AP con cuatro y diez aumentos.
La Figura 14F muestra colonias preparadas como en D en una tinción vital del marcador de superficie celular TRA-1-60, de las hES.
La Figura 14G muestra la expresión de ARNm de los marcadores de las hES, OCT4 (endógeno), NANOG (endógeno), LIN28 (endógeno), TERT y REX1 evaluados mediante sedimentación de las colonias, aislamiento del ARN total y cuantificación mediante qRT-PCR.
EJEMPLOS
Ejemplo 1: Identificación de elementos de secuencia que estabilizan los ARNm
Para identificar elementos de secuencia novedosos que estabilizan los ARNm, hemos desarrollado un proceso de selección in vivo mediante el uso de hiDC como entorno selectivo para el ARN transcrito in vitro. La biblioteca del ARN de partida se construyó mediante el uso de secuencias de ARNm de origen natural derivadas de hiDC. Antes del aislamiento del ARN, las células se cultivaron durante 5 horas en presencia del inhibidor de la transcripción Actinomicina D (ActD) para preseleccionar los ARN estables. Después se extrajo el ARNm restante y se redujo a fragmentos de 200-800 nucleótidos, se transcribió inversamente y se clonó como UTR-3' en un vector que portaba una secuencia de hAg 5'UTR y un gen reportero, que se eligió como base del proceso de selección. El molde de ADN usado para la posterior transcripción del ARNm de la biblioteca se amplificó mediante PCR, durante la cual se introdujo un promotor T7 a través del 5' y una cola PoliA A60 a través del cebador 3'. El ARNm transcrito se introdujo después en el proceso de selección en vivo, que se compone de varias rondas de transcripción in vitro de la biblioteca, electroporación de los ARN correspondientes en hiDC, y extracción y amplificación de secuencias estables después de puntos de tiempo definidos. La amplificación de las secuencias seleccionadas se realizó mediante PCR con cebadores específicos, después de la síntesis de ADNc. Los productos de PCR resultantes se usaron posteriormente como moldes para la nueva biblioteca del ARNm. Esto se realizó durante seis rondas, con extracción de los ARN restantes después de 24 horas en la ronda 1, 48 horas en las rondas 2 y 3, 72 horas en las rondas 4 y 5, y finalmente 96 horas, así como también una y dos semanas en la ronda 6 (después de la electroporación, las células se dividieron en tres partes y después se cosecharon individualmente en los puntos de tiempo dados).
El monitoreo del proceso de selección después de las rondas 1 a 5 demostró un aumento significativo de la vida media promedio del conjunto de ARN correspondiente, lo que es indicativo de un enriquecimiento de los elementos UTR-3' estabilizadores (Tabla 1). Sin embargo, el aumento de la estabilidad fue menos pronunciado con rondas más altas. Por lo tanto, el proceso de selección se detuvo después de una sexta ronda final, en la que se extrajo el ARN de las células después de 96 horas, una semana, y dos semanas. Para caracterizar las secuencias seleccionadas, se secuenciaron más de 350 clones individuales, 108 de la ronda 5, 88 de la ronda 6/96 horas, 110 de la ronda 6/1 semana, y 96 de la ronda 6/2 semanas. Todas las secuencias se compararon entre sí, así como también y con el BLAST para identificar su origen genómico. Aquí, se analizó especialmente si las secuencias se derivaban de UTR 5' o 3' endógenas o de la región codificante. Finalmente, su nivel de expresión en las hiDC se descargó de NextBio (Illumina). En total, pudieron identificarse siete grupos, (i) para los que se encontraron secuencias múltiples, (ii) los que se originaron a partir de las UTR-3' de ARN endógenos o de un a Rn no codificante endógeno, y (iii) los que se expresaron claramente en las hiDC (Tabla 2). Estos se derivan de los siguientes genes: Fragmento Fc de IgG, receptor, transportador, alfa (B, FCGRT, NM_001136019), Proteína específica de linfocitos 1 (D, LSP1, NM_002339), Ligando de quimiocina 22 (E, CCL22, NM_002990), Potenciador de la separación del amino terminal (F, AES, NM_198969), Miembro 3 de la familia de fosfolipasa D (G, PLD3, NM_001031696), ARN 12S codificado mitocondrialmente (I, MT_RNR1, NC_012920), Complejo principal de histocompatibilidad clase II DR beta 4 (J, HLA-DRB4, NM_021983). Tenga en cuenta que, por simplicidad, las letras mayúsculas B a I dadas entre paréntesis se usan a continuación como abreviaturas para estos elementos. Es importante destacar que, en todos los casos, los clones para una secuencia difieren en sus extremos exactos 5'- y 3'-, lo que demuestra que provienen de diferentes clones iniciales y no se enriquecen artificialmente durante el proceso (ver los apéndices para obtener una lista completa de todas las secuencias identificadas en la selección).
Ejemplo 2: Caracterización de elementos de secuencia individuales identificados
Para la caracterización de los elementos de secuencia identificados, se eligió un candidato representativo de cada grupo (las secuencias detalladas están marcadas en el apéndice). Después esta secuencia se clonó como UTR-3' en un vector con un gen reportero de luciferasa, cuyo nivel de expresión puede analizarse en el tiempo después de la transferencia a las células. Se ha demostrado previamente que a partir de la observación del patrón de expresión para la proteína, puede inferirse con precisión la estabilidad relativa y la eficiencia de la traducción del ARN (Kuhn 2010 Gene Ther.). El reportero específico usado en este experimento, luc2CPmut, es una forma desestabilizada de luciferasa (Promega). Esto permite detectar incluso pequeños cambios en la estabilidad del ARN. Después se comparó el ARN transcrito in vitro procedente de estos vectores con nuestro ARNm estándar de oro, es decir, el que contiene el 2hBg UTR-3', con respecto a la estabilidad del ARN y a la eficiencia de la traducción. Como muestras de control se usaron un ARN transcrito in vitro sin una UTR-3' (es decir, que solo contenía secuencias usadas para clonar los insertos) y uno con un solo elemento de Betaglobina (lhB).
Comenzando con los vectores que contienen UTR, la región a transcribirse se amplificó por PCR mediante el uso de un cebador 5' que contiene el promotor T7 y un cebador 3' con una cola poli(A) de 60 nucleótidos. La purificación de los fragmentos de PCR se realizó mediante el uso de AGENCOURT AMPURE XP (Beckman Coulter). Se añadieron 0,6 volúmenes de perlas a cada reacción de PCR y se mezclaron. Después de una incubación de 15 minutos a RT, los productos de PCR unidos a las perlas se separaron mediante soporte magnético del exceso de cebadores, nucleótidos, sales y enzimas. Las perlas se lavaron dos veces durante 30 segundos con etanol al 80 % para eliminar aún más los contaminantes. Los productos de PCR deseados finalmente se eluyeron dos veces con 30 yL ddH2O y se usaron como moldes para la transcripción in vitro de los ARN correspondientes. Para las transcripciones in vitro se usaron ARN polimerasa T7 (Fermentas), el tampón de la reacción respectivo y NTP 6 mM. Para la formación eficiente del casquete del ARN, la concentración de GTP se redujo a 1,5 mM y se añadieron 6 mM de p-S-ARCA(D2) a la reacción y se incubaron durante 2,5 h a 37 °C. El ARN se purificó mediante perlas magnéticas carboxiladas (Invitrogen) y la concentración y calidad del ARN se evaluaron mediante espectrofotometría y análisis en un Bionanalyzer 2100 (Agilent).
De acuerdo con sus identificaciones en el enfoque de detección, todas las secuencias nuevas mostraron características muy similares en comparación con 2hBg con respecto a la estabilidad del ARN con el grupo I (mtRNRI) como el mejor (Figura 3; Tabla 3). Es importante destacar que, cada elemento individual confirió estabilización al ARN en comparación con el ARN sin una UTR-3' e incluso en comparación con el ARN solo con una copia única del elemento Beta-globina. La eficiencia de la traducción no se afectó significativamente, como se observó por la correlación directa entre la estabilidad del ARN y la proteína total expresada en el tiempo.
Ejemplo 3: Combinación de elementos de secuencia individuales.
En un experimento adicional, las secuencias individuales de cada grupo se combinaron entre sí de una manera bien ponderada (Figura 2). La racionalidad detrás de esto fue nuestra observación previa de que la combinación de dos UTR-3' tenía un efecto adicional sobre la estabilidad y la eficiencia de la traducción del ARN (Holtkamp y otros 2006). La estabilidad y la eficiencia de la traducción del ARN se calcularon en R mediante interporlación de los valores de luciferasa medidos con una spline, a partir de la cual la pendiente ascendente más pronunciada se definió como la eficiencia de la traducción y la vida media de la señal como estabilidad. La integral de la spline interpolada se interpretó como la expresión de proteína total. En total, se clonaron 64 combinaciones, es decir, todas las combinaciones posibles de las siete secuencias recientemente identificadas y de la beta-globina UTR-3' humana (Tabla 6). Como se describió anteriormente, el ARN se preparó a partir de estos moldes de ADN, y después se electroporó en hiDC. Como controles, además se incluyeron los ARN que contenían los elementos individuales. Para la mayoría de los siete elementos nuevos se observó que al menos una combinación con otro elemento proporciona un ARN con una mayor estabilidad que solo con el elemento individual (Tabla 7 a Tabla 13). Curiosamente, en la mayoría de los casos, la combinación con el elemento I (mtRNRI) aumentó la vida media del ARN. Aquí, la estabilidad del ARN fue generalmente incluso mayor en comparación con un ARN con 2hBg UTR-3' (Tabla 7 a Tabla 13). Casi todas las combinaciones tuvieron un efecto positivo en la eficiencia de la traducción del ARN. En total, los efectos combinados sobre la estabilidad del ARN y la eficiencia de la traducción resultan en un aumento de la expresión total de proteína de hasta 1,74 veces. Por lo tanto, podríamos identificar elementos individuales (con longitudes inferiores a 233 nucleótidos), así como también combinaciones de dos elementos diferentes que dan lugar al ARN con un aumento en la estabilidad y/o eficiencia de la traducción, pero al mismo tiempo se evitarían los problemas de tener dos copias idénticas de un elemento como se describió anteriormente para 2hBg.
Para verificar los resultados obtenidos con la forma desestabilizada de luciferasa, se repitieron los experimentos anteriores con ARN que portaban la luciferasa estándar (Promega), y las siguientes UTR-3' seleccionadas: mtRNRl (I), mtRNRl-AES (IF), AES-mtRNR1 (FI), mtRNR1-hBg (IhBg) y hBg-mtRNR1 (IhBg). Como se muestra en la Figura 4 y Tabla 14, pueden obtenerse resultados equivalentes como se observó anteriormente, mediante la verificación de que los elementos nuevos, individualmente o en combinación, aumentan la estabilidad del ARNm y/o la eficiencia de la traducción de manera similar al elemento 2hBg.
Ejemplo 4: Análisis de ARNm que portan elementos de secuencia seleccionados en otros tipos de células
Las UTR-3' mtRNR1 y AES recién seleccionadas se evaluaron además en diferentes tipos de células y líneas celulares para ver si hay una especificidad de hiDC. Las secuencias se evaluaron en fibroblastos humanos (HFF), mioblastos murinos (C2C12) (Figura 5) y células T (Figura 6) para evaluar si además se estabilizan en estas células.
Las células HFF y C2C12 se cosecharon y se prepararon para la electroporación. A continuación se electroporaron 2,0 yg de IVT-RNA junto con 1,0 yg del ARN codificante para GFP que contiene las 3'UTR indicadas. Después de la electroporación, las células se dividieron. Para medir la actividad luciferasa se distribuyeron 5000 células por pocillo en una placa de 96 pocillos por triplicado en un total de 7 puntos de tiempo (2, 4, 8, 24, 48 y 72 h). Se sembraron 2E+05 células por pocillo en placas de 6 pocillos para cosechar para FACS después de 24 h (señal GFP). Esto permitió monitorear las eficiencias de la transfección. Estas diferían entre 72 y 90 % y podrían incluirse en el cálculo de la vida media. Los resultados obtenidos con HFF y C2C12 así como también con las células T confirmaron los resultados obtenidos previamente con hiDC. La combinación de I con F fue en particular de 2 a 3 veces mejor en la vida media en comparación con 2hBg. Además, FI mostró una eficiencia de la traducción 3 veces mejor en las células C2C12 y una producción de proteínas 2 veces mejor en el tiempo, en comparación con nuestro estándar de oro. Estos resultados mostraron que I y F no son específicos de hiDC, sino que, además, mejoran la estabilidad del ARNm y la eficiencia de la traducción en otras células.
Ejemplo 5: El FI 3'UTR aumenta la expresión del ARNm modificado
Para algunas aplicaciones, que incluyen la terapia de reemplazo de proteínas, se prefieren los ARNm con nucleótidos modificados en lugar de los no modificados debido a su inmunogenicidad disminuida (Kariko y otros, 2008). Sin embargo, las modificaciones de base pueden tener un efecto sobre la estabilidad de un ARNm ya sea por influir directamente en la interacción con una proteína de unión al ARN correspondiente, o por alterar la formación de la estructura secundaria del ARN. En consecuencia, las UTR 3' seleccionadas podrían comportarse de manera diferente en el contexto de los ARNm modificados. Por lo tanto, comparamos la combinación de F e I con 2hBgUTR en el contexto de ARNm modificado m1Y en células hiDC, HFF, células T CD8+ y CD4+ y en MEF murinos, C2C12 y bmDC. Se usó Luciferasa como reportero (ver Figura 7A para el diseño de la construcción). Para la generación de los ARNm modificados, en la reacción de IVT, U se sustituyó completamente por m1Y. En todos los experimentos, el ARN no modificado se incluyó como un control. Las integridades de los ARNm obtenidos no se afectaron por el intercambio de UTP por mlYTP (Figura 7B). Las células se electroporaron mediante el uso de las condiciones descritas en la Tabla 15, y los niveles de luciferasa se midieron a las 3, 6, 12, 24, 48, 72 y 96 h.
La electroporación del ARNm no modificado de luciferasa podría reproducir los efectos vistos anteriormente: En todos los tipos de células, el elemento FI fue igual o superior al control 2hBg para transmitir la estabilidad del ARN (Tabla 16A). Mientras que en las DC murinas y en las células T humanas, las vidas medias del ARNm eran comparables entre las dos 3'UTR, el elemento FI aumentó las vidas medias de ARNm hasta 1,69 veces en las células HFF. La cantidad de proteína total aumentó en todas las líneas celulares, más prominentemente en las células HFF (2,45 veces).
Con el ARNm modificado, el elemento FI además condujo a un aumento en la vida media de ARNm en comparación con 2hBg en hiDC, la cantidad de proteína total aumentó más del doble (Tabla 16B). Además, los resultados en otros tipos de células son similares a los obtenidos con el ARNm no modificado: El elemento FI fue superior a 2hBg en todos los experimentos que involucraron las células HFF, MEF y C2C12, y comparable en células T y Dc murinas (Tabla 16B). Por lo tanto, la modificación del U no altera la capacidad del elemento FI para estabilizar el ARNm.
Ejemplo 6: El FI 3'UTR aumenta la expresión del ARNm independientemente del método de transfección
Hasta ahora, todos los experimentos se realizaron con la electroporación como método de transfección. Con la electroporación, el ARNm suministrado llega directamente al citoplasma, bajo la evasión de una ruta de captación endosómica, la que se sigue después de la transfección mediante lipofección. Para ver si el elemento FI además funciona en estas condiciones, las células se lipofectaron con los mismos ARNm de Luciferasa, que contenían FI y 2hBg que se usaron en experimentos anteriores, mediante el uso de RNAiMAX como reactivo de transfección. Además después de la lipofección, el elemento FI aumentó la expresión de Luciferasa, aunque el aumento fue menos pronunciado en comparación con los experimentos donde el ARN se suministró mediante electroporación (Tabla 16C). Por lo tanto, el método de transfección no tiene un impacto en el efecto estabilizador del elemento FI.
Ejemplo 7: El ARNm que contiene FI 3'UTR y 2hBgUTR conducen a una expresión de proteínas comparable y a la activación inmunitaria in vivo.
Para evaluar la expresión de proteínas a partir del ARNm que contiene el FI 3'UTR in vivo, los mismos ARNm de Luciferasa que contienen FI y 2hBg que se usaron en experimentos anteriores se formularon con F12 y se administraron i.v. en ratones BALB/c. Como se muestra en la Figura 8, la expresión de luciferasa fue comparable para ambas 3'UTR. La respuesta inmunitaria específica al antígeno se indujo, además, en un grado comparable con el efecto del ARNm que contiene FI 3'UTR que es ligeramente más fuerte en el bazo.
Ejemplo 8: IF UTR conduce a una mayor estabilidad del ARN autorreplicante in vitro.
Los ARN autorreplicantes transcritos in vitro (replicón de ARN) derivado de genomas alfavirales son potentes vectores de vacuna. El replicón de ARN codifica en los dos primeros tercios el complejo enzimático necesario para la replicación citoplasmática (replicasa) del replicón de ARN. Esta replicasa reconoce una estructura interna del ARN que actúa como promotor subgenómico para la síntesis dependiente de replicasa de los ARN subgenómicos. Los transgenes o antígenos para la vacunación están codificados en este ARN subgenómico que es significativamente más corto que el replicón completo. En general, tanto el ARN genómico (es decir, el replicón de ARN de longitud completa) como el ARN subgenómico se asemejan al ARNm celular. Ambos están flanqueados por las UTR, ambos están protegidos por casquetes y son poliadenilados. Las enzimas responsables de la formación del casquete y de la poliadenilación están contenidas en el complejo de la enzima replicasa. Los elementos de secuencia conservada (CSE) dentro de las UTR, que se superponen con el ORF de la replicasa en el caso del 5'CSE, son necesarios para la unión de la replicasa y actúan como promotores de la síntesis de la cadena negativa (3'CSE) o la síntesis de la cadena positiva (5'CSE).
Para evaluar si las UTR estabilizadoras novedosas, identificadas y validadas para no replicar el ARNm transcrito in vitro, proporcionan una mayor estabilidad y, por lo tanto, una mayor expresión transgénica, del ARN replicón, clonamos las secuencias respectivas en vectores molde de ARN replicón. Como el 3'CSE necesita ubicarse inmediatamente adyacente a la cola poli-A, insertamos los UTR novedosos inmediatamente en dirección 5' del 3'CSE de un replicón que codifica la luciferasa desestabilizada (Luc2CP). El replicón de ARN se sintetizó mediante la transcripción in vitro de plásmidos molde linealizados similares al ARNm de IVT. El replicón de ARN se introdujo en las células (BHK21 y HFF) mediante electroporación, y se evaluó la expresión de luciferasa. Como se muestra en la Figura 9, todas las UTR insertadas aumentaron la traducción de Luc2CP en ambas líneas celulares usadas. Curiosamente, la combinación UTR "IF" resultó en un aumento notable de la traducción.
Ejemplo 9: Los intercambios de nucleótidos de hasta el 90 % de homología no tienen impacto en las propiedades estabilizadoras del elemento FI
Debido al procedimiento de selección que se aplicó para identificar los elementos estabilizadores UTR novedosos, se obtuvieron secuencias en un determinado intervalo de tamaño. La identificación de las mismas secuencias con extremos prolongados en 5' y 3' proporcionó una primera indicación de la longitud mínima requerida. Sin embargo, la región mínima requerida para que cada elemento ejerza su efecto estabilizador podría ser aún más corta. Adicionalmente, ligeras variaciones de las secuencias podrían seguir siendo funcionales, es decir, la identidad de cualquier nucleótido individual podría no ser de suma importancia para las propiedades estabilizantes del elemento FI. Para ver en qué grado los elementos son robustos frente a los intercambios de nucleótidos, se evaluaron las secuencias UTR 3' con 97,5 %, 95,0 %, 92,5 % y 90,0 % de homología con el elemento FI original para determinar la expresión de proteína total y la vida media del ARNm en hiDC. Los nucleótidos que se cambiaron se eligieron aleatoriamente a lo largo de toda la secuencia (secuencias 208-211, modificaciones aleatorias). Los ARNm de luciferasa con estos elementos modificados como 3'UTR se transcribieron in vitro, se electroporaron en hiDC y su expresión se siguió en el tiempo mediante las mediciones de luciferasa después de 3, 6, 24, 48 y 72 h. Los ARNm de luciferasa con el elemento FI modificado produjeron la misma cantidad global de proteína y tuvieron aproximadamente la misma vida media (Tabla 17).
Además de las sustituciones aleatorias con grados crecientes como se describió anteriormente, se generó otro conjunto de elementos FI modificados mediante la introducción racional de sustituciones de nucleótidos que probablemente alteren la estructura secundaria del elemento FI. Para múltiples secuencias UTR 3' naturales se conoce que su estructura secundaria es importante porque proporciona los sitios de unión para proteínas reguladoras, que influyen en la estabilidad del ARNm (Addess y otros, 1997; Putland y otros, 2002; Crucs y otros, 2000; Adams y otros, 2003) Dos secuencias de 8nt que son perfectamente complementarias entre sí están presentes en el elemento FI, una en el elemento F y la otra en el elemento I (Figura 10). El apareamiento de bases de estas dos regiones puede verse, además, en la mayoría de las predicciones múltiples. mFold (Zuker, 2003) es un programa de computadora que permite predicciones de estructura secundaria de secuencias de entrada. Para verificar la importancia de este elemento de estructura secundaria específico, la secuencia se cambió de una manera que elimina el emparejamiento de bases (secuencia 212, mutación 8nt). Además de estas secuencias complementarias bastante largas, las predicciones mfold para FI 3'UTR se seleccionaron para elementos de estructura presentes en la mayoría de los pliegues de salida, que por lo tanto deberían tener una alta probabilidad de formación in vivo. Los nucleótidos involucrados en el apareamiento de bases de estos pliegues se cambiaron a 97,5 %, 95,0 %, 92,5 % y 90,0 % de homología con las secuencias FI originales mediante intercambio con sus parejas de apareamiento de bases, de esta manera se retiene la estructura secundaria de la secuencia (secuencias 217-220, modificaciones que retienen la estructura). Además, las mismas secuencias se intercambiaron en una sola cadena de la parte bicatenaria, de esta manera se destruye deliberadamente la estructura secundaria. En estos casos, la identidad de la secuencia original fue 98,75%, 97,50%, 96,25% y 95,00%, respectivamente (secuencias 213-216, modificaciones desestabilizadoras de la estructura).
Los ARN de luciferasa con los elementos UTR 3' modificados descritos se transcribieron in vitro, se electroporaron en hiDC y su expresión se siguió en el tiempo mediante las mediciones de luciferasa después de 3, 6, 24, 48 y 72 h. Con ninguna estrategia de modificación pudo observarse un impacto significativo en la vida media del ARNm. Por lo tanto, las propiedades estabilizadoras del elemento FI parecen ser robustas frente a los cambios en su secuencia de nucleótidos o estructura secundaria al menos hasta 10,0 % de nucleótidos variados. Además, no pudo observarse una disminución en la cantidad de proteína total después de la modificación de la secuencia de FI (Tabla. 18 A y B).
Ejemplo 10: El uso del elemento FI en lugar de 2hBg evita errores de hibridación en la amplificación basada en PCR de la región codificante del ARN
Como se ha demostrado, el elemento FI es igual o superior al 2hBg 3'UTR con respecto a la estabilidad del ARNm y a la eficiencia de la traducción. Otra ventaja del elemento Fi es su secuencia no repetitiva, mientras que las dos copias de hBg 3'UTR pueden causar problemas en algunos casos.
Esto es más obvio cuando el molde de ADN para la transcripción de ARN se amplifica mediante PCR. En tales casos, se adiciona la cola poliA de longitud completa con el oligo cebador 3' que se une en el propio extremo 3' de la UTR 3' (Figura 11 A). En el caso de 2hBgUTR, emergen productos secundarios truncados durante la PCR, que después de la secuenciación resultó que consisten en ARNm con solo la repetición de 1hBg en la UTR (Figura 11 B). Después de la transcripción, el truncamiento es, además, visible en el ARNm (Figura 11C). Este fenómeno ocurre en la mayoría de las reacciones de PCR con construcciones que contienen el elemento 2hBgUTR y no puede eliminarse completamente mediante esfuerzos de optimización que incluyen temperatura de hibridación del cebador, composición del tampón, secuencia del cebador o polimerasas alternativas. Incluso después de la inserción de una secuencia de enlace única entre la UTR 3' y la cola de poliA, el problema persiste. Es importante destacar que la fuerza del pico lateral se correlacionó con el rendimiento de la reacción de PCR, lo que indica errores de hibridación de los fragmentos de PCR cortos truncados, que aumentan con cada ciclo de PCR, como causa probable del problema. Por lo tanto, no pudieron identificarse condiciones satisfactorias para los moldes de ADN codificantes para los ARN con el 2hBg UTR-3'.
Por el contrario, la PCR de los moldes de ADN con el elemento FI no produjo ningún producto secundario truncado (Figura 11 D), y además el ARNm resultante no mostró un pico adicional en el perfil del Bioanalizador (Figura 11 E). Por lo tanto, el elemento FI constituye una mejora considerable como una 3'UTR en comparación con el 2hBgUTR con respecto a la integridad del molde de PCR y a la calidad del ARN correspondiente.
Ejemplo 11: Propiedades estabilizadoras de ARN de los subfragmentos de los elementos F e I
Debido al procedimiento de selección que se aplicó para identificar los elementos estabilizadores UTR novedosos, se obtuvieron secuencias en un determinado intervalo de tamaño. La identificación de las mismas secuencias con extremos prolongados en 5' y 3' proporcionó una primera indicación de la longitud mínima requerida. Sin embargo, la región mínima requerida para que cada elemento ejerza su efecto estabilizador podría ser incluso más corta.
Con este fin, tanto para el elemento F como para el I, se diseñaron cinco construcciones reporteras de Luciferasa, cada una de las cuales contiene una UTR acortada que cubre un fragmento diferente del elemento original acortado en el extremo 5' y/o 3' (ver Figura 12 paneles superiores A y B, respectivamente). Estas construcciones reporteras se transcribieron in vitro, se electroporaron en hiDC y su expresión se siguió en el tiempo mediante las mediciones de luciferasa a las 3, 6, 24, 48 y 72 h después de la electroporación. Las curvas de expresión resultantes se analizaron para la vida media relativa del ARN con el ARN que contiene la longitud completa establecido en 1 (ver Figura 12 paneles inferiores A y B, respectivamente).
Para el elemento F, no pudo observarse una vida media del ARNm significativamente disminuida para ninguna subsecuencia evaluada, lo que indica una participación redundante y no cooperativa de varias subsecuencias a lo largo del elemento F en su papel estabilizador. Se podría obtener un resultado similar para el elemento I, aunque aquí pudo observarse una ligera caída en el rendimiento cuando solo se usó la región central (nt37-107) como 3'UTR.
Para poner estos resultados en perspectiva, los elementos F e I individuales de longitud completa, así como también la combinación FI, se compararon con una UTR 3' seleccionada al azar de la biblioteca inicial (257nt de longitud). Esto se obtuvo mediante la clonación de un conjunto de ADN inicial y mediante la selección aleatoria de un clon único. Como se describió anteriormente, los ARN codificantes de luciferasa con las secuencias UTR respectivas se electroporaron en hiDC, se midió la expresión de luciferasa en el tiempo, y se calcularon las vidas medias relativas y la expresión de proteína total. En comparación con los elementos F, I y FI, el ARN con la UTR 3' seleccionada aleatoriamente es significativamente menos estable (Figura 13, panel superior). El efecto de las UTR seleccionadas es aún más pronunciado para la expresión de proteína total (Figura 13, panel inferior). Esto indica claramente que el efecto de los fragmentos de los elementos F e I como se describió anteriormente son específicos para las secuencias seleccionadas y no causado simplemente por la presencia de una secuencia UTR 3'. Esto está en línea con el aumento observado en la estabilidad del a Rn del conjunto durante la selección (ver arriba).
Ejemplo 12: Uso de elementos UTR estabilizadores para la reprogramación de células madre
Se sembraron 40,000 células en una placa de 12 pocillos y se lipofectaron durante tres (3x) o cuatro (4x) días consecutivos con mezclas de ARNm que estaban compuestas de 0,33 yg de ARN sin modificar transcrito in vitro (IVT) que codifica la reprogramación TF OCT4, SOX2, KLF4, cMYC, NANOG y LIN28 (OSKMNL) (1:1:1:1:1:1) con 0,08 yg decadaB18R, E3 y K3 (EKB) y 0,1,7yg de una mezcla de miARN compuesta de miARN 302a-d y 367 (1:1:1:1:1:1). De esta manera, las construcciones de ARN solo diferían en su 3'UTR que consiste en una repetición en tándem de la 3'UTR de la p-globina humana (2hBg), el elemento F-I (FI) o el elemento I-F (IF). Las células se cultivaron en medio de células madre embrionarias humanas (hES) y las lipofecciones se realizaron mediante el uso de RNAiMAX de acuerdo con las instrucciones del fabricante. Desde el día 9 en adelante, se observó la formación de colonias y el análisis de colonias se realizó en el d11 (ver la Figura 14A para una descripción general de la línea de tiempo). Las colonias establecidas se tiñeron para fosfatasa alcalina (AP) el día 11 mediante el uso de un kit de tinción AP. Para una visión general, las tinciones representativas se muestran en la Figura 14B. Se hizo obvio que la incorporación del elemento FI resulta en cantidades más altas de colonias AP positivas (oscuras). Se contaron las colonias teñidas para AP y se confirmaron los resultados de la visión general: En comparación con el 2hBg-UTR usado anteriormente, la sustitución con el FI-UTR conduce a un exceso de colonias de 3-4 veces cuando las células se lipofectaron 3 veces. La sustitución con el IF-UTR resulta en un exceso de 2 veces. Con cuatro transfecciones, estos efectos son menos pronunciados. Aquí no se observó ninguna mejora con el IF-UTR. Por un lado, el proceso parece estar saturado con cuatro transfecciones, mientras que por el otro lado el recuento de colonias está sesgado en cierta medida debido al crecimiento excesivo de colonias (ver Figura 14C). La morfología de la colonia de las colonias de células iPS resultantes mediante el uso de ARN que contenían el FI-UTR era similar a una célula hES, con células pequeñas muy compactas en colonias distintas y bordes bien definidos (figura 14D). Estas colonias podrían teñirse positivas para AP (Figura 14E) y el marcador de superficie celular de las hES TRA-1-60 (Figura 14F). La tinción vital TRA-1-60 se realizó con el anticuerpo Stain-Alive TRA-1-60 (Stemgent) de acuerdo con las instrucciones del fabricante. Se muestran imágenes representativas de colonias. Para evaluar aún más la pluripotencia de las colonias, las células se sedimentaron, se aisló el ARN total y la expresión del ARNm de los marcadores de hES OCT4 (endógeno), NANOG (endógeno), LIN28 (endógeno), TERT y REX1 se cuantificó mediante qRT-PCR. La expresión de ARNm se normalizó con respecto a la de HPRT y se muestra como las veces de inducción en comparación con los niveles de los transcritos de las células de entrada. El análisis de colonias después de 3 lipofecciones se muestra en la Figura 14G. Todos los marcadores analizados se expresaron altamente en comparación con las células de entrada, lo que indica la pluripotencia de las células reprogramadas. La superioridad del ARNm sintético que contiene FI se confirmó mediante una mayor expresión del marcador endógeno en comparación con la reprogramación con los ARNm que contienen 2hBg e IF.
Estos resultados muestran, que la sustitución de la 2hBg-UTR con la FI-UTR resulta en una tecnología de reprogramación basada en el ARN más rápida y eficiente. Esto probablemente se basa en la expresión más larga y más alta de los factores de transcripción de reprogramación que resultan de la sustitución con el elemento FI. La orientación del elemento FI parece de esta manera indispensable, ya que el beneficio no se observó con las construcciones IF. La reprogramación exitosa de las células mediante el ARNm que contienen FI se confirmó por la morfología similar a las células hES, la actividad AP y la expresión de los marcadores de la superficie celular de las hES y de los marcadores endógenos de las colonias de las células iPS resultantes.
Tablas
Tabla 1 Vida media del ARNm en horas (h) calculada a partir de datos de experimentos de transcriptasa inversa-PCR (RT-PCR) en tiempo real para monitorear el progreso de la selección. Los ARNm se cuantificaron 8, 24 y 48 horas después de la electroporación. En el experimento I (izquierda), cada muestra se analizó solo una vez. En consecuencia, no se proporciona una desviación estándar.
Figure imgf000041_0001
Tabla 2 Descripción general de los 7 grupos principales con la región de unión (BR) dentro de la UTR-3' de la secuencia BLASTed. Se muestran la abreviatura del grupo, el número de clones identificados para el grupo (núm.), el origen genómico con la abreviatura respectiva (Abr.), el código NCBI y la posición dentro de la secuencia con respecto a la región codificante. De acuerdo con NextBio, todas las secuencias se regulan positivamente en hiDC.
Grupo núm. Resultado del BLAST con la secuencia representativa
de cada grupo. Homo Sapiens Abr. Código NCBI BR B 50 Fragmento Fc de IgG. receptor. transportador. alfa. FCGRT NM_001136019 UTR-3' ARNm (clon de ADNc)
D 22 Proteína 1 específica de linfocitos. ARNm LSP1 NM_002339 UTR-3'
E 13 Ligando 22 de quimiocina (motivo C-X-C). ARNm CCL22 NM_002990 UTR-3'
F 4 Potenciador de la Separación del Amino Terminal. AES NM_198969 UTR-3' ARNm
G 15 Familia de fosfolipasa D. miembro 3. ARNm PLD3 NM_001031696 CDS+UTR-3'
I 17 ARN 12S codificado mitocondrialmente MT-RNR1 NC_012920 ncRNA
J 22 Complejo principal de histocompatibilidad, clase II. HLA-DRB4 NM_021983 UTR-3' DR beta 4. ARNm
Tabla 3 Valores calculados en relación con nuestro estándar de oro 2hBg para la vida media y la proteína total a lo largo del tiempo. Se muestran el nombre del grupo y el gen respectivo.
Con relación a 2hBg Gen RefSeq
Vida media Proteína total en el tiempo Fragmento Fc de IgG, receptor, transportador,
alfa NM_001136019 0,89 ± 0,15 0,96 ± 0,15
Proteína 1 específica de linfocitos NM_002339 0,80 ± 0,21 0,75 ± 0,03
Ligando de quimiocina 22 NM_002990 0,82 ± 0,16 0,66 ± 0,12 Potenciador de la Separación del Amino
Terminal NM_198969 0,90 ± 0,06 0,95 ± 0,01
Miembro 3 de la familia de Fosfolipasa D NM_001031696 0,79 ± 0,21 0,66 ± 0,13
ARN 12S codificado mitocondrialmente NC_012920 1,15 ± 0,09 0,94 ± 0,08 Complejo principal de histocompatibilidad
clase II d R beta 4 NM_021983 0,89 ± 0,08 0,89 ± 0,09
Tabla 4. Condiciones de PCR para la amplificación de la biblioteca y las etapas de selección posterior,
Tiempo Temperatura Etapa
Desnaturalización
1 min 30$ 98 ’C inicial
20 í 98 ’C Desnaturalización
30 s 65 "C Hbridac'ói
45 i 72 ° t Extersicn
Figure imgf000042_0001
5 min 724C Extensión final
« 4®C Mantenimiento
Tabla 5 Reacción de transcripción IVT-T7.
Conc./Vol. Conc. Final
ddH2O Ad 50 pL
Casquete D1 Variable 6,0 mM
ATP/CTP/UTP 100 mM 7,5 mM
GTP 100 mM 1,5 mM
Tampón T7 10x 1x
Producto de la PCR Variable 0,05 pg/pL
enzima T7 mix HC 10x 1x
Tabla 6. Com binaciones clonadas y comparadas con nuestro estándar de oro 2hBg (esquina in fe rio r derecha). Se resaltan los e lem entos únicos clonados dos veces.
Figure imgf000043_0001
Tabla 7 Resultado de FCGRT (grupo B) clonado como elemento único o combinado en dirección 5' con una de las otras secuencias del grupo como elemento en dirección 3'. Los valores en negrita son > 1,0. Los valores son con relación a 2hBg
Con relación a 2hBg
Muestra
Vida media Eficiencia de la traducción Proteína total en el tiempo B 0,840 1,320 1,300
BB 0,580 1,530 0,900
BI 0,920 1,750 1,410
BG 0,780 2,300 1,430
BD 0,730 1,970 1,220
BJ 0,710 1,910 1,190
BE 0,720 1,500 1,030
BF 0,760 1,720 1,220
BhBg 0,970 2,200 1,740
hBgB 0,640 1,750 1,030
2hBg 1,000 1,000 1,000
Tabla 8 Resultado de LSP1 (grupo D) clonado como elemento único o combinado en dirección 5' con una de las otras secuencias del grupo como elemento en dirección 3'. Los valores en negrita son > 1,0. Los valores son con relación a 2hBg.
Con relación a 2hBg
Muestra
Vida media Eficiencia de la traducción Proteína total en el tiempo D 0,770 0,860 1,250
DD 0,680 1,130 1,000
DI 0,960 1,440 1,270
DG 0,700 1,530 1,110
DB 0,640 0,900 0,760
DJ 0,640 1,040 0,890
DE 0,690 1,000 0,970
DF 0,750 1,080 1,000
DhBg 0,840 1,120 1,020
hBgD 0,820 1,490 1,160
2hBg 1,000 1,000 1,000
Tabla 9 Resultado de CCL22 (grupo E) clonado como elemento único o combinado en dirección 5' con una de las otras secuencias del grupo como elemento en dirección 3'. Los valores en negrita son > 1,0. Los valores son con relación a 2hBg.
Con relación a 2hBg
Muestra
Vida media Eficiencia de la traducción Proteína total en el tiempo E 0,760 0,970 0,940
EE 0,600 0,950 0,670
EI 0,890 1,120 0,960
EG 0,680 1,590 0,940
EB 0,570 1,470 0,850
ED 0,650 1,350 0,950
EJ 0,600 1,230 0,760
EF 0,760 1,100 0,860
EhBg 0,690 1,190 0,780
hBgE 0,880 1,630 1,050
2hBg 1,000 1,000 1,000
Tabla 10 Resultado de AES (grupo F) clonado como elemento único o combinado en dirección 5' con una de las otras secuencias del grupo como elemento en dirección 3'. Los valores en negrita son > 1,0. Los valores son con relación a 2hBg.
Con relación a 2hBg
Muestra
Vida media Eficiencia de la traducción Proteína total en el tiempo F 0,500 1,760 0,970
FF 0,910 1,770 1,410
FI 1,100 1,490 1,290
FG 0,850 1,680 0,980
FB 0,720 1,360 0,860
FD 0,490 1,350 0,620
FJ 0,780 1,720 1,090
FE 0,730 1,660 1,080
FhBg 1,050 1,900 1,530
hBgF 0,940 2,250 1,500
2hBg 1,000 1,000 1,000
Tabla 11 Resultado de PLD3 (grupo G) clonado como elemento único o combinado en dirección 5' con una de las otras secuencias del grupo como elemento en dirección 3'. Los valores en negrita son > 1,0. Los valores son con relación a 2hBg.
Con relación a 2hBg
Muestra
Vida media Eficiencia de la traducción Proteína total en el tiempo G 0,740 1,260 1,110
GG 0,480 1,080 0,690
GI 0,990 1,010 1,000
GB 0,520 0,970 0,620
GD 0,630 1,170 0,780
GJ 0,520 0,940 0,640
GE 0,500 0,730 0,550
GF 0,620 0,790 0,680
GhBg 0,740 0,990 0,860
hBgG 0,720 1,160 0,910
2hBg 1,000 1,000 1,000
Tabla 12 Resultado de mtRNRl (grupo I) clonado como elemento único o combinado en dirección 5' con una de las otras secuencias del grupo como elemento en dirección 3'. Los valores en negrita son. Los valores son con relación a 2hBg.
Con relación a 2hBg
Muestra
Vida media Eficiencia de la traducción Proteína total en el tiempo I 1,080 1,020 1,440
II 1,170 0,830 1,030
IG 1,040 1,250 1,310
IB 1,100 1,200 1,180
ID 1,190 1,580 1,510
IJ 1,080 1,430 1,330
IE 1,060 1,000 1,070
IF 1,220 1,130 1,290
IhBg 1,230 1,110 1,210
hBgl 1,210 1,420 1,270
2hBg 1,000 1,000 1,000
Tabla 13 Resultado de HLA-DRB4 (grupo J) clonado como elemento único o combinado en dirección 5' con una de las otras secuencias del grupo como elemento en dirección 3'. Los valores en negrita son > 1,0. Los valores son con relación a 2hBg.
Con relación a 2hBg
Muestra
Vida Media Eficiencia de la traducción Proteína total en el tiempo J 0,790 0,930 0,920
JJ 0,490 0,960 0,540
JI 0,880 1,110 0,900
JG 0,420 1,280 0,630
JB 0,480 1,000 0,520
JD 0,500 1,370 0,830
JE 0,420 0,950 0,520
JF 0,570 1,190 0,800
JhBg 0,730 1,100 0,800
hBgJ 0,770 1,530 1,080
2hBg 1,000 1,000 1,000
Tabla 14 Resultados representativos mediante el uso de luc2mut como gen reportero y las UTR-3' recién seleccionadas después de la electroporación en hiDC. La actividad de luciferasa se midió durante 96 h. Los valores son con relación a 2hBg.
Con relación a 2hBg
Muestra
Vida media Eficiencia de la traducción Proteína total en el tiempo noUTR 0,300 0,694 0,139
hBg 0,360 1,216 0,437
I 0,800 1,132 0,936
IF 1,110 1,050 1,133
FI 1,020 0,818 0,847
IhBg 0,880 0,860 0,792
hBgI 0,840 0,776 0,681
2hBg 1,000 1,000 1,000
Tabla 15: Condiciones de Electroporación
Figure imgf000046_0001
Tabla 16
Vida media y proteína total del elemento FI con relación a 2hBgUTR que contiene ARNm no modificado y modificado, después de la electroporación, y ARN no modificado después de la lipofección. Los plásmidos que codifican el gen de luciferasa de luciérnaga que contiene ya sea FI o 2hBg como 3'UTR se linealizaron en dirección 3' del poli(dA:dT) con una enzima de restricción de clase IIS, de esta manera se genera un molde sin nucleótido adicional más allá del poli(dA:dT). El ADN plasmídico linealizado se purificó mediante el uso de perlas magnéticas carboxiladas (Invitrogen), se cuantificó por espectrofotometría y se sometió a transcripciones in vitro. Para las transcripciones in vitro de fabricación casera se usaron las ARN polimerasas T7 suplementadas con inhibidores de RNasa y pirofosfatasa con NTP 7,5 mM en un tampón de Hepes 125mM pH 8,35, MgOAc2 34mM, DTT 10mM y espermidina 2mM. Para una eficiente formación del casquete del ARN se añadió p-S-ARCA(D2) 6 mM a la reacción y la concentración inicial de GTP se redujo a 1,5 mM, que se ajustó a 7,5 mM en un proceso de alimentación por lotes durante 2,5 h a 37 °C. El ARN se purificó mediante perlas magnéticas carboxiladas (Invitrogen) y la concentración y calidad del ARN se evaluaron mediante espectrofotometría y análisis en un Bioanalizador 2100 (Agilent).
A) Muestra que la vida media de los ARNm no modificados que contienen el elemento FI son mayores o comparables a los que contienen el 2hBg 3'UTR en varias líneas celulares humanas y murinas. La cantidad de fibroblastos humanos (HFF), células T CD8+ y CD4+, fibroblastos embrionarios murinos (MEF), células de mioblastoma (C2C12) y DC murinas como se enumeran en la Tabla 15 se mezclaron con la cantidad respectiva de ARN (Tabla 15) en medio X-VIVO15 (Lonza) y se sometieron a electroporación. El número indicado de células se sembró en placas de 96 pocillos en 100^L de medio de crecimiento apropiado con aditivos. A las 2, 6, 24, 48, 72 y 96 horas después de la siembra, se determinó la actividad de luciferasa de luciérnaga mediante la adición de Luciferina (Promega) en un lector de fluorescencia (TECAN).
B) Muestra que la vida media de los ARNm modificados m1Y que contienen el elemento FI son más altas o comparables a las que contienen el 2hBg 3'UTR en diferentes líneas celulares humanas y murinas. La cantidad de células dendríticas inmaduras humanas (iDC), fibroblastos (HFF), células T CD8+ y CD4+, fibroblastos embrionarios murinos (MEF), células de mioblastoma (C2C12) y DC murinas como se enumeran en la Tabla 15 se mezclaron con la cantidad respectiva de ARN modificado m1Y (Tabla 15) en medio X-VIVO15 (Lonza) y se sometieron a electroporación. El número indicado de células se sembró en placas de 96 pocillos en 100^L de medio de crecimiento apropiado con aditivos. A las 2, 6, 24, 48, 72 y 96 horas después de la siembra, se determinó la actividad de luciferasa de luciérnaga mediante la adición de Luciferina (Promega) en un lector de fluorescencia (TECAN).
C) Muestra que la vida media de los ARNm no modificados que contienen el elemento FI son mayores o comparables a los que contienen el 2hBg 3'UTR en diferentes líneas celulares, además, cuando el ARN se transfectó mediante lipofección. Se incubaron 50 ng de ARN durante 15-30 minutos con 0,2^L RNAiMAX y se administró a las células 1E04, HFF, MEF o C2C12 en 96 pocillos. Los niveles de luciferasa se midieron a las 3, 6, 12, 24, 48, 72 y 96 h mediante la adición de Luciferina (Promega) en un lector de fluorescencia (TECAN).
A B C
ARNm no modificado ARNm modificado m1Y Lipofección con relación a 2hBg con relación a 2hBg con relación a 2hBg Vida media proteína total Vida media proteína total Vida media proteína total hiDCs 1,29 2,24
C2C12 1,64 2,24 1,58 2,32 1,09 1,82 HFF 1,69 2,45 1,83 2,21 1,14 2,22 MEF 1,39 2,15 1,18 1,52 1,11 2,24 CD4+ 1,04 1,32 1,02 1,46
CD8+ 0,96 1,29 1,05 1,33
bmDC 0,87 1,98 1,09 1,34
Tabla 17: 10^g del ARN que codifica para la luciferasa de luciérnaga que contiene ya sea el elemento FI o variaciones del elemento FI con la homología designada a la secuencia FI original como 3'UTR se electroporaron en hiDC en un formato de 96 pocillos. La expresión de luciferasa se siguió en el tiempo a las 3, 6, 24, 48, y 72 h, y a partir de la curva de expresión resultante se calculó la vida media de ARNm y la cantidad de proteína total traducida a partir del ARN.
con relación a la secuencia FI
Vida media proteína total
% de homología
97,5 1,0+/-0,1 1,3+/-0,2
95,0 1,0+/-0,0 1,2+/-0,2
92,5 1, 1+/-0,1 1,4+/-0,1
90,0 0,9+/-0,1 1,1+/-0,2
Tabla 18: 10jg del ARN que codifica para la luciferasa de luciérnaga que contiene ya sea el elemento FI o variaciones del elemento FI que contiene la estructura que retiene o destruye las mutaciones y con la homología designada a la secuencia FI original como 3'UTR se electroporaron en hiDC en un formato de 96 pocillos. La expresión de luciferasa se siguió en el tiempo a las 3, 6, 24, 48, y 72 h, y a partir de la curva de expresión resultante se calculó la vida media de ARNm y la cantidad de proteína total.
A B
Modificaciones que retienen la estructura Modificaciones que desestabilizan la estructura con relación a la secuencia FI con relación a la secuencia FI Vida media proteína total Vida media proteína total % de homología % de homología
97,5 1,2+/-0,1 1,6+/-0,3 98,75 1, 1+/-0,1 1, 5+/-0,1
95,0 1, 1+/-0,1 1,7+/-0,3 97,50 1, 1+/-0,1 1,4+/-0,1
92,5 1, 1+/-0,1 1,5+/-0,3 96,25 1,0+/-0,1 1, 5+/-0,1
90,0 1,1+/-0,2 1,4+/-0,1 95,00 1,0+/-0,0 1,1+/-0,2
Mutación 8nt 0,9 /- 0,0 1,3 /- 0,4
Las secuencias descritas en la presente descripción son las siguientes:
Grupo B
>Rn5-2pl-A4_Fcr2
CAUCCUGCUGCUGCUGCUGCUGCUGCUGCGGGUCUUCCUGGAAUCUGACCAUUCGUUGUC
UGCUAUGCCCGUCCUCACCAAGACUGACUGCCUGCUGCUUUGCUACUGCCCGGGCCCAUG
AGACUGACUUCCCACUGCUCUGCCUGCCUCUCCCCACUGCACUGGCACAGCCCCGCCUUG
CCGCUGCUGAUCCAUUGCCGGUGUGACC
>Rn5-2pl-A3_For2
GCUGCUGCUGCUGCUGCUGCUGCGGGUCUUCCUGGAAUCUGACCAUUCGUUGUCUGCUAU
GCCCGUCCUCACCAAGACUGACUGCCUGCUGCUUUGCUACUGCCCGGGCCCAÜGAGACUG
ACUUCCCACUGCUCÜGCCUGCCUCUCCCCACUGCACUGGCACAGCCCCGCCUUGCCGCUG
CUGAUCCAUUGCCGGUGUGACC
>Rn5C5_For2
UUCCUGCUGCUGCUGCUGCUGCUGCUGCUGCGGGUCTJUCCUAGAAUCUGACCAUUCGUUG
UCUGCUAUGCCCGUCCUCACCAAGACUGACUGCCUGCUGCUUUGCUACUGCCCGGGCCCA
ÜGAGACUGACUUCCCACUGCUCUGCCUGCCUCUCCCCACUGCACUGGCACAGCCCCGCCU
UGCCGCUGCUGAUCCAUUGCCGGUGAGACC
>Rn5E6_For2
LHCUGCUGGUGOTGCGaGUCL^CCUGtAAGG'JGAGCAmJOGUüaUCUGCUAGGCCeGUCC tX^ACGAAlGACÜGA CUG GCÜG CU'GCUUUGCUACU'^CC CG^GGCC CAÜGAGACtXiACUÜ CC CA CtJGCUCUGCCTJGCCUCtJCCCCACtJGCACUGGCACñGCCCCGCCUUGCCGaKjCUGAUCCA mJGCCaGOGGACA
>ftnE-1WüC3_Für2
GCGGCÜGCGGGUeUUCCDGGAAGCUGACCAUUCGLRJGUCCJGCIJAJUQCCOGUCCUCACeAA ÜñOJGAGUGCCtjGCtlGCLJÜUGCmCürTGCCGGGCCÍAÜGAGACIJGACÜUCCGACUGGtiCU GCCUGCOTCUCCCCACUGCñCUGíJGACAGCCCCGCCUUGPCGCU&CU'GñUCCAUUtjCOGG CGUACC
>ftnE-1 WoB 12_Foí2
CUGGAAUCUGACCAUUCGmJGUCUGCUAUGCCCGUCCÜCAKl^AGAGUGACL'GCCUGCUG CUCUGCUAC^CCCGeGCCCñUGAGAaJGACUUCCCACUGCUOJGCCUGCCUCUCCCCAC UGCACUGGCACAGCCCCGCCmJGCCGCUGCUCA'JCCAUlJGCCGGOaGACC
>R:nE-1 WdS 1,Fof£
UCCUGCUGCUGaJGCUGCL'GCUGCUGCGÜGUCmJGCTJGGAATJCUGACCAiAJCGUUG'JCyG
CUAQÜCCCG'JCGUCACCAAGACUGACUGCCUGCUGCUUÜGCUACUGCCCGGGOCCAÜGAG
AGUGACU'JCCCACUGCUCLVGCCUGCCUCUGCCCAGUGCACUGGCACAGCGCOaCCUUGCC GGUGCUGAUCCAUUGCCaGUGGGACC
>ftnE-1 Wüf 3_Fcr2
CL'GGaJGC’u’GCU’JUGCUACUGCCCGGGCCGAfJGAGACUGACyUCCCACUGCrjCGGCCJGC
CUCTXCCÍAC^CACUGGCACAGCCCCGCCTKKCOGCUGCUGAUCCñUÜGCOGGUAGAAC
c
>FtnE-1W&_H11_b
UOCUGCUGCUGC'JGCLXSCUGCUGeUGCGGC-UCtmCCUGGAAUCTJGACCAUUlJGUUGUCUG CÜAOGCOO^O)CACKARG*CTKWCTraCarcCU^aroUGCUJiCUGCCCGGGOCCAW«3 AnJGAaTUCCCACUGCUCIJGCCUGCCUCUCCCCACUGCACUGGCACAGGCCCGCarJGCC GCUGCÜGAUCCA'JUGCCGGUGGGACC
>ftnE-2Wüüa_b
GCUGCUGCUGGGÜCUGCÜGGGCüUCGGGGAAGC^ACCAUüCGU’JGUCUGC'JAUGCCGGU
ÍCUCACCAAGAaX-ACGGCCUGCTJGCÜUUGClJACUGCCCGGGCCCAUGAGACUGACGUCv CACUGCütTOC CUG CCUCUCC CCACüGCA cuera CACAGC CCCGCCUUO CCGCUGCUOAOC CAU1JGCOGGUGUGACC
>RnS-2pl-B3_Far£
UCÜGGCCL’ CACUGAGUCUGAAGAGCUGUUAACUACGAUGGCr^GUCCUCCCUGAG'UCUGA CCAUCL^CCAUCCtlGCUGCCGClíGCUGCUGCtJGCUGCGC-GUCUUCCIJQ&AAL’ CUGACCAU [JCGUUC-LTUGCLTIUGCCOGUCCUCACCAAGACTJCACUGCCUGC'JGCLJUUGCL’ACUGCCeG
GGCCCAUGAGACUGAGUIJCCCACÜGCUGUGCCIJGOCUCL'CCCCACUGCACUGGCACAGCC
CCGOCQUGCCGCUGCUGAL'CCAUDGCCGGUGUGACC
>RnS_FS_b
V CUGGC CUCACÜGAGÜCIHÍAAGAG CUGÜUAA CTJACCAUGG CCA'GÜC CU CCCtiGAGUaXiA CtAtJCUUCCAUCCÜGGUGCt^CUGCUGCUGCUGClíJGCGGGitJCtJlJCCtJGGAAUCtJGACCAU UCGtmGUOJGCUAUGCCCGUCCUCACCAAGACUGACyGCCLrGCUGCGUUGCGACÍIGCCCG G<KCCAUGAGAOTGACÜÜ CCCAGtJG OX3JOCCDGC CÜCO CCCCACtíG lACUGGCXCAGCC CCG CCUUGCCGCUG CUGAUCCAUGGCCGGGGUGACC
>RnSBS_Fof2
CUACCAlKGCCRGUOCOCOCUlGAGÍtlCWíftCCftilCUÜCCADCOD'GCUfJCU'GCOGCWjíCU'GC
GGCUGCGGGUCUUCCUGGAAQGUÜACCAUUCGUUGUC'JGCGAUGCCCGGCCUCACCAAGA
nJGACUGCCUGCUGCUUUGTOACUGCCCGGGCCCAGGAGACUCACUUCCCACL’GCUCUGC CUGCCmJUCCCCACUGCACTJGGCACAGCCCOGCGUUGCÜGCTJGCUGAUCCAtfUGCCGGUG UGACC
^Rn6-lWüH9_Far2
GUCCUCCCUGAGUCUGACCAGCGUCCAQCCDGCQGCUGCUGCUGCUGCUGCUGCGGGÜCU
UCCGGGAAUCUGACCAmJCGUUGUCUGCUAUGCCCGUCCDCACCAAGAGL'GACtrGCCUGC DGCGUUGCtFACUGCCGGGaCCCAUGAGACUGACnJCCCACUGCUCUGCCUGCCtrCUCCCC ACTKCACUGGCACAGCCCCGCCTjTrCCCGCUGCUGAUCCAUUGCCGGUCQGACA
^Rn6-2WüC11_For2
GIKCTJCCCUGMOCUQACCAlJCUU'CCAUOCUGCDGCUGCUGCIJGCUGCUOOTGCGGGíUCIJ
UCCUGGAAGaJGACCAUUtTGUUGUCyGCUAUGKCCUCCUCACCAAGACUGACGGCCUGC ^CUirUGCÜAaJGCCCGGGCCCAÜGAGACUGACTJ’JCCCAaJGC-JCUÍjCCyGCCmcCCCA CUGCACUGG CACAGCCCCGC GUUGCCGGUGCUC AGCCAUUGCCGGUG UGACC
>RnS_C3_b
CCAU COJGC UG OJGCUG CÜG CUGCtraaJGCGGOÜCUU C CUGGAATJ CUGACCAW 'rGUUGU
CUGCUAUGCCCGEJCCUCAGCAAGACIJGACUGCCTJGCGGGUUGCUACUGCCCGGGCCCAIJG
AGAaJGACGGCCCACUGCUCUGCCUGCmCUCCCCACCGCACUGGCACAGCCCOGCCUUG CCG CUGC1ÍGAUCC AUUGCOGGUG'dGAGC
>RnG-2WütíS_FDr2
GOCAGUCCUCCCUGJ^UCTJGWXAUanrcCWKK^JGCTCCÜOOraCUGCTJlGCTKaJGOGG GUCÜUCCUGGAAUCüGACCAUUCGUOGUCUGCUAUGCCCGUCCUCftCCAAGACUGACUGC
CUGGUGAGWGCUACUGCCCGGGGCCAUGAGACTIGACUUCCCACGGCUCUIGCCUGCCTJCU
CCCCACUGCACTJGGCACAGCCCCGCCmJGCCGnJGCGGAUCCAUGGCCGGlJGUGACC
^Rn6-96hE1 Í_Füt2
u g c c l t u c c g g c t j c c u g c u g c ij u c u g g c c u c a c u ig a g u c g g a a g a g c u g ü l Ja a c ü a g c a t j g
GCCAÜUCCUCCCUGAGGCUGACCAUCÜUCCAUCCUGC'UGCUÜCGC-CUÜCUGCTJGCIJGCGG
GUCUUCCGGGAAUCUG&CCAIJUCGUUGUCUGCUAUGCCCGUCCUGACCAAJGACUGACUGC
CGGCUaCUGUGCUACGGCCCGaGCCCAUGAGACTJGACGUCCGACGGCUCUGCCUGCCUCG
CCCGACGGCACUGGCACAGGCCCGCOJUGCCGCUGCUGAUCCñUUGCCGGGGUGACG
■>RriG-96h-2pl-E9_.F
GGCCHTCCUGttXJGnGVaJGftCCmaVUCGMrcaJGCOGCUGCGGCDOCUGCTOaffiOG BGUCUUCCGGGAAUCUGACCAUUGGUUGÜGUGCUAUGCCCGUGCGCACCAAGACUGñajO
CCUGCUGCUUUGGUACGGCCCGGGCCCAUGñGAGUGACUUCCGACGGCUCUGCCUGCCUC
UCCCCACGGCAGUGGCACAGGCCCGCCUUCCCaCUGCUGAUCCAGUGCCGGUGUGACC
■>RriG-96h-2pl-H10_
GGCCAGUCC'JCCCTJGAGUCUGACGAUCUUCCAGCCUGCUGCUGGUGCrJGOJGCUGCUGOG GGUCTJUCC GGGAAÜOÍ3AC CAUUCGUi>GUCGGCUADG; CCCGUCCÜ CACCAAGACOGACUG CCUC-CUGCUUUGCUACUGCCCGGGCCCAUGfiGACUGfiCUUCCCACUGCUClJGGCGGCCUC
□CCCCACGGCACUGCCACAGCCCCGCCUUCCCGCUGCUGAUCCAGUGCGGGÍJGUGACC
>RnG-1 WüS 11_For2
^'g a c c a u c u u c c a u c c u g c g g c u g c ü g c u g g ü g c u g c g g c o g ü g c l 'u c c u g g a a u c u g a g CAUUCGGUGUGaGCUAGGCCCGUCCUCACCAAGACÜGAGUÍGCCGGGUGCUUUGCUACUGC CCGGGCCCAUGAÜACGGACUUCCCAGUGCUGUaGCUGCGUGUCCCCAÍZUGCAGtJGGGACA GOCCCGCaJUGCGGCUGCUGAUCCñGUGCCGGUGUGACC
>Ftn6-lWüF7_FDr2
C CAGUCC l 1 C C CUGAGUC TCA CCAUCUU CCMÍC I^ TJGC tX? Ct>GOTG03GCU'^^GCt»C CGGG D C rjUC C D GGAAU C TJGA C CALTUC G ÜÜÜU CUG C(JAUG C C CG (JC C OCA C CAAGAC rJ GA CUG C C UGCTJaCUUÜGCTJACUGCCCGGGCCCAUGAGñCTJGACUIJCCCUCUGCTJCUGCCUGCCUCUC
CCCAC'JGCACUGGCñCAGClXGGCCtfUGCCGCTJGCtKjflUCCAtJUGCCUGUGGSACCA
>RnS-1 WüA7_Foí 2
tX^CCAUCUUCGAPCCUG^TGCTCCUGCDGCUGOQGGUCUUCCTCQGAIUJCOGhOGAUUCG [XJaUCUGCtrAUGCCCGtfCCUUACCAAGACt^ACUGCCUGCUGCUUUGCUAC^CGCGGGC CCAUGAGACUGACUUCCCftCUGCUCUGCCUGCCÜCUCCCCACUGGACUGGCACAGCCCOG CCUUGUCGCiVSCUGAUCCftilUGCCGGUGUGACAC
>Ftn6-2W üD llJ i
GAOÍGACTJGC CUGCUGCUUUG CnACUGCCCGGOC CCAOGAGAC OGACTJUC C CACDG CU OJ QCCUGCCUCUCCCCACÜG CAC tXJGCACAGCC C C^CCUlKCCGOÍGCUaM] CSZAÜÜQCCGQ UGUGACCC
>RnG-2WüGl_For2
COCCaJGâ CTOAC^lTCUUCC^CKCUGCUGCTOCUCCaGCUGCCJGCUGOGGCOaJUCC
UGGAAUCUGACCAUUÜGUUGUCUGCUAUGCCCGUCCUCACCAAGACUGACUGCCUGCÜGC
UOTCCUACUGCCCGGGCCCAUGAGACUGACWCCCACDGCUCUGCCUaCCUCUCCCCACU GCACUGGCACAGCCCUaCCUUGCCGCUGCUGADCCAUUGCCGGUGUGACC
■>RnS-2WaC2_.Fnr2
ÜÜCCAUC CDGCUGOXJ CUGCUGCDG OJG C (JGCGGGUCUÜC CUGGAADCUGAC CAÜU CGUU
GOCUGOJAUGOC CGU COTCACCAAGACUGAC1JGC CUGC ÜGCOlXfGaJACUG C CCGOG C CC AUGAGACUGACUUCCCACÜGCUC’JGCCUGCCTJCUCCCCACUGCACUGGCACAGCCCajCC UüGC CGCUC CUGAUCCALTOGCCGGUGUGACC
>Rri6-lWüDS_Für2
tK^XCGUCCUCACCAAj^CUQAC^JCCTCCUQGDUUGCOACUGCCCGGGGCCAUGAGACU GACinJCCCñCUGCUCUGCCOGCCUCUCCCGACGGCAC’JCÍGCACAGCCCCGCCCJUGCGGGU GCUGAUCCAITJGCCGGUGUGACC
>RnS-1 WüD1 Ü_For2
r^ CCCC-UCCUCACCAAGACUGACUGCCUGCUGCWUGCÜACUGCCOGGGCCCAUGAGAtrO G&CUUCCCACÜGCUCL'GeCUGCCUCUCCCCACTJGCACUGGCACAGCCCCGGCmJGCCGCU G CUGAOCCAUUGC CGGUCttJGAC C
>Ftn6-2WüG5_For2
GC 'XXÍUaJÜC CÜGGAACTCTCAA CAUUCOUUGUaJGC UAÜGCCGGÜCCUCAC CAAGACUGA CUGCCtJGCUGaJUtraCTACÜGCCraGGCCeatJGAGACUGACUUCCCACUGCffCtJGCCÜGC
COCD CC G CAOJGCACÜOG CACAGCCC CGCCUOT CCGC LK5CUGAUCCAUDG CCGGÜGUGAC
C
>Ftn6-96h-2pl-GB_F
aUlKfUCUGCUñUSGGCGnCCUCACCAAGACUGACUQGOTGCUGCUUtJGCQACDGCCGQGG CrtAUGAGACUGflCUUCCCACUGCUCUGCCUGrcUCLÍCCCCACUGCACüGGGACAGCCCC
g c c u u g g c g c u g c lt tAu c c a u u g c c g g u g u g a c c
■>Rn6-1 WdE 7_Foí 2
CAAGACOGACUG CCTJGCUG CDUUGOJACaSCCCíKG CCCAUGAGAC fX3ACUUCCCACUG C
u c u g c c u g c c u c u c c c c a c t j g c a c u g g c a c a g c c c c g c c u u g c c g c g g c u g a u c c a u ü g c CGGUGIÍGACC
>Ftn6-lWü_Alí_b
OrocaWCAAGAOOQACUOOCUGCTCCUUUGOTlACUGODÜQGROOCWJGaGACDGAaJDCC CACUGajCUGCOJGCCUCUCCCCACUGCACUGGCACAGCCCCGCCUUGCCGCUGCUGAUC CAUUGOCGGUGUGACUGC
>Ftn6-lWDÜ11_Forí
CUUCCAUCOJCCUGCÜG CUGOÜGÍ COG OTGCÜ&20QGUCUUC CUGGAAUCtfGACCAÜU CGU WSUCUGCnMKCCOMCCDCACCAIfiACUGAClKEOTGCDCÍCDODGMACDGCCOGGGCC CflUGAGACUGACUUCCCACUGCUCUGCaJGCCUCGCCCCACÜGCACTJGGCACPiGCCCCGC CUUGCCGCÜGCUGAUCCAUÜGCCGGUGUGACCCC
>RnG-1 WütíS_Fnr2
COGACCftAGACUGAOaGCCOGOUGCaUUGCirACUGCCOGGGCCCAUGAGACUGACUUaCC ACUGCDCL'GCCDGCCTrGDCCCCACUGCAC'UGGCACAGCCCCÜCCUUGCCSCUGCÜGADCC AUUGCCGGUGUÜACC
>Füi6-lWDH4_Fnr2
A^GftCÜGñaJGCCaGOJGCUUTJGCUACUGCCCGGGCCCftilÜAGACUCACIJUCtCfiCUGCU CUGCI^GCajCUCCCCACUGCACTJGGCACAGCCCCGCCüUGCCGCTJGCyGAUCCAGUGCC GGDGUGACC
>Rti6-2WüSJ_Foí2
CUCCAiGCÜCGCUUCCAUUUÍíCUUGCAiGAAÜUUCuCGCL'GuGCUCACGAAüaAJGCGCUCC UUGGAGGCCUGAGCAACAGCAUCAUCAAGCUGAÜCUlJCCAGCÜCULrLICCUGAGCGUC-UGA
GCUCUCOGCACUUCCUGCCGCAUGGCGUCCACCUUCÜGCGUGGCCACCIJGCAUCUCCIJCC
[JCCmJGGCUCGCAGCUGCCGGCACACCUUCUÜCGCUAAGAUGGGAUñCGGCAU’OGAGGGñ UCAAUGUGUAAGGAUCOGAÜCUGCUUCaGGCCUGJ^CGGAGUCGGAAGAGGLIGUGAACUAjC: CAUCGCCAG'JCaJCCCUGAGUCUGñCC'AUCUUCCAUCCUGGGGCUGCUGCUGCGGGUOCU GCGGGUCUUCCUGGAAUCTJGACCAÜUCGUUGUCUGCGRUGUCCGÜCCUCACCAfiGACÜGA CU^CC^CUGCOUIJGCUACUGCCCeGGCCCAUGAGACtJCACUUCCCAaiGCUCtJGCClJGC CUCUCCCCACOGCACUGGeACAÜCCCCHCCUUGCCGCUGCUGAUCCAUUGCCGGUGUGAC C
>Rn6-96h-2pl-A5_F
CUGAGQGCCUGCUGCtIUUGCUAGUGCCCGGC-CCCAUGAGACUGAGUUGCCAC*UGGUCGGC CUGCCUCUCCCCACUGCACUGGCACAGCCCCGCaiUGCCGCQGGDGAUCCAUUGÍCGGQG ÍJGACG
■>Rn6-1WüC6_Für2
CCAAC-ACyGACUGCCUGCVlGC^WJCUACtJGCCCGGGGCCAOGAeACUGACUUCCCAajG CUCUGCC:JGCaJCUCCCCfiCUGCACUGGCACAGCCCCGCamGCCGCUGClJGAUCCR[JU'G
ACQGOTOSkCC
>RnSDl_Für2
tJMGUACCA[JGGCCAGuCCUCCCUGAG[JCTGACCAUCUGCGAUCGUGCÜÍ>CXJGajGCUGG UGCUaCÜGGtJCUUCCUGGAAUGDGACCAUUCGUUGUCGGaJAUÜGGCC-UCCUCACCAAGA
CUGACUGCCUGCÜGCUUUGCTJACUGCCCGGGCCGAUGAGAGUGACUUCCCACGGGUCCJGC
CGGCCUCUCCCGAGLIGCACUGGCACAGCCCCGCCUUGCGGrUGUUGAGGCA'JUGCOGGUG UGACC
>Rn6-2WüG lO_For2
CCAAGACUGaCUGCCUC-C OGCUUIXC UACÚOCCC&^-r CCAUGAGACUGACUugcC A O S CL'CUGCCUGCCUCUCCCCAaJGCACTJGGCACAGCCCOG C CUGGCOGGIj GUDGAUCCAUUG UCOGUGUUACC
>Rn6^TWo_E4J>
[XAAaACU^aJGCCtBCTnKtJDUSCURCUGOCCGWOCCWOSftGftCUaftaJUCOOkCyG CUCUGCCTUGCCUCUCCCCACUGCACUGGCACAGCCCCGCC'JUGCCSCUGCUGflíJCCAUUG CCGGCJGUGACC
>RnS-2WDF3_FDr2
CDSCUHTOCOJGUOCDCJVCCAAiGACDGAiCDCCCUGOTGCirJUGCUftiCUGOOCGGQCCCAIJ GAGACUGACÜUCCCfiClKJCUCUGCCUGCCUCU[XCCññUGCAC'UGGCACAGCCCCGCCTJU GCOGCUGCUGAUCCAUUOCCGGUGUÍjACC
>RnG-96h-2pl-0lÜ
C OGCUAUGCCCGUCCDCAC CAAGAC UGACUOC CDSCUG C fJUl>GCUACUG CCCGGGCC CAU GAGACU^C^OCCCACUGCUttJGCCMHXJUCUCCCCACUGCftajGGCACAGCCCCGCCUU GCCGCUGCUGAUCCAUUGCGGGUGüGACC
>RrG-96h-2pl-C10
GCTAUGCCCGUCOICfiCCAAGACyGiACUGCCUGCUGCUUUGCUACUGCCOGGGCCCAUGA
GAGUGACUUCCCACUGCUCUGCCUGCCUCÜCCCCAC'JGCACUGGGACAGCCCCGCCUUGC
CGCUGCU3AUCCAUUGCCGGUGUGACC
■>RnS-1 Wü0£_Fof 2
UCUUCCUGGAAUaJGACCAmjCGUUGyC[JGCUAU5CCCGUCCyCACCAñGAC[JGACUGCC UGCUGCUOJGCUACUGCCCGGGClíCAUGAGACUGACyuíCCACUC-CUCVGCCUGCCüCUC CCCACUGCACUGGCACAGCCCCGCcyUGCCGC-JGCyGAUCCAUUGCCGGyGUOñCC
>RnS-96h-2pl-DG_f
CUGGAAIÍ CUSA CCACUCGmJGUCtIGCUAUG CCCGUC C U C^CCMOACUGACDGC CU'GCOG OJUUGCOACDGCC C GGGOCCAIKAGACÜGA CimCCCACDOCUC DG CCUGC COCO CCCCAC UC CACIJGGCACAGCC C CGCCUUG C CGCUG CDGAUCCAtJOO CCGGUC-UG ACC
■>Rn6-96h-2pl-£6_.F
a x G ^ u c tK jA a ^ m a ju u i io cdgc ual>s c c c o t ccu cac caagacuoacogc cug o jg
CULAJGCTJACIHjCCCGGGCCCAUGAGAGUGACIJUCCCACUGCUCUGCCTJGCCL'CUCCCGÍí C
tJGCAC DGGCACAGCCCCGCCÜÜG CCGGÜG CUGAU CCAUUGC CGGUGUGAC C
>RnG-2WDF10_ForS
[KAAUCUeACCAQUGGUUGuCUflCCAtí&CCCGUCCUCACCAAGACUCTAClJGCCUGCUGCU UDOCUACDGCCCGÍ^CCAtJGAaACOaACDUCa^araaJCUGCCÜGCCUCDCCCCAaja CAOJGOCACAGCCCCGCCm;GCCGCCJGCTJíjA[JCCAUUGCOGGUGUGACG
>Rn6-lWDÜ9_For2
CO«GACTIGACT^CUGCUGK*^GCaAC[mCCaGGCCCAUGAGACT*^CUUCCCAnK CUCÜGCCUGCC UCÜCCC CACtJGCACUGG CAUAG CCCCGC CUtJSCCG CtJGCUGAUC CA W G CCGGUGUGACC
>RnS-96hC1í_For2
CUUCCUGGAA:JCyGACCAUUCGUl]GUCUGCUAUGCCCGUCCaCACGJUtóACUGACUtJCCU GCtJGCUUUGCtJACTUGCCCGGGCCCAt^GAGACUGACUOCCCACUGCCJCÜGCCUGCCUC’tJCC CCñCUGGACÜlWCAUAGCCCCGCCUUGCCGCGGCUGAUCCAUUUCCGGUGUGACC
Grupo D
>ftnS-1 WüF2_Far2
CAGACACCCGCCCCCCGGCCCUGGCUAAGAAUVUGCUUCCUGtroGCGA^AüGACCUACC CtJCGC CDOJUÜi^l^CAUCCaCDG CCAC C UCC UUUUGC D CCUOGAC C CUTJüaGCCUC tfC UGCCCÜUCCACUCTJCUGACC
>F¡nS-2WDDG_FDr2
UUCCAGOCAGACAaiOGCCCOCCGGCCC âJAAGMGmJGCUUCCUaDDGCCftGCAIJG AC CtlACCCÜCGCC UC UDDGAUGCCAUC CGCÜGCCAC CUCCÜÜOOGCUCC DQQAC CCTJUUA GCCLTUCüGCC CUUGCACUCUGUGñCCCC
■>Rn6-1 WdDS_ For£
CUC GCUU CXTOGGUCIJGCAGG U CCAGC CGGCUGGCACC CUCCAWUACCCftGGGGAG&UU GCAGCCAGACACCCGCCCCCCGGCCCUGGCIJAAGAAGLTj GGUUCCÜGUUGCCAGCAUGAC CUACC CTJGOC CyCUUUOAUO CCAüOCQ CÜQC CAOCUC CUUUIJJ CnjCCUQOAC CCUUUAGC CUCUCUGCCCUUCCACUCCCU-GACCACCGCCC
■>RnS-2pl-DS_Faf2
UCCAGC CAGACAC C CGCCC CC CGG CCCÜOGOIAAGAAGaî GCDÜ CCUGUDG CCAG CAUGA CCUACCCU^CUCTJUUGAUGCCAUCC^UGCCACCUCCUmraGCUCCÜGGACCCUUUAG CmCÜCTOCCC UÜCCAClJCÜCÜQQ
>Ftn6-2WüAfi_Foí2
CGCOOCCUGGGUCU qcaggu ccag ccggcugo CACC C^ CACGTJACCCAGGGGAGAUUCC
AGCCAGACACCCGCCCCCCGGCCCÜGGCUAAGAAGUUGCUUCCUGUUGCCAGCAUGACCU
AC CCUOGC OJCUUUGAÜa OCAUOOGC13G CCAC cnjCÜUUÜUUCDCCUGOAC C CÜÜDAG CCÜ CUaJGCCCTJUCCACUCÜCUGAGCACCG
>F¡nG-2WDD7_FarS
CAUGUACCCAGGGaAGa^CCAGCGAaAaACCrGCOTCCm^CCnJGQCDAAGAAGaUGC ÜUCCUQ UtíG CCftOCXDGA C CUACCC UCG CCtrOJUUGADGCCJUJCCGCUGC CACCLTCCUUU UGCUCCUGGAGGCUUUAGCOJGUCUGCCCUUCCACü CG
■>Rn6-2WüBfi_Fof2
C[JCGaTUCCU(jGGUCUGCAGGCJCCAOCCGGCUG!j(^CCCt.rCCñUaUACCCñGGa:-AGAUU CCJU3 CCAGACAC CCGG CC G C CGGCCCU^ CDAAGAAGnOGOJ U (JCUGTJUG C CAOCAOGAC CUACCaTCGCCUCmJUGA'JGCCAQGCGCUGGCACCUCCGUUUGCUCCUGGACCG'JUUAGG CUCUCUGCCCCCCCGAU
■>Rri6-9&h-2pl-HG_F
c g c a g - ucccqaggcgucccaucvucgcuuccugggdcugcagguccagccggguggcacc
CUCCA'OG'JACCCAGGGGAGAUUCCAGCCAGACACOCGCGCCCCGGGCCUGGCUAAGAAÜU
□C-CUUCCtfGUUGCCAGCAUGACCUACCCTJOGCCUCUUUGAUGCCAUÍICGCUGCCACCUCC
UUUTJG CUCCUGGAC C OTOUAGCCü CUCO&CC CTJUCCACUCUUOCíACCCCCAUCUUA
■>RriG-96h-2pl-F10
GGCGACCrMÜCAuGGGAAGUATJGAGAAÜGUGCU-UiSuGGAAGGGGGCCGGGClJCCCuAGGC GUCCCñüCUCGCittCCUGGÜGCUGCAGÜUCCAGGCÜGCtJGGCACCCIJCCAUGUfiCCCñGG GAG«W£CAGCC¿ÜACaCCCGCCCC£CGGGC?CUGGGQAAGAAGÜLrGCU[UCCUa'LXrGCCAG
CAUGAOCUACCCUCGCCUCUÜUGAUGCCAUCCÜGUGCCACCGGCUUUUGGUCCUGGACCC
U’JUñSCaJCUCUGCCGUUCGACUCUCUGACCCC
>Rn5H_ F«2
U&UACCCAGGGGAÜAimCQAÜC(^ÜA£ACCCGcCCCCGCG£CCUGGcUAAGAA&LJÜÜCUU COOGDDIMCAeCMMACCT^ÜCOCGtiOOODüaahüGCCAnCOQCTKIOClUCOaOCDaDOG CCJCCÜGGAGCCUUljAGCCUCUCUGCCCUUCCACGCCJGGGACCACCñCCCCC
>Rn5G7_Für2
CCGGGcCUÜGC’uAAÜAAGUÜGCUUGcruGUUGCCAGCñlJGACCüACCC-JCGCCIJCULrUGAU GCCAUCGGCUGCCACGUOCüULÍUGGUCCUGGACCCÜÜUñGCC’u'CÜCuGCCGUUCCACUCU CUGACCACAGCCCC
>Rnfr1WóGS_Füf2
C^Ca^Gt'CCUGGCQAAGAAGÜUGCUVCCÜGUyGGCAGCAtiGAGCañCCCUCGCaJCUUUG AOGCCAUCCÜCUOC CAGOUC CW JW 3 OTCCUGG A CC CUUUjftOC î XUOJGCCCTOCCACU CUCOGACCAGGGCCGCCGCC
>Rnfr1WüAa_Füf2
CGGGCÜGGGACCOJOGAUG'lJACCCA&GGGAGAUUCCAGCCaGAGACCCGKCCCCGGCCC UGGCmfljGAAGTXIGCÍJUCCtJCSUUGCCAGCAUGñCCUñCCCIJCGCCUCUUtJGAUGCCAUCG GCÜGGCaCCUDGCrL^IUGCUCCGGGACGCTmnJAnCCrjCÜ'CülGCCGUUCCACDCUGüGACCA CCGCCCCC
^Rnfrgsn_D3_b
GCCGGCUGGGACCCUCCAUG'JAGOCa GGGGAGAÜUCGAGCCAGAGAGCGGGCGCCCGGCC GQGGaJAAGAAGUUGC'JUCCrjG'JUGCGAGCAUGAGCUACCGUAGCCJCinJUGAUGGGAUC
GGGUGG^CGUGCUUUTJUGCUCCUGGACGCUUUAGCCUGUCUGCCCUUGCACUÍGGGGAC
CACCGCCCCC
^Rnfrg6hC11_Fü(í
UGCAGCGAGAGACGCGCCCCGGGGCCÍUGGOUAAGAAGUUGCmJCGUGUUGCGAGCAGGA CCUACGCUGGCCUCUVLIGAliGCCAUCGGCUGCGAGCUCGUUUUGCUCCUGGñCCCUUUAG CCUCUCUGCCCUUCCACCJCUCUGACCÍlOCACCCC
>RMV5H1_F«2
GCCAGACACCCGCCCOCCGGCCCUGr^GAAGAAGUUGCUUCCUGUUGCCAGCAUGACCUA CCCUCGCCUCCIUUCAaGCCAUCCGCUGCCACCUCí;cmUUGCUCaiHGñCCDJUtIí.GCnJC UCTJGCCCÜüCCñCUCUCUaACKJCCC
>Rnfr1WoG2_Fof2
[TOCñÜCCAGACACCCGCCCCCCGGCCCUGGCUAAGAñGyUGCmJCCUGUUGCGAGCAUGA
ccuACGCGCGOcuGUL^GAUGOCAUcracuGCCACGUCGmjuijaajccLXM ACCGumwj CCUCÍTGUGCCeUUCCAC^CUCUGACCCCCC
>Rnfr1WoG7_Fof2
CGGCUCCCOAOTCGUCC CAUCUCGCUDC CTJGGGOCUG CAGGUCCaOGCGG ÉU'GG CACCCTJ CCAOHÜACC CAGGGGAGLAUUCCAOCCAGftCAC CCGCCCC CCOGCC ClXXXXmAGAAOTUa CUUC CXTGUtJG CCA^CATXlAlXUACCCUCOCC CCAC CT7CCUU UUGCUCCUr^CÍCUUUAGCCUCUClJGCCCUÜGCACUttJC’JGACCACUiGCCrc
>Rnfrg6hB11_Fa2
UGCAGGUCGAGCCQGCUGGCAOCaiCCA^UACCCAGGGGAGAUUCCAGCCAGACACCGA OCCCCOGGCCa^COAAGMGÜUGCTCajaUDQCCAGCAUGACCUACCCUCGCCUCUUU GAUGCGAÜGGGCUGCCñCGÜCCUU’JUC-CL'^ClJGGAL’ tGLTJUñüCGUGaCUlGCGLTTJCGAC UCÜCUGACCACUa CCCC
>Rnfr2WüFfl_FOf2
UUCCAGGCAGAGACCOGCCCCCGGGCCCUGGCGAAGAAGUUGCTTJCCUG^UGCGAJGtAUG ACGUAGCGUCGCGUCUUUGAUGGGACJCCGCUGGCACGUCC'JUUTJGGCJGCUGGACCCim'A GCCUC'JCJGCGCtJUCCACUCUaJGACCAaJGCGCC
>Rnfrgsn_A9_t
OCC3GCCCOCCt3GOCC™aGaRAfiAAmiDGCUUCmQUUQCCAaCAUGAGímCCCrtJCC5CC UGLrUUGMGCCAUCOÍCUGCCACCUCCUUUÜGCUGCUGGACGCUUUAGCCUCTJCUGGCCU UCCACUCUCUGACC
>Ríl6-1 W0H3_F0í2
CAGGCAGACACCCGGCGCGCGGCGCUGC-C’JAAGAAGmJGCJUCGUGUUGCCAGCAUGACO QACGCUOGGCUCUUuGAUGCCALICCGCÜGCCAGCUCGUUUUGCUCCUGGAGCCUUUAGCG UGUCUGCCCUIJCGACUCUCUGAACACC
Grupo E
aAGCCUACUCU&AÜGACreUGGOCmJGGCL'CCUCCAjGGAAGÜCUCAGGAGCCCUAC!CUCC C^CCAUUAUJUjrraaTC^COaCCAOAMCCÜGÜGCCAñCÜOTCTTGCAmCCCmjAtJCtJC CUGUGGÜ'JÜUCriCCC'JUGGUZI^lCUCCGUGCUÜUCFi.ZUGCCAUCUCCCCCCUGrACCCCUZ GAACCCALTCCTJA
:-R Jlfr1W QDl_F0í 2
GAGCCUACUCU&AUGACCGuGÜOCm^CUCCUCCi^3AA&SCUCAGGCGCCCUAGClJCC CUGrcAUUAUAGCUGCUCCCCGCCAÜAAGCCUGuGCCAACUCUC(JGCA[JUCCCUGA(JCUC CAUCCCUGUGGCUGUCACCCUUGGLJCACC^CCGaGCUGUCACtJGCCAUCUCCCCCCUGAG CCCÜGUAACCC
>Rnfr2WüG7_Fw2
aCCUACUCUGAUGACOGUG&GCUU&SGUCCQCCASGAAGGCUÍÍAGaAGCCCtrAiCGUGCGU OCCHJÜAnMCDBCUCCOOSCCAflAAGCCUSnSCCftACUCUCUGÍIADÍICOCOQAUCDOCA UCCCUGÜGGCUGUCACCCUUGGUCCACUGCCAUCUCCCCOCC
> R jifr2 WoH2 _Foí2
GAGCCUACUCTJGAtJGACCGUGÜCCUUaGCUCCUCCAGGAAGGCLiCñGGAGCCCUAGCuCC GQGCCAUUAUAGGUGC'JCCCCGCCAGAAGCGUGIJGCGAACUGÜCUC-CAmCCCUGAUCUC CAUCCCUGUGGCUGUCACCCUTJaGUCACCUCCGUGCUaaUAGUGCCAUC'JCGCCCCUGAC CCC
>RJ1f r 2 W üC1_FOí2
GAAGAGCCUACUCUGA'yGACOGUGGCCmJGGCUCCIJCCAGGAAGGCUCAGaAaCCCUACC uccaroccflU U A U ^cuG O JCíccG G CíW jA A s^cuG U G írcjuiCTjcuc'jncA U U CCciiG A tj CUCCAUL:CÍUG[rGG"UG[JlCft)ÜCCUÜGGtrCACCUCCGÜGCUÜUCAGUlGCÍlAUCUCí:CCCC[I GACGCCUCUAACCCAUCClfCUGCCUCCCUCCCUGCAGUCñGAGGGUCCUGtPJCCCAACCA
>RJ1f r 1W o_C1?_b
UGUGGCCUUCGCTJCOJCCAGCAAMCmAGÍÍAGGCCUACCUCCCUGCCAUUAlJAGCUGCtJ CCCOGCCAGAArTCCUGUGCCAACUCUajGCAULTICOTGAUCUCrJiG-CCCIG^GGCUlGrTCA CGCLmCGUGAGCUCOGUGCUG^CACuGCGAUCUCCÍCGCÜGACOCC
> FLlfr1W üE12_Füf2
aCCUUGGCUCCUCCAGaAAGGCUCAjGGAaOCCmCCUCCCUGCOAUUAUAGCIJGCL'CCCC G CCA'SAAOCCriODOC CAAOTOTCTOCAmCC COGADCUCCAOC CC UG CÍ3GCU3 LFCAC CCU UGGUCACCUCCGUGCUCUCACUGCCATJCUCCCCCC
>Rfl6-2WúF 5_FOí2
AGAÜCCUACÜCU&AUGACCGUGGCCmK&CUCCUCCAGGAAÜGCUCMGAGCCCUACCUC CCaGCCAUUAGAGCUGCDCCCOGCCAGAAGCCUGQGCCAACUCGCUGCAmJCCCUGAUCU CCAUCCCUGTJGGCUGUCACCCUUGGUCACCUCCGUGCüaUCACÜCCCAUCTJCCCCCaJGA
CCCCUCÜAACGCAaCC^JCUGCCuCGCUCCCuGílAGGCAGAGGGGCCüGUÜCCCAUÍAGCG AUU'GCCCGGCUUAAACCCUUCCAÜGACUGCCCACL'GCCC’JAAGCUGAGGCJCAGüCÜCc GA A3CCUGACAU
>Ríl5n2phH3_Füf2
UAUAGCuGGUCCCCGCCAGAAÚCCUGUGCCAACUCUCuGCAtAJCCCrJGAGCUCCAUí:CGU GUGGClXtJCACGCUUGGIJCACCDCCTiXJCUGÜCACUGOCAUCUCCOCCGUGACGCCUCUA ACCCAUCCUaJGCCUCCCUCCCUGCAGUCAGAGGGUCCUGUU-GCCAUCAGCGAUUCCCCU GCUUAAACCCTOCCAUEjACAGCCC
>Rnfr2WüA3_Füf2
u c r.i g ca uirG c c ltga'c c u c ca d c c c d s qg g c u gu ca c c c u n gg u c a c cu c og c'g c u s ucac UGCCAGGUCCOCCCL-ÜACCGCUCGAa CCCAUCCUCUGGCUCCCÜCCCUGc AGUCaGAGGG UC COG UUCC CAUCAOC 3AUUCCCC U3CUUAAGC CCUDC CAUOACnqCCC
>Rnfr36hF12_F£>í2
CUCCCDÜCGAimUAGCUGCU-GCGO3C0AGAAGCa.lGI>GCGAACUC,JCUGCA’JUCCCUGA UCrjCCAUOCCmUGGCUGUCACCCUUGGUCACCTJCCGIJGCUGUCACUGCCAQOUOCCCCC UGACCCCUCUAACCCArJGCUaJGCCUCCCGCCCUGGAGUCAGAaGGUCaJGUljTCCAUGA GOGAIHJCCCCUCCUUAAACCCIAJCCAUGACUCCCCAA
>R(ifrg6hE11_Fa2
GGCUACUCUGAUGACGGUGGCGGTJGGGUCCUCCAGGAAGGCU-CAGGAGCCCUACCUCCGU
GCCAWAaAGnJGCGGCC03Cí:AGAAGUCGaUGCCAACUCUCUGCArJUCCCtJCTAUCUCCA UC r CUGUQG ctJG UCAC CCUU £ OTCA.C CUC n^UGC UGUCA171J5C CAtJCUCC c e CCÜGACcC GUCUAACCCAUCClJCnjGCeUCCtTiCCCl^CftGUCAGAL^GUCCUGUUCCCA(JCAGCSALTJ CCCCUGCUUAAAOCClJGCCAUGACUCCCCUCU
>Rnfr36h-2f*A11
OTAJH^OOJÍÍO£3OTmMCUQCUCCX:CGCCMAAJGCCIKT^CftAaJCUCUlGCAUUCC CQGAlX/JCCAUCCCUGÜGGCUGUCACCCUl^GUCACaJCOGiXJCUGUCACUGCCAUCUCC COCCUGACCCC
Grupo F
>Rjlfr1WüB3_Füf2
ClK&UAGuGCAUL-CACGGAAUGCUAGCUr^CCCGJIJlJCCC&UCClJGGGliACCCCGAGlJCUC rcCOaAGeuaKGUCCCAGGuAUGCUGCCACCUCGACCU&COCCAÍuGACCACC'UCUGCU AOLTUCCAGACACCLTCC
:-Rjl6-2'iVrjEl l_fl
Figure imgf000062_0001
UCÜCCCCCGACCCÜÜGGUCCCAGGUAUGCUCCCñCCUCCACClffiCCCÍIACUÍ^Ul’ CACCUC QGCUAGUÜCCAGACACCCOCGCG
>RnfrgSh_E3._b
CCUUCCCCGGUUlfUGAAGAUG-JGUAACGGACñGTJCUGCG^GGGCCACñSGCCUCXJCACCC
UGOTACTGCATOCACO CAJUWCUAGCUG CC CCUUUCC CG CCCTOOQGACCC CQAGÜCUC C
CCCGACCCCGGGUrcnftJGGIiA'JG^aGCCAÍZCDCCACCGGCTCCCACIJCACCACCUC'JGCUA GUUCCAGa -GACCUCCAC
>Rfifc-3SlvZp4-BS_F
QCUGCCUGGGCCACAGCCClJC’JCACCCUGGlJACUQC’AUGCACGCAñUGCUAGCUGCCCCa UGCCCGUCCUGGGCACGCCGAGUOJCCCCraACCCQjGGÜCCCAGGUAUGCUCCCACCTJC C A C C U G C C c C A c u C A - c f t C Gü TCUG C UAG C n.1 C C AGACA c e ríe C A 2 GC C. c j\.c C UG GUC G r j C [I CCtlftilOGCCCJiOUW^-GGGGGGAOGAÜGGACGAC-CUUAGGUGAGCl^GGAGGAGCAGG G'JGAGGGUGGGCGAOCCAGGAL'UCCCCCACCCC
Grupo G
>FÜ15_D5_b
UGACACCnCñG CUGACAGCGUGGG C AACGCCUGCCG CCÜGCUGI J<5 AGGCCCGAUCC AG UG
GGCAGGCCAAGGCCÜGCUGGGC CCC0GCGGA COCAGGUGCUC L'GGGUCACGGUCGCUGUC
C CCGCAC C CC CGCUUCTJG UCUGC C CCAUUGÜGGCUC CUGAGGCUCUCUC CC CUGCTJCUCC
O ^UCUACCUCCftCO CCA
=RnEB2_For2
CGCAG CCSACACOGUQGGCAACGC C UG CCGCCtJGC'JCUG AGGCCgGAUCGAGUGGg GAGG
CCAAGGCC UG CUGGGCCCCCGCGGACCCAGGUGCUCUGGGUCACGGUC CCUGUCCCCGCA
CCCC OGCTJU CTJGU CUGCCCCAUUGUGGCUCCUCAGGCUCUCUCCCCUG CUCU CCCAC CU C
UACCüCCACUCCC
=-RnEiG3_For2
U C CGA3GCCCG AUCCAGUGGGCAGGCCAAGGC OIGCOSGGC C CCCGCGGAC CCAOG UG C U
CUGGGUCAOGGUCCCUGUCCCOGCACCCCCGCUUCTJGUCUGCCCCAUUGUGG CUC CUCAG
g c : tg: ic :jg c c c u g c :tg ug ccac c u c u a c c u c c a o c c cc
=-Rn6-S6hF11 =&2
GGC CCGAUC CAGÜGGG CAGG CCAAGGCCUG CÜGGGCC CC CG CGGAC CCMGÜGCÜCUGGG
UCACQHÜCCCTJG U CCCCGCACCCCQGCTJUCUG L-CUGC c c c a u u g u GGCÜC c ijc a g g c u c u CUCCCCUG'GLTCUCC CACCU CIJACCUCCACCCC C
=-Rn£-S6h-2pl-DE. F
G CCUG C’JGGGCCt CCGCGGAL'CCAJGGUGCCJCUGÜGUCAOGG UCCCUHUC 2 COGCA CCCCC
G CUUCTIGUCUG CC CCADUGUGG CUCCUCAGGCUCUCÍJCCCCTJGCUCUCCCAC C’JCÜACC U
CCGCCCCC
=-Rn5C4_For2
CGCGGACCCAGGUG CUCTJGGGUCACGÜUC CCUGU CC COGCACCCCCGCUUCDGGCUGCCC
CAUU GUGG C U C CUUAGGCUCÜCCCCCCUGCUCUCCCACCUUUACCUCCACCCCUAC
=RnÉ-2WoD3 For2
CuGACAG CGOÜGaCAAOGOCUG CGGCCUGCUCuGAGG CC CC AUCCAGUGGGCAGGCCAAG GcCUGCUGGGCCCCOGCGGACCCAGGUGCUCUGGGUCAGGGUCCC’TraUCCCCGCACCCCC
G CTTT TCTJGUCUGCCCCAü UGUGGCUCCUC AGGCUCUC- TCCCCTJGCUCUCCCACCUCUA CCU
CCACCCCCAC
=-Rn£-S6h-2pl-C Í F
CuGACAGCGTJGGG C AAOTCCUÜCOG Cc UGCUCu GAGG ccc g a u c c a g u g g g c a g g c c a a g GCC UGCUGGGC CC COGOGGAL’CCAGGUGL’ JCUGGGUCACGGUCC CUGU CCCOGCAjCC CC C G CUUC L'GÜGUíi CC CCAUUGUGG CUCCUCAGGC UCUCUCC CCUGCU CTJCCCAC CUCUACCU CCACCCCCAAC
=Rn£-96h-2pl-C7. F
CUGACAG CC UGGGCAACGCCUGCCC CC UG C'JCUG AGGCCCGAUCC AG UGCGCAQGCCAAG
GCCUGCUGGGCC CCCGCGGACCCAGGUGCUCUGGGUC ACGGUC CCUGU CCCCGCACCCC C
G CUUCUGUCOGC C C CAUUGUGGCU CCUCAGGCU CU CTJCC CCÜG CUCU C C CAC C TJCUAC C U
CCACCCCCAAC
=-Rnfi-96h-2pl-FB_ F
OGUGGG CAACG CCUGCCG CCUGCUCUGAGCCCCG AUCCAC-UGGGCAGGC CAAGGCCUGCU
GGGCCCCCGCQQACCCAGGUGCUCUGÜGUCACGGüCCCUGUCCCOGCACCCCCGCUUCUG
UCUGCCC CADUGUGGCUCCUCAGGCÜCUCUCC CCUGCUCUCCCACCÜCUACCUCCACCCA
GACC
=-RnÉ-96hH9_For2
UCCUGAGGG ACUGGGAC'J CCL’CUUACAGCCAL'G AGCUÜGACACCU CAG CUGACAGCG UGG
GCAACGCCUGCCGCCUGCUCüGAGGCCCGA'UCCAGUGGGCAGGCCAAGGCCUGCUGGGCC
C CCGCGGACC CAGG U G CUCUGGGUCROGGUCCCUGUCC COGCACC CCCGCUUCTJGU C17G C
CCCAUUGUCGCUCCUC AGGCUCTICUCCCGTTG CUCUC CCAC CUCUACCUCCAOGCCCAC
>Rn6 F10_b
CUGftGGGACUGOGACUC CCCUUAGAG CCAUGACCJUGACACCUCAGCUGACAGCC UGGGG
AACGC CUG CC3CCUGCUCUGAGGCCOGAUCC AGUGGGC AGGCC AAGGCCIÍGCUGGGCCCC
CGOGGACCC AGGUGCUCUGGGT JCACGGUC CCUGUCCCüGCACCCCCGCT JTTCT TGU CUGQCC
CñUUQUQQCUCaJCAOQCUCUCUCCCCUQCUCUCCCACCUCUACCUCCñCACCU
=RnÉ-2WoF11 For2
UGCGGAG CCAGCüGGAGGCCAUÍIUGCCUGAGGÜ ACUGGGACUCC CCUUACAGCCAUGAC C
UUGACAC CU CAG C'JC-AC AGCGUGC-GC AAC3 CC UC-C CGCC [JGCUCUGAGGC CCGAUCCAGU
GGGCAGG C CAAGGCC UGCü GGGCC C c c g c g Ga c c c aGGü g cucqc-g g u c a c g g u c c c u g u
CCCCGCACC CC CGC L'UCUGUCUGCCCCATTUGUGGCUCC'J CAGG CUCUCUCCCCUGCU CUC
CGACCUCUACCUCCACCC
=-RnÉ-1WoA3 =or2
CTJGGASGC C AUUUUC C UGAGGGAC UGSSAOJCC GCTJDftJC&GC CAUGAC CÜUGACAC C L'CA GCUGACAGOSUGGGaUWSCCT^CGCCUGCUCWSAGGCCCGAUCCAGUGGGCAGGCCñA QíSCCUGCTTGÍjGCCCCCGC^GACCCAGGUGCUCUGGCUCACGGSJCCCTjrxUCCC’CGCACCCC OGCUUCUHUClHCCCCflUUGUGGCUCCU'CAJSGCÜCUCUOGCCtlGCUCUCCCACCCJ'ClIACC TICCCGCCAC
=-Rn6-1WoF9_For2
CTJGGSACÜ CCCCU UAOAGCCAUGACCUTJGACACCIJCAG CUGA CAGG 3UGGGCAACGC CUG
C CGC CTJG OTOJGAGGG CCAAUC CAGUGGG CAGGC CAAGG C C UG CUG3GC CC C CGCGGACC
CAGGDGCUC UGGGTJ CA CGGUCC CTJG U C C C CGCAC CC C CC CUUCUG U CÜGCC C CAUUGUGC
CUC CUUAGGC! J OTCUCCCOT9CUOJCCCAGCUCIIACCGCCRC CCCC
Grupo I
=-Rn5_A7_b
O CAGCAAUGCAG CU CAAAACGCUUAGCCUAGCCACACCCCCACGGUAAACAG CAGU3AUU
AACUUUURGCAAimAACGAAAGTTU TJAACTJAAG CUAUACUAACCCCAGGGUUGGUGAAUUU CGUGCCAGCCACC
=-Rn5_B6_b
C L'U UCUAUUAGCUCTJIIñGU AAGAUUACACATXSCAAG CAUCCCCGUUCCAGUGAjGUUCACC
CUCUAAAUCACCACGLAUAAAAAGGGACAAGCAUCAAGCACGCAGCAAUü CAGCUCAAAAC
G CUTJAGCCUAGCCACACCCCCAOGGGAAACAG CAGUGAUUAA C CUUGAGCAAUAAACGAA
AGDUÜAACUAAGCaAUACUAACC CCAGGGUUGGU CAñUUUOGUGCCASOJAC C
>RnE¡D4_ For2
G'J U CCAGUGAG UUCACCCUCUAAAÍJCACCACG AUCAAAAGGGACAAG CAUCAAG CACGCA
GCAAL'GCAGCUCAAAfLCGCUUAGCCGAGCCACACCCCCACGGGAAACAGCAGUGAUUAAC
C UUUAG CAAUAAAC GAAAGUUXJAACOAAG CUAUACÜAAC CC CAGG3ÜUGGUCAAUUUC CU
GCCAGCCAGC
=-Rn5D2_ For2
AAAGGGACAAGCAUGAAG CACO CAGCAAUG CAGC ÜCAAAAOGCUUAGC CUAGC GAGACCC
C CACGGGAAACAiGCAGUGAUUAAC CTIUUAGCAAUAAACGAAAGUUUAA CUAAGCOAUACU AAC C CCAGGG UUGG UCAAUUUC GUG CCAGC CAC C
>Rn6-1Wo D7 b
UCAAAAÜGGACAAG CAUCAAü c acgcaac aaugcagcuc aaaaacgcuuagccuaüccac
AC'C CCCACGGGAAACAG CAGUGADHAA C CUUUAGCAAUAAACGAAAGUUUAACUAAGCUA
CACUAR CC CCAGGG TO'GGTJCAAUT.TUCGUGCCAG CCA CC
>Rn6-9Gh-2p(-ABF
JACACAUC CAAGCAU CCCCC UU ÜCAGUGAGUUCAC CC ÜCUAAAUCaCCACGAUCAAAaGG
GACAAGCAUCAAGCACGCAGCAAUGCAGCUCAAAAAOGC UUAGCCUAGCCACACOCCCAC
GGGAAACAGCAG DGAUTJAACCUUUAG CAAUAAAC GAAAGUUOAAC UAAG GUAUACUAAC C
CCAGGGUUGGUCAAUl.-.ICGÜGOCAGCCftC C
=-Rn6-2WoH3 Forí
caucaagcacgcag caaügcagcucaaaacgcxjuagccuag c caoac C CC CACOGGAAAC AGCAGtTGAUÜAACCUUUAGC AAUAAACGAAAGU TTUAA C UAAG CDAUACOAAC CCCAGOG U UGGUCAAUUÜOGUGCCAACCACC
=-Rn6-96hG11_For2
AAAGGG-ACAAGCAUCAAGCAGGCAGCAAUÜ C AG CU CAAAAOGCUU AGCCUAGCCACACCC
CCACGGGAAACAGCftGÜGAUIIAACCUUí;AGC31AUAftACGAAAJGUUUAACIlARGCUAUACU AACCC CAGGGUX JGGUCAAI JUUCGX JGCC AACCAC C
=-Rn5E1l_FDr2
CAAGCACGCAACAAUGCAG CTJCAAAACGCUUAGCCUAGCCACACCCCCAOGGGAAACAGC
AGUGAUUAACCUUUAGCAAUAAACGAAAGUUUAACUAAGCUAUACUAACCCCAGGGUUGG
UCMUUUCGUGCCAACCACC
=-Rnfi-1WaA11_For2
CAUCAAGCACGCAG CAAU G CAGOJ CAAAACG CUUAG C CUAGCCACACC C CCATJGOGAAAC
AGCAGUGAUUAACCUUUAGCAAÜAAACGAAAGUUUAACUAAGCUAUACUAACCCCAGGGU
UGC-CCAAU UUOGUGCCfteCUCACC
=-Rnfi-2WoE7. -ot2
CAAGCACGCAGCAAuGCAgCuCAAAACGCUUAcCCLIAGCCaCACCCcCACGGgAAACAjGC AGUGAUUAACCUUUAGCAAUAAACGAAAGUUUAACTJAAGCUAUñCUAACCCCAGGGT.njGG TÍCAAUUUCGUGCCAGCCACACC
=-Rnfi-96h-2pl-B5_ F
CAAQ CACG CAGCAAUG CAQ CUCAAAAC G CUUA3CCUAGC CACAC C CCCACGG GAAACAQC
AGUGAUUAACCUUÜAGCAAaAAACGAAAGUUUAACUAAGC U,AUACÜAAC CC CAGGGUUGG ÜCAAUUUCGÜGGCAGCCACC
=-RnBH2 For2
GACGAUCAAAAGGGACAAGCAUCAAGCZACüCACCAAÜGÍAGCUCAAAACGajÜAGCC'JAG CCACACC CC CACGGGAAACA3CAGUGAUTJAACG LnjUAGCAAUAAACGAAAGUUÜAACUAA G CUAUACUAAC CCCAGGGUII:GGUCA AGITJCGT IGCCAGC CACC
=-RnÉ-1WoF11_Far2
UAAAU CACCAOGAÜCAAAAG GGACAAG CAUCAA(3CACG CAG CAAÜG CAG CUCAAAACGC U
UAC-C CUA&C CACAEC C C CAC3GGAAACAGCAGUGAUUAA:: CUUUAGCAAUAAAGGAAAGU
UDAñCUAAG OJAUAC UAACC C CAGGG UUGGtrCAAUW J OGUGCCAG CCfiCC
=-RnÉ-2WoB11 For2
AGCCU üU GUAU UAGOTOJUAGGAAGAüfACACAUGCAAGCAUüCCCGGt CCAGUGAGUU C
ACCCUCÜAAAUCACCACGAUCAAAAGGGACAAGCAUCAAGCACGCAGCAAUGCAGCUCAA
AACGCUT T AG GCUAGCCACAC CCCCAOGGGAAACAGCAGUGAUUAACCUUUAÜCAAUAAAC
GAAAGUl TUAACUAAGCUñUACüAACC CCAGGGUUGGTJC AAUUUCGUGCCAGCCACC
=-Rnfi-1WoA3_For2
GGÚAGAAGCAUCAAGCACGCa GCAAUGCAGCUCAAAACGCUUAjGCCgAGCCACACCgCCA
CGGGAAACAGCAGUGALTIAACCUUüAGCAAüAAACGAAAGUUüAACUAAGCUAUACUAAC
cccagggt- jg g ucaauttug g tig ccag ccacc
=-Rnfi-1Wo_D2_b
GGGACAAGCAUCAAGCACGCAGCAAUG CAGCGGAAAAOGCUUAGCCaAGCCACACC CCCA CGGGAAACAGCñGTJGAUDAACCTJUUAG-GAAnAAACGAAAGUUUAACGñAGCUAUACTOAAC C C CAGGGUUGGUCfiAUUUCGUG C CAGCCAC C
Grupo J
>Rn5A1 For2
IKKOTCCCC^ aCUUIJGCAaGATOñARCACUUC CC CGCUUGGOTCXJCAUUCUU C CACAAGA GAGACCUUUCUC CGGACCUGGUUGCtJACUGGU U CAGCAACUCCGCAGAAAAUGUCCU CC C CUGUGGCtJG C CüCAQ Ctl CfiUG C CTJUUGGC CUGAAGUCC CAGCAÜtJGADGGCñG CC CCüCA ttC'JUC CAAJG ÜUUUGUGCUCC C CUUUACCUAACQ CUTJ CCTJGCC U CCCAUÜCAUCUGUACUC OTUCUGUGCCACU
=-Rn5B1 For2
TJ UC UG C OCCAG CTJUTJ G CAG C AU C AAACAC UTJ C CC OG CUU-G G CC C TJ CAUU CUU C CACAAGA
GAjGAC ctjtjuctjc c ggac cugguugc ua c UC-GUUCAG CAACUCUGCAGAAAAUGUC CUCCC aJGUGGCÜGCC'JCAGCUCAUGCCUUUGGCCUGAAGCCCCAGCAUUtJAUGGCAGCCCCUCA
ü CUUC CAAG UUUUG1JGC UC CC CUUUACCUAACGCUU CCUGCCUCCCAUGCAU CÜGGACUC
COTCTJGÜGCCACTJ
=-Rn5_A10_b
C CC CAJ30JUüGCA33A1ÍGAAACACUDC ttXftCUUGGCUC ucauuc uuc cacaagagagac CuuUCUC CGiSACCUGGUUG CUACtFGG UUCAG CAA CUCUG CAGAAAAUGUCCÜ C CC CUGUG GCUGCCUCAGCUCaUG CCUUÜGGCCUGAAGUCCCAG CAUUGAUGGCAjGCCC CuCAuC LTJ c CAAGUDUUG CJGCÜCC CCUUUAC CtmACGCUUC CUG C CUC CCAU G CAUCUGUACUCCJ CCIJ GUGCCACAAA
=-Rn5_G1_b
CCCCAGCUUUGCAGGAUGAAACACL-UCCCCGCUUGGCUCU CAUTJ CU L'CCACAAGAGAGAC
CUUUCUCCGGAC C tJGGUUG CUACUGG W J CAGGAACUCTIGC AGAAAAUGUCCU CCCCUGUG GC UGCCUCAGCUCATO C C UUUGGC Ct*3AAGUCCCAG CAUUGAOGG C&GC CC CUCAUC UUC
CAAÜUUUUGUGCUCCCCUUUACCUAACGCUUCCCGCCUCCCAUGCAÜOJGUACUCCUCCÜ
OTGCCACAAA
=-Rn6-1WoF5. -ar2
OJUUG CAG GAUGAAACAC TAT C CCCGC UUGSC UCÜGAUUCLT UCCACAAGAGAÜ ACCUU L'C U
COGGACCUGGUUGCUACUGGUUCAGCAACUCUGCAGAAAAIJGUCCUCCCCUGUGGCUGCC
UCAGCUCAUGC CUUUGG ccugaag gcc cag cauugaugg cagc Ce ÍCJCAUC UUCCaagui; UUG UG C UC C C CUTOACCUAAC □ OTUCCUOC CUCC CAGGCAI7CDGIMCUCCT JCC
=-Rn6-2WoAE =or2
UOCñGGAUOAAACAC UTJ C CCCGCTJUGGCUCU CAUUCUUCC ACAGGAGAGAC CCJUUCU CCG GAC CTJGGUUGCUACUGG UUCAG CAACUCTJG CAGAAAAUGUC CU CCCCUGUGGCUGCC JCA GCTJ CAUG C CTJUUGG CCUGAAGUC C CAGCATJUGAtJGGCAG CC CC UCÁUCTJUC CAAGUUUUG UG CUCCCCUUUACCOAACGCUUCCUGCCT ICC CAUO CAU C UGUACüCCA
=-Rn6-2WaA7. -ür2
OUGMGAUGACCACAITUCAAGGAAGAACC i:UCU<3CCCCAGCUiJÜGCAGfl AUGAAACACJ l :
CC cOGCuUGGCuCuCCU U CUUC CACAAGAQAGAC CmiUCUCCGGACCtX3GtTUG CÜAOJGG
UUCACCAGCUCüGCAGAAAAUGUCCUCCCUUGUGGCTJGCCUCAGCUCGUAC CUUUGGCCU
GAAGUCC CAG CAÜUAAUGG CAG CCCCGCAUCUUC CAACUUUUGIXJ CU C C C C UUUAC CUAA
ÜGCDUCCUGCCUCCCAUGCAIJC l JGC TACUC CUGCUGl JGCCA
=-Rn£-2WoG2. -w2
UCCACAAG AGAG ACCTJUUC UCGHGAC CUGG CUGCUACUGGUUCAGCAGCUCU3 CAGAAAA
UGUCCUCCCUUGUGGCUGCCUCAGCU CGUACCUUUGGCCUGAAGUCCCAGCAUUAAUGGC
AG CCCCUCAUCUUC CAAGUUDUGÜGCUC C CCUUUACCUAAITG CUl JCCUGC CTTCCCAUGC A UCUOUACUCCUG OT3UGC CACAAACAC
=-Rn£-2 WqH 10_Far2
TJCCACAAGAGAGACC UUU C üCCGGACCUGGCUGCÜACUGGmJCAGCAGCG CUGCAGAAAA Vi GT JCCÜC c a JUGtJGGCUGC COCAGCU CGU A CC UUUGG CCÜGAAGUCCCAGCAIJUAAT. JGGC AG CCCCUCAUCJUG CAAGiUUUUGUG CUCCC CUUUACCGAAUGCUUC'CCJGCC UCCCAUGCA UCUGUACUC CUGCUGUGCCACAAACAC
=-Rn£-S6h-2pl-G7_ F
GCUACÜGC rJ UCAGCAflCUCUGCAGAAAADG U CCUOC CUUGuGGCUGCcUCAGCUcGUACC
UUUGGCCUGAAGUCCCA3 CAUUAAUGGCAGC CCCUCAU CUDCCAAGUUUUGUG CUCC CCU
UUACOJAMJGCDÜCCOGCCUCCCHCGCAUCUGUACUCCTJGCGU
=-Rn5-2pFB2_For2
AGAACCUUCUGCCCCAGCCJUUGCAGG AUGAAAC ACUfJ CC CCGCULTGGCUCU CA UUC ü UCC
ACAAGAGAGACCUUUCUCCGGACCUGGUUGCUACUGGUUCAGCAGCUCUGCAGAAAAUGU
CCUCCCUUGUGGCCJGCCUC AGCUCC-UAC CC JIJ'J ggcCüGAAgtjcccagcauuaauggcagc CCCUCAUCTJUC CMGUUTJUGUGCÜC CC CUU OAcCU AAUGCUU CCUGCC UCC CAUQCAUCU GUACUCOTG
>Rn5-2pl-D1 For2
AGAACCITJ CUGCCCCAGCÜU UGCftGQMJQAAACftCUTJ CCCCG CTmGGCUCUCAUUCÍJ üCC
ACAAGIAGAÍMCCUÜUCUC CGGAC CUGGÜDGC ÜRCUG TTTCAGC MCUCUGC AGAAAAUGU
C C U C f C TJU3UOGCUG C CU CAG CtJC^JACCUUUGG CCUOAAGTJC C CAG CñUUAATJOO CAGC
CCCUCAÜCUUCCAAGUUUUGUGCUCCCCUUUACCUAAUGCTJUCCUGCC UC CCAUGCAUCU
GUACUCCUG
^RnB-lWoAB ft*2
UGAAOAUGACXACAU U CAAGGAAGAAC CUUCUGC CC CAGCTJUUG CAGGAUGAAACACTTLT C
C C C G CÜIAGG C UOTCAUUC UUC CACJUM3AGAGACCUUDCUC033AC C U GGUUG CJUCAGCAa CUCUGCAGAAAAUGLCC UCCC-J UÜ U&3CUC CCUCAGCüCÜUACCUUtJGGCCUGAAGUCCC
AGCAUUAAUGGCAGCCCCUCAUCUUCCAAGUUUUGUGCUCCCCUUUAGCUAAUGCUUCCTJ
GCCUCC GAÜGCAIJCTJGUACUCCUG
=-Rn6-1Wo_G1ü_b
UGAAGAü QAC C^ CACWCTIAjGGAAQAACC UUCDG CC CCAQ CUlIUGH^añUOAAACACXnj C
CCCGCUiraGCUOTCAUUCUUCCACAAGAGAGACCUUTJCUCCGGACCUGGUUGCUACUGGU UCAGCAGCUCUGCAGAAAAUGUCCUCCCTJUGUGGCUGCCUCAGCUCGtlACCUUUGGCCUG
AAGUCCCAGCAUUAAUGGCAGCCCCUCAUCUUCCAAGUUUUGUGCUCCCCUUUACCUAAU
GCUUC CUS CCÜCC CAUG c a u c u g u a c u g c c
*Rn6-2WoE4 -or2
CCACAUUCAAGGAAGAACCL-JCUGCCCCAGCUUUGCAGGAUGAAACACUUCC CCGCUUGG
C TJC UCAUU CIAJCCACAAGAGAGAC CUUUC1ICCGGA CCTGG UUG CUAC UGG UUCAGCAGCU
CUG CAG AAAAUGUCCITLlCCUUGUGGCUOCCUCAGCLrCGTJACCuaUGGCCUGAAGUCC CAG
CAUUAA UGGCAGC CC C ÜCAC C UUCCAAGUUUUGUGC UCCC CUUUACC UAAUGCUU CCTJG C
c e c e e
=-RnÉ-96hG12_For2
GUGAAGAUGACCACAU UCAAGGAAÜ AACCUUCUG CC CCAflCUUUSCAGGAUGAAACa C'JU
CCCCG CUUGC-CUCUCAUUCUUCC AC AAGAG AGAC CUUUCUCCGGACCUGGUDGCIJACUGG
UUCAGCAGCUCXJGCAGAAA AUC-QCCUC CCTLCrGLTGGCUG CCL'CAjQ CUCGUACCUUUGGCCi: GAAGUCCCAGC AUUAAUGGC AG CCC CUCAUCUUGCAAGUUTJUGGGC L-CCCCmJUAC CUAA ;tg cuuc cugccccccau
=-RnÉ-96h-2pl-C12
AGAACtmJCüGCCCCAG CUUUG CAGGAUGAAAC ACUUCCG G3 Cu u GGCü CUCHJÜC ü L'CC ACAAGAGAGACC'GUUCiTCCGGACCUGGUUGCUACTJGGCJUCAGCAGCUCU'GCAGAAAAUGU
CGUCCCUDGUGGCUGGCÜGAGCUOGUACCUUUGGC CUGAAGÜCCCAGCAÜUAAUGGCAG C
GCCüCAUCUUCCAAGUUUUGl^UCCCCC
=-Rn6-S6h-2pl-A6_F
CTJGAAGUGAAGAL’GACCACAUUCAAGGAAGAACCUUCUGCCCCAGCCJUIJGCAGGAUGAAA
CACtJTTGCGG GCT R JGGCU CUCAUt JCUIJ GCACAAGAGAGAG CUL " JCÜCOGGACCIJGGUUGCU AC UGG tIUCAG CAG CUCUG CAGAAAAÜGUC CTJC CCUTIGUGGCUGCCUCAG CUCGUACCUUU
GGCCUGAAGUCCCAGCAUUAAUGGCAGCCC Gü CAUCUUCCAAGUUUUQUGCUC CC CDUUA
CCUAAtfGCUDC CUG CCUC CCAUGCAÜC UGUACUCCU
=-Rn6-S6h-2pl-R5_-
CUGAAGLKJAAGAUG ACCAC A'JÜCAAGGAAGAACCEJ TJC UGC CCCAG CUUTJG CAGGAUGAAA
CAOUU C C C CGCDÜGGCD C U CADU CTJUCCACAAGAGAGAC CUUUCU CCGGACCUGGOTG C U
ACUGGITJCAGOAGCUC JGC AG AAAAGGUCGUCCCUTJGUGGCUGC CUCAQ CUCGUA CCÜUU
GGCCUGAAGUCC CAGCAL'UAAUGGCAGCCCCUCAU C [TUCCAAGÜUÜU&TJG CUCCCCUUUA
CCDAAUGCtKJCCOGCCUCCCAOQCAUCÜGtJACUCCTJ
=-Rn6-2WoG1. -ar2
AAGAUGAC CACAUU CAAGGAAGAAC C UU C TJG CC CCAGCU L'GCGAGGADGAAACACUU CCC
GGCUUGGCU CUC AUUCUtI CCACAAG AGAGACCUUUCUCCGG ACCUGGUUGOJACUGGU! J C
AGCAGCIJ CUGCAGAAAAUGUCCUCCCUOGDGG CUGOCTJCAGCUCGUACCOUDCGCCDGAA
GU C C GAGCAUTJAAUGG GAGCC C CU CAUCUUCCWM3UUW JGUGCUC CCCUUIÍñ CCUAAUGC
UtJCCUGGCÜCCCADGCAIJCGGOACÜCCüOC
=-Rn6-£6h-2pl-D11
CCCCSCUÜOGCU GUCAGUCGUCC ACAAG AGAG A0CU U J G U GOGGACCUGGUUGCUACUGG
UUCAG CAGGUC CJG CAGAAAAUGUC c u e c e rjUGGGG CU GC CUCAS CU CGUAC CTJUUCG C C U
GAAGUCGCAGCAUUAAUGGC AGC CCCUCAUCUUOCAAGUUUUGUGCDCCCCOUUACCUAA
UGCDUCCÜGCCUCCCADGCAUCUGUAGUCCTT
>RnB-SGh-2|i-FB_F
CC CC G C UTJGG CUCUCAUUCU [JCXACAAGAGAGACC UTJtr C U C CG GA£ CUGGUI.TG CCACIKJ3 ITUCAGCAGCEJ l-JGCAGAAAAUGUCCUCCcaUGUGGC UG CCUCAGCUCÜUACCU'J UGGCCU GAAGUCCCAGCAUUAAUGGC AGCCCClJ CAU CUUC CAAGUUUUGUGCU C C C OJUUAC GUAA UGCT GTGCUGC a JCCCADGCAUCUGÍ JACUCCT1
>hBg:
GAGAG C'JCGC uaL'CUUGCIJGUCCAAUUUCUAUUAAAGC L'ü GCUulJGÜ ÜCCCUAAjGUCC AA CmCUAAA'^JGOGGGAUAUUAÜGAAGGG CCUUGAG CAUCUOGAÜUCUG CCÜAAÜAAAAAA CAUUUñUUUUCñUUGCTJCCGUC
noUTR:
>
=-EB
UGCCCGuCCUCACCAAGACuSñCliGCGUGCUGCUUÜGCUACÜGCCGGGGCCCAOGAGACU GACUUOCCACUGCUCUGCCOCCCüCUCCGCACTÍGCAiCüaGCACAGCCCaKCUUGCOGCU gcugaucg auugccggugugacc: ugcccguc! cucaC caagacuC-agugccug cugcuüug
CUACUGCCOGGG COCAUGAGACUGACITUGC CAC-JGCUCUG CCUGCCUCUCC CCACUGCAC
UGGCACBGCCCCGCCUUGCCGCUGCDGAUCT^UUGCCGGUGUGACC
>ED
tJGC C CGUCC U CACCAAGA.C TOAC UG GCTA3CUGCUUiraCtFACUG CC CGGGC CCAUOAGACU GACUUCCCACUGCUCUGCCUGCCUCUCCCCACÜGCAiCUOGCAiCftGCOCOGCCUUGCOGCÜ a CUGAÜC CAUU G C CGGOGU3AC CÜUCCAGC CAGACACC CGCCC C C CGG CC ClfGG CUAAGA
a g u u g c u u c c u g u u g c c a g c a u g a c c u a o c c u o g c c u c u u u g a ijg c c a e jc c g c ü g c c a c c UCCUUÜ TUG G i JCCDSGACOCUUUAGCCUa ICUGC CCm J CCAOJOTCUGACCCC
=-EE
TKCCOGUCCU CAC CAAGACÜGACUGCC UG CUGCUT.njGCÜACLTGCCGGGGCCCAUGAGACLT GACUUCCCACUGCUCUGCCUGCaTCTJCCCC ACUGCACUGG c a c a g c c c c g c c u u g c o g c j
G OJGAUC CAUTO C CGG UG UGAC CGC C IIUGG CUCCUC CAGGAAGGCUCAGG AGCC CUACCU
CC CUGC CAUUAUAG OJGCUC CCCGC CAGAAG CCUGUG CCAACÜCDOJGCAÜUCC CÜGAUC
UCCAUCCCUGUGGCtJGUC&CCClTUGGUCACCuCCGCJGCUGfUCACDQCCAtJCtJCCCCCC
>EF
UGCCCGUCCÜCACCAAGACUGACUGCCUGCUGCÜtrUGCUACUC-CCCGGGCCCAuGAGACU GACtJTJ e rre * CUGCUCUGC c u g c c u o t c c k c a c g g c a c ü g g c a ca g c c c c g c c t ju g c c g c u G CUGAÜC CAUUGC CGGUGUGAC CCUOGtlACTJG CAÜGCACGCAAUG CUAG CTOC CC CUUtJC
CCGUCCUGGGUACCCCGAGUCJL’CCCCGACCUCGGGUCCCAGGUAUGCUCCCACCUCCAC
CUGCCCCACUCACCACCT TC[ JGCUAGUUCCAGACACCDCC
^EG
UGC CCGUCCTJCAC CAAGACUGACUG CC UGC U G CUUUGC LTACÜGC CCGGGCC CAUQAGAC T] GACUU OCCACUHCUCUGCCUG CCUCUC C CCACUG CACUGG CACAG CC CQGCCUUG C CGCU GCUGAUCCAUUGC CGGUOUGAC C C U GACAGCGUGU 3 CAACGC CUGC 03 CCUG CUCUQAG G CCCGAUCCAGUGGGCAGGCCAAGGCCUGCUGGGCCCCCGOGGACCCAGGIÍGCUCUGGGUC AC3GUCCC UGUCcCOGCACCt CCG CU UCUG JCUGCCCCAUUGUGGCUCCUCAGGCUCUCU CCCCUGCUCUCCCAC CT TCUACCUCCACCC CCAC
:'Eh3g
ÜG CCCBUCCUCa CCAAGAcUGAC UGCCUGCUG CÜUUG CUACUGCC CGGGCCCAu Ga GACU GACUUC CCACUGCUCUG CCT TG CCUCUC CC CACUGCACDGGCACAG CC CCG CCUUGC CGCU GCUGAUCC AmjGCCGCUGUGACOGAJj AGC UCG CUUU CUUG CUGIJCCAAUUU CUAOTAAAG GJ UCCUUUGU UCCCUAAGUCCAACUACUAAAC UG GGGGAUAUUAUGAAGGÜ CCUUGAGCA UCUGGAUUCUGGCÜfiftlIAAAAAACAUUUAUUUUCAUUGCDGCGIIC
>EI
UGC CCG UCCUCACCAAGACUGACUGCC UGCUGCUUUGC’J ACUGCCCGGGC CCAUGAGAC U GftCUOCOCACÜGiCUCUGCC UGCCUCUC CCCACUGCñCUGGCft CAGCCCC3 C CUUGCCGCU GCUGAUCCATH jrrCCGGUCUGACCCAAG CACGCAGCAAUG CfiGCUCAAAACGCUUAGCCTJA CCCACACCCCCAOGGGAAACAGCAGUGAUUAACCUUUAGCAAUAAACGAAAGUUUAACUA ASCUHIACOAACGCCftGGGUUGGUCAAUUUCGUGCCAGCCACACC
>EJ
UGCCCGUCCUCACCAAGACUGACUGCCUGCUGCUUUGCUACOGCCCGGGCCCAUGAGACU GACUUC CCACÍJG CT JCUGCCUGC CÜCTJCCCCACTKSCACUSGCACASCCCOG CCIC JGC CGCIT GCUGAUCCAUUGCCGGnGUGACCCUUUGCAGGAUGAAACACUUCCCCGCUUGGCUCUCAU UCUUCCACAAGAGAGACCUUUCUC CGGACCUGGUUGCUACUGGUUCAGCAACUCUG CACA AAAUGUCCUCCCCUGUGGCUGC CUCAG CUC AUGCCUUUGGCCÜGAAGUCCCAGCAI JI73 AU GGCAGCCCr ücatj CUUCCRAGUUUUGU G CU C CCCUIJUACCUAACGCUUCCUGCCUC CCAU GCAUCUGUACUCCUCC
>□3
TriCCAGCCAGACACCCGCCCCCOGGCCCUGGCUñAGAAGUU5CUUCCUGUUCCCAGCAuG ACCUACCCUCGC C UCUUUGAUG CCAUCCG CtJGCCAC CUC CT Jl JUUG C UCCUGK2AC C CUUOA
GC CU CUCUGCC CuUCCACUCUCTJGACCC CUGCCCGUCCUGACCAAGACTJGACUGCCUGCU GCUUUGCUACUGCCCGGGCCCAUGAGACUGACUUCCCACUGCLTCUGCCUGCCUCUCCCCA CUGCACUGCCñCAC-C CCCGC CUUGCCGCUGCUGAUCCAUUGCCGGI IG'JGACC
>DÜ
UJCCAGCCAGACACCCGCCCCCCGGCCmGGCUAAÜAAGUUGCUlJCCUGUUGCCAGCAUC-ACCUACCCUCGCCDCUUUGAUGCCAUCCECUGCCftCCUCCUUUUGCUCCUGGACCCUUUA GC CUCUCUGCCGUUGQACUCUCUGACCGCUlTÚCAGCCAGACftCCCGCGCCCCGGvG CUGEJ fUAAGAAGLíL-GCUtJCC’UGUUGCCAjGCAtiGACCUACOCUCGCCtJCEnTUGAUGICCAüCCGCU GCCñCCUCCUUUUGCUCCIX^CCCUUUAGCCUCUCUGCCCUUCCACOUJCUGACCCC
>DE
UUCCAG CCAGACACC COC CCCCCGGCC CTJGGCUAAGAAGUIJG CTJÍJ C C UG UTJG CCAG CAUG ACCUACCCUCGCC UCUUUGAUGC CAÜC CGCUGC CAC CTJC C1TUUU G C UCCÜGGACC CUUUA GCCT: CUCUGCCcuuC CACUCUCUOACCCCGCCUUGGCUCCUCCAGGAAGGCUCAGGAGCC cuaccuc ccugccauuauagcug cucccOGCCftG aágcc ügugccaa cucücug cauucc CUG AUL'UCCAUOCCUGUGGCUGUCACL'L’TJIJGG GCACCUCOGUGCUGUCACUGCCAi: C UC C CCCC
>DF
TJUCCAG CCAGACACC CGC CC CC CGG CC C UGG CTWiGAAGUTOCCJll'C CtTOUTJ SC CAS CAUG ACCUAC CCU C G C CüCUUUGAUG C CAUCCGC UGOCROC U CCUUUUGC U CCUGGAC C CUUUA GCCtf CUCUGCCCUUCCñiCÜ GUGUGACCCCCIíGGGACüGGAUGCAOGCAñUGC UAGCUGCC CCUUUCeOGUCCUGC^UACCCCGAGUCl’CCCCcGACCUCS^UCCCAGGUAUGCuCCCAC CUOCACCOGGCCCACÜCACCACCUCÜGCUAGUIJDCAGACACCUCC
>DG
TXT CCAjGOCAGAC ACGOGCCGOCCQGCC CUGGCUAAGAAGUUG CUUCCUGU U GCCAGCAUG ACCUAC CCUC GCCUCUUVGAUGCCAUC CGOTGC CACCU CCUUUUG C U CCUGGACC CUUUA
eOCUCUCÜG COCUUOCAC UCUCUGACCCOCUGACAG CGtJGGGCAACGCCUGCCGCCUGCU CUGAGG CC CGAUCCAG W^GGGAGGCCAAGGCC UGCUG3GCC C C CGC GGAC C CAGOUGCUC U GGGUCACGG UCC OTGU C C G CGCACC C CCGCUUCUGUCUGCC CCAUUGUGGCUCCUCAGG CUCUCUCCCCUGCUCUCCCACCUCUACCU CCACCCCCAC
>DhBg
u u c c a g c c a g a c a c c g ü c c c c g c g g c c c u ú g c u a a g a a g u u g g u ü 'c c u g u u g c c ag c au g ACCUAC CCU C GCCUCUUIAGAUGCCAUCCGCUGC CACCU CCUUUU CCUC CUGGACC CUUUA GCCUaTCUGCCCITUCCACUCUCUGfiCCCOGAGAGCUCGanrJCUUGCUC-UCCAATJICJCUA UUAAMGUU CCUUUGü U CC CÜAAGUC CAACUACUAAACUG GG GGAUAUUAUGAAG GGCCÜ UGAG CAUC UC GATO CÜGC CUAAUAAAAAACAI7WIAUUUUCAUÜGCUG CGU C
>□1
TJlKXAGCCAGftCACCCGCCCCCCG<3 Ce CUGGC U A A G U U G CUU CCUOÜTJGCCAÍKMJG ACCUACCCUCGCCUCUUIÍGAUGCCAUCCGCUGCCACCUCCUUUUGCUCCUG-GACCCUiroA
GCCUCUCDG CCCVUCCACUCUCUGACCCCCAAG CACGCAG CAAUGCAGCUCAAAACG CUU AGCCUAGC CACACC C C CACGGGAAACAG CAGUGAUUAAC CUDÜAGCAAUAAACGAAAG LT U UAACC AAGCUAUACUAACCCCAGGGTn TOGUGAAUUUOGUG CCAGC CACACC
> D J
(JUCCAGCCAGACACCCGCCCCCCGGCCL’UGGCUAAGAAíSUUGCUUCCLiGUUGCCAGCAtJG AGOm.CCCÍICGOCÜClímiGAUGCCAUCCGCEHK:CACCÜCCUUDUGCUCCUHGanCCÜim G CCTJCUCUGCCCUUCCACt; JCUCDGACC CCC'JUUG CAGGAUGftAACACUUCCC CGCUUGGC UCUCAÜU CUUocacaagagaga c cuudcüc cggac ctjgguugc uacugguu cagcaacuo TOCAGAAAAU GUCCTJCCCCUG UGGC TOC c U CAQC U CADG CC UTXTG G CCUGAAGUC CCAG C AUUGAUGG CAGCC CCUCAUCUU C CAAGÜUUUG UGCUC CC CUUUACCUAAC G CTJUC CUGC C UCCCAUG CAUCPGUACUCCUCC
>EB
GCCUUGGGUC CUCCAGOAAQ3 CUCAGGAGCCCUACOJCCCUGCCAUUAUAGCUGCü CCCC OCCaGAAiSCCUGGGCCAACÜCUCUGCAUUCCCUGAÜCUCCAUCCCUGUGGCUGUCACCCTJ uggqcacct jcotüQCugucacuGCgaucücc ccccugc coguccucaccaagaCügagug CCTJBCUG CUUÜGCCJACUGC C03QGC CCAUGAGACUG ACUTjCCCAOJG GUCDG CCUGC CUC UC CCCACUG CA CUGGCACAGCCCCG CCUUGCCGCUG CUGAUCCAUUGCOGGUGUGACC
>ED
a CCUÜGGCUCCUC CAGGAAGG C UCAGGAG CC CÜAC CU C CC UG C CAUUAUAGCUGCUC CCC QOCftGAASCCUGUG CCAACUCUCÜGCAUUCOCUGAUCUCCAUC COJG UGG CUGUCAC CCU UGGUUAC CUCCGGGCTJGUCACT ÍGCCAUCUCCC CCCUUCCftOCCAGACACC CGCCCCCCGG ce CtíGGCUAAGAAGUUGCUUCCUGUUG ce AGCAUGACCUACCCUOGCCUC UU UG AUC CCA U C C G CUGC CACCUCC UUTT UGCUCCUGGAC CC UTJUAGC CUCUCUG CC CUTJC CAC ÍJCTTOJGA CCCC
>EE
GCG UUGG Cu CCUCCAGGAAGGCUCAGGAGCCC'L-ACCUCC OTGCCAUUAUAjGCTJGCUOCCC GCCAGAAGCCUGUGCCAACLÍCUCUGCAUUCCCUGAUCL’CCAUCCCUGUGGCUGUCACCCU UGGUCAC C UCCGUG C TJGUCACOGC CAUCUC C CC CC G CCUJGO CUCCUC CAGGAAGG CUCA
g g a g c c c u a c c u c c c ijg c c a ü u a la g c u g c c c c c c g c c a g a a g c c u g ijg c c a a c u c u c u g CAUl’C CCUGAUCL’C CAUCC CUGUGGCUGUCACCCUUGGUCACCUCCGUGCUGUCAC'JGC C ADCUCCOCCC
>EF
GCCUUGG CUCCUCCAGGAAGG CUCAGGAG CCCUACCUCC CUGCCAÜUAIJAGCUGCUCCCC
GCCAGAAGCCUG UG CCAACUCUCUGCAUUCCCUGAUCUC CAÜCCCDGUGGCUGUC ACCCU
TJGGUCACCT JC CGUGCUGUCAC OGC CAUCUCCCCCC CU9G0ACUGCAUGCAC GCAAUG COA
GCUGCCC CUUUCCOGtlCCCJGGGUACCCCGAGÜC U CCCCCGACCUCGGGUC CCA3GUAUGC UCCCACCUCCACa TG C CCCACUCACCACa JCUGCOftGW TCCAGACACCUCC
>EG
> G CCUUGG CUC CÜC CAGGAAG GCTJ CAGGAG CC CÜACCÜC CCUGC CAUUAUAG CUGCTJCCC
OGCCAGAAGCCUGUG C CAACUOJCUGCAUUCC CUGAUCUCCAUCC CUGUGG CUGÜCACCC
: n ;gg: jcaccüccgug cuguc aci i c. ccaucuc cc ccc cugacagoguggg caacgccugcc
G C CUGCUCU3AGGC CC GAUCCAGGO GGCAOGC CAAGG CCTJG CUGGG CCC CCGOGGACCCA
GGUGCUC DGGGÜCACGGTJC C03GUCC CCGCACCCCCG CUUCIJGIJCTJGC C C CATIUGUOGC U
C CUCAGGCTX3UCUCC CCOGCOCUC CCACOJCOACCUCCAC CCCCAC
>EhBg
GCCUUGGCUCCUCCAGGAAGG CUCAGGAGCCCUAC CUCtCUGCCAUUAUAGCUGCUCCCC
GCCAGAAGCOTGUGCCAACUCUCUGCAUUCCCUGAUCUCCAU'CCCUGUGGCUGUCACCCU
(A^UCACCUCCGUGCUGUCACUGCCAUCUCGCKCCQ^GAeCDC&CUUUCtlUGCUGlJCCAA
UUUC UAUUAAAGGUUCCUUUGUUCCCUAACTJCCAACUACUAAAC ÜGGG SGAL'AU'J AUG AA
GGG CCTJÜGAGCAl JCUGGñUUCTXKCCBlAUAAAAAACñüDUAUüT: TUCAUUG CUGGGTJC
>EI
G CCÜ D Q G CU CC L’C C A&GAAGGCUCAGGAGCC CUACC1JC CCTJG CCAUÜAUAGCUGCUCCCC
GC5CAÍ3AJW3CCUGUGGCAAaJCUCUGCAUUCCCUGAUCUCGAUCCCUGUOaCUGUCAOC5CU L'GGUCACCQCCGUGCUGVCACUGCCAUCtJCCCCCCCAAGClACGCAGCAAUGCAGCUCAAA
ACGCUUAG CCUAGCCACACC C C CACGGGAAACAGCAGUGAUUAACCÜUUAGCAAÜAAACG
AAAGUUUAACUAAGCUAUACT TAACCCCAGGGUUGGI JCAAUUUCGTJGCCAGCCACACC
>EJ
GCCTJUOGCUCCU CCAGGAAGGCUCAGG AjGCCCUACCUCCCUGCCAUÜ AUAG CUGCUCCCC GCCMSftAGGCUGUGCGAACUCUCUGC AUÜCCCUGAUCUCCA1 JCCCUGUGGCUGUCA CC CU □g g u c a c c u o c g u g c d ü u g a c u g c c a u c g c c c c CCGu g u g c a g g a u g a a a c a c u ijc c c c c CUUGGCÍ TCUC AU1JCUUCC ACAAG A<3 AGAC CT JUUCUC CGGACCUGG LfUGCU ACUGGUUCAG CAACUCUGCAGAAAAUGÜGCUCGCCUGnGGCUGCCUCAGCGCAUGCGUGUGGGCGGAAGU
C C C AGCAUUG AUGGC AGCCCCUC ALICUÜCCAAGUU J LG UGCUC CC CUDUACC UAACG CÜU
c a JGCCÜCOC AUGC AUCUGUACTJCCUC C
>FB
CUgGÜACUGCa UGC^CGCAACJGCUAGCüGCCCCUUTJCCCGu CCUGgGUACCCcGAGu Cu C C C C CGAC CUCGGGUC CC AGGUAUGCUC CCACC DCGACCU'GCCCCACDCACGACCU CUGC U AGTJTJCCAGAGACCUCCTÍGCCGGUCCUCACCAAGñJCUGACUGCCUGCUGCUUUGCtmCUGC COSGGCCCRDGftGACUGACUDCCCACUGCUCUGCC UG CeLTCUCCCCACUGCACUGGCACA GCCC C CC CUUGC COCUGCUGAUC CAUTJGC CGGUGUG&C C
>FD
CuGGÜACUeCAUGCACxSCAAuGCUAGCuGCCCCmttJC0C£UCCUGGGUACcCCGAGUCIJC CDCCGACCIJCGGGUCCCAGGUAUGCUCCCACCUCCAOCEJGCCCCAOTCACCACCUCUGCU AG^CtAGACACCaCCUUeCAGCtAGACACCCGCCCCCCGGCCCCIGGCLrAAGAAjCmJGCU U CCTJOTUG C CAG CAOGAC CUACCCUCG CCUClimJGADGCCAUC COCUG CCACCUGC ÍJUUU 3 CU C CÜGGACCCUUUAG C CÜCUCU3 CC CÜUC CACÜCUCUGACC CC
>FE
CUGOTACUGCAÜGCACG CAAUGCUAG CUGCCC CTJUTJCC CG U C CUGGGUAC CCCGAGUCÜC C C CC GAC C U C GG GUC CCAGGUAUGCUC C CA C CUC CAC C UG C COCA CUCA C CACCUCTJG C U AGUUCCAGAíacCUCCGCCíJUGGCtJCtUtdAGGAAC-GCUCAGGAGCC’CUACCÍJCtCUGCC AUUAUAG CUGCUCCCCGCCAGAAGCCTJGU 3 CCAACUCUCUGC AUU CCOJGAUCUCCAUCC CDGU GGCÜGUCACCCUDGGüCA C CUC CG UG CUG U CACUG CCAÜCUC CC CC C
>FF
C TJGG UA C TJG CAIJQCACGCAAUGC UAG CUGCC CC UUTJ CCCGUC CTJGGGTJAC CCCGAGUCUC CCCCGACCUCGGGUCCCñJSGDAUGCUCCCñCCUCCACCUGCCCCACUCaCCACCUCTIGCU a g ug ccag a Ca c Cu c c CuGg u a c u g Ga u g c a c g c a a u g c u a Gcug C C Í CTXjuOCCGijo c u GGGUAC CC CGAGUCUCC CCCGACC UCGG3 UCC CAGGU AUGCUCCCACC'J CCACCUGCCCC ACÜCACCAC CüCUG CUAGUUCCAGACAC cuc c
>FG
CUGGUACUGCAUGCACGCAAUGCttAGCUGCCCCULJLrCCCGUCCUGGGUACCCCGAGUCTjC C C C CGACCUCGGGU CC CAGGDAUG C U C CGAC CUC CAC CUGC CC CACUCAC CAC C U CTFG C U AGIIUCCAGACACCUCCCDGACAGCGüOGGCAACGCCDGCCGCCDiGCUCUGAaGCOCGADC CAGUGGGCAGGCCAAGGCCUG CU3GG C CC CCG CGGAC CC AGGUGCUCUGGGUCACGGrJCC CJGUCCCCGCACCC CCGCUUC UGUCGG CC CCATTUGUGGCTJCCUC ASG CUCUCUCC C CUGC UGUC C CACCUC UAC C UCCAC CCC CAC
>FhBg
CUGGÜACUGCAtTO CACGCAAUG CUAGCUG CCCClJLTUCCCGUCCÜGGGTJACCCCGAC DCUC C CCCGACCU CGGGUCOCAQGUMJGCUCOCRCCUCCACC UGCC CCACUCACCACCÜCUGCU AGUUCCAGACAC C U C cmGAGCUCGCUUU CUUGCUG U CCAAT.nXJ<^0?iUUAAAGGUUC COT UGL:GL’CCUAA3UCCAACL1ACUAAAC TJG3GGGAUAU U ADGAAGGGCCÜ UGAGCAUCDSOAU UCOGCCUAAUAAftAAACMXniAIJIJUUCAUUGCUGaSUC
>FI
CUGGUACUGCAUGCACGCAAUG CUASCUGGCCGUU UCGGGUC CUGGGU ACCCCGAÜüCUC CCCCGACCUCGGGUCCCAiGGURÜGCÜCCCACCUCCACCaGCCCCACUCACCACGüaJSCU AGUUC CAGACACCUCC CAAGCAC 3 CAG CAAU3 CAG CIJCAAAACGCUUAG CC UAG C CACAO CC C’CACGGGAAACAG CAGÜG AUÜAACCUUUAGCAAUAAACGAAAGUUUAACUAAG CüAUA CUBUUCCC CAGGGUUGGUC3UUJIJUCGIA3CCJU3CGACACC
>FJ
CUGGCa CuGCATKCa CGCAAUG CUAG C 33 CC C CUUU C CC GUCC UGGGUACC C CGAG UC üC CCCCGAC CUCGGGUCOCASGUAUOCUCOCAG CUCCACC UGC CCCACTJC&C CACCUCUSCU AGUUCCAGACACCUCCCUIA TGCAGGAUG AAACACUUCG CCGCtJUGGCUCt JCAUUCUl ;CCA CAAGaGAGACC üüUCUCGÜ GACCÜGGUÜG CUACU GG TXTCAG CAACUCUGCAGAAAAU Gü C C7.TCCC 2 UGUGG CUGCCTJCSQCUCflUG C a 7UUGGC CUG AñGUCCCAGCAUUGAüGGC AGCC
CaKAUaJUCCAAGUÜUUGÜOCUCCCCUUUACCnAJLCGCUTJCCUOCCUCCCAUGCADCUG UACUCCUCC
>GE
CUGACAGGGL'GGGGAACGCCÜGCCGCGUGCUC-JGAiGGCCCGAUCCAGUGGGCAjGGCGAAjG G C CU G CÜGGGCC CC CGCGGAC C CA'GG TJGC U C UG3 GUCAC GGUC C CTG U CC CCGCftCCCC C G rwcUGUCUGCC GCAO ]L-I JGGCUC CUCAGGCUCU CGCCCCU3CUCUCCCAC CUOTACCU CCACCCLTACTJGCCOGUGCUCACCAAGACHGACIJGCC-JG'CUGCUUUGCTJACUGCCCGGGC C3CAUGAG. ACUGACUUCCCACUGCU CUGCCUGCC L'CUCC CCACUGCACUGGCACAGC CCC'G CCUUGCCGGUGCUGAUCCñDUGCCGGUGUGACC
>GD
CUGACA3 L’G UGGGCAAGGC CUGC CGCCUGCUCUGAGGCCCGAUCCAGUGGGCAGGCC AAG GCCUGCUGGGCCCCCG CGGAC CCAGGUG CTJCUC-GG U CACGGUCC CUGUC C C CG CACO CC C G CUÜCUGU CUG CC C CA( JIIGUGGCI JCCUCftGGCTJCU CÜCCCCOGCÜCUCCC&CCUCCACCU CGAC CCC CACUUCCAGCCAGACACCCG CCCCCCGGCCCUGGCUAAGAAGUUaCUUCCtíGTJ ■Jg CCAGCAGGACC'JACCCUCGCCUCUUuGAUGGCAUCCGC ugccaccucc ü j uugcuccu GG AC CCUUUAGCCUCÜCUGCCCT JUCCñ CUCUCUGA CCC C
>GE
ajGACAGCGUGGGCAACGCCUGCCGCCUGCUCUGAGGCCCGAUCCAGUGGGCAGGCCAAG
GCCTJGCUGGGCCCCCGCGGACCCAGGUGCUCT IGGGUC ACGGUC CCUGUCG CCGCAC CCCC
□ CTOCGCT.TCUGCCCCAT JUCUGGCUCCUC AGGCUCUCaCCC CT3GCUCUCCC AOCUCUAOCU
CCACCC GCACGCCUTJGÜCUCCGCCAGGAAGG CUCAGGAG CG CUACO UC CCÜGC CATJUAUA
G CUGCG GÍG’CJ c g c c a g a a g c c u q u g c c a a c u c u c ug cautf c c c ü g a u c u c CATJ c c c u g u o g CTJGUCACCCÜUGGUCACCUCCGÜGCTX3UCACT JGCCMJCUCCCC CC
>GF
CuGAcAGCGUGGGCAACGCCUkGCCGCtaGCUC’JGAGGCCCGAlFCCAGUGGGCAjGGCCAAG
GCC CGCUGGGC CCCOGOGGACCCA0GUG CUCUGGGD CACGGUCC CUGUCC CCGCACCCCC
GCUU GUGUCUGCCCCATFJGT TGGC: JCCUCAGGCU^UCUCCCCUGCI } OJC C CACCUCUAC c u CCACCCCCACCUGGUACUGCAUGCACG CRAUGCTJAGCUaCCCCDUÜCC L’GI ;c c u g g g u a c
C GCGAGUCUCC CCCGAC CUCGGGUCCCAGGUA'JGCUCCCAC CUCCACCTJGCC CCACÜCAC
C ACCUGUGCUAGUUC C AGACACCI ICC
*GG
CUGACAGCGUGGGCAACGCCUGCGGOCUGCUCUGAGGCCCGAUCCAGUGGGCAGGCCAAG
GCCUGCUGGG CC CCCGCGGACCCAGGUGCUCUGGGUCACGGI JCGCUGUCC CCGCACCCCC
g c u u c u g u Cü c c c g c a u ü ü u g g c u c c u c a g g c u c u c ü c c c c ü g c u c ü c c c a c c u c u a c c u
CCACC C CCAî CUGAGAGC GTJGGGCAAGGCOT G C CGC CUG CUC TJGAGG C CCGAUC CAGUGG
GCAGG GCAAGGCCTTG CTIGGGC CCCCQCGGACCC AGGUG CUCTJGGGUCACGGU CC CUGUC C
CGg CAGCCCCGCUUCUGUCUGGC CC A'J UG DQGGUCCTICftflaCÜCUCÜCCCCDGC UCÜCcC ACCUCUAC CTJC CAC C CCC AC
>GhBg
CUGACACCGUCGCCAACGCCUCCCGCCUGCCJCUGAGGC COGAUCCAGUGGGC AGGCCflAG
3 CCTJGCUGGGCCCCCGCGGACCCAGGUGCUCUGGGUCACGGUCCCUGUCCCCGCACCCCC
C- GUI ICUGUCUGC CC CAUUG UOG C U CCUCAGGC U C U CUC CCCUGCUCUCCCAC CUCUACCU
CGACCCCCACtJAGAGCTJCGCUUUCTJUGCTGOCCAñüUÜCtrAlin&AAOauuCCtAJUGUUCC
CUAAGUCCAACGACUAAACUGGGGGAUAUUAUG AAGGG CCC'JGAG CAUCUGGAUUCUGCC
UAAUAAAAAACAUUUAÜX JUUCAUUGCUGCGUC
>GI
CUGACAGCGUGGGCAACGCCUGCCGCCUGCIJCIJGAjGGCCGSAIJCCAjGUÍÍGGCAjK í CCAAG GCCUSOJGGC-C CCCCG CGG ACCCAGGUGCUC L’G GC-UCACGGUOCCUGUCC CCGCACCCC C OCUUC¡JGUCUGCCCCftilW3ÜGGCUCCUCAiaGCÜCUCUCCCCUGCÜCUOGCftCCÜCUfl.CCÜ CCACCCCCACCAAGCA'CGCAGCAAUGCAGCU CAAAACG C tJUAGC CUAGC CACAC CCC CAC GGGAAACAGCAGUGAUUAACCUIWAGCAAUAAACGAAAGUUUAACL’AAGCUAUA<IL-AACC CCJWGCKJUUGOTCAAUUUCGUGCCflSOCACACC
»GJ
CUGACAGCGUGGGCAAOGCClWCCGCCUGCUCtKSAGÍJCCCGAUCCAGUGGGCAGGCCAAG GCCUGCÜGaGCCCCOGOGGACCCAGGUGCUCUGGGUCACGGUCCCUGITCCCCGCAGCCCC GCmCGOUCUGCCCCATOGUGGCüCOTCAGGCUCtJCtrGCCCTOCÜCüCÚCACCU'GUñCCU CCACC C C CAC CTJTJ Tj G CAJGGAtJ GAAA CACUU C C C C G C [TUGG CU C U CAItti CUU C CACAR GAG AGAC CCU’JCUCCGGACCUGGUUGCUACUGGUUCAG CAACUCUGCASAAAAUGUCCUCCCC UGUGGCÜG C CUCAG CUCAUQCC UUUGGCCÜGAAGUC CChGCAUUGAUGGCAQCCCCUCAU G GJ CGAAGt-'J U'J GIIC CGL’OCaAJUACCGfAACGCUJ CCUGGCUCCCAUGC AU G'JGUACUCC UCC
>hBgB
GAG&GCnOGCUUUCTJUGCUGUCCAAUtJ-CCUAUÍJAAAGG ü TJCCUUUG UUCC CUAAGUC CAA CUACDAAAC UGG GG GA UAUUAUGAAGG G C CUU GAGCAUCÜG GAUU CUG C C UAAUAAAAAA CAUIttJAUutjH GAUUQ CDGCGU CUGC CCGUCCUCAGCAAGAC UQACUGC CUGC UG CUUUG C UACUGCCCGGGCCCAÜGAGACUQACUUC CCAC UGCUC 1X3 C C UGC CUCUCC GCACUGCACU GGCACAGCC C CGCC UUG CCGCUG CHUGAUCCAUUUCC G ÜJGUGAC C
>hBgD
G AGAGCTJOGCUUUCTJüGCUGUCCAA'J UUCUATJUAMOGUUCCU L'UG'JUCCCUAAGUCCAA COACUAAA C UGGGGGA UAUUAUGAAGGG C OTO GAGCAU C UG GAIJUCUG C C UAAUAAAAAA CAÍJUUAUIIUUGACJUGCtJGCautruUCGAGGCAC-ACACCCGCCCCCCtMCCCtJGGCUAAGAA GUUGCmiCCUGUUGCCAGCAUGACCUAGOCUCGCCUCmJUGaüGCCAUCCGCTIGCCAiCCD C c:n JTrJGOTCCUGGACCCUGTJAGC GGCUCUG GCCtrucCACUCUCUGACCCC
>hBgE
C AGAGtuOGCUUUtfJUGCUGUCCAAUU UC LAUUAaACüJ TJlCUUTJG UU CC CUAAGtTGCAA CUACUAAA C GGGGGGAUAUUAUGAAGGG CC UUGAG CAU C ÜGGAUTJ CUGC CÜAAUAAAAAA
caguüauijuücaüugcikggucg cc uuggcuc cuc caggaagg cucaggagc ccuac cuc CCUGC CAUUAUSGCUGCUCCCCGCCAGAAGCCU3ÜGCCAACUCUCWGCAUUCCOJGAUCU CCAUGCGT.TGI JGGCÜGUCACCCUUGGUGAJC CU CCGUGCT IGUCACUGCCAI ¡ a ICC CCCC >hBgF
GAGAGCUOGCUUU CUUGCUü J GCAAUÜUCUAmJAAAGGUUCC u U Ü GUÍTCCCllAASUCCAA COAC UAAAC UG3íK jGADAUUAUij AAG<3GC OTW5AGCAUOT3GAUU CT7G C COAAUAAAAAA CAUUUAUmTUGAUUGGUGCGUGCUGtíUACGGCAUGCACG QAAUGCUAGCUGCC CCUUUCG CGUCOIGGGUACCCCGAiGUCUCOTCQaACCUOaGGtJCCCAjGGUAUGCU'CCGAOCUCCaCC UGCCC CACffCñCCACCUCDGCUftEUUCGAfiACACCl :CC
>hBgG
GAGAGCUCG CUTJU C UUG CÜG UC CAAUmJCÜAUUAAAGG UUCCTJUDG T.TUCCCUAAGDCCAA CTACUAAJ^EraWGGJHIADUAUQAAiQGGCCOOSfcGCAUCTIGGAUUCUGCCTBUtflWUUlAA CAUUUAUÜUrjCñUTJGCGGCGUCCUGACAGCGtTGGGCAAOGCCUGCCGGCUGCUCyGAGGC CCGAUCCAGUGGGCAGGCGAAGGCCIj G CIÍGGG CCCOCGCGC3 AC CCñGGOG CUC UGC-Ü UCA CGGUC CCUGU GGCCGCACCCCOGGUUGUGUCUGCCCCAUUGUGGOJCCUCAiGGCU CUCUC C GCTTG CI JCUCCCACCUCUflCCUCCACCC CCAC
>hBghBg
GAGAGC jo g g u u u c u u g c u g u c g /^ - ju ü c u a u u a a a g g u u o c ü -j u g u u c c c iía a g u c c a a CÜSlC UAAAC UG<3 QGGAraUUAUGAAGGG-C CUUGAGCAÜCDGG3UJU C U G C CTJAAUAAAAAA CAUUUAUU UL'G AUUGCUGCG'JCGAGAjGCUOGCUUUG'J L'G CU3UGCAAUUU GUAUUAAAjGG ■JIJCGUUUGUUCCCTJ AAGUCCAACUACUAAACUGGGQGAUAUUAUGAAGGGGC UTTGAGCAU OJGGAUTjaJGCCüAAUAAñAñACAXJUmUUUUCAUUGCUGaiUC
>hBgl
GAGAGCUCGCUUUCUUGCUGUCCAAU U UCÜAtTUAAAGGGUCC'JUUGUUCC CUAAGÜCC AA CU AOTAAACUGGGGG AUAUI: AÜGAAGGG HTGAGGAGC UGGA-HTC UGGaJAAlj AAAAAA CAUUUAUUÜUCAGUGC GGCGUCCAAGCACC CAGCAADGCAGClTCAAAAGG CTJUAG CCUAG C CACAOC C C CAC GGGAAACAGCAGUGAUUAAC CUUUAG CAAUAAA. CGAAAGTJUIJAACUAA GGTTAUACUAACCCCñGGGUUGGTJCAAUUUCGUGCCAGCCACACC
>hBgJ
GAGAGCUGGCUUUCüÜGCUGUCCAAUUUCÜAUUAAAGGuUCCUUUGQÜCCCUAAGUCCAA CUACUAAACIX3GGGG ADAUUAÜGAAGGGCC l JGGAGCAUCUGGAUI :CUG CCTJAAU AAAAAA CAUUUAUUUUCAUGGCUGGGUCCUUUGCAGGAUGAAACACUUCCCCGCUIlGGCUCUCAtTU CUUCCACAAGAGAGACCUUUCUCCCtGAOCUGGUUGCUACUGGTTUCAGCAACUCUGCAGAA AAIJGUCriJCCCCUGT TGGCUGCCUCñG G7IC AUGCCinrJGGCCUGAAGÜCCCAGG AUUGAUG GCAGCCCGU CAUCUIi L’CAAGUUUIJGUGCaCCCC L’J ÜACCUAACG G-JUCL’tíGCCUCCCAUG CAUCOGüACUCCUCC
CAAG CAC5 CAOÍ^iAUaCAG CUCAAAACOCUTJAG C C UAGCCACAC C CCCACGGGAAACAG C
AGUGALFUAACCUÜUAG CAAUAAACGAAAGUUUAA CUAAG CUAUA CUAAC CC CAGGGUUGG
ÜCAAnuUC*3l*X!CMCC&CACCUGCC0GuccÜCA£CAAGftCW^CTXX!CU3CÜGÍtnjuiGC UACUOOCXXKGCCCMJGÍWSACUlGACUOCCCACUGClJCUGCCUGCCUCIJCCCCACOGCftCU GGCAC^CCCCCtCCUUGCCGCITCCUGAÜCCAUTIGCCGGUGUGACC
>D
CAAGCACGCAfíCAAtraCAGC U GAAAACGCDTJAG C C UAG C CACACC CCCAOGGGAAACAG C AGCTGftilUAACClXTUMCAftilAAAOSiñJKDUUAACÜAAGaiADACUAACCCCftGGGUUGG ÜCAAUmjCGTJGCCAGCCAGñCCÜUCCAÜCCñGACACCOíJCCCCCCGGCCCUGGCT^AAGAA GUOGCUUCCUGOUaOCaGCAUGACCUACOCUCGCCUCUUUGMJGCCRÜCCGCaaCCACCU cc :u : JT GIGCUCCUGGACC GTH JUAGC CUCUCUG CCCirJCCAOTCUCUGACCCC
>IE
C AAGC ACGCAGC AALG CAGC-J CAAAa CGCUUAGCC-Ja G CCACACCCCCAc GGGAAACAGC
AGUGALTJAACCUUUAGCAAUAAACGAAAGUUUAACWWSCCAWCUAACCCCAGGGUUSG
(JCAAÜUGCGLJGC CAGC C ACAC OGCCÜUGGCEJCC UCC AGGAAGGCUCAGGAGCCCUAC CUC
CCÜG OCAUUAUAia CC3CU CCCCG CCAGAASC CiJGUGCCMGÜ CUCUGCROUCCCIHAUCU CCñUCCCUGUGGCÜGUCACCCUUGGUCACaJCCGUGCUGUCACUGOCAUCUCCCCCC
>IF
CAAGCACC-CAGtAAUGCAGCfJGAAAACGCUUAjGCCUAfiCCACAOCCCCAGGGGAAACAjGC AGUGAÜUAACCI.TUUAGCWUJAAACGftñAGUUUAACOAñGCtlAUflCQAAOCOCASGGUUGG
u c a a u u u o c u g c c a g c c a c ac c c u g g u a c u g c a u ü c ac g c aa u g c u a g c u g c c c c u tjg c c CGU CCTJGGGUACCCOQftG L’CUCCCCCGACOJCGGG 'J CCCAGGUA [JGCUC CCftC O J CCACC UGCCCCACTJCACCACCUGUGCÜAQUUOCAGñCACCUCC
»IG
CAAGC ACGCAGC AAUG CAGCUCAAAACGCmJAGC C'JAGCCACACCCCC ACGGGAAACAGC
AGUGAUUAAC CUTJIIAGCñADAAACGAAAGUUUAACDAAGCUAOACUAAC CC CAG GGUUGG
tfC^ÜUUCGUGC CAG C CACAC C CTGACAG CGTOGG CAñCG C CUGC CG CCUGCUC OGAíCG C CCGAUCCAGUÜGGCAGGC^AAGGCCLrGCUGGGCCCCCGCGGACCCAGGUGCUCGGGGUCA
CGGU CC CUGUCCC CGCAOCCCGGC GUC UGUCTJGCC CCAULTG UGGCUCCUCAGGCUCOC UC
CCCUGCUCUCCCACCTJCUACCUCCACCQCCAC
>lh3g
CAAGCACGCAGCAAUGCAGCUCAAAACGCUUAGCCUAGCCACACCCCCACGGGAAACAGC
AGUGAUUAAC CIKJUAG CG^IIAAACGAAAGUUUAACUAAC C UAUACUAAC C CCAGGGUUGG
ÜCAAUUUCGUGC CAGC CACAC CGAGAG CUCG CUUUOTDG CUG QCCAAUUUcuatjuaaagg UUCCUUtjGUUC C CUAAGUC CAACUACUAAAC UG G GG GAUAUÜAUGAAGGG CCUUGAG CAU CUCXj AUUCUG C CUAAUAAAAAACAUUUAUUUU CAÜUGCüG C GÜC
>11
CAAGCACGCAGCAAGGCAGCUCAAAACGCUUAGCCUAGCCACACCCCCACGGGAAACAGC
ACTGAmiAACOJUU70^AAnAAACGAAAGUUUAACUAAG CUACA CUAAC C C CAGGGUT JGG UCAAtJUUCGGGCCAGCCACACCCAAGCACaCAGCAAUGCAGCUCAAAAGGCUL’AiGCCUAG C CACAC CC C CACGGOAAACAG CAGUGAUUAAC CUU UAGCAAU AAACtí AAAGDUÜAACU AA G CUAUACOAAC CCCAGGOUIXXJUCAAUÜUC GUGCCAG- CCACACG
>U
CAAGCACGCAGCAAUG CAGCUCAAAACG CUUAGC CUAGC CACAC C C C CAC GGGAAACAG C
AGUGALITIAACGICn: AGC AAUAAACGAAAGUUU AACUAAGCUAUACUA ACC CCAGGGI, JUQG ÜCAAUIÍUCGOGCCAGCCACACCGUUUG CAGGAUGAAACACUUCCtCG CUUQOOTCLTCAÜÜ
C UUC CACAAGAGAGAC CUOU CU C C GGACCUGGULXACUACUGGUU CAG CAACUCUGCAGAA
aaugcjc ct ic c c c u g u e g c u g c c u c a g c u c a u g c c u u u g g c c u g a a g u c c c a g c AOIGAUG GCAGCCcCuCAUCUUCCAAGüUÜUGUGGUCCCCuUUACCuAACGCuucchgoccjcccaug CAUCUGUACUCCUCC
>JB
CU UUGCAGGAUGAAACACUUC’CCCGCUUGGCUCUCAUUCTJUCCACAAGAGAGAC CUÜUCTJ
C CGGAC CUGGUUGCUA CUG GUU CASCAACU C13GCAGAAAÍJJG U C CUC C CCUGTJGC GT JGC C
u c ag C'j caug c cu iiu g g ccu g a a gu g cc a g c a u u g a u g g c a ü c c c c u c a g c u l:c caag uu
UUGÜGCUCCCCUUUACCUAACGCUUCCÜGCCUCCCAUGCAUCUGUACUCCUCCUGCCCGU
CCUCACC^CACUnACTJGCCUGCUGCUUUGCUACUGCCCGGGCCCAUGA-GACUGACUUCC CAGUG C'J CuGCC UG CCÜC L’CCCCAGUGG ACUGg Ca Ca GGCCc G CCÜUG CCGCuC CUG AUC CAUT JGCCGGT TQUGACC
>JD
CUUUG CAÜ GA Ü GAAACAC U D r C C CGCmJGG CUCÜCAUU CVU C CACAAGAGAGAC CUUTJ C U
C CGGAC CTJGGOTGCÜACUGG1JU CAGCAACUC EJGCAGAAAAUGUC CUCC C C UG U GG CDGC C
UCAGC UCAUG CCt JUÜG GCClXiAAaUCCCAG CAUUGAÍJGGCAGeCCClTC AUCUUC CAA3UU UUGUG CUCCC CUUUAOCUAACGCUU CCCTSCCUCCCRÜGCAUC ÜGUACÜCCUCCUUCCAflC caqacacgcGCCccccGgc c cuse? cu aagaajgijitgit.iucci :gui:gccagc augaccuacc
C UCG CC GCUUUGAUG C CAUCCT3 CTJGC CAC CU C C UUUUGCUC CUGGAC CCUUÜAGC CUCUC
UGC C C UUCCACUC U CTJGAC CC C
>JE
C UUUGCAOGAUGAAAGACUIJ CCCCGCUU&GCUCUCAUUCUUCCLACAAGAG AGACC’J UUCU
C CGGAC CUGGUUG CUA C ÜGGUU CAGCAACUCUGCAGAAAADUUC CUC C C CU CU GG CUGC C
UCAÜCUCAUG CCULTJGCCCUGAAGUCCCAG CAGUGAUGGCAGCCCCUCAUCUUCCAAGUU
uugugcuccccuot taccitaacgctjuccugc cu c c CAUGCAUCUGDACUC CUC CGCCUUOG c u c cuc caggaaggcucaggagccCUACCUCcc u g cCAUUAUA3cugcu cc cugc caga a GCCUG UGC CAA CTJCU CTJGCATJUC C CT3GAUCUCCAUC CCUGtJGOCUGUCAC C CTJUGG TI CAC OTCOGUGCUGUCfljCTJGCCflDCUCCOCCC
>JF
C GU1JGCAGGAUGAAACACUU CCCCGCUTJGG CUCUCAUU CUUC CACAAGA.GAGAC C UÜUCU
C CGGA C CUGG UTJG CUAC UGGUUCAG CAA CUCTJGCAGAAAAUGUC CUCCC CUGGGG CUG C C
ucagcucaugccuuuggccugaagucccagcauugauggcagccccucauctjuccaaguu
u u g u g c u g c c c u u u a c c -ja a c g c u u c c t jg c c u c c c a u g c a u c u g u a c u c c t íc c c u g g íja c
UGCAUGCA CG CAAUG C UASCOGCCCCTÍUDCCCGUCOJOSGOACCC CGAGUCUCCC CCGAC
CUCGGGUCC CAGGUAUGCUC CCAC OTCCAjCCUGCGCCACUCAOCACCUCÜGCURGUUC CA GACACCUCC
>JG
CTIUUGCAJGGAUGAAACACUL'CCCC&GUUGGCUCU CAUUCUU GCACAAjGAGA&AC CUUUCU
COGGACCUGGUUGCUACU<KUUCAGCAACUCUGCAGAAAAUGUCCL)CCCCUGUGGCUGCC
UCAGCUCAUG CC UUUGGCCUGAñSUCCCñGCAWGAUGGCñOCC C CUCAU CUUCCAAGUU
UUGÜG CUCCC CUUUACC UAACGC tJUC CTJG C CUCO CAUGCAUCUGGAC UC CÜCC CÜGACA3
CGUGGGCAACG CCUGCCGC CUGCUCUGJWSGCCGGAU CCAG UGGGCAGGCCAAGGC CTG C U
GGGCCCCCGCGG AC CakGOUGCUCU'^GGÜCACGGÜC CCUGÜCCCCGGACGCC CSC. JT JCT JG ■JCXIG CCCCAUUG USG CUC CUCAflflCÜ CUCUCCCCÍIGCUCUCCCAC GÜCTJACCUCCACCCC CAC
>JhBg
emraGCAjOGñUGAAAGACUUCCCCGCtJLlGG CUCGCAUUC L^CCACAAGAGAGACCCJUUCÍJ CCGGAC C ü GGDUG CUACUGGUUC AC CAACLT CUGCAGAAAAUGUCC'J CCCCUGOaGCOGCC
UCAG CUCAUGC CUUUGGCCUGAASÜCCCAG CAW JGAUGGCAGCCC OJCAU CUDCCAAGUU
DOSUGCUC CCCUUUACCUAACGCT7UCCUGC CU C CCAUOCAU CUGUA CUC CUC CGAGAG C U
CG CUUUCtnjG CUC UCCAAUIIUCUAUUAÍAGGUUCCTJUUGDU r C CUAAGTJCCAACUACUAA ACDaGQQGftilAUUAUGAAGGG C G TJUGAG CALT C UGGAU TJCUG C CUAAUAAAAAACAÜUUALT
u u u c a ; jt.tg c u g c g u c
>JI
CUUUGCAjGGAüGAAACa CUUCCCGGCUUGGCÜCUCAGÜCLJUCCACAaGAGAíSÁCCUUUCU
C C GGACCUGGÜDGC1JACU&GUUCAG CAAC U C TOCAGAAAAUGUC CU C C CC UGUGGCUGCC
tJCAGCUGAUG CCVUUGCC CGGAAG U C C CAGCAUUGAUG GCAGCC C CUCAUCUUCCAAGUtJ UUGUGCUCCCOTJUACCQAACGCUli COJGCC J CCCAÜGGADC UGÜACTJCC U C CCAAG CAC GCAGCAAUGCA3CUCAAAA CGC CJtmGC CUAG C CACACCC CCACGGGAAACAG cao ugauu AAOTJUUAG CAAUAAA CGAAAGUtJUAA iGUAAGCUAUACÜAACC CCAG GGUUGGIX:AAUUU C3UGCCAGCCACACC
>JJ
CUUUGCAGG AUG AAACACUTICCCCGCUUGGG-J CU CAUUCUUC CACAAGAGAGACCUÜ TJC U
CCGGACCUGGU UGC CACUGG-JUCAGC AACUC UGCAGAAAAUGUC CUCCC CUGUGGOJGCC
:.TCAGCUCACTGCGUUUGGCCUGAAGCrGCCAGCATr.J'jAUGGCAGCCCCUCAU'GUUCCAAGUU UUGUGCU CCC COUUACCUAACGCTJLT CCUGC CrJ CCCAUGC AUCUGUACUCCEJCOCTJUUGCA GGAUGAAACA GUI 7C CCCGCUT IGGCUCUCAUUCITj CCACAAGAOAG ACCUIT JCÜCCGGACC
UGGU U GCU ACU GGU U CAGCAACU CU GCAGAAAAU GU C CUC GCGÍ IG :t g g c u G CCU C A G CU C AUGC CÜUUGGC CUGAñGUCC ca g c a u d g a d g g c a g c c c c u c a u c u u c c a a g u u u u gug cu c c c c ü u u a c c u a a g g c u u c c u g c c u c c c a u g c a u c u g u a c u c c u c c
> FI UTR 97,5 % de homología (modificaciones aleatorias)
OJGG'JACUGCAUGGACGCAACíGCUAGCUGCGCGUUUCCCGGCCUGGGUACGCCGAjGUCAG C C CCGACCUCGGGUCC c a g g u a u c g u c c c a CCUCCACCUGC CCCACUCACCACCUCÍJGCU
AGUIICC AG ACACCUC CCAAGCACGCAC C AAUGCAGCOCAAAACGGUTJAGCAUAGGCACAC
UCCCAOGÜGAAACAGCAÜUGAaUAACCUUUAGUAAUAAUCGAAUGUUUAACUAAGCUAUA CUAACCCCA&GG X ’GGTIC AAUUUCGUGCCAGC CAC ACC
> FI UTR 95 % de homología (modificaciones aleatorias)
CUGGUACUG CAUGGACGCAAUGCtí AGCUGOCCCüU U CCCGUCGUGGGUACCCGG AG UCAC CACOGACCUCGGGUCCCAGGUAUCGUCCCACCDCCAOSDGCCOCACrjCACCAOCUCUGaj AGUUCCAGACACCUCCCA^GCACGGAGCAAUGCAGC'LrCAAAACGCUUAGCAUAGCCACAC CCCCACGGGAAACAGUAGUGAUUAACCUUUAGCAAUAAUOGAAuGUCUAACUAAGCUAUA CUAACCCGAGGGUUGATICAAUUñCGUGCCAGCCAGAC C
> FI UTR 92,5 % de homología (modificaciones aleatorias)
CUCGDACUGCMIGGACGCAAUSCUAGCUGCCOCUUUCCCBUCC'JGGGUACCCCGAGUCAC
CACOGACCUCGGGGGCCAiaGDAUCGUCCCACCUCCACGUaCCaCA'CUCACGAOCDOTJGCU aguu gc ag acaccuc ccauscacgg ag c aaugCagaucaaaacgcüuagcauagccacac
C CC CACGGGAAACA,GUAGUGAÜTJAAC CUUIJAG CAAUAAUCGAA-JGUCTJAAGUAAGCUAUA
CUAACCCCASGG UUGACJ CAAUUAOGUGCCAGC GACACC
> FI UTR 90 % de homología (modificaciones aleatorias)
GUCGUACUGCAÜüGACGC AAUG CÜAGCAGCACCU UUCCCG'J L’CUGGGt! ACCCCGAGUCA" CACCGACCl JOGGGUC CCAGGUA UOGUC CCACCÍICCAGGUGC COCACCCACCMOIDDSCU
AGTJUCCAG AGACCUCCCAUG GACGCAGCAAUGCAG AUCAAAAOGCUUAG CAUAGGCACAO
COC CA C GGGAAACA GUAGDGAU CAAC CUUUAGC UAÜAAUCGAAU GD CUAA CUAAG CUAUU
CUAA CCACAGGG UU <^U<^\A1XACG1*XX'AG c cagacc
> Mutación FI 8nt
CUG GUACtJGCAUG CACG GAAUG CUAGCOGC C C CAAAGGGCU C CUGGGUAC CCCGAGUCUC CCCCGñ C CUCGGGUCC CAGGUAUGCUC CCACCG CCAC CITGCC CCACUCACCACCUCT 7GCD AGUtjCGAGACAC CUC C CAAG CAGGCAGCAAtJG CAGCUtAAAACGCUUAGGC UAC GCa Ca G CCCCACGGGAAACAGCAGUGAUUAACCUUUAGCAAUAAAOGAAAGUUUAACUAAGCUAGA CUAAGCC CAGGGTTT IGGTÜCAAUUUCGUGCC AGC CAGACC
> FI UTR 98,75 % de homología (modificaciones que desestabilizan la estructura)
cugguagugcaugcacgcaat; g CÜAG CUGCCCCCJUtTCCOGuGGÜ CCClJAGGCgGa GUGUC C CCCGACC U CGGGUC CX^GGUATJGCU CC CAC C TJCCACCÜG CC C CACUCAC CACCUCUG C U AGI JUC CAGACAC cttcccaagcacgcagcaaug cag ::: jcaaaacgcuuag ccu ag cca ca c CCCCAOGGGAAACAGCAGÜGAULAACCUUüAGCAAUAAACGAAAG-JUUAACUAAGCUAUA CUAAC CCCAGGGUUGGUCAAUUUCGUGCCAG CCACACC
> FI UTR 97,5 % de homología (modificaciones que desestabilizan la estructura)
C IKKUACUGOUM CACG CAM JG C UAGCUGCCCC UUÜCCCGEJGG ACCGG ACGGCUAGUCL'C
CCCCGACCUCGGGUCCCKGGUAUGCUCCCACCüCCA CCT JGC CCCACUCACCACCU CT JGCU
AG UUC CAG ACAGC'JCCCAAGCACC-C AGCAAUGC AGCUCAAAACGCUUAGC CUAGCCACAC
C C CCA C GGGAAACAGCAGUGAUUAAC C LTTJCAG CAAÜAAACGAAAGUU UAAC IIAAGCUAUA
CUAACCCCAGGGUUGGUCAAUUUCGUGCCAGCCACACC
> FI UTR 96,25 % de homología (modificaciones que desestabilizan la estructura)
C’JGGUACUGCAUGCAOSC AAUGCUAGCUGC CCCUUUGCCGUGG ACCGH ACHGGC UG UC UC
CCCOGACCUCGWUCCaU3GOAJUGCUCCCACCUCCACCTOCCCC»CUCACCACCUCTJGCU AiGUtíC CflGACAC CUCCCAAGCACüCAGGAAUGCAG CIÍCAAAACGCUUAGC CUAG CCAC A C
GCCCACGGGAAACAGCAGUGAUUAAGCUUUAGCAAUAAACGAAAGUUUAACUAAGCUAUA
CUAACCC CAGGGUUGGUCAAI7 JT IOGUGCCAGCC AC ACC
> FI UTR 95 % de homología (modificaciones que desestabilizan la estructura)
CUGGUACUGCAUGCACGCAAUÜCUAGCUGCCCttJUUGGGCUGÜACCGUAOGGGCUGUCUC
CCCCGACCUCGGSUCCC AGGUAUGCUCCC ACCUCCACCI TGC CCC ACUCACC ACCTJCUGCU
a g u u g c a g a c a c c u c c c a a g c a Cg c a g c a a u g c a g c u c a a a a c g c u ü a g c c u a g c c a c a c CCCCACG GGAAACAGCAGCC AUUAAc Cü UjJ AGCAAU AAACG AAAGUUUAAC'JAAGCuAU a
c u ia a jg c o c a g g g u u g g u c a a u u u c g u g o c a g c c a c a c c
> FI UTR 97,5 % de homología (modificaciones que desestabilizan la estructura)
CUGGUACUGCAUGCACGCAAUGCUAGCUGCCCCUUUCCCGUGGUCCGUACCCCGAGUCUC
CC C CGACCÜCGGGLT CGOACCUAUG C u c c c a c g u c c a c c u g c c c c a c u c a c c a c c u c o q c t j
AGUUCCAGACACC'J CCCAAGCACGCAGCAAUGC A 3 CUC AAAAOGCUUAGCCUAGCC ACAC
CCCCACGGGAAACAGCAGUGAmJAACCUUUAGCAAIIAAACGAAAGUUUAACUAAGCimUA CUAACCCCAGGGL"JC-SUCAAUUUCGU<3CCAGCCACACC
> FI UTR 95 % (modificaciones que retienen la estructura)
CUG GUA C UGCAUG CACG CAAUG CIJAC-CUGCCCC'JUli C CCGUGGACCGUACGGCGAGUCUC CCCCGACCt JOGCC (JCGGUCC (CAI JG CU CCCACC UC CACCUGC C CCACUCA CCACCUCUGCU AGUUCCAGACa CCUCCCAAG CACG CAGCAAUG CAGCUCAAAACGCTJUAGCCTJAGCC ACAC CCCC AOGGG AAACAGCAGUGAUUAACCT.TI.rjAG C AAUAAACGAAAGUUUAACUAAG CIJA UA CTJAACC CCAGGGUUGGUCAAUUUCGUGOCñGC CACACC
> FI UTR 92,5 % (modificaciones que retienen la estructura)

Claims (23)

    REIVINDICACIONESUna molécula de ácido nucleico que comprende en la dirección de transcripción 5 ' ^ 3':(a) un promotor;(b) una secuencia de ácido nucleico transcribible o una secuencia de ácido nucleico para introducir una secuencia de ácido nucleico transcribible; y(c) una secuencia de ácido nucleico que, cuando se transcribe bajo el control del promotor (a), codifica para una región no traducida en 3' en el transcrito que no está naturalmente unida a la secuencia de ácido nucleico (b), dicha región no traducida en 3' comprende(i) (c-4) la secuencia de ácido nucleico de la región no traducida en 3' del Potenciador de la Separación del Amino Terminal (AES) que comprende o consiste en una secuencia de ácido nucleico seleccionada del grupo que consiste en las SEC ID NOs: 86 a 89, preferentemente la SEQ ID NO: 86, un fragmento de esta, o una variante de dicha secuencia o fragmento de ácido nucleico que es al menos 90 % idéntica a dicha secuencia o fragmento de ácido nucleico; o(ii) (c-8) cualquier combinación de (c-4) y una o más secuencias de ácido nucleico seleccionadas del grupo que consiste en:
  1. (c-1) la secuencia de ácido nucleico de la región no traducida en 3' del Fragmento Fc de IgG, Receptor, Transportador, Alfa (FCGRT) que comprende o consiste en una secuencia de ácido nucleico seleccionada del grupo que consiste en las SEC ID NOs: 1 a 50, preferentemente la SEQ ID NO: 27, un fragmento de esta, o una variante de dicha secuencia o fragmento de ácido nucleico que es al menos 90 % idéntica a dicha secuencia o fragmento de ácido nucleico,
  2. (c-2) la secuencia de ácido nucleico de la región no traducida en 3' de la Proteína Específica de Linfocitos 1 (LSP1) que comprende o consiste en una secuencia de ácido nucleico seleccionada del grupo que consiste en las SEC ID NOs: 51 a 72, preferentemente la SEQ ID NO: 52, un fragmento de esta, o una variante de dicha secuencia o fragmento de ácido nucleico que es al menos 90 % idéntica a dicha secuencia o fragmento de ácido nucleico, (c-3) la secuencia de ácido nucleico de la región no traducida en 3' del Ligando de Quimiocina 22 (CCL22) que comprende o consiste en una secuencia de ácido nucleico seleccionada del grupo que consiste en las SEC ID NOs: 73 a 85, preferentemente la SEQ ID NO: 79, un fragmento de esta, o una variante de dicha secuencia o fragmento de ácido nucleico que es al menos 90 % idéntica a dicha secuencia o fragmento de ácido nucleico, (c-4) la secuencia de ácido nucleico de la región no traducida en 3' del Potenciador de la Separación del Amino Terminal (AES) que comprende o consiste en una secuencia de ácido nucleico seleccionada del grupo que consiste en las SEQ ID NOs: 86 a 89, preferentemente la SEQ ID NO: 86, un fragmento de esta, o una variante de dicha secuencia o fragmento de ácido nucleico que es al menos 90 % idéntica a dicha secuencia o fragmento de ácido nucleico,
    (c-5) la secuencia de ácido nucleico de la región no traducida en 3' del Miembro 3 de la Familia de fosfolipasa D
  3. (PLD3) que comprende o consiste en una secuencia de ácido nucleico seleccionada del grupo que consiste en las SEC ID NOs: 90 a 104, preferentemente la SEQ ID NO: 96, un fragmento de esta, o una variante de dicha secuencia o fragmento de ácido nucleico que es al menos 90 % idéntica a dicha secuencia o fragmento de ácido nucleico,
    (c-6) la secuencia de ácido nucleico del ARN no codificante del ARN 12S codificado mitocondrialmente (MT-RNR1) que comprende o consiste en una secuencia de ácido nucleico seleccionada del grupo que consiste en las SEC ID NOs: 105 a 121, preferentemente la SEQ ID NO: 115, un fragmento de esta, o una variante de dicha secuencia o fragmento de ácido nucleico que es al menos 90 % idéntica a dicha secuencia o fragmento de ácido nucleico, y (c-7) la secuencia nucleica de la región no traducida en 3' del Complejo Principal de Histocompatibilidad Clase II DR Beta 4 (HLA-DRB4) que comprende o consiste en una secuencia de ácido nucleico seleccionada del grupo que consiste en las SEC ID NOs: 122 a 143, preferentemente la SEQ ID NO: 126, un fragmento de esta, o una variante de dicha secuencia o fragmento de ácido nucleico que es al menos 90 % idéntica a dicha secuencia o fragmento de ácido nucleico,
    en donde las secuencias de ácido nucleico (b) y (c) bajo el control del promotor (a) pueden transcribirse para proporcionar un transcrito común en el que la secuencia de ácido nucleico transcrita a partir de la secuencia de ácido nucleico (c) está activa para aumentar la eficiencia de la traducción y/o la estabilidad de la secuencia de ácido nucleico transcrita a partir de la secuencia de ácido nucleico transcribible (b).
    La molécula de ácido nucleico como se reivindicó en la reivindicación 1, en donde la secuencia de ácido nucleico (c-8) comprende una combinación de (c-4) y (c-6), en donde, preferentemente, (c-4) se ubica 5' a (c-6), y/o la combinación de (c-4) y (c-6) comprende la secuencia de ácido nucleico de la SEQ ID NO: 174, un fragmento de esta, o una variante de dicha secuencia o fragmento de ácido nucleico que es al menos 90 % idéntica a dicha secuencia o fragmento de ácido nucleico.
    La molécula de ácido nucleico como se reivindicó en la reivindicación 1 o 2, que comprende además (d) una secuencia de ácido nucleico que, cuando se transcribe bajo el control del promotor (a), codifica para una secuencia de ácido nucleico que es una secuencia de poliadenilo, en donde, opcionalmente, la secuencia de poliadenilo comprende dentro de la secuencia de poliadenilo una secuencia de uno o más nucleótidos consecutivos que contienen nucleótidos distintos de los nucleótidos A.
  4. 4. La molécula de ácido nucleico como se reivindicó en cualquiera de las reivindicaciones 1 a 3, que es una molécula circular cerrada o una molécula lineal.
  5. 5. La molécula de ácido nucleico como se reivindicó en cualquiera de las reivindicaciones 1 a 4, en donde la secuencia de ácido nucleico transcribible comprende una secuencia de ácido nucleico codificante para un péptido o proteína y la secuencia de ácido nucleico para introducir una secuencia de ácido nucleico transcribible es un sitio de clonación múltiple.
  6. 6. La molécula de ácido nucleico como se reivindicó en cualquiera de las reivindicaciones 1 a 5, que comprende además uno o más miembros seleccionados del grupo que consiste en: (i) un gen reportero; (ii) un marcador de selección; y (iii) un origen de replicación.
  7. 7. La molécula de ácido nucleico como se reivindicó en cualquiera de las reivindicaciones 1 a 6, que es adecuada, en particular después de la linealización, para la transcripción in vitro del ARN, en particular del ARNm.
  8. 8. El ARN que puede obtenerse mediante la transcripción, preferentemente, la transcripción in vitro, mediante el uso de una molécula de ácido nucleico como se reivindicó en cualquiera de las reivindicaciones 1 a 7 como un molde.
  9. 9. El ARN que comprende en la dirección 5 ' ^ 3':
    (a) una región no traducida en 5';
    (b) una secuencia de ácido nucleico codificante para un péptido o proteína; y
    (c) una región no traducida en 3' que no está unida naturalmente a la secuencia de ácido nucleico (b), dicha región no traducida en 3' comprende
    (i) (c-4) la secuencia de ácido nucleico de la región no traducida en 3' del Potenciador de la Separación del Amino Terminal (AES) que comprende o consiste en una secuencia de ácido nucleico seleccionada del grupo que consiste en las SEC ID NOs: 86 a 89, preferentemente la SEQ ID NO: 86, un fragmento de esta, o una variante de dicha secuencia o fragmento de ácido nucleico que es al menos 90 % idéntica a dicha secuencia o fragmento de ácido nucleico; o
    (ii) (c-8) cualquier combinación de (c-4) y una o más secuencias de ácido nucleico seleccionadas del grupo que consiste en:
    (c-1) la secuencia de ácido nucleico de la región no traducida en 3' del Fragmento Fc de IgG, Receptor, Transportador, Alfa (FCGRT) que comprende o consiste en una secuencia de ácido nucleico seleccionada del grupo que consiste en las SEC ID NOs: 1 a 50, preferentemente la SEQ ID NO: 27, un fragmento de esta, o una variante de dicha secuencia o fragmento de ácido nucleico que es al menos 90 % idéntica a dicha secuencia o fragmento de ácido nucleico,
    (c-2) la secuencia de ácido nucleico de la región no traducida en 3' de la Proteína Específica de Linfocitos 1 (LSP1) que comprende o consiste en una secuencia de ácido nucleico seleccionada del grupo que consiste en las SEC ID NOs: 51 a 72, preferentemente la SEQ ID NO: 52, un fragmento de esta, o una variante de dicha secuencia o fragmento de ácido nucleico que es al menos 90 % idéntica a dicha secuencia o fragmento de ácido nucleico, (c-3) la secuencia de ácido nucleico de la región no traducida en 3' del Ligando de Quimiocina 22 (CCL22) que comprende o consiste en una secuencia de ácido nucleico seleccionada del grupo que consiste en las SEC ID NOs: 73 a 85, preferentemente la SEQ ID NO: 79, un fragmento de esta, o una variante de dicha secuencia o fragmento de ácido nucleico que es al menos 90 % idéntica a dicha secuencia o fragmento de ácido nucleico, (c-4) la secuencia de ácido nucleico de la región no traducida en 3' del Potenciador de la Separación del Amino Terminal (AES) que comprende o consiste en una secuencia de ácido nucleico seleccionada del grupo que consiste en las SEQ ID NOs: 86 a 89, preferentemente la SEQ ID NO: 86, un fragmento de esta, o una variante de dicha secuencia o fragmento de ácido nucleico que es al menos 90 % idéntica a dicha secuencia o fragmento de ácido nucleico,
    (c-5) la secuencia de ácido nucleico de la región no traducida en 3' del Miembro 3 de la Familia de Fosfolipasa D (PLD3) que comprende o consiste en una secuencia de ácido nucleico seleccionada del grupo que consiste en las SEC ID NOs: 90 a 104, preferentemente la SEQ ID NO: 96, un fragmento de esta, o una variante de dicha secuencia o fragmento de ácido nucleico que es al menos 90 % idéntica a dicha secuencia o fragmento de ácido nucleico,
    (c-6) la secuencia de ácido nucleico del ARN no codificante del ARN 12S codificado mitocondrialmente (MT-RNR1) que comprende o consiste en una secuencia de ácido nucleico seleccionada del grupo que consiste en las SEC ID NOs: 105 a 121, preferentemente la SEQ ID NO: 115, un fragmento de esta, o una variante de dicha secuencia o fragmento de ácido nucleico que es al menos 90 % idéntica a dicha secuencia o fragmento de ácido nucleico, (c-7) la secuencia nucleica de la región no traducida en 3' del Complejo Principal de Histocompatibilidad Clase II DR Beta 4 (HLA-DRB4) que comprende o consiste en una secuencia de ácido nucleico seleccionada del grupo que consiste en las SEC ID NOs: 122 a 143, preferentemente la SEQ ID NO: 126, un fragmento de esta, o una variante de dicha secuencia o fragmento de ácido nucleico que es al menos 90 % idéntica a dicha secuencia o fragmento de ácido nucleico,
    en donde la secuencia de ácido nucleico (c) es activa para aumentar la eficiencia de la traducción y/o la estabilidad de la secuencia de ácido nucleico codificante para un péptido o proteína.
  10. 10. El ARN como se reivindicó en la reivindicación 9, que comprende además (d) una secuencia de ácido nucleico que es una secuencia de poliadenilo que opcionalmente comprende dentro de la secuencia de poliadenilo una secuencia de uno o más nucleótidos consecutivos que contienen nucleótidos distintos de los nucleótidos A, en donde, preferentemente, dicha secuencia de ácido nucleico (d) está ubicada en el extremo 3' de dicho ARN, y/o las secuencias de ácido nucleico (c) y (d) están activas para aumentar la eficiencia de la traducción y/o la estabilidad de la secuencia de ácido nucleico codificante para un péptido o proteína.
  11. 11. El ARN como se reivindicó en la reivindicación 9 o 10, que además comprende (e) un casquete 5'.
  12. 12. Un método para obtener ARN, que comprende:
    (i) proporcionar una molécula de ácido nucleico como se reivindicó en cualquiera de las reivindicaciones 1 a 7, y (ii) transcribir el ARN mediante el uso de la molécula de ácido nucleico como un molde.
  13. 13. Un método para obtener un péptido o proteína, que comprende:
    (i) obtener el ARN codificante para el péptido o proteína de acuerdo con el método de conformidad con la reivindicación 12, y
    (ii) traducir el ARN.
  14. 14. El método como se reivindicó en la reivindicación 12 o 13, caracterizado porque comprende, además, antes de la transcripción de la molécula de ácido nucleico, la escisión de la molécula de ácido nucleico.
  15. 15. Un método para obtener ARN, que comprende:
    (i) acoplar una secuencia de ácido nucleico (b) que, cuando se transcribe, codifica para una región no traducida en 3', en el extremo 3' de una secuencia de ácido nucleico transcribible (a) que comprende una secuencia de ácido nucleico codificante para un péptido o proteína, en donde la secuencia de ácido nucleico (a) no está unida naturalmente a la secuencia de ácido nucleico (b), y
    (ii) transcribir el ácido nucleico obtenido,
    dicha región no traducida en 3' comprende
    (iia) (b-4) la secuencia de ácido nucleico de la región no traducida en 3' del Potenciador de la Separación del Amino Terminal (AES) que comprende o consiste en una secuencia de ácido nucleico seleccionada del grupo que consiste en las SEC ID NOs: 86 a 89, preferentemente la SEQ ID NO: 86, un fragmento de esta, o una variante de dicha secuencia o fragmento de ácido nucleico que es al menos 90 % idéntica a dicha secuencia o fragmento de ácido nucleico; o
    (iib) (b-8) cualquier combinación de (b-4) y una o más secuencias de ácido nucleico seleccionadas del grupo que consiste en:
    (b-1) la secuencia de ácido nucleico de la región no traducida en 3' del Fragmento Fc de IgG, Receptor, Transportador, Alfa (FCGRT) que comprende o consiste en una secuencia de ácido nucleico seleccionada del grupo que consiste en las SEC ID NOs: 1 a 50, preferentemente la SEQ ID NO: 27, un fragmento de esta, o una variante de dicha secuencia o fragmento de ácido nucleico que es al menos 90 % idéntica a dicha secuencia o fragmento de ácido nucleico,
    (b-2) la secuencia de ácido nucleico de la región no traducida en 3' de la Proteína Específica de Linfocitos 1 (LSP1) que comprende o consiste en una secuencia de ácido nucleico seleccionada del grupo que consiste en las SEC ID NOs: 51 a 72, preferentemente la SEQ ID NO: 52, un fragmento de esta, o una variante de dicha secuencia o fragmento de ácido nucleico que es al menos 90 % idéntica a dicha secuencia o fragmento de ácido nucleico, (b-3) la secuencia de ácido nucleico de la región no traducida en 3' del Ligando de Quimiocina 22 (CCL22) que comprende o consiste en una secuencia de ácido nucleico seleccionada del grupo que consiste en las SEQ ID NO: 73 a 85, preferentemente la SEQ ID NO: 79, un fragmento de esta, o una variante de dicha secuencia o fragmento de ácido nucleico que es al menos 90 % idéntica a dicha secuencia o fragmento de ácido nucleico,
    (b-4) la secuencia de ácido nucleico de la región no traducida en 3' del Potenciador de la Separación del Amino Terminal (AES) que comprende o consiste en una secuencia de ácido nucleico seleccionada del grupo que consiste en las SEC ID NO: 86 a 89, preferentemente la SEQ ID NO: 86, un fragmento de esta, o una variante de dicha secuencia o fragmento de ácido nucleico que es al menos 90 % idéntica a dicha secuencia o fragmento de ácido nucleico,
    (b-5) la secuencia de ácido nucleico de la región no traducida en 3' del Miembro 3 de la Familia de Fosfolipasa D (PLD3) que comprende o consiste en una secuencia de ácido nucleico seleccionada del grupo que consiste en las SEQ ID NO: 90 a 104, preferentemente la SEQ ID NO: 96, un fragmento de esta, o una variante de dicha secuencia o fragmento de ácido nucleico que es al menos 90 % idéntica a dicha secuencia o fragmento de ácido nucleico, (b-6) la secuencia de ácido nucleico del ARN no codificante del ARN 12S codificado mitocondrialmente (MT-RNR1) que comprende o consiste en una secuencia de ácido nucleico seleccionada del grupo que consiste en las SEC ID NOs: 105 a 121, preferentemente la SEQ ID NO: 115, un fragmento de esta, o una variante de dicha secuencia o fragmento de ácido nucleico que es al menos 90 % idéntica a dicha secuencia o fragmento de ácido nucleico, (b-7) la secuencia nucleica de la región no traducida en 3' del Complejo Principal de Histocompatibilidad Clase II DR Beta 4 (HLA-DRB4) que comprende o consiste en una secuencia de ácido nucleico seleccionada del grupo que consiste en las SEC ID NO: 122 a 143, preferentemente la SEQ ID NO: 126, un fragmento de esta, o una variante de dicha secuencia o fragmento de ácido nucleico que es al menos 90 % idéntica a dicha secuencia o fragmento de ácido nucleico,
    en donde las secuencias de ácido nucleico (a) y (b) pueden transcribirse para proporcionar un transcrito común en el que la secuencia de ácido nucleico transcrita a partir de la secuencia de ácido nucleico (b) está activa para aumentar la eficiencia de la traducción y/o la estabilidad de la secuencia de ácido nucleico transcrita a partir de la secuencia de ácido nucleico transcribible (a).
  16. 16. El método como se reivindicó en la reivindicación 15, que comprende además el acoplamiento de una secuencia de ácido nucleico (c) que, cuando se transcribe, codifica para una secuencia de ácido nucleico que es una secuencia de poliadenilo que opcionalmente comprende dentro de la secuencia de poliadenilo una secuencia de uno o más nucleótidos consecutivos que contiene nucleótidos distintos de los nucleótidos A, en el extremo 3' de la secuencia de ácido nucleico (b), en donde, preferentemente, las secuencias de ácido nucleico (a), (b), y (c) pueden transcribirse para proporcionar un transcrito común en el que las secuencias de ácido nucleico transcritas a partir de las secuencias de ácido nucleico (b) y (c) están activas para aumentar la eficiencia de la traducción y/o la estabilidad de la secuencia de ácido nucleico transcrita a partir de la secuencia de ácido nucleico transcribible (a).
  17. 17. Un método para obtener un péptido o proteína, que comprende:
    (i) obtener ARN mediante el método de conformidad con la reivindicación 15 o 16, y
    (ii) traducir el ARN.
  18. 18. El método como se reivindicó en cualquiera de las reivindicaciones 12 a 17, en donde la transcripción se realiza in vitro.
  19. 19. El ARN que se obtiene mediante el método como se reivindicó en cualquiera de las reivindicaciones 12, 14 a 16 y 18.
  20. 20. Un método para obtener un péptido o proteína, que comprende traducir el ARN como se reivindicó en cualquiera de las reivindicaciones 8 a 11 y 19.
  21. 21. El ARN como se reivindicó en cualquiera de las reivindicaciones 8 a 11 y 19 para usaren un método detransfección de una célula huésped, en donde, preferentemente, la célula huésped es una célula presentadora de antígeno, en particular una célula dendrítica, un monocito o un macrófago.
  22. 22. El ARN como se reivindicó en cualquiera de las reivindicaciones 8 a 11 y 19 para usar en un método de vacunación.
  23. 23. El ARN como se reivindicó en cualquiera de las reivindicaciones 8 a 11 y 19 para usar en un método de reprogramación de células somáticas en células que tienen características de células madre.
ES16778784T 2015-10-07 2016-10-05 Secuencias UTR 3' para la estabilización del ARN Active ES2753201T3 (es)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
PCT/EP2015/073180 WO2017059902A1 (en) 2015-10-07 2015-10-07 3' utr sequences for stabilization of rna
PCT/EP2016/073814 WO2017060314A2 (en) 2015-10-07 2016-10-05 3' utr sequences for stabilization of rna

Publications (2)

Publication Number Publication Date
ES2753201T3 true ES2753201T3 (es) 2020-04-07
ES2753201T8 ES2753201T8 (es) 2020-04-16

Family

ID=54293227

Family Applications (2)

Application Number Title Priority Date Filing Date
ES19198322T Active ES2866224T3 (es) 2015-10-07 2016-10-05 Secuencias UTR 3' para la estabilización del ARN
ES16778784T Active ES2753201T3 (es) 2015-10-07 2016-10-05 Secuencias UTR 3' para la estabilización del ARN

Family Applications Before (1)

Application Number Title Priority Date Filing Date
ES19198322T Active ES2866224T3 (es) 2015-10-07 2016-10-05 Secuencias UTR 3' para la estabilización del ARN

Country Status (26)

Country Link
US (2) US11492628B2 (es)
EP (3) EP3636764B1 (es)
JP (5) JP7084302B2 (es)
KR (2) KR102363368B1 (es)
CN (1) CN108291230B (es)
AU (3) AU2016335029B2 (es)
BR (2) BR122021025194B1 (es)
CA (2) CA2998554C (es)
CY (2) CY1122347T1 (es)
DK (2) DK3337902T3 (es)
ES (2) ES2866224T3 (es)
HK (2) HK1256701A1 (es)
HR (2) HRP20191907T1 (es)
HU (2) HUE055152T2 (es)
IL (3) IL293020A (es)
LT (2) LT3337902T (es)
MX (2) MX2018004160A (es)
NZ (1) NZ740946A (es)
PL (2) PL3636764T3 (es)
PT (2) PT3337902T (es)
RS (2) RS61684B1 (es)
RU (1) RU2720934C2 (es)
SG (1) SG10201912558YA (es)
SI (2) SI3636764T1 (es)
WO (2) WO2017059902A1 (es)
ZA (1) ZA201800835B (es)

Families Citing this family (100)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2017059902A1 (en) * 2015-10-07 2017-04-13 Biontech Rna Pharmaceuticals Gmbh 3' utr sequences for stabilization of rna
US11253601B2 (en) 2016-07-11 2022-02-22 Translate Bio Ma, Inc. Nucleic acid conjugates and uses thereof
AU2018318135A1 (en) * 2017-08-15 2020-03-05 Intellia Therapeutics, Inc. Stabilized nucleic acids encoding messenger ribonucleic acid (MRNA)
CN111741764A (zh) 2018-02-12 2020-10-02 生物技术Rna制药有限公司 使用细胞因子编码rna的治疗
EP3788155A1 (en) * 2018-05-01 2021-03-10 Wake Forest University Health Sciences Lentiviral-based vectors and related systems and methods for eukaryotic gene editing
WO2020020783A1 (en) 2018-07-24 2020-01-30 Biontech Rna Pharmaceuticals Gmbh Il2 agonists
CN115120716A (zh) 2019-01-14 2022-09-30 健泰科生物技术公司 用pd-1轴结合拮抗剂和rna疫苗治疗癌症的方法
US20220125836A1 (en) 2019-02-08 2022-04-28 Biontech Cell & Gene Therapies Gmbh Treatment involving car-engineered t cells and cytokines
JP2022525921A (ja) 2019-03-18 2022-05-20 バイオエヌテック セル アンド ジーン セラピーズ ゲーエムベーハー 免疫エフェクタ細胞の特異的活性化のためのインターロイキン2受容体(il2r)およびインターロイキン2(il2)バリアント
WO2020200481A1 (en) 2019-04-05 2020-10-08 Biontech Rna Pharmaceuticals Gmbh Treatment involving interleukin-2 (il2) and interferon (ifn)
TW202115105A (zh) 2019-06-24 2021-04-16 德商拜恩迪克Rna製藥有限公司 Il2激動劑
CN114729369A (zh) * 2019-08-29 2022-07-08 苏黎世大学 最小mRNA及其用途
WO2021081261A1 (en) * 2019-10-22 2021-04-29 The Regents Of The University Of California Modulation of engineered immune cell receptor translation using noncoding sequence elements
AU2021212197A1 (en) 2020-01-31 2022-08-04 BioNTech SE Methods of inducing neoepitope-specific T cells with a PD-1 axis binding antagonist and an RNA vaccine
EP4103228A1 (en) 2020-02-13 2022-12-21 Institut Pasteur Nucleic acid vaccine against the sars-cov-2 coronavirus
CA3171370A1 (en) 2020-03-16 2021-09-23 Ugur Sahin Antigen-specific t cell receptors and t cell epitopes
KR102462990B1 (ko) * 2020-03-17 2022-11-07 에이비온 주식회사 인비트로 트랜스크립트 mRNA 및 이를 함유하는 약학조성물
EP4126947A1 (en) 2020-03-30 2023-02-08 BioNTech SE Rna compositions targeting claudin-18.2
WO2021197589A1 (en) 2020-03-31 2021-10-07 BioNTech SE Treatment involving non-immunogenic rna for antigen vaccination
IL297414A (en) 2020-04-22 2022-12-01 Pfizer Vaccine against the corona virus
GB202307565D0 (en) * 2020-04-22 2023-07-05 BioNTech SE Coronavirus vaccine
CN116234568A (zh) 2020-07-07 2023-06-06 生物技术公司 用于hpv阳性癌症的治疗性rna
EP4182924A1 (en) 2020-07-17 2023-05-24 Genentech, Inc. Attention-based neural network to predict peptide binding, presentation, and immunogenicity
EP4192859A1 (en) 2020-08-06 2023-06-14 BioNTech SE Binding agents for coronavirus s protein
MX2023002670A (es) 2020-09-08 2023-05-08 Genentech Inc Sistemas y procedimientos para producir composiciones farmaceuticas usando bombas peristalticas y amortiguadores.
TW202227478A (zh) 2020-09-15 2022-07-16 德商拜恩迪克公司 對細胞靶向遞送的藥劑及方法
EP4203997A1 (en) 2020-10-26 2023-07-05 Pécsi Tudományegyetem Vaccine platform
JP2023547947A (ja) 2020-11-11 2023-11-14 ビオンテック・ソシエタス・エウロパエア プログラム細胞死-1タンパク質に対するモノクローナル抗体および医薬におけるその使用
WO2022106860A1 (en) 2020-11-20 2022-05-27 Pécsi Tudományegyetem Recombinant peptides for use in therapy
WO2022122689A1 (en) 2020-12-09 2022-06-16 BioNTech SE Rna manufacturing
WO2022135666A1 (en) 2020-12-21 2022-06-30 BioNTech SE Treatment schedule for cytokine proteins
WO2022135667A1 (en) 2020-12-21 2022-06-30 BioNTech SE Therapeutic rna for treating cancer
TW202245808A (zh) * 2020-12-21 2022-12-01 德商拜恩迪克公司 用於治療癌症之治療性rna
CN114717230A (zh) * 2021-01-05 2022-07-08 麦塞拿治疗(香港)有限公司 成纤维细胞生长因子mRNA的无细胞和无载体体外RNA转录方法和核酸分子
WO2022223617A1 (en) 2021-04-20 2022-10-27 BioNTech SE Virus vaccine
JP2024518335A (ja) 2021-04-26 2024-05-01 アンスティチュ パスツール SARS-CoV-2に対するヒト中和モノクローナル抗体、及びそれらの使用
EP4334943A1 (en) 2021-05-04 2024-03-13 BioNTech SE Technologies for early detection of variants of interest
EP4351633A1 (en) 2021-06-08 2024-04-17 Biontech Cell & Gene Therapies Gmbh Agents and methods for activation and targeting of immune effector cells
KR20230000471A (ko) * 2021-06-24 2023-01-02 한미약품 주식회사 비천연 5'-비번역 영역 및 3'-비번역 영역 및 그의 용도
EP4370551A1 (en) 2021-07-15 2024-05-22 BioNTech SE Agents encoding cldn6 and cd3 binding elements for treating cldn6-positive cancers
WO2023008793A1 (ko) * 2021-07-27 2023-02-02 에스케이바이오사이언스(주) 단백질 발현을 위한 mrna와 이를 위한 주형
WO2023006920A1 (en) 2021-07-29 2023-02-02 BioNTech SE Compositions and methods for treatment of melanoma
EP4392140A1 (en) 2021-08-24 2024-07-03 BioNTech SE In vitro transcription technologies
WO2023030635A1 (en) * 2021-09-02 2023-03-09 BioNTech SE Potency assay for therapeutic potential of coding nucleic acid
WO2023051926A1 (en) 2021-09-30 2023-04-06 BioNTech SE Treatment involving non-immunogenic rna for antigen vaccination and pd-1 axis binding antagonists
CA3234490A1 (en) * 2021-10-07 2023-04-13 Precision NanoSystems ULC Rna vaccine lipid nanoparticles
TW202333802A (zh) 2021-10-11 2023-09-01 德商拜恩迪克公司 用於肺癌之治療性rna(二)
WO2023061550A1 (en) 2021-10-11 2023-04-20 BioNTech SE Therapeutic rna for lung cancer
TW202333803A (zh) 2021-10-11 2023-09-01 德商拜恩迪克公司 用於肺癌之治療性rna(一)
WO2023064612A2 (en) 2021-10-15 2023-04-20 BioNTech SE Pharmaceutical compositions for delivery of viral antigens and related methods
CN118302189A (zh) 2021-10-21 2024-07-05 生物技术欧洲股份公司 冠状病毒疫苗
WO2023067126A1 (en) 2021-10-22 2023-04-27 BioNTech SE Oligosaccharide compounds and complexes
EP4169580A1 (en) 2021-10-22 2023-04-26 BioNTech SE Oligosaccharide compounds and complexes
EP4169534A1 (en) 2021-10-22 2023-04-26 BioNTech SE Oligosaccharide complexes and uses
EP4285933A1 (en) 2022-05-30 2023-12-06 BioNTech SE Oligosaccharide complexes and uses
EP4169579A1 (en) 2021-10-22 2023-04-26 BioNTech SE Disulfide oligosaccharide compounds and complexes
WO2023067124A1 (en) 2021-10-22 2023-04-27 BioNTech SE Disulfide oligosaccharide compounds and complexes
EP4285932A1 (en) 2022-05-30 2023-12-06 BioNTech SE Oligosaccharide complexes and uses
WO2023067123A1 (en) 2021-10-22 2023-04-27 BioNTech SE Oligosaccharide complexes and uses
EP4286004A1 (en) 2022-05-30 2023-12-06 BioNTech SE Disulfide oligosaccharide compounds and complexes
AU2022369405A1 (en) 2021-10-22 2024-05-09 BioNTech SE Oligosaccharide compounds and complexes
EP4286003A1 (en) 2022-05-30 2023-12-06 BioNTech SE Oligosaccharide compounds and complexes
WO2023067125A1 (en) 2021-10-22 2023-04-27 BioNTech SE Oligosaccharide complexes and uses
EP4286394A1 (en) 2022-05-30 2023-12-06 BioNTech SE Oligosaccharide compounds and complexes
EP4186528A1 (en) 2021-11-30 2023-05-31 BioNTech SE Oligosaccharide complexes and uses
EP4238577A3 (en) 2021-10-22 2023-12-06 BioNTech SE Compositions for administration of different doses of rna
EP4169578A1 (en) 2021-10-22 2023-04-26 BioNTech SE Oligosaccharide compounds and complexes
WO2023073190A1 (en) 2021-10-28 2023-05-04 BioNTech SE Rna constructs and uses thereof
WO2023083434A1 (en) 2021-11-09 2023-05-19 BioNTech SE Rna encoding peptidoglycan hydrolase and use thereof for treating bacterial infection
EP4226938A3 (en) 2021-11-29 2023-11-01 BioNTech SE Coronavirus vaccine
WO2024046572A1 (en) 2022-09-01 2024-03-07 BioNTech SE Chimeric antigen receptor-modified cells for the treatment of cldn6 expressing cancer
AU2022405694A1 (en) 2021-12-09 2024-07-04 BioNTech SE Chimeric antigen receptor-modified cells for the treatment of cldn6 expressing cancer
WO2023126053A1 (en) 2021-12-28 2023-07-06 BioNTech SE Lipid-based formulations for administration of rna
WO2023147090A1 (en) 2022-01-27 2023-08-03 BioNTech SE Pharmaceutical compositions for delivery of herpes simplex virus antigens and related methods
WO2023147091A1 (en) 2022-01-28 2023-08-03 BioNTech SE Coronavirus vaccine
WO2023214801A1 (ko) * 2022-05-03 2023-11-09 단국대학교 산학협력단 단백질의 발현 수준 및 발현 위치 조절을 위한 utr 서열 및 이를 포함하는 mrna 서열
US11932693B2 (en) 2022-05-12 2024-03-19 BioNTech SE Monoclonal antibodies directed against programmed death-1 protein and their use in medicine
WO2023218431A1 (en) 2022-05-13 2023-11-16 BioNTech SE Rna compositions targeting hiv
WO2023230295A1 (en) 2022-05-25 2023-11-30 BioNTech SE Rna compositions for delivery of monkeypox antigens and related methods
WO2023232747A1 (en) 2022-05-30 2023-12-07 BioNTech SE Complexes for delivery of nucleic acids
WO2023237726A1 (en) 2022-06-10 2023-12-14 Pantarhei Oncology B.V. An intracellular tumor-specific variant of human zona pellucida glycoprotein 3 and nucleic acids coding therefor for use in the treatment of cancer
US11878055B1 (en) 2022-06-26 2024-01-23 BioNTech SE Coronavirus vaccine
WO2024017479A1 (en) 2022-07-21 2024-01-25 BioNTech SE Multifunctional cells transiently expressing an immune receptor and one or more cytokines, their use and methods for their production
WO2024028445A1 (en) 2022-08-03 2024-02-08 BioNTech SE Rna for preventing or treating tuberculosis
WO2024027910A1 (en) 2022-08-03 2024-02-08 BioNTech SE Rna for preventing or treating tuberculosis
CN117660494A (zh) * 2022-09-07 2024-03-08 远大赛威信生命科学(南京)有限公司 用于表达水痘-带状疱疹病毒抗原蛋白的mRNA及其用途
WO2024056856A1 (en) 2022-09-15 2024-03-21 BioNTech SE Systems and compositions comprising trans-amplifying rna vectors with mirna
WO2024064931A1 (en) 2022-09-23 2024-03-28 BioNTech SE Compositions for delivery of liver stage antigens and related methods
WO2024064934A1 (en) 2022-09-23 2024-03-28 BioNTech SE Compositions for delivery of plasmodium csp antigens and related methods
WO2024063788A1 (en) 2022-09-23 2024-03-28 BioNTech SE Compositions for delivery of malaria antigens and related methods
WO2024063789A1 (en) 2022-09-23 2024-03-28 BioNTech SE Compositions for delivery of malaria antigens and related methods
WO2024068674A1 (en) 2022-09-26 2024-04-04 BioNTech SE Nucleic acid complexes and uses thereof
WO2024074634A1 (en) * 2022-10-06 2024-04-11 BioNTech SE Rna compositions targeting claudin-18.2
WO2024074211A1 (en) * 2022-10-06 2024-04-11 BioNTech SE Rna compositions targeting claudin-18.2
WO2024086575A1 (en) 2022-10-17 2024-04-25 BioNTech SE Combination vaccines against coronavirus infection, influenza infection, and/or rsv infection
WO2024083345A1 (en) 2022-10-21 2024-04-25 BioNTech SE Methods and uses associated with liquid compositions
WO2024084462A1 (en) 2022-10-21 2024-04-25 BioNTech SE Nucleic acid complexes and uses thereof
WO2024107754A1 (en) 2022-11-15 2024-05-23 Genentech, Inc. Selection of diverse candidate peptides for peptide therapeutics
WO2024137589A2 (en) 2022-12-20 2024-06-27 Genentech, Inc. Methods of treating pancreatic cancer with a pd-1 axis binding antagonist and an rna vaccine
CN117535295B (zh) * 2024-01-09 2024-04-26 艾斯拓康医药科技(北京)有限公司 一种优化的3`utr序列及其应用

Family Cites Families (124)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4897355A (en) 1985-01-07 1990-01-30 Syntex (U.S.A.) Inc. N[ω,(ω-1)-dialkyloxy]- and N-[ω,(ω-1)-dialkenyloxy]-alk-1-yl-N,N,N-tetrasubstituted ammonium lipids and uses therefor
ES2121803T3 (es) 1987-05-20 1998-12-16 Novartis Ag Plantas de zea mays y plantas transgenicas de zea mays generadas a partir de protoplastos o celulas derivadas de protoplastos.
RU2126047C1 (ru) 1987-05-29 1999-02-10 Новартис Аг Способ получения растений zea mays l., устойчивых к повреждениям, вызываемым насекомыми
US5804381A (en) 1996-10-03 1998-09-08 Cornell Research Foundation Isolated nucleic acid molecule encoding an esophageal cancer associated antigen, the antigen itself, and uses thereof
US5703055A (en) 1989-03-21 1997-12-30 Wisconsin Alumni Research Foundation Generation of antibodies through lipid mediated DNA delivery
US5264618A (en) 1990-04-19 1993-11-23 Vical, Inc. Cationic lipids for intracellular delivery of biologically active molecules
WO1991019806A1 (en) 1990-06-18 1991-12-26 Monsanto Company Increased starch content in plants
US6235525B1 (en) 1991-05-23 2001-05-22 Ludwig Institute For Cancer Research Isolated nucleic acid molecules coding for tumor rejection antigen precursor MAGE-3 and uses thereof
NL9300646A (nl) 1992-12-28 1994-07-18 Stichting Scheikundig Onderzoe Werkwijze voor het verkrijgen van transgene planten welke een gemodificeerd fructaan-patroon vertonen.
AU5843794A (en) 1992-12-28 1994-07-19 Stichting Scheikundig Onderzoek In Nederland Method for obtaining transgenic plants showing a modified fructan pattern
US7422902B1 (en) 1995-06-07 2008-09-09 The University Of British Columbia Lipid-nucleic acid particles prepared via a hydrophobic lipid-nucleic acid complex intermediate and use for gene transfer
DE69723434T2 (de) 1996-04-26 2004-05-19 Rijksuniversiteit Te Leiden Verfahren zur selektion und produktion von t-zell-peptide epitope und vakzine mit diese epitope
EP0938298B1 (en) 1996-09-13 2002-12-04 Lipoxen Technologies Limited Liposome-based composition
EP0839912A1 (en) 1996-10-30 1998-05-06 Instituut Voor Dierhouderij En Diergezondheid (Id-Dlo) Infectious clones of RNA viruses and vaccines and diagnostic assays derived thereof
US6074645A (en) 1996-11-12 2000-06-13 City Of Hope Immuno-reactive peptide CTL epitopes of human cytomegalovirus
EP1029050A1 (en) 1997-11-06 2000-08-23 Roche Diagnostics GmbH Tumor-specific antigens, methods for their production and their use for immunization and diagnosis
US6432925B1 (en) 1998-04-16 2002-08-13 John Wayne Cancer Institute RNA cancer vaccine and methods for its use
JP2002526421A (ja) 1998-10-05 2002-08-20 ジェンザイム・コーポレーション 癌細胞に差別的に発現する癌ワクチン設計のための遺伝子
WO2000050592A1 (en) 1999-02-24 2000-08-31 Genetics Institute, Inc. Secreted proteins and polynucleotides encoding them
BR0010322A (pt) 1999-05-06 2002-04-09 Univ Wake Forest Vetor de expressão, vacina e seu método de uso para eliciar uma resposta imune dirigida contra um antìgeno em um mamìfero
JP5640237B2 (ja) 1999-11-30 2014-12-17 ルードヴィッヒ インスティテュート フォー キャンサー リサーチ リミテッド 癌関連抗原をコードする単離された核酸分子、その抗原そのものおよびその使用
ATE366582T1 (de) 1999-12-28 2007-08-15 Pharmexa Inc Optimierte minigene und dadurch kodierte peptide
US7462354B2 (en) 1999-12-28 2008-12-09 Pharmexa Inc. Method and system for optimizing minigenes and peptides encoded thereby
AR044724A1 (es) 2000-03-27 2005-10-05 Syngenta Participations Ag Promotores del virus de la rizadura amarilla del cestrum
CA2412026A1 (en) 2000-06-07 2001-12-13 Biosynexus Incorporated Immunostimulatory rna/dna hybrid molecules
US6472176B2 (en) 2000-12-14 2002-10-29 Genvec, Inc. Polynucleotide encoding chimeric protein and related vector, cell, and method of expression thereof
DE50214200D1 (de) * 2001-06-05 2010-03-25 Curevac Gmbh Stabilisierte Tumorantigen-mRNA mit erhöhtem G/C-Gehalt
EP1444326A4 (en) * 2001-08-24 2006-06-28 Advanced Cell Tech Inc SCREENING ASSAYS FOR IDENTIFICATION OF AGENTS INDUCING DIFFERENTIATION, AND PRODUCTION OF CELLS DIFFERENTIATED FOR CELL THERAPY
DE10162480A1 (de) 2001-12-19 2003-08-07 Ingmar Hoerr Die Applikation von mRNA für den Einsatz als Therapeutikum gegen Tumorerkrankungen
AUPS054702A0 (en) 2002-02-14 2002-03-07 Immunaid Pty Ltd Cancer therapy
KR20050016410A (ko) * 2002-05-17 2005-02-21 베일러 칼리지 오브 메디신 도세탁셀 약제민감성 및 약제내성을 예측하는 특징적인유전자 발현 패턴
ATE519115T1 (de) 2002-06-13 2011-08-15 Merck Patent Gmbh Verfahren für die identifizierung von allo- antigenen und ihre verwendung für krebstherapie und transplantation
DE10229872A1 (de) 2002-07-03 2004-01-29 Curevac Gmbh Immunstimulation durch chemisch modifizierte RNA
US7393653B2 (en) 2002-09-06 2008-07-01 The Burnham Institute Methods of modulating cell death based on the Bit1/AES regulatory pathway
KR100710519B1 (ko) 2002-10-09 2007-04-24 (주)씨아이디 일본뇌염 바이러스의 신규한 전체-길이의 게놈 RNA 및상기 JEV 게놈 RNA에 대한 감염성이 있는 JEVcDNA 및 이것의 용도
DE10344799A1 (de) 2003-09-26 2005-04-14 Ganymed Pharmaceuticals Ag Identifizierung von Oberflächen-assoziierten Antigenen für die Tumordiagnose und -therapie
EP2286794B8 (en) 2003-10-15 2016-06-01 SynCore Biotechnology CO., LTD Use of cationic liposomes comprising paclitaxel
CN1898569A (zh) 2003-10-24 2007-01-17 伊缪因艾德有限公司 治疗方法
US7303881B2 (en) 2004-04-30 2007-12-04 Pds Biotechnology Corporation Antigen delivery compositions and methods of use
DE102004023187A1 (de) 2004-05-11 2005-12-01 Ganymed Pharmaceuticals Ag Identifizierung von Oberflächen-assoziierten Antigenen für die Tumordiagnose und -therapie
DE102004057303A1 (de) 2004-11-26 2006-06-01 Merck Patent Gmbh Stabile Kristallmodifikationen von DOTAP Chlorid
WO2006071990A2 (en) 2004-12-29 2006-07-06 Mannkind Corporation Methods to bypass cd+4 cells in the induction of an immune response
GB0507997D0 (en) 2005-02-01 2005-05-25 Powderject Vaccines Inc Nucleic acid constructs
CN101213297B (zh) 2005-05-09 2013-02-13 小野药品工业株式会社 程序性死亡-1(pd-1)的人单克隆抗体及单独使用或与其它免疫治疗剂联合使用抗pd-1抗体来治疗癌症的方法
KR101411165B1 (ko) 2005-07-01 2014-06-25 메다렉스, 엘.엘.시. 예정 사멸 리간드 1 (피디-엘1)에 대한 인간 모노클로날항체
ES2735531T3 (es) 2005-08-23 2019-12-19 Univ Pennsylvania ARN que contiene nucleósidos modificados y métodos de uso del mismo
DE102005041616B4 (de) 2005-09-01 2011-03-17 Johannes-Gutenberg-Universität Mainz Melanom-assoziierte MHC Klasse I assoziierte Oligopeptide und für diese kodierende Polynukleotide und deren Verwendungen
EP1762575A1 (en) 2005-09-12 2007-03-14 Ganymed Pharmaceuticals AG Identification of tumor-associated antigens for diagnosis and therapy
DE102005046490A1 (de) * 2005-09-28 2007-03-29 Johannes-Gutenberg-Universität Mainz Modifikationen von RNA, die zu einer erhöhten Transkriptstabilität und Translationseffizienz führen
DE602005026186D1 (de) * 2005-12-12 2011-03-10 Riyadh Sa 3-nichttranslatierte hybridbereiche mit eignung zur effizienten proteinexpression in säugerzellen
EP1994181A4 (en) 2006-02-27 2010-05-19 Univ Arizona IDENTIFICATION AND USE OF NOVOPEPTIDES FOR THE TREATMENT OF CANCER
US20090275633A1 (en) 2006-04-13 2009-11-05 Oncomethylome Sciences Sa Novel Tumour Suppressor
US20090304711A1 (en) 2006-09-20 2009-12-10 Drew Pardoll Combinatorial Therapy of Cancer and Infectious Diseases with Anti-B7-H1 Antibodies
DE102006060824B4 (de) 2006-12-21 2011-06-01 Johannes-Gutenberg-Universität Mainz Nachweis von individuellen T-Zell-Reaktionsmustern gegen Tumor-assoziierte Antigene (TAA) in Tumorpatienten als Basis für die individuelle therapeutische Vakzinierung von Patienten
EP2133365B1 (en) 2006-12-27 2017-05-17 Emory University Compositions and methods for the treatment of infections and tumors
WO2008112127A2 (en) * 2007-03-08 2008-09-18 Switchgear Genomics Functional arrays for high throughput characterization of regulatory elements in untranslated regions of genes
US8877206B2 (en) 2007-03-22 2014-11-04 Pds Biotechnology Corporation Stimulation of an immune response by cationic lipids
US8140270B2 (en) 2007-03-22 2012-03-20 National Center For Genome Resources Methods and systems for medical sequencing analysis
KR101586617B1 (ko) 2007-06-18 2016-01-20 머크 샤프 앤 도메 비.브이. 사람 프로그램된 사멸 수용체 pd-1에 대한 항체
CA2715078C (en) 2007-09-26 2019-07-23 Intrexon Corporation Synthetic 5'utrs, expression vectors, and methods for increasing transgene expression
EP2060583A1 (en) 2007-10-23 2009-05-20 Ganymed Pharmaceuticals AG Identification of tumor-associated markers for diagnosis and therapy
CN103396415B (zh) 2008-03-24 2016-08-10 4Sc股份有限公司 新的取代的咪唑并喹啉化合物
CA2721366C (en) 2008-04-17 2017-06-06 Elizabeth Ann Vasievich Stimulation of an immune response by enantiomers of cationic lipids
WO2010037402A1 (en) * 2008-10-02 2010-04-08 Dako Denmark A/S Molecular vaccines for infectious disease
DE102008061522A1 (de) 2008-12-10 2010-06-17 Biontech Ag Verwendung von Flt3-Ligand zur Verstärkung von Immunreaktionen bei RNA-Immunisierung
DK2459231T3 (en) 2009-07-31 2016-09-05 Ethris Gmbh RNA with a combination of unmodified and modified nucleotides for protein expression
WO2011075838A1 (en) 2009-12-21 2011-06-30 Audigen Inc. Method of treating or preventing hearing loss
WO2013040142A2 (en) 2011-09-16 2013-03-21 Iogenetics, Llc Bioinformatic processes for determination of peptide binding
KR102095670B1 (ko) 2010-05-14 2020-03-31 더 제너럴 하스피톨 코포레이션 종양 특이적 신생항원을 확인하는 조성물 및 방법
HUE058896T2 (hu) 2010-10-01 2022-09-28 Modernatx Inc N1-metil-pszeudo-uracilt tartalmazó ribonukleinsavak és azok felhasználásai
US8710200B2 (en) 2011-03-31 2014-04-29 Moderna Therapeutics, Inc. Engineered nucleic acids encoding a modified erythropoietin and their expression
DE102011102734A1 (de) 2011-05-20 2012-11-22 WMF Württembergische Metallwarenfabrik Aktiengesellschaft Vorrichtung zum Aufschäumen von Milch, Getränkebereiter mit dieser Vorrichtung und Verfahren zum Aufschäumen von Milch
RS62993B1 (sr) 2011-10-03 2022-03-31 Modernatx Inc Modifikovani nukleozidi, nukleotidi, i nukleinske kiseline, i njihove upotrebe
CN104114572A (zh) 2011-12-16 2014-10-22 现代治疗公司 经修饰的核苷、核苷酸和核酸组合物
RU2491343C1 (ru) 2011-12-23 2013-08-27 Общество с ограниченной ответственностью "Биотехнологический центр трансгенеза в фарминдустрии "Трансгенфарм" Генетические конструкции ltf3, ltf5, ltf7, ltf10, ltf11 для получения рекомбинантного лактоферрина человека (варианты)
US20150030576A1 (en) 2012-01-10 2015-01-29 Moderna Therapeutics, Inc. Methods and compositions for targeting agents into and across the blood-brain barrier
WO2013120497A1 (en) * 2012-02-15 2013-08-22 Curevac Gmbh Nucleic acid comprising or coding for a histone stem-loop and a poly(a) sequence or a polyadenylation signal for increasing the expression of an encoded therapeutic protein
EP3072898A1 (en) 2012-02-20 2016-09-28 Universita' degli Studi di Milano Homo- and heterodimeric smac mimetic compounds as apoptosis inducers
JP6295512B2 (ja) 2012-03-15 2018-03-20 株式会社豊田中央研究所 酵母における外来遺伝子の発現産物の生産方法、酵母における発現調節剤及びその利用
MX358706B (es) * 2012-03-27 2018-08-31 Curevac Ag Moleculas de acido nucleico artificiales que comprenden un top 5´utr.
DK3578659T3 (da) * 2012-03-27 2024-02-05 CureVac SE Kunstige nukelinsyremolekyler til forbedret protein- eller peptidekspression
SG10201607962RA (en) * 2012-03-27 2016-11-29 Curevac Ag Artificial nucleic acid molecules
US20130255281A1 (en) 2012-03-29 2013-10-03 General Electric Company System and method for cooling electrical components
DE18200782T1 (de) 2012-04-02 2021-10-21 Modernatx, Inc. Modifizierte polynukleotide zur herstellung von proteinen im zusammenhang mit erkrankungen beim menschen
CN104662171B (zh) 2012-07-12 2018-07-13 普瑟姆尼股份有限公司 个性化癌症疫苗和过继免疫细胞治疗
JP2015524672A (ja) 2012-08-17 2015-08-27 ダウ アグロサイエンシィズ エルエルシー 植物における導入遺伝子発現のためのトウモロコシ非翻訳領域の使用
RU2711249C2 (ru) 2012-11-01 2020-01-15 Фэктор Байосайенс Инк. Способы и продукты для экспрессии белков в клетках
EP4074834A1 (en) 2012-11-26 2022-10-19 ModernaTX, Inc. Terminally modified rna
EP2931319B1 (en) 2012-12-13 2019-08-21 ModernaTX, Inc. Modified nucleic acid molecules and uses thereof
WO2014164253A1 (en) 2013-03-09 2014-10-09 Moderna Therapeutics, Inc. Heterologous untranslated regions for mrna
EP2968391A1 (en) 2013-03-13 2016-01-20 Moderna Therapeutics, Inc. Long-lived polynucleotide molecules
US20160032316A1 (en) 2013-03-14 2016-02-04 The Trustees Of The University Of Pennsylvania Purification and Purity Assessment of RNA Molecules Synthesized with Modified Nucleosides
EP2971010B1 (en) 2013-03-14 2020-06-10 ModernaTX, Inc. Formulation and delivery of modified nucleoside, nucleotide, and nucleic acid compositions
EP2971165A4 (en) 2013-03-15 2016-11-23 Moderna Therapeutics Inc DISSOLUTION OF DNA FRAGMENTS IN MRNA MANUFACTURING METHODS
US20160032273A1 (en) 2013-03-15 2016-02-04 Moderna Therapeutics, Inc. Characterization of mrna molecules
WO2014144767A1 (en) 2013-03-15 2014-09-18 Moderna Therapeutics, Inc. Ion exchange purification of mrna
US11377470B2 (en) 2013-03-15 2022-07-05 Modernatx, Inc. Ribonucleic acid purification
WO2014144711A1 (en) 2013-03-15 2014-09-18 Moderna Therapeutics, Inc. Analysis of mrna heterogeneity and stability
WO2014152027A1 (en) 2013-03-15 2014-09-25 Moderna Therapeutics, Inc. Manufacturing methods for production of rna transcripts
KR102341899B1 (ko) 2013-04-07 2021-12-21 더 브로드 인스티튜트, 인코퍼레이티드 개인맞춤화 신생물 백신을 위한 조성물 및 방법
WO2014184684A2 (en) 2013-05-16 2014-11-20 Oslo Universitetssykehus Hf Methods and biomarkers for detection of hematological cancers
RU2535871C1 (ru) 2013-07-10 2014-12-20 Общество с ограниченной ответственностью "Лаборатория медицинской биотехнологии" (ООО "ЛМБТ") Плазмида для экспрессии в клетке китайского хомячка, клетка китайского хомячка - продуцент белка с Gla-доменом и способ получения белка с Gla-доменом
WO2015014375A1 (en) 2013-07-30 2015-02-05 Biontech Ag Tumor antigens for determining cancer therapy
AU2014315287A1 (en) 2013-09-03 2015-03-12 Moderna Therapeutics, Inc. Chimeric polynucleotides
EP3041938A1 (en) 2013-09-03 2016-07-13 Moderna Therapeutics, Inc. Circular polynucleotides
EP3043826A4 (en) 2013-09-13 2017-05-24 Moderna Therapeutics, Inc. Polynucleotide compositions containing amino acids
WO2015043613A1 (en) 2013-09-26 2015-04-02 Biontech Ag Particles comprising a shell with rna
WO2015051173A2 (en) 2013-10-02 2015-04-09 Moderna Therapeutics, Inc Polynucleotide molecules and uses thereof
US10385088B2 (en) 2013-10-02 2019-08-20 Modernatx, Inc. Polynucleotide molecules and uses thereof
WO2015058780A1 (en) 2013-10-25 2015-04-30 Biontech Ag Method and kit for determining whether a subject shows an immune response
WO2015085318A2 (en) 2013-12-06 2015-06-11 Moderna Therapeutics, Inc. Targeted adaptive vaccines
EP3053585A1 (en) 2013-12-13 2016-08-10 Moderna Therapeutics, Inc. Alternative nucleic acid molecules and uses thereof
KR102399799B1 (ko) * 2013-12-30 2022-05-18 큐어백 아게 인공 핵산 분자
JP6584414B2 (ja) * 2013-12-30 2019-10-02 キュアバック アーゲー 人工核酸分子
JP2017507703A (ja) 2014-02-05 2017-03-23 バイオエヌテック アーゲーBioNTech AG カニューレ、注射または注入装置、およびカニューレまたは注射もしくは注入装置を使用する方法
HUE051311T2 (hu) * 2014-03-09 2021-03-01 Univ Pennsylvania Ornitin transzkarbamiláz (TC) deficiencia kezelésében alkalmas készítmények
PT3134131T (pt) 2014-04-23 2022-03-24 Modernatx Inc Vacinas de ácidos nucleicos
WO2015172843A1 (en) 2014-05-16 2015-11-19 Biontech Diagnostics Gmbh Methods and kits for the diagnosis of cancer
WO2016005004A1 (en) * 2014-07-11 2016-01-14 Biontech Rna Pharmaceuticals Gmbh Stabilization of poly(a) sequence encoding dna sequences
WO2016062323A1 (en) 2014-10-20 2016-04-28 Biontech Ag Methods and compositions for diagnosis and treatment of cancer
ES2791152T3 (es) * 2014-12-12 2020-11-03 Curevac Ag Moléculas de ácido nucleico artificiales para una expresión proteica mejorada
EP3240558A1 (en) 2014-12-30 2017-11-08 CureVac AG Artificial nucleic acid molecules
WO2016155809A1 (en) 2015-03-31 2016-10-06 Biontech Rna Pharmaceuticals Gmbh Lipid particle formulations for delivery of rna and water-soluble therapeutically effective compounds to a target cell
WO2017059902A1 (en) * 2015-10-07 2017-04-13 Biontech Rna Pharmaceuticals Gmbh 3' utr sequences for stabilization of rna

Also Published As

Publication number Publication date
ES2866224T3 (es) 2021-10-19
LT3636764T (lt) 2021-05-10
IL284651B (en) 2022-06-01
EP3636764B1 (en) 2021-03-03
KR20220025195A (ko) 2022-03-03
JP7084565B2 (ja) 2022-06-15
RU2018112325A (ru) 2019-11-07
HRP20191907T1 (hr) 2020-02-07
CN108291230B (zh) 2022-12-20
PT3337902T (pt) 2019-10-30
AU2023278107A1 (en) 2024-01-04
IL258074B (en) 2021-07-29
PL3337902T3 (pl) 2020-01-31
PT3636764T (pt) 2021-03-25
JP2021129563A (ja) 2021-09-09
JP2018530332A (ja) 2018-10-18
EP3868885A1 (en) 2021-08-25
JP6844060B1 (ja) 2021-03-17
AU2021206886B2 (en) 2023-12-14
JP7084302B2 (ja) 2022-06-14
HK1256701A1 (zh) 2019-10-04
PL3636764T3 (pl) 2021-07-05
LT3337902T (lt) 2019-12-10
EP3337902B1 (en) 2019-09-25
IL293020A (en) 2022-07-01
MX2021000250A (es) 2021-04-12
US20230272406A1 (en) 2023-08-31
RU2018112325A3 (es) 2019-11-07
CY1124066T1 (el) 2022-05-27
BR112018003486A2 (pt) 2018-09-25
CN108291230A (zh) 2018-07-17
AU2021206886A1 (en) 2021-08-12
IL258074A (en) 2018-05-31
JP2021048847A (ja) 2021-04-01
SG10201912558YA (en) 2020-02-27
RS59538B1 (sr) 2019-12-31
SI3337902T1 (sl) 2019-12-31
RS61684B1 (sr) 2021-05-31
AU2016335029A1 (en) 2018-04-19
CY1122347T1 (el) 2021-01-27
HUE055152T2 (hu) 2021-11-29
MX2018004160A (es) 2018-08-01
AU2016335029B2 (en) 2021-04-29
KR20180057647A (ko) 2018-05-30
CA2998554C (en) 2024-04-30
NZ740946A (en) 2022-08-26
BR112018003486B1 (pt) 2023-09-26
EP3337902A2 (en) 2018-06-27
HRP20210449T1 (hr) 2021-10-01
ES2753201T8 (es) 2020-04-16
SI3636764T1 (sl) 2021-07-30
BR122021025194A8 (pt) 2023-01-31
JP7277506B2 (ja) 2023-05-19
BR122021025194A2 (es) 2018-09-25
HK1258262A1 (zh) 2019-11-08
KR102363368B1 (ko) 2022-02-16
CA3223575A1 (en) 2017-04-13
US11492628B2 (en) 2022-11-08
RU2720934C2 (ru) 2020-05-14
WO2017060314A2 (en) 2017-04-13
WO2017059902A1 (en) 2017-04-13
US20190071682A1 (en) 2019-03-07
CA2998554A1 (en) 2017-04-13
JP2022050390A (ja) 2022-03-30
DK3337902T3 (da) 2019-11-04
WO2017060314A3 (en) 2017-05-18
DK3636764T3 (da) 2021-03-22
JP2021048848A (ja) 2021-04-01
EP3636764A1 (en) 2020-04-15
IL284651A (en) 2021-08-31
ZA201800835B (en) 2020-05-27
BR122021025194B1 (pt) 2023-09-26
HUE046982T2 (hu) 2020-04-28

Similar Documents

Publication Publication Date Title
ES2753201T3 (es) Secuencias UTR 3&#39; para la estabilización del ARN
ES2676470T3 (es) Método para la expresión de ARN en células
JP6131433B2 (ja) 細胞rna発現のための方法
ES2467678T3 (es) Modificación del ARN, que produce unas estabilidad de transcripción y eficiencia de traducción aumentadas
EP3681901B1 (en) Method of enhancing rna expression in a cell
RU2783165C1 (ru) Последовательности 3&#39;-utr для стабилизации рнк