ES2849728T3 - Selectividad eficiente de proteínas recombinantes - Google Patents

Selectividad eficiente de proteínas recombinantes Download PDF

Info

Publication number
ES2849728T3
ES2849728T3 ES15833421T ES15833421T ES2849728T3 ES 2849728 T3 ES2849728 T3 ES 2849728T3 ES 15833421 T ES15833421 T ES 15833421T ES 15833421 T ES15833421 T ES 15833421T ES 2849728 T3 ES2849728 T3 ES 2849728T3
Authority
ES
Spain
Prior art keywords
cell
goi
gene
seq
protein
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
ES15833421T
Other languages
English (en)
Inventor
Dipali Deshpande
Darya Burakov
Gang Chen
James Fandl
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Regeneron Pharmaceuticals Inc
Original Assignee
Regeneron Pharmaceuticals Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Regeneron Pharmaceuticals Inc filed Critical Regeneron Pharmaceuticals Inc
Application granted granted Critical
Publication of ES2849728T3 publication Critical patent/ES2849728T3/es
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K16/00Immunoglobulins [IGs], e.g. monoclonal or polyclonal antibodies
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/85Vectors or expression systems specially adapted for eukaryotic hosts for animal cells
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P21/00Preparation of peptides or proteins
    • C12P21/005Glycopeptides, glycoproteins
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2319/00Fusion polypeptide
    • C07K2319/30Non-immunoglobulin-derived peptide or protein having an immunoglobulin constant or Fc region, or a fragment thereof, attached thereto
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2510/00Genetically modified cells
    • C12N2510/02Cells for production
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2840/00Vectors comprising a special translation-regulating system
    • C12N2840/20Vectors comprising a special translation-regulating system translation of more than one cistron
    • C12N2840/203Vectors comprising a special translation-regulating system translation of more than one cistron having an IRES

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Organic Chemistry (AREA)
  • Genetics & Genomics (AREA)
  • Engineering & Computer Science (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Biotechnology (AREA)
  • General Engineering & Computer Science (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biochemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Microbiology (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • General Chemical & Material Sciences (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Physics & Mathematics (AREA)
  • Plant Pathology (AREA)
  • Immunology (AREA)
  • Medicinal Chemistry (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)
  • Peptides Or Proteins (AREA)
  • Enzymes And Modification Thereof (AREA)

Abstract

Una célula aislada que comprende: (a) un gen de resistencia a tunicamicina (Tn) de mamíferos que codifica una proteína que tiene al menos 93 % de identidad con la secuencia de aminoácidos de la SEQ ID NO: 3, en donde el gen de resistencia a Tn se añade exógenamente a la célula; (b) un primer gen de interés (GOI), en donde el primer GOI es un GOI añadido exógenamente; y (c) al menos un elemento regulador, en donde el gen de resistencia a Tn se une operativamente al primer GOI y al menos a un elemento regulador, en donde la célula es una célula de mamífero, y en donde el primer GOI codifica una cadena ligera de anticuerpo o fragmento de unión al antígeno del mismo, una cadena pesada de anticuerpo o fragmento de unión al antígeno del mismo, o una proteína de fusión a Fc o un fragmento de la misma.

Description

DESCRIPCIÓN
Selectividad eficiente de proteínas recombinantes
Antecedentes
Campo de la invención
La invención proporciona para la expresión de proteínas recombinantes en células de mamíferos de una manera consistente y eficiente. En particular, la invención incluye métodos y composiciones para la expresión potenciada de proteínas en células de mamíferos mediante empleo de marcadores de selección de mamíferos. La invención incluye métodos que facilitan la selectividad y las copias de expresión potenciada así como también el rendimiento proteico de proteínas recombinantes en células de mamíferos, y métodos de uso de tales sistemas de expresión.
Descripción de la técnica relacionada
El desarrollo de sistemas de expresión celular es un objetivo importante para proporcionar una fuente confiable y eficiente de una proteína dada para investigación y uso terapéutico. La expresión de proteína recombinante en células de mamíferos a menudo se prefiere para fabricar proteínas terapéuticas debido, por ejemplo, a la capacidad de los sistemas de expresión de mamíferos para modificar apropiadamente las proteínas recombinantes postraduccionalmente.
Diversos vectores están disponibles para la expresión en huéspedes de mamíferos, cada uno de los cuales contiene marcadores de selección que permiten el fácil aislamiento de células que expresan proteínas recombinantes durante el cultivo celular. Los genes marcadores seleccionables (SMG, por sus siglas en inglés) se utilizan en dichos sistemas porque confieren una ventaja selectiva para las células que expresan la proteína de interés; sin embargo, los SMG deben optimizarse por su neutralidad fenotípica, eficiencia y versatilidad, entre otras razones. El documento WO 2009/066919 describe el uso de un gen de UDP-N-acetil-D-glucoasima:fosfato de dolicol-N-acetilglucosaminafosfotransferasa de patata como marcador para seleccionar transformantes vegetales. El acceso de entrada de Uniprot No. G31967 se refiere a la información de secuencia para un gen UDP-N-acetil-D-glucoasima:fosfato de dolicol- N-acetilglucosamina-fosfotransferasa de la línea celular de ovario de hámster chino (CHO)-K1. Socca y Krag J. Biol. Chem. (1990) 265(33): 20621-20626 describe la secuencia de un ADNc que especifica la uridina difosfato N-acetil-D-glucoasima:fosfato de dolicol N- acetilglucosamina-1-fospato transferasa de células de ovario de hámster chino.
A pesar de la disponibilidad de numerosos vectores y sistemas de expresión que hospedan SMG, la expresión de una proteína recombinante lograda en sistemas de mamíferos a menudo es insatisfactoria, ya sea en cantidad o calidad o ambas. La “huella dactilar” biológica de una molécula, por ejemplo, modificaciones postraduccionales como la glicosilación, es de particular importancia en la definición de la utilidad y eficacia de la molécula en el desarrollo de una proteína terapéutica recombinante (Cumming, D.A., 1990, Glycobiology, 1 (2):115-130). Los SMG que no afectan negativamente las propiedades biológicas de una proteína de interés expresada son particularmente ventajosos.
La mayoría de los SMG son de origen bacteriano e imparten otras desventajas para usar en sistemas de mamíferos debido a la creciente preocupación por el riesgo de transferencia horizontal de genes de resistencia a antibióticos bacterianos a bacterias ambientales (Breyer, D. y otros, 2014, Critical Reviews in Plant Sciences 33:286- 330). La eliminación del uso de genes de resistencia a antibióticos bacterianos podría tener efectos positivos en la aceptación del consumidor y aliviar dichos riesgos percibidos.
Las células autólogas producidas por ingeniería genética se convierten rápidamente en un éxito clínico (véase, por ejemplo, Kershaw, M.H. y otros, 2013, Nature Reviews: Cancer 13:525-541). La elección y el diseño de vectores para modificaciones genéticas en productos de células autólogas humanas es crítica, especialmente dado que la introducción no deseada de componentes no humanos en una célula autóloga humana podría tener consecuencias graves para la seguridad del paciente (Eaker, y otros 2013, Stem cells Trans. Med. 2:871-883; publicado por primera vez en línea en SCTMEXPRESS el 7 de octubre de 2013). Un sistema de vectores que solo tenga componentes de origen mamífero, en lugar de bacteriano, sería ventajoso para usar en células T específicas de pacientes para la inmunoterapia adoptiva.
Por lo tanto, es conveniente introducir genes de selectividad de mamíferos, especialmente aquellos que dan a las células transformadas una ventaja fenotípica o metabólica en sistemas de expresión para la producción de proteínas de interés de mamíferos. Además, una línea celular que expresa de manera fiable niveles suficientemente altos de una proteína terapéutica, y que modifica de manera apropiada y consistente la proteína postraduccionalmente terapéutica, es muy conveniente. En consecuencia, existe una necesidad en la técnica de sistemas de expresión de mamíferos mejorados.
Breve resumen
El uso de un gen de resistencia a tunicamicina (Tn) de mamíferos como un marcador seleccionable en un sistema de expresión de mamíferos puede aumentar la eficiencia y el número de copias de transfectantes. Se ha observado que el uso de un gen de resistencia a Tn unido operativamente a un gen de interés crea presión selectiva en una población de células de mamíferos, lo que aumenta la integración aleatoria del transfectante (es decir, el gen de interés). Se entiende que los sistemas de marcadores seleccionables pueden fomentar la selección de los transfectantes deseados, sin embargo, los métodos de la invención brindan un aumento inesperado tanto en la eficiencia como en la integración aleatoria del gen de interés, así como también en las cualidades biológicas confiables de la proteína deseada. Las composiciones y métodos de la invención permiten, por lo tanto, la selección ventajosa de modificaciones postraduccionales cualitativamente favorables para las proteínas expresadas.
La presente invención proporciona una célula aislada que comprende: (a) un gen de resistencia a tunicamicina (Tn) de mamíferos que codifica una proteína que tiene al menos 93 % de identidad con la secuencia de aminoácidos de la SEQ ID NO: 3, en donde el gen de resistencia a Tn se añade exógenamente a la célula; (b) un primer gen de interés (GOI), en donde el primer GOI es un GOI añadido exógenamente; y (c) al menos un elemento regulador, en donde el gen resistente a Tn se une operativamente al primer GOI y al menos a un elemento regulador, en donde la célula es una célula de mamífero, y en donde el primer GOI codifica una cadena ligera de anticuerpo o fragmento de unión al antígeno del mismo, una cadena pesada de anticuerpo o fragmento de unión al antígeno del mismo, o una proteína de fusión a Fc o un fragmento de la misma.
La presente invención proporciona además un vector que comprende un ácido nucleico, en donde el ácido nucleico comprende un gen de resistencia a tunicamicina (Tn) de mamíferos que codifica una proteína que tiene al menos 93 % de identidad con la secuencia de aminoácidos de la SEQ ID NO: 3, un primer gen de interés (GOI) unido operativamente al gen de resistencia a Tn, y al menos un elemento regulador, y en donde el primer GOI codifica una cadena ligera de anticuerpo o fragmento de unión al antígeno del mismo, una cadena pesada de anticuerpo o fragmento de unión al antígeno del mismo, o una proteína de fusión a Fc o un fragmento de la misma.
La presente invención proporciona además un método, que comprende (a) introducir un vector que comprende un ácido nucleico en una población de células huésped de mamíferos mediante transfección, en donde el ácido nucleico comprende un gen de resistencia a tunicamicina (Tn) de mamíferos que codifica una proteína que tiene al menos 93 % de identidad con la secuencia de aminoácidos de la SEQ ID NO: 3, un primer gen de interés (GOI) unido operativamente al gen de resistencia a Tn, y al menos un elemento regulador; (b) cultivar la población celular de la etapa (a) en presencia de Tn, obtener de esta manera un transfectante celular que comprende el ácido nucleico del vector.
La presente invención proporciona además un método para producir una proteína recombinante de interés (POI), en donde el método comprende: (a) proporcionar una célula huésped de mamífero que comprende: (i) un gen de resistencia a tunicamicina (Tn) de mamíferos que codifica una proteína que tiene al menos 93 % de identidad con la secuencia de aminoácidos de la SEQ ID NO: 3, en donde el gen de resistencia a Tn se añade exógenamente a la célula; (ii) un primer gen de interés (GOI), en donde el primer GOI es un GOI añadido exógenamente; y (iii) al menos un elemento regulador, en donde el gen resistente a Tn se une operativamente al primer GOI y al menos a un elemento regulador; y (b) cultivar la célula en presencia de Tn para expresar una POI a partir del GOI. Además se describe en la presente descripción una célula aislada que comprende un gen de resistencia a tunicamicina (Tn) de mamíferos que codifica una proteína que tiene al menos 93 % de identidad con la secuencia de aminoácidos de la SEQ ID NO:3, unido operativamente a un gen de interés (GOI) y al menos un elemento regulador.
Además se describe en la presente descripción un método para producir una proteína recombinante de interés (POI), en donde el método comprende: proporcionar una célula huésped de mamífero que codifica una molécula de ácido nucleico que comprende (i) un gen de resistencia a tunicamicina (Tn) de mamíferos y (ii) un gen que codifica la POI; cultivar la célula en presencia de una primera concentración de Tn; aislar una población celular que expresa al menos una copia del gen de resistencia a Tn; cultivar la población celular en presencia de concentraciones crecientes de Tn, en donde al aumentar la concentración de Tn aumenta la producción de la POI; y aislar la POI del cultivo celular.
Además se describe en la presente descripción un método para glicosilar un sustrato proteico N-glicano, en donde el método comprende: proporcionar una célula huésped de mamífero que codifica una molécula de ácido nucleico que comprende un gen de resistencia a tunicamicina (Tn) de mamíferos unido operativamente a un gen que codifica el sustrato proteico que necesita glicosilación; cultivar la célula en presencia de una primera concentración de Tn; aislar una población celular que expresa al menos una copia del gen de resistencia a Tn; cultivar la población celular en presencia de concentraciones crecientes de Tn, en donde al aumentar la concentración de Tn aumenta la producción de la POI; y aislar el sustrato proteico del cultivo celular.
En algunos de los métodos descritos en la presente descripción, el gen de resistencia a Tn se une operativamente al gen que codifica la POI, y el gen que codifica la POI se une operativamente a al menos un elemento regulador.
De acuerdo con la presente invención, el gen de resistencia a Tn se añade exógenamente a la célula. De acuerdo con la presente invención, el gen de resistencia a Tn codifica la proteína que tiene al menos 93 % de identidad con la secuencia de aminoácidos de la SEQ ID NO:3. En otras modalidades, el gen de resistencia a Tn codifica la proteína que tiene al menos 94 % de identidad con la secuencia de aminoácidos de la SEQ ID NO:3. El gen de resistencia a Tn descrito en la presente descripción puede codificar una proteína que tiene al menos 93 % de identidad con la secuencia de aminoácidos de la SEQ ID NO:4. El gen de resistencia a Tn descrito en la presente descripción puede codificar una proteína que tiene al menos 94 % de identidad con la secuencia de aminoácidos de la SEQ ID n O:4.
En algunas modalidades, el gen de resistencia a Tn de mamíferos comprende un gen de resistencia a Tn de hámster chino (Cricetulus griseus). En otras modalidades, el gen de resistencia a Tn de mamíferos comprende un gen de resistencia a Tn humano.
El gen de resistencia a Tn puede comprender además la secuencia de ácido nucleico seleccionada del grupo que consiste en la SEQ ID NO:2, la SEQ ID NO:11, la SEQ ID NO:12, la SEQ ID NO:13, la SEQ ID NO:14, la SEQ ID NO:15, la SEQ ID NO:16 y la SEQ ID NO:17.
En ciertas modalidades de las invenciones mencionadas anteriormente, el gen de resistencia a Tn de mamíferos comprende una secuencia de ácido nucleico que tiene al menos 92 % de identidad con la secuencia de ácido nucleico de la SEQ ID NO:2. En algunas modalidades, el gen de resistencia a Tn de mamíferos comprende una secuencia de ácido nucleico que tiene al menos 92 % de identidad con la secuencia de ácido nucleico de la SEQ ID NO: 12.
Al menos un elemento regulador unido operativamente al gen de resistencia a Tn se proporciona en la célula aislada de la invención, en donde el elemento regulador incluye, pero no se limita a un promotor, sitio de unión al ribosoma, y potenciador. Aún en otra modalidad, el GOI se une operativamente a un promotor. En otra modalidad, el GOI se une operativamente a un sitio de unión al ribosoma, tal como un IRES.
En algunas modalidades, la célula aislada, el vector y los métodos de la invención comprenden además un segundo gen de interés añadido exógenamente (GOI). En algunas modalidades, el segundo GOI codifica una glicoproteína seleccionada opcionalmente a partir de una cadena ligera de anticuerpo o fragmento de unión al antígeno del mismo, una cadena pesada de anticuerpo o fragmento de unión al antígeno del mismo, una proteína de fusión a Fc o un fragmento de la misma, un ligando, y un receptor o fragmento de unión al ligando del mismo. En otra modalidad, el GOI añadido exógenamente es un gen humano. Aún en otra modalidad, el elemento regulador es un elemento regulador añadido exógenamente.
En la célula aislada de la presente invención y el vector de la presente invención, el primer GOI codifica una cadena ligera de anticuerpo o fragmento de unión al antígeno del mismo, una cadena pesada de anticuerpo o fragmento de unión al antígeno del mismo, o una proteína de fusión a Fc o un fragmento de la misma.
En algunas modalidades de los métodos de la presente invención, el primer GOI codifica una glicoproteína seleccionada opcionalmente a partir de una cadena ligera de anticuerpo o fragmento de unión al antígeno del mismo, una cadena pesada de anticuerpo o fragmento de unión al antígeno del mismo, una proteína de fusión a Fc o un fragmento de la misma, un ligando, y un receptor o fragmento de unión al ligando del mismo.
El primer y/o segundo GOI descrito en la presente descripción puede codificar una POI que incluye, pero no se limita a, una cadena pesada de anticuerpo, cadena ligera de anticuerpo, fragmento de unión al antígeno, y/o proteína de fusión a Fc.
El primer GOI y el segundo GOI descritos en la presente descripción pueden seleccionarse independientemente del grupo que consiste en un gen que codifica para una cadena ligera de anticuerpo o un fragmento específico de antígeno del mismo, una cadena pesada de anticuerpo o un fragmento específico de antígeno del mismo, una proteína de fusión a Fc o un fragmento de la misma, y un receptor o fragmento específico de ligando del mismo. En una modalidad, un sitio de reconocimiento de recombinasa está presente entre el primer GOI y el segundo GOI. En otras modalidades, un sitio de reconocimiento de recombinasa se proporciona 5' al primer GOI y un sitio de reconocimiento de recombinasa 3' con respecto al segundo GOI.
En aún otra modalidad de los métodos de la presente invención, el GOI codifica una glicoproteína seleccionada a partir de una cadena ligera de anticuerpo o fragmento de unión al antígeno del mismo, una cadena pesada de anticuerpo o fragmento de unión al antígeno del mismo, una proteína de fusión a Fc o un fragmento de la misma, un ligando, y un receptor o fragmento de unión al ligando del mismo.
Las células aisladas de origen no natural descritas en la presente descripción pueden derivarse de una célula eucariota. La célula aislada de la presente invención es una célula de mamífero. En algunas modalidades, la célula aislada es una célula humana ex vivo. En algunas modalidades, la célula se selecciona del grupo que consiste en CHO (por ejemplo, CHO K1, DXB-11 CHO, Veggie-CHO), COS (por ejemplo, COS-7), linfocito, célula madre, célula retiniana, Vero, CV1, riñón (por ejemplo, HEK293, 293 EBNA, MSR 293, MDCK, HaK, BHK21), HeLa, HepG2, WI38, MRC 5, Colo25, HB 8065, HL-60, Jurkat, Daudi, A431 (epidérmica), CV-1, U937, 3T3, célula L, célula C127, SP2/0, NS-0, célula MMT, célula tumoral y una línea celular derivada de una célula mencionada anteriormente. En ciertas modalidades, la célula aislada de la invención es una célula CHO-K1, un linfocito, una célula retiniana o una célula madre.
En una modalidad, la primera concentración de Tn es 1 pg/mL. En otra modalidad, las concentraciones crecientes de T n comprenden una segunda y tercera concentración de Tn.
En algunas modalidades, la segunda concentración es mayor que la primera concentración de Tn, y la tercera concentración es mayor que la segunda concentración de Tn. En ciertas modalidades, la segunda concentración de Tn es 2,5 pg/mL, y la tercera concentración es 5 pg/mL.
En aún otras modalidades, las concentraciones crecientes de Tn comprenden una segunda concentración de Tn, en donde la segunda concentración de Tn es 2,5 pg/mL o 5 pg/mL.
Cualquiera de los aspectos y modalidades de la invención puede usarse junto con cualquier otro aspecto o modalidad de la invención, a menos que se especifique de otra manera o sea evidente a partir del contexto.
Otros objetos y ventajas se harán evidentes a partir de una revisión de la descripción detallada posterior.
Breve descripción de las figuras
La figura 1 ilustra un diagrama esquemático del casete de expresión operativa en un constructo de vector de clonación, usado para la introducción de la secuencia de ácido nucleico que codifica un gen de interés, por ejemplo eGFP, en un genoma celular. Promotor de SV40: Promotor del virus simio 40; GPT: GlcNAc-1-P transferasa (por ejemplo, CHO-GPT, SEQ ID NO:2; o hGPT, SEQ ID NO: 12); IRES: sitio interno de entrada al ribosoma; eGFP: proteína verde fluorescente potenciada; SV40poliA: Virus simio 40 poliA.
Las figuras 2A a 2C representan un alineamiento de secuencias de aminoácidos de GPT de mamíferos, es decir, humano (GPT_HUMAN; UniProtKB Accn. No. Q9H3H5; SEQ ID NO:4), macaco Rhesus (GPT_MACMU; UniProtKB Accn. No. F6TXM3; SEQ ID NO:5), chimpancé (GPT_PANTR; UniProtKB Accn. No. H2R346; SEQ ID NO:6), perro (GPT_CANFA; UniProtKB Accn. No. E2RQ47; SEQ ID NO:7), cobaya (GPT_CAVPO; UniProtKB Accn. No. E2RQ47; SEQ ID NO:8), rata (GPT_RAT; UniProtKB Accn. No. Q6P4Z8; SEQ ID NO:9), y ratón (GPT_MOUSE; UniProtKB Accn. No. P42867; SEQ ID NO:10) en comparación con secuencias de aminoácidos de GPT de hámster chino (GPT_CRIGR; UniProtKB Accn. No. P24140; SEQ ID NO:3).
Las figuras 3A y 3B ejemplifican cómo puede lograrse la optimización de proteínas mediante el uso de los métodos y composiciones de la invención. La figura 3A representa el método para seleccionar un transfectante celular positivo a partir de una primera mezcla de células cultivada con 1 pg/mL de tunicamicina (Tn). Posteriormente, un segundo cultivo celular con una concentración creciente de tunicamicina, por ejemplo, 2,5 pg/mL o 5 pg/mL, para mejorar la expresión de proteínas. La figura 3B: representa un método para seleccionar un transfectante celular positivo a partir de una primera mezcla de células cultivada con 1 pg/mL de tunicamicina (Tn), y luego concentraciones crecientes seriadas de Tn en cultivos celulares posteriores para optimizar la expresión de proteínas.
Las figuras 4A a 4B muestran diagramas de dispersión de FACS que representan diversos parámetros de selectividad a Higromicina. Las células CHO modificadas comprenden un gen de YFP flanqueado por sitios lox. Los marcadores de selección (gen de resistencia a antibióticos y eGFP) flanqueados por sitios lox se incorporan al sitio de YFP y sustituyen a YFP a través de integración dirigida con recombinasa Cre. Los integrantes aleatorios expresan tanto YFP como eGFP. Figura 4A: Las células se transfectan con un vector de recombinasa Cre y un vector de expresión de hpt que comprende eGFP; pero se cultivan sin higromicina en el cultivo. Figura 4B: Las células se transfectan con un vector de recombinasa Cre y un vector de expresión de hpt que comprende eGFP; en presencia de 400 pg/mL de higromicina.
Las figuras 5A a 5F muestran diagramas de dispersión de FACS que representan diversos parámetros de selectividad a Tunicamicina (Tn). Las células CHO modificadas comprenden un gen de YFP flanqueado por sitios lox. Los marcadores de selección (gen de resistencia a antibióticos y eGFP) flanqueados por sitios lox se incorporan al sitio de YFP y sustituyen a YFP a través de integración dirigida con recombinasa Cre. Los integrantes aleatorios expresan tanto YFP como eGFP. Figura 5A: Las células se transfectan con un vector de recombinasa Cre y un vector de expresión de CHO-GPT que comprende eGFP; pero sin tunicamicina en el cultivo. Figura 5B: Las células se transfectan con un vector de recombinasa Cre y un vector de expresión de CHO-GPT que comprende eGFP; en presencia de 1 pg/mL de Tn. Figura 5C: Las células se transfectan con un vector de recombinasa Cre y un vector de expresión de CHO-GPT que comprende eGFP; en presencia de 2,5 pg/mL de Tn. Figura 5D: Las células se transfectan con un vector de recombinasa Cre y un vector de expresión de GPT humana que comprende eGFP; pero sin tunicamicina en el cultivo. Figura 5E: Las células se transfectan con un vector de recombinasa Cre y un vector de expresión de GPT humana que comprende eGFP; en presencia de 1 pg/mL de Tn. Figura 5F: Las células se transfectan con un vector de recombinasa Cre y un vector de expresión de GPT humana que comprende eGFP; en presencia de 2,5 pg/mL de Tn.
Las figuras 6A y 6B muestran mezclas de células que expresan GPT en comparación con mezclas que no expresan GPT en su capacidad relativa para mejorar la expresión de un GOI unido operativamente, tal como eGFP. La figura 6A: ilustra el número relativo de copias génicas de CHO-GPT medido mediante PCR para mezclas de células de la siguiente manera: Células Pool-49 (sin GPT exógena añadida) sin selección de Tn; células Pool-49 (sin GPT exógena) con selección de Tn de 5 ug; células Pool-1 expresan de forma natural altas cantidades de GPT (datos no mostrados), y se prueban sin selección de Tn; células Pool-78 (sin GPT exógena) sin selección de Tn; células CHO que expresan hpt añadida exógenamente y selección de Higromicina de 400 pg/mL; células CHO que expresan GPT exógena bajo condiciones de selección de Tn de 1 pg/mL; células CHO que expresan GPT exógena seleccionadas de una mezcla de selección de Tn de 1 pg/mL cultivadas adicionalmente en 1 pg/mL de Tn; células CHO que expresan GPT exógena seleccionadas de una mezcla de selección de Tn de 1 pg/mL cultivadas adicionalmente en 2,5 pg/mL de Tn; células CHO que expresan GPT exógena seleccionadas de una mezcla de selección de Tn de 1 pg/mL cultivadas adicionalmente en 5 pg/mL de Tn. La figura 6B: ilustra el número relativo de copias génicas de un gen de interés, eGFP, medido por qPCR para las mismas mezclas de células (como la figura 6A).
Las figuras 7A a la 7D ilustran las características de glicoforma de la proteína de fusión a Fc 1 (FcFP1) producida a partir del cultivo celular de la siguiente manera, la figura 7A: Células CHO que no expresan GPT mediante el uso de un protocolo estándar (Lot B10002M410), en comparación con la figura 7B: Células CHO que expresan CHO-GPT y selección sin T n (Lot 110728). Figura 7C: Células CHO que expresan CHO-GPT y seleccionadas con 1 pg/mL de Tn (Lot 110728-01), en comparación con la figura 7D: Células CHO que expresan CHO-GPT y seleccionadas con 5 pg/mL de Tn (Lot 110728-02). Cada cromatograma indica fracciones que contienen residuos sialilados de la siguiente manera: OSA = cero residuos de ácido siálico; 1SA = un residuo de ácido siálico; 2SA = dos residuos de ácido siálico; 3SA = tres residuos de ácido siálico; 4SA = cuatro residuos de ácido siálico.
La figura 8 ilustra el perfil de solapamiento de glicosilación de la proteína de fusión a Fc 1 (FcFP1) muestreada a partir de (A) Lot B10002M410, (B) Lot 110728, (C) Lot 110728-01, y (D) Lot 110728-02. Los glicoperfiles de cada proteína producida a partir de los lotes de GPT son compatibles con la proteína estándar de referencia y las principales especies de glicoformas se producen de forma consistente. Es evidente que no se produjeron especies nuevas y únicas de glicoformas en los lotes de GPT en comparación con la proteína estándar de referencia.
Descripción detallada
Antes de que se describan los métodos presentes, debe entenderse que esta invención no se limita a los métodos y condiciones experimentales particulares descritas, ya que tales métodos y condiciones pueden variar. Además, debe entenderse que la terminología usada en la presente descripción es solamente para el propósito de describir modalidades particulares, y no pretende ser limitante, ya que el alcance de la presente invención se limitará solamente por las reivindicaciones adjuntas.
Como se usa en esta descripción y las reivindicaciones adjuntas, las formas singulares “un”, “una” y “el/la” incluyen referencias en plural a menos que el contexto lo indique claramente de otra manera. Así, por ejemplo, una referencia a “un método” incluye uno o más métodos y/o etapas del tipo descrito en la presente descripción y/o que resultarán evidentes para los expertos en la técnica al leer esta divulgación.
A menos que se defina de otra manera, o se especifique de otra manera, todos los términos técnicos y científicos usados en la presente descripción tienen el mismo significado que entiende comúnmente un experto en la técnica a la que pertenece esta invención.
Aunque cualquiera de los métodos y materiales similares o equivalentes a los descritos en la presente descripción puede usarse en la práctica o prueba de la presente invención, los métodos y materiales particulares se describen a continuación.
Una variedad de genes bien conocidos en la técnica pueden conferir un fenotipo seleccionable en células de mamíferos en cultivo. Comúnmente, los genes marcadores seleccionables expresan proteínas, usualmente enzimas, que confieren resistencia a diversos antibióticos en el cultivo celular. En algunas condiciones selectivas, las células que expresan un marcador proteico fluorescente se hacen visibles y, por tanto, son seleccionables. Los ejemplos en la técnica incluyen beta-lactamasa (bla; gen de resistencia a antibióticos beta-lactámicos o ampR; gen de resistencia a ampicilina), bis (gen de resistencia de la acetil transferasa a blasticidina), fosfotransferasa de higromicina (hpt; gen de resistencia a higromicina) y otros.
Los métodos descritos en la presente descripción se basan en el uso de tunicamicina y enzimas (marcadores) que pueden permitir que las células resistentes a la tunicamicina crezcan en el cultivo celular. La tunicamicina (Tn) es una mezcla de antibióticos que actúan como inhibidores de las N-acetilglucosamina transferasas bacterianas y eucariotas que previenen la formación de intermediarios lipídicos de N-acetilglucosamina y la glicosilación de glicoproteínas recién sintetizadas. (King, I.A., y Tabiowo, A., 1981, Effect of tunicamycin on epidermal glycoprotein and glycosaminoglycan synthesis in vitro. Biochem. J., 198(2):331-338). La Tn es citotóxica porque inhibe específicamente la UDP-N-acetilglucosamina: fosfato de dolicol N-acetilglucosamina- 1-P transferasa (GPT), una enzima que cataliza la etapa inicial de la biosíntesis de oligosacáridos unidos a dolicol. En presencia de tunicamicina, las glicoproteínas unidas a asparagina producidas en el retículo endoplasmático (ER, por sus siglas en inglés) no se glicosilan con glicanos unidos a N, y de esta manera pueden no plegarse correctamente en el ER y, por lo tanto, pueden dirigirse para descomposición (Koizumi, y otros 1999, Plant Physiol. 121 (2):353-362). Por lo tanto, la Tn es un inductor notable de la respuesta de proteínas desplegadas (UPR, por sus siglas en inglés) que conduce a la apoptosis en células bacterianas y eucariotas.
El gen para la uridina difosfato GPT (también conocido como GlcNAc-1-P transferasa) se identificó como sobreexpresado en ciertas condiciones celulares para conferir resistencia a Tn (Criscuolo y Krag, 1982, J Biol Chem, 263(36):19796-19803; Koizumi, y otros, 1999, Plant Physiology, Vol. 121, pp. 353-361). El gen que codifica GPT, también descrito como GenBank Accn. No. M36899 (SEQ ID NO: 2), se aisló de una línea celular de ovario de hámster chino resistente a Tn y codifica una proteína de 408 aminoácidos (SEQ ID NO: 3) (Scocca y Krag, 1990, J Biol Chem 265(33):20621-20626; Lehrman, M. y otros, 1988, J Biol Chem 263(36): 19796-803). La GPT de hámster se sobreexpresó en células de levadura (S. pombe) y confirió resistencia a Tn en estas células; también proporciona una fuente conveniente para la purificación de la enzima GPT (Scocca JR, y otros 1995, Glycobiology, 5(1):129-36). Los niveles de transcriptos de GPT se analizaron en células de hibridoma (células B que expresan IgG frente a células B en reposo), mientras que se observó que las células que producen IgG no mostraron niveles aumentados de transcriptos o actividad de GPT, aun así se observó un pequeño aumento en GPT en la transición de células B en reposo a células B activas. Se concluyó que los niveles de GPT pueden corresponderse con el desarrollo temprano de respuesta proliferativa a la estimulación con LPS (antígeno) en las células B (Crick, D.C. y otros, 1994, J Biol Chem 269(14): 10559-65).
Además, se desconocía previamente si la alteración de la expresión de GPT, con o sin presencia de Tn, en un sistema de expresión celular tendrá un efecto sobre la glicosilación del producto proteico, y por lo tanto sobre la calidad del producto. Se entiende que la glicosilación óptima y consistente es un atributo proteico crítico en la producción de glicoproteínas terapéuticas.
Se describe en la presente descripción un método mejorado para la producción de proteínas recombinantes en sistemas de células de mamíferos que utilizan un gen de resistencia a Tn de mamíferos, GPT, como un marcador de selección regulable, mientras que el mayor número de copias de un gen de interés unido operativamente a GPT se correlaciona con una mayor integración aleatoria de un casete de expresión de GPT en la célula.
La técnica ha reconocido que la fabricación de proteínas terapéuticas, particularmente glicoproteínas, se basa en sistemas de expresión de tipo mamífero que imitan la glicosilación natural de tales proteínas. (Para la revisión, véase Bork, K. y otros, 2009, J Pharm Sci. 98(10):3499-3508.) Por ejemplo, el monosacárido terminal de ciertas glicoproteínas tales como glicanos complejos unidos a N típicamente está ocupado por ácido siálico. La sialilación puede afectar las propiedades farmacocinéticas de la glicoproteína, tales como la absorción, la vida media en suero y el aclaramiento, u otras propiedades fisicoquímicas o inmunogénicas de la glicoproteína. Las glicoproteínas recombinantes sobreexpresadas a menudo tienen glicosilación incompleta o inconsistente. Los métodos fiables son críticos para la consistencia y calidad del proceso de las glicoproteínas terapéuticas producidas en líneas celulares de mamíferos.
También se describe en la presente descripción un método mejorado para la glicosilación de proteínas recombinantes, es decir, un método para fabricar glicoproteínas, en sistemas de células de mamíferos para proporcionar un rendimiento de calidad consistente de las proteínas deseadas.
Definiciones
Las regiones de ADN se unen operativamente cuando se relacionan funcionalmente entre sí. Por ejemplo, un promotor se une operativamente a una secuencia codificante si el promotor es capaz de participar en la transcripción de la secuencia; un sitio de unión al ribosoma se une operativamente a una secuencia codificante si se posiciona para permitir la traducción. Por lo general, unido operativamente puede incluir, pero no requiere, contigüidad. En el caso de secuencias tales como las líderes secretoras, la contigüidad y la colocación adecuada en un marco de lectura son características típicas. Una secuencia de mejora de la producción, tal como un promotor, se une operativamente a un gen de interés (GOI) donde se relaciona funcionalmente con el GOI, por ejemplo, donde su presencia resulta en una mayor expresión del GOI.
Como tal, la frase “unido operativamente”, tal como en el contexto de constructos de vectores de expresión de ADN, una secuencia de control, por ejemplo, un promotor u operador o marcador, se coloca apropiadamente en una posición relativa a una secuencia codificante de manera que la secuencia de control dirige o permite la producción de un polipéptido/proteína de interés codificado por la secuencia codificante. Por ejemplo, donde se requiere un marcador de selección para que las células sobrevivan en ciertas condiciones de cultivo, el gen de interés se une operativamente al gen marcador de selección porque la expresión no se producirá sin la presencia de una proteína marcadora de selección operable.
"Promotor" como se usa en la presente descripción indica una secuencia de ADN suficiente para dirigir la transcripción de una secuencia de ADN a la cual se une operativamente, es decir, se une de manera que permite la transcripción del gen de interés y/o el gen marcador de selección cuando las señales apropiadas están presentes. La expresión de un gen puede ponerse bajo el control de cualquier elemento promotor o potenciador conocido en la técnica.
Un “vector de expresión” en el contexto de la presente invención puede ser cualquier vector adecuado, incluidos vectores de ácido nucleico cromosómico, no cromosómico y sintético (una secuencia de ácido nucleico que comprende un conjunto adecuado de elementos de control de expresión). Los ejemplos de tales vectores incluyen derivados de SV40, plásmidos bacterianos, ADN de fagos, baculovirus, plásmidos de levadura, vectores derivados de combinaciones de plásmidos y ADN de fagos y vectores de ácidos nucleicos virales (ARN o ADN). En una modalidad, una molécula de ácido nucleico que codifica una proteína de fusión a Fc o polipéptido se comprende en un vector de ADN o ARN desnudo, que incluye, por ejemplo, un elemento de expresión lineal (como se describe en, por ejemplo, Sykes y Johnston, 1997, Nat Biotech 12, 355-59), un vector de ácido nucleico compactado (como se describe en, por ejemplo, el documento US6,077,835 y/o WO00/70087), o un vector plasmídico tal como pBR322, pUC 19/18, o pUC 118/119. Tales vectores de ácido nucleico y el uso de los mismos se conocen bien en la técnica (véase, por ejemplo, los documentos US5,589,466 y US5,973,972).
Como se usa en la presente descripción, "operador" indica una secuencia de ADN que se introduce en o cerca de un gen de tal manera que el gen puede regularse mediante la unión de una proteína represora al operador y, como resultado, evita o permite la transcripción del GOI, es decir, un nucleótido que codifica un polipéptido o proteína de interés.
Los sitios de unión al ribosoma incluyen “sitios internos de entrada al ribosoma” (IRES, por sus siglas en inglés) o pueden incluir una caperuza 5'. Muchas secuencias de IRES son bien conocidas en la técnica. El IRES representa una secuencia de control de traducción, en donde el sitio del IRES se localiza típicamente 5' de un gen de interés y permite la traducción del ARN de manera independiente de la caperuza. Los IRES transcritos pueden unirse directamente a las subunidades ribosómicas de manera que la ubicación de los codones iniciadores del ARNm esté orientada correctamente en el ribosoma para su traducción. Las secuencias de IRES se localizan típicamente en el 5' UTR del ARNm (directamente aguas arriba del codón de iniciación). Los IRES sustituyen funcionalmente la necesidad de diversos factores proteicos que interactúan con la maquinaria de traducción eucariota.
Los términos “potenciado” o “mejorado” cuando se usan para describir la expresión de proteínas incluyen un aumento en la cantidad y/o consistencia de la calidad de la proteína (es decir, producto génico) producida por el sistema de expresión descrito en la presente descripción o los métodos de la invención. Como tal, esto incluye una potenciación de al menos aproximadamente 1,5 veces a al menos aproximadamente una potenciación de 3 veces en la expresión sobre lo que se observa típicamente mediante la integración aleatoria en un genoma, por ejemplo, en comparación con una mezcla de integrantes mediante el uso de otro constructo de marcador seleccionable. Como tal, la potenciación de la expresión de veces observada para las proteínas de interés se compara con un nivel de expresión del mismo gen, medido esencialmente bajo las mismas condiciones, en ausencia de un casete de expresión o célula de la invención que comprende un gen de GPT, o en presencia de un casete de expresión o célula que comprende un marcador seleccionable diferente. La potenciación de la expresión también puede medirse por el número resultante de eventos de integración aleatoria. La eficiencia de recombinación potenciada incluye una potenciación de la capacidad de un locus para recombinar (por ejemplo, al emplear sitios de reconocimiento de recombinasa). La potenciación se refiere a una eficiencia medible sobre la recombinación aleatoria, que es típicamente del 0,1 %. En ciertas condiciones, la eficiencia de recombinación potenciada es de aproximadamente 10 veces por encima de la aleatoria, o aproximadamente 1 %. A menos que se especifique, la invención reivindicada no se limita a una eficiencia de recombinación específica. La potenciación de la expresión también puede medirse por el número resultante de copias génicas medida por reacción en cadena de la polimerasa cuantitativa (qPCR), u otra técnica bien conocida.
El producto potenciado o mejorado también se refiere a la calidad más consistente, por ejemplo, modificaciones postraduccionales observadas con el sistema de expresión de GPT descrito en la presente descripción. La calidad consistente incluye tener, por ejemplo, un perfil de glicosilación conveniente después de replicar líneas de producción. La consistencia, con respecto a la calidad, se refiere a un grado de uniformidad y estandarización, mientras que los lotes de producción replicados están esencialmente libres de variación. El cálculo de un número Z para medir la consistencia se enseña en la presente descripción. Otras medidas estadísticas se conocen en la técnica para medir la consistencia.
La frase “presión selectiva” es la fuerza o estímulo aplicado a un organismo vivo (por ejemplo, una célula) o sistema (por ejemplo, como un sistema de expresión) que altera el comportamiento y la supervivencia (tal como la capacidad de sobrevivir) del organismo o sistema vivo dentro de un entorno dado.
La frase “amplificación génica” significa un aumento en el número de copias idénticas de una secuencia génica. Ciertos procesos celulares se caracterizan por la producción de múltiples copias de un gen o genes particulares que amplifican el fenotipo que el gen confiere a la célula, por ejemplo, resistencia a los antibióticos.
Donde la frase “gen añadido exógenamente” o “GOI añadido exógenamente” se emplea con referencia a un casete de expresión, la frase se refiere a cualquier gen que no esté presente dentro del genoma celular como se encuentra en la naturaleza, o una copia del gen adicional integrada dentro (un locus diferente dentro) del genoma. Por ejemplo, un “gen añadido exógenamente” dentro de un genoma de CHO (por ejemplo, un gen marcador seleccionable), puede ser un gen de hámster que no se encuentra dentro del locus de CHO particular en la naturaleza (es decir, un gen de hámster de otro locus en el genoma de hámster), un gen de cualquier otra especie (por ejemplo, un gen humano), un gen quimérico (por ejemplo, humano/ratón), o puede ser un gen de hámster que no se encuentra dentro del genoma de CHO en la naturaleza (es decir, un gen de hámster que tiene menos de 99,9 % de identidad al gen de otro locus en el genoma de hámster), o cualquier otro gen que no se encuentre en la naturaleza que exista dentro del genoma natural de CHO.
Los eventos de integración aleatoria difieren de los eventos de integración dirigidos, donde la inserción de un gen en el genoma de la célula no es sitio-específica en eventos de integración aleatoria. Un ejemplo de la integración dirigida es la recombinación homóloga. La integración aleatoria (no homóloga) significa que la ubicación (locus) del integrante resultante no es conocida o especificada. Se cree que la integración aleatoria ocurre por unión terminal no homóloga (NHEJ, por sus siglas en inglés), sin embargo, no se limita a este método.
La eficiencia de selección significa el porcentaje de población de células supervivientes que expresan el marcador seleccionable y, si corresponde, la proteína de interés bajo el control del marcador seleccionable.
El porcentaje de identidad, cuando se describe una proteína de resistencia a Tn, está destinado a incluir secuencias homólogas que muestran la identidad citada a lo largo de regiones de homología contiguas, pero la presencia de espacios, deleciones, o inserciones que no tienen homólogo en la secuencia comparada no se tiene en cuenta al calcular el porcentaje de identidad. Al explicar el uso de “porcentaje de identidad” en este contexto, la siguiente comparación de secuencias de aminoácidos hará referencia a:
1 MWAFPELPLPLPLLVNLIGSLLGFVATVTLIPAFRSHFIAARLCGQDLNKLSQQQIPESQ 60 GPT_MOUSE
1 MWAFPELPL— PLLVNLFGSLLGFVATVTLIPAFRSHFIAARLCGQDLNKLSRQQIPESQ 58 GPT_CRIG
Como se usa en la presente descripción, una determinación de “porcentaje de identidad” entre la secuencia “GPT_CRIG” anterior (para una GPT de hámster chino) con un homólogo de ratón (“GPT_MOUSE”) podría no incluir una comparación de los aminoácidos de hámster 10 y 11, ya que el homólogo de hámster no tiene secuencia homóloga para comparar en un alineamiento (es decir, la GPT de ratón tiene una inserción en ese punto, o el homólogo de hámster tiene un espacio o deleción, según pueda ser el caso). Por lo tanto, en la comparación anterior, la comparación de porcentaje de identidad podría extenderse desde el “MWA” en el extremo 5' hasta el “ESQ” en el extremo 3'. En ese caso, el homólogo de ratón difiere solo en que tiene una “R” en la posición 51 de la GPT de hámster. Dado que la comparación es de más de 58 bases contiguas en un estiramiento de 60 pares de bases, con solo una diferencia de aminoácidos (que no es un espacio, deleción o inserción), hay más del 98 % de identidad entre las dos secuencias (hámster y ratón) de la posición 1 de la GPT de hámster a la posición 58 de la GPT de hámster (ya que el “porcentaje de identidad” no incluye penalizaciones por espacios, deleciones e inserciones). Aunque el ejemplo anterior se basa en una secuencia de aminoácidos, se entiende que el porcentaje de identidad de una secuencia de ácido nucleico podría ser calculada de la misma manera.
El término “célula” incluye cualquier célula que es adecuada para expresar una secuencia de ácido nucleico recombinante. Las células incluyen aquellas de procariotas y eucariotas (unicelulares o pluricelulares), células bacterianas (por ejemplo, cepas de E. coli, Bacillus spp., Streptomyces spp., etc.), células de micobacterias, células fúngicas, células de levaduras (por ejemplo, S. cerevisiae, S. pombe, P. partoris, P. methanolica, etc.), células vegetales, células de insectos (por ejemplo, SF-9, SF-21, células de insectos infectadas con baculovirus, Trichoplusia ni, etc.), células de animales no humanos, célula de mamíferos, células humanas, o fusiones celulares tales como, por ejemplo, hibridomas o cuadromas. En ciertas modalidades, la célula es una célula humana, de mono, simio, hámster, rata o ratón. En otras modalidades, la célula es eucariota y se selecciona de las siguientes células: CHO (por ejemplo, CHO K1, DXB-11 CHO, Veggie-CHO), COS (por ejemplo, COS-7), células retinianas, Vero, CV1, riñón (por ejemplo, HEK293, 293 EBNA, MSR 293, MDCK, HaK, BHK21), HeLa, HepG2, WI38, MRC 5, Colo25, HB 8065, HL-60, Jurkat, Daudi, A431 (epidérmica), CV-1, U937, 3T3, célula L, célula C127, SP2/0, NS-0, célula MMT, célula tumoral y una línea celular derivada de una célula mencionada anteriormente. En algunas modalidades, la célula comprende uno o más genes virales, por ejemplo, una célula retiniana que expresa un gen viral (por ejemplo, una célula PER.C6®).
La frase “densidad celular integrada”, o “ ICD” significa la densidad de células en un medio de cultivo tomado como un integral durante un período de tiempo, expresado como días celulares por mL_. En algunas modalidades, la ICD se mide alrededor del duodécimo día de células en cultivo.
“Glicosilación” o la frase “que glicosila una proteína” incluye la formación de glicoproteínas mientras que los oligosacáridos se unen a la cadena lateral del residuo de asparagina (Asn) (es decir, unidos a N) o residuo de serina (Ser)/treonina (Thr) (es decir, unidos a O) de una proteína. Los glicanos pueden ser homo- o heteropolímeros de residuos monosacáridos, que pueden ser lineales o ramificados. La glicosilación unida a N se conoce que se inicia primeramente en el retículo endoplasmático, mientras que la glicosilación unida a O se demuestra que inicia en el ER o en el aparato Golgi.
Una “proteína N-glicano” o un “sustrato proteico N-glicano” incluye proteínas que contienen o pueden aceptar oligosacáridos unidos a N. Los N-glicanos pueden estar compuestos de N-acetil galactosamina (GalNAc), manosa (Man), fucosa (Fuc), galactosa (Gal), ácido neuramínico (NANA) y otros monosacáridos, sin embargo, los N-glicanos tienen normalmente una estructura pentasacárida central común que incluye: tres azúcares manosa y dos Nacetilglucosamina (GIcNAc). Las proteínas con la secuencia de aminoácidos consecutiva (es decir, sequon) Asn-X-Ser o Asn-X-Thr, donde X es cualquier aminoácido excepto prolina, pueden proporcionar un sitio de unión para los N-glicanos.
Descripción general
La invención se basa al menos en parte en el descubrimiento de que, bajo ciertas condiciones, las proteínas recombinantes pueden producirse en una célula en donde el gen que codifica la proteína se une operativamente a un gen de resistencia a Tn, GPT, y la selección de una célula productora de proteínas se formatea para aumentar los eventos de integración aleatoria en el genoma celular y, por lo tanto, aumentar el número de copias del gen de interés, y finalmente la producción de proteínas.
La invención se basa además al menos en parte en el hallazgo de que la célula productora de proteínas puede optimizarse para expresar proteínas con modificaciones postraduccionales consistentes y confiables. Los casetes de expresión de GPT también pueden integrarse en un genoma celular, como en constructos de expresión, tales como a través de los vectores de expresión, mediante el uso de diversas técnicas de edición génica conocidas en la técnica. Los vectores de expresión que comprenden GPT pueden integrarse en un genoma mediante recombinación aleatoria o dirigida tal como, recombinación homóloga o recombinación mediada por recombinasas que reconocen sitios de recombinación específica (por ejemplo, recombinación mediada por Cre-lox).
La recombinación homóloga en células eucariotas puede facilitarse al introducir una ruptura en el ADN cromosómico en el sitio de integración. Los sistemas modelo han demostrado que la frecuencia de recombinación homóloga durante el direccionamiento génico aumenta si se introduce una ruptura de doble cadena dentro de la secuencia diana cromosómica. Esto puede lograrse al dirigir determinadas nucleasas al sitio específico de la integración. Las proteínas de unión a ADN que reconocen secuencias de ADN en el locus diana se conocen en la técnica. Los vectores de direccionamiento génico también se emplean para facilitar la recombinación homóloga. En la ausencia de un vector de direccionamiento génico para la reparación dirigida por homología, las células cierran con frecuencia la ruptura de doble cadena por unión terminal no homóloga (NHEJ) que puede conducir a la deleción o inserción de múltiples nucleótidos en el sitio de escisión. La construcción del vector de direccionamiento génico y la selección de la nucleasa están dentro de la habilidad del experto a quien pertenece esta invención.
En algunos ejemplos, las nucleasas con dedos de zinc (ZFN), que tienen una estructura modular y contienen dominios con dedos de zinc individuales, reconocen una secuencia particular de 3 nucleótidos en la secuencia diana (por ejemplo, sitio de integración dirigida). Algunas modalidades pueden utilizar ZFN con una combinación de dominios con dedos de zinc individuales que se dirigen a múltiples secuencias diana.
Las nucleasas efectoras tipo activador de la transcripción (TAL) (TALEN) también pueden emplearse para la edición de genoma sitio-específica. El dominio de unión a ADN de la proteína efectora TAL se utiliza típicamente en combinación con un dominio de escisión no específico de una nucleasa de restricción, tal como Fokl. En algunas modalidades, una proteína de fusión que comprende un dominio de unión a ADN de la proteína efectora TAL y un dominio de escisión de la nucleasa de restricción se emplea para reconocer y escindir el ADN en una secuencia diana dentro del locus descrito (Boch J y otros, 2009 Science 326:1509-1512).
Las endonucleasas guiadas por ARN (RGEN) son herramientas de ingeniería del genoma programables que se desarrollaron a partir de la maquinaria inmunitaria adaptativa bacteriana. En este sistema, las repeticiones palindrómicas cortas agrupadas y regularmente interespaciadas (CRISPR)/respuesta inmune asociada a CRISPR (Cas), la proteína Cas9 forma una endonucleasa específica de secuencia cuando se acopla con dos ARN, uno de los cuales guía la selección de la diana. Las RGEN constan de componentes (Cas9 y tracrRNA) y un ARN CRISPR específico de la diana (ARNcr). Tanto la eficiencia de la escisión de la diana del ADN como la ubicación de los sitios de escisión varían en base a la posición de un motivo adyacente del protoespaciador (PAM, por sus siglas en inglés), un requisito adicional para el reconocimiento de la diana (Chen, H. y otros, J. Biol. Chem. publicado en línea el 14 de marzo de 2014, como Manuscrito M113.539726).
Aún otros métodos de recombinación homóloga están disponibles para el experto en la técnica, tales como nucleasas derivadas de BuD (BuDN) con especificidades precisas de unión a ADN (Stella, S. y otros Acta Cryst. 2014, D70, 2042-2052). Se eligen métodos de modificación del genoma precisos en base a las herramientas disponibles compatibles con secuencias dianas únicas dentro del genoma para evitar la alteración del fenotipo celular.
Las células y métodos se proporcionan para integrar de manera estable una secuencia de ácido nucleico (gen de interés) en una célula de mamífero, en donde la secuencia de ácido nucleico es capaz de la expresión potenciada en virtud de integrarse con una secuencia de GPT. También se proporcionan composiciones y métodos para usar GPT en relación con constructos de expresión, por ejemplo, vectores de expresión, y para añadir una GPT exógena en una célula de mamífero de interés. Las células y los métodos se proporcionan para usar en un método consistente pero robusto para hacer glicoproteínas, particularmente glicoproteínas terapéuticas.
Construcción de un casete marcador de selección de GPT
Los vectores de expresión que comprenden un casete de expresión de GPT operativo se proporcionan en la presente descripción. El casete de expresión comprende los elementos reguladores necesarios para permitir e impulsar la transcripción y traducción de GPT de mamíferos y el producto génico deseado.
También pueden desarrollarse diversas combinaciones de los genes y secuencias reguladoras descritas en la presente descripción. Los ejemplos de otras combinaciones de las secuencias apropiadas descritas en la presente descripción que también pueden desarrollarse incluyen secuencias que incluyen múltiples copias de los genes de GPT divulgados en la presente descripción, o secuencias derivadas al combinar la GPT divulgada con otras secuencias nucleotídicas para lograr combinaciones óptimas de elementos reguladores. Tales combinaciones pueden unirse o disponerse contiguamente para proporcionar el espaciado óptimo de GPT orientado al gen de interés y a los elementos reguladores.
Se sabe que existen secuencias homólogas de genes que codifican GPT en células de otras especies de mamíferos (tales como, por ejemplo, humanos; véase la figura 2) así como también en líneas celulares derivadas de otros tipos de tejido de mamíferos, y pueden aislarse mediante técnicas que se conocen bien en la técnica. Una lista ilustrativa de secuencias de aminoácidos de GPT de mamíferos se proporciona en la figura 2. Pueden realizarse cambios en la secuencia nucleotídica, tal como optimización de codones, a las secuencias nucleotídicas establecidas en las SEQ ID NOs:2 y 11-17 para permitir la expresión óptima de las proteínas GPT correspondientes, establecidas en las SEQ ID NOs:3-10. Además, pueden realizarse cambios en la secuencia de aminoácidos establecidas en las SEQ ID NOs:3-10 al realizar cambios en las secuencias nucleotídicas que codifican la GPT. Tales técnicas que incluyen, pero no se limitan a, técnicas de mutagénesis sitio-dirigidas o aleatorias se conocen bien en la técnica.
Las variantes de GPT resultantes pueden entonces determinarse para la actividad de GPT como se describe en la presente descripción, por ejemplo, para determinar la resistencia a la tunicamicina. Las proteínas GPT que son al menos aproximadamente 93 % idénticas, o al menos aproximadamente 95 % idénticas, o al menos aproximadamente 96 % idénticas, o al menos aproximadamente 97 % idénticas, o al menos aproximadamente 98 % idénticas en secuencia de aminoácidos a la SEQ ID NO:3 que tiene actividad GPT son aislables mediante experimentación rutinaria, y se espera que muestren la misma resistencia a Tn, eficiencia de selectividad y beneficios postraduccionales de la SEQ ID n O:3. En consecuencia, los homólogos de mamíferos de GPT y variantes de GPT se abarcan también por modalidades de la invención. Las figuras 2A a 2C muestran un alineamiento de diversas secuencias de aminoácidos de GPT de mamíferos (es decir, SEQ ID NO: 3-10). Las secuencias de GPT de mamíferos (ácido nucleico y aminoácido) se conservan entre los genomas de hámster, humano, ratón y rata. La tabla 1 identifica las proteínas GPT de mamíferos ilustrativas y su grado de homología.
TABLA 1A: Identidad de aminoácidos de homólo os de GPT
Figure imgf000011_0001
TABLA 1B I n i i n l i h m l PT r r n i s
Figure imgf000011_0002
Las poblaciones celulares que expresan niveles potenciados de una proteína de interés pueden desarrollarse mediante el uso de los métodos de GPT/tunicamicina proporcionados en la presente descripción. El nivel absoluto de expresión variará con la proteína específica, en dependencia de cómo la proteína se procesa eficientemente por la célula.
En consecuencia, una secuencia nucleotídica que expresa GPT seleccionada del grupo que consiste en las SEQ ID NOs:2 y 11-17 se describe en la presente descripción. Además se describe en la presente descripción una secuencia nucleotídica que expresa GPT que es al menos 92 % idéntica, al menos 93 % idéntica, al menos 94 % idéntica, al menos 95 % idéntica, al menos 96 % idéntica, al menos 98 % idéntica, o al menos 99 % idéntica a la secuencia nucleotídica seleccionada del grupo que consiste en las SEQ ID NOs:2 y 11-17.
También se describen en la presente descripción vectores que comprenden la SEQ ID NO:1, la SEQ ID NO:2 o la SEQ ID NO: 12. Los vectores que comprenden un gen de GPT de mamíferos, y elementos reguladores opcionales, incluyen vectores para la transfección transitoria o estable.
En una modalidad, el gen de GPT se emplea para potenciar la expresión de un GOI, como se ilustra en la figura 1. La figura 1 muestra un GOI unido operativamente con una secuencia IRES y un marcador seleccionable de GPT. El casete de GPT incluye además una secuencia promotora, por ejemplo, un promotor de SV40, y una secuencia de poliadenilación (poli(A)), por ejemplo, SV40 poli(A).
El casete de potenciación de la expresión (que incluye GPT y un promotor aguas arriba) se integra de manera óptima en un genoma celular. Mediante el uso de los métodos de la invención, un GOI se expresa dentro del casete de expresión de GPT bajo condiciones de cultivo en base a concentraciones crecientes de Tn (figura 3A o figura 3B). Un lector de FACS, tal como el que se muestra en las figuras 5B, 5C, 5E y 5F, ejemplifica la distribución de la expresión en una población de células transfectadas de manera estable, en particular el aumento dramático en la eficiencia de selección mediante el uso de marcadores de selección resistentes a Tn de mamíferos, CHO-GPT y hGPT. La expresión de GPT de mamíferos potencia además la expresión de un producto génico de interés, por ejemplo, la producción de una proteína fluorescente, eGFP. Los cultivos consecutivos de concentraciones crecientes de Tn resultan en una expresión potenciada de aproximadamente dos veces en comparación con el GOI expresado en un sistema de expresión mediante el uso de GPT bajo condiciones de cultivo en base a una concentración de Tn, tal como lo ejemplificado en la figura 6B.
Se describe en la presente descripción una célula de mamífero que comprende tal gen de GPT en donde el gen de GPT es exógeno y se integra en el genoma celular mediante los métodos de la invención. Las células comprenden tal gen de GPT que tienen al menos un gen de interés añadido exógenamente (GOI) que está aguas arriba o aguas abajo del gen de GPT.
En diversas modalidades, la expresión de un GOI puede potenciarse al colocar el GOI bajo el control de un marcador seleccionable de mamífero g Pt . En otras modalidades, los eventos de integración aleatoria de un GOI pueden potenciarse al colocar el GOI bajo el control de un marcador seleccionable de mamífero GPT y proporcionar condiciones de cultivo celular que comprenden una concentración de Tn superior a 0,5 pg/mL. En algunas modalidades, las condiciones del cultivo celular comprenden una concentración de Tn superior a 1 pg/mL. Un elemento regulador puede estar unido operativamente al GOI donde la expresión del GOI— a la distancia seleccionada del GOI y GPT (en la dirección 5' o 3')— conserva la capacidad de potenciar la expresión del GOI sobre, por ejemplo, la expresión típicamente observada debido a un evento de integración aleatoria. En diversas modalidades, la potenciación es al menos aproximadamente 1,5 veces a aproximadamente 2 veces o más. La potenciación en la expresión en comparación con una integración aleatoria, o expresión aleatoria, es de aproximadamente 1,5 veces o aproximadamente 2 veces o más.
En otra modalidad, se pueden alcanzar proteínas glicosiladas uniformemente mediante el uso de los métodos de la invención y las composiciones descritas en la presente descripción. Como se muestra en la tabla 4, los lotes de proteínas recombinantes GPT/GOI tratados con Tn permiten replicar lotes con perfiles de glicosilación equivalentes. Como tal, la expresión de proteínas potenciadas tal como perfiles de glicosilación consistentes puede compararse directamente mediante el cálculo del número Z como se enseñó en la presente descripción. La ecuación del número Z tiene en cuenta el número relativo de picos en un cromatograma que representa restos de ácido siálico (SA, por sus siglas en inglés), así como también la forma relativa y la intensidad de cada pico. El número Z se basa en el área ocupada por cada pico y puede usarse como medida de consistencia para glicoproteínas complejas (véase, por ejemplo, las figuras 7A-7D, figura 8, y ejemplo 3, descritos en la presente descripción.
La optimización de la expresión de proteínas también puede lograrse para cada GOI, que incluye, por ejemplo, la orientación del casete de expresión o la optimización de codones. La optimización de proteínas también puede lograrse al variar la concentración incremental de Tn en los métodos de cultivo celular.
Los vectores de expresión recombinante pueden comprender fragmentos de ADN sintéticos o derivados de ADNc que codifican una proteína, unidos operativamente a un elemento regulador transcripcional y/o traduccional adecuado derivado de genes de mamíferos, virus o insectos. Dichos elementos reguladores incluyen promotores transcripcionales, potenciadores, secuencias que codifican sitios de unión al ribosoma de ARNm adecuados, y secuencias que controlan la terminación de la transcripción y traducción, como se describe en detalle en la presente descripción. Los vectores de expresión de mamíferos pueden comprender además elementos no transcritos tales como un origen de replicación, otras secuencias no transcritas flanqueadas 5' o 3', y secuencias no traducidas 5' o 3' tales como sitios donantes y receptores de empalmes. También pueden incorporarse genes marcadores seleccionables adicionales (tales como marcadores fluorescentes) para facilitar el reconocimiento de transfectantes.
El vector descrito en la presente descripción comprende una molécula de ácido nucleico (o gen de interés) que codifica una proteína de interés, que incluye un vector de expresión que comprende las moléculas de ácido nucleico (genes) descritas, en donde la molécula de ácido nucleico (gen) se une operativamente a una secuencia de control de expresión.
Se proporciona un vector que comprende un gen de interés (GOI), en donde el GOI se une operativamente a una secuencia de control de la expresión adecuada para la expresión en una célula huésped de mamífero.
Los promotores útiles que pueden usarse en la invención incluyen, pero no se limitan a, la región promotora temprana de SV40, el promotor contenido en la repetición terminal larga 3' del virus del sarcoma de Rous, las secuencias reguladoras del gen de metalotionina, el promotor IE del citomegalovirus humano o de ratón (Gossen y otros, (1995) Proc. Nat. Acad. Sci. USA 89:5547-5551), el promotor de ARN 35S del virus del mosaico de la coliflor, y el promotor de la enzima fotosintética ribulosa bifosfato carboxilasa, elementos promotores de levadura u otros hongos tales como el promotor de Gal 4, el promotor de ADC (alcohol deshidrogenasa), el promotor de PGK (fosfoglicerol quinasa), el promotor de fosfatasa alcalina, y las siguientes regiones de control transcripcional animal, que muestran especificidad tisular y se han utilizado en animales transgénicos: elastasa 1; insulina; inmunoglobulina; virus tumoral mamario de ratón; albúmina; a-fetoproteína; a1-antitripsina; p-globina; y la cadena ligera de miosina-2.
Las moléculas de ácido nucleico descritas en la presente descripción pueden, además, unirse operativamente a una secuencia de terminación poli(A) efectiva, por ejemplo, SV40 poli(A), un origen de replicación para el producto plasmídico en E. coli, y/o un sitio de clonación conveniente (por ejemplo, un polienlazador). Los ácidos nucleicos pueden comprender, además, un promotor inducible regulable (inducible, reprimible, regulado por el desarrollo) en contraposición a un promotor constitutivo como CMV IE (el experto en la técnica reconocerá que tales términos son realmente descriptores de un grado de expresión génica en determinadas condiciones).
En la presente descripción se describen métodos para producir una proteína de interés mientras que se proporciona un vector de expresión que comprende un gen de interés (GOI). Dichos vectores de expresión pueden usarse para la producción recombinante de cualquier proteína de interés. Las secuencias de control transcripcional y traduccional en vectores de expresión útiles para transfectar células de vertebrados pueden proporcionarse por fuentes virales. Por ejemplo, los promotores y potenciadores comúnmente usados se derivan de virus como polioma, adenovirus 2, virus de simio 40 (SV40) y citomegalovirus humano (CMV). Los promotores genómicos virales, secuencias de control y/o señal pueden utilizarse para impulsar la expresión, siempre que tales secuencias de control proporcionadas sean compatibles con la célula huésped elegida. También pueden usarse promotores celulares no virales (por ejemplo, promotores de la p-globina y de la EF-1a), en dependencia del tipo celular en el que se va a expresar la proteína recombinante.
Las secuencias de ADN derivadas del genoma viral de SV40, por ejemplo, los sitios de origen de SV40, promotor temprano y tardío, potenciador, empalme y poliadenilación pueden usarse para proporcionar otros elementos genéticos útiles para la expresión de una secuencia de ADN heterólogo. Los promotores tempranos y tardíos son especialmente útiles porque ambos se obtienen fácilmente del virus SV40 como un fragmento que también comprende el origen de replicación viral de SV40 (Fiers y otros, Nature 273:113, 1978). También pueden usarse fragmentos de SV40 más pequeños o más grandes. Típicamente, se incluye la secuencia de aproximadamente 250 pb que se extiende desde el sitio Hind III hacia el sitio Bgll ubicado en el origen de replicación de SV40.
Los vectores de expresión bicistrónicos usados para la expresión de múltiples transcriptos se han descrito anteriormente (Kim S. K. y Wold B. J., Cell 42:129, 1985; Kaufman y otros 1991, supra) y pueden usarse en combinación con un sistema de expresión de GPT. Otros tipos de vectores de expresión también serán útiles, por ejemplo, aquellos descritos en la Patente de los Estados Unidos No. 4,634,665 (Axel y otros) y la Patente de los Estados Unidos No. 4,656,134 (Ringold y otros).
Un sitio de integración, por ejemplo, un sitio de reconocimiento de recombinasa, puede colocarse a 5' o 3' de la secuencia génica que codifica la POI. Un ejemplo de un sitio de integración adecuado es un sitio loxP. Otro ejemplo de un sitio de integración adecuado es dos sitios de reconocimiento de recombinasa, por ejemplo, seleccionados del grupo que consiste en un sitio loxP, lox y un sitio lox 5511.
Casetes de amplificación génica y vectores de expresión de los mismos
Los elementos reguladores útiles, descritos anteriormente o conocidos en la técnica, también pueden incluirse en los constructos de ácido nucleico usados para transfectar células de mamíferos. La figura 1 ejemplifica un casete operativo en un vector de GPT que comprende, además, una secuencia promotora, una secuencia IRES, un gen de interés y una secuencia poli(A).
Un vector de expresión en el contexto de los métodos de la invención puede ser cualquier vector adecuado, incluidos vectores de ácido nucleico cromosómico, no cromosómico y sintético (una secuencia de ácido nucleico que comprende un conjunto adecuado de elementos de control de expresión). Los ejemplos de tales vectores incluyen derivados de SV40, plásmidos bacterianos, ADN de fagos, baculovirus, plásmidos de levadura, vectores derivados de combinaciones de plásmidos y ADN de fagos y vectores de ácidos nucleicos virales (ARN o ADN). En una modalidad, una molécula de ácido nucleico que codifica un anticuerpo se comprende en un vector de ADN o ARN desnudo, que incluye, por ejemplo, un elemento de expresión lineal (como se describe en, por ejemplo, Sykes y Johnston, Nat Biotech 12, 355-59 (1997)), un vector de ácido nucleico compactado (como se describe en, por ejemplo, el documento US 6,077,835 y/o WO 00/70087), o un vector plasmídico tal como pBR322, pUC 19/18, o pUC 118/119. Tales vectores de ácido nucleico y el uso de los mismos se conocen bien en la técnica (véase, por ejemplo, los documentos US 5,589,466 y US 5,973,972).
Un vector de expresión puede ser alternativamente un vector adecuado para la expresión en un sistema de levadura. Puede emplearse cualquier vector adecuado para la expresión en un sistema de levadura. Los vectores adecuados incluyen, por ejemplo, vectores que comprenden promotores constitutivos o inducibles tales como factor alfa de levadura, alcohol oxidasa y PGH (revisados en: F. Ausubel y otros, ed. Current Protocols in Molecular Biology, Greene Publishing and Wiley InterScience Nueva York (1987) y Grant y otros, Methods in Enzymol 153, 516-544 (1987)).
El vector descrito en la presente descripción comprende una molécula de ácido nucleico (o gen de interés) que codifica una proteína de interés, que incluye un vector de expresión que comprende las moléculas de ácido nucleico (genes) descritas en donde la molécula de ácido nucleico (gen) se une operativamente a una secuencia de control de expresión adecuada para la expresión en la célula huésped.
Las secuencias de control de expresión se diseñan por ingeniería genética para controlar e impulsar la transcripción de genes de interés y la expresión posterior de proteínas en diversos sistemas celulares. Los plásmidos combinan un gen de interés expresable con secuencias de control de expresión (es decir, casetes de expresión) que comprenden elementos reguladores convenientes tales como, por ejemplo, promotores, potenciadores, marcadores seleccionables, operadores, etc. En un vector de expresión descrito en la presente descripción, GPT y las proteínas de interés, tales como moléculas de ácido nucleico que codifican un anticuerpo, pueden comprender o estar asociadas con cualquier promotor, potenciador, operador, proteína represora, secuencias de terminación poli(A) y otros elementos que facilitan la expresión adecuados.
La expresión de un gen de interés, tal como una secuencia nucleotídica que codifica un anticuerpo, puede ponerse bajo el control de cualquier elemento promotor o potenciador conocido en la técnica. Ejemplos de tales elementos incluyen promotores de expresión fuertes (por ejemplo, promotor/potenciador de CMV IE humano o promotor IE principal de CMV (CMV-MIE), así como también RSV, promotor tardío de SV40, SL3-3, MMTV, ubiquitina (Ubi), ubiquitina C (UbC) y promotores LTR del VIH).
En algunas modalidades, el vector comprende un promotor seleccionado del grupo que consiste en SV40, CMV, CMV-IE, CMV-MIE, RSV, SL3-3, MMTV, Ubi, UbC y LTR del VIH.
Las moléculas de ácido nucleico descritas en la presente descripción pueden, además, unirse operativamente a una secuencia de terminación poli(A) efectiva, un origen de replicación para el producto plasmídico en E. coli, un gen de resistencia a antibióticos como marcador seleccionable y/o un sitio de clonación conveniente (por ejemplo, un polienlazador). Los ácidos nucleicos pueden comprender, además, un promotor inducible regulable (inducible, reprimible, regulado por el desarrollo) en contraposición a un promotor constitutivo como CMV IE (el experto en la técnica reconocerá que tales términos son realmente descriptores de un grado de expresión génica en determinadas condiciones).
Los marcadores seleccionables son elementos que se conocen bien en la técnica. En algunas circunstancias, pueden emplearse marcadores seleccionables adicionales, además de GPT, en donde tales marcadores hacen las células visibles. Puede usarse una selección positiva o negativa.
En otras modalidades, el vector comprende uno o más genes marcadores seleccionables que codifican la proteína verde fluorescente (GFP), proteína verde fluorescente potenciada (eGFP), proteína cian fluorescente (CFP), proteína cian fluorescente potenciada (eCFP), proteína amarilla fluorescente (YFP) o proteína amarilla fluorescente potenciada (eYFP).
Para los propósitos de esta invención, la expresión génica en células eucariotas puede regularse estrechamente mediante el uso de un promotor fuerte que está controlado por un operador que a su vez está regulado por una proteína de fusión reguladora (RFP). La RFP consiste esencialmente en un dominio de bloqueo de la transcripción y un dominio de unión a ligando que regula su actividad. Ejemplos de tales sistemas de expresión se describen en el documento núm. US20090162901A1.
Una serie de operadores en células procariotas y bacteriófagos están bien caracterizados (Neidhardt, ed. Escherichia coli and Salmonella; Cellular and Molecular Biology 2d. Vol 2 ASM Press, Washington D.C. 1996). Estos incluyen, pero no se limitan a, la región del operador del gen LexA de E. coli, que se une al péptido LexA y los operadores de lactosa y triptófano, que se unen a las proteínas represoras codificadas por los genes Lacl and trpR de E. coli. Estos incluyen, además, los operadores de bacteriófagos de los genes ant/mnt de lambda Pr y del fago P22 que se unen a las proteínas represoras codificadas por lambda cl y P22 arc. En algunas modalidades, cuando el dominio de bloqueo de la transcripción de la proteína represora es una enzima de restricción, tal como NotI, el operador es la secuencia de reconocimiento para esa enzima. Un experto en la técnica reconocerá que el operador debe ubicarse adyacente a, o 3' del promotor de manera que sea capaz de controlar la transcripción por parte del promotor. Por ejemplo, la Patente de los Estados Unidos No. 5,972,650, especifica que las secuencias tetO estén dentro de una distancia específica de la caja TATA. En modalidades específicas, el operador se coloca preferentemente inmediatamente aguas abajo del promotor. En otras modalidades, el operador se coloca dentro de 10 pares de bases del promotor.
En ciertas modalidades, el operador se selecciona del grupo que consiste en operador tet (tetO), secuencia de reconocimiento NotI, operador LexA, operador de lactosa, operador de triptófano y operador de Arc (AO). En algunas modalidades, la proteína represora se selecciona del grupo que consiste en TetR, LexA, Lacl, TrpR, Arc, LambdaCI y GAL4. En otras modalidades, el dominio de bloqueo de la transcripción se deriva de una proteína represora eucariota, por ejemplo, un dominio represor derivado a partir de GAL4.
En un sistema de expresión celular ilustrativo, las células se diseñan por ingeniería genética para expresar la proteína represora de tetraciclina (TetR) y una proteína de interés se coloca bajo el control transcripcional de un promotor cuya actividad está regulada por TetR. Dos operadores TetR en tándem (tetO) se colocan inmediatamente aguas abajo de un promotor/potenciador CMV-MIE en el vector. La transcripción del gen que codifica la proteína de interés dirigida por el promotor CMV-MIE en tal vector puede bloquearse por TetR en ausencia de tetraciclina o algún otro inductor adecuado (por ejemplo, doxiciclina). En presencia de un inductor, la proteína TetR es incapaz de unirse a tetO, por lo tanto, ocurre la transcripción y luego la traducción (expresión) de la proteína de interés. (véase, por ejemplo, la Patente de los Estados Unidos No. 7,435,553.)
Otro sistema de expresión celular ilustrativo incluye proteínas de fusión reguladoras tales como la proteína de fusión TetR-ERLBüT2, en la que el dominio de bloqueo de la transcripción de la proteína de fusión es TetR y el dominio de unión a ligando es el dominio de unión a ligando del receptor de estrógeno (ERlbd) con mutaciones T2 (ERlbdT2; Feil y otros (1997) Biochem. Biophys. Res. Commun. 237:752-757). Cuando las secuencias tetO se colocaron aguas abajo y próximas al promotor CMV-MIE fuerte, se bloqueó la transcripción de la secuencia nucleotídica de interés desde el promotor CMV-MIE/tetO en presencia de tamoxifeno y se desbloqueó mediante la eliminación del tamoxifeno. En otro ejemplo, el uso de la proteína de fusión A tc2-ERlbdT2, una proteína de fusión que consiste en un dímero de cadena simple que consiste en dos proteínas Arc conectadas por un enlazador de 15 aminoácidos y el ERlbdT2 (supra), involucra un operador Arc (AO), más específicamente dos operadores arc en tándem inmediatamente aguas abajo del promotor/potenciador CMV-MIE. Las líneas celulares pueden estar reguladas por A tc2-ERlbdT2, en donde las células que expresan la proteína de interés están dirigidas por un promotor CMV-MIE/ArcO2 y son inducibles con la eliminación del tamoxifeno. (Véase, por ejemplo, el documento Us 20090162901A1.)
En algunas modalidades, un vector de la invención comprende un promotor híbrido CMV-MIE/TetO o CMV-MIE/AO2.
Los vectores de la invención pueden emplear, además, herramientas Cre-lox para la tecnología de recombinación con el fin de facilitar la replicación de un gen de interés. Una estrategia Cre-lox requiere al menos dos componentes: 1) recombinasa Cre, una enzima que cataliza la recombinación entre dos sitios loxP; y 2) sitios loxP (por ejemplo, una secuencia específica de 34 pares de bases que consiste en una secuencia núcleo de 8-pb, donde tiene lugar la recombinación, y dos repeticiones invertidas flanqueantes de 13-pb) o sitios lox mutantes. (Véase, por ejemplo, Araki y otros, PNAS 92:160-4 (1995); Nagy, A. y otros Genesis 26:99-109 (2000); Araki y otros Nuc Acids Res 30(19):e103 (2002); y el documento US20100291626A1). En otra estrategia de recombinación, la recombinasa FLP derivada de levadura puede utilizarse con la secuencia consenso FRT (véase además, por ejemplo, Dymecki, S. PNAS 93(12): 6191-6196 (1996)).
En otro aspecto, un gen (es decir, una secuencia nucleotídica que codifica un polipéptido recombinante descrito en la presente descripción) se inserta aguas arriba o aguas abajo del gen de GPT del casete de expresión y, opcionalmente, está unido operativamente a un promotor, en donde el gen unido a un promotor está flanqueado en 5' por un primer sitio de reconocimiento de recombinasa y en 3' por un segundo sitio de reconocimiento de recombinasa. Tales sitios de reconocimiento de recombinasa permiten la recombinación mediada por Cre en la célula huésped del sistema de expresión. En algunos casos, un segundo gen ligado a un promotor está aguas abajo (3') del primer gen y está flanqueado en 3' por el segundo sitio de reconocimiento de recombinasa. En otros casos más, un segundo gen unido a promotor está flanqueado en 5' por el segundo sitio de recombinasa y flanqueado en 3' por un tercer sitio de reconocimiento de recombinasa. En algunas modalidades, los sitios de reconocimiento de recombinasa se seleccionan de un sitio loxP, un sitio lox511, un sitio Iox2272 y un sitio FRT. En otras modalidades, los sitios de reconocimiento de recombinasa son diferentes. En una modalidad adicional, la célula huésped comprende un gen capaz de expresar una recombinasa Cre.
En otra modalidad, el vector comprende un primer gen que codifica una cadena ligera de un anticuerpo o una cadena pesada de un anticuerpo descrito en la presente descripción, y un segundo gen que codifica una cadena ligera de un anticuerpo o una cadena pesada de un anticuerpo descrito en la presente descripción.
En algunas modalidades, el vector comprende, además, un gen de proteína de unión a caja X 1(mXBP1) capaz de mejorar la producción de proteínas/secreción de proteínas a través del control de la expresión de genes implicados en el plegamiento de proteínas en el retículo endoplasmático (ER). (Véase, por ejemplo, Ron D y Walter P. Nat Rev Mol Cell Biol.8:519-529 (2007)).
Cualquier célula es adecuada para expresar una secuencia de ácido nucleico recombinante descrita en la presente descripción. Las células usadas en la invención son células de mamíferos tales como células animales no humanas, células humanas o fusiones celulares tales como, por ejemplo, hibridomas o cuadromas. En ciertas modalidades, la célula es una célula humana, de mono, hámster, rata o ratón. En otras modalidades, la célula es eucariota y se selecciona de las siguientes células: CHO (por ejemplo, CHO K1, DXB-11 CHO, Veggie-CHO), COS (por ejemplo, COS-7), células retinianas, Vero, CV1, riñón (por ejemplo, HEK293, 293 EBNA, MSR 293, MDCK, HaK, BHK21), HeLa, HepG2, WI38, MRC 5, Colo25, HB 8065, HL-60, Jurkat, Daudi, A431 (epidérmica), CV-1, U937, 3T3, célula L, célula C127, SP2/0, NS-0, célula MMT, célula tumoral y una línea celular derivada de una célula mencionada anteriormente. En algunas modalidades, la célula comprende uno o más genes virales, por ejemplo, una célula retiniana que expresa un gen viral (por ejemplo, una célula PER.C6®).
En incluso un aspecto adicional, la invención se refiere a una célula huésped de mamífero recombinante, tal como un transfectoma, que produce una inmunoglobulina, tal como un anticuerpo o una molécula biespecífica. Los ejemplos de tales células huésped incluyen células de mamíferos modificadas por ingeniería genética tales como células CHO o HEK. Por ejemplo, se describe en la presente descripción una célula que comprende un ácido nucleico integrado de manera estable en el genoma celular que comprende una secuencia que codifica la expresión de un anticuerpo que comprende un polipéptido recombinante descrito en la presente descripción. En otra modalidad, se describe en la presente descripción una célula que comprende un ácido nucleico no integrado (es decir, episómico), tal como un plásmido, cósmido, fagémido, o elemento de expresión lineal, que comprende una secuencia que codifica la expresión de un anticuerpo que comprende el polipéptido recombinante descrito en la presente descripción. Se describe en la presente descripción adicionalmente una línea celular producida por la transfección estable de una célula huésped con un plásmido que comprende un vector de expresión descrito en la presente descripción.
Por lo tanto, se describe en la presente descripción una célula que contiene (a) un polinucleótido recombinante que codifica un gen de GPT de mamíferos añadido exógenamente y (b) un polinucleótido que codifica una proteína de múltiples subunidades. El gen de GPT añadido exógenamente puede ser 90 % idéntico a la secuencia de ácido nucleico de la SEQ ID NO: 2, ejemplos no limitantes de los cuales se proporcionan en las SEQ ID NO: 11-17, y la proteína de múltiples subunidades es un anticuerpo. La célula descrita en la presente descripción puede contener además un gen de GPT añadido exógenamente, y elementos reguladores. La célula descrita en la presente descripción puede ser una célula de mamífero, tal como una célula CHO usada en la fabricación de productos biofarmacéuticos.
Se describe en la presente descripción adicionalmente una línea celular derivada de la célula descrita en el aspecto anterior. Por “derivado de”, lo que se entiende es una población de células descendidas clonalmente de una célula individual y que tienen algunas cualidades seleccionadas, tales como la capacidad de producir proteína activa en un título determinado, o la capacidad de proliferar a una densidad particular. La línea celular, que se deriva de una célula que alberga el polinucleótido recombinante que codifica un gen de GPT de mamíferos y un polinucleótido que codifica una proteína de múltiples subunidades, puede ser capaz de producir la proteína de múltiples subunidades a un título de al menos 3 gramos por litro de medio (g/L), al menos 5 g/L, o al menos 8 g/L. La línea celular puede alcanzar una densidad celular integrada (ICD) que es al menos un 30 % mayor, al menos un 50 % mayor, al menos un 60 % mayor, o al menos un 90 % mayor que la densidad celular integrada alcanzable por una línea celular derivada de lo que es esencialmente la misma célula pero sin el polinucleótido recombinante que codifica la GPT.
Se proporciona un método para amplificar el GOI. Los métodos ejemplificados aplican concentraciones crecientes de tunicamicina a un sistema de expresión de GPT eucariota, lo que amplifica por lo tanto la copia génica de un GOI unido operativamente a un gen de GPT de mamíferos añadido exógenamente.
Proteínas de interés
Una secuencia de ácido nucleico que codifica una proteína de interés puede integrarse convenientemente en una célula que comprende un gen marcador de resistencia a Tn y un IRES, y opcionalmente flanqueado por sitios de reconocimiento de recombinasa. Puede usarse cualquier proteína de interés adecuada para la expresión en células de mamíferos, sin embargo las glicoproteínas se beneficiarán especialmente de los métodos de la invención. Por ejemplo, la proteína de interés puede ser un anticuerpo o fragmento de unión al antígeno del mismo, un anticuerpo biespecífico o fragmento del mismo, un anticuerpo quimérico o fragmento del mismo, un ScFv o fragmento del mismo, una proteína marcada con Fc (por ejemplo, proteína T rampa) o fragmento de la misma, un factor de crecimiento o un fragmento del mismo, una citocina o un fragmento de la misma, o un dominio extracelular de un receptor de superficie celular o fragmento del mismo.
Las glicoproteínas con glicanos unidos a asparagina (unidos a N) son ubicuos en las células eucariotas. La biosíntesis de estos glicanos y su transferencia a los polipéptidos tiene lugar en el retículo endoplasmático (ER). Las estructuras de N-glicanos se modifican adicionalmente por una serie de glicosidasas y glicosiltransferasas en el ER y el complejo Golgi. La producción de proteínas mediante el uso de la invención se dirige a la consistencia de la estructura nativa de N-glicano para eliminar epítopos inmunogénicos (“glicótopos”).
Mediante el uso de los métodos de la invención, los lotes de proteínas recombinantes muestran características favorables. La HPLC (con detección fluorescente) de lotes de producción de proteínas replicadas demostró que las glicoproteínas tenían patrones de expresión y glicosilación uniformes, como se ejemplifica en las figuras 7-8 en la presente descripción. Se proporciona un método para glicosilar un sustrato proteico N-glicano, mientras que se proporciona una célula huésped de mamíferos que codifica una molécula de ácido nucleico que comprende un gen de resistencia a tunicamicina (Tn) de mamíferos unido operativamente a un gen que codifica el sustrato proteico en necesidad de glicosilación; la célula se cultiva en presencia de una primera concentración de Tn; se aísla una población celular que expresa al menos una copia del gen de resistencia a Tn; la población celular se cultiva en presencia de concentraciones crecientes de Tn; y el sustrato proteico N-glicano se aísla del cultivo celular. El contenido de N-glicano del sustrato proteico puede evaluarse para la presencia de monosacáridos y oligosacáridos por cualquier método conocido en la técnica.
El análisis estructural detallado de proteínas unidas a glicanos puede correlacionarse con características funcionales de la proteína. Tal análisis que caracteriza la glicosilación de proteínas típicamente implica varias etapas: i) una liberación enzimática o química de los glicanos unidos; ii) derivatización de los glicanos liberados mediante aminación reductora con aminas aromáticas o alifáticas o permetilación; iii) análisis de los glicanos. El experto conoce muchas variaciones del análisis de patrones de glicosilación. Las glicoproteínas pueden portar varios tipos de glicoformas que ocupan diversos sitios en cantidades específicas y, por lo tanto, su complejidad puede dificultar la reproducción en ciertos métodos de producción. La consistencia de tipo y cantidad de glicoforma es medible y representa un resultado deseable para la producción de proteínas terapéuticas.
Células huésped y transfección
Las células huésped de mamíferos usadas en los métodos de la invención son células de mamíferos, que incluyen, por ejemplo, células CHO y células de ratón. Se describe en la presente descripción una célula que comprende una secuencia de ácido nucleico que codifica una proteína marcadora de resistencia a Tn derivada de Cricetulus griseus (hámster chino) (como se establece en la SEQ ID NO:3), o una homóloga o variante de la misma. En algunas modalidades, la célula comprende múltiples copias génicas del gen marcador de resistencia a Tn. Se describe en la presente descripción una secuencia de ácido nucleico que codifica una proteína marcadora de resistencia a Tn derivada de humano (SEQ ID NO:4), mono Rhesus (SEQ ID NO:5), chimpancé (SEQ ID NO:6), perro (SEQ ID NO:7), cobaya (SEQ ID NO:8), rata (SEQ ID NO:9) o ratón (SEQ ID NO:10).
La invención incluye una célula huésped de mamífero transfectada con un vector de expresión de la invención. Las células huésped transfectadas incluyen células que se han transfectado con vectores de expresión que comprenden una secuencia que codifica una proteína o polipéptido de interés. Las proteínas expresadas se secretarán típicamente en el medio de cultivo, en dependencia de la secuencia de ácido nucleico seleccionada, pero pueden retenerse en la célula o depositarse en la membrana celular. Pueden emplearse diversos sistemas de cultivo celular de mamíferos para expresar proteínas recombinantes. Los ejemplos de líneas celulares huésped de mamíferos adecuadas incluyen las líneas COS-7 de células de riñón de mono, descritas por Gluzman (1981) Cell 23:175, y otras líneas celulares capaces de expresar un vector apropiado que incluye, por ejemplo, líneas celulares CV- 1/EBNa (ATCC CRL 10478), células L, C127, 3T3, CHO, HeLa y BHK. Otras líneas celulares desarrolladas para esquemas de selección o amplificación específicos también serán útiles con los métodos y composiciones proporcionados en la presente descripción. En una modalidad de la invención, la célula es una línea celular de CHO designada K1 (es decir, una célula de CHO K1). Para lograr el objetivo de producción de alto volumen de proteínas recombinantes, la línea celular huésped debe preadaptarse al medio del biorreactor en el caso adecuado.
Se conocen varios protocolos de transfección en la técnica, y se revisan en Kaufman (1988) Meth. Enzymology 185:537. El protocolo de transfección elegido dependerá del tipo de célula huésped y de la naturaleza del GOI, y puede elegirse en base de la experimentación rutinaria. Los requisitos básicos de cualquiera de tales protocolos son primero introducir el ADN que codifica la proteína de interés en una célula huésped adecuada, y luego identificar y aislar las células huésped que han incorporado el ADN heterólogo de una manera relativamente estable y expresable.
Algunos reactivos útiles para introducir el ADN heterólogo en una célula de mamífero incluyen el reactivo Lipofectin™ y el reactivo Lipofectamine™ (Gibco BRL, Gaithersburg, Md.). Ambos reactivos son reactivos comercialmente disponibles que se usan para formar complejos de lípido-ácido nucleico (o liposomas) que, cuando se aplican a células cultivadas, facilitan la captación del ácido nucleico en las células.
El protocolo de transfección elegido y los elementos seleccionados para usar en el mismo dependerán del tipo de célula huésped usada. Los expertos en la técnica conocen numerosos protocolos diferentes y células huésped, y pueden seleccionar un sistema apropiado para la expresión de una proteína deseada, en base a los requisitos del sistema de cultivo celular usado. Se describe en la presente descripción un vector de expresión que codifica un polipéptido, que incluye, pero no se limita a, un anticuerpo, anticuerpo biespecífico, anticuerpo quimérico, ScFv, proteína de unión al antígeno, o proteína de fusión a Fc. Tales vectores de expresión pueden usarse para la producción recombinante de polipéptidos mediante el uso de los métodos y composiciones de la invención.
Otras características de la invención se harán evidentes en el curso de las siguientes descripciones de modalidades ilustrativas que se proporcionan para ilustrar la invención y no pretenden ser limitantes de la misma.
Ejemplos
Los siguientes ejemplos se presentan para proporcionar a los expertos en la técnica cómo hacer y usar los métodos y composiciones descritas en la presente descripción, y no pretenden limitar el alcance de lo que los inventores consideran como su invención. Se han hecho esfuerzos para garantizar la exactitud con respecto a los números usados (por ejemplo, cantidad, temperatura, etc.) pero deben tenerse en cuenta algunos errores y desviaciones experimentales. A menos que se indique de otra manera, las partes son partes por peso, el peso molecular es el peso molecular promedio, la temperatura es en grados centígrados y la presión es atmosférica o cercana.
Ejemplo 1. Eficiencia de selección de células transfectantes que expresan GPT.
Las células CHO K1 modificadas se transfectaron con un vector plasmídico que contiene CHO-GPT (SEQ ID NO: 2), GPT humana (SEQ ID NO:12) o un vector plasmídico que contiene una fosfotransferasa de higromicina (Hpt, gen de resistencia a la higromicina); por ejemplo, el gen marcador seleccionable (CHO-GPT o hpt) se unió transcripcionalmente a un gen de eGFP aguas abajo a través de una secuencia de IRES, en sus respectivos vectores. Por ejemplo, cada plásmido se construyó para contener las siguientes secuencias génicas, en la dirección 5' a 3': un sitio Lox, un promotor tardío de SV40, ya sea CHO-GPT (o Hpt), IRES, proteína verde fluorescente potenciada (eGFP), y un segundo sitio Lox. Los plásmidos recombinantes purificados se transfectaron junto con un plásmido que expresa la recombinasa Cre, en una línea celular huésped CHO modificada que contiene: de 5' a 3', un sitio lox, YFP, y un segundo sitio lox, en un locus transcripcionalmente activo. Por consiguiente, la célula CHO huésped puede aislarse mediante citometría de flujo como una célula verde-positiva o una amarilla-negativa. Cuando el plásmido recombinante que expresa eGFP (regulado transcripcionalmente por los genes de GPT o hpt) se transfectó junto con un plásmido que expresa la recombinasa Cre, la recombinación mediada por la recombinasa Cre da como resultado la integración sitio-específica del casete GPT/eGFP en el locus cromosómico que contiene los sitios lox y ocurre la sustitución del gen de YFP (es decir, una célula verde-positiva). Si la eGFP se integra de forma aleatoria, se producirán células positivas tanto verdes como amarillas.
Las poblaciones celulares se incubaron con 0,1 pg/mL, 2,5 pg/mL o 5 pg/mL de tunicamicina (Tn) o 400 |jg de higromicina (Hyg), como se indica en la tabla 2. Las poblaciones recombinantes observadas (ORP, por sus siglas en inglés) se midieron mediante análisis de clasificación de células activada por fluorescencia (FACS, por sus siglas en inglés). Las células se clasificaron para cuantificar cada población de células, y se calculó la eficiencia de selección para células que expresaban solo GFP y no YFP (figuras 4 o 5).
La eficiencia de selección (población porcentual de células supervivientes que expresan GFP) se comparó entre mezclas de células resistentes a Tn o Hyg (tabla 2).
TABLA 2: Eficiencia de selección
Figure imgf000018_0001
Se observó que la selección de tunicamicina es tan eficiente como la selección de higromicina. Tanto CHO-GPT como GPT humanas fueron eficientes en la selección de los integrantes en presencia de 1 ug/mL o 2,5 ug/mL de tunicamicina.
Ejemplo 2. Am plificación del producto génico.
La selección incremental se realizó al aplicar concentraciones crecientes de tunicamicina al sistema de expresión de GPT. Las células CHO K1 se transfectaron con un vector plasmídico que contiene el gen CHO-GPT (SEQ ID NO: 2) como se indicó anteriormente. El plásmido contiene en dirección 5' a 3', un primer sitio Lox, un promotor tardío de SV40, el gen CHO-GPT, un IRES, eGFP, y un segundo sitio Lox. Los sitios CRE-lox direccionan la integración del gen de interés en el genoma, lo que da como resultado una mezcla de células transfectantes estable con al menos una inserción de GPT por célula. (Se pueden producir más integrantes debido a la integración aleatoria, como se ha visto anteriormente). Las células CHO se cultivaron inicialmente en presencia de 1 pg/mL de tunicamicina (Tn). Los transfectantes se seleccionaron entonces de la mezcla estable (denominada mezcla de células 2) y posteriormente se expandieron en presencia de 1 pg/mL, 2,5 pg/mL o 5 pg/mL de Tn. Se realizaron rondas de selección para identificar poblaciones celulares capaces de expresión potenciada (múltiples copias) de eGFP. Los eventos de integración aleatoria aumentaron considerablemente, en presencia de 2,5 pg/mL o 5 pg/mL de Tn.
El número de copias del producto génico, ya sea CHO GPT, eGFP o mGapdh (control normalizado), se midió mediante el uso de métodos de qPCR estándar. El número de copias de eGFP en las células de la mezcla resistente a 1 pg/mL de Tn incubada adicionalmente con 2,5 ug/mL de Tn fue al menos 2 veces el número de copias de eGFP de la mezcla resistente a 1 pg/mL de Tn incubada adicionalmente con 1 pg/mL de Tn. El número de copias génicas aumentó aún más cuando una mezcla tratada con 1 pg/mL de Tn se incubó adicionalmente con 5 pg/mL de Tn. El aumento en el número de copias génicas de eGFP se correlaciona con el aumento de la copia génica de CHO-GPT. (Véase las figuras 6A y 6B.)
Para determinar si el aumento en el número de copias génicas se traduce en un aumento de la expresión de proteínas, la intensidad fluorescente media (MFI, por sus siglas en inglés) se midió por FACS para las mismas mezclas de células que expresan GPT y eGFP que se trataron con múltiples rondas de selección de Tn, es decir, 1, 2,5 o 5 pg de Tn (véase, por ejemplo, muestras 7, 8 y 9 en la figura 6B). La comparación de la expresión de eGFP para estas mezclas de células se representa en la tabla 3.
La mezcla de células que expresan GPT que se sometió a una segunda ronda de selección con 5 pg de Tn resultó en algo más de 2,5 veces la salida productiva en comparación con el tratamiento con 1 pg de Tn, y 1,5 veces la salida productiva en comparación con el tratamiento con 2,5 pg de Tn, con respecto a la producción de eGFP (tabla 3).
Figure imgf000019_0002
Sin estar unido por ninguna teoría, los aumentos incrementales en la concentración de Tn amplificaron la presión selectiva a las células de manera controlada, lo que aumenta así la salida productiva.
Los vectores de expresión resistentes a Tn también se emplearon en experimentos adicionales, descritos a continuación, para probar los efectos de la selección de Tn en patrones de glicosilación.
Ejemplo 3. Expresión y perfil de glicosilación de una proteína dimérica ilustrativa.
Las células CHO que expresan una proteína “Trampa” (proteína de fusión a Fc-1, en lo sucesivo denominada FcFP1) se transfectaron con un vector de expresión que contiene GPT. El plásmido tiene, en dirección 5' a 3', un sitio Lox, un promotor tardío de SV40, un gen resistente a Tn (CHO-GPT), un IRES eGFP, SV40 poliA y un segundo sitio Lox. Se usó 1 pg/mL de Tn o 5 pg/mL de Tn para la selección del marcador seleccionable de GPT. Las células de las mezclas seleccionadas se expandieron en cultivos en suspensión en medio de producción sin suero. La transfección de GPT se confirmó por la expresión de eGFP mediante análisis de FACS. Los sedimentos recolectados de las mezclas seleccionadas se enviaron para el análisis del número de copias para la expresión de GPT y se estableció un ensayo de productividad de 12 días para determinar el nivel de expresión de FcFP1 en las mezclas seleccionadas con diferentes concentraciones de Tunicamicina.
Se seleccionó la FcFP1 por su patrón de glicosilación complejo, que tiene una abundancia de sitios de glicosilación. Para determinar los perfiles de glicosilación, las células que expresan la proteína FcF1 se expandieron en cultivo celular bajo el protocolo estándar (sin Tn) o las condiciones del tratamiento de Tn como se representa en la tabla 4, luego se aisló y purificó la proteína.
TABLA 4 Pr i n r ín F FP1
Figure imgf000019_0001
El análisis detallado de glicanos se realizó mediante el uso de cromatografía basada en métodos bien conocidos para HPLC y marcajes de ácido antranílico (AA) fluorescente (Anumula, y Dhume, Glycobiology, 8(7):685-694, 1998), para cada lote de glicoproteína para determinar si Tn tuvo un impacto negativo en los perfiles de glicosilación. Los lotes de producción también se compararon con un estándar de referencia que representa un lote de proteína terapéuticamente aceptable. El análisis representativo de glicanos se muestra en las figuras 7A-7D. Cada lote, en comparación con el lote de referencia, produce consecuentemente el mismo número de picos, la forma relativa e intensidad relativa. El solapamiento de cada cromatograma (figura 8) indica que no se han descubierto picos únicos o inusuales.
El perfil de oligosacáridos se realizó mediante métodos de HPLC bien conocidos contra el lote estándar de referencia para la proteína FcFP1. Se midieron los niveles de sialilación para los lotes de proteína trampa FcFP1 y se calculó el número Z para cada lote (3 réplicas). El número Z representa la medida de variación entre lotes. El número Z tiene en cuenta el número relativo de picos, así como también la forma relativa y la intensidad de cada pico. Por ejemplo, el área de cada pico de 0SA, 1SA, 2SA, 3SA y 4SA en las figuras 7A-7D se cuantifica como en la tabla 5.
TABLA An li i n i i li ri
Figure imgf000020_0001
OS = oligosacárido; 0SA = cero residuos de ácido siálico; 1SA = un residuo de ácido siálico; 2SA = dos residuos de ácido siálico; 3SA = tres residuos de ácido siálico; 4SA = cuatro residuos de ácido siálico
Número Z = (Área1SA+2*Área2SA+3*Área3SA+4*Área4SA)
(Area0SA+Area1SA+Area2SA+Area3SA+Area4SA)
El número Z calculado para cada lote está dentro de un intervalo aceptable comparado con el lote de referencia, por lo tanto cada lote de proteínas se entiende para lograr el mismo material que la molécula terapéutica. Dado que se sabe que la presencia de Tn tiene un efecto negativo en la glicosilación de glicoproteínas unidas a N, era inesperado que la producción de proteínas fuera fiable y consistente, así como también productiva, dadas las condiciones de presión selectiva creciente por Tn.

Claims (15)

REIVINDICACIONES
1. Una célula aislada que comprende:
(a) un gen de resistencia a tunicamicina (Tn) de mamíferos que codifica una proteína que tiene al menos 93 % de identidad con la secuencia de aminoácidos de la SEQ ID NO: 3, en donde el gen de resistencia a Tn se añade exógenamente a la célula;
(b) un primer gen de interés (GOI), en donde el primer GOI es un GOI añadido exógenamente; y (c) al menos un elemento regulador,
en donde el gen de resistencia a Tn se une operativamente al primer GOI y al menos a un elemento regulador, en donde la célula es una célula de mamífero, y en donde el primer GOI codifica una cadena ligera de anticuerpo o fragmento de unión al antígeno del mismo, una cadena pesada de anticuerpo o fragmento de unión al antígeno del mismo, o una proteína de fusión a Fc o un fragmento de la misma.
2. Un vector que comprende un ácido nucleico, en donde el ácido nucleico comprende un gen de resistencia a tunicamicina (Tn) de mamíferos que codifica una proteína que tiene al menos 93 % de identidad con la secuencia de aminoácidos de la SEQ ID NO: 3, un primer gen de interés (GOI) unido operativamente al gen de resistencia a Tn, y al menos un elemento regulador, y en donde el primer GOI codifica una cadena ligera de anticuerpo o fragmento de unión al antígeno del mismo, una cadena pesada de anticuerpo o fragmento de unión al antígeno del mismo, o una proteína de fusión a Fc o un fragmento de la misma.
3. La célula aislada de la reivindicación 1, o el vector de la reivindicación 2, en donde el gen de resistencia a Tn comprende una secuencia de ácido nucleico seleccionada del grupo que consiste en la SEQ ID NO: 2, SEQ ID NO: 11, SEQ ID NO: 12, SEQ ID NO: 13, SEQ ID NO: 14, SEQ ID NO: 15, SEQ ID NO: 16 y SEQ ID NO: 17.
4. La célula aislada de la reivindicación 1, o el vector de la reivindicación 2, en donde al menos un elemento regulador se selecciona del grupo que consiste en un promotor, sitio de unión al ribosoma y potenciador.
5. La célula aislada de la reivindicación 1, o el vector de la reivindicación 2, en donde el primer GOI se une operativamente a un promotor.
6. La célula aislada de la reivindicación 1, o el vector de la reivindicación 2, que comprende, además, un segundo gen de interés (GOI) añadido exógenamente, opcionalmente en donde el segundo GOI codifica una glicoproteína y opcionalmente en donde la glicoproteína se selecciona de una cadena ligera de anticuerpo o fragmento de unión al antígeno del mismo, una cadena pesada de anticuerpo o fragmento de unión al antígeno del mismo, una proteína de fusión a Fc o un fragmento de la misma, un ligando, y un receptor o fragmento de unión al ligando del mismo.
7. Un método, que comprende
(a) introducir un vector que comprende un ácido nucleico en una población de células huésped de mamíferos mediante transfección, en donde el ácido nucleico comprende un gen de resistencia a tunicamicina (Tn) de mamíferos que codifica una proteína que tiene al menos 93 % de identidad con la secuencia de aminoácidos de la SEQ ID NO: 3, un primer gen de interés (GOI) unido operativamente al gen de resistencia a Tn y al menos un elemento regulador;
(b) cultivar la población celular de la etapa (a) en presencia de Tn, obtener de esta manera un transfectante celular que comprende el ácido nucleico del vector.
8. Un método para producir una proteína recombinante de interés (POI), en donde el método comprende:
(a) proporcionar una célula huésped de mamífero la cual comprende:
(i) un gen de resistencia a tunicamicina (Tn) de mamíferos que codifica una proteína que tiene al menos 93 % de identidad con la secuencia de aminoácidos de la SEQ ID NO: 3, en donde el gen de resistencia a Tn se añade exógenamente a la célula;
(ii) un primer gen de interés (GOI), en donde el primer GOI es un GOI añadido exógenamente; y (iii) al menos un elemento regulador, en donde el gen de resistencia a Tn se une operativamente al primer GOI y al menos a un elemento regulador; y
(b) cultivar la célula en presencia de Tn para expresar una POI a partir del GOI.
9. El método de la reivindicación 7 u 8, en donde:
(i) el gen de resistencia a Tn comprende una secuencia de ácido nucleico seleccionada del grupo que consiste en la SEQ ID NO: 2, SEQ ID NO: 11, SEQ ID NO: 12, SEQ ID NO: 13, SEQ ID NO: 14, SEQ ID NO: 15, SEQ ID NO: 16 y SEQ ID NO: 17;
(ii) el al menos un elemento regulador se selecciona del grupo que consiste en un promotor, sitio de unión al ribosoma y potenciador;
(iii) el primer GOI se une operativamente a un promotor; y/o
(iv) el primer GOI codifica una glicoproteína y opcionalmente en donde la glicoproteína se selecciona de una cadena ligera de anticuerpo o fragmento de unión al antígeno del mismo, una cadena pesada de anticuerpo o fragmento de unión al antígeno del mismo, una proteína de fusión a Fc o un fragmento de la misma, un ligando, y un receptor o fragmento de unión al ligando del mismo.
10. El método de la reivindicación 7, en donde el vector comprende, además, un segundo gen de interés (GOI) añadido exógenamente, opcionalmente en donde el segundo GOI codifica una glicoproteína y opcionalmente en donde la glicoproteína se selecciona de una cadena ligera de anticuerpo o fragmento de unión al antígeno del mismo, una cadena pesada de anticuerpo o fragmento de unión al antígeno del mismo, una proteína de fusión a Fc o un fragmento de la misma, un ligando, y un receptor o fragmento de unión al ligando del mismo.
11. El método de la reivindicación 8, en donde la célula de mamífero comprende, además, un segundo gen de interés (GOI) añadido exógenamente, opcionalmente en donde el segundo GOI codifica una glicoproteína y opcionalmente en donde la glicoproteína se selecciona de una cadena ligera de anticuerpo o fragmento de unión al antígeno del mismo, una cadena pesada de anticuerpo o fragmento de unión al antígeno del mismo, una proteína de fusión a Fc o un fragmento de la misma, un ligando, y un receptor o fragmento de unión al ligando del mismo.
12. El método de cualquiera de las reivindicaciones 7-11, en donde la Tn está en una concentración de al menos 1 |jg/mL, preferentemente en donde la Tn está en una concentración de 1 jg/mL, 2,5 jg/m L o 5 jg/mL.
13. El método de la reivindicación 7 en donde el transfectante celular se obtiene mediante el cultivo de la población celular de la etapa (b) en presencia de concentraciones crecientes secuencialmente de Tn, o el método de la reivindicación 8 en donde el cultivo comprende el cultivo en presencia de concentraciones crecientes secuencialmente de Tn, opcionalmente en donde el cultivo comprende el cultivo a una primera concentración de Tn de 1 pg/mL, seguido del cultivo a una segunda concentración de Tn de 2,5 pg/mL o 5 pg/mL.
14. El método de cualquiera de las reivindicaciones 7-11 y 13 que comprende, además, aislar una POI expresada a partir del GOI.
15. La célula aislada de cualquiera de las reivindicaciones 1 y 3-6, o el método de cualquiera de las reivindicaciones 7-14, en donde la célula es: (a) seleccionada del grupo que consiste en CHO-K1, COS-7, HEK293, célula tumoral, linfocito, célula retiniana y célula madre; o (b) una célula CHO-K1.
ES15833421T 2014-08-19 2015-08-19 Selectividad eficiente de proteínas recombinantes Active ES2849728T3 (es)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US201462039416P 2014-08-19 2014-08-19
PCT/US2015/045793 WO2016028838A1 (en) 2014-08-19 2015-08-19 Efficient selectivity of recombinant proteins

Publications (1)

Publication Number Publication Date
ES2849728T3 true ES2849728T3 (es) 2021-08-20

Family

ID=55347784

Family Applications (1)

Application Number Title Priority Date Filing Date
ES15833421T Active ES2849728T3 (es) 2014-08-19 2015-08-19 Selectividad eficiente de proteínas recombinantes

Country Status (27)

Country Link
US (4) US9732357B2 (es)
EP (2) EP3901274A1 (es)
JP (3) JP7115851B2 (es)
KR (2) KR102406976B1 (es)
CN (2) CN107075549B (es)
AR (1) AR102333A1 (es)
AU (3) AU2015305565B9 (es)
BR (1) BR112017003074A2 (es)
CA (1) CA2957036A1 (es)
CY (1) CY1124079T1 (es)
DK (1) DK3183359T3 (es)
EA (1) EA035340B1 (es)
ES (1) ES2849728T3 (es)
HR (1) HRP20210301T1 (es)
HU (1) HUE054069T2 (es)
IL (3) IL287020B (es)
LT (1) LT3183359T (es)
MA (1) MA40371B1 (es)
MX (2) MX2017002203A (es)
MY (1) MY191745A (es)
PL (1) PL3183359T3 (es)
PT (1) PT3183359T (es)
RS (1) RS61371B1 (es)
SG (2) SG10201707859RA (es)
SI (1) SI3183359T1 (es)
TW (3) TWI777374B (es)
WO (1) WO2016028838A1 (es)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
AR102333A1 (es) 2014-08-19 2017-02-22 Regeneron Pharma Selectividad eficiente de proteínas recombinadas
EP3749754A4 (en) * 2018-02-08 2021-10-20 Applied Stemcell, Inc. PROCEDURE FOR SCREENING VARIANTS OF A TARGET
WO2021079909A1 (ja) 2019-10-23 2021-04-29 キヤノン株式会社 セラミックス物品の製造方法およびセラミックス物品

Family Cites Families (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4634665A (en) 1980-02-25 1987-01-06 The Trustees Of Columbia University In The City Of New York Processes for inserting DNA into eucaryotic cells and for producing proteinaceous materials
US4656134A (en) 1982-01-11 1987-04-07 Board Of Trustees Of Leland Stanford Jr. University Gene amplification in eukaryotic cells
US5703055A (en) 1989-03-21 1997-12-30 Wisconsin Alumni Research Foundation Generation of antibodies through lipid mediated DNA delivery
US6077835A (en) 1994-03-23 2000-06-20 Case Western Reserve University Delivery of compacted nucleic acid to cells
KR970029803A (ko) 1995-11-03 1997-06-26 김광호 반도체 메모리장치의 프리차지 회로
US5972650A (en) 1997-06-26 1999-10-26 Brigham And Women's Hospital Tetracycline repressor regulated mammalian cell transcription and viral replication switch
US6281005B1 (en) 1999-05-14 2001-08-28 Copernicus Therapeutics, Inc. Automated nucleic acid compaction device
US6919183B2 (en) 2001-01-16 2005-07-19 Regeneron Pharmaceuticals, Inc. Isolating cells expressing secreted proteins
ATE496134T1 (de) 2002-03-29 2011-02-15 Xoma Technology Ltd Multigene vectoren und methoden für eine erhöhte expression von rekombinanten polypeptiden
US8673589B2 (en) 2002-05-29 2014-03-18 Regeneron Pharmaceuticals, Inc. Inducible eukaryotic expression system
US7384744B2 (en) * 2002-11-29 2008-06-10 Boehringer Ingelheim Pharma Gmbh & Co., Kg Expression vector, methods for the production of heterologous gene products and for the selection of recombinant cells producing high levels of such products
JP2005027599A (ja) * 2003-07-09 2005-02-03 Nara Institute Of Science & Technology 植物由来遺伝子を用いた遺伝子導入植物の選抜法
EP1586585A1 (de) * 2004-04-14 2005-10-19 F. Hoffmann-La Roche Ag Expressionssystem zur Herstellung von IL-15/Fc-Fusionsproteinen und ihre Verwendung
CA2671365C (en) 2006-12-07 2020-07-21 Dow Agrosciences Llc Use of dsm-2 gene as a selectable marker for selecting herbicidal resistant plants
PL2150617T3 (pl) 2007-06-04 2015-04-30 Regeneron Pharma Wzmocniona ekspresja i regiony stabilności
KR100927803B1 (ko) * 2007-11-23 2009-11-23 한국생명공학연구원 식물 형질전환체를 선별하기 위한 마커로서 gpt 유전자
ME03057B (me) * 2007-12-07 2019-01-20 Zymogenetics Inc Molekuli humanizovanih antitela specifični za il-31
WO2009131681A2 (en) * 2008-04-22 2009-10-29 Rutgers, The State University Hcv e2 construct compositions and methods
WO2010077297A1 (en) * 2008-12-09 2010-07-08 Halozyme, Inc. Extended soluble ph20 polypeptides and uses thereof
EP2674495A1 (en) 2012-06-14 2013-12-18 Sanofi CHO expression system
AR102333A1 (es) 2014-08-19 2017-02-22 Regeneron Pharma Selectividad eficiente de proteínas recombinadas

Also Published As

Publication number Publication date
HUE054069T2 (hu) 2021-08-30
SG10201707859RA (en) 2017-10-30
SG11201701121UA (en) 2017-03-30
US9732357B2 (en) 2017-08-15
TWI719945B (zh) 2021-03-01
EP3183359B1 (en) 2020-12-16
TW201615833A (zh) 2016-05-01
IL295361A (en) 2022-10-01
EP3901274A1 (en) 2021-10-27
LT3183359T (lt) 2021-02-25
TWI777374B (zh) 2022-09-11
EA201790241A1 (ru) 2017-06-30
JP7260510B2 (ja) 2023-04-18
US20210340564A1 (en) 2021-11-04
IL295361B1 (en) 2023-04-01
AU2020205336B2 (en) 2022-11-10
AU2023200752B2 (en) 2024-02-29
US11085053B2 (en) 2021-08-10
CA2957036A1 (en) 2016-02-25
TW202246506A (zh) 2022-12-01
JP7115851B2 (ja) 2022-08-09
TWI832364B (zh) 2024-02-11
AU2020205336A1 (en) 2020-08-06
CN107075549B (zh) 2021-04-20
AU2015305565B2 (en) 2020-04-30
EP3183359A4 (en) 2018-04-04
AR102333A1 (es) 2017-02-22
JP2017525368A (ja) 2017-09-07
AU2015305565B9 (en) 2020-05-21
MY191745A (en) 2022-07-13
JP2020174681A (ja) 2020-10-29
SI3183359T1 (sl) 2021-03-31
BR112017003074A2 (pt) 2018-03-06
IL287020B (en) 2022-09-01
MX2017002203A (es) 2017-05-22
AU2023200752A1 (en) 2023-03-09
HRP20210301T1 (hr) 2021-04-02
US20160053280A1 (en) 2016-02-25
WO2016028838A1 (en) 2016-02-25
US10457959B2 (en) 2019-10-29
DK3183359T3 (da) 2021-02-01
AU2015305565A1 (en) 2017-03-09
MA40371B1 (fr) 2021-03-31
RS61371B1 (sr) 2021-02-26
TW202124716A (zh) 2021-07-01
US20200063159A1 (en) 2020-02-27
KR102406976B1 (ko) 2022-06-10
KR20220080215A (ko) 2022-06-14
PT3183359T (pt) 2021-02-03
CN113293139A (zh) 2021-08-24
IL250531B (en) 2021-10-31
IL295361B2 (en) 2023-08-01
US20170335341A1 (en) 2017-11-23
KR102556383B1 (ko) 2023-07-17
KR20170055481A (ko) 2017-05-19
MX2021009154A (es) 2021-09-10
EP3183359A1 (en) 2017-06-28
IL250531A0 (en) 2017-03-30
CY1124079T1 (el) 2022-05-27
CN107075549A (zh) 2017-08-18
EA035340B1 (ru) 2020-05-29
PL3183359T3 (pl) 2021-08-02
IL287020A (en) 2021-12-01
MA40371A (fr) 2017-06-28
JP2023076667A (ja) 2023-06-01

Similar Documents

Publication Publication Date Title
KR102243243B1 (ko) 신규한 cho 통합 부위 및 이의 용도
KR101812348B1 (ko) 단백질의 생산 방법
US8809017B2 (en) IRES mediated multicistronic vectors
US20210340564A1 (en) Efficient selectivity of recombinant proteins
US10253321B2 (en) Methods, compositions and kits for a one-step DNA cloning system
WO2010140387A1 (ja) 高生産性細胞の樹立のための発現ベクター及び高生産性細胞
Kalkan et al. Improving recombinant protein production in CHO cells using the CRISPR-Cas system
JP2010522549A (ja) 目的のポリヌクレオチドの発現を増強するためのポリヌクレオチド
JP7472167B2 (ja) 安定的な標的組み込み
TW202102669A (zh) 含有新穎選擇標記的細胞株及其用於蛋白製造的用途
WO2012081629A1 (ja) タンパク質の生産方法
AU2015271899A1 (en) Ires mediated multicistronic vectors
JP2012055303A (ja) 遺伝子増幅を含む高生産性細胞の樹立のための発現ベクター