ES2750525T3 - Procedimientos y composiciones relacionados con CRM197 - Google Patents

Procedimientos y composiciones relacionados con CRM197 Download PDF

Info

Publication number
ES2750525T3
ES2750525T3 ES13815768T ES13815768T ES2750525T3 ES 2750525 T3 ES2750525 T3 ES 2750525T3 ES 13815768 T ES13815768 T ES 13815768T ES 13815768 T ES13815768 T ES 13815768T ES 2750525 T3 ES2750525 T3 ES 2750525T3
Authority
ES
Spain
Prior art keywords
crm197
protein
asp
signal peptide
ala
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
ES13815768T
Other languages
English (en)
Inventor
Julian Ihssen
Michael Kowarik
Linda Christiane Thöny-Meyer
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
GlaxoSmithKline Biologicals SA
Eidgenoessische Materialprufungs und Forschungsanstalt EMPA
Original Assignee
GlaxoSmithKline Biologicals SA
Eidgenoessische Materialprufungs und Forschungsanstalt EMPA
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by GlaxoSmithKline Biologicals SA, Eidgenoessische Materialprufungs und Forschungsanstalt EMPA filed Critical GlaxoSmithKline Biologicals SA
Application granted granted Critical
Publication of ES2750525T3 publication Critical patent/ES2750525T3/es
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/195Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from bacteria
    • C07K14/34Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from bacteria from Corynebacterium (G)

Landscapes

  • Chemical & Material Sciences (AREA)
  • Organic Chemistry (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Biochemistry (AREA)
  • Biophysics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Medicinal Chemistry (AREA)
  • Molecular Biology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Gastroenterology & Hepatology (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Peptides Or Proteins (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)

Abstract

Un procedimiento de producción de CRM197 en el que el procedimiento comprende cultivar una célula huésped que comprende un ácido nucleico que codifica CRM197 en el que CRM197 se fusiona con un péptido señal heterólogo que dirige a CRM197 al periplasma de la célula huésped, en el que el ácido nucleico codifica un sitio de escisión entre el péptido señal que dirige a CRM197 al periplasma y la proteína de CRM197 en el que el sitio de escisión comprende la secuencia de aminoácidos aa1-aa2- aa3-(sitio de escisión)-aa4-aa5-aa6-aa7-aa8, en la que aa1 es Ala, Ser, Gly, Cys, Thr o Gln; aa2 se selecciona de cualquier aminoácido natural; aa3 se selecciona de cualquier aminoácido natural excepto Phe, His, Tyr, Trp, Asp, Glu, Lys, Arg, Asn y Gln; aa4 a 8 se selecciona entre ala-asp-asp-val y met-gly-ala-asp; o en la que el sitio de escisión comprende la secuencia de aminoácidos aa1-aa2-aa3-(sitio de escisión)-aa4-aa5- aa6-aa7-aa8, en la que aa4 a 8 se selecciona entre ala-asp-asp-val y met-gly-ala-asp; y en la que los primeros 70 aa del primer marco de lectura abierto dan como resultado una puntuación Y cuando es analizado por SignalP 4,0 Server de más de 0,72.

Description

DESCRIPCIÓN
Procedimientos y composiciones relacionados con CRM197
1. Introducción
La presente invención proporciona nuevos procedimientos de producción de toxina diftérica. En particular, la presente invención proporciona nuevos procedimientos de producción de formas no tóxicas de toxina diftérica, por ejemplo, CRM197. La presente invención también proporciona nuevas composiciones que comprenden toxina diftérica o formas no tóxicas de toxina diftérica, por ejemplo, CRM197.
2. Antecedentes
La proteína CRM197 es un portador dependiente de células T seguro y eficaz para sacáridos y actualmente se está usando en muchas formulaciones de vacuna diferentes llamadas vacunas conjugadas. La toxina de la difteria es una proteína exotoxina producida por la bacteria Corynebacterium diphtheriae tras la infección con el fago p197. Tanto la toxina de la difteria ("DT") como CRM197 son componentes de muchas vacunas, como por ejemplo contra Bordatella pertussis, Clostridium tetani, C. diphtheriae, virus de la hepatitis B y Haemophilus influenzae tipo B (documentos WO 9324148, WO 9700697, WO 02055105). Además, ha habido un creciente interés en CRM197 debido a su potencial actividad antitumoral relacionada con su capacidad para unirse a la forma soluble de HB-EGF (documento US 2006/0270600A1).
El CRM197 es producido por C. diphtheriae infectado por el fago no toxigénico p197tox. p197tox fue creado por la mutagénesis por nitrosoguanidina del corinefago toxigénico p (Uchida, T. et al. 1971, Nature New Biology 233:8-11). La proteína CRM197 es una forma no tóxica de la toxina de la difteria, pero es inmunológicamente indistinguible de la toxina de la difteria. DT tiene una masa de 58,350 kDa (CRM197 = 58,415 kDa) y consta de los dominios N-terminal A y C-terminal B (21 y 37 kDa) que están unidos por un puente disulfuro que conecta Cys186 y Cys201. El fragmento A es tóxico después de ser liberado de su socio unido por disulfuro, el fragmento B. El corte de la holotoxina por proteólisis leve en el péptido de conexión en las posiciones 191-3 es un requisito previo para la activación del fragmento A. El fragmento B no tiene actividad enzimática aparente, pero se requiere para la toxicidad, probablemente debido a que la holotoxina se dirige a las membranas celulares diana (Broker M, Costantino P, De Tora L, McIntosh ED, Rappuoli R: Biochemical and biological characteristics of cross-reacting material 197 (CRM197), a non-toxic mutant of diphtheria toxin: use as a conjugation protein in vaccines and other potential clinical applications. Biologicals, 2011, 39(4):195-204).
Los cultivos de C. diphtheriae infectados secretan la proteína CRM197 a través de la membrana citoplasmática fuera de la célula al medio de cultivo. La proteína CRM197 tiene aproximadamente el mismo peso molecular que la toxina de la difteria, pero difiere de ella por un cambio de base única (guanina a adenina) en el gen estructural. Este cambio de base única provoca una sustitución de aminoácidos (ácido glutámico para glicina, G52E) en la proteína madura y elimina las propiedades tóxicas de la toxina diftérica (Giannini G, Rappuoli R, Ratti G: The amino-acid sequence of two non-toxic mutants of diphtheria toxin: CRM45 y c Rm 197. Nucleic Acids Res 1984, 12(10):4063-4069).
Los procedimientos de preparación de DT y CRM197 se describen en los documentos US 4709017, US 5843711, US 5601827, y US 5917017. Actualmente hay tres sistemas diferentes usados para la preparación industrial de CRM197. Dos sistemas se basan en el uso de células de C. diphtheriae infectadas con fagos. El desarrollo más reciente constituye un sistema de expresión recombinante en Pseudomonas fluorescens. El procedimiento emplea un enfoque de secreción en el periplasma en una cepa de P. fluorescens genéticamente optimizada usando un gen CRM197 equipado con un péptido señal para secreción en el periplasma (documento US20110287443).
Por ejemplo, la toxina de la difteria se aísla de cultivos de C. diphtheriae cepa C7 (B197) y/o C. diphtheriae cepa C7 (B197) pPx350 cultivados en un medio a base de extracto de levadura y casaminoácidos en condiciones aeróbicas. Se demostró que el ajuste de los componentes del medio mejora los rendimientos (documentos US 4925792, WO 2006 100108). CRM197 o DT se cosechan del sobrenadante del cultivo y se concentran por ultrafiltración. La precipitación con sulfato de amonio es la primera, y la cromatografía de intercambio aniónico es una segunda etapa de purificación.
Sin embargo, la producción de cantidades significativas de la proteína CRM197 para su uso en vacunas se ha visto obstaculizada debido a la baja abundancia de proteínas (documento WO 2006100108).
Se han desarrollado técnicas para impulsar la producción de proteínas CRM usando lisógenos dobles (Isolation and characterization of C. diphtheriae nontandem double lysogens hyperproducing CRM197. R Rappuoli, Appl. Environ. Microbiol. September 1983 46:560-564; U.S. Pat. No. 4,925,792 issued to R. Rappuoli; e Integration of corynebacteriophages beta tox+, omega tox+, and gamma tox- into two attachment sites on the C. diphtheriae chromosome. R Rappuoli, J L Michel, and J R Murphy; J. Bacteriol. March 1983 153:1202-1210) del corinefago no toxigénico p197. Rappuoli informa rendimientos de CRM197 de lisógenos dobles y triples hasta tres veces más altos que los lisógenos individuales. Los niveles de producción de CRM197 por lisógenos individuales son adecuados pero económicamente insatisfactorios para la producción de vacunas que usan la proteína CRM197. Es importante tener en cuenta que la construcción de cepas lisogénicas dobles y triples para aumentar la eficiencia de expresión en C. diphtheriae es un procedimiento largo que requiere una fase de cribado laboriosa.
Se desarrollaron plásmidos para la expresión recombinante de CRM197 en C. diphtheriae (las Patentes de los Estados Unidos US patent 5614382, 1995/5614382 _1997). Esto hace posible aumentar el número de copias del gen (hasta 5-10 por célula) sin tener que seleccionar cepas bacterianas pluri-lisogénicas.
Como en el caso de las cepas de Corynebacterium infectadas por el fago p197tox, CRM197 se expresa en medios de cultivo especiales con un bajo contenido ferroso. A pesar de una reducción en el tiempo requerido para el manejo genético de la cepa bacteriana, la producción de CRM197 no aumenta dramáticamente en comparación con el uso de dobles lisógenos.
Las células huésped de expresión alternativa para DT incluyeron una cepa de vacuna Salmonella typhi cvd 908-htra (Orr N, Galen JE, Levine MM: Expression and immunogenicity of a mutant diphtheria toxin molecule, CRM197, and its fragments in S. typhi vaccine strain CVD 908-htrA. Infect Immun 1999, 67(8):4290-4294). Salmonella es una bacteria Gram negativa y un huésped de expresión similar a E. coli. Los niveles de expresión de diversas construcciones (con, sin péptido señal) en cvd 908-htra fueron bajos y la solubilidad e inmunogenicidad fueron pobres. El uso del sistema alternativo de translocación dependiente no-Sec del operón de hemolisina mejoró la expresión de DT soluble, pero los niveles aún eran bajos.
Los informes para la producción de CRM197 en E. coli muestran bajos rendimientos de CRM197 soluble y formación de producto insoluble en cuerpos de inclusión. Los enfoques de truncamiento se han usado en un intento de mejorar la expresión a niveles superiores. (Bishai WR, Miyanohara A, Murphy JR: Cloning and expression in E. coli of three fragments of diphtheria toxin truncated within fragment B. Journal of Bacteriology 1987, 169(4):1554-1563)
Se usó un plásmido de expresión de cadena sencilla para CRM197 que contiene el gen de la toxina diftérica mutada que codifica CRM197 para la expresión en E. coli (Bishai WR, Rappuoli R, Murphy JR: High-level expression of a proteolytically sensitive diphtheria toxin fragment in Escherichia coli. Journal of Bacteriology 1987, 169(11):5140-5151; Bishai 1987). En esta publicación, la transcripción de CRM197 fue controlada por el promotor Ptox endógeno y constitutivo. Además, el DT fusionado en C-terminalmente con la hormona estimulante de melanocitos alfa ("ABM508") fue expresado por el promotor Plambda inducible por calor o el promotor Ptac para la expresión.
Bishai 1987 especuló que el atasco del aparato de secreción debido a la inducción de proteínas de alto nivel causó una detención del crecimiento después de la inducción de la expresión de las variantes periplásmicas de DT/CRM197. Esto puede ser un problema general en la expresión de proteínas periplásmicas que se ha observado y dado como resultado previamente bajos rendimientos volumétricos de proteínas (Benson SA, Hall MN, Silhavy TJ: Genetic analysis of protein export in E. coli K12. Annual Review of Biochemistry 1985, 54:101-134). El bloqueo del aparato de secreción y la formación de proteína insoluble sugirió una incapacidad de las células de E. coli para proporcionar un entorno productivo de translocación y plegamiento para la biogénesis CRM197.
Como consecuencia, Bishai 1987 razonó que la expresión citoplasmática evitaría el bloqueo del translocón. Por lo tanto, Bishai 1987 eliminó el péptido señal para dirigir la expresión al citoplasma. Solo a bajas temperaturas y cuando se eliminaron las proteasas citoplasmáticas, las construcciones de expresión citoplasmática produjeron producto soluble. La producción fue ineficiente y condujo a agregados a temperaturas elevadas, y cuando las proteasas estaban presentes.
Bishai 1987 no pudo mostrar la producción de altos niveles de proteína de fusión de proteína CRM197 soluble, es decir, con péptido señal para el direccionamiento periplásmico. En un gel de poliacrilamida SDS teñido con Coomassie, los extractos que contienen la construcción de expresión ABM508 mostraron una banda de proteína intensa correspondiente a ABM508, mientras que las células que expresan CRM197 expresadas desde el promotor natural con el péptido señal de tipo salvaje no muestran una banda obvia para CRM197 en el tamaño esperado de 58 kDa.
De este modo, la expresión periplásmica no se consideró una estrategia de producción eficiente y hasta la fecha no existe un sistema de expresión periplásmico de E. coli establecido para la producción de CRM197 o DT soluble y correctamente plegado.
El primer sistema de expresión basado en E. coli para CRM197 (documento WO2010 150230) proporciona un sistema de producción que se basa en la expresión citoplasmática de CRM197 insoluble en cuerpos de inclusión seguido de solubilización, purificación y replegamiento de la proteína. El CRM197 de tipo salvaje sin aminoácidos adicionales solo se puede obtener con este sistema cuando se aplica una etapa de proteólisis adicional.
Los péptidos de señal inducen la secreción de proteínas al periplasma y tienen diversos efectos sobre la biogénesis de proteínas. (Powers T, Walter P: Co-translational protein targeting catalyzed by the E. coli signal recognition particle and its receptor. The EMBO Journal 1997, 16(16):4880-4886.) (Schierle CF, Berkmen M, Huber D, Kumamoto C, Boyd D, Beckwith J: The DsbA signal sequence directs efficient, cotranslational export of passenger proteins to the E. coli periplasm via the signal recognition particle pathway. Journal of Bacteriology 2003, 185(19):5706-5713). La expresión y purificación de CRM197 se ha divulgado en los documentos WO 11/42516 y Alessandra Stefan et al Journal of Biotechnology 156; 245-252 (2011).
3. Sumario
En este documento se proporciona un procedimiento de producción de CRM197 en el que el procedimiento comprende cultivar una célula de E. coli que comprende un ácido nucleico que codifica CRM197 en el que CRM197 se fusiona con un péptido señal heterólogo que se dirige a CRM197 al periplasma de la célula de E. coli, en el que el ácido nucleico codifica un sitio de escisión entre el péptido señal que dirige CRM197 al periplasma y la proteína CRM197 en el que el sitio de escisión comprende la secuencia de aminoácidos aa1-aa2-aa3-(sitio de escisión)-aa4-aa5-aa6-aa7-aa8, en el que aa1 es Ala, Ser, Gly, Cys, Thr o Gln; aa2 se selecciona de cualquier aminoácido natural; aa3 se selecciona de cualquier aminoácido natural excepto Phe, His, Tyr, Trp, Asp, Glu, Lys, Arg, Asn y Gln; aa4 a 8 se selecciona de ala-asp-asp-val y met-gly-ala-asp; o en la que el sitio de escisión comprende la secuencia de aminoácidos aa1-aa2-aa3-(sitio de escisión)-aa4-aa5-aa6-aa7-aa8, en la que aa4 a 8 se selecciona de ala-asp-aspval y met-gly-ala-asp; y en la que los primeros 70 aa del primer marco de lectura abierto dan como resultado una puntuación Y cuando es analizada por el servidor SignalP4,0 de más de 0,72. El procedimiento consiste en producir CRM197 soluble, plegado, de longitud completa con altos rendimientos (por ejemplo, al menos 0,5 mg/1) en cepas de expresión de E. coli. En particular, se usa un péptido señal para dirigir la secreción de la proteína al espacio periplásmico.
En este documento se proporcionan procedimientos de producción de CRM197 en el que el procedimiento comprende cultivar una célula de E. coli que comprende un ácido nucleico que codifica CRM197 en el que CRM197 se fusiona con un péptido señal heterólogo que se dirige a CRM197 al periplasma de la célula de E. coli. En realizaciones más específicas, el péptido señal de tipo salvaje de CRM197 se ha eliminado. En realizaciones aún más específicas, el péptido señal de tipo salvaje de CRM197 ha sido reemplazado por el péptido señal heterólogo. El péptido señal heterólogo se puede seleccionar del grupo que consiste en el péptido señal de la enterotoxina termolábil de E. coli, porina de membrana externa de E. coli (OmpA), proteína de unión a maltosa de E. coli (MalE), pectato liasa de E. carotovorans (PelB) y Bacillus sp. endoxilanasa (XynA). CRM197 se puede producir a una concentración de al menos 5, 10, 25, 50, 75, 100, 125, 125, 150, 175, 200, 225, 250, 300, 400, 500, 600, 700, 800, 900, o al menos 1000 mg de proteína por litro de medio de cultivo. Al menos el 50% de la proteína producida se pliega adecuadamente según lo determinado por el dicroísmo circular. Al menos 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 90%, 95%, 98%, 99%, 99,5%, 99,8%, o al menos 99,9% de la proteína producida está plegada adecuadamente. Al menos el 50% de la proteína producida no está presente en los agregados. Al menos 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 90%, 95%, 98%, 99%, 99,5%, 99,8%, o al menos 99,9% de la proteína producida no está presente en los agregados. Al menos el 50% de la proteína producida es soluble. Al menos 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 90%, 95%, 98%, 99%, 99,5%, 99,8%, o al menos 99,9% de la proteína producida es soluble.
En ciertas realizaciones, la secuencia de nucleótidos heteróloga codifica un sitio de escisión entre el péptido señal que dirige CRM197 al periplasma y la proteína CRM197 en la que el sitio de escisión comprende la secuencia de aminoácidos aa1-aa2-aa3-(sitio de escisión)-aa4-aa5-aa6-aa7-aa8, en la que
aa1 se selecciona entre Ala, Ser, Gly, Cys, Thr, y Gln;
aa2 se selecciona de cualquier aminoácido natural;
aa3 se selecciona de cualquier aminoácido natural excepto Phe, His, Tyr, Trp, Asp, Glu, Lys, Arg Asn, y Gln; aa4 a 8 se selecciona entre ala-asp-asp-val y met-gly-ala-asp;
o en la que el sitio de escisión comprende la secuencia de aminoácidos aa1-aa2-aa3-(sitio de escisión)-aa4-aa5-aa6-aa7-aa8, en la que aa4 a 8 se selecciona entre ala-asp-asp-val y met-gly-ala-asp; y en la que los primeros 70 aa del marco de lectura abierto dan como resultado una puntuación Y cuando es analizado por SignalP 4,0 Server de más de 0,72.
En ciertas realizaciones específicas, la secuencia de nucleótidos heterólogos codifica la proteína de la SEQ ID NO: 1 o 2. La secuencia de nucleótidos heterólogos se puede unir operativamente a un promotor seleccionado del grupo que consiste en el promotor araBAD inducible por 1-arabinosa (PBAD), el promotor lac, el promotor rhaP bAd inducible por 1-ramnosa, el promotor de ARN polimerasa T7, el promotor trc y tac, el promotor de fago lambda p L y el promotor/operador tetA inducible por anhidrotetraciclina.
En ciertas realizaciones, el ácido nucleico que codifica CRM197 se inserta en un plásmido de expresión de copia alta. El plásmido de expresión de copia alta puede ser pEC415, pBR322, pBAD, serie pET, serie pUC, pACT3, pEXT22, pEXT20, serie pBLUESCRIPT, serie pGEM.
En ciertas realizaciones, la expresión de CRM197 se puede inducir a una densidad de cultivo de OD600> 0,3. Específicamente, la expresión de CRM197 se puede inducir a una densidad de cultivo de OD600 >0,5, >1, o >1,5.
El CRM197 se puede expresar a una temperatura de 37 °C. CRM197 se puede expresar a una temperatura de 20, 25, 30, 32 o 35 °C.
En ciertas realizaciones, al menos el 50% de la proteína CRM197 que se ha producido de acuerdo con los procedimientos proporcionados en este documento tiene una terminación N de ADDV, GADDV o MGADDV. Más específicamente, al menos 60%, 70%, 80%, 90%, 95%, 98%, 99%, al menos 99,5% o 100% del CRM197 expresado tiene una terminación N de ADDV, GADDV, o MGADDV. En ciertas realizaciones, al menos el 50% del CRM197 expresado tienen un enlace disulfuro entre Cys186 y Cys201. Al menos 60%, 70%, 80%, 90%, 95%, 98%, 99%, al menos 99,5% o 100% del CRM197 expresado tienen un enlace disulfuro entre Cys186 y Cys201.
3.1 Terminología
La toxina DT-difteria
CRM197-Material reactivo cruzado 197, DT con una mutación de glicina 52 a glutamato, G52E
AMB508-Proteína de fusión que consiste en una secuencia de hormona estimulante de alfa melanocitos fusionada con la secuencia de CRM197 proteína-preproteína p197tox-no-toxigénico corinefago 197
que incluye la proteína madura del péptido señal,
proteína procesada- proteína después de la escisión del péptido señal
IPTG-Isopropil-p-D-tiogalactopiranosid, inductor para lac, trc y promotores relacionados, que se agregarán a los medios de crecimiento en el momento de la inducción
Promotor de paraBAD del operón araBAD, inducible por la adición de L-arabinosa a los medios de crecimiento 4. Breve descripción de los dibujos
Figura 1 Expresión de CRM197 en E. coli. Se probaron diferentes plásmidos de expresión (1, 2, 3, 4, 5 que indican p932, p934, p722, una variante citoplasmática CRM197, y p150 (véase, la Tabla 2)) para la expresión de CRM197 en células E. coli BL21 (carriles indicados por A) o W3110 (B). Los extractos celulares totales normalizados a OD600 después de 2 horas de inducción se prepararon y analizaron. El panel superior muestra una transferencia Western usando antisuero anti DT, el panel inferior se detectó usando antisuero anti his tag. Figura 2. Purificación de CRM197 soluble de E. coli. Se cultivaron dos cepas diferentes que contenían plásmidos de expresión (1, 2, que indican p932, p933) en BL21 como se describe en el texto. Las fracciones de elución se separaron mediante SDS PAGE y se tiñeron con azul Coomassie (panel izquierdo) y se inmunodetectaron después de la electrotransferencia a membranas de nitrocelulosa usando antisuero anti DT.
Figura 3. Niveles de expresión periplásmica de CRM197 fusionados a diferentes péptidos señal N-terminales en comparación con una proteína de referencia bien secretada EPA-6H, exotoxina A (EPA) recombinante, genéticamente desintoxicada de Pseudomonas aeruginosa, (Ihssen J, Kowarik M, Dilettoso S, Tanner C, Wacker M, Thony-Meyer L: Production of glycoprotein vaccines in E. coli. Microbial cell factories 2010, 9:61). Gel SDS-PAGE teñido con Coomassie con extractos periplásmicos de cepas de E. coli que albergan los plásmidos 1 a 16 como se describe en la tabla 2. Las células se cultivaron en matraces de agitación a la temperatura de expresión óptima en medio TB y se indujeron a un OD600 de 0,4-0,6 por la adición de 4 g/l de L-arabinosa. Se tomaron muestras equivalentes a OD para la extracción de proteínas periplásmicas solubles (procedimiento de sacarosalisozima) 4 h después de la inducción, con la excepción de 13*: muestra tomada antes de la inducción. M: mezcla de marcadores proteicos, escala de proteínas pre-teñidas Thermo-Scientific # 26616, 3 |il (concentración de proteínas individuales 0,1-0,2 mg/ml).
5. Descripción detallada
En este documento se proporcionan procedimientos para la expresión de toxina diftérica y formas no tóxicas de toxina diftérica, por ejemplo, CRM197. Más específicamente, se proporcionan en este documento procedimientos para la expresión de CRM197 y la secreción de CRM197 en el espacio periplásmico de células de E. coli en una forma soluble y plegada correctamente.
El CRM197 se expresa usando un péptido señal heterólogo que se dirige al CRM197 en el espacio periplásmico de la célula huésped. En ciertas realizaciones más específicas, la célula huésped es E. coli. Se puede construir un casete de expresión que contiene el gen CRM197 y un péptido señal heterólogo usando técnicas estándar de biología molecular. Específicamente, el péptido señal de tipo salvaje de CRM197 se elimina y en su lugar se introduce un péptido señal heterólogo. A nivel de ácido nucleico, se debe tener cuidado de que la secuencia que codifica el péptido señal se clone en marco con el ácido nucleico que codifica el resto de CRM197. En ciertas realizaciones específicas, el péptido señal heterólogo reemplaza al péptido señal de tipo salvaje. En otras realizaciones, el péptido señal de tipo salvaje se elimina o se inactiva funcionalmente y el péptido señal heterólogo se introduce en una ubicación diferente de la proteína. En ciertas realizaciones, se introduce un sitio de escisión proteolítica entre el péptido señal y el resto de la molécula. El sitio de escisión proteolítica se puede reconocer y escindir en el periplasma de la célula huésped. En ciertas realizaciones más específicas, la señal peptidasa se expresa de forma recombinante en la célula huésped.
En ciertas realizaciones, los siguientes parámetros pueden afectar la expresión de la proteína de interés. Se proporciona información más detallada sobre estos diversos aspectos en las siguientes secciones.
El ácido nucleico puede codificar el CRM197 maduro y secretado (SEQ ID NO: 6):
i) de manera optimizada para el uso de codones de E. coli.
ii) Se puede usar una secuencia de señal heteróloga para dirigir CRM197 al espacio periplásmico en E. coli. Mediante procedimientos de clonación estándar, las secuencias de ADN sintéticas que codifican un péptido señal heterólogo se pueden fusionar en la terminación N del gen de CRM197 maduro. Diferentes péptidos señal N-terminales, tal como a partir de la enterotoxina termolábil de E. coli, la porina A de membrana externa de E. coli (OmpA), la proteína de unión a maltosa de E. coli (MalE), E. coli DsbA, pectato liasa de Erwinia carotovorans (PelB) o endoxilanasa de Bacillus sp. (XynA) se puede usar con los procedimientos proporcionados en este documento. En ciertas realizaciones, se ha demostrado que un péptido señal heterólogo particular confiere secreción de proteínas recombinantes al espacio periplásmico de E. coli
iii) El sitio de escisión del péptido señal (esto es, la secuencia entre el péptido señal y la proteína secretada); Por ejemplo, los programas de predicción de escisión de péptidos señal, tal como por ejemplo el programa de servidor SignalP 4,0 (alojado en el sitio web del the Center for Biological Sequence Analysis of the Technical University of Denmark), se pueden usar para diseñar sitios de escisión de péptidos señal alternativos. Este programa predice i) la probabilidad del sitio de escisión, y ii) la ubicación del sitio de escisión, es decir, entre qué aminoácidos es más probable que se produzca la escisión. En realizaciones específicas, los sitios de escisión del péptido señal se diseñan de una manera que da como resultado una terminación N de CRM197 lo más similar posible a la terminación N natural.
iv) Se puede usar un plásmido de expresión de alto número de copias apropiado con los procedimientos proporcionados en este documento.
v) La expresión de CRM 197 se puede colocar bajo el control del promotor de arabinosa de inducción de alto nivel.
vi) El medio de crecimiento;
vii) El tiempo de expresión, es decir, el punto de inducción durante el crecimiento y el tiempo entre la inducción y la cosecha de las células;
viii) Cantidad de inductor;
ix) La temperatura de expresión;
En general, un procedimiento proporcionado en este documento se realiza como sigue. Primero, un plásmido de expresión como se describe en este documento se introduce en una célula huésped (por ejemplo, cepa de expresión de E. coli o Salmonella sp). La mezcla de transformación se puede colocar en placas en medios enriquecidos complementados con el antibiótico para el cual el plásmido de expresión lleva un marcador de resistencia. Se puede usar una sola colonia para inocular un pequeño volumen de cultivo (por ejemplo, 5 ml) que consiste en, por ejemplo, medio TB o un medio rico similar que contiene glicerol como fuente de carbono y que carece o se complementa con el antibiótico apropiado. El cultivo se puede incubar luego entre 20-35 °C hasta la fase estacionaria y luego diluirse en medio fresco de composición idéntica o similar, precalentado a 20-35 °C, en una proporción de 1:50 a 1: 100. El cultivo fresco puede crecer hasta la fase de crecimiento exponencial (OD600 de 0,6-1,2) y la expresión se induce mediante la adición del inductor apropiado, que depende del promotor usado en el plásmido de expresión. Los ejemplos de inductores incluyen arabinosa o un químico diferente de la condición física para la inducción de proteínas de alto nivel. Luego, la expresión continúa. En ciertas realizaciones, la expresión continúa antes de la cosecha durante al menos 2, 4, 6, 8, 10, 12, 14, 16, 18, 20, 22, 24, 26, 28, o al menos 30 horas.
Se pueden tomar muestras en cualquier momento. En todos los puntos de tiempo, la cantidad de CRM197 soluble formado se evalúa mediante análisis a través de SDS-PAGE y tinción con Coomassie de extractos periplásmicos. Una comparación con el CRM197 comercial de concentración conocida permite estimar el rendimiento.
En ciertas realizaciones, el siguiente control se usa para determinar que la proteína CRM197 expresada es soluble. Sin estar limitado por la teoría, dicha proteína soluble está plegada correctamente. CRM197 detectado a alrededor de 58 kDa en extractos periplásmicos preparados por el procedimiento de sacarosa-lisozima (Kowarik M, Young NM, Numao S, Schulz BL, Hug I, Callewaert N, Mills DC, Watson DC, Hernandez M, Kelly JF et al: Definition of the bacterial N-glycosylation site consensus sequence. The EMBO journal 2006, 25(9):1957-1966) se puede usar como un estándar para la proteína soluble.
En ciertas realizaciones, en este documento se proporcionan procedimientos que dan como resultado una concentración de CRM197 plegado adecuadamente de al menos 1 mg/1, 2 mg/l, 3 mg/l, 4 mg/l, 5 mg/l, 6 mg/l, 7 mg/l, 8 mg/l, 9 mg/l, 10 mg/l, 11 mg/l, 12 mg/l, 13 mg/l, 14 mg/l, 15 mg/l, 20 mg/l, 25 mg/l, 50 mg/l, 75 mg/l, o al menos 100 mg/l.
En ciertas realizaciones, dependiendo de la secuencia del sitio de escisión del péptido señal, la terminación N de CRM197 puede ser ADDV o MGADDV.
En ciertas realizaciones, al menos el 50%, 60%, 70%, 75%, 80%, 85%, 90%, 95%, 98%, 99%, o 100% de las proteínas CRM197 resultantes tienen un disulfuro enlace entre Cys186 y Cys201 conectando los fragmentos A y B. La presencia de este enlace disulfuro se puede demostrar usando un ensayo de tiol (Hansen RE, Ostergaard H, Norgaard P, Winther JR: Quantification of protein thiols and dithiols in the picomolar range using sodium borohydride and 4,4'-dithiodipyridine. Anal Biochem 2007, 363(1):77-82).
En ciertas realizaciones, al menos el 50%, 60%, 70%, 75%, 80%, 85%, 90%, 95%, 98%, 99%, o 100% de las proteínas CRM197 resultantes son solubles y no están presentes en los agregados.
5.1 Proteínas de interés
La presente invención describe procedimientos de producción para CRM197. Las secuencias de proteínas ilustrativas para CRM197 se proporcionan como SEQ ID NOs: 3 y 4, y las secuencias de ADN del plásmido de expresión de longitud completa correspondientes son SEQ ID NOs: 1 y 2.
5.2 Orientación periplásmica
En E. coli existen diversas rutas secretoras desde el citoplasma hasta el periplasma. Estas vías incluyen la vía Sec, la vía dependiente de SRP y la vía de la arginina gemela para la secreción. Se cree que el poro TatABC es responsable de la secreción de proteínas plegadas. Sin estar limitado por la teoría, el péptido señal puede determinar qué vía secretora es elegida por la célula. (Driessen AJ, Nouwen N: Protein translocation across the bacterial cytoplasmic membrane. Annual review of biochemistry 2008, 77:643-667.)
En ciertas realizaciones, el péptido señal heterólogo para usar con los presentes procedimientos es una secuencia señal hidrófoba amino terminal que se escinde durante el procedimiento de translocación. En ciertas realizaciones, las condiciones para un procedimiento proporcionado en este documento se eligen de manera que la proteína no se pliegue en su estructura tridimensional estable en el citoplasma de la célula huésped. Sin estar limitado por la teoría, el plegado el citoplasma puede evitar la exportación. En ciertas otras realizaciones, el péptido señal heterólogo codifica una firma de arginina que dirige la proteína a la ruta de la arginina gemela para la secreción.
En ciertas realizaciones, una proteína desplegada se puede mantener en un estado competente de exportación de varias maneras diferentes: (i) el péptido señal heterólogo se puede elegir de modo que la proteína se pueda translocar a través de una membrana simultáneamente con la traducción de la proteína, asegurando de este modo que ni siquiera sus estructuras secundarias se forman en el citoplasma debido a la ausencia de polímero de aminoácidos; (ii) chaperonas o factores antiplegamiento que evitan el plegamiento en el citoplasma (Randall LL, Topping TB, Smith VF, Diamond DL, Hardy Sj : SecB: a chaperone from E. coli. Methods Enzymol 1998, 290:444-459.) se pueden proporcionar; (iii) las secuencias de señal heterólogas se eligen y/o insertan de manera que actúen como chaperonas intrapolipéptidas para evitar el plegamiento rápido; y/o (iv) el DT o CRM197 se modifica de modo que contenga características en su estructura final (por ejemplo, enlaces disulfuro) que no se forman en el entorno del citoplasma de modo que las proteínas no puedan alcanzar sus conformaciones plegadas finales en el citoplasma.
5.2.1 Péptidos de señal
Los péptidos señal heterólogos ilustrativos que se pueden usar con los procedimientos proporcionados en este documento son: la secuencia señal de E. coli DsbA, los péptidos señal MalE, OmpA y PelB. Sin estar limitado por la teoría, la elección del péptido señal puede determinar la ruta de secreción, por ejemplo, la ruta dependiente de SRP frente a la dependiente de SecB hacia el translocón. Las condiciones de expresión óptimas pueden diferir para diferentes rutas de focalización. Hay informes que afirman que las tecnologías que permiten la identificación de la vía de secreción dirigida (Marrichi M, Camacho L, Russell dG, DeLisa MP: Genetic toggling of alkaline phosphatase folding reveals signal peptides for all major modes of transport across the inner membrane of bacteria. J Biol Chem 2008, 283(50):35223-35235).
Los péptidos señal preferidos se seleccionan de proteínas secretadas conocidas y predichas que se exportan eficientemente al periplasma de E. coli a través de rutas cotraduccionales. Entre otros, se pueden usar los péptidos señal de enterotoxina termolábil de E. coli, porina A de membrana externa de E. coli (OmpA), proteína de unión de maltosa de E. coli (MalE), pectato liasa de E. carotovorans (PelB), o endoxilanasa de Bacillus sp. (XynA).
5.2.2 Sitios de escisión
Sin estar limitados por la teoría, los péptidos señal se escinden de la preproteína mediante una peptidasa señal, y en E. coli hay SPaseI y II. SPaseI está escindiendo algunos péptidos señal de proteínas de membrana y más solubles, mientras que SPaseII escinde péptidos señal de lipoproteínas. SPaseI es la peptidasa señal responsable en la presente invención. Se pudo determinar el uso de SPaseI (Paetzel M, Karla A, Strynadka NC, Dalbey RE: Signal peptidases. Chemical reviews 2002, 102(12):4549-4580).
Sin estar limitados por la teoría, las ubicaciones del sitio de escisión se definen por i) la estructura de la organización del péptido señal característico con un núcleo hidrófobo, una terminación N cargada y una terminación C hidrófila, y ii) por la secuencia primaria alrededor de la posición de escisión (a menudo A-X-A) (Heijne G: The distribution of positively charged residues in bacterial inner membrane proteins correlates with the trans-membrane topology. The EMBO journal 1986, 5(11):3021-3027.). Ambos parámetros son bien entendidos y los programas de predicción tienen una alta precisión (Petersen TN, Brunak S, von Heijne G, Nielsen H: SignalP 4,0: discriminating signal peptides from transmembrane regions. Nat Methods 2011, 8(10):785-786). El programa SignalP 4,0 server proporciona una probabilidad de escisión basada en la secuencia de los primeros 70 aminoácidos de la preproteína. En ciertas realizaciones, los sitios de escisión diseñados para su uso con los procedimientos proporcionados en este documento tienen una puntuación Y de al menos 0,4, 0,5, 0,6, 0,7, 0,72, 0,75, 0,8, 0,85, 0,9, o al menos 0,95.
En ciertas realizaciones, el sitio de escisión del péptido señal está diseñado de tal manera que la terminación N prevista es la terminación N de la proteína que existe naturalmente. En otras realizaciones, los péptidos señal y la terminación N del CRM197 están diseñados de tal manera que la terminación N esté lo más cerca posible de la terminación N encontrado de forma nativa.
La terminación N natural después de la escisión del péptido señal de la proteína CRM197 es GADDV... (Bell CE, Eisenberg D: Crystal structure of nucleotide-free diphtheria toxin. Biochemistry 1997, 36(3):481-488). En ciertos aspectos de la divulgación, la terminación N de CRM197 expresado en E. coli usando el péptido señal DsbA puede ser:
MKKIWLALAGLVLAFSASA-(escis¡ón)-ADDVVDSSK... y usando el péptido señal PelB MKKIWLALAGLVLAFSAMA-(escis¡ón)-GADDVVDSSKS....
Tenga en cuenta el motivo AXA en el sitio de escisión, donde la escisión tiene lugar después del segundo A. Otras secuencias de escisión y combinaciones de sitios de escisión de péptido señal se exponen en la Tabla 2 a continuación.
5.3 Plásmidos de expresión
Se conoce una amplia variedad de vectores de expresión para la expresión recombinante en células de E. coli. En principio, se puede usar cualquier esqueleto de vectores. Los vectores ilustrativos son: pEC415 (Schulz H, Hennecke H, Thony-Meyer L: Prototype of a heme chaperone essential for cytochrome c maturation. Science 1998, 281(5380): 1197-1200), pBR322 (Bolivar F, Rodriguez RL, Greene PJ, Betlach MC, Heyneker HL, Boyer HW, Crosa JH, Falkow S: Construction and characterization of new cloning vehicles. II. A multipurpose cloning system. Gene 1977, 2(2):95-113), pBAD (Invitrogen corporation, Carlsbad, CA), serie pET (Invitrogen), serie pUC (Lin-Chao S, Chen WT, Wong TT: High copy number of the pUC plasmid results from a Rom/Rop-suppressible point mutation in RNA II. Mol Microbiol 1992, 6(22):3385-3393), pACT3, pEXT22, pEXT20 (Dykxhoorn DM, St Pierre R, Linn T: A set of compatible tac promoter expression vectors. Gene 1996, 177(1-2):133-136.), serie pBLUESCRIPT (Stratagene, Agilent Technologies, Santa Clara, CA), serie pGEM (Promega Corp., Madison, WI). Todos estos vectores podrían usarse para clonar el casete de expresión de la preproteína bajo el control de un promotor inducible.
Se proporcionan plásmidos ilustrativos como SEQ ID NOs: 1 y 2. El esqueleto del vector se basa en pBR322 que contiene un origen de replicación pMB1 de copia media a alta, un casete de resistencia a ampicilina que se puede intercambiar por un casete de kanamicina, el regulón del operón araBAD que codifica el represor AraC y el promotor araBAD para la inducción de expresión de proteínas de alto nivel.
En ciertas realizaciones, CRM197 se expresa a partir de construcciones integradas cromosómicamente. Esta estrategia requiere tecnologías adicionales que son bien conocidas para los expertos en el arte y darían como resultado una construcción de expresión integrada al genoma que consta de los mismos elementos que un plásmido de expresión pero que no requiere el casete de selección (solo para la selección tras la integración genómica) y origen de replicación.
5.4 Promotores
Entre los promotores inducibles de alta expresión bien conocidos, se puede usar cualquiera que sea funcional a la temperatura para la expresión de la proteína de interés. En ciertas realizaciones, un promotor que se usará con los procedimientos proporcionados en este documento es activo por debajo de la temperatura de 37 °C, por debajo de 36 °C, 35 °C, 34 °C, 33 °C, 32 °C, 31 °C, o por debajo de 30 °C. La siguiente lista contiene promotores ilustrativos de expresión bacteriana que se pueden usar con los procedimientos proporcionados en este documento (Tabla 1):
Tabla 1: Promotores inducibles usados en la expresión bacteriana (Fuente: sitio web del: The Wolfson Centre for Applied Structural Biology of the Hebrew University of Jerusalem)
Figure imgf000009_0001
(continuación)
Figure imgf000010_0001
5.5 Medio de cultivo
El medio de cultivo para la producción de proteínas puede ser cualquier medio definido, semidefinido o complejo apropiado para la sobreexpresión de proteínas recombinantes en E. coli. Se prefiere un medio complejo rico como el caldo Terrific (TB), pero también se pueden usar medios de sales minerales definidos. El caldo Terrific está compuesto de 24 g/l de extracto de levadura, 12 g/l de triptona o peptona (es decir, caseína digerida proteolíticamente, proteína de soja u otra proteína) y 4% (v/v) de glicerol. Además, el medio está tamponado.
En ciertas realizaciones específicas, la concentración de iones de magnesio es como máximo 10nM, 50nM, 100nM, 250nM, 500nM, 750nM, o como máximo 1mM. En ciertas realizaciones específicas, no se agrega magnesio. En ciertas realizaciones específicas, no se agrega MgCh al medio de cultivo.
En ciertas realizaciones específicas, el pH del medio de cultivo está entre 6 y 9. En ciertas condiciones específicas, el extracto de levadura puede estar presente en el medio de cultivo a una concentración entre 10-30 g/l. En ciertas realizaciones específicas, el medio de cultivo comprende glicerol del 2,5% al 10%. En ciertas otras realizaciones, el medio de cultivo comprende glicerol al menos 5%, 10%, 15% o al menos 20%.
5.6 Inducción y expresión
Los cultivos de expresión antes de la inducción se pueden cultivar a diferentes temperaturas, por ejemplo, temperaturas que oscilan entre 4-35 °C o 18-37 °C. En ciertas realizaciones, los cultivos de expresión antes de la inducción se cultivan a una temperatura dentro del intervalo de 18-20 °C, 20-22 °C, 22-24 °C, 24-26 °C, 26-28 °C, 28-30 °C, 30-32 °C, 32-34 °C, o 34-36 °C. En ciertas realizaciones, los cultivos de expresión antes de la inducción se cultivan a una temperatura de aproximadamente 18 °C, 19 °C, 20 °C, 21 °C, 22 °C, 23 °C, 24 °C, 25 °C, 26 °C, 27 °C, 28 °C, 29 °C, 30 °C, 31 °C, 32 °C, 33 °C, 34 °C, 35 °C, 36 °C, o 37 °C.
Las temperaturas de cultivo después de la inducción pueden caer en ciertos intervalos, por ejemplo, temperaturas que oscilan entre 4-35 °C o 18-37 °C, y pueden ser diferentes de las condiciones de inducción anteriores. Por ejemplo, un cultivo de preinducción se puede cultivar a temperaturas más altas, por ejemplo, una temperatura descrita anteriormente, y luego cambiarse a una temperatura más baja, por ejemplo, una temperatura en el intervalo de 15-30 °C, para la producción. En ciertas realizaciones, los cultivos después de la inducción se cultivan a una temperatura dentro del intervalo de 18-20 °C, 20-22 °C, 22-24 °C, 24-26 °C, 26-28 °C, 28-30 °C, 30-32 °C, 32-34 °C, o 34-36 °C. En una realización específica, dicha temperatura cae dentro de un intervalo que es inferior al intervalo en el que se cultiva el cultivo de preinducción. En ciertas realizaciones, los cultivos después de la inducción se cultivan a una temperatura de aproximadamente 18 °C, 19 °C, 20 °C, 21 °C, 22 °C, 23 °C, 24 °C, 25 °C, 26 °C, 27 °C, 28 °C, 29 °C, 30 °C, 31 °C, 32 °C, 33 °C, 34 °C, 35 °C, 36 °C, o 37 °C. En una realización específica, dicha temperatura cae dentro de un intervalo que es inferior al intervalo en el que se cultiva el cultivo de preinducción.
Dependiendo de la construcción, el tiempo de expresión puede ser de 2-20 h. Las concentraciones de inductor son, dependiendo del promotor, de 0,01 a 1% (p/v) de arabinosa (ParaBAD), o de 10 a 1000 |iM de IPTG. La inducción se puede realizar a valores de OD600 obtenidos durante la fermentación entre 0,3 a 1,5 en cultivos en matraces de agitación, y a OD600 entre 5 a 200 en fermentaciones del biorreactor. En ciertas realizaciones específicas, la inducción se realiza a una OD600 entre 5 y 50, 25 y 75, 50 y 100, 75 y 125, 100 y 150, 125 y 175, 150 y 200, o 175 y 200. En ciertas realizaciones, la inducción se realiza al comienzo de la fase log en el matraz de agitación. Las fermentaciones del biorreactor se pueden realizar a valores constantes de pO2 que oscilan desde 0% a 40%. La regulación de pO2 se puede realizar regulando la velocidad del agitador o la velocidad de aireación.
En ciertas realizaciones, el promotor es inducible con arabinosa; las concentraciones de arabinosa pueden ser al menos 0,01, 0,05, 0,1, 0,2, 0,3, 0,4, 0,5, 0,6, 0,7, 0,8, 0,9, o al menos 1 % (p/v) arabinosa. En ciertas realizaciones, la concentración del inductor arabinosa es como máximo 0,01, 0,05, 0,1, 0,2, 0,3, 0,4, 0,5, 0,6, 0,7, 0,8, 0,9, o como máximo 1 % (p/v) arabinosa
En ciertas realizaciones, el promotor es inducible con IPTG; las concentraciones de IPTG pueden ser al menos 10, 25, 50, 75, 100, 200, 250, 300, 400, 500, 600, 700, 750, 800, 900 o al menos 1000 |iM de IPTG. En ciertas realizaciones, la concentración del inductor IPTG es como máximo 10, 25, 50, 75, 100, 200, 250, 300, 400, 500, 600, 700, 750, 800, 900 o como máximo 1000 |iM de IPTG.
En ciertas realizaciones, la expresión se realiza en cultivos en matraces de agitación. Los valores de OD600 en el momento de la inducción son al menos 0,3, 0,4, 0,5, 0,6, 0,7, 0,8, 0,9, 1, 1,1, 1,2, 1,3, 1,4, o al menos 1,5 en cultivos en matraces de agitación. En ciertas realizaciones, los valores de OD600 en el momento de inducción son como máximo 0,3, 0,4, 0,5, 0,6, 0,7, 0,8, 0,9, 1, 1,1, 1,2, 1,3, 1,4, o como máximo 1,5 en cultivos en matraces de agitación. En ciertas realizaciones, la expresión se realiza en fermentaciones del biorreactor. Los valores de OD600 en el momento de la inducción son al menos 5, 10, 15, 20, 25, 50, 75 o al menos 100 en fermentaciones del biorreactor. En ciertas realizaciones, los valores de OD600 en el momento de la inducción son como máximo 5, 10, 15, 20, 25, 50, 75 o como máximo 100 en fermentaciones del biorreactor.
Las fermentaciones del biorreactor se pueden realizar a valores constantes de pO2 de al menos 1%, 2%, 3%, 4%, 5%, 6%, 7%, 8%, 9%, 10%, 15%, 20%, 25%, 30%, 35%, o al menos 40%. En ciertas realizaciones, las fermentaciones del biorreactor se pueden realizar a valores constantes de pO2 de como máximo 1%, 2%, 3%, 4%, 5%, 6%, 7%, 8%, 9%, 10%, 15%, 20%, 25%, 30%, 35%, o como máximo 40%.
5.7 Células huésped
Las cepas de expresión para la producción recombinante de la proteína diana pueden ser, pero no se limitan a, cepas de E. coli K12 y B, como W3110, DB1, DH5a, BL21, BL21(DE3), C43, JM109, JM101, JM110, y derivados de los mismos (Huang Cj , Lin H, Yang X: Industrial production of recombinant therapeutics in E. coli and its recent advancements. Journal of Industrial Microbiology & Biotechnology 2012, 39(3):383-399). Las células huésped se pueden modificar cromosómicamente para acomodar la expresión óptima de la proteína CRM197. Por ejemplo, las proteasas periplásmicas como DepP, Prc, Spr y/o proteasa III pueden eliminarse en cepas de producción. Las deleciones pueden ser útiles solas o en combinación con otras proteasas. Además, mutaciones supresoras como, por ejemplo, sprW148R (Chen C, Snedecor B, Nishihara JC, Joly JC, McFarland N, Andersen DC, Battersby JE, Champion KM: High-level accumulation of a recombinant antibody fragment in the periplasm of E. coli requires a triple-mutant (degP prc spr) host strain. Biotechnology and bioengineering 2004, 85(5):463-474.) pueden aumentar el rendimiento de la proteína CRM197.
5.8 Ensayos
Los procedimientos para caracterizar el rendimiento, la pureza, la estabilidad, el grado de corte, la toxicidad y el contenido de endotoxinas están bien establecidos y definen la calidad para el uso de CRM197 en una vacuna. El análisis de CRM197 se realiza mediante, por ejemplo, cromatografía de exclusión por tamaño de alto rendimiento, enfoque isoeléctrico, SDS-PAGE y Western Blot, determinación de peso molecular por MS, secuenciación de terminal N, análisis de aminoácidos, cromatografía líquida de fase inversa, espectroscopía de masas por electroaspersión y mapeo de péptidos por espectroscopía de masas después de la digestión tríptica.
Se describen procedimientos analíticos y los parámetros que definen una calidad aceptable están bien establecidos para su uso en medicamentos. Se proporcionan información detallada y parámetros marco, por ejemplo, en las directrices publicadas por la agencia médica europea, EMEA, y se pueden encontrar en el sitio web de EMEA, por ejemplo, para la vacuna Prevenar que contiene CRM197.
5.8.1 Concentración del producto de expresión
Se podrían usar tecnologías de concentración de proteínas estándar como el ensayo Lowry, el ensayo BCA y los ensayos Bradford, así como la determinación de la absorción UV a 280 nm y la cuantificación de geles SDS-PAGE teñidos con Coomassie por densitometría o electroforesis en gel capilar por mediciones de intensidad de tinte fluorescente.
5.8.2 Plegado del producto de expresión
El plegamiento del producto se puede analizar directamente mediante espectroscopía de dicroísmo circular, espectroscopía de r Mn de proteínas y HPSEC. Los procedimientos indirectos incluyen la medición de la solubilidad, la resistencia a la proteasa y los ensayos de actividad para determinar la toxicidad en el caso del fragmento DT A, y los ensayos de unión para los fragmentos DT B y CRM197.
5.8.3 Cuerpos de inclusión del producto de expresión
La formación del cuerpo de inclusión se cuantifica fácilmente mediante la primera homogeneización de las células cosechadas después de la fermentación, centrifugación de baja rotación para la sedimentación de la materia insoluble, y comparando las pellas y el sobrenadante lado a lado de una manera de densidad óptica equivalente. La intensidad de la banda de proteínas permite la estimación de la proporción en el sobrenadante (proteína soluble) y las pellas (agregados insolubles y cuerpos de inclusión).
5.8.4 Solubilidad del producto de expresión
La solución sobrenadante que contiene la proteína se puede centrifugar y filtrar estéril. Si la proteína permanece en solución y no se agota del filtrado y los sobrenadantes, la proteína es soluble. Un procedimiento más sofisticado es la dispersión dinámica de la luz. Permite la determinación del tamaño de partícula, que es indicativo del estado oligomérico o micro agregado de la proteína purificada.
La solubilidad es inversamente proporcional a la formación de agregados de tal manera que un hallazgo de alta solubilidad demuestra que no hay o tiene un bajo nivel de formación de agregados.
5.8.5 Localización periplasmática del producto de expresión
La localización periplasmática se mide mediante el fraccionamiento de las células y comparando los rendimientos proteicos específicos observados en las fracciones de periplasma y esferoplasto. El fraccionamiento se realiza usando el procedimiento de sacarosa-lisozima (Kowarik M, Young NM, Numao S, Schulz BL, Hug I, Callewaert N, Mills DC, Watson DC, Hernandez M, Kelly JF et al: Definition of the bacterial N-glycosylation site consensus sequence. The EMBO journal 2006, 25(9):1957-1966), choque osmótico (Johansson hJ, Jagersten C, Shiloach J: Large scale recovery and purification of periplasmic recombinant protein from E. coli using expanded bed adsorption chromatography followed by new ion exchange media. J Biotechnol 1996, 48(1-2):9-14.), o polimixina (Schulz H, Hennecke H, Thony-Meyer L: Prototype of a heme chaperone essential for cytochrome c maturation. Science 1998, 281(5380): 1197-1200). Las alícuotas de las fracciones se normalizan en función de los volúmenes de muestra y el cultivo OD600 y se analizan mediante SDS PAGE y transferencia Western.
5.8.6 Escisión de secuencia de señal
La escisión de los péptidos señal se analiza mediante i) análisis de desplazamiento de gel de células fraccionadas como se describe en 5.8.5. En este análisis, la preproteína no procesada se puede acumular en agregados citoplasmáticos o membranas, y la proteína procesada estará presente en fracciones periplásmicas, solubles. La movilidad electroforética diferente constituirá un desplazamiento entre preproteínas procesadas y no procesadas por SDS-PAGE (y transferencia Western si es necesario). Finalmente, la secuenciación de aminoácidos N-terminal se puede usar para determinar la terminación N procesado y, por lo tanto, definir el sitio de escisión experimentalmente.
5.8.7 Toxicidad potencial de CRM197
Se puede analizar la presencia de toxina activa en CRM197 midiendo la actividad ADP-ribosil transferasa. Además, se pueden usar otras pruebas (citotoxicidad en células HeLa o células Vero in vitro, letalidad en cobayas in vivo, prueba de toxicidad anormal) para demostrar la no toxicidad de CRM197
5.9 Composiciones
El CRM197, producido de acuerdo con los procedimientos proporcionados en este documento, puede procesarse adicionalmente para obtener composiciones inmunogénicas o vacunas. Por ejemplo, la proteína se puede conjugar con un oligosacárido o un polisacárido para producir una composición o vacuna inmunogénica. En ciertas realizaciones específicas, dicha composición inmunogénica o vacuna tiene propiedades inmunogénicas mejoradas sobre las composiciones de la técnica anterior. Sin estar limitados por la teoría, los procedimientos proporcionados en este documento proporcionan una población más homogénea de proteína CRM197 soluble. Como tal, cualquier composición inmunogénica o vacuna es más efectiva que las composiciones de la técnica anterior.
En ciertas realizaciones, se proporciona en este documento una composición que comprende CRM197, que se ha producido de acuerdo con los procedimientos proporcionados en este documento. En ciertas realizaciones más específicas, dicha composición es una composición farmacéutica. Incluso más específicamente, dicha composición farmacéutica comprende además y un portador farmacéuticamente aceptable.
6. Ejemplos
6.1 Ejemplo 1
Se probaron diferentes configuraciones experimentales y se determinó el rendimiento de CRM197 mediante transferencia Western usando antisuero toxina anti diftérica para la detección de CRM197.
Un proveedor comercial (Genescript, Piscataway, NJ) sintetizó un marco de lectura abierto de ADN para la expresión de CRM197 en una forma optimizada de codón que contiene el péptido señal N-terminal de la proteína DsbA de E. coli en lugar del péptido señal natural, y una etiqueta de hexahistidina C terminal. La secuencia de proteína resultante es la SEQ ID 5. El marco de lectura abierto para ssDsbA-CRM197-his6 se insertó en los sitios NdeI y XbaI de pEC415 (Schulz H, Hennecke H, Thony-Meyer L: Prototype of a heme chaperone essential for cytochrome c maturation. Science 1998, 281(5380):1197-1200).
A partir de este plásmido, se hicieron diversos mutantes para analizar las diferencias de los rendimientos de CRM197. Las mutaciones se introdujeron en el sitio esperado de escisión del péptido señal mediante mutagénesis de cambio rápido según lo descrito por el fabricante (Stratagene, Agilent Technologies, Santa Clara, CA). Las construcciones resultantes se resumen en la Tabla 1.
Los plásmidos mencionados se transformaron en células BL21 y W3110 para realizar experimentos de expresión de proteínas. Las colonias transformadas se recogieron de una placa LB y se usaron para inocular el cultivo líquido medio LB, que se cultivaron durante la noche a 37 °C. Los cultivos de alta densidad se diluyeron a una OD600 de 0,05 en medio LB nuevo y se cultivaron más hasta que la OD alcanzó un valor de OD600 = 0,5. Luego se agregó arabinosa para la inducción de la expresión de proteínas recombinantes. Los experimentos iniciales usando algunas de las construcciones mencionadas se realizaron bajo diversas condiciones.
Sin embargo, no se detectó proteína CRM197 en extractos celulares en comparación con las células de control que no expresan proteínas o que expresan EPA (Ihssen J, Kowarik M, Dilettoso S, Tanner C, Wacker M, Thony-Meyer L: Production of glycoprotein vaccines in E. coli. Microbial cell factories 2010, 9:61). Ni a 30 ni a 37 °C, usando tiempos de inducción durante la noche y medio LB suplementado con ampicilina para el mantenimiento del plásmido.
Posteriormente, la expresión se realizó como sigue. Para la expresión, los cultivos de alta densidad de incubaciones durante la noche se diluyeron en caldo Terrific para una mejor viabilidad celular. Los cultivos se cultivaron hasta la fase exponencial y se indujeron durante 2 horas y durante la noche, y luego las células se cosecharon y los extractos celulares se prepararon disolviendo cantidades equivalentes de OD de biomasa en tampón de muestra Lammli. Los extractos se separaron mediante SDS PAGE y se transfirieron por electrotransferencia a membranas de nitrocelulosa para la inmunodetección posterior usando antisueros anti dT y anti his tag. Sorprendentemente, se detectó una señal de proteína en la movilidad electroforética esperada de CRM197 a aproximadamente 60 kDa después de 2 horas de inducción. Las construcciones de expresión p932, p934 y p722 condujeron a señales detectables en inmunotransferencias antisuero anti DT y anti his tag. p932 parecía producir la mayoría, p934 menos, y p722 aún menos señales CRM197. Un extracto de control de células que contiene un plásmido de expresión que carece de una secuencia de péptido señal mostró CRM197 en el intervalo de peso molecular correcto y confirmó la identidad del material en los otros carriles.
Estos experimentos mostraron que CRM197 se podía expresar, pero no si era soluble o plegado. Como se indica en la Figura 1, se detectó CRM197 sin un péptido señal y se esperaba en cuerpos de inclusión citoplasmáticos. Los rendimientos esperados son desconocidos y solo pueden estimarse en comparación con la expresión de EPA. En esta comparación, CRM197 alcanza rendimientos similares a los de EPA en función de las intensidades de señal observadas usando la transferencia Western antisuero anti his tag como se ilustra en la Figura 1 (compare los carriles 4A y 4B con 5A y 5B). El EPA en fermentaciones controladas de biorreactores conduce a hasta 0,5 g/l de proteína.
El orden de eficiencia para la producción de CRM197 fue p932> p934> p722. El residuo de metionina codificado en el sitio de escisión del CRM197 expresado a partir de p722 puede interferir con la productividad, y también el residuo de glicina tiene cierta influencia. Parece, sin embargo, que la formación de un N terminal de CRM197 con un aminoácido menos (ADDV...; p932) que el N terminal natural en combinación con el residuo de serina en la posición -2 en relación con el sitio de escisión conduce al contexto de expresión óptimo cuando se usa el péptido señal DsbA. Sin embargo, fue posible detectar señales CRM197 en experimentos de expresión usando diferentes construcciones de expresión y medio TB.
6.2 Ejemplo 2
Para analizar la solubilidad y el rendimiento global en matraces de agitación, CRM197 se purificó a partir de cultivos celulares usando dos construcciones de expresión diferentes. La cepa de expresión fue BL21, los plásmidos de expresión p932 o p933. Los matraces de agitación de 5 litros que contenían 11 TB suplementado con ampicilina se inocularon con un cultivo previo al cultivo en LB suplementado con ampicilina y se cultivaron a 30 °C. A una OD600 de 0,5, se agregó arabinosa al 0,2% (p/v) y se permitió la expresión durante 2 (p932) o 4 horas (p933). Las células se cosecharon luego por centrifugación, se resuspendieron en tampón para la extracción del periplasma (sacarosa al 20% p/v, TrisHCl 30 mM pH 8,0, EDTA 1 mM, 1 mg/ml de lisozima, 1 comprimido/80 mL de mezcla inhibidora de proteasa completa (Roche, Basilea, Suiza)) en una proporción de 20 OD por ml, se incubó en hielo durante 30 minutos y se centrifugó durante 15 minutos a 8000 rpm y 4 °C. El sobrenadante se trató adicionalmente con DNasa (Fluka, Balgach, Suiza), se centrifugó a 4 °C, y el sobrenadante se esterilizó por filtración. El filtrado se preparó para la purificación usando cromatografía de afinidad Ni2+. La carga, el lavado y la elución se realizaron a concentraciones específicas de imidazol (10, 20, 500 mM). Las fracciones de elución se analizaron mediante SDS PAGE y tinción azul brillante de Coomassie (Figura 2).
Se detectó una banda principal correspondiente a CRM197 en fracciones de elución de la purificación. La determinación de proteínas dio como resultado valores de aproximadamente 2 mg de proteína de la construcción p932, y aproximadamente 4 mg de la construcción p933 por litro de caldo de fermentación. La secuenciación N terminal y MALDI MSMS de las bandas de proteínas extirpadas de este gel SDS PAGE confirmaron la terminación N de CRM197 en ambos casos (véase la Tabla 1) y que la proteína es realmente CRM197.
La diferencia entre la proteína expresada de p932 y p933 es la secuencia del péptido señal y la terminación N de CRM197 maduro resultante. p933 produjo la terminación N de tipo salvaje correcto; aunque la puntuación Y para la eficiencia de escisión es menor que para p932. En la figura 1, la expresión transmitida por p934 parece ser incluso menos eficiente y, de acuerdo con lo anterior, la puntuación Y es menor. De este modo, una combinación de un alto valor de puntuación Y y una posición de escisión del péptido señal que da como resultado la terminación N nativo GADDV parece ser la configuración óptima para la expresión de CRM197 de alto rendimiento en E. coli. El tiempo de expresión, la temperatura, el medio y la concentración del inductor pueden influir en el rendimiento, la velocidad y la eficacia de la escisión del péptido señal y, de acuerdo con lo anterior, en los rendimientos de CRM197.
6.3 Ejemplo 3
Para analizar la productividad de diferentes construcciones en paralelo, se realizaron experimentos de expresión en matraces de agitación a pequeña escala, los extractos periplásmicos se prepararon y analizaron mediante SDS PAGE para la intensidad de la banda CRM197 mediante tinción de Coomassie (Figura 3) y se cuantificaron (Tabla 2). Las condiciones de expresión detalladas se dan en la leyenda de la Figura 3 y en la Tabla 2.
Los péptidos señal DsbA, MalE y PelB dieron como resultado los mejores rendimientos en combinación con condiciones de expresión optimizadas. Las condiciones de expresión tuvieron una influencia más fuerte en los rendimientos que las configuraciones del sitio de escisión del péptido señal. Sin embargo, la importancia de la secuencia del sitio de escisión del péptido señal se muestra, por ejemplo, por los bajos rendimientos obtenidos con el plásmido de expresión p722 (a 25 °C). Aunque p722 codifica la señal DsbA, el rendimiento es bajo en comparación con otras secuencias (codificadas, por ejemplo, en p932, p933, p934 o p936). Las configuraciones del sitio de escisión del péptido de señal se pueden clasificar de acuerdo con sus eficiencias de rendimiento: ASA-ADD y AMA-GADD parecen mejores que ASA-GADD, y AMG-ADD es el sitio menos eficiente. Las puntuaciones Y no se correlacionan con los niveles de expresión.
Todas las construcciones probadas que contienen la señal de PelB dieron como resultado altos rendimientos a una temperatura de expresión de 30 °C. Las diferencias en la secuencia del sitio de escisión del péptido señal no influyeron drásticamente en los rendimientos. Sin embargo, las diferencias en la secuencia del sitio de escisión del péptido señal fueron pequeñas en este conjunto de construcciones.
Figure imgf000016_0001
ncias
SF.Q ID l : p 332
GTCGAGCTAGCAAAAGCA T TTT AAATAAGGAGGAATAACACAT ATGAAAAAGATTTGG C T G G C G CT G G C TG GT T T ACE T T T T AG C G T T T AG CG CC; ACIC G C C GC AG AT G AC GT TG T TG AG A G C ACC AAA T C CT TC G TT AT G G AAAAC TT CTC CT CT T AT C ACG GC AC C AAA GC GG GC T AT G T G C AC AG C AT TC AG A A A GC T AT C C A AAAAC C G A A AT C T GC C AC G C AC CC T AA CTAC C AT G A CGATTGGAAAGAATTCTACAGCACCGACAACAAATATGATGCGGCCGGTTACTCAGTTGA C A AC GAAAA TC C G C TG TC C- GG G AAAGC CG G C G GT G TG GT TAAAG TC AC G T AT C C GG GC C T GACCAAAGT CCTGGCC CTGAAAG1 GGATAATGCAGAAACCATCAAAAAAGAAC TGGGT CT G A GC CTG AC GGAAC CG CT G AT GG A AC AGG T TG GC ACC G A AGAAT TC AT C AAA C G CT TC G G CGATGGTGCCAGTCGTGTCGTGCTGTCCCTGCCGTTCGCAGAAGGTAGCTCTAGTGTCGA ATATATTAACAATTGG GAACAAGC GññAGCCCTGTCCGTGGAACTGGAAATCAACTTTGA AAC C CG CGGC AAAC GT GG T C A GG AT GC G AT C-T AT G A AT AC AT GG C ACAA GC TTGC GC G GG T AAT CGCGT TC GT C GCAG CGTC GGC TC CTCAC TG T CTTG TATCAACCT G GAC TGGGAT GT T AT C CG T G A TAAAACCAAAACGAAAACCG AAAGC C TGAAAGAACACGG C CC GATCAAAAA C AAAAC G AG C G AAT C T C C G AA TAAAA C: GGC GT CC G AAC! AAAAA!; C T AAAC AG TA TC TG G A ACAA TC C C ACCAAAC C G C A C T G GAACATCC GC AAC TC TC A C AAC TCAAAAC CG TCACG GG TACCAACCCGGTGTTTGCCGGCGCAAATTACGCAGCTTGGGCTGTGAACGTTGCGCAAGT GATTGAC T C GGAAACGGCCGATAATCT GGAAAAAACCAC GGCGG CC CTGAGTA TTC TG CC GG GCATCGGTTCC GTGATG GG T AT T GC CG ATGGCG C AGTTC AT C AC AACAC C GAAGAAAT T G TC GC C í : A GT CT A TC G C A C T G T C G A GCC T G ATG G TT G C T í : A A !; C G A T T CC G C TGGTT G G C CAA CTGG T TG AT ATC GGCTTTGC ACC TT AC AAC T TC C T GC AAA CT AT C AT CAA CC TC T T TC AG GTTG T CC AT A AC TC A T AT AAT CG CC C GG CC T AC TC GC CG G GT C AC A A A ACC C AAC C G TTC CT G :: A TG AC G C-C TA C G C G G TT AG CT G G A AT AC G C-T CG AAG AT TC T AT T ATC C C-T A C C G GC T T T C A GG C-T C- A ATC T GG G C AC G AC AT T AAA ATC AC G GC T G AAAAC AC C G C GC TG C C G ATT GC C G G TG TT C TG CT G C CG AC C A TCC C GG GTAAACT G í JA T G 'i' (.? AAT AAAT CAAAAAC C C AT A TCTC GG TT AAC GG TG GC AA AATTC G T ATG C GC TG CC GTG CG AT C G ACGGCG AT GT GACCTTCTGTCGTCCGAAAAGCCCGGTCTATGTGGGCAACGCTGTTCATGCTAATCTGCA C GTC GC GTT TC ATC GC TC TAGTTC C GAAAAAATC C AC AG TAAC G AAAT C TC ATCGGAC TC C ATT GG TGT GC TG C- C-C TAC C A G AAAAC GG T C-G AT C AT AC C AA AG TT AAT AG C AAAC TG T C ACTG TT C T T CGAAATCAAATCAGGC TCGC ATCAT CAT CAT C AC CACTAATCTAGAGGATC C C GGGG TACCGAGCTCCAAT T C T T GAAGACGAAAGGG GC T G GTGATAC G GC T ATT T T T A T AGGTTAATGTCATGATAATAATGGTTTCTTAGACGTCAGGTGGCACTTTTCGGGGAAATG TGCG CGGAA CC CC T A T T T G T T T A T T T T T C TAAATACATT CAAATATGTATC CGCTCATGA G AC A A T AAC C CTG A T AAAT GC TT C AAT AAT AT TG AA AA AG G AAG AG T AT C-AG T A TT C AA C A T T T CC GTG TC GCCCT TA TTC C C T T T T T T G CGGCA TTTT GC CTT CC T G T TT TT GCTCAC C C AGAAACGC TGGTGAAAG TAAAAGATGCTGAAGATGAGTTGCGTGC AC GAG TGGGTTACA
T ■: ;G AAC T GG AT CTC AAC AG C G GT AAG ATC C TT G AG AG TT T TCGC CC CGAAG AAC GT T T T C C AAT C AT C A CC AC T TT T AA AC TTC TGC T AT CT GG C GC GG T AT T A TC CC C TC T T C AC C C C G G CC A AG A G C AA c T c G-G TC G- G C G C A T AC AC T AT TC T c AGfiAT CA c TT CG T TC A G TAC TC A c C AGT CACAG AAAAGCATC TTAC GGATGGC ATG AC AGT AAGAGñA TT AT G CAGTGC TGC C A TAAC CATGAGT GATAAC ACTGCGGC CAAC T TA CTTCTGACAAC GATCGGAGGACC GAAGG AG C T AAC C G CT TT T TT GC A C AAC: AT GGGGG AT C AT GT AAC TCGC CT TGA TC G T T GGGAA C C GG AGC TG AATG AAGCG AT ACC AA ACG AC G AG CG T G AC ACC AC G AT GC C TG C AGG AAT GG C AAC AAC GTTCCCC AAAC T AT TA AC TC GC G AA C T AC T T ACTCTfi C-C TT C C C C- C C AAC AA T T AAT AG AC T GG ATGGAGG CGGATAAAGTTG CAGG AC C AC TTCTG CG CT C GG CC CTTC C GG C TG G C T GG TTTAT TG CT G A l AAAT C TG G AG C C GG T GA GC GT GG G TC TCG C G C- T A IC AT TG CAGCACTG GGGCCAGATGGTAAGC CCTCCCGTAT CGTAG TT AT C TACACG AC GG G GAG TC AGGC AACT ATGG ATGAACG AAAT AGAC AG ATCGC TGAGAT AjGGT GC CTC ACTGATT AAGC ATTGGT AACTGTCAGA í : CAAGTTTACTC ATATATACTT TAGAT T GATTTAAAACTTCATT TTTAATTTAAAAGGATCTAGGTGAAGATCCTTTTTGATAATCTCATGACCAAAATCCCTT AACGTGAGTTTTCGTTCCACTGAGCGTCAGACCCCGTAGAAAAGATCAAAGGATCTTCTT G Ai ¡ A TC GT TTTTT TC TGCGC C-T A AT GT GC T G C TT G G A AA CAA A A A AAC C AC C G C T A GC A i : C GG 1' GG TT T GT T T GC C GG AT C AAG AGC TAC G AAC TGT T T TT CC G AAGG T AAC T G GC TT G A g c a g a g c g c a g a t a c c a a a t a c t g t c c t t c t a g t g t a g c c g t a g t t a g g c c a c c a c t t c a AGAACTCTGTAGCACCGCCTACATACCTCGCTCTGCTAATCCTGTTACCAGTGGCTGCTG CCAGTGGCGATAAGTCGTGTCTTACCGGGTTGGACTCAAGACGATAGTTACCGGATAAGG C GC A GC GG T C G GG C T G AA G G GG GG G TT C G T GC ACA G A GC CC AG C TT GG A GC G AA G G AC G T ACAC G GAACTGAGAT AG C T ACAGCG TGAGCTATG AGAAAGCGC CACGCT TC C G GAAG G G A GAAAGG CGC AC ACGTATCC G GTAAGCGGC AGG GT CGCAA CACC AGAGCGCACGA CCC ACC TTCCAGGGGGAAfkCGCCTGGTATCTTTATAGTCCTGTCGGGTTTCGCCACCTCTGACTTG A GC G TC G ATTTTTGTG ATG C' 11 CGT C AG C-G G C-G C G G AGC C T ATGG A AA AA C G CC AGC A AC G C C-G C C T TT TT AC G C-TT C C T G GC CT T TT GC TGGCC TTTTG CT C AC AT GTT C T TTCC TGC CT T AT C CC CT GATTCTGTGGATAACC G TATT A C C C C C TTTGAGTGAGC TGATACC GC TCG CC G CAGCC GAAC GAC: CGAGCGCAG C :GAGTCAGTGAGCGAí i 2 AAGCGGAAGA C iCGCCTGATGC G GTATTTTCTCCTTACGCATCTGT G CGGTATTTC; AC AC CGCATGGTGC IACTCTCAGTACA ATC T GC TC T G A TGC C GC AT AC-T T A AGC C AG T AT AC AC T C CG CT A TC GC T AC C- T C- AC TG GG T CAT GG CT GC GC CCC GACAC CC GC CAACACCC GC TGAC G CGCC C TGAC G GG CTTGTCT GC T CC CGG CATCCGCTTACAGACAAGC TGTGA CC GTCTCC G GGAGC TGCATGTGTCAGAGGT TTTCACCGTC ATCACCGAAACGCG CGAGGCAGCTG C G GTAAAGCTCI ATCAGCGTGGTCGT GAAGCGATTCACAGATGTCTGCCTGTTCATCCGCGTCCAGCTCGTTGAGTTTCTCCAGAA GCGTTAATGTCTGGCTTCTGATAAAGCGGGCCATGTTAAGGGCGGTTTTTTCCTGTTTGG TCACTGATGCCTCCGTGTAAGGGGGATTTCTGTTCATGGGGGTAATGATACCGATGAAAC G AG AG AGG A TGC TC AC GAT AC G GG T TAC T G AT G AT G AAC AT GC C C G C-T TAC T GG AAC G TT G TGAGG GTAAAC AAC TGGC GGTATG GATGCGGCGGGACCAGAG í iAAAATC AC T CAG G G TC AAT Ct CC AG C GC; T T C G T . AAT AC; AG ATG T AG GT GT TC C AC; AG GG T AG CX IA C X : A GC AT CC TG C GAT G CAGA TCC GG AAC A T AAT GG T GC: AG G G C G C 'i1 G Aí; T TC: CG C GT TT C G AG AG T T TAC G AAAC AC GG A AA C C G AA G A C C: ATTC ATG TT GTT GC TC AGG TC GC A C-AC G TTTTGC AGC AGC AGT C GC TT C AC GTTC GC TC GCG T AT CG C-T GAT TC ATT C T GC T AAC C A G T AAG G C AAC C C C G CC AGC CTAGCCGGGTCCTCAACG ACAGGAGCACGATCATGCG C AC CCGTGGCCAGGACC
C; AAC GC TG CC CG AGC G T C AAC G GG G CC: AG AT AC AG í : AAA CGGG T GC GG G GG AAA T AC G C G GTTAAACGATCGACTGCCGCTTTGCCGCTGCGCCACAGCCGCCAGCATAGCCAGCCTCCG AC C C AC AG C AG C AAC GC CG T CG CC A GC AG C ACCC AT T T G AAAC C TC CG C TC TG C AT AT C G GAA G GA AT ATCGATTGC CGCTCCCGC G AGAAT GG CC GGCAGGA A AT AAA AG GGCGGC CAC AGCAAACAGCCAATCAAGTTCGGCC CAATAAATTT CG CCAC GGGAAGATCCAGCATCC CT GCC1 A CCATCGGCACCAGCGGCCTC G TCGGACCGAC: AAAACGTCCGACC A CJGAT CGT{ : AAC ATACTGTGCTGATGCAGCGCGTGTTCGGTTTTATCCAGCAGCGACTTGTTCTTTTTCATA AAAGACCAGC GGTGTAGCGGCTTTTTAAAGCGCC AC CC CAG CC AGAAC GAAATCCAGT C G C CCATCAGACAGCCGATAATACCCACCAGC C AGGCAT GC CAAAAAT TG A GCTC GC CGC TG C CGATAAGCGCGCCCAGCC C CGCCATCAGTAC CG TGCC G GGTAAAATCAACCCCACCAGC G CC AGC G ATT CC AGG AAGGC G ACC AGC AAC AC GG CG ATG A GCG l , AT AC A G AGTGG ATT GG G TC A T AAA GTGTTCC A C C AC TC CT T GC AT AGT GT GTCC G TC AG C C-T G A T G A A C C AC C-C AT TCTGCTTACCCCG'I C CC CC TTC GT C A AGC CGT C A ATTflT CC G A A T AGTT AC GG CTT AT G A C AT C TT TG T GG ACACA I C A I Tí!: AC T TT TT A TT C AC AT C C GG CC C TG A AC TC C- C T AG G AC T T GC C CC GG TG C ATTTTTT AAAT AC C CG C G AAAAATAGAG CTG AT C G TC AAAT C C AAC ATT G CGCCCAACGGTCGCTATC G GCATT CGCGTAGTGCT AAG CAGAA GTTT CGCC T GGCTGAT AC G C TGATCTT C G C G CCAGCTCAATACGCTAATGCCTAACTGCTGGCG GAACAGATG T G A T AAC CCGCAGCGCC ACAGGCAGACATG CT GGGCG AC GC T GG CG ATATC A AAA TGGCTGTC C GC C AG AT GG TC GC TG AT AT AC TG G C AGG C AT C G CG C AC AC GG C T ATC C AT CG GC GGG TG CAAC GACT C ATT AATTAC C G CCAT ACG TC TGAGC AACAACTGC T CCATCAGATT GATCGC CAGTAG CT CAG AATAGC GAC CT TC C CC TT GCC CG GC GC T GATGATC TGC CC GAAC AGT TC G CT GAAATGCG G CTGGC GCGCCTCGTCCGGGCGGAAAAA TCCTG TCTG G G C AAAGATTGT CGGCCAGGTCAGCCACTCCTGCCAGTAGGCGCGAGGCCGGARATAAACCCACTGGTGATA CCACTCGCTGGCGTCCGGATGCCGTCCATAGTGATGAATCTCGCCCGGCGGAAACAATAA T AT ATC GC C AGGCC G A C A G AC AA AC TG CT C C-C C ATT ATT ATT AA TG AC G C C CTCTCC G C G G AT C- C-T C AC- GTT AAGAAT AT AT CC C TT C AT GC C C AAC GG AC G AT C G AT AAAAAAAT C C AG AT AT C C AT T C G C T TC AAT T G GC GT C AG C CCGGCG AC C AG A 1' GG G C ATT AAAT G A AT AT C C c g g c a a t a g c g g a t c a t t t t g c g t t t c a g c c a t g a t t t c t c t a c c c c c c g a t g t t c a g a g AAGAAACAAATTGTCCATATCGACCAGGACGACAGAGCTTCCGTCTCCGCAAGACTTTGC G CT T C- ATG AAATC A C GT A Tí.: AAC C: C C G CT T C-T C AA AA GC' 5CTTTGT AAC A AA AC G G TAC A G TT C AG C-C GATAAAATTAAG T AAC AC AAG T CT C T AT AAC T AT G G C T C- G AAT C T C C AC ATT G AAT AT TT GC AC AG C GT C AC AC TT T CC AA A C C AT T AG CATTTTT C-T CC A T AA GATT AG CG G AT C CT GC C T G AC GGT T T T T GC CG C GACT C TC TAC T G T T TC TC C AT Ai: C TG T T T T T CT GG ATGGAGTAAGACGATGGCAATTGCAATTGGCCTCGATTTTGGCAGTGATTCAGTGCGCGC T C T C CC AG TGG ACTGCGC C AC C GG C C AC G A G ATC G C C AC C AGC G T AC-AG TG GTATCC G C G C TG G C AAG AAG G C C G TT AT T C-C G AC CG C C C G AAC AAC C AGTTC C GT C AT C ATC CGC CC C A C TACATGGAü T C AATG GAGGCCGCG CTGAAAGCC GTTC TGGCACAATTAAGC G C C G CG CA ACGCGCAAATGTCGTTGG C ATTGGCGTTGAC AGÍ; ACCGGCTCTACGCCAC-C GCCGATTGA C Gí X G ACG G T AAC G T CC T G G CG CT G CG Tí IC AG AG T T C G C CG AG A Ai I Cí: G AAT G C G A TG TT T GT G C T GT GG AAAGATC AC ACC GC C GT GG AAG AG GC CG A CG AAATC AC T C G TC TG TGC C A TAAGCCAGGCAAG
SEQ ID 2 :
GTCGAGCTAGTAAAAGCATTTTAAATAAGGAGGAATAACAC AT AT GAAAAAGATTTGGCT GGCGCTGGCTGGTTTAGTTTTAGCGTTTAGCGCCATGGCAGGCGCAGATGACGTTGTTGA C A C-C AC CAA AT C C T TC C-T T AT C CAA AACT T CT CC T C T T ATC AC G GC AC C AA A C C CC CC T A TG TG G AC AG C ATT C AG A AA GGT ATC CAA A AAC C (i AAATC TGGCACG C AG GG T AA C TAC C-A TG AC G AT T G C- AAAC- AATT C T AC AG C AC C G AC AAC AAAT AT G AT G C G GC C GG TT A CTC AGT TG AC AAC G A AAAT C CG CT L- T C GG GC A AAG C CG GC G GT GT G GT XAAAGT C AC G TA TC CG G G CCTí; AC CAAAG TCCTC GCCCTtJ AAAGTGGATAAT GCAi: AAACCATCAAAAAAÍ JAACTGGG TCTGfiGCCTGACGGAñCCGCTGATGGAACAGGTTGGCACCGAAGAATTTATCAAACGCTT C G GC GAT G G TG CCAGTCG TGTC GTGCTGTC CC TGC CG TT CGCAGAAGGTAGCTC TAGT G T CGAA TATATTAACAATTGGGAACAAGCGAAAGCC C TG TCCGTGGAACTG GAAATCAACTT T G AAAC C C G C G GC AAACC T G G T C AG G ATG C G ATG T AT E: AA T A C ATG GCACAA G E!. TT E! C G C GGGTAATCGCGTTCGTCGCAGCGTCGGCTCCTCACTGTCTTGTATCAACCTGGACTGGGA TGTTATCCGTGATAAAACCAAAACGAAAATCGAAAGTCTGAAAGAACACGGCCCGATCAA AAAC A AAAT G AGC C- A ATC TC C G AAT A AAAC GG TG T C C C-A A G A AA AAGC T A AA C A C-T AT C T GGAAGAATT CCACCAAACCGCACT GGAACATC CGGAACT GT CAGAACT GAAAACCG TCA C GGGTACCAACCCGGTGTTTGCCGGCGCAAATTACGCAGCTTGGGCTGTGAACGTTGCGCA AGTGATTGACTCGGAAACGGCCGATAATCTGGAAAAAACCACGGCGGCCCTGAGTATTCT GCC G GGC ATC GGTTC CGTGATGGGTAT TGCC GAT GGCGCAGTTCATCACAACACC GAAGA AAT TGTCGCCC AG TC TAT CGCACTG TC GAG ÍC T G A CGGT1L¡CCCAAGCGATTC CGCTG GT T L-G C GAAC T GGTT G AT AT G G L-C TT T L-C AG C TTAC AAC T T CG TG GAAAG T AT C AT C AAC GT QT T T C AG G T T G T CCATAAí : T CATATAATCGC C CG GCCTACC CGCCGGGTCACAAAAC C CA ACC G TT CC TG CATOACG GC T AC GC G GT TAGCT GGAATAC GG TC G AAGAT TC TATTATC CG T AC C GG C T TTCAGGG TG AAT CT GG C C ACG AC ATT AAAAT CñCG G CT G AA A ACACC CC G C T G CC C-AT TG CC GGTGTTC TGC TG CC G AC C AT CC CG G G T AA AC TGG AT GT G AAT AA AT CAA A AACCCATATC TCGGTTAAí : GGT CGCAAAATTCGTA TGCG CTGCCGTGCGATCGAC GGCGA t g t g a c c t t c t g t c g t c c g a a a a g c c c g g t c t a t g t g g g c a a c g g t g t t c a t g c t a a t c t GCACGTCGCGTTTCATCGCTCTAGTTCCGAAAAAATCCACAGTAACGAAATCTCATCGGA CTCCATTGGTGTGCTGGGCTACCAGAAAACGGTGGATCATACCAAAGTTAATAGCAAACT G TC AC T GTTC TTC GAAAT C AAATC AC-G C T C C-C AT C AT C A TC AT C AC C AC T AA TCT AGAGG ATC C CC GG GT AC CG AGC TC G AATT C TT G A AG AC G AAAG G GC CT C GT G AT AC GC CT ATT TT TAT ATCTTAAT CTCATGATAATAATCC TT T CT TACAC C T CAGCTCC CAC TT TTCC GGCAA A TG T GC GC G G AAC C C CTATT TG TT T AT TT T TC T AAA TAC AT TC A A AT AT GT ATCC GC T C A TGAGACAATAACCCTGATAAATGCTTCAATAATATTGAAAAAGGAAGAGTATGAGTAT1C AAC ATT TC CGTGTC GCC CT T AT TC C CT TTTTT GC G GC AT TTTG C C T TC C TG TTTTT C-C TC ACC CAGAAAC GC TGGTGAAAGTAAAAGATGCT GAAGATCAGTTG GG TG CAC GAGTGGGTT ACAT CGAACTGGATCTíI AAC: AGC:GG TAAGATCCTTGAí: AGTTT T C;GCCCCGAAGAACGTT T TC ICAATGAT GAGCACTTTT AAAG TTCTGCTATGTGGCGCGGTATTATC CCGTGTTGACG C C G G CC AAG AG C AAC TC GGT C G CC G C AT AC AC T ATT C T C AG AAT C- AC T T CG T T C AG TAC T C AC C AG TC A C AG AA AA G C AT CT TAC CG AT G GC AT G AC AG T AA G A G AAT T AT GC AGT CC T G C CAI'A ACC A TG AG TG A T AAC AC TG C L-G CC AAC TT AC TT C TG AC A AC G AT CG C AC GA CC L-A AGGA C rC XAACCGCTTTTTTGCACAACATGGGG G ATCIATGTAACTCGCCTTGATCGTTGGG AAC C G CAC CT CAA TC AAGC C AT AC CAAAC GAC GAGC GTGAC AC C AC GATGCCTGC AGCAA T C-C C A AC AAC GTTGC GC AAAC T AT T AA C T G C-C GAAC TAC TT AC T CT AG C TT CC CG GC AAC AATTAATAGACTGGATGGAGGCGGATAAAGTTGCAGGACCACTTCTGCGCTGGGCCCT1C C C-G C TG CC T CG TT T ATT G C T GATA AAT C T G G AGC C CG T G AG CG T C-G C-C C TC CC C CT AT C A T TGCAGCAC TGGGGCCAGAC GGTAAGCCC TCC CGTATCG TAGT TAC CCACAC GAC GGG GA G TCIA CiGCAAC T AT GG A T GAAC ;GAAA T AG AC: AG AT C GC T G AGA . A L-G TG C; CT C AC TG AT T A a g c a t t g g t a a c t g t c a g a c c a a g t t t a c t c a t a t a t a c t t t a g a t t g a t t t a a a a c t t c ATT T TTAATTTAAAAGGAC C: TAGGT CAAGA TC C T TTTT GATAATCT C AT CAC CAAAATC C C TC AAC GT C-AG TTTC C G TTC C ACC G AG CGTC AG AC C C C G TAG AAAAC-AT C AAAG G ATC TT C TT G AG AT CC T T T T T T T C T G CG CG T AATC T L-C TG CTTGC AAAC AAAAAAAC CAL C G CT AC C: AGCGGTGGTTTGTTTGCCG GATCAAGAGCTAC C; AACC TCTTTTTCCGAA C ÍG TAAC TGGCT T C AG C AC AGC GC AG AT ACC AA AT AC TCTCCTTCT.ACTCT AG CC C T AGT TAC G C C ACCACT T C A A G AAC TC TG TAC C ACC G CC TAC AT AC C TC C-C T C T C C T AAT C CT GT T AC C AGTG GC TC CTGCCAGTGGCGATAftGTCGTGlCTTACCGGGTTGGñCTCAAGACGATAGTTACCGGATA AGG C GC AG C GGT C GG G C T GAAC GG G GG GT T CG TG C AC AC AG CC C AG CT T GG A GG GAAC G A CCTA CACCGAACTGAGATACCTAC AGCGTGAG CTA TGAGAAAGCGCüACGC TTCC CGAAG GGAGAAAGGCGGACAGGTATCCGGTAAGCGGCAGGGTCGGAACAGGAGAGCGCACGAGGG AGCTTCCAGGGGGAAACGCCTGGTATCTTTATAGTCCTGTCGGGTTTCGCCACCTCTGAC T TG A C-C CT C G A TTTTT G T G ATG CC C CT C AGGG CG GC GG AGC CT A TG CAA AAA CGC C AG C A ACGCGGCCTTTTTACGGTTCCTGGCCTTTTGCTGGCCTTTTGCTCACATGTTCTTTCCTG C C-T T AT CC CC TG ATTC TGTí ¡ GATA ACC GT ATT AC CGCC T TTG AG I X ¡ A G C TG A T A C C C C TC GCCC-CAGCCGAACC-ACCCACCCCACCCACTCAC-TCACCCACCAAGCC-CA.ACAGCGCCTGA T GC G GT AT TTTC T C C TT ACG C ATC T GT GC GGT AT TTC AC AC CG C ATGG T GC AC TC TC AGT ACAATCTGCTCTG ATGC CGCATAG T TAAGCCAGTAIACACTCCG CTATCGCTAC GTGACT G GG T C ATG GC TGCGC CC CG AC ACC C GC C A AC AC C CGCT G AC GC G C C CT G AC G G G C TTG TC T GC T CC CG G C A T C C G C T TAC AGAC AAG CTGTGAC C GT C T CC GG G AG CT G CATGT GT CAL-A GGTTTTC ACC GTCAL CAC C (] AAACGCGCGAC i G C AG C TGCGGTAAAGCTCATCAGCGTGGT CGTCAACCC-ATTCACAGATCTCTCCCTGTTCATCCGCGTCCAGCTCGTTGAC-TTTCTCCA GAAGCGTTAATGTCTGGCTTCTGATAAAGCGGGCCATGTTAAGGGCGGTTTTTTCCTGTT
T ' -C T C ALT G AT L C CT C L GTC T AAG G GG C-ATTT CT GTT CATGGGG GG A AT G AT AC C G AT G A A AC G AGAGA GG AT GC T C AC GAT A<! 'GGG TT AC T G AT G A : G AACAT GC CC G GT TAC TGGAAC G TT G TG AG GG T AAAC; A AC T G GC ’ GG T AT GG A TG C G G C G G G AC; C AG AG AAAA AT C A C TC AG Q GTCAATGCCAGCGCTTCGTTAATACAGATGTAGGTGTTCCACAGGGTAGCCAGCAGCATC CTGCGATGCAGATCCGGAACATAATGGTGCAGGGCGCTGACTTCCGCGTTTCCAGACTTT AC G AAAC AC GGAAAC C G AAG AC C AT TC: AT G TT GT T GC T C AG GTC GC AG A C G TTTT G C AGC AGC AGT CG CTTC AC GTT C G C TC GC G T ATC G G T G ATT C AT TC TGC T AAC C AG T AA GGG AAC C CC GCCAC CC TACCCGGGTCCTCAACC AC ACGAGCAC Q A TC ATGCC CAOCC CTCC CCAC C ACC C A AC G CTGC CC G AG CG T C A AC G C-C GG C AG AT AC AG C A AAC G GC TG C CG C- G G AA AT AG G CG G TT A A AC G ATC G AC TGC CG CTT TG CC GC T GC GC C AC AGCC G CC AG C AT AGCC AGC C T C C GAC CC AC AGCAGCAACGC CGTCGC CAGCAG CAGCCAT TT GAAATCTCCGCTCTGC ATA T CGGAAGGAATATCGATTGCCGCTC CC GC CAGAATGCCCGGCAGGAAATAAAACGGCGGC CACA C rC AAACAGC] CAATCAAGTTC G GC C XIAATAAATTTC ] GCCAGGGGAA Ct ATCCAGCATC c c t g c c a c c a t c g g c a c c a g c g g c c t c g t c g g a c c g a c a a a a c g t c c g a c c a g g a t c g t g AAC A TAC T G T G C T C-AT GC AG C G CG T C-T TC G C-T TT T AT C C AG C AG C GAC T TG T T C TTTT TC ATAAAAGACCAGCGGTGTAGCGGCT TT TT AAAGCGCCAC CC CAG C CAGAACGAAATC CAG T CG C CC AT C AG AC AG C C GAL AA'i' AC CC AC C AG CC A GG L A TG CC A AAAAT TG A GC T C GC C G CTGCCGATAAGCGCGCCCAGCCCCGCCATCAGTACCGTGCCGGGTAAAATCAACCCCACC ACC GCCAC CG ATTCCA Q GAACC CC AC C AC CAAC ACGGCCATCAC CC AATACA CA C T C CAT
t g c c -t c a t a a a c t g c t c c a c c a c c c c t t c c a t a c t c t c t c c c c c a c c c t c -a t c a a c c a g c G ATT C T GC T T AC CC C GTCC C CC TT C GT CAAGC C G TCAAT TATC C GAAT A GT TACGGC T TA T C-AC AT C T TT G T G C-AC AC AT C ATT C AC TT TTT AT T C AC ATC CG G C G C T C-AAC T C GC TAGG ACTT GC CC CG GTG C ATTTTT T AAAT AC CC GC GAAAAAT AG AGC T C- ATC G TC A AA TC C AAC a t t g c g c c c a a c g g t c g c t a t c g g c a t t c g c g t a g t g c t a a g c a g a a g t t t c g c c t g g c t g a t a c g c t g a t c t t c g c g c c a g c t c a a t a c g c t a a t g c c t a a c t g c t g g c g g a a c a g a t g T G AT AAC C C- G G AG GG CG AC AC-G C AG AC AT GC T GG GC G AC GC TGG CG AT A TC AAAAT C-G C T G TC C GC C AG AT GGTC GC TG AT AT AC TG C-C AGG C ATC GC G C AC AC GG CT ATC C AT C G C-C G G G TGCAALGAL TL AT T AATT ACCGCCATAC GTC TG AGCAA CAAC TGC TCCAGCAGATTGAT C GC C AG T AG L T L AG AA T A GC G ACC T TC CC C TT GC C L G GC GC TG A TG AT C TG C L C G AAC; AG T TC GCT GAAATG CGG CTGG C GC GC C TC GTCCG GG CGCAAAAATC CT GT C TC GGCAAACAT TGTCGGCCAGGTCAGCCACTCCTGCCAGTAGGCGCGAGGCCGGAAATAAACCCACTGGTG A T A C C ACT C G CT G G C GTCCG G A TG C C GTC C AT AG TG ATG A ATC T CG C C C C-G CGG AA AC AA TAATATATC GC L AGGC L GACAGACAAACTGCTCG CC ATTATTAT TAATGAC GC CCTCTCC GCGGATGGTL AiJ GTTAAGAATATATCCCTT L ATGCCCAACGGACGATCGATAAAAAAATC C AG A TATC CATTCGC TTCAATTGG C GT CAGCC CG GC GAC CAGAT GG GC A TTAAATGAATA TCCCGGCAATAGCGGATCATTTTGCGTTTCAGCCATGATTTCTCTACCCCCCGATGTTCA GAGAAGAAACAAATTGTCCATAlC GAC CAGGAC G AC AGAGC TTC CG TC T C C GCAAGAC TT T GC G CT TG A T G AAA GCACGT AT C A AC CCCGCTTGTG AAAAGCGCTTTG T AAC AA AAC-C C-T AC AG TT C AG GGG A T AA A A T T A AGT AAC AC ¡ AAG TG T L T AT A ACT ATG GC TGG AAT G T CC AC ATT GAATATTTG C AC AG CG T C A C AC TT TC C A AAC C AT T A GC AT T TT TC T C C A T AACAT T A GCGGATCCTGCCTGACGGTTTTTGCCGCGACTCTCTACTGTTTCTCCATACCTGTTTTlC
TGGATGGAGTAAGACGATG GC AATTG CAATT GG CC TC GATTTTGGCAGIGATTCAGTGCG
CGCTCTGGCAGTGGACTGCGC CAC CGGC GAC G AGATCGCC AC CAG C' G TAGAG TGGTATCC
G C GC T G :; C AA C: A A : 3 GC CG T T ATT G CG AC GGC CC G AA C AAC C AG T T CC GT C AT C AT C C GC G
CGACTACATGGAGTCAATGGAGGCCGCGCTGAAAGCCGTTCTGGCACAATTAAGCGCCGC
GC AACGC GC AAATG TC GTT GG CAT TG GC GTT GACAGC ACC GGCTC TACGC CAGC G C C GAT
TG AC GCC G ACGGT AAC GT C CT G GC GC TG CGT CC AG AG TTC G C C G AG AAC C CG AAT GC GAT
GTTTGTGCTGTGGAAAGATCACACCGCCGTGGAAGAGGCCGACGAAATCACTCGTCTGTG
CCATAAGCCñGGCAAG
SEQ ID 3: Péptido de señal que contiene la secuencia de aminoácidos de Crm197 expresada a partir de p932
MKKI W LALAGLVLAFSASAAD D W DS S K S FVMEN F S S YH GTK PG YVD SI QKGIQK PKSGT
QGN Y D DDWK Z ZY £ T DNK Y DAAGY £ VDNEN T L £ GK AGG W K VT YP C-L TKVL ALKVDN AE T I
KKE L G LS LT E P EXE QV GTEEFIKRE 'G DG A SR W LSL P FAEGS £ S VE YI N N W Y QA RAES VE
l e í :; f e tr g krgqd am y e y i-iaq ac ag n r y r r s v g s s l s c in l dw dV i rd r t k t k i e s l k e n G P IK N KMS ESP N K T VS E E.KAKQ Y L EE F H QT ALE H PF. T ,5 ELKT V TG 1' M P V FAGAN Y AAW A
VN V AQVIDSETADN LEKTTAALSILFGIGSVMGIADG AVH FINTEEIVñQ SIA LS S LM VAQ
A I PL VG E L V D IC- FA AYN FVE £ 11N L FQ W HN ? YN R PAYS PGHKTQ P F IH DG Y AY £ WN TVE
CE 11RT G FQ GE S G11D _ K 1TAEN T PL P I AG V EL PT i PG KL DVN K5 KT H15 VN G RK1RMRC R
ñTDGDVTFCRPKSPYYVGNGVHANLHVM’HRSSSEKTHSNETSSDSTGVLGYQFTVDHTK
VNSKLSLFFEIKSGSHHHHHH
SEQ ID 4: Péptido de señal que contiene la secuencia de aminoácidos de Crm197 expresada a partir de p933
MKKIW L AL AG L VL AF S AMAGAD D W DSSKS FVME NF £ £ YE C-T K DG Y VD S IQ K G IQKPK3 G
TQ G N Y D D DW KEFYSTD NK Y DAAG Y 3 V DN Z NP L£ G K AC ¡ C 3VVKVT YPGL TK V LALK V DN AE T
1KKEL GE 3 L 'TE P LME 0 VG TEEFIKR F G E GASRVV L S L P í ' AE G 333 VE Y1X N W EQ AKA L S V
E LEINFETRGKRG QDAMYYYMACAC ACNRVRREVG5SL5CINLDWDVIR D KT KT K IE S L K
EHGPIKHKM 3 E £ PN KT VS EE K AKQ YLE E F HQT ALE H PELS EL KT VTG TM P V Z AG ANYAAV?
AVH VAQ V ID SETADNL EKT TAAL3 I L PGIG£VMGIADGAVHHNT E Z IV AQ31AL £ 3LM VA
QAIPLVGE LVDIGFAAYNFVE S11NL FQVVHN$YNRPAYS PGHKTQPFLHDGYAVSWNTV
E D S11 RT G F QGE5GHDIKITAE N T P L P1A G V L L PT 1 PG K L D V N K 3 KT i 115 VN GRK1 RMRC
RAT DGDVT F CR?KS PVYVG M GV HANL HVA FHRS 53 EKIH SNEIS S DSIGVT ,G YQKTVDH T
KVNSKLSLFFEIKSGSHHHHHH
SEQ ID 5: secuencia de proteína traducida de p722
M K K ! W L A L A G L V L A FGAMGA LJ D W DA 3 K 3 F VME N F 35 Y H G T K PG Y V D 51 QKG IQ K P K 5 G T
Q GNY D DDWK E FY S T DN K Y D AA G Y 3 V D N EN PLS GK.A GG W K VT YPGLTKV LALKV DN AF T 7
KKE L G L £ LT E PLMEQVGTEE F I KR FG DGASRW L S L F FAEGS S SVE Y I XNWEQA KALSVE
L E I X F E TRG KRGQDAMYE YMAQACAGNRVRRSVGSSLSCINLDWDVIRDKT K T K IE S L KE
HG P 1 K N KMS Y 3 P N K TV 3 E Y KAKQ Y L EE F HQ TALE H PE LS E LKT V TGTN P V FA{IAN Y AAW A
VX VA Q V T DS E T A DN LE KT T AA LS I L P G I G S VMG I ADG A VH H XTE E T V AQ S I A LS 3 L M V AQ
AI PL VGELVDIG FAAYNFVE S I IN L F Q W H N S YNRPAYS PGHKTQ PFLH DG YAVS WNT VE
DS11RTG t 'QGE 3 GH D I K i TAENTP L P . AGVLL PTIPGKLDVXKS KTH_ S VN GRK1 RMRCR
A I DC- D VT Z C R PK £ P VY VGN G V HAN L ñ VAF HRS S S E K I H S N E I S S D S I C-VL 3 Y QK T VD ñ T K
VNSKLSLFFEIKSGSHHHHHH
SEQ ID 6: CRM197 madura y secretada

Claims (16)

REIVINDICACIONES
1. Un procedimiento de producción de CRM197 en el que el procedimiento comprende cultivar una célula huésped que comprende un ácido nucleico que codifica CRM197 en el que CRM197 se fusiona con un péptido señal heterólogo que dirige a CRM197 al periplasma de la célula huésped, en el que el ácido nucleico codifica un sitio de escisión entre el péptido señal que dirige a CRM197 al periplasma y la proteína de CRM197 en el que el sitio de escisión comprende la secuencia de aminoácidos aa1-aa2- aa3-(sitio de escisión)-aa4-aa5-aa6-aa7-aa8, en la que aa1 es Ala, Ser, Gly, Cys, Thr o Gln;
aa2 se selecciona de cualquier aminoácido natural;
aa3 se selecciona de cualquier aminoácido natural excepto Phe, His, Tyr, Trp, Asp, Glu, Lys, Arg, Asn y Gln; aa4 a 8 se selecciona entre ala-asp-asp-val y met-gly-ala-asp;
o en la que el sitio de escisión comprende la secuencia de aminoácidos aa1-aa2-aa3-(sitio de escisión)-aa4-aa5-aa6-aa7-aa8, en la que
aa4 a 8 se selecciona entre ala-asp-asp-val y met-gly-ala-asp; y en la que los primeros 70 aa del primer marco de lectura abierto dan como resultado una puntuación Y cuando es analizado por SignalP 4,0 Server de más de 0,72.
2. El procedimiento de la reivindicación 1, en el que el péptido señal de tipo salvaje de CRM197 ha sido eliminado.
3. El procedimiento de la reivindicación 1, en el que el péptido señal de tipo salvaje de CRM197 ha sido reemplazado por el péptido señal heterólogo.
4. El procedimiento de la reivindicación 1, en el que el péptido señal heterólogo se selecciona del grupo que consiste en el péptido señal de enterotoxina termolábil de E. cotí, porina de membrana externa de E. cotí (OmpA), proteína de unión a maltosa de E. cotí (MalE), pectato liasa de E. carotovorans (PelB) y endoxilanasa de Bacíllus sp. (XynA).
5. El procedimiento de la reivindicación 1, en el que CRM197 se produce a una concentración de al menos 5, 10, 25, 50, 75, 100, 125, 125, 150, 175, 200, 225, 250, 300, 400, 500, 600, 700, 800, 900, o al menos 1000 mg de proteína por litro de medio de cultivo.
6. El procedimiento de la reivindicación 1 o 5, en el que al menos el 50% de la proteína producida se pliega adecuadamente como se determina por dicroísmo circular.
7. El procedimiento de la reivindicación 1 o 5, en el que al menos el 50% de la proteína producida no está presente en los agregados.
8. El procedimiento de la reivindicación 1 o 5, en el que al menos el 50% de la proteína producida es soluble.
9. El procedimiento de la reivindicación 1 o 5, en el que la secuencia de nucleótidos heteróloga codifica un sitio de escisión entre el péptido señal que dirige CRM197 al periplasma y la proteína CRM197 en el que el sitio de escisión comprende la secuencia de aminoácidos aa1-aa2-aa3-(sitio de escisión)-aa4-aa5-aa6-aa7-aa8, en la que aa1 es Ala;
aa2 se selecciona de cualquier aminoácido natural;
aa3 es Ala;
aa4 a 8 se selecciona entre ala-asp-asp-val y met-gly-ala-asp.
10. El procedimiento de la reivindicación 1 o 5, en el que la secuencia de nucleótidos heteróloga codifica la proteína de SEQ ID NO: 1 o 2.
11. El procedimiento de la reivindicación 1 o 5, en el que la secuencia de nucleótidos heteróloga se une operativamente a un promotor seleccionado del grupo que consiste en el promotor araBAD inducible por 1-arabinosa (PBAD), el promotor lac, el promotor rhaP BAD inducible por 1-ramnosa, el promotor de la ARN polimerasa T7, el promotor trc y tac, el promotor del fago lambda p L y el promotor/operador tetA inducible por anhidrotetraciclina.
12. El procedimiento de la reivindicación 1 o 5, en el que el ácido nucleico que codifica CRM197 se inserta en un plásmido de expresión de copia alta, opcionalmente el plásmido de expresión de copia alta es pEC415, pBR322, pBAD, serie pET, serie pUC, pACT3, pEXT22, pEXT20, serie pBLUESCRIPT, serie pGEM.
13. El procedimiento de la reivindicación 1 o 5, en el que la expresión de CRM197 se induce a una densidad de cultivo de OD600> 0,3.
14. El procedimiento de la reivindicación 1 o 5, en el que CRM197 se expresa a una temperatura de 20, 25, 30, 32, 35 °C o 37 °C.
15. El procedimiento de la reivindicación 1 o 5, en el que al menos el 50% del CRM197 expresado tiene una terminación N de ADDV o MGADDV.
16. El procedimiento de la reivindicación 1 o 5, en el que al menos el 50% del CRM197 expresado tiene un enlace disulfuro entre Cys186 y Cys201.
ES13815768T 2012-12-27 2013-12-24 Procedimientos y composiciones relacionados con CRM197 Active ES2750525T3 (es)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US201261746366P 2012-12-27 2012-12-27
PCT/EP2013/077968 WO2014102265A1 (en) 2012-12-27 2013-12-24 Methods and compositions relating to crm197

Publications (1)

Publication Number Publication Date
ES2750525T3 true ES2750525T3 (es) 2020-03-26

Family

ID=49917090

Family Applications (1)

Application Number Title Priority Date Filing Date
ES13815768T Active ES2750525T3 (es) 2012-12-27 2013-12-24 Procedimientos y composiciones relacionados con CRM197

Country Status (7)

Country Link
US (1) US10287330B2 (es)
EP (1) EP2938363B1 (es)
JP (1) JP2016501550A (es)
CN (1) CN105263527A (es)
CA (1) CA2896157A1 (es)
ES (1) ES2750525T3 (es)
WO (1) WO2014102265A1 (es)

Families Citing this family (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6553517B2 (ja) 2013-01-17 2019-07-31 アルサニス・バイオサイエンスズ・ゲゼルシャフト・ミト・ベシュレンクテル・ハフツング Mdr大腸菌特異的抗体
NZ723328A (en) 2014-02-24 2018-01-26 Glycovaxyn Ag Compositions comprising e. coli o25b antigen, uses thereof and methods of manufacture
EA035117B1 (ru) * 2014-11-20 2020-04-29 Байолоджикал И Лимитед Кодон-оптимизированный полинуклеотид для экспрессии crmна высоком уровне
TWI715617B (zh) 2015-08-24 2021-01-11 比利時商葛蘭素史密斯克藍生物品公司 對抗腸道外病原性大腸桿菌之免疫保護之方法及組合物
AR109621A1 (es) 2016-10-24 2018-12-26 Janssen Pharmaceuticals Inc Formulaciones de vacunas contra glucoconjugados de expec
US11951165B2 (en) 2016-12-30 2024-04-09 Vaxcyte, Inc. Conjugated vaccine carrier proteins
AU2017388891A1 (en) 2016-12-30 2019-07-04 Vaxcyte, Inc. Polypeptide-antigen conjugates with non-natural amino acids
KR101908590B1 (ko) * 2017-02-01 2018-10-16 (주)포바이오코리아 Crm197의 용해성 단백질 발현 및 정제 방법
EP3444269A1 (en) 2017-08-17 2019-02-20 National Research Council of Canada Systems and methods for the production of diphtheria toxin polypeptides
CN112513066A (zh) * 2018-01-19 2021-03-16 台湾浩鼎生技股份有限公司 Crm197蛋白质表达
KR102078714B1 (ko) * 2018-02-02 2020-02-19 (주)포바이오코리아 봉입체로 발현된 불용성 crm197 단백질로부터 활성 crm197 효율적인 회수 및 정제 방법
KR102574882B1 (ko) 2019-03-18 2023-09-04 얀센 파마슈티칼즈, 인코포레이티드 대장균 o-항원 다당류의 바이오컨쥬게이트의 생성 방법, 이의 조성물 및 이의 사용 방법
SG11202110301TA (en) 2019-03-18 2021-10-28 Janssen Pharmaceuticals Inc Bioconjugates of e. coli o-antigen polysaccharides, methods of production thereof, and methods of use thereof
KR102099342B1 (ko) 2019-09-03 2020-04-10 주식회사 제노포커스 Crm197 단백질 발현 방법
KR20230102682A (ko) * 2021-12-30 2023-07-07 (주)셀트리온 목적 단백질의 발현 방법
EP4324843A1 (en) * 2022-08-18 2024-02-21 SenseUp GmbH Production of crm197

Family Cites Families (28)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4356170A (en) 1981-05-27 1982-10-26 Canadian Patents & Development Ltd. Immunogenic polysaccharide-protein conjugates
US4673574A (en) 1981-08-31 1987-06-16 Anderson Porter W Immunogenic conjugates
US4695624A (en) 1984-05-10 1987-09-22 Merck & Co., Inc. Covalently-modified polyanionic bacterial polysaccharides, stable covalent conjugates of such polysaccharides and immunogenic proteins with bigeneric spacers, and methods of preparing such polysaccharides and conjugates and of confirming covalency
US4680262A (en) 1984-10-05 1987-07-14 Genentech, Inc. Periplasmic protein recovery
IT1187753B (it) 1985-07-05 1987-12-23 Sclavo Spa Coniugati glicoproteici ad attivita' immunogenica trivalente
US4709107A (en) 1985-10-11 1987-11-24 General Electric Company Process for producing nitrones
WO1990010015A1 (en) 1989-02-23 1990-09-07 Seragen, Inc. Chimeric toxin
AU685047B2 (en) 1992-02-11 1998-01-15 Henry M. Jackson Foundation For The Advancement Of Military Medicine Dual carrier immunogenic construct
DE69327534T2 (de) 1992-06-18 2000-06-08 The President And Fellows Of Harvard College, Cambridge Impfstoffe gegen diphtherietoxin
AU685412B2 (en) 1992-10-30 1998-01-22 General Hospital Corporation, The Nuclear hormone receptor-interacting polypeptides and related molecules and methods
DE122009000058I1 (de) 1993-09-22 2009-12-31 Jackson H M Found Military Med Verfahren zur aktivierung von löslichem kohlenhydraten durch verwendung von neuen cyanylierungsreagenzien, zur herstellung von immunogenischen konstrukten
US5917017A (en) 1994-06-08 1999-06-29 President And Fellows Of Harvard College Diphtheria toxin vaccines bearing a mutated R domain
US6455673B1 (en) 1994-06-08 2002-09-24 President And Fellows Of Harvard College Multi-mutant diphtheria toxin vaccines
AU712981B2 (en) 1995-03-22 1999-11-18 Henry M. Jackson Foundation For The Advancement Of Military Medicine Producing immunogenic constructs using soluble carbohydrates activated via organic cyanylating reagents
US7517527B2 (en) 1995-10-30 2009-04-14 The United States Of America As Represented By The Department Of Health And Human Services Immunotoxin with in vivo T cell suppressant activity and methods of use
AU714493B2 (en) 1996-07-02 2000-01-06 Connaught Laboratories Limited Multivalent DTP-polio vaccines
US6299881B1 (en) 1997-03-24 2001-10-09 Henry M. Jackson Foundation For The Advancement Of Military Medicine Uronium salts for activating hydroxyls, carboxyls, and polysaccharides, and conjugate vaccines, immunogens, and other useful immunological reagents produced using uronium salts
AU781175B2 (en) 1999-04-09 2005-05-12 Intercell Usa, Inc. Recombinant toxin A/toxin B vaccine against Clostridium Difficile
GB0319601D0 (en) 2003-08-20 2003-09-24 Sandoz Ag Production process
EP1721283B1 (en) 2004-02-06 2022-11-30 Council of Scientific and Industrial Research Computational method for identifying adhesin and adhesin-like proteins of therapeutic potential
US9580719B2 (en) 2007-04-27 2017-02-28 Pfenex, Inc. Method for rapidly screening microbial hosts to identify certain strains with improved yield and/or quality in the expression of heterologous proteins
US20120020996A1 (en) 2008-08-06 2012-01-26 Jonathan Lewis Telfer Vaccines against clostridium difficile and methods of use
IT1398927B1 (it) * 2009-06-25 2013-03-28 Consorzio Interuniversitario Per Lo Sviluppo Dei Sistemi A Grande Interfase Csgi Espressione batterica di un gene artificiale per la produzione di crm197 e derivati.
GB0917647D0 (en) 2009-10-08 2009-11-25 Glaxosmithkline Biolog Sa Expression system
WO2011060431A2 (en) 2009-11-16 2011-05-19 University Of Maryland Baltimore Multivalent live vector vaccine against clostridium difficile-associated disease
AU2010201410B2 (en) 2010-03-30 2015-04-30 Pelican Technology Holdings, Inc. High level expression of recombinant CRM197
ES2684087T3 (es) * 2010-09-03 2018-10-01 The Governors Of The University Of Alberta Péptido que contiene múltiples sequones de glicosilación ligada a N
GB201106225D0 (en) 2011-04-13 2011-05-25 Glaxosmithkline Biolog Sa Fermentation process

Also Published As

Publication number Publication date
US20150376245A1 (en) 2015-12-31
EP2938363A1 (en) 2015-11-04
CN105263527A (zh) 2016-01-20
WO2014102265A1 (en) 2014-07-03
CA2896157A1 (en) 2014-07-03
EP2938363B1 (en) 2019-08-21
JP2016501550A (ja) 2016-01-21
US10287330B2 (en) 2019-05-14

Similar Documents

Publication Publication Date Title
ES2750525T3 (es) Procedimientos y composiciones relacionados con CRM197
CN109563140A (zh) α-溶血素变体及其用途
Chen et al. Novel architectural features of Bordetella pertussis fimbrial subunit promoters and their activation by the global virulence regulator BvgA
US10745450B2 (en) Peptides and uses thereof
CA3000561A1 (en) Alpha-hemolysin variants
JP2012531198A (ja) Crm197及びその誘導体の産生のための人工遺伝子の細菌発現
EA035117B1 (ru) Кодон-оптимизированный полинуклеотид для экспрессии crmна высоком уровне
CN115427071A (zh) 包含ltb和病原性抗原的组合物及其用途
Knoot et al. A minimal sequon sufficient for O-linked glycosylation by the versatile oligosaccharyltransferase PglS
KR101373297B1 (ko) 대장균 포스포글리세르산 인산화효소 유전자를 융합 파트너로서 포함하는 발현벡터
Humphries et al. Expression of the class 1 outer-membrane protein of Neisseria meningitidis in Escherichia coli and purification using a self-cleavable affinity tag
US20140154742A1 (en) Novel expression and secretion vector systems for heterologous protein production in escherichia coli
Wang et al. Preparation of a peptide vaccine against GnRH by a bioprocess system based on asparaginase
US20160009779A1 (en) Novel fusion tags and expression vector system for the expression of human parathyroid hormone (rhpth)
US20070031937A1 (en) Co-expression of recombinant proteins
RU2728652C1 (ru) Рекомбинантная плазмидная ДНК pET19b-SAV, обеспечивающая синтез полноразмерного белка стрептавидина Streptomyces avidinii, штамм бактерий Escherichia coli - продуцент растворимого полноразмерного белка стрептавидина Streptomyces avidinii
Epp et al. Raising antibodies against OprD, an outer membrane protein of Pseudomonas aeruginosa using translational fusions to MalE
EP3512956A1 (en) Method for producing di-chain clostridial neurotoxins
EP4079845A1 (en) Method for enhancing water solubility of target protein by whep domain fusion
CN112689674B (zh) 葡聚糖亲和性标签及其应用
Atapour et al. Cloning, expression and purification of a novel fusion protein composed of flagellin and NS5B of hepatitis C virus in Escherichia coli host
KR101905460B1 (ko) 네이세리아 고노르호에아 유래 탄산무수화효소를 이용한 탄산무수화 활성이 증가된 형질전환체
Novikov et al. The highly efficient expression of the aspartase gene (L-aspartate ammonia-lyase) in Escherichia coli cells
Al-Sheikh et al. Modification of an expression vector for efficient recombinant production and purification of mitogillin of Aspergillus fumigatus expressed in Escherichia coli
KR20160088259A (ko) 활성형 아르기닌 탈이민효소의 제조방법