ES2868887T3 - Evaluación de la actividad de la ruta de señalización celular de JAK-STAT1/2 usando modelos matemáticos de la expresión de genes diana - Google Patents

Evaluación de la actividad de la ruta de señalización celular de JAK-STAT1/2 usando modelos matemáticos de la expresión de genes diana Download PDF

Info

Publication number
ES2868887T3
ES2868887T3 ES18773226T ES18773226T ES2868887T3 ES 2868887 T3 ES2868887 T3 ES 2868887T3 ES 18773226 T ES18773226 T ES 18773226T ES 18773226 T ES18773226 T ES 18773226T ES 2868887 T3 ES2868887 T3 ES 2868887T3
Authority
ES
Spain
Prior art keywords
stat1
jak
activity
signaling pathway
subject
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
ES18773226T
Other languages
English (en)
Inventor
Wilhelmus Verhaegh
meng Dou
De Stolpe Anja Van
Rick Velter
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Koninklijke Philips NV
Original Assignee
Koninklijke Philips NV
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Koninklijke Philips NV filed Critical Koninklijke Philips NV
Application granted granted Critical
Publication of ES2868887T3 publication Critical patent/ES2868887T3/es
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6844Nucleic acid amplification reactions
    • C12Q1/6851Quantitative amplification
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6844Nucleic acid amplification reactions
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6809Methods for determination or identification of nucleic acids involving differential detection
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6883Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
    • C12Q1/6886Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material for cancer
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N7/00Computing arrangements based on specific mathematical models
    • G06N7/01Probabilistic graphical models, e.g. probabilistic networks
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B25/00ICT specially adapted for hybridisation; ICT specially adapted for gene or protein expression
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B5/00ICT specially adapted for modelling or simulations in systems biology, e.g. gene-regulatory networks, protein interaction networks or metabolic networks
    • G16B5/20Probabilistic models
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B50/00ICT programming tools or database systems specially adapted for bioinformatics
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/158Expression markers
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B25/00ICT specially adapted for hybridisation; ICT specially adapted for gene or protein expression
    • G16B25/10Gene or protein expression profiling; Expression-ratio estimation or normalisation

Landscapes

  • Chemical & Material Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Organic Chemistry (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Health & Medical Sciences (AREA)
  • Biotechnology (AREA)
  • Biophysics (AREA)
  • Genetics & Genomics (AREA)
  • Molecular Biology (AREA)
  • Analytical Chemistry (AREA)
  • Immunology (AREA)
  • General Engineering & Computer Science (AREA)
  • Biochemistry (AREA)
  • Microbiology (AREA)
  • Theoretical Computer Science (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Medical Informatics (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Evolutionary Biology (AREA)
  • Pathology (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Probability & Statistics with Applications (AREA)
  • Oncology (AREA)
  • General Physics & Mathematics (AREA)
  • Physiology (AREA)
  • Hospice & Palliative Care (AREA)
  • Mathematical Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Bioethics (AREA)
  • Algebra (AREA)
  • Mathematical Physics (AREA)
  • Mathematical Optimization (AREA)
  • Pure & Applied Mathematics (AREA)
  • Data Mining & Analysis (AREA)

Abstract

Un método implementado por ordenador para inferir la actividad de una ruta de señalización celular de JAK- STAT1/2 en un sujeto, realizado por un dispositivo de procesamiento digital, en donde la inferencia comprende: recibir niveles de expresión de tres o más genes diana de la ruta de señalización celular de JAK-STAT1/2 medidos en una muestra del sujeto, determinar un nivel de actividad de un elemento de factor de transcripción (TF) JAK-STAT1/2 en la muestra del sujeto, controlando el elemento TF JAK-STAT1/2 la transcripción de los tres o más genes diana JAK-STAT1/2, basándose la determinación en la evaluación de un modelo de ruta matemático calibrado que relaciona los niveles de expresión de los tres o más genes diana de JAK-STAT1/2 con el nivel de actividad del elemento TF JAK-STAT1/2 y inferir la actividad de la ruta de señalización celular JAK-STAT1/2 en el sujeto basándose en el nivel de actividad determinado del elemento TF JAK-STAT1/2 en la muestra del sujeto, en donde los tres o más genes diana de JAK-STAT1/2 se seleccionan del grupo que consiste en: BID, GNAZ, IRF1, IRF7, IRF8, IRF9, LGALS1, NCF4, NFAM1, OAS1, PDCD1, RAB36, RBX1, RFPL3, SAMM50, SMARCB1, SSTR3, ST13, STAT1, TRMT1, UFD1L, USP18 y ZNRF3, preferentemente, del grupo que consiste en: IRF1, IRF7, IRF8, IRF9, OAS1, PDCD1, ST13, STAT1 y USP18, en el que se infiere que la actividad de la ruta de señalización celular JAK-STAT1/2 es actividad de IFN tipo I o bien actividad de IFN tipo II mediante el uso de dos modelos de ruta matemática calibrados, uno de los cuales se calibra en la actividad de IFN de tipo I y el otro en actividad de IFN tipo II.

Description

DESCRIPCIÓN
Evaluación de la actividad de la ruta de señalización celular de JAK-STAT1/2 usando modelos matemáticos de la expresión de genes diana
Campo de la invención
La presente invención se refiere en general al campo de la bioinformática, procesamiento genómico, procesamiento proteómico y técnicas relacionadas. Más particularmente, la presente invención se refiere a un método implementado por ordenador para inferir la actividad de una ruta de señalización celular de JAK-STAT1/2 en un sujeto realizado por un dispositivo de procesamiento digital, en donde la inferencia se basa en los niveles de expresión de tres o más genes diana de la ruta de señalización celular de JAK-STAT1/2 medidos en una muestra del sujeto. La presente invención se refiere además a un aparato para inferir la actividad de una ruta de señalización celular de JAK-STAT1/2 en un sujeto que comprende un procesador digital configurado para realizar el método, a un medio de almacenamiento no transitorio para inferir la actividad de una ruta de señalización celular de JAK-STAT1/2 en un sujeto que almacena instrucciones que son ejecutables por un dispositivo de procesamiento digital para realizar el método, y a un programa informático para inferir la actividad de una ruta de señalización celular de JAK-STAT1/2 en un sujeto que comprende medios de código de programa para hacer que un dispositivo de procesamiento digital realice el método, cuando el programa informático se ejecuta en el dispositivo de procesamiento digital. La presente invención se refiere además a un kit para medir los niveles de expresión de tres o más genes diana de la ruta de señalización celular de JAK-STAT1/2 en una muestra de un sujeto, a un kit para inferir la actividad de una ruta de señalización celular de JAK-STAT1/2 en un sujeto y a los usos de los kits para realizar el método.
Antecedentes de la invención
Los análisis genómicos y proteómicos se han realizado sustancialmente y son una promesa potencial para la aplicación clínica en campos médicos tales como la oncología, donde se sabe que diversos cánceres están asociados a combinaciones específicas de mutaciones/variaciones genómicas y/o niveles de expresión altos o bajos para genes específicos, que juegan un papel en el crecimiento y la evolución del cáncer, por ejemplo, proliferación celular y metástasis.
El documento WO2013/011479A2 se refiere a la evaluación de la actividad de la ruta de señalización celular usando un modelo probabilístico de la expresión del gen diana.
STAT1 y STAT2 son factores de transcripción inducibles que regulan la expresión de muchos genes implicados en la respuesta inmunitaria y en el cáncer. La ruta JAK-STAT1/2 es una ruta de señalización clave implicada en diversos desafíos que enfrenta el sistema inmunitario, desde resistir infecciones hasta mantener la tolerancia inmunitaria, hacer cumplir las funciones de barrera y proteger contra el cáncer. Diferentes estímulos, tales como los IFN, desencadenan la ruta JAK-STAT1/2 para fosforilar monómeros STAT latentes, citosólicos, permitiéndoles formar homodímeros STAT1 y heterodímeros STAT1/2, que a su vez se unen a sitios diana de ADN específicos y regulan la transcripción de genes. Los interferones de tipo I normalmente activan un heterodímero STAT1/2 como factor de transcripción, mientras que los interferones de tipo II activan predominantemente homodímeros STAT1/1. Ambos complejos de factores de transcripción activan la transcripción del gen diana a través de un elemento de respuesta definido por separado, llamados ISRE y GAS, respectivamente (véase también
la Figura 1, que está basada en Platanias L.C., "Mechanisms of type-I- and type-II-interferon-mediated signaling", Nature Reviews Immunology, Vol. 5, mayo de 2015, páginas 375 a 386). Por esta razón, se prefiere tener modelos que puedan distinguir entre la transcripción STAT1/2 y STAT1/1, aunque es probable que sus genes diana en general se superpongan y no está completamente claro qué genes diana son específicos para uno u otro de los complejos de transcripción.
Con respecto a la señalización JAK-STAT1/2 en, por ejemplo, cáncer, es importante poder detectar la actividad de señalización anormal de JAK-STAT1/2 para permitir la elección correcta del tratamiento farmacológico dirigido. Actualmente se están desarrollando terapias anti-JAK-STAT1/2 (véase Liu B. et al., "Inhibition of Stat1-mediated gene activation by PIAS1", Cell Biology, Vol. 95, septiembre de 1998, páginas 10626 a 10631). Sin embargo, hoy en día no hay ningún ensayo clínico disponible para evaluar el estado funcional con respecto a la actividad de la ruta de señalización celular de JAK-STAT1/2, que en su estado activo indica que es, por ejemplo, más probable de ser promotor de tumores en comparación con su estado pasivo. Es por lo tanto deseable ser capaz de mejorar las posibilidades de caracterizar a los pacientes que tienen una enfermedad, tal como un cáncer, por ejemplo, un cáncer de mama, cervical, endometrial, ovárico, pancreático o de próstata, o un trastorno inmunitario, que esté dirigido al menos parcialmente por una actividad anormal de la ruta de señalización celular de JAK-STAT1/2 y que, por lo tanto, es probable que responda a inhibidores de la ruta de señalización celular de JAK-STAT1/2.
Sumario de la invención
La presente invención se define por las reivindicaciones adjuntas. De acuerdo con un aspecto principal de la presente invención, el problema anterior se resuelve mediante un método implementado por ordenador para inferir la actividad de una ruta de señalización celular de JAK-STAT1/2 en un sujeto realizado por un dispositivo de procesamiento digital, en donde la inferencia comprende:
recibir niveles de expresión de tres o más, por ejemplo, tres, cuatro, cinco, seis, siete, ocho, nueve o más, genes diana de la ruta de señalización celular de JAK-STAT1/2 medidos en una muestra del sujeto,
determinar un nivel de actividad de un elemento de factor de transcripción (TF) JAK-STAT1/2 en la muestra del sujeto, controlando el elemento TF JAK-STAT1/2 la transcripción de los tres o más genes diana JAK-STAT1/2, basándose la determinación en la evaluación de una ruta de modelo matemático calibrado que relaciona los niveles de expresión de los tres o más genes diana JAK-STAT1/2 con el nivel de actividad del elemento TF JAK-STAT1/2 e
inferir la actividad de la ruta de señalización celular JAK-STAT1/2 en el sujeto basándose en el nivel de actividad determinado del elemento TF JAK-STAT1/2 en la muestra del sujeto,
en donde los tres o más genes diana de JAK-STAT1/2 se seleccionan del grupo que consiste en: BID, GNAZ, IRF1, IRF7, IRF8, IRF9, LGALS1, NCF4, NFAM1, OAS1, PDCD1, RAB36, RBX1, RFPL3, SAMM50, SMARCB1, SSTR3, ST13, STAT1, TRMT1, UFD1L, USP18 y ZNRF3, preferentemente, del grupo que consiste en: IRF1, IRF7, IRF8, IRF9, OAS1, PDCD1, ST13, STAT1 y USP18.
En el presente documento, el "nivel de actividad" de un elemento TF denota el nivel de actividad del elemento TF con respecto a la transcripción de sus genes diana.
La presente invención se basa en la innovación de los inventores de que una forma adecuada de identificar los efectos que se producen en la ruta de señalización celular de JAK-STAT1/2 pueden basarse en una medición de la salida de señalización de la ruta de señalización celular de JAK-STAT1/2, que es, entre otros, la transcripción de los genes diana, que está controlada por un elemento del factor de transcripción (TF) de JAK-STAT1/2 que está controlado por la ruta de señalización celular de JAK-STAT1/2. Esta innovación de los inventores supone que el nivel de actividad de FT se encuentra en un estado cuasi-estacionario en la muestra, que puede detectarse mediante, entre otros, los valores de expresión de los genes diana JAK-STAT1/2. Se sabe que la ruta de señalización celular del JAK-STAT1/2 dirigida en el presente documento controla muchas funciones en muchos tipos de células en humanos, tales como proliferación, diferenciación y cicatrización de heridas. Con respecto a los trastornos patológicos, tales como cáncer (por ejemplo, cáncer de mama, cervical, endometrial, ovárico, pancreático o de próstata), la actividad de señalización celular anormal JAK-STAT1/2 juega un papel importante, que es detectable en los perfiles de expresión de los genes diana y, por tanto, se aprovecha mediante un modelo de ruta matemático calibrado.
La presente invención hace posible determinar la actividad de la ruta de señalización celular de JAK-STAT1/2 en un sujeto (i) determinando un nivel de actividad de un elemento TF JAK-STAT1/2 en la muestra del sujeto, en donde la determinación se basa en evaluar un modelo matemático calibrado que relaciona los niveles de expresión de tres o más genes diana de la ruta de señalización celular de JAK-STAT1/2, cuya transcripción está controlada por el elemento TF JAK-STAT1/2, al nivel de actividad del elemento JAK-STAT1/2 TF, y (ii) inferir la actividad de la ruta de señalización celular de JAK-STAT1/2 en el sujeto basándose en el nivel de actividad determinado del elemento TF JAK-STAT1/2 en la muestra del sujeto. Esto preferentemente permite mejorar las posibilidades de caracterizar a los pacientes que tienen una enfermedad, tales como cáncer, por ejemplo, un cáncer de mama, cervical, endometrial, ovárico, pancreático o de próstata, que esté dirigido al menos parcialmente por una actividad anormal de la ruta de señalización celular de JAK-STAT1/2 y que, por lo tanto, es probable que responda a inhibidores de la ruta de señalización celular de JAK-STAT1/2. En realizaciones particulares, la determinación del tratamiento puede basarse en una actividad específica de la ruta de señalización celular de JAK-STAT1/2. En una realización particular, el estado de señalización celular de JAK-STAT1/2 puede establecerse en un valor de corte de las probabilidades de que la ruta de señalización celular de JAK-STAT1/2 esté activa de, por ejemplo, 10:1, 5:1, 4:1, 2:1, 1:1, 1:2, 1:4, 1:5,o 1:10.
En el presente documento, la expresión "elemento de factor de transcripción JAK-STAT1/2" o "elemento TF JAK-STAT1/2" o "elemento TF" se define como un complejo proteico que contiene al menos un heterodímero STAT1-STAT2 o un homodímero STAT1, que es capaz de unirse a secuencias de ADN específicas, preferentemente los elementos de respuesta ISRE (motivo de unión AGTTTCNNTTCNC/T) o GAS (motivo de unión TTC/ANNNG/TAA), respectivamente, controlando de esta manera la transcripción de genes diana. Preferentemente, la expresión se refiere a una proteína o un factor de transcripción complejo de proteína que se forma por diferentes estímulos tales como los IFN desencadenados por la unión del ligando estimulante a su receptor, lo que da como resultado una señalización posterior.
El modelo de ruta matemática calibrado puede ser un modelo probabilístico, preferentemente un modelo de red bayesiana, basado en probabilidades condicionales que relacionan el nivel de actividad del elemento TF JAK-STAT1/2 y los niveles de expresión de los tres o más genes diana de JAK-STAT1/2, o el modelo de ruta matemática calibrado puede basarse en una o más combinaciones lineales de los niveles de expresión de los tres o más genes diana de JAK-STAT1/2. En particular, la inferencia de la actividad de la ruta de señalización celular de JAK-STAT1/2 puede realizarse como se desvela en la solicitud de patente internacional publicada WO 2013/011479 A2 ("Assessment of cellular signaling pathway activity using probabilistic modeling of target gene expression") o como se describe en la solicitud de patente internacional publicada WO 2014/102668 A2 ("Assessment of cellular signaling pathway activity using linear combination(s) of target gene expressions"). Pueden encontrarse detalles adicionales sobre la inferencia de la actividad de la ruta de señalización celular usando modelos matemáticos de la expresión de genes diana en Verhaegh W. et al., "Selection of personalized patient therapy through the use of knowledge-based computational models that identify tumor-driving signal transduction pathways", Cancer Research, Vol. 74, N.° 11, 2014, páginas 2936 a 2945.
El término "sujeto", como se usa en el presente documento, se refiere a cualquier ser vivo. En algunas realizaciones, el sujeto es un animal, preferentemente, un mamífero. En determinadas realizaciones, el sujeto es un ser humano, preferentemente un sujeto médico. En todavía otras realizaciones, el sujeto es una línea celular.
La expresión "gen diana" como se usa en el presente documento, significa un gen cuya transcripción está directa o indirectamente controlada por un factor de transcripción de JAK-STAT1/2. El "gen diana" puede ser un "gen diana directo" y/o un "gen diana indirecto" (como se describe en el presente documento). Además, los "genes diana" pueden ser "genes diana directos" y/o "genes diana indirectos" (como se describe en el presente documento).
Los genes diana de JAK-STAT1/2 particularmente adecuados se describen en los siguientes pasajes de texto así como en los ejemplos a continuación (véase, por ejemplo, Tablas 1 y 2 a continuación).
Por lo tanto, de acuerdo con una realización preferida los genes diana JAK-STAT1/2 se seleccionan del grupo que consiste en los genes diana JAK-STAT1/2 enumerados en la Tabla 1 o la Tabla 2 a continuación.
Los presentes inventores han descubierto que los genes diana de JAK-STAT1/2 en la lista más corta se vuelven cada vez más probatorios para determinar la actividad de la ruta de señalización celular de JAK-STAT1/2.
Otro aspecto de la presente invención se refiere a un método (como se describe en el presente documento), en el que se infiere que la actividad de la ruta de señalización celular JAK-STAT1/2 es actividad de IFN tipo I o bien actividad de IFN tipo II mediante el uso de dos modelos de ruta matemática calibrados, uno de los cuales se calibra en la actividad de IFN de tipo I y el otro en actividad de IFN tipo II. La inferencia comprende preferentemente una comparación de los niveles de actividad determinados. Por ejemplo, si el modelo JAK-STAT1/2 IFN tipo I informa una ruta activa, y el modelo JAK-STAT1/2 IFN tipo II no informa o informa un nivel de actividad más bajo que el modelo JAK-STAT1/2 IFN tipo I, puede concluirse que la muestra es JAK-STAT1/2 activada con IFN de tipo I. Por otro lado, si el modelo JAK-STAT1/2 IFN tipo II informa una ruta activa, y el modelo JAK-STAT1/2 IFN tipo I no informa o informa un nivel de actividad más bajo, puede concluirse JAK-STAT1/2 activado con IFN tipo II. Como alternativa, puede calcularse una diferencia en el nivel de actividad entre ambos modelos y, en lugar de determinar si la diferencia es positiva o negativa, puede compararse con un umbral distinto de cero.
Otro aspecto de la presente invención se refiere a un método (como se describe en el presente documento), que comprende, además: determinar si la ruta de señalización celular JAK-STAT1/2 está funcionando anormalmente en el sujeto basándose en la actividad inferida de la ruta de señalización celular JAK-STAT1/2 en el sujeto.
La presente invención también se refiere a un método (como se describe en el presente documento), que comprende, además:
recomendar la prescripción de un fármaco para el sujeto que corrige el funcionamiento anormal de la ruta de señalización celular JAK-STAT1/2,
en donde la recomendación se realiza si se determina que la ruta de señalización celular JAK-STAT1/2 funciona de forma anormal en el sujeto basándose en la actividad inferida de la ruta de señalización celular JAK-STAT1/2. La expresión "la ruta de señalización celular está funcionando de manera anormal" se refiere al caso donde la "actividad" de la ruta no es la esperada, en donde el término "actividad" puede referirse a la actividad del complejo del factor de transcripción para impulsar la expresión de los genes diana, es decir, la velocidad a la que se transcriben los genes diana. "Normal" puede ser cuando está inactivo en el tejido donde se espera que esté inactivo y activo donde se espera que esté activo. Adicionalmente, puede haber un cierto nivel de actividad que se considera "normal", y cualquier nivel más alto o más bajo puede considerarse "anormal".
La presente invención también se refiere a un método (como se describe en el presente documento), en donde el funcionamiento anormal de la ruta de señalización celular JAK-STAT1/2 es una función en la que la ruta de señalización celular JAK-STAT1/2 funciona como un promotor tumoral en el sujeto.
Otro aspecto de la presente invención se refiere a un método (como se describe en el presente documento), que comprende además predecir una respuesta del sujeto a una inmunoterapia con antígeno tumoral basada en la actividad inferida de la ruta de señalización celular JAK-STAT1/2.
La muestra o muestras a usar de acuerdo con la presente invención pueden ser una muestra extraída, esto es, una muestra que se ha extraído del sujeto. Los ejemplos de la muestra incluyen, pero no se limitan a, un tejido, células, sangre y/o un fluido corporal de un sujeto. Si el sujeto es un sujeto médico que tiene o puede tener cáncer, puede ser, por ejemplo, una muestra obtenida de una lesión de cáncer, o de una lesión que se sospecha de cáncer, o de un tumor metastásico, o de una cavidad corporal en la cual hay líquido contaminado con células cancerosas (por ejemplo, cavidad pleural o abdominal o cavidad vesical) o de otros fluidos corporales que contienen células cancerosas, etcétera, preferentemente mediante un procedimiento de biopsia u otro procedimiento de extracción de muestras. Las células de las que se extrae una muestra también pueden ser células tumorales de neoplasias hematológicas (tales como leucemia o linfoma). En algunos casos, la muestra de células también pueden ser células tumorales circulantes, esto es, células tumorales que han entrado en el torrente sanguíneo y pueden extraerse mediante técnicas de aislamiento adecuadas, por ejemplo, aféresis o extracción de sangre venosa convencional. Aparte de la sangre, un fluido corporal del que se extrae una muestra puede ser orina, contenido gastrointestinal o un extravasado. El término "muestra", como se usa en el presente documento, también abarca el caso en que, por ejemplo, se han tomado del sujeto un tejido y/o células y/o un fluido corporal del sujeto y, por ejemplo, se han colocado en un portaobjetos de microscopio y, para realizar el método reivindicado, se extrae una parte de esta muestra, por ejemplo, por medio de microdisección por captura láser (LCM, por sus siglas en inglés), o raspando las células de interés del portaobjetos, o mediante técnicas de clasificación de células activadas por fluorescencia. Además, el término "muestra", como se usa en el presente documento, también abarca el caso en el que, por ejemplo, se ha tomado del sujeto un tejido y/o células y/o un fluido corporal del sujeto y se ha colocado en un portaobjetos de microscopio y el método reivindicado se realiza en el portaobjetos.
De acuerdo con otro aspecto divulgado, un aparato para inferir la actividad de una ruta de señalización celular de JAK-STAT1/2 en un sujeto comprende un procesador digital configurado para realizar el método de la presente invención como se describe en el presente documento.
De acuerdo con otro aspecto divulgado, un medio de almacenamiento no transitorio para inferir la actividad de una ruta de señalización celular de JAK-STAT1/2 en un sujeto almacena instrucciones que son ejecutables por un dispositivo de procesamiento digital para realizar el método de la presente invención como se describe en el presente documento. El medio de almacenamiento no transitorio puede ser un medio de almacenamiento legible por ordenador, tales como un disco duro u otro medio de almacenamiento magnético, un disco óptico u otro medio de almacenamiento óptico, una memoria de acceso aleatorio (RAM, por sus siglas en inglés), una memoria de solo lectura (ROM, por sus siglas en inglés), una memoria flash u otro medio de almacenamiento electrónico, un servidor de red, etcétera. El dispositivo de procesamiento digital puede ser un dispositivo portátil (por ejemplo, un asistente de datos personales o un teléfono inteligente), un ordenador portátil, un ordenador de sobremesa, un ordenador o dispositivo de tableta, un servidor de red remoto, etcétera.
De acuerdo con otro aspecto divulgado, un programa informático para inferir la actividad de una ruta de señalización celular de JAK-STAT1/2 en un sujeto comprende medios de código de programa para hacer que un dispositivo de procesamiento digital realice el método de la presente invención como se describe en el presente documento, cuando el programa informático se ejecuta en el dispositivo de procesamiento digital. El dispositivo de procesamiento digital puede ser un dispositivo portátil (por ejemplo, un asistente de datos personales o un teléfono inteligente), un ordenador portátil, un ordenador de sobremesa, un ordenador o dispositivo de tableta, un servidor de red remoto, etcétera.
De acuerdo con otro aspecto divulgado, un kit para medir niveles de expresión de tres o más, por ejemplo, tres, cuatro, cinco, seis, siete, ocho, nueve o más, genes diana de la ruta de señalización celular JAK-STAT1/2 en una muestra de un sujeto comprende:
uno o más componentes para determinar los niveles de expresión de los tres o más genes diana JAK-STAT1/2 en la muestra del sujeto,
en donde los tres o más genes diana de JAK-STAT1/2 se seleccionan del grupo que consiste en: BID, GNAZ, IRF1, IRF7, IRF8, IRF9, LGALS1, NCF4, NFAM1, OAS1, PDCD1, RAB36, RBX1, RFPL3, SAMM50, SMARCB1, SSTR3, ST13, STAT1, TRMT1, UFD1L, USP18 y ZNRF3, preferentemente, del grupo que consiste en: IRF1, IRF7, IRF8, IRF9, OAS1, PDCD1, ST13, STAT1 y USP18.
El uno o más componentes o medios para medir los niveles de expresión de los tres o más genes diana JAK-STAT1/2 pueden seleccionarse del grupo que consiste en: un chip de matriz de ADN, un chip de matriz de oligonucleótidos, un chip de matriz de proteínas, un anticuerpo, una pluralidad de sondas, por ejemplo, sondas marcadas, un conjunto de componentes de secuenciación de transcriptasa inversa de ARN, y/o ARN o ADN, incluyendo ADNc, cebadores de amplificación. En una realización, el kit incluye un conjunto de sondas marcadas dirigidas a una porción de una secuencia de ARNm o ADNc de los tres o más genes diana JAK-STAT1/2 como se describe en el presente documento. En una realización, el kit incluye un conjunto de cebadores y sondas marcadas dirigidas a una porción de una secuencia de ARNm o ADNc de los tres o más genes diana JAK-STAT1/2. En una realización, las sondas marcadas están contenidas en una placa estandarizada de 96 pocillos. En una realización, el kit incluye además cebadores o sondas dirigidas a un conjunto de genes de referencia. Tales genes de referencia pueden ser, por ejemplo, genes expresados constitutivamente útiles para normalizar o estandarizar los niveles de expresión de los niveles de expresión del gen diana descrito en el presente documento.
En una realización, el kit para medir los niveles de expresión de tres o más, por ejemplo, tres, cuatro, cinco, seis, siete, ocho, nueve o más, genes diana de la ruta de señalización celular JAK-STAT1/2 en una muestra de un sujeto comprende:
cebadores de reacción en cadena de la polimerasa dirigidos a los tres o más genes diana JAK-STAT1/2, sondas dirigidas a los tres o más genes diana JAK-STAT1/2,
en donde los tres o más genes diana de JAK-STAT1/2 se seleccionan del grupo que consiste en: BID, GNAZ, IRF1, IRF7, IRF8, IRF9, LGALS1, NCF4, NFAM1, OAS1, PDCD1, RAB36, RBX1, RFPL3, SAMM50, SMARCB1, SSTR3, ST13, STAT1, TRMT1, UFD1L, USP18 y ZNRF3, preferentemente, del grupo que consiste en: IRF1, IRF7, IRF8, IRF9, OAS1, PDCD1, ST13, STAT1 y USP18.
De acuerdo con otro aspecto divulgado, un kit para inferir la actividad de una ruta de señalización celular de JAK-STAT1/2 en un sujeto comprende:
el kit de la presente invención como se describe en el presente documento y
el aparato de la presente invención como se describe en el presente documento, el medio de almacenamiento no transitorio de la presente invención como se describe en el presente documento o el programa informático de la presente invención como se describe en el presente documento.
De acuerdo con otro aspecto divulgado, los kits de la presente invención como se describen en el presente documento se usan para realizar el método de la presente invención como se describe en el presente documento. La presente invención como se describe en el presente documento puede, por ejemplo, usarse ventajosamente también en al menos una de las siguientes actividades:
diagnóstico basado en la actividad inferida de la ruta de señalización celular de JAK-STAT1/2 en el sujeto; pronóstico basado en la actividad inferida de la ruta de señalización celular de JAK-STAT1/2 en el sujeto; prescripción de fármacos basada en la actividad inferida de la ruta de señalización celular de JAK-STAT1/2 en el sujeto;
predicción de la efectividad del fármaco basada en la actividad inferida de la ruta de señalización celular de JAK-STAT1/2 en el sujeto;
predicción de efectos adversos basada en la actividad inferida de la ruta de señalización celular de JAK-STAT1/2 en el sujeto;
monitorización de la efectividad de fármacos;
desarrollo de fármacos;
desarrollo de ensayos;
investigación de rutas;
estadificación del cáncer;
inscripción del sujeto en un ensayo clínico basado en la actividad inferida de la ruta de señalización celular de JAK-STAT1/2 en el sujeto;
selección de la prueba posterior a realizar; y
selección de pruebas de diagnóstico complementario.
Las ventajas adicionales serán evidentes para los expertos en la materia tras leer y comprender las figuras adjuntas, la siguiente descripción y, en particular, después de leer los ejemplos detallados que se proporcionan a continuación. Debe entenderse que el método de la reivindicación 1, el aparato de la reivindicación 9, el medio de almacenamiento no transitorio de la reivindicación 10, el programa informático de la reivindicación 11, los kits de las reivindicaciones 12 a 14 y el uso de los kits de la reivindicación 15 tienen realizaciones preferidas similares y/o idénticas, en particular, como se define en las reivindicaciones dependientes.
Se entenderá que una realización preferida de la presente invención también puede ser cualquier combinación de las reivindicaciones dependientes o realizaciones anteriores con la respectiva reivindicación independiente.
Estos y otros aspectos de la invención serán evidentes a partir de y se aclararán con referencia a las realizaciones descritas en lo sucesivo en el presente documento.
Breve descripción de los dibujos
La Figura 1 muestra esquemática y ejemplarmente la ruta de señalización celular JAK-STAT1/2. Diferentes estímulos, tales como los IFN, desencadenan la ruta JAK-STAT1/2 para fosforilar monómeros STAT latentes, citosólicos, permitiéndoles formar homodímeros STAT1 y heterodímeros STAT1/2, que a su vez se unen a sitios diana de ADN específicos y regulan la transcripción de genes. Los interferones de tipo I normalmente activan un heterodímero STAT1/2 como factor de transcripción, mientras que los interferones de tipo II activan predominantemente homodímeros STAT1/1. Ambos complejos de factores de transcripción activan la transcripción del gen diana a través de un elemento de respuesta definido por separado, llamados ISRE y GAS, respectivamente (véase también la Figura 1, que se basa en Platanias L.C., "Mechanisms of type-I- and type-II-interferon-mediated signaling", Nature Reviews Immunology, Vol. 5, mayo de 2015, páginas 375 a 386).
La Figura 2 muestra esquemáticamente y a modo de ejemplo un modelo matemático, en el presente documento, un modelo de red bayesiana, usado para modelar el programa transcripcional de la ruta de señalización celular de JAK-STAT1/2.
La Figura 3 muestra un diagrama de flujo que ilustra a modo de ejemplo un proceso para inferir la actividad de la ruta de señalización celular de JAK-STAT1/2 en un sujeto basándose en los niveles de expresión de genes diana de la ruta de señalización celular de JAK-STAT1/2 medidos en una muestra de un sujeto.
La Figura 4 muestra un diagrama de flujo que ilustra a modo de ejemplo un proceso para obtener un modelo de ruta matemático calibrado como se describe en el presente documento.
La figura 5 muestra un diagrama de flujo que ilustra a modo de ejemplo un proceso para determinar un nivel de actividad de un elemento factor de transcripción (TF) de JAK-STAT1/2 en una muestra de un sujeto como se describe en el presente documento.
La Figura 6 muestra un diagrama de flujo que ilustra a modo de ejemplo un proceso para inferir la actividad de la ruta de señalización celular de JAK-STAT1/2 en un sujeto usando observables discretizados.
La Figura 7 muestra un diagrama de flujo que ilustra a modo de ejemplo un proceso para inferir la actividad de la ruta de señalización celular de JAK-STAT1/2 en un sujeto usando observables continuos.
La Figura 8 muestra un diagrama de flujo que ilustra a modo de ejemplo un proceso para determinar los valores de Cq a partir del análisis de RT-qPCR de los genes diana de la ruta de señalización celular de JAK-STAT1/2. La Figura 9 muestra los resultados de calibración de IFN tipo I del modelo de red bayesiana basado en la lista de genes diana curada por evidencia (lista de 23 genes diana) de la Tabla 1 y los métodos descritos en el presente documento usando conjuntos de datos de expresión disponibles públicamente de monocitos sanguíneos de 11 donantes sanos del conjunto de datos GSE38351.
La Figura 10 muestra los resultados de calibración de IFN tipo II del modelo de red bayesiana basado en la lista de genes diana curada por evidencia (lista de 23 genes diana) de la Tabla 1 y los métodos descritos en el presente documento usando conjuntos de datos de expresión disponibles públicamente de monocitos sanguíneos de 11 donantes sanos del conjunto de datos GSE38351.
La Figura 11 muestra las predicciones de la actividad de la ruta de señalización celular JAK-STAT1/2 del modelo de red bayesiana de IFN tipo I a modo de ejemplo entrenado usando la lista de genes diana curada por evidencia (lista de 23 genes diana) de la Tabla 1.
La Figura 12 muestra las predicciones de la actividad de la ruta de señalización celular JAK-STAT1/2 del modelo de red bayesiana de IFN tipo I a modo de ejemplo entrenado usando la lista de genes diana curada por evidencia (lista de 23 genes diana) de la Tabla 1.
La Figura 13 muestra las predicciones de la actividad de la ruta de señalización celular JAK-STAT1/2 del modelo de red bayesiana de IFN tipo I a modo de ejemplo entrenado usando la lista de genes diana curada por evidencia (lista de 23 genes diana) de la Tabla 1.
La Figura 14 muestra las predicciones de la actividad de la ruta de señalización celular JAK-STAT1/2 del modelo de red bayesiana de IFN tipo II a modo de ejemplo entrenado usando la lista de genes diana curada por evidencia (lista de 23 genes diana) de la Tabla 1.
La Figura 15 muestra las predicciones de la actividad de la ruta de señalización celular JAK-STAT1/2 del modelo de red bayesiana de IFN tipo II a modo de ejemplo entrenado usando la lista de genes diana curada por evidencia (lista de 23 genes diana) de la Tabla 1.
La Figura 16 muestra las predicciones de la actividad de la ruta de señalización celular JAK-STAT1/2 del modelo de red bayesiana de IFN tipo II a modo de ejemplo entrenado usando la lista de genes diana curada por evidencia (lista de 23 genes diana) de la Tabla 1.
La Figura 17 muestra las predicciones de la actividad de la ruta de señalización celular JAK-STAT1/2 del modelo de red bayesiana de IFN tipo I a modo de ejemplo entrenado usando la lista de genes diana curada por evidencia (lista de 23 genes diana) de la Tabla 1.
La Figura 18 muestra las predicciones de la actividad de la ruta de señalización celular JAK-STAT1/2 del modelo de red bayesiana de IFN tipo I a modo de ejemplo entrenado usando la lista de genes diana curada por evidencia (lista de 23 genes diana) de la Tabla 1.
La Figura 19 muestra la correlación entre el modelo de red bayesiano de IFN tipo I a modo de ejemplo entrenado usando la lista de genes diana curada por evidencia (lista de 23 genes diana) de la Tabla 1 y la lista corta de 9 genes diana de la Tabla 2, respectivamente.
La Figura 20 muestra la correlación entre el modelo de red bayesiano de IFN tipo II a modo de ejemplo entrenado usando la lista de genes diana curada por evidencia (lista de 23 genes diana) de la Tabla 1 y la lista corta de 9 genes diana de la Tabla 2, respectivamente.
La Figura 21 muestra resultados de validación adicionales del modelo de red bayesiano a modo de ejemplo entrenado usando la lista de genes diana curada por evidencia (lista de 23 genes diana) de la Tabla 1.
Descripción detallada de realizaciones
Los siguientes ejemplos meramente ilustran métodos particularmente preferidos y aspectos seleccionados en relación con los mismos. La enseñanza proporcionada en los mismos puede usarse para construir varias pruebas y/o kits, por ejemplo, para detectar, predecir y/o diagnosticar la actividad anormal de la ruta de señalización celular JAK-STAT1/2. Adicionalmente, tras usar métodos como se describen en el presente documento, la prescripción de medicamentos puede guiarse ventajosamente, puede realizarse la predicción de la respuesta al fármaco y monitorización de la efectividad de fármacos (y/o efectos adversos), puede predecirse y monitorizarse la resistencia a fármacos, por ejemplo, para seleccionar la prueba o pruebas posteriores que se realizarán (como una prueba de diagnóstico complementaria). Los siguientes ejemplos no han de interpretarse como limitaciones del alcance de la invención.
Ejemplo 1: Construcción del modelo matemático
Como se describe en detalle en la solicitud de patente internacional publicada WO 2013/011479 A2 ("Assessment of cellular signaling pathway activity using probabilistic modeling of target gene expression"), mediante la construcción de un modelo probabilístico, por ejemplo, un modelo de red bayesiana, e incorporando relaciones probabilísticas condicionales entre los niveles de expresión de tres o más genes diana de una ruta de señalización celular, en el presente documento, la ruta de señalización celular de JAK-STAT1/2 y el nivel de actividad de un elemento factor de transcripción (TF), en el presente documento, el elemento TF JAK-STAT1/2, controlando el elemento TF la transcripción de los tres o más genes diana de la ruta de señalización celular, un modelo tal puede usarse para determinar la actividad de la ruta de señalización celular con un alto grado de precisión. Además, el modelo probabilístico puede actualizarse fácilmente para incorporar conocimientos adicionales obtenidos por estudios clínicos posteriores, ajustando las probabilidades condicionales y/o añadiendo nuevos nodos al modelo para representar fuentes de información adicionales. De esta manera, el modelo probabilístico puede actualizarse según sea apropiado para incorporar los conocimientos médicos más recientes.
En otro enfoque fácil de comprender e interpretar descrito en detalle en la solicitud de patente internacional publicada WO 2014/102668 a 2 ("Assessment of cellular signaling pathway activity using linear combination(s) of target gene expressions"), la actividad de una ruta de señalización celular, en el presente documento, la ruta de señalización celular JAK-STAT1/2, puede determinarse construyendo y evaluando un modelo lineal o (pseudo-)lineal que incorpora relaciones entre los niveles de expresión de tres o más genes diana de la ruta de señalización celular y el nivel de un elemento de factor de transcripción (TF), en el presente documento, el elemento TF JAK-STAT1/2, controlando el elemento TF la transcripción de los tres o más genes diana de la ruta de señalización celular, estando el modelo basado en una o más combinaciones lineales de niveles de expresión de los tres o más genes diana.
En ambos enfoques, los niveles de expresión de los tres o más genes diana pueden ser preferentemente mediciones del nivel de ARNm, que puede ser el resultado de, por ejemplo, (RT)-PCR y técnicas de micromatrices que usan sondas asociadas a las secuencias de ARNm de los genes diana, y de secuenciación de ARN. En otra realización, los niveles de expresión de los tres o más genes diana pueden medirse mediante niveles de proteína, por ejemplo, las concentraciones y/o la actividad de la proteína o proteínas codificadas por los genes diana.
Los niveles de expresión mencionados anteriormente pueden convertirse opcionalmente de muchas formas que podrían o podrían no adaptarse mejor a la solicitud. Por ejemplo, cuatro transformaciones diferentes de los niveles de expresión, por ejemplo, niveles de ARNm basados en micromatrices, pueden ser:
- "datos continuos", es decir, niveles de expresión obtenidos después del preprocesamiento de micromatrices usando algoritmos bien conocidos tales como MAS5.0 y fRMA,
- "puntuación z", es decir, niveles de expresión continuos escalados de manera que el promedio de todas las muestras sea 0 y la desviación estándar sea 1,
- "discreto", es decir, cada expresión por encima de un cierto umbral se establece en 1 y por debajo de él en 0 (por ejemplo, el umbral para un conjunto de sondas puede elegirse como la mediana (ponderada) de su valor en un conjunto de un número de positivos y el mismo número de muestras clínicas negativas),
- "difuso", es decir, los niveles de expresión continua se convierten en valores entre 0 y 1 usando una función sigmoidea del siguiente formato: 1/(1 exp((thr - expr) / se)), siendo expr los niveles de expresión continuos, siendo thr el umbral que se ha mencionado anteriormente y siendo se un parámetro de suavizado que influye en la diferencia entre 0 y 1.
Uno de los modelos lineales más sencillos que pueden construirse es un modelo que tiene un nodo que representa el elemento del factor de transcripción (TF), en el presente documento, el elemento TF JAK-STAT1/2, en una primera capa y nodos ponderados que representan mediciones directas de los niveles de expresión de los genes diana, por ejemplo, por un conjunto de sondas que está particularmente altamente correlacionado con el gen diana particular, por ejemplo, en experimentos de micromatrices o (q)PCR, en una segunda capa. Las ponderaciones pueden basarse en cálculos de un conjunto de datos de entrenamiento o en conocimientos de expertos. Este enfoque de usar, en el caso de que posiblemente se midan múltiples niveles de expresión por gen diana (por ejemplo, en el caso de experimentos de micromatrices, donde un gen diana puede medirse con múltiples conjuntos de sondas), solo un nivel de expresión por gen diana es particularmente sencillo. Una forma específica de seleccionar el nivel de expresión que se usa para un gen diana particular es usar el nivel de expresión del conjunto de sondas que es capaz de separar mejor las muestras activas y pasivas de un conjunto de datos de entrenamiento. Un método para determinar este conjunto de sondas es realizar una prueba estadística, por ejemplo, la prueba t, y seleccionar el conjunto de sondas con el valor p más bajo. Los niveles de expresión del conjunto de datos de entrenamiento del conjunto de sondas con el valor p más bajo son, por definición, el conjunto de sondas con la menor probabilidad de que los niveles de expresión de las muestras activas y pasivas (conocidas) se superpongan. Otro método de selección se basa en razones de probabilidades. En un modelo tal, se proporcionan uno o más nivel o niveles de expresión para cada uno de los tres o más gen o genes diana y la una o más combinación o combinaciones lineales comprenden una combinación lineal que incluye para cada uno de los tres o más genes diana un término ponderado, basándose cada término ponderado en sólo un nivel de expresión del uno o más nivel o niveles de expresión proporcionados para el gen diana respectivo. Si solo se elige un nivel de expresión por gen diana como se describe anteriormente, el modelo puede denominarse modelo de "conjuntos de sondas más discriminantes".
En una alternativa al modelo de "conjuntos de sondas más discriminantes", es posible, en el caso de que posiblemente se midan múltiples niveles de expresión por gen diana, hacer uso de todos los niveles de expresión que se proporcionan por gen diana. En un modelo tal, se proporcionan uno o más nivel o niveles de expresión para cada uno de los tres o más genes diana y la una o más combinación o combinaciones lineales comprenden una combinación lineal de todos los niveles de expresión del uno o más nivel o niveles de expresión proporcionado para los tres o más genes diana. En otras palabras, para cada uno de los tres o más genes diana, cada uno de los uno o más nivel o niveles de expresión proporcionados para el gen diana respectivo puede ponderarse en la combinación lineal por su propio peso (individual). Esta variante puede denominarse modelo de "todos los conjuntos de sondas". Tiene la ventaja de ser relativamente sencillo y al mismo tiempo hacer uso de todos los niveles de expresión proporcionados.
Los dos modelos descritos anteriormente tienen en común que son lo que pueden considerarse modelos de "capa única", en los cuales el nivel de actividad del elemento TF se calcula basándose en una combinación lineal de niveles de expresión del uno o más conjuntos de sondas de los tres o más genes diana.
Después del nivel de actividad del elemento TF, en el presente documento, el elemento TF JAK-STAT1/2, se ha determinado evaluando el modelo respectivo, el nivel de actividad del elemento TF determinado puede establecerse como umbral para inferir la actividad de la ruta de señalización celular, en el presente documento, la ruta de señalización celular JAK-STAT1/2. Un método preferido para calcular un umbral tan apropiado es comparando los niveles de actividad del elemento TF determinados wlc (combinación lineal ponderada) de muestras de entrenamiento que se sabe que tienen una ruta de señalización celular pasiva y muestras de entrenamiento con una ruta de señalización celular activa. Un método que lo hace y también tiene en cuenta la varianza en estos grupos se da mediante el uso de un umbral
°w iC pas ^ w ic act+ g w icact^ w ic pas
th r =
°w iC pa s 0 w icact (1)
donde a y p son la desviación estándar y la media de los niveles de actividad del elemento TF determinados wlc para las muestras de entrenamiento. En caso de que solo haya una pequeña cantidad de muestras disponibles en las muestras de entrenamiento activo y/o pasivo, puede añadirse un pseudo recuento a las varianzas calculadas basándose en el promedio de las varianzas de los dos grupos:
Figure imgf000009_0001
x v (n act-v w lcact x n act
x v (npas -
v wlcpas X + Tlpa s
Figure imgf000009_0002
donde v es la varianza de los niveles de actividad del elemento TF determinados wlc de los grupos, x es un pseudo recuento positivo, por ejemplo, 1 o 10, y nact y npas son el número de muestras activas y pasivas, respectivamente. A continuación, puede obtenerse la desviación estándar a tomando la raíz cuadrada de la varianza v.
El umbral puede restarse de los niveles de actividad del elemento TF determinados wlc para facilitar la interpretación, dando como resultado una puntuación de actividad de la ruta de señalización celular en la cual los valores negativos corresponden a una ruta de señalización celular pasiva y los valores positivos corresponden a una ruta de señalización celular activa.
Como alternativa a los modelos de "capa única" descritos anteriormente, también puede usarse uno de "dos capas" en un ejemplo. En un modelo tal, se calcula un valor de resumen para cada gen diana usando una combinación lineal basada en las intensidades medidas de sus conjuntos de sondas asociados ("primera capa (inferior)"). El valor de resumen calculado se combina posteriormente con los valores de resumen de los otros genes diana de la ruta de señalización celular usando una combinación lineal adicional ("segunda capa (superior)"). De nuevo, las ponderaciones pueden aprenderse de un conjunto de datos de entrenamiento o basarse en el conocimiento de expertos o una combinación de los mismos. Expresado de manera diferente, en el modelo de "dos capas", se proporcionan uno o más nivel o niveles de expresión para cada uno de los tres o más genes diana y una o más combinación o combinaciones lineales comprenden para cada uno de los tres o más genes diana una primera combinación lineal de todos los niveles de expresión del uno o más nivel o niveles de expresión proporcionados para el gen diana respectivo ("primera capa (inferior)"). El modelo se basa además en una combinación lineal adicional que incluye para cada uno de los tres o más genes diana un término ponderado, basándose cada término ponderado en la primera combinación lineal para el gen diana respectivo ("segunda capa (superior)").
El cálculo de los valores de resumen puede, en una versión preferida del modelo de "dos capas", incluir definir un umbral para cada gen diana usando los datos de entrenamiento y restar el umbral de la combinación lineal calculada, produciendo el resumen del gen diana. En este caso, el umbral puede elegirse de manera que un valor de resumen del gen diana negativo corresponda a un gen diana regulado negativamente y que un valor de resumen del gen diana positivo corresponda a un gen diana regulado positivamente. También, es posible que los valores de resumen del gen diana se transformen usando, por ejemplo, una de las transformaciones descritas anteriormente (difusa, discreta, etc.), antes de que se combinen en la "segunda capa (superior)".
Una vez que se ha determinado el nivel de actividad del elemento TF mediante la evaluación del modelo de "dos capas", el nivel de actividad del elemento TF determinado puede establecerse como umbral para inferir la actividad de la ruta de señalización celular, como se ha descrito anteriormente.
En lo sucesivo, los modelos descritos anteriormente se denominan colectivamente modelos "(pseudo-)lineales". Una descripción más detallada del entrenamiento y uso de modelos probabilísticos, por ejemplo, un modelo de red bayesiana, se proporciona en el Ejemplo 3 a continuación.
Ejemplo 2: Selección de genes diana
Un factor de transcripción (TF) es un complejo de proteínas (es decir, una combinación de proteínas unidas en una estructura específica) o una proteína que es capaz de regular la transcripción de genes diana al unirse a secuencias de ADN específicas, controlando de esta manera la transcripción de información genética de ADN a ARNm. El ARNm producido directamente debido a esta acción del complejo TF se denomina en el presente documento un "gen diana directo" (del factor de transcripción). La activación de la ruta de señalización celular también puede resultar en una mayor transcripción de genes secundarios, denominados "genes diana indirectos". En lo sucesivo, se prefieren los modelos (pseudo-)lineales o modelos de redes bayesianas (como modelos matemáticos a modo de ejemplo) que comprenden o consisten en genes diana directos como enlaces directos entre la actividad de la ruta de señalización celular y el nivel de ARNm, sin embargo, la distinción entre genes diana directos e indirectos no siempre es evidente. En el presente documento, se presenta un método para seleccionar genes diana directos usando una función de puntuación basada en los datos de la bibliografía científica disponible. Sin embargo, no puede descartarse una selección accidental de genes diana indirectos debido a la información limitada, así como a las variaciones biológicas e incertidumbres. Para seleccionar los genes diana, se empleó la base de datos MEDLINE del National Institute of Health accesible en "www.ncbi.nlm.nih.gov/pubmed" y denominado además en el presente documento "Pubmed" para generar una lista de genes diana. Adicionalmente, se seleccionó una lista adicional de genes diana basándose en la naturaleza probatoria de su expresión.
Las publicaciones que contenían genes diana de JAK-STAT1/2 putativos se buscaron mediante consultas tales como ("JAK-STAT1/2" Y "gen diana") en el período del primer y segundo trimestre de 2017. Las publicaciones resultantes se analizaron posteriormente de forma manual siguiendo la metodología que se describe con más detalle a continuación.
Se seleccionaron genes diana de ARNm de la ruta de señalización celular específica de la bibliografía científica, mediante el uso de un sistema de clasificación en el que se dio una clasificación a la evidencia científica para un gen diana específico, dependiendo del tipo de experimentos científicos en los que se acumuló la evidencia. Si bien algunas pruebas experimentales sugieren simplemente que un gen es un gen diana directo, como, por ejemplo, un ARNm que aumenta según se detecta mediante una intensidad creciente de un conjunto de sondas en una micromatriz de una línea celular en la que se sabe que la ruta de señalización celular de JAK-STAT1/2 está activa, otra evidencia puede ser muy fuerte, como la combinación de un sitio de unión TF de la ruta de señalización celular de JAK-STAT1/2 identificada y la recuperación de este sitio en un ensayo de inmunoprecipitación de cromatina (ChIP) después de la estimulación de la ruta de señalización celular específica en la célula y aumento de ARNm después de la estimulación específica de la ruta señalización celular en una línea celular.
En la bibliografía científica pueden identificarse diversos tipos de experimentos para encontrar genes diana de rutas de señalización celular específicas:
1. Experimentos ChIP en los cuales se muestra la unión directa de un TF de la ruta de señalización celular de interés a su sitio de unión en el genoma. Ejemplo: Mediante el uso de la tecnología de inmunoprecipitación de cromatina (ChIP), posteriormente, los sitios de unión de TF JAK-STAT1/2 funcionales putativos en el ADN de líneas celulares con y sin inducción activa de la ruta de señalización celular de JAK-STAT1/2, por ejemplo, por estimulación con JAK-STAT1/2, se identificaron, como un subconjunto de los sitios de unión reconocidos puramente basándose en la secuencia de nucleótidos. La funcionalidad putativa se identificó como evidencia derivada de ChIP de que se encontró que el TF se unía al sitio de unión del ADN.
2. Ensayos de cambio de movilidad electroforética (EMSA) que muestran la unión in vitro de un TF a un fragmento de ADN que contiene la secuencia de unión. En comparación con la evidencia basada en ChIP, la evidencia basada en EMSA es menos sólida, ya que no puede traducirse a la situación in vivo.
3. Estimulación de la ruta de señalización celular y medición de la expresión de ARNm usando una micromatriz, secuenciación de ARN, PCR cuantitativa u otras técnicas, usando líneas celulares inducibles por la ruta de señalización celular de JAK-STAT1/2 y midiendo los perfiles de ARNm medidos al menos uno, pero preferentemente varios puntos de tiempo después de la inducción, en presencia de cicloheximida, que inhibe la traducción a proteína, por lo tanto, se supone que los ARNm inducidos son genes diana directos.
4. Similar a 3, pero, alternativamente, mide la expresión de ARNm adicionales en dirección 3' con mediciones de abundancia de proteínas, tales como transferencia Western.
5. Identificación de sitios de unión de TF en el genoma mediante un enfoque bioinformático. Ejemplo para el elemento TF JAK-STAT1/2: Usando el motivo de unión ISRE 'AGTTTCNNTTCNC/T' y el motivo de unión GAS 'TTC/ANNNG/TAA', se identificaron los sitios de unión potenciales en regiones promotoras de genes.
6. Similar a 3, solo en ausencia de cicloheximida.
7. Similar a 4, solo en ausencia de cicloheximida.
En la forma más sencilla, puede asignarse a cada gen potencial 1 punto para cada uno de estos enfoques experimentales en los cuales el gen se identificó como un gen diana de la familia de factores de transcripción JAK-STAT1/2. Usando esta estrategia de clasificación relativa, puede hacerse una lista de los genes diana más fiables.
Como alternativa, la clasificación de otra manera puede usarse para identificar los genes diana que tienen más probabilidades de ser genes diana directos, dando un mayor número de puntos a la tecnología que proporciona la mayor evidencia de un gen diana directo en vivo. En la lista anterior, esto significaría 7 puntos para el enfoque experimental 1), 6 para 2) y bajar a 1 punto para el enfoque experimental 7). Esta lista puede denominarse una "lista general de genes diana".
A pesar de las variaciones biológicas e incertidumbres, los inventores supusieron que los genes diana directos son los que tienen más probabilidades de inducirse de forma independiente del tejido. Una lista de estos genes diana puede denominarse una "lista de genes diana curada por pruebas". Esta lista de genes diana curada por pruebas se ha usado para construir modelos computacionales de la ruta de señalización celular de JAK-STAT1/2 que pueden aplicarse a muestras procedentes de diferentes fuentes de tejido.
Lo siguiente ilustrará a modo de ejemplo cómo se construyó específicamente la selección de una lista de genes diana curada por evidencia para la ruta de señalización celular de JAK-STAT1/2.
Se introdujo una función de puntuación que daba un punto por cada tipo de evidencia experimental, tales como ChIP, EMSA, expresión diferencial, atenuación/inactivación génica, ensayo del indicador del gen de la luciferasa, análisis de secuencia, que se informó en una publicación. La misma evidencia experimental a veces se menciona en múltiples publicaciones, lo que da como resultado un número correspondiente de puntos, por ejemplo, dos publicaciones que mencionan un resultado de ChIP dan como resultado el doble de la puntuación que se da para un solo resultado de ChIP. Se realizaron análisis adicionales para permitir solo genes que tenían diversos tipos de evidencia experimental y no solo un tipo de evidencia experimental, por ejemplo, expresión diferencial. Se seleccionaron aquellos genes que tenían más de un tipo de evidencia experimental disponible (como se muestra en la Tabla 1).
Los inventores realizaron una selección adicional de la lista de genes diana curada por pruebas (enumerada en la Tabla 2). Se seleccionaron los genes diana de la lista curada por evidencias de pruebas que demostraron ser más probatorios en la determinación de la actividad de la ruta de señalización celular de JAK-STAT1/2 de las muestras de entrenamiento. En el presente documento, se usaron los conjuntos de datos de expresión disponibles de monocitos sanguíneos de 11 donantes sanos del conjunto de datos GSE38351. 19 muestras eranSTAT1/2 inactivas, incluyendo 11 muestras con monocitos incubados sin ninguna estimulación y 8 muestras con monocitos que se aislaron inmediatamente después de la extracción de sangre. El grupo JAK-STAT1/2 activo incluyó 7 muestras estimuladas con IFNa2a y 7 muestras estimuladas con IFNy. Los valores de expresión génica para la "lista de genes diana curada por evidencia" (lista de 23 genes diana) de la Tabla 1 se compararon entre las muestras activas e inactivas de STAT1/2 del conjunto de datos GSE38351. Si el nivel de expresión de un gen diana obviamente se diferenciaba entre los grupos activos e inactivos de la ruta, lo que significa que el gen diana puede usarse para distinguir entre los grupos activos e inactivos de la ruta, entonces se seleccionó el gen diana. Esto dio como resultado la "lista corta de 9 genes diana" que se muestra en la Tabla 2.
Tabla 1: "Lista curada por evidencia de genes diana" (lista de 23 genes diana) de la ruta de señalización celular de JAK-STAT1/2 usada en los modelos de ruta de señalización celular de JAK-STAT1/2 y conjuntos de sondas i r m ir l ni l x r i n AR m l n i n
Figure imgf000012_0002
Tabla 2: "Lista corta de 9 genes diana" de genes diana de JAK-STAT1/2 basada en la lista curada por evidencia de n i n AK- TAT12 L n n n i n l mi m n l T l 1
Figure imgf000012_0001
Ejemplo 3: Entrenamiento y uso del modelo matemático
Antes de que el modelo matemático pueda usarse para inferir la actividad de la ruta de señalización celular, en el presente documento, la ruta de señalización celular JAK-STAT1/2, en un sujeto, el modelo debe estar apropiadamente entrenado.
Si el modelo de ruta matemática es un modelo probabilístico, por ejemplo, un modelo de red bayesiana, basado en probabilidades condicionales que relacionan el nivel de actividad del elemento TF JAK-STAT1/2 y los niveles de expresión de tres o más genes diana de la ruta de señalización celular de JAK-STAT1/2 medidos en la muestra del sujeto, el entrenamiento puede realizarse preferentemente como se describe en detalle en la solicitud de patente internacional publicada WO 2013/011479 A2 ("Assessment of cellular signaling pathway activity using probabilistic modeling of target gene expression").
Si el modelo de ruta matemática se basa en una o más combinación o combinaciones lineales de niveles de expresión de tres o más genes diana de la ruta de señalización celular JAK-STAT1/2 medida en la muestra del sujeto, el entrenamiento puede realizarse preferentemente como se describe en detalle en la solicitud de patente internacional publicada WO 2014/102668 A2 ("Assessment of cellular signaling pathway activity using linear combination(s) of target gene expressions").
En el presente documento, se usó un modelo de red bayesiana a modo de ejemplo como se muestra en la Figura 2 para modelar el programa transcripcional de la ruta de señalización celular de JAK-STAT1/2 de una manera sencilla. El modelo consiste en tres tipos de nodos: (a) un elemento de factor de transcripción (TF) (con estados "ausente" y "presente") en una primera capa 1; (b) genes diana TG1, TG2, Tgnn (con estados "activo" e "inactivo") en una segunda capa 2 y; (c) nodos de medición vinculados a los niveles de expresión de los genes diana en una tercera capa 3. Estos pueden ser conjuntos de sondas de micromatrices PS1,1, PS1,2, PS1,3, PS2,1, PSn,1, PD„,m (con estados "bajo" y "alto"), como se usa preferentemente en el presente documento, pero también podrían ser otras medidas de expresión génica tales como RNAseq o RT-qPCR.
Una implementación adecuada del modelo matemático, en el presente documento, el modelo de red bayesiana a modo de ejemplo, se basa en datos de micromatrices. El modelo describe (i) cómo los niveles de expresión de los genes diana dependen de la activación del elemento TF y (ii) cómo las intensidades de conjuntos de sondas, a su vez, dependen de los niveles de expresión de los genes diana respectivos. Para lo último, las intensidades del conjunto de sondas pueden tomarse de micromatrices Affymetrix HG-U133Plus2.0 preprocesadas con fRMA, que están ampliamente disponibles en Gene Expression Omnibus (GEO, www.ncbi.nlm.nih.gov/geo) y ArrayExpress (www.ebi.ac.uk/arrayexpress).
Como el modelo de red bayesiana a modo de ejemplo es una simplificación de la biología de una ruta de señalización celular, en el presente documento, la ruta de señalización celular de JAK-STAT1/2, y como las mediciones biológicas son normalmente ruidosas, se optó por un enfoque probabilístico, es decir, las relaciones entre (i) el elemento TF y los genes diana, y (ii) los genes diana y sus respectivos conjuntos de sondas, se describen en términos probabilísticos. Adicionalmente, se asumió que la actividad de la ruta de señalización celular oncogénica que impulsa el crecimiento tumoral no se altera de forma transitoria y dinámica, sino a largo plazo o incluso se altera irreversiblemente. Por lo tanto, se desarrolló el modelo de red bayesiana a modo de ejemplo para la interpretación de una condición celular estática. Por esta razón, las características complejas de la ruta de señalización celular dinámica no se incorporaron al modelo.
Una vez que se construye y se calibra el modelo de red bayesiana a modo de ejemplo (véase a continuación), el modelo puede usarse en datos de micromatrices de una nueva muestra introduciendo las mediciones del conjunto de sondas como observaciones en la tercera capa 3, e infiriendo hacia atrás en el modelo cuál debe haber sido la probabilidad de que el elemento TF esté "presente". En este caso, se considera "presente" el fenómeno de que el elemento TF está unido al ADN y controla la transcripción de los genes diana de la ruta de señalización celular y "ausente" el caso de que el elemento TF no controle la transcripción. Esta probabilidad es, por tanto, la lectura principal que puede usarse para indicar la actividad de la ruta de señalización celular, en el presente documento, la ruta de señalización celular JAK-STAT1/2, que a continuación puede traducirse en las probabilidades de que la ruta de señalización celular esté activa tomando la relación entre la probabilidad de que esté activa frente a la de estar pasiva (es decir, las probabilidades están dadas por p/(1-p), donde p es la probabilidad predicha de que la ruta de señalización celular esté activa).
En el modelo de red bayesiana a modo de ejemplo, las relaciones probabilísticas se han hecho cuantitativas para permitir un razonamiento probabilístico cuantitativo. Para mejorar el comportamiento de generalización entre tipos de tejidos, los parámetros que describen las relaciones probabilísticas entre (i) el elemento TF y los genes diana han sido cuidadosamente seleccionados. Si el elemento TF está "ausente", lo más probable es que el gen diana esté "inactivo", por tanto, se elige una probabilidad de 0,95 para esto, y se elige una probabilidad de 0,05 para que el gen diana esté "activo". La última probabilidad (distinta de cero) es para dar cuenta de la posibilidad (rara) de que el gen diana esté regulado por otros factores o de que se observe accidentalmente como "activo" (por ejemplo, debido al ruido de medición). Si el elemento TF está "presente", entonces con una probabilidad de 0,70, el gen diana se considera "activo", y con una probabilidad de 0,30 el gen diana se considera "inactivo". Los últimos valores se eligen de esta manera, debido a que puede haber varias causas por las que un gen diana no se expresa en gran medida aunque el elemento TF esté presente, por ejemplo, porque la región promotora del gen está metilada. En el caso de que un gen diana no esté regulado positivamente por el elemento TF, sino regulado negativamente, las probabilidades se eligen de manera similar, pero reflejando la regulación negativa en presencia del elemento TF. Los parámetros que describen las relaciones entre (ii) los genes diana y sus respectivos conjuntos de sondas se han calibrado con datos experimentales. Para lo último, en este ejemplo, se usaron datos de micromatrices de muestras de pacientes que se sabe que tienen una ruta de señalización celular JAK-STAT1/2 activa mientras que se usaron muestras normales, sanas del mismo conjunto de datos como muestras de la ruta de señalización celular JAK-STAT1/2 pasiva, pero esto también podría realizarse usando experimentos de líneas celulares u otras muestras de pacientes con un estado conocido de actividad de la ruta de señalización celular. Las tablas de probabilidad condicional resultantes vienen dadas por:
A: para genes diana regulados positivamente
Figure imgf000014_0002
B: para genes diana regulados negativamente
Figure imgf000014_0001
En estas tablas, las variables ALij, AH,, PLij y PHij indican el número de muestras de calibración con un complejo de transcripción "ausente" (A) o "presente" (P) que tienen una intensidad del conjunto de sondas "baja" (L) o "alta" (H), respectivamente. Se han añadido recuentos ficticios para evitar probabilidades extremas de 0 y 1.
Para discretizar las intensidades del conjunto de sondas observadas, para cada conjunto de sondas PSij se usó un umbral tij, por debajo del cual la observación se denomina "baja" y por encima del cual se denomina "alta". Este umbral se ha elegido para que sea la intensidad media (ponderada) del conjunto de sondas en el conjunto de datos de calibración usado. Debido al ruido de los datos de micromatrices, se usó un método difuso al comparar la intensidad de un conjunto de sonda observado con su umbral, asumiendo una distribución normal con una desviación estándar de 0,25 (en una escala log2) alrededor de la intensidad informada, y determinando la masa de probabilidad por debajo y por encima del umbral.
Si en lugar de la red bayesiana a modo de ejemplo descrita anteriormente, se empleó un modelo (pseudo-)lineal como se describe en el Ejemplo 1 anterior, los pesos que indican el signo y la magnitud de la correlación entre los nodos y un umbral para indicar si un nodo está "ausente" o "presente" deberían determinarse antes de que el modelo pueda usarse para inferir la actividad de la ruta de señalización celular en una muestra de prueba. Podría usarse el conocimiento experto para completar los pesos y el umbral a priori, pero normalmente el modelo se entrenaría usando un conjunto representativo de muestras de entrenamiento, de los cuales preferentemente se conoce la verdad fundamental, por ejemplo, datos de expresión de conjuntos de sondas en muestras con un complejo de factor de transcripción "presente" conocido (= ruta de señalización celular activa) o complejo de factor de transcripción "ausente" (= ruta de señalización celular pasiva).
Se conoce en el campo una multitud de algoritmos de entrenamiento (por ejemplo, regresión) que toman en cuenta la topología del modelo y cambian los parámetros del modelo, en este caso, los pesos y el umbral, de tal manera que la salida del modelo, en este caso, una puntuación lineal ponderada, se optimiza. Como alternativa, también es posible calcular los pesos directamente a partir de los niveles de expresión observados sin la necesidad de un algoritmo de optimización.
Un primer método, denominado método "blanco y negro" en el presente documento, se reduce a un sistema ternario, en el cual cada ponderación es un elemento del conjunto {-1,0, 1}. Si esto se pone en un contexto biológico, el -1 y el 1 corresponden a genes diana o conjuntos de sondas que están regulados negativa y positivamente en caso de actividad de la ruta de señalización celular, respectivamente. En caso de que no se pueda demostrar estadísticamente que un conjunto de sondas o un gen diana esté regulado positiva o negativamente, recibe un peso de 0. En un ejemplo, puede usarse una prueba t de dos muestras de lado izquierdo y de lado derecho de los niveles de expresión de la ruta de señalización celular activa frente a los niveles de expresión de las muestras con una ruta de señalización celular pasiva para determinar si una sonda o gen está regulado positiva o negativamente dados los datos de entrenamiento usados. En los casos en los cuales el promedio de las muestras activas sea estadísticamente mayor que las muestras pasivas, es decir, el valor p está por debajo de un cierto umbral, por ejemplo, 0,3, se determina que el gen o conjunto de sondas diana está regulado positivamente. A la inversa, en los casos en los cuales el promedio de las muestras activas sea estadísticamente menor que las muestras pasivas, se determina que el gen diana o conjunto de sondas está regulado negativamente tras la activación de la ruta de señalización celular. En caso de que el valor p más bajo (del lado izquierdo o derecho) exceda el umbral mencionado anteriormente, el peso del gen diana o el conjunto de sondas puede definirse que es 0.
Un segundo método, denominado "probabilidades de registro" - pesos en el presente documento, se basa en el logaritmo (por ejemplo, en base e) de la razón de posibilidades. La razón de probabilidades para cada gen diana o conjunto de sondas se calcula basándose en el número de muestras de entrenamiento positivas y negativas para las que el nivel del conjunto de sondas/gen objetivo está por encima y por debajo del umbral correspondiente, por ejemplo, la mediana (ponderada) de todas las muestras de entrenamiento. Puede añadirse un pseudo recuento para eludir las divisiones entre cero. Otro refinamiento es contar las muestras por encima o por debajo del umbral de una manera algo más probabilística, asumiendo que los niveles de conjuntos de sondas/genes diana están, por ejemplo, distribuidos normalmente alrededor de su valor observado con una cierta desviación estándar especificada (por ejemplo, 0,25 en una escala de 2-log) y contando la masa de probabilidad por encima y por debajo del umbral. En el presente documento, una razón de probabilidades calculada en combinación con un pseudo-recuento y usando masas de probabilidad en lugar de valores de medición deterministas se denomina razón de probabilidades "suave".
Pueden encontrarse detalles adicionales sobre la inferencia de la actividad de la ruta de señalización celular usando modelos matemáticos de la expresión de genes diana en Verhaegh W. et al., "Selection of personalized patient therapy through the use of knowledge-based computational models that identify tumor-driving signal transduction pathways", Cancer Research, Vol. 74, N.° 11, 2014, páginas 2936 a 2945.
En el presente documento, los presentes inventores han usado datos de expresión de ARNm disponibles públicamente de Affymetrix U133Plus2.0 de monocitos sanguíneos de donantes sanos que se estimularon in vitro por citocinas: IFNa2a (IFN tipo I) e IFNy (IFN tipo II). Debido a que la ruta STAT1/2 puede activarse por IFN tipo I o por IFN tipo II, con efectos ligeramente diferentes en los niveles de expresión génica diana, se usaron dos conjuntos de datos de calibración diferentes, representativos de las dos formas de activación de STAT1/2, definiéndose como estimulación con estímulos de IFN tipo I e IFN tipo II, respectivamente. Los monocitos sanguíneos de donantes sanos sin ningún estímulo forman el grupo de control. Por tanto, dos modelos diferentes se calibraron por separado en muestras de calibración con estimulación con IFNa2a (IFN tipo I) o estimulación con IFNy (IFN tipo II), usando la misma lista de genes diana (véase la Tabla 1).
En lo sucesivo, los resultados de calibración del modelo de red bayesiana en conjuntos de datos con estimulación de IFN tipo I y simulación de IFN tipo 2 se muestran en las Figuras 9 y 10.
La Figura 9 muestra los resultados de calibración de IFN tipo I del modelo de red bayesiana basado en la lista de genes diana curada por evidencia (lista de 23 genes diana) de la Tabla 1 y los métodos descritos en el presente documento usando conjuntos de datos de expresión disponibles públicamente de monocitos sanguíneos de 11 donantes sanos del conjunto de datos GSE38351. 19 muestras, incluyendo 11 muestras con monocitos sanguíneos incubados sin ninguna estimulación y 8 muestras con monocitos sanguíneos que se aislaron inmediatamente después de la extracción de sangre, se usan como grupo control, es decir, una muestra de calibración inactiva (grupo 3). El grupo de entrenamiento, es decir, las muestras de calibración activas, incluyó 7 muestras estimuladas con IFNa2a (IFN tipo I; grupo 1). El modelo se probó en otras 7 muestras de los mismos donantes estimulados con IFNy (IFN tipo II; grupo 2). En el diagrama, el eje vertical indica las probabilidades de que el elemento TF esté "presente" respecto a "ausente", que corresponde a que la ruta de señalización celular de jAK-STAT1/2 esté activa respecto a pasiva, donde los valores por encima del eje horizontal corresponden a que el elemento TF es más probable que esté "presente"/activo y los valores por debajo del eje horizontal indican que las probabilidades de que el elemento TF esté "ausente"/pasivo son mayores que las probabilidades de que esté "presente"/activo. El modelo JAK-STAT1/2 de IFN tipo I fue capaz de separar claramente las muestras de calibración inactivas de las activas.
La Figura 10 muestra los resultados de calibración de IFN tipo II del modelo de red bayesiana basado en la lista de genes diana curada por evidencia (lista de 23 genes diana) de la Tabla 1 y los métodos descritos en el presente documento usando conjuntos de datos de expresión disponibles públicamente de monocitos sanguíneos de 11 donantes sanos del conjunto de datos GSE38351. 19 muestras, incluyendo 11 muestras con monocitos sanguíneos incubados sin ninguna estimulación y 8 muestras con monocitos sanguíneos que se aislaron inmediatamente después de la extracción de sangre, se usan como grupo control, es decir, las muestras de calibración inactiva (grupo 3). El grupo de entrenamiento, es decir, las muestras de calibración activas, incluyó 7 muestras estimuladas con IFNy (IFN tipo II; grupo 1). El modelo se probó en otras 7 muestras de los mismos donantes estimulados IFNa2a (IFN tipo I; grupo 2). En el diagrama, el eje vertical indica las probabilidades de que el elemento TF esté "presente" respecto a "ausente", que corresponde a que la ruta de señalización celular de JAK-STAT1/2 esté activa respecto a pasiva, donde los valores por encima del eje horizontal corresponden a que el elemento TF es más probable que esté "presente"/activo y los valores por debajo del eje horizontal indican que las probabilidades de que el elemento TF esté "ausente"/pasivo son mayores que las probabilidades de que esté "presente"/activo. El modelo JAK-STAT1/2 de IFN tipo II fue capaz de separar claramente las muestras de calibración inactivas de las activas.
Comparando los niveles de actividad de la ruta entre el modelo JAK-STAT1/2 IFN tipo I (Figura 9) y el modelo JAK-STAT1/2 IFN tipo II (Figura 10) en muestras idénticas, puede inferirse si la actividad de JAK-STAT1/2 se induce por estimulación de tipo I o de tipo II. Para las muestras estimuladas con IFNa2a (IFN tipo I; grupo 1), las puntuaciones de actividad del modelo de tipo I en la Figura 9 son más altas que las puntuaciones de actividad del modelo de tipo II en la Figura 10, claramente de acuerdo con su estimulación con IFN tipo I. Para las muestras estimuladas con IFNy (IFN tipo II; grupo 2), las puntuaciones de actividad del modelo JAK-STAT1/2 de IFN tipo II en la Figura 10 son más altas que las puntuaciones de actividad del modelo JAK-STAT1/2 de IFN tipo I en la Figura 9, de acuerdo con su estimulación con IFN tipo II. Para muestras con estimulación desconocida, tal comparación puede indicar qué tipo de estimulación ha desencadenado la activación de JAK-STAT1/2.
En lo sucesivo, Los resultados de la validación del modelo de red bayesiano a modo de ejemplo entrenado usando la lista de genes diana curada por evidencia (lista de 23 genes diana) de la Tabla 1 se muestran en las Figuras 11 a 16.
La Figura 11 muestra las predicciones de la actividad de la ruta de señalización celular JAK-STAT1/2 del modelo de red bayesiana de IFN tipo I a modo de ejemplo entrenado usando la lista de genes diana curada por evidencia (lista de 23 genes diana) de la Tabla 1. Se han aislado células NK de células mononucleares de sangre periférica (PBMC) de cinco controles sanos directamente (grupo 1) o después de cultivar durante 6 h sin estimulación (grupo 2) (conjunto de datos GSE15743). Con 6 horas de estimulación con 100 ng/ml y 1 ng/ml de IFNa-2b recombinante (estímulo de IFN tipo I) (grupo 3 y grupo 4, respectivamente), JAK-STAT1/2 se activa. En el diagrama, el eje vertical indica las probabilidades de que el elemento t F esté "presente" respecto a "ausente", que corresponde a que la ruta de señalización celular de JAK-STAT1/2 esté activa respecto a pasiva, donde los valores por encima del eje horizontal corresponden a que el elemento TF es más probable que esté "presente"/activo y los valores por debajo del eje horizontal indican que las probabilidades de que el elemento TF esté "ausente"/pasivo son mayores que las probabilidades de que esté "presente"/activo. El modelo JAK-STAT1/2 de IFN tipo I predice correctamente una alta actividad JAK-STAT1/2 para muestras con estimulación con IFNa-2b (IFN tipo I) y muestras estimuladas con dosis altas de IFNa-2b que también tienen una alta actividad de la ruta.
La Figura 12 muestra las predicciones de la actividad de la ruta de señalización celular JAK-STAT1/2 del modelo de red bayesiana de IFN tipo I a modo de ejemplo entrenado usando la lista de genes diana curada por evidencia (lista de 23 genes diana) de la Tabla 1. Las células dendríticas plasmacitoides (pDC) se separaron de donantes sanos y pacientes con EM (esclerosis múltiple) antes y después del inicio del tratamiento con IFN-p (IFN tipo I) (conjunto de datos GSE37750). En el diagrama, los puntos individuales en el lado izquierdo del gráfico representan donantes sanos que están en el grupo control. Como puede verse en los valores de actividad dados en log2 (probabilidades) en el eje vertical del gráfico, las muestras del grupo de control son JAK-STAT1/2 inactivas. Por el contrario, los puntos conectados representan los valores de actividad STAT1/2 de 9 pacientes con EM antes del tratamiento (lado izquierdo del gráfico) y después del tratamiento (lado derecho del gráfico). Cada línea conecta la actividad STAT1/2 antes y después del tratamiento para cada paciente, lo que muestra que las actividades de STAT1/2 son significativamente más altas después del tratamiento en 8 pacientes. El modelo JAK-STAT1/2 de IFN tipo I predice correctamente que los niveles de actividad JAK-STAT1/2 aumentan después del tratamiento con IFN-p.
La Figura 13 muestra las predicciones de la actividad de la ruta de señalización celular JAK-STAT1/2 del modelo de red bayesiana de IFN tipo I a modo de ejemplo entrenado usando la lista de genes diana curada por evidencia (lista de 23 genes diana) de la Tabla 1. En el conjunto de datos GSE14386, las células mononucleares de sangre periférica (PBMC) se obtuvieron de pacientes con el denominado "síndrome clínicamente aislado (CIS)", sugerente para el diagnóstico de esclerosis múltiple (EM), y estimulado con mAb aCD3 (1 pg/ml) y aCD28 (5 pg/ml) inmovilizados en placa (BD Biosciences) en ausencia (grupo 1) o presencia (grupo 2) de FNp-1a (IFN tipo I) (1000 U/ml) durante 24 horas. En el diagrama, los puntos conectados representan los valores de actividad STAT1/2 de 14 pacientes con CIS antes del tratamiento (lado izquierdo del gráfico) y después del tratamiento (lado derecho del gráfico). Los resultados muestran que las actividades de STAT1/2 son significativamente más altas después del tratamiento para los 14 pacientes. El modelo JAK-STAT1/2 de IFN tipo I predice correctamente que los niveles de actividad JAK-STAT1/2 aumentan después de la incubación con IFNp-1a (IFN tipo I).
La Figura 14 muestra las predicciones de la actividad de la ruta de señalización celular JAK-STAT1/2 del modelo de red bayesiana de IFN tipo II a modo de ejemplo entrenado usando la lista de genes diana curada por evidencia (lista de 23 genes diana) de la Tabla 1. Se maduraron células dendríticas (DC) durante 6 horas con receptor tipo Toll (TLR) 4 en presencia de IFNy (IFN tipo II) en el conjunto de datos GSE11327. El ARN de las DC se aisló después de 6, 12, 24 o 48 horas de maduración (grupo 1; las cuatro barras representan cuatro puntos secuenciales en el tiempo: 6, 12, 24, 48 horas). En el diagrama, el eje vertical indica las probabilidades de que el elemento TF esté "presente" respecto a "ausente", que corresponde a que la ruta de señalización celular de JAK-STAT1/2 esté activa respecto a pasiva, donde los valores por encima del eje horizontal corresponden a que el elemento TF es más probable que esté "presente"/activo y los valores por debajo del eje horizontal indican que las probabilidades de que el elemento TF esté "ausente"/pasivo son mayores que las probabilidades de que esté "presente"/activo. El modelo JAK-STAT1/2 de IFN tipo II predice correctamente niveles más altos de actividad JAK-STAT en las DC (grupo 1) y STAT1/2 inactivo en el grupo control no estimulado (grupo 2).
La Figura 15 muestra las predicciones de la actividad de la ruta de señalización celular JAK-STAT1/2 del modelo de red bayesiana de IFN tipo II a modo de ejemplo entrenado usando la lista de genes diana curada por evidencia (lista de 23 genes diana) de la Tabla 1. Se trataron células THP1-SP1 10b con IFNy (IFN de tipo II) en el conjunto de datos GSE58096. En el diagrama, el eje vertical indica las probabilidades de que el elemento TF esté "presente" respecto a "ausente", que corresponde a que la ruta de señalización celular de JAK-STAT1/2 esté activa respecto a pasiva, donde los valores por encima del eje horizontal corresponden a que el elemento TF es más probable que esté "presente"/activo y los valores por debajo del eje horizontal indican que las probabilidades de que el elemento TF esté "ausente"/pasivo son mayores que las probabilidades de que esté "presente"/activo. El modelo JAKSTAT1/2 de IFN tipo II predice correctamente niveles más altos de actividad JAK-STAT en las células que se trataron con IFNy (IFN tipo II) durante 2 días (grupo 2), células que se trataron con Dox más IFNy durante 2 días (grupo 3), células que se trataron con IFNy durante 4 días (grupo 4) y células que se trataron con Dox más IFNy durante 4 días (grupo 5), en comparación con el grupo control no tratado (grupo 1).
La Figura 16 muestra las predicciones de la actividad de la ruta de señalización celular JAK-STAT1/2 del modelo de red bayesiana de IFN tipo II a modo de ejemplo entrenado usando la lista de genes diana curada por evidencia (lista de 23 genes diana) de la Tabla 1. Se cultivaron células mononucleares de sangre periférica en RPMI 1640 complementado con suero bovino fetal al 10 % y M-CSF 10 ng/ml en presencia o ausencia de IFNy 100 U/ml durante 24 h (conjunto de datos GSE11864). En el diagrama, el eje vertical indica las probabilidades de que el elemento TF esté "presente" respecto a "ausente", que corresponde a que la ruta de señalización celular de JAK-STAT1/2 esté activa respecto a pasiva, donde los valores por encima del eje horizontal corresponden a que el elemento TF es más probable que esté "presente"/activo y los valores por debajo del eje horizontal indican que las probabilidades de que el elemento TF esté "ausente"/pasivo son mayores que las probabilidades de que esté "presente"/activo. El modelo JAK-STAT1/2 de IFN tipo II predice correctamente que JAK-STAT1/2 está inactivo en los monocitos de sangre fresca (grupo 1) y en las células que se cultivaron en M-CSF (grupo 2), mientras que las células que se estimularon con IFNy muestran niveles elevados de actividad JAK-STAT1/2 (grupo 3).
Los resultados adicionales de la validación del modelo de red bayesiano a modo de ejemplo entrenado usando la lista de genes diana curada por evidencia (lista de 23 genes diana) se muestran en las Figuras 17 y 18. En este caso, se aplicaron el modelo JAK-STAT1/2 de IFN tipo I y el modelo JAK-STAT1/2 de IFN tipo II a los mismos conjuntos de datos para investigar las diferencias en los resultados de predicción de la actividad de la ruta de señalización celular JAK-STAT1/2.
La Figura 17 muestra las predicciones de la actividad de la ruta de señalización celular JAK-STAT1/2 del modelo de red bayesiana de IFN tipo I a modo de ejemplo entrenado usando la lista de genes diana curada por evidencia (lista de 23 genes diana) de la Tabla 1. El modelo de red bayesiana JAK-STAT1/2 calibrado con IFN tipo I se aplicó al mismo conjunto de datos GSE58096 que en la Figura 15, representando cinco grupos las mismas muestras. En el diagrama, el eje vertical indica las probabilidades de que el elemento TF esté "presente" respecto a "ausente", que corresponde a que la ruta de señalización celular de JAK-STAT1/2 esté activa respecto a pasiva, donde los valores por encima del eje horizontal corresponden a que el elemento TF es más probable que esté "presente"/activo y los valores por debajo del eje horizontal indican que las probabilidades de que el elemento TF esté "ausente"/pasivo son mayores que las probabilidades de que esté "presente"/activo. El modelo JAK-STAT1/2 de IFN tipo I predijo los niveles de actividad de la actividad JAK-STAT1/2 inducida por IFNy a un nivel de actividad más bajo en comparación con el modelo JAK-STAT1/2 calibrado con IFN tipo II. En el resultado de predicción del modelo JAK-STAT1/2 de IFN tipo II en la Figura 15, cuatro grupos, que se trataron con IFNy, se consideraron ser activos, mientras que aquí solo se considera activo un grupo, que son las células tratadas con IFNy durante 4 días (grupo 4), mientras que JAK-STAT1/2 se considera inactivo basándose en el modelo JAK-STAT1/2 de IFN tipo I para células que se trataron con IFNy durante 2 días (grupo 2), células que se trataron con Dox más IFNy durante 2 días (grupo 3) y células que se trataron con Dox más IFNy durante 4 días (grupo 5). Este es un buen ejemplo para demostrar que los modelos JAK-STAT1/2 calibrados por separado en modelos de células inducidas por IFN tipo I y tipo II, respectivamente, pueden distinguir entre la actividad STAT 1/2 inducida por IFN tipo I e IFN tipo II, respectivamente, porque los resultados del modelo JAK-STAT1/2 de IFN tipo II en la Figura 15 muestran niveles de actividad más altos para los grupos 2 a 5 que el modelo JAK-STAT1/2 de IFN tipo I en la Figura 17.
La Figura 18 muestra las predicciones de la actividad de la ruta de señalización celular JAK-STAT1/2 del modelo de red bayesiana de IFN tipo I a modo de ejemplo entrenado usando la lista de genes diana curada por evidencia (lista de 23 genes diana) de la Tabla 1. El modelo de red bayesiana JAK-STAT1/2 calibrado con IFN tipo I se aplicó al mismo conjunto de datos GSE11864 que en la Figura 16, representando tres grupos las mismas muestras. En el diagrama, el eje vertical indica las probabilidades de que el elemento TF esté "presente" respecto a "ausente", que corresponde a que la ruta de señalización celular de JAK-STAT1/2 esté activa respecto a pasiva, donde los valores por encima del eje horizontal corresponden a que el elemento TF es más probable que esté "presente"/activo y los valores por debajo del eje horizontal indican que las probabilidades de que el elemento TF esté "ausente"/pasivo son mayores que las probabilidades de que esté "presente"/activo. Mientras que el modelo JAK-STAT1/2 de IFN tipo I muestra claramente una actividad más alta en las muestras del grupo 3 en comparación con los grupos 1 y 2, una comparación de las puntuaciones de actividad de las muestras del grupo 3 entre el modelo de tipo I y el modelo de tipo II de la Figura 16 revela una puntuación de actividad más alta para el último modelo, indicando que las muestras del grupo 3 corresponden a una activación de IFN tipo II de JAK-STAT1/2.
Los resultados adicionales de la validación de los modelos de red bayesianos a modo de ejemplo entrenados usando la lista de genes diana curada por evidencia (lista de 23 genes diana) de la Tabla 1 y la lista corta de 9 genes diana de la Tabla 2 se muestran en las Figuras 19 y 20. En este caso, la lista de genes diana curada por evidencia (lista de 23 genes diana) de la Tabla 1 se compara con la lista corta de 9 genes diana de la Tabla 2 para los mismos conjuntos de datos tanto para el modelo JAK-STAT1/2 de IFN tipo I como para el modelo JAK-STAT1/2 de IFN tipo II.
La Figura 19 muestra la correlación entre el modelo de red bayesiano de IFN tipo I a modo de ejemplo entrenado usando la lista de genes diana curada por evidencia (lista de 23 genes diana) de la Tabla 1 y la lista corta de 9 genes diana de la Tabla 2, respectivamente. En el diagrama, el eje horizontal indica las probabilidades (en una escala log2) de que el elemento TF esté "presente" respecto a "ausente", que corresponde a que la ruta de señalización celular de JAK-STAT1/2 esté activa respecto a pasiva, como se predice por el modelo de red bayesiano de IFN tipo I a modo de ejemplo entrenado usando la lista de genes diana curada por evidencia (lista de 23 genes diana) de la Tabla 1. El eje vertical indica la misma información, como se predice por el modelo de red bayesiano de IFN tipo I a modo de ejemplo entrenado usando la lista de 9 genes diana de la Tabla 2 (conjuntos de datos GSE15743, GSE37750, GSE14386). Los dos modelos están significativamente correlacionados con un valor p de 2,2e-16 y un coeficiente de correlación de 0,988.
La Figura 20 muestra la correlación entre el modelo de red bayesiano de IFN tipo II a modo de ejemplo entrenado usando la lista de genes diana curada por evidencia (lista de 23 genes diana) de la Tabla 1 y la lista corta de 9 genes diana de la Tabla 2, respectivamente. En el diagrama, el eje horizontal indica las probabilidades (en una escala log2) de que el elemento TF esté "presente" respecto a "ausente", que corresponde a que la ruta de señalización celular de JAK-STAT1/2 esté activa respecto a pasiva, como se predice por el modelo de red bayesiano de IFN tipo II a modo de ejemplo entrenado usando la lista de genes diana curada por evidencia (lista de 23 genes diana) de la Tabla 1. El eje vertical indica la misma información, como se predice por el modelo de red bayesiano de IFN tipo I a modo de ejemplo entrenado usando la lista de 9 genes diana de la Tabla 2 (conjuntos de datos GSE58096, GSE11327, GSE11864). Los dos modelos están significativamente correlacionados con un valor p de 2,2e-16 y un coeficiente de correlación de 0,992.
Los resultados adicionales de la validación del modelo de red bayesiano a modo de ejemplo entrenado usando la lista de genes diana curada por evidencia (lista de 23 genes diana) de la Tabla 1 se muestran en la Figura 21. El diagrama muestra los resultados de un estudio clínico, en el cual los pacientes con melanoma metastásico se trataron con inmunoterapia MAGE-A3 (seis o más dosis del producto inmunoterapéutico) y se identificaron respondedores y no respondedores. De las 65 muestras que se incluyeron en el estudio, 9 muestras no fueron evaluables (NE), 22 muestras respondieron (R) y 34 muestras no respondieron (NR). En el diagrama, cada cuadro representa la distribución de la puntuación de actividad de la ruta STAT1/2 para cada grupo (NR, R, NR). Muestra que el grupo de respondedores (R) tiene una puntuación de la ruta STAT1/2 significativamente más alta en comparación con los no respondedores (NR). El grupo que fue no evaluable (NE) tiene una puntuación de la ruta STAT1/2 aún más baja.
En lugar de aplicar el modelo matemático calibrado, por ejemplo, el modelo de red bayesiana a modo de ejemplo, en datos de entrada de ARNm provenientes de micromatrices o secuenciación de ARN, puede ser beneficioso en aplicaciones clínicas desarrollar ensayos específicos para realizar las mediciones de la muestra, por ejemplo, en una plataforma integrada que usa qPCR para determinar los niveles de ARNm de genes diana. Las secuencias de ARN/ADN de los genes diana desvelados pueden usarse después para determinar qué cebadores y sondas seleccionar en dicha plataforma.
La validación de dicho ensayo dedicado puede realizarse usando el modelo matemático basado en micromatrices como modelo de referencia y verificando si el ensayo desarrollado da resultados similares en un conjunto de muestras de validación. Junto a un ensayo dedicado, esto también puede realizarse para construir y calibrar modelos matemáticos similares usando datos de secuenciación de ARN como medidas de entrada.
El conjunto de genes diana que mejor indican la actividad de la ruta de señalización celular específica, por ejemplo, las Tablas 1 y 2, basado en una investigación basada en secuenciación de micromatrices/ARN usando el modelo matemático calibrado, por ejemplo, el modelo de red bayesiana a modo de ejemplo, puede traducirse en un ensayo de PCR cuantitativa múltiplex para realizar en una muestra del sujeto y/o un ordenador para interpretar las medidas de expresión y/o inferir la actividad de la ruta de señalización celular de JAK-STAT1/2. Para desarrollar una prueba de este tipo (por ejemplo, una prueba aprobada por la FDA o una prueba exenta de CLIA en un laboratorio de servicio central o una prueba desarrollada en un laboratorio para uso exclusivo en investigación) para la actividad de la ruta de señalización celular, se requiere el desarrollo de un kit de prueba normalizado, que debe validarse clínicamente en ensayos clínicos para obtener la aprobación regulatoria.
La presente invención se refiere a un método implementado por ordenador para inferir la actividad de una ruta de señalización celular de JAK-STAT1/2 en un sujeto realizado por un dispositivo de procesamiento digital, en donde la inferencia se basa en los niveles de expresión de tres o más genes diana de la ruta de señalización celular de JAK-STAT1/2 medidos en una muestra del sujeto. La presente invención se refiere además a un aparato para inferir la actividad de una ruta de señalización celular de JAK-STAT1/2 en un sujeto que comprende un procesador digital configurado para realizar el método, a un medio de almacenamiento no transitorio para inferir la actividad de una ruta de señalización celular de JAK-STAT1/2 en un sujeto que almacena instrucciones que son ejecutables por un dispositivo de procesamiento digital para realizar el método, y a un programa informático para inferir la actividad de una ruta de señalización celular de JAK-STAT1/2 en un sujeto que comprende medios de código de programa para hacer que un dispositivo de procesamiento digital realice el método, cuando el programa informático se ejecuta en el dispositivo de procesamiento digital.
El método puede usarse, por ejemplo, en el diagnóstico de una actividad (anormal) de la ruta de señalización celular de JAK-STAT1/2, en el pronóstico basado en la actividad inferida de la ruta de señalización celular de JAK-STAT1/2, en la inscripción de un sujeto en un ensayo clínico basado en la actividad inferida de la ruta de señalización celular de JAK-STAT1/2, en la selección de la prueba o pruebas posteriores que se realizarán, en la selección de pruebas de diagnóstico complementarias, en sistemas de apoyo a la toma de decisiones clínicas, o similares. A este respecto, se hace referencia a la solicitud de patente internacional publicada WO 2013/011479 A2 ("Assessment of cellular signaling pathway activity using probabilistic modeling of target gene expression"), a la solicitud de patente internacional publicada WO 2014/102668 A2 ("Assessment of cellular signaling pathway activity using linear combination(s) of target gene expressions") y a Verhaegh W. et al., "Selection of personalized patient therapy through the use of knowledge-based computational models that identify tumor-driving signal transduction pathways", Cancer Research, Vol. 74, N.° 11, 2014, páginas 2936 a 2945, que describen estas aplicaciones con más detalle.
Ejemplo 4: Información adicional para ilustrar la presente invención
(1) Medir los niveles de expresión génica
Los datos derivados del conjunto único de genes diana descritos en el presente documento se usan además para inferir una actividad de la ruta de señalización celular de JAK-STAT1/2 usando los métodos descritos en el presente documento.
Los métodos para analizar los niveles de expresión génica en muestras extraídas se conocen generalmente. Por ejemplo, los métodos tales como transferencia Northern, el uso de PCR, PCR anidada, PCR cuantitativa en tiempo real (qPCR), RNA-seq o micromatrices, pueden usarse todos para derivar datos del nivel de expresión génica. Todos los métodos conocidos en la técnica para analizar la expresión génica de los genes diana se contemplan en el presente documento.
Los métodos para determinar el producto de expresión de un gen usando métodos basados en PCR pueden ser de uso particular. Para cuantificar el nivel de expresión génica mediante PCR, la cantidad de cada producto de PCR de interés se estima típicamente usando PCR cuantitativa en tiempo real (qPCR) convencional para medir la acumulación de productos de PCR en tiempo real después de cada ciclo de amplificación. Esto normalmente utiliza un indicador detectable, tal como un tinte intercalante, un tinte de unión al surco menor o una sonda fluorogénica mediante la cual la aplicación de luz excita al indicador a emitir fluorescencia y la fluorescencia resultante se detecta típicamente usando una cámara CCD o un sistema de detección de fotomultiplicador, tal como aquel desvelado en la patente de EE.UU. 6.713.297. En algunas realizaciones, las sondas usadas en la detección de productos de PCR en el ensayo de PCR cuantitativa en tiempo real (qPCR) pueden incluir un marcador fluorescente. Numerosos marcadores fluorescentes están disponibles en el mercado. Por ejemplo, Molecular Probes, Inc. (Eugene, Oreg.) vende una amplia diversidad de tintes fluorescentes. Los ejemplos no limitantes incluyen Cy5, Cy3, TAMRA, R6G, R110, ROX, JOE, FAM, Texas Red™ y Oregon Green™. Los marcadores fluorescentes adicionales pueden incluir sondas de doble extinción IDT ZEN con sondas de hidrólisis 5' tradicionales en ensayos de qPCR. Estas sondas pueden contener, por ejemplo, un tinte 5' FAM con cualquiera de un inactivador 3' TAMRA, un inactivador 3' Black Hole (BHQ, Biosearch Technologies) o un inactivador ZEN interno y un inactivador 3' lowa Black Fluorescent (IBFQ).
Los tintes fluorescentes útiles de acuerdo con la invención pueden unirse a cebadores oligonucleotídicos usando métodos bien conocidos en la técnica. Por ejemplo, una forma común de añadir un marcador fluorescente a un oligonucleótido es hacer reaccionar un éster de N-hidroxisuccinimida (NHS) del tinte con un grupo amino reactivo en la diana. Los nucleótidos pueden modificarse para que porten un grupo amino reactivo mediante, por ejemplo, inclusión de un grupo alil amina en la nucleobase. Se describe el marcaje mediante alil amina, por ejemplo, en las Pat. de EE.UU. N.° 5.476.928 y 5.958.691. Otros medios de marcaje fluorescente de nucleótidos, oligonucleótidos y polinucleótidos son bien conocidos por los expertos en la materia.
Otros enfoques fluorogénicos incluyen el uso de sistemas de detección genéricos tales como el tinte SYBR-green, que emite fluorescencia cuando se intercala con el ADN amplificado de cualquier producto de expresión génica como se describe en las Pat. de EE.UU. N.° 5.436.134 y 5.658.751.
Otro método útil para determinar los niveles de expresión de genes diana incluye RNA-seq, una poderosa herramienta analítica usada para análisis de transcriptomas, incluyendo la diferencia del nivel de expresión génica entre diferentes condiciones fisiológicas o cambios que ocurren durante el desarrollo o durante el curso de la progresión de la enfermedad.
Otro enfoque para determinar los niveles de expresión génica incluye el uso de micromatrices, por ejemplo, micromatrices de ARN y ADN, que son bien conocidas en la técnica. Las micromatrices pueden usarse para cuantificar la expresión de un gran número de genes simultáneamente.
(2) Flujo de trabajo generalizado para determinar la actividad de la señalización celular JAK-STAT1/2
En la Figura 3 se muestra un diagrama de flujo que ilustra a modo de ejemplo un proceso para inferir la actividad de la señalización celular de JAK-STAT1/2 a partir de una muestra aislada de un sujeto. En primer lugar, se aísla el ARNm de una muestra (11). Segundo, los niveles de expresión de ARNm de un conjunto único de al menos tres o más genes diana de JAK-STAT1/2, como se describe en el presente documento, se miden (12) usando métodos para medir la expresión génica que se conocen en la técnica. A continuación, se determina un nivel de actividad de un elemento (13) del factor de transcripción JAK-STAT1/2 (TF) usando un modelo de ruta matemático calibrado (14) que relaciona los niveles de expresión de los tres o más genes diana de JAK-STAT1/2 con el nivel de actividad del elemento TF de JAK-STAT1/2. Finalmente, la actividad de la ruta de señalización celular de JAK-STAT1/2 en el sujeto se infiere (15) basándose en el nivel de actividad determinado del elemento TF de JAK-STAT1/2 en la muestra del sujeto. Por ejemplo, se determina que la ruta de señalización celular de JAK-STAT1/2 está activa si la actividad está por encima de un cierto umbral y puede clasificarse como pasiva si la actividad cae por debajo de un cierto umbral.
(3) Modelo de ruta matemática calibrada
Como se contempla en el presente documento, los niveles de expresión del conjunto único de tres o más genes diana de JAK-STAT1/2 descritos en el presente documento se usan para determinar un nivel de actividad de un elemento de TF de JAK-STAT1/2 usando un modelo de ruta matemático calibrado como se describe adicionalmente en el presente documento. El modelo de ruta matemático calibrado relaciona los niveles de expresión de los tres o más genes diana de JAK-STAT1/ 2 con el nivel de actividad del elemento TF JAK-STAT1/2.
Como se contempla en el presente documento, el modelo de ruta matemática calibrada se basa en la aplicación de un modelo de ruta matemática. Por ejemplo, el modelo de ruta matemática calibrada puede basarse en un modelo probabilístico, por ejemplo, un modelo de red bayesiana o un modelo lineal o pseudo-lineal.
En una realización, el modelo de ruta matemática calibrada es un modelo probabilístico que incorpora relaciones probabilísticas condicionales que relacionan el elemento TF de JAK-STAT1/2 y los niveles de expresión de los tres o más genes diana de JAK-STAT1/2. En una realización, el modelo probabilístico es un modelo de red bayesiana.
En una realización alternativa, el modelo matemático de la ruta calibrada puede ser un modelo lineal o pseudo-lineal. En una realización, el modelo lineal o pseudo-lineal es un modelo de combinación lineal o pseudo-lineal como se describe adicionalmente en el presente documento.
En la Figura 4 se muestra un diagrama de flujo que ilustra a modo de ejemplo un proceso para generar un modelo de ruta matemático calibrado. Como una etapa inicial, se recopilan y normalizan los datos de entrenamiento para los niveles de expresión de ARNm. Los datos pueden recopilarse usando, por ejemplo, intensidades de conjuntos de sondas de micromatrices (101), valores de Cq de PCR en tiempo real (102), lecturas de RNAseq sin procesar (103) o modalidades de medición alternativas (104) conocidas en la técnica. Los datos del nivel de expresión sin procesar pueden normalizarse para cada método, respectivamente, por normalización usando un algoritmo de normalización, por ejemplo, análisis multimatriz robusto congelado (fRMA) o MAS5.0 (111), normalización a Cq promedio de genes de referencia (112), normalización de lecturas en lecturas/fragmentos por kilobase de transcripción por millón de lecturas mapeadas (RPKM/FPKM) (113) o normalización con genes/proteínas de referencia (114). Este procedimiento de normalización conduce a una intensidad de conjunto de sondas normalizada (121), valores de Cq normalizados (122), RPKM/FPKM normalizados (123) o medición normalizada (124) para cada método, respectivamente, que indican los niveles de expresión de genes diana dentro de las muestras de entrenamiento.
Una vez normalizados los datos de entrenamiento, se obtiene una ID o ID de muestra de entrenamiento (131) y los datos de entrenamiento de estas muestras específicas se obtienen de uno de los métodos para determinar la expresión génica (132). Los resultados finales de expresión génica de la muestra de entrenamiento se generan como datos de entrenamiento (133). Todos los datos de diversas muestras de entrenamiento se incorporan para calibrar el modelo (incluyendo, por ejemplo, umbrales, CPT, por ejemplo en el caso de la red probabilística o bayesiana, los pesos, por ejemplo, en el caso del modelo lineal o pseudo-lineal, etc.) (144). Además, los genes diana de la ruta y los nodos de medición (141) se usan para generar la estructura del modelo, por ejemplo, como se describe en la Figura 2 (142). La estructura del modelo resultante (143) de la ruta se incorpora luego con los datos de entrenamiento (133) para calibrar el modelo (144), en donde los niveles de expresión génica de los genes diana son indicativos de la actividad del elemento del factor de transcripción. Como resultado de la determinación del elemento TF en las muestras de entrenamiento, se genera un modelo de ruta calibrado (145), que asigna la actividad de la ruta de señalización celular JAK-STAT1/2 para una muestra de interés examinada posteriormente, por ejemplo de un sujeto con cáncer, basado en los niveles de expresión génica diana en las muestras de entrenamiento.
(4) Determinación del elemento TF
En la Figura 5 se muestra un diagrama de flujo que ilustra a modo de ejemplo un proceso para determinar un nivel de actividad de un elemento TF. Los datos de nivel de expresión (datos de prueba) (163) de una muestra extraída de un sujeto se introducen en el modelo de ruta matemática calibrada (145). El modelo de ruta matemática puede ser un modelo probabilístico, por ejemplo, un modelo de red bayesiana, un modelo lineal o un modelo pseudo-lineal.
El modelo de ruta matemática puede ser un modelo probabilístico, por ejemplo, un modelo de red bayesiana, basado en probabilidades condicionales que relacionan el elemento TF de JAK-STAT1/2 y los niveles de expresión de los tres o más genes diana de la ruta de señalización celular JAK-STAT1/2 medidos en la muestra del sujeto, o el modelo matemático puede basarse en una o más combinación o combinaciones lineales de los niveles de expresión de los tres o más genes diana de la ruta de señalización celular JAK-STAT1/2 medidos en la muestra del sujeto. En particular, la determinación de la actividad de la ruta de señalización celular de JAK-STAT1/2 puede realizarse como se describe en la solicitud de patente internacional publicada WO 2013/011479 A2 ("Assessment of cellular signaling pathway activity using probabilistic modeling of target gene expression"). En resumen, los datos se introducen en una llamada de motor de inferencia de red bayesiana (BN) (por ejemplo, una Toolbox BNT) (154). Esto conduce a un conjunto de valores para las probabilidades Bn marginales calculadas de todos los nodos en el BN (155). De estas probabilidades, se determina la probabilidad del nodo del factor de transcripción (TF) (156) y se establece el nivel de actividad del elemento TF (157).
Como alternativa, el modelo matemático puede ser un modelo lineal. Por ejemplo, puede usarse un modelo lineal como se describe en la solicitud de patente internacional publicada WO 2014/102668 A2 ("Assessment of cellular signaling pathway activity using linear combination(s) of target gene expression"). Pueden encontrarse detalles adicionales sobre el cálculo/la determinación de la actividad de la ruta de señalización celular usando modelos matemáticos de la expresión de genes diana en Verhaegh W .et al., "Selection of personalized patient therapy through the use of knowledge-based computational models that identify tumor-driving signal transduction pathways", Cancer Research, Vol. 74, N.° 11, 2014, páginas 2936 a 2945. En resumen, los datos se introducen en una puntuación combinada lineal ponderada calculada (w/c) (151). Esto conduce a un conjunto de valores para la puntuación de combinación lineal ponderada calculada (152). A partir de estas puntuaciones de combinación lineal ponderada, se determina la puntuación de combinación lineal ponderada del nodo del factor de transcripción (TF) (153) y se establece el nivel de actividad del elemento de TF (157).
(5) Procedimiento para observables discretizados
En la Figura 6 se muestra un diagrama de flujo que ilustra a modo de ejemplo un proceso para inferir la actividad de una ruta de señalización celular de JAK-STAT1/2 en un sujeto como un observable discretizado. En primer lugar, se extrae la muestra de prueba y se le asigna un ID de muestra de prueba (161). A continuación, se recopilan y normalizan los datos de prueba para los niveles de expresión de ARNm (162). Los datos de prueba pueden recopilarse usando los mismos métodos que se analizaron para las muestras de entrenamiento en la Figura 5, usando intensidades de conjuntos de sondas de micromatrices (101), valores de Cq de PCR en tiempo real (102), lecturas de RNAseq sin procesar (103) o modalidades de medición alternativas (104). Los datos del nivel de expresión sin procesar pueden normalizarse para cada método, respectivamente, por normalización usando un algoritmo, por ejemplo, fRMA o MAS5.0 (111), normalización a Cq promedio de genes de referencia (112), normalización de lecturas en RPKM/FPKM (113) y normalización con genes/proteínas de referencia (114). Este procedimiento de normalización conduce a una intensidad de conjunto de sondas normalizada (121), valores de Cq normalizados (122), RPKM/FPKM normalizados (123) o medición normalizada (124) para cada método, respectivamente.
Una vez normalizados los datos de prueba, los datos de prueba resultantes (163) se analizan en una etapa umbral (164) basada en el modelo de ruta matemático calibrado (145), dando como resultado los datos de prueba con umbral (165). Al usar observables discretos, en un ejemplo no limitante, cada expresión por encima de un cierto umbral es, por ejemplo, dado un valor de 1 y los valores por debajo del umbral reciben un valor de 0, o en una realización alternativa, la masa de probabilidad por encima del umbral como se describe en el presente documento se usa como valor umbral. Basado en el modelo de ruta matemática calibrada, este valor representa el nivel de actividad del elemento TF (157), que después se usa para calcular la actividad de la ruta de señalización celular (171). La salida final da la actividad de la ruta de señalización celular (172) en el sujeto.
(6) Procedimiento para observables continuos
En la Figura 7 se muestra un diagrama de flujo que ilustra a modo de ejemplo un proceso para inferir la actividad de una ruta de señalización celular de JAK-STAT1/2 en un sujeto como un observable continuo. En primer lugar, se extrae la muestra de prueba y se le asigna un ID de muestra de prueba (161). A continuación, se recopilan y normalizan los datos de prueba para los niveles de expresión de ARNm (162). Los datos de prueba pueden recopilarse usando los mismos métodos que se analizaron para las muestras de entrenamiento en la Figura 5, usando intensidades de conjuntos de sondas de micromatrices (101), valores de Cq de PCR en tiempo real (102), lecturas de RNAseq sin procesar (103) o modalidades de medición alternativas (104). Los datos del nivel de expresión sin procesar pueden normalizarse para cada método, respectivamente, por normalización usando un algoritmo, por ejemplo, fRMA (111), normalización a Cq promedio de genes de referencia (112), normalización de lecturas en RPKM/FPKM (113) y normalización con respecto a genes/proteínas de referencia (114). Este procedimiento de normalización conduce a una intensidad de conjunto de sondas normalizada (121), valores de Cq normalizados (122), RPKM/FPKM normalizados (123) o medición normalizada (124) para cada método, respectivamente.
Una vez normalizados los datos de prueba, los datos de prueba resultantes (163) se analizan en el modelo de ruta matemático calibrado (145). Al usar observables continuos, como un ejemplo no limitante, los niveles de expresión se convierten en valores entre 0 y 1 usando una función sigmoidea como se describe con más detalle en el presente documento. La determinación del elemento TF como se describe en el presente documento se usa para interpretar los datos de prueba en combinación con el modelo de ruta matemática calibrada, el valor resultante representa el nivel de actividad del elemento TF (157), que después se usa para calcular la actividad de la ruta de señalización celular (171). La salida final da la actividad de la ruta de señalización celular (172) en el sujeto.
(7) Procedimiento de determinación del nivel de expresión del gen diana
En la Figura 8 se muestra un diagrama de flujo a modo de ejemplo que ilustra un proceso para derivar los niveles de expresión del gen diana a partir de una muestra extraída de un sujeto. En una realización a modo de ejemplo, las muestras se reciben y se registran en un laboratorio. Las muestras pueden incluir, por ejemplo, muestras fijadas en formalina, embebidas en parafina (FFPE) (181) o muestras frescas congeladas (FF) (180). Las muestras de FF pueden lisarse directamente (183). Para muestras FFPE, la parafina puede retirarse con una etapa de incubación calentada tras la adición de Proteinasa K (182). Después, las células se lisan (183), lo que destruye las membranas celulares y nucleares, lo que hace que el ácido nucleico (AN) esté disponible para su procesamiento posterior. El ácido nucleico está unido a una fase sólida (184) que podría, por ejemplo, ser perlas o un filtro. Después el ácido nucleico se lava con tampones de lavado para retirar todos los restos celulares que están presentes después de la lisis (185). A continuación, el ácido nucleico limpio se separa de la fase sólida con un tampón de elución (186). El ADN se elimina mediante un tratamiento con DNAsa para garantizar que solo haya ARN presente en la muestra (187). La muestra de ácido nucleico puede usarse directamente en la mezcla de muestras RT-qPCR (188). Las mezclas de muestras de RT-qPCR contienen la muestra de ARN, la enzima RT para preparar ADNc a partir de la muestra de ARN y una enzima de PCR para amplificar el ADNc, una solución tampón para asegurar el funcionamiento de las enzimas y potencialmente puede contener agua de calidad molecular para establecer un volumen fijo de concentración. La mezcla de muestra puede añadirse a una placa de pocillos múltiples (es decir, una placa de 96 pocillos o de 384 pocillos) que contiene ensayos de RT-qPCR secos (189). El RT-qPCR puede ejecutarse en una máquina de PCR de acuerdo con un protocolo específico (190). Un ejemplo de protocolo de PCR incluye i) 30 minutos a 50 °C; ii) 5 minutos a 95 °C; iii) 15 segundos a 95 °C; iv) 45 segundos a 60 °C; v) 50 ciclos repitiendo las etapas iii y iv. Los valores de Cq se determinan después con los datos brutos usando el método de la segunda derivada (191). Los valores de Cq se exportan para su análisis (192).
(8) Enfermedades y trastornos mediados por JAK-STAT1/2 y métodos de tratamiento
Como se contempla en el presente documento, los métodos y aparatos de la presente invención pueden usarse para evaluar la actividad de la ruta de señalización celular de JAK-STAT1/2 en un sujeto, por ejemplo, un sujeto sospechoso de tener, o que tiene, una enfermedad o trastorno en el que el estado de la ruta de señalización del JAK-STAT1/2 es probatorio, ya sea total o parcialmente, de la presencia o progresión de la enfermedad. En una realización, se proporciona en el presente documento un método para tratar a un sujeto que comprende recibir información sobre el estado de actividad de una ruta de señalización celular de JAK-STAT1/2 derivada de una muestra extraída del sujeto usando los métodos descritos en el presente documento y administrar al sujeto un inhibidor de JAK-STAT1/2 si la información con respecto a la actividad de la ruta de señalización celular de JAK-STAT1/2 es indicativa de una ruta de señalización de JAK-STAT1/2 activa. En una realización particular, la indicación de actividad de la ruta de señalización celular de JAK-STAT1/2 se establece en un valor de corte de probabilidades de que la ruta de señalización celular de JAK-STAT1/2 esté activa de 10:1, 5:1, 4:1, 2:1, 1:1, 1:2, 1:4, 1:5, 1:10.
La ruta JAK-STAT1/2 juega un papel en una gran cantidad de enfermedades, tales como en diversos tipos de cáncer como, por ejemplo, cáncer gastroesofágico, Carcinoma hepatocelular, carcinoma de pulmón y cáncer gástrico, y otros tipos de cáncer y subtipos de cáncer que tienen una ruta de señalización JAK-STAT1/2 activa como ruta de conducción del cáncer, en enfermedades mediadas por el sistema inmunitario como enfermedad inflamatoria intestinal, artritis reumatoide, psoriasis, LES, esclerosis múltiple, etcétera, y en enfermedades inflamatorias como asma, ateroesclerosis, diabetes, enfermedades psiquiátricas como depresión y esquizofrenia, acné, endometriosis, etcétera. Con tales enfermedades, se espera que la medición del perfil de actividad de la ruta JAK-STAT1/2 en tipos de células inmunitarias en tejidos y sangre sea útil para diagnosticar, subtipificar y predecir y/o monitorizar la respuesta a terapia inmunomoduladora, especialmente inmunosupresora e inmunosupresora dirigida, y monitorización del estado de la respuesta inmunitaria. La predicción de la respuesta a los fármacos puede usarse para hacer coincidir un fármaco de la ruta anti-STAT1/2 con un paciente. Por ejemplo, pravastatina fármaco anti-STAT1 como tratamiento para la esquizofrenia (ensayo clínico de fase IV), preeclampsia (Fase I), hiperlipidemia (Fase I/M/IM/IV), cirrosis (Fase II/III), cáncer gastroesofágico (Fase IV), leucemia mieloide (Fase I/II), neumonía (Fase 0), Tofacitinib para el tratamiento de la artritis reumatoide (Fase I/II/III), artritis idiopática juvenil (Fase I/II/III), psoriasis (Fase I/II/III), espondilitis anquilosante (Fase II), queratoconjuntivitis seca (Fase II), colitis ulcerosa (Fase III), AZD para el tratamiento del Carcinoma hepatocelular, carcinoma de pulmón y cáncer gástrico (Fase I), trombocitemia esencial, mielofibrosis y pospolicitemia vera (Fase I), y señuelo de oligodesoxinucleótidos para el

Claims (15)

REIVINDICACIONES
1. Un método implementado por ordenador para inferir la actividad de una ruta de señalización celular de JAK-STAT1/2 en un sujeto, realizado por un dispositivo de procesamiento digital, en donde la inferencia comprende: recibir niveles de expresión de tres o más genes diana de la ruta de señalización celular de JAK-STAT1/2 medidos en una muestra del sujeto,
determinar un nivel de actividad de un elemento de factor de transcripción (TF) JAK-STAT1/2 en la muestra del sujeto, controlando el elemento TF JAK-STAT1/2 la transcripción de los tres o más genes diana JAK-STAT1/2, basándose la determinación en la evaluación de un modelo de ruta matemático calibrado que relaciona los niveles de expresión de los tres o más genes diana de JAK-STAT1/2 con el nivel de actividad del elemento TF JAK-STAT1/2 y
inferir la actividad de la ruta de señalización celular JAK-STAT1/2 en el sujeto basándose en el nivel de actividad determinado del elemento TF JAK-STAT1/2 en la muestra del sujeto,
en donde los tres o más genes diana de JAK-STAT1/2 se seleccionan del grupo que consiste en: BID, GNAZ, IRF1, IRF7, IRF8, IRF9, LGALS1, NCF4, NFAM1, OAS1, PDCD1, RAB36, RBX1, RFPL3, SAMM50, SMARCB1, SSTR3, ST13, STAT1, TRMT1, UFD1L, USP18 y ZNRF3, preferentemente, del grupo que consiste en: IRF1, IRF7, IRF8, IRF9, OAS1, PDCD1, ST13, STAT1 y USP18,
en el que se infiere que la actividad de la ruta de señalización celular JAK-STAT1/2 es actividad de IFN tipo I o bien actividad de IFN tipo II mediante el uso de dos modelos de ruta matemática calibrados, uno de los cuales se calibra en la actividad de IFN de tipo I y el otro en actividad de IFN tipo II.
2. El método de la reivindicación 1, en donde los tres o más genes diana JAK-STAT1/2 comprenden seis o más genes diana JAK-STAT1/2 seleccionados del grupo que consiste en: IRF1, IRF7, IRF8, IRF9, OAS1, PDCD1, ST13, STAT1 y USP18.
3. El método de la reivindicación 1 o 2, que comprende, además:
determinar si la ruta de señalización celular JAK-STAT1/2 está funcionando anormalmente en el sujeto basándose en la actividad inferida de la ruta de señalización celular JAK-STAT1/2 en el sujeto.
4. El método de la reivindicación 3, que comprende, además:
recomendar la prescripción de un fármaco para el sujeto que corrige el funcionamiento anormal de la ruta de señalización celular JAK-STAT1/2,
en donde la recomendación se realiza si se determina que la ruta de señalización celular JAK-STAT1/2 funciona de forma anormal en el sujeto basándose en la actividad inferida de la ruta de señalización celular JAK-STAT1/2.
5. El método de la reivindicación 3 o 4, en donde el funcionamiento anormal de la ruta de señalización celular JAK-STAT1/2 es una función en la que la ruta de señalización celular JAK-STAT1/2 funciona como un promotor tumoral en el sujeto.
6. El método de cualquiera de las reivindicaciones 1 a 5, que comprende además predecir una respuesta del sujeto a una inmunoterapia con antígeno tumoral basada en la actividad inferida de la ruta de señalización celular JAK-STAT1/2.
7. El método de cualquiera de las reivindicaciones 1 a 6, en donde el método se usa en al menos una de las siguientes actividades:
diagnóstico basado en la actividad inferida de la ruta de señalización celular de JAK-STAT1/2 en el sujeto; pronóstico basado en la actividad inferida de la ruta de señalización celular de JAK-STAT1/2 en el sujeto; prescripción de fármacos basada en la actividad inferida de la ruta de señalización celular de JAK-STAT1/2 en el sujeto;
predicción de la efectividad del fármaco basada en la actividad inferida de la ruta de señalización celular de JAK-STAT1/2 en el sujeto;
predicción de efectos adversos basada en la actividad inferida de la ruta de señalización celular de JAK-STAT1/2 en el sujeto;
monitorización de la efectividad de fármacos;
desarrollo de fármacos;
desarrollo de ensayos;
investigación de rutas;
estadificación del cáncer;
inscripción del sujeto en un ensayo clínico basado en la actividad inferida de la ruta de señalización celular de JAK-STAT1/2 en el sujeto;
selección de la prueba posterior a realizar; y
selección de pruebas de diagnóstico complementario.
8. El método de cualquiera de las reivindicaciones 1 a 7, en donde el modelo calibrado de ruta matemática es un modelo probabilístico, preferentemente un modelo de red bayesiana, basado en probabilidades condicionales que relacionan el nivel de actividad del elemento TF JAK-STAT1/2 y los niveles de expresión de los tres o más genes diana de JAK-STAT1/2, o en donde el modelo de ruta matemática se basa en una o más combinación o combinaciones lineales de la expresión niveles de los tres o más genes diana de JAK-STAT1/2.
9. Un aparato para inferir la actividad de una ruta de señalización celular de JAK-STAT1/2 en un sujeto que comprende un procesador digital configurado para realizar el método de cualquiera de las reivindicaciones 1 a 8.
10. Un medio de almacenamiento no transitorio para inferir la actividad de una ruta de señalización celular de JAK-STAT1/2 en un sujeto almacenando instrucciones que son ejecutables por un dispositivo de procesamiento digital para realizar el método de cualquiera de las reivindicaciones 1 a 8.
11. Un programa informático para inferir la actividad de una ruta de señalización celular de JAK-STAT1/2 en un sujeto que comprende medios de código de programa para hacer que un dispositivo de procesamiento digital realice el método de cualquiera de las reivindicaciones 1 a 8, cuando el programa informático se ejecuta en el dispositivo de procesamiento digital.
12. Un kit para medir los niveles de expresión de tres o más genes diana de la ruta de señalización celular JAK-STAT1/2 en una muestra de un sujeto, que comprende:
cebadores de reacción en cadena de la polimerasa dirigidos a los tres o más genes diana JAK-STAT1/2, sondas dirigidas a los tres o más genes diana JAK-STAT1/2 y
el aparato de la reivindicación 9, el medio de almacenamiento no transitorio de la reivindicación 10 o el programa informático de la reivindicación 11,
en donde los tres o más genes diana de JAK-STAT1/2 se seleccionan del grupo que consiste en: BID, GNAZ, IRF1, IRF7, IRF8, IRF9, LGALS1, NCF4, NFAM1, OAS1, PDCD1, RAB36, RBX1, RFPL3, SAMM50, SMARCB1, SSTR3, ST13, STAT1, TRMT1, UFD1L, USP18 y ZNRF3, preferentemente, del grupo que consiste en: IRF1, IRF7, IRF8, IRF9, OAS1, PDCD1, ST13, STAT1 y USP18.
13. Un kit para inferir la actividad de una ruta de señalización celular de JAK-STAT1/2 en un sujeto, que comprende: uno o más componentes para determinar los niveles de expresión de tres o más genes diana de la ruta de señalización celular de JAK-STAT1/2 en una muestra del sujeto y
el aparato de la reivindicación 9, el medio de almacenamiento no transitorio de la reivindicación 10 o el programa informático de la reivindicación 11,
en donde el uno o más componentes se seleccionan preferentemente del grupo que consiste en: un chip de matriz de ADN, un chip de matriz de oligonucleótidos, un chip de matriz de proteínas, un anticuerpo, una pluralidad de sondas, por ejemplo, sondas marcadas, un conjunto de componentes de secuenciación de transcriptasa inversa de ARN, y/o ARN o ADN, incluyendo ADNc, cebadores de amplificación,
en donde los tres o más genes diana de JAK-STAT1/2 se seleccionan del grupo que consiste en: BID, GNAZ, IRF1, IRF7, IRF8, IRF9, LGALS1, NCF4, NFAM1, OAS1, PDCD1, RAB36, RBX1, RFPL3, SAMM50, SMARCB1, SSTR3, ST13, STAT1, TRMT1, UFD1L, USP18 y ZNRF3, preferentemente, del grupo que consiste en: IRF1, IRF7, IRF8, IRF9, OAS1, PDCD1, ST13, STAT1 y USP18.
14. El kit de cualquiera de las reivindicaciones 12 y 13, en donde los tres o más genes diana JAK-STAT1/2 comprenden seis o más genes diana JAK-STAT1/2 seleccionados del grupo que consiste en: IRF1, IRF7, IRF8, IRF9, OAS1, PDCD1, ST13, STAT1 y USP18.
15. Uso del kit de una cualquiera de las reivindicaciones 12 a 14 para realizar el método de cualquiera de las reivindicaciones 1 a 8.
ES18773226T 2017-10-02 2018-09-27 Evaluación de la actividad de la ruta de señalización celular de JAK-STAT1/2 usando modelos matemáticos de la expresión de genes diana Active ES2868887T3 (es)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
EP17194291.5A EP3461915A1 (en) 2017-10-02 2017-10-02 Assessment of jak-stat1/2 cellular signaling pathway activity using mathematical modelling of target gene expression
PCT/EP2018/076334 WO2019068562A1 (en) 2017-10-02 2018-09-27 EVALUATION OF THE ACTIVITY OF THE JAK-STAT1 / 2 CELL SIGNALING PATH USING MATHEMATICAL MODELING OF A TARGET GENE EXPRESSION

Publications (1)

Publication Number Publication Date
ES2868887T3 true ES2868887T3 (es) 2021-10-22

Family

ID=60037387

Family Applications (1)

Application Number Title Priority Date Filing Date
ES18773226T Active ES2868887T3 (es) 2017-10-02 2018-09-27 Evaluación de la actividad de la ruta de señalización celular de JAK-STAT1/2 usando modelos matemáticos de la expresión de genes diana

Country Status (8)

Country Link
US (1) US11649488B2 (es)
EP (2) EP3461915A1 (es)
JP (1) JP6931125B2 (es)
CN (1) CN111479933A (es)
CA (1) CA3078278A1 (es)
DK (1) DK3692173T3 (es)
ES (1) ES2868887T3 (es)
WO (1) WO2019068562A1 (es)

Families Citing this family (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP3882363A1 (en) 2020-03-17 2021-09-22 Koninklijke Philips N.V. Prognostic pathways for high risk sepsis patients
EP3978628A1 (en) 2020-10-01 2022-04-06 Koninklijke Philips N.V. Prognostic pathways for viral infections
EP4136261A1 (en) 2020-04-16 2023-02-22 InnoSIGN B.V. Prognostic pathways for viral infections
EP3940704A1 (en) * 2020-07-14 2022-01-19 Koninklijke Philips N.V. Method for determining the differentiation state of a stem cell
EP3960875A1 (en) 2020-08-28 2022-03-02 Koninklijke Philips N.V. Pcr method and kit for determining pathway activity
EP3974540A1 (en) 2020-09-25 2022-03-30 Koninklijke Philips N.V. Method for predicting immunotherapy resistance
EP4015651A1 (en) 2020-12-17 2022-06-22 Koninklijke Philips N.V. Treatment prediction and effectiveness of anti-tnf alpha treatment in ibd patients
EP4039825A1 (en) 2021-02-09 2022-08-10 Koninklijke Philips N.V. Comparison and standardization of cell and tissue culture
JP2024514404A (ja) 2021-03-11 2024-04-02 コーニンクレッカ フィリップス エヌ ヴェ 高リスク敗血症患者のための予後経路

Family Cites Families (51)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4711955A (en) 1981-04-17 1987-12-08 Yale University Modified nucleotides and methods of preparing and using same
US6004761A (en) 1986-11-19 1999-12-21 Sanofi Method for detecting cancer using monoclonal antibodies to new mucin epitopes
US5660985A (en) 1990-06-11 1997-08-26 Nexstar Pharmaceuticals, Inc. High affinity nucleic acid ligands containing modified nucleotides
US5436134A (en) 1993-04-13 1995-07-25 Molecular Probes, Inc. Cyclic-substituted unsymmetrical cyanine dyes
US5658751A (en) 1993-04-13 1997-08-19 Molecular Probes, Inc. Substituted unsymmetrical cyanine dyes with selected permeability
US6720149B1 (en) 1995-06-07 2004-04-13 Affymetrix, Inc. Methods for concurrently processing multiple biological chip assays
US5545531A (en) 1995-06-07 1996-08-13 Affymax Technologies N.V. Methods for making a device for concurrently processing multiple biological chip assays
US6146897A (en) 1995-11-13 2000-11-14 Bio-Rad Laboratories Method for the detection of cellular abnormalities using Fourier transform infrared spectroscopy
US6391550B1 (en) 1996-09-19 2002-05-21 Affymetrix, Inc. Identification of molecular sequence signatures and methods involving the same
NZ516848A (en) 1997-06-20 2004-03-26 Ciphergen Biosystems Inc Retentate chromatography apparatus with applications in biology and medicine
DE69823206T2 (de) 1997-07-25 2004-08-19 Affymetrix, Inc. (a Delaware Corp.), Santa Clara Verfahren zur herstellung einer bio-informatik-datenbank
US6953662B2 (en) 1997-08-29 2005-10-11 Human Genome Sciences, Inc. Follistatin-3
US6020135A (en) 1998-03-27 2000-02-01 Affymetrix, Inc. P53-regulated genes
US6884578B2 (en) 2000-03-31 2005-04-26 Affymetrix, Inc. Genes differentially expressed in secretory versus proliferative endometrium
US6783934B1 (en) 2000-05-01 2004-08-31 Cepheid, Inc. Methods for quantitative analysis of nucleic acid amplification reaction
CN1262337C (zh) 2000-11-16 2006-07-05 赛弗根生物***股份有限公司 质谱分析方法
AU2002314715B2 (en) 2001-02-16 2006-07-27 Ciphergen Biosystems, Inc. Method for correlating gene expression profiles with protein expression profiles
JP2005519624A (ja) 2002-03-13 2005-07-07 ジェノミック ヘルス, インコーポレイテッド 生検腫瘍組織での遺伝子発現プロファイリング
US7097976B2 (en) 2002-06-17 2006-08-29 Affymetrix, Inc. Methods of analysis of allelic imbalance
JP4606879B2 (ja) 2002-11-15 2011-01-05 ジェノミック ヘルス, インコーポレイテッド Egfr陽性癌の遺伝子発現プロファイリング
US20040231909A1 (en) 2003-01-15 2004-11-25 Tai-Yang Luh Motorized vehicle having forward and backward differential structure
PL3470535T3 (pl) 2003-06-24 2020-08-24 Genomic Health, Inc. Prognozowanie prawdopodobieństwa ponownego wystąpienia raka
US7526387B2 (en) 2003-07-10 2009-04-28 Genomic Health, Inc. Expression profile algorithm and test for cancer prognosis
JP2005176804A (ja) 2003-12-24 2005-07-07 Japan Health Science Foundation Stat3の活性化能を指標とする肝疾患治療剤のスクリーニング法
CA3061785A1 (en) 2004-11-05 2006-05-18 Genomic Health, Inc. Predicting response to chemotherapy using gene expression markers
CA2602951A1 (en) 2005-03-23 2006-09-28 Bio-Rad Laboratories, Inc. Diverse chemical libraries bound to small particles with paramagnetic properties
US7919261B2 (en) 2005-12-05 2011-04-05 Merck Sharp & Dohme Corp. Methods for predicting treatment response based on the expression profiles of protein and transcription biomarkers
KR100806274B1 (ko) 2005-12-06 2008-02-22 한국전자통신연구원 멀티 쓰레디드 프로세서 기반의 병렬 시스템을 위한 적응형실행 방법
JP5297202B2 (ja) 2006-01-11 2013-09-25 ジェノミック ヘルス, インコーポレイテッド 結腸直腸癌の予後のための遺伝子発現マーカー
US7888019B2 (en) 2006-03-31 2011-02-15 Genomic Health, Inc. Genes involved estrogen metabolism
US8518639B2 (en) 2006-04-11 2013-08-27 Bio-Rad Innovations HPV detection and quantification by real-time multiplex amplification
CA2706881A1 (en) 2007-11-30 2009-06-11 Brian Z. Ring Tle3 as a marker for chemotherapy
WO2009114836A1 (en) 2008-03-14 2009-09-17 Genomic Health, Inc. Gene expression markers for prediction of patient response to chemotherapy
GB2477705B (en) 2008-11-17 2014-04-23 Veracyte Inc Methods and compositions of molecular profiling for disease diagnostics
US8765383B2 (en) 2009-04-07 2014-07-01 Genomic Health, Inc. Methods of predicting cancer risk using gene expression in premalignant tissue
WO2011014697A1 (en) 2009-07-31 2011-02-03 The Translational Genomics Research Institute Methods of assessing a risk of cancer progression
US8451450B2 (en) 2009-09-14 2013-05-28 Bio-Rad Laboratories, Inc. Near real time optical phase conjugation
WO2011146619A2 (en) 2010-05-19 2011-11-24 The Regents Of The University Of California Systems and methods for identifying drug targets using biological networks
US8703736B2 (en) 2011-04-04 2014-04-22 The Translational Genomics Research Institute Therapeutic target for pancreatic cancer cells
US20130042333A1 (en) * 2011-05-06 2013-02-14 Jean-Gabriel JUDDE Markers for cancer prognosis and therapy and methods of use
KR20140044341A (ko) 2011-06-02 2014-04-14 알막 다이아그노스틱스 리미티드 암에 대한 분자적 진단 검사
EP2549399A1 (en) 2011-07-19 2013-01-23 Koninklijke Philips Electronics N.V. Assessment of Wnt pathway activity using probabilistic modeling of target gene expression
MX366164B (es) 2012-01-31 2019-07-01 Genomic Health Inc Algoritmo de perfil de expresion genica y prueba para determinar la prognosis de cancer de prostata.
US10081838B2 (en) 2012-05-03 2018-09-25 Qiagen Sciences, Llc Gene expression signature for IL-6/STAT3 signaling pathway and use thereof
RU2721130C2 (ru) * 2012-12-26 2020-05-18 Конинклейке Филипс Н.В. Оценка активности путей клеточной сигнализации с помощью линейной комбинации(ий) экспрессий генов-мишеней
KR102256141B1 (ko) 2013-04-26 2021-05-27 코닌클리케 필립스 엔.브이. 다수의 세포 신호전달 경로 활성을 이용하는 치료 반응의 의학적 예후 및 예측
WO2015050844A1 (en) 2013-10-01 2015-04-09 Dana-Farber Cancer Institute, Inc. Methods of treating cancer with atovaquone-related compounds
JP6077178B2 (ja) * 2014-01-03 2017-02-08 コーニンクレッカ フィリップス エヌ ヴェKoninklijke Philips N.V. 標的遺伝子発現の数学的モデリングを用いるpi3k細胞内シグナル伝達経路活性の評価
JP6704861B2 (ja) 2014-06-16 2020-06-03 ワールドワイド・イノベイティブ・ネットワークWorldwide Innovative Network 癌処置のための個別化三剤治療を選択するための方法
EP3210144B1 (en) * 2014-10-24 2020-10-21 Koninklijke Philips N.V. Medical prognosis and prediction of treatment response using multiple cellular signaling pathway activities
AU2015334840B2 (en) * 2014-10-24 2021-10-21 Innosign B.V. Assessment of TGF-beta cellular signaling pathway activity using mathematical modelling of target gene expression

Also Published As

Publication number Publication date
JP2020535822A (ja) 2020-12-10
EP3461915A1 (en) 2019-04-03
JP6931125B2 (ja) 2021-09-01
EP3692173A1 (en) 2020-08-12
CA3078278A1 (en) 2019-04-11
US11649488B2 (en) 2023-05-16
US20190100795A1 (en) 2019-04-04
CN111479933A (zh) 2020-07-31
DK3692173T3 (da) 2021-05-31
WO2019068562A1 (en) 2019-04-11
EP3692173B1 (en) 2021-03-31

Similar Documents

Publication Publication Date Title
ES2868887T3 (es) Evaluación de la actividad de la ruta de señalización celular de JAK-STAT1/2 usando modelos matemáticos de la expresión de genes diana
US20220259666A1 (en) Assessment of the p13k cellular signaling pathway activity using mathematical modelling of target gene expression
ES2833543T3 (es) Evaluación de la actividad de la ruta de señalización celular de TGF usando modelos matemáticos de la expresión de genes diana
ES2861400T3 (es) Evaluación de la actividad de la ruta de señalización celular de NFkB usando modelos matemáticos de la expresión de genes diana
EP3729439B1 (en) Assessment of mapk-ap 1 cellular signaling pathway activity using mathematical modelling of target gene expression
EP3692172B1 (en) Assessment of jak-stat3 cellular signaling pathway activity using mathematical modelling of target gene expression
EP3462349A1 (en) Assessment of notch cellular signaling pathway activity using mathematical modelling of target gene expression
BR112020006605A2 (pt) método para determinar o status funcional de ao menos um tipo de célula imune em ao menos uma amostra de um indivíduo, método para determinar o status de atividade do sistema imune inato ou adaptativo de um indivíduo, método para determinar o status de atividade do sistema imune global de um indivíduo, aparelho, mídia de armazenamento não transitório, programa de computador e kit
WO2020260226A1 (en) Identification of the cellular function of an active nfkb pathway