ES2838923T3 - Pronóstico médico y predicción de la respuesta a tratamiento usando múltiples actividades de la ruta de señalización celular - Google Patents

Pronóstico médico y predicción de la respuesta a tratamiento usando múltiples actividades de la ruta de señalización celular Download PDF

Info

Publication number
ES2838923T3
ES2838923T3 ES15785100T ES15785100T ES2838923T3 ES 2838923 T3 ES2838923 T3 ES 2838923T3 ES 15785100 T ES15785100 T ES 15785100T ES 15785100 T ES15785100 T ES 15785100T ES 2838923 T3 ES2838923 T3 ES 2838923T3
Authority
ES
Spain
Prior art keywords
pathway
target genes
tgf
activity
risk
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
ES15785100T
Other languages
English (en)
Inventor
Ooijen Hendrik Jan Van
Brussel Anne Godefrida Catharina Van
Janneke Wrobel
Strijp Dianne Arnoldina Margaretha Wilhelmina Van
Gog Robert Van
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Koninklijke Philips NV
Original Assignee
Koninklijke Philips NV
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Koninklijke Philips NV filed Critical Koninklijke Philips NV
Application granted granted Critical
Publication of ES2838923T3 publication Critical patent/ES2838923T3/es
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B5/00ICT specially adapted for modelling or simulations in systems biology, e.g. gene-regulatory networks, protein interaction networks or metabolic networks
    • G16B5/20Probabilistic models
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6809Methods for determination or identification of nucleic acids involving differential detection
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6883Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
    • C12Q1/6886Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material for cancer
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
    • G16B20/20Allele or variant detection, e.g. single nucleotide polymorphism [SNP] detection
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
    • G16B20/30Detection of binding sites or motifs
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B25/00ICT specially adapted for hybridisation; ICT specially adapted for gene or protein expression
    • G16B25/10Gene or protein expression profiling; Expression-ratio estimation or normalisation
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B5/00ICT specially adapted for modelling or simulations in systems biology, e.g. gene-regulatory networks, protein interaction networks or metabolic networks
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/20ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for computer-aided diagnosis, e.g. based on medical expert systems
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/30ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for calculating health indices; for individual health risk assessment
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/158Expression markers
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/16Primer sets for multiplex assays

Landscapes

  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Physics & Mathematics (AREA)
  • Chemical & Material Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Health & Medical Sciences (AREA)
  • Medical Informatics (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Genetics & Genomics (AREA)
  • Molecular Biology (AREA)
  • Biotechnology (AREA)
  • Biophysics (AREA)
  • Analytical Chemistry (AREA)
  • Organic Chemistry (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Theoretical Computer Science (AREA)
  • Evolutionary Biology (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Wood Science & Technology (AREA)
  • Zoology (AREA)
  • Pathology (AREA)
  • Public Health (AREA)
  • Immunology (AREA)
  • Biomedical Technology (AREA)
  • Biochemistry (AREA)
  • Microbiology (AREA)
  • General Engineering & Computer Science (AREA)
  • Primary Health Care (AREA)
  • Epidemiology (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Physiology (AREA)
  • Oncology (AREA)
  • Hospice & Palliative Care (AREA)
  • Probability & Statistics with Applications (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Apparatus Associated With Microorganisms And Enzymes (AREA)
  • Investigating Or Analysing Biological Materials (AREA)
  • Algebra (AREA)

Abstract

Un método implementado por ordenador para determinar una puntuación de riesgo que indica un riesgo de que un sujeto experimente un evento clínico asociado con una enfermedad dentro de un período de tiempo definido realizado por un dispositivo de procesamiento digital, en donde la determinación comprende: inferir la actividad de cada una de dos o más rutas de señalización celular en el sujeto basándose en la evaluación de un modelo de ruta matemática calibrada que relaciona los niveles de expresión de tres o más genes diana de la ruta de señalización celular respectiva medida en una muestra del sujeto con un nivel de actividad de los respectivos elemento(s) del factor de transcripción (TF) de la ruta de señalización celular respectiva en la muestra del sujeto, el elemento o elementos de TF controlan la transcripción de los tres o más genes diana de la ruta de señalización celular respectiva, la actividad de la ruta de señalización celular respectiva se define por el nivel de actividad de los respectivos elementos de TF, siendo el modelo de ruta matemática calibrada un modelo que se calibra utilizando un conjunto de datos verdaderos del terreno que incluye muestras en las cuales la transcripción de los tres o más genes diana de la respectiva señalización celular es inducida por los respectivos elementos TF y muestras en las cuales la transcripción de los tres o más genes diana no son inducidos por los respectivos elementos TF, y determinar el puntuación de riesgo con base en una combinación de las actividades inferidas, en donde el evento clínico es la recurrencia de la enfermedad, en donde la enfermedad es cáncer de mama, en donde las rutas de señalización celular comprenden una ruta TGF-β y una o más de una ruta PI3K, una ruta Wnt, una ruta ER y una ruta HH, en donde la ruta TGF-β, la ruta PI3K, la ruta Wnt, la ruta ER y la ruta HH se definen como la ruta de señalización celular que finalmente conduce a la actividad transcripcional de los respectivos elementos TF, en donde los elementos TGF-β TF consisten en complejos de proteínas que contienen un dímero de un miembro seleccionado del grupo que consiste en SMAD1 SMAD2, SMAD3, SMAD5 y SMAD8 con SMAD4 o un trímero de dos miembros seleccionados del grupo que consiste en SMAD1, SMAD2, SMAD3, SMAD5 y SMAD8 con SMAD4, el elemento PI3K TF consiste en un miembro de la familia FOXO, el elemento Wnt TF consiste en β-catenina/TCF4, el elemento ER TF consiste en el dímero ERα, y el elemento HH TF consiste en un miembro de la familia GLI, en donde: los tres o más genes diana de TGF-β se seleccionan del grupo que consiste en: ANGPTL4, CDC42EP3, CDKN1A, CTGF, GADD45A, GADD45B, HMGA2, ID1, IL11, JUNB, PDGFB, PTHLH, SERPINE1, SGK1, SKIL, SMAD4, SMAD5, SMAD6, SMAD7, SNAI2, VEGFA, y/o los tres o más genes diana PI3K se seleccionan del grupo que consiste en: AGRP, BCL2L11, BCL6, BNIP3, BTG1, CAT, CAV1, CCND1, CCND2, CCNG2, CDKN1A, CDKN1B, ESR1, FASLG, FBXO32, GADD45A, INSR, MXI1, NOS3, PCK1, POMC, PPARGC1A, PRDX3, RBL2, SOD2, TNFSF10, y/o los tres o más genes diana Wnt se seleccionan del grupo que consiste en: CEMIP, AXIN2, CD44, RNF43, MYC, TBX3, TDGF1, SOX9, ASCL2, CXCL8, SP5, ZNRF3, EPHB2, LGR5, EPHB3, KLF6, CCND1, DEFA6 y FZD7, y/o los tres o más genes diana de ER se seleccionan del grupo que consiste en: CDH26, SGK3, PGR, GREB1, CA12, XBP1, CELSR2, WISP2, DSCAM, ERBB2, CTSD, TFF1, PDZK1, IGFBP4, ESR1, SOD1, AP1B1 y NRIP1, y/o los tres o más genes diana de HH se seleccionan del grupo que consiste en: GLI1, PTCH1, PTCH2, IGFBP6, SPP1, CCND2, FST, FOXL1, CFLAR, TSC22D1, RAB34, S100A9, S100A7, MYCN, FOXM1, GLI3, TCEA2, FYN y CTSL1, en donde la puntuación de riesgo se basa en una puntuación de Multirruta (MPS) que comprende una suma que incluye el término wt · Pt y uno o más de los términos wp · Pp, ww · Pw, we · Pe, y wh · Ph, en donde Pt, Pp, Pw, Pe y Ph denotan la actividad inferida de la ruta TGF-β, la ruta PI3K, la ruta Wnt, la ruta ER y la ruta HH, respectivamente, y en donde wt, wp, ww, we, y wh son coeficientes de ponderación constantes que representan una correlación entre el riesgo de que el sujeto experimente el evento clínico dentro del período de tiempo definido y la actividad de la ruta TGF-β, la ruta PI3K, la ruta Wnt, la ruta ER, y la ruta HH, respectivamente.

Description

DESCRIPCIÓN
Pronóstico médico y predicción de la respuesta a tratamiento usando múltiples actividades de la ruta de señalización celular
Campo de la invención
El asunto descrito en el presente documento se refiere principalmente a bioinformática, técnicas de procesamiento genómico, técnicas de procesamiento proteómico y técnicas relacionadas. Más particularmente, la presente invención se refiere a un método implementado por ordenador para determinar una puntuación de riesgo que indica un riesgo de que un sujeto experimente un evento clínico asociado con una enfermedad dentro de un período de tiempo definido realizado por un dispositivo de procesamiento digital, en donde la puntuación de riesgo se determina basándose en una combinación de actividades inferidas para dos o más rutas de señalización celular en el sujeto. La presente invención se refiere además a un aparato para determinar una puntuación de riesgo que indica un riesgo de que un sujeto experimente un evento clínico asociado con una enfermedad dentro de un período de tiempo definido que comprende un procesador digital configurado para realizar el método, a un medio de almacenamiento no transitorio para determinar una puntuación de riesgo que indica un riesgo de que un sujeto experimente un evento clínico asociado con una enfermedad dentro de un período de tiempo definido, almacenar instrucciones que son ejecutables por un dispositivo de procesamiento digital para realizar el método, y a un programa de ordenador para determinar una puntuación de riesgo que indica un riesgo de que un sujeto experimente un evento clínico asociado con una enfermedad dentro de un período de tiempo definido que comprende medios de código de programa para hacer que un dispositivo de procesamiento digital realice un método, cuando el programa de ordenador se ejecuta en el dispositivo de procesamiento digital. La presente invención se refiere además a un kit para medir los niveles de expresión de tres o más genes diana de cada una de dos o más rutas de señalización celular en una muestra de un sujeto, a kits para determinar una puntuación de riesgo que indica un riesgo de que un sujeto experimentará un evento clínico asociado con una enfermedad dentro de un período de tiempo definido, y a los usos de los kits en la ejecución del método.
Antecedentes de la invención
Los análisis genómicos y proteómicos se han realizado sustancialmente y son potencialmente prometedores para la aplicación clínica en campos médicos como la oncología, en donde se sabe que diversos cánceres están asociados con combinaciones específicas de mutaciones/variaciones genómicas/patrones de metilación anormales y/o niveles de expresión altos o bajos para genes específicos, que juegan un papel en el crecimiento y la evolución del cáncer, por ejemplo, la proliferación celular y la metástasis. Por ejemplo, la ruta de señalización de Wnt afecta la regulación de la proliferación celular y está altamente regulada. La alta actividad de la ruta Wnt debido a la pérdida de regulación se ha correlacionado con el cáncer, entre los que se encuentran los tumores de colon malignos. Aunque no se limita a ninguna teoría particular de funcionamiento, se cree que la desregulación de la ruta Wnt en las células de colon malignas conduce a una alta actividad de la ruta de Wnt que a su vez provoca la proliferación celular de las células de colon malignas, es decir, la diseminación del cáncer de colon. Por otro lado, la actividad de la ruta anormalmente baja también podría ser de interés, por ejemplo, en el caso de la osteoporosis. Otras rutas que desempeñan papeles similares en la división, función y/o diferenciación celular en la salud y la enfermedad son las rutas de señalización celular (por ejemplo, ER, PR, Ar , PPAR, GR, VitD, TGF-p, Notch, Hedgehog, FGF, NFkB, VEGF y PDGF).
Las tecnologías para adquirir datos genómicos y proteómicos se han hecho fácilmente disponibles en entornos clínicos. Por ejemplo, las mediciones mediante micromatrices se emplean de forma rutinaria para evaluar los niveles de expresión génica, los niveles de proteínas, la metilación, etc. La secuenciación de genes automatizada permite la identificación rentable de variaciones genéticas/mutaciones/patrones de metilación anormales en el ADN y el ARNm. La evaluación cuantitativa de los niveles de ARNm durante la secuenciación de genes es prometedora como herramienta clínica para evaluar los niveles de expresión de genes.
Uno de los principales desafíos para un terapeuta, por ejemplo, un oncólogo, es realizar una conjetura fundamentada sobre el pronóstico del paciente, ya que esta información influye en las elecciones de tratamiento. Los análisis genómicos, transcriptómicos y proteómicos (y otros "ómicos") basados en muestras de tejido canceroso de pacientes individuales proporcionan información que puede contribuir potencialmente a la evaluación pronóstica del paciente. Sin embargo, la interpretación de estos datos complejos para extraer la información clínica relevante ha demostrado ser un desafío, pero en gran parte sin resolver. El pronóstico de un paciente puede indicarse de manera cuantitativa de varias formas, como, por ejemplo: "tiempo hasta la recurrencia (de una enfermedad)", "tiempo hasta la progresión (de una enfermedad)", "tiempo de aparición (de una enfermedad)", o "tiempo hasta la muerte (enfermedad)".
El documento WO 2012/154567 A2 describe un método para determinar si un sujeto que tiene un tumor está en riesgo de metástasis del tumor, o en riesgo de recurrencia del tumor después del tratamiento del tumor usando una firma genética. El documento WO 2013/075059 A1 da a conocer firmas genéticas para subtipificar el cáncer de mama triple negativo (TNBC). El documento WO 2013/003384 A1 describe firmas genéticas asociadas con el cáncer, en particular el cáncer de próstata.
Resumen de la invención
De acuerdo con un aspecto principal de la presente invención, el problema anterior se resuelve o al menos se reduce mediante un método implementado por ordenador para determinar una puntuación de riesgo que indica un riesgo de que un sujeto experimente un evento clínico asociado con una enfermedad. dentro de un período de tiempo definido, en donde la determinación comprende:
inferir la actividad de cada una de dos o más rutas de señalización celular en el sujeto basándose en la evaluación de un modelo de ruta matemática calibrada que relaciona niveles de expresión de tres o más, por ejemplo, tres, cuatro, cinco, seis, siete, ocho, nueve, diez, once, doce o más, genes diana de la ruta de señalización celular respectiva medidos en una muestra del sujeto a un nivel de actividad de los elementos del factor de transcripción (TF) respectivo de la ruta de señalización celular respectiva en la muestra del sujeto, controlando el TF elemento(s) que controlan la transcripción de los tres o más genes diana de la ruta de señalización celular respectiva, estando definida la actividad de la ruta de señalización celular respectiva por el nivel de actividad de los elementos de TF respectivos, siendo el modelo de ruta matemática calibrado un modelo que se calibra utilizando un conjunto de datos verdaderos fundamental que incluye muestras en las cuales se induce la transcripción de los tres o más genes diana de la ruta de señalización celular respectiva por los respectivos elementos TF y muestras en las cuales la transcripción de los tres o más genes diana no es inducida por los respectivos elementos TF, y
determinar la puntuación de riesgo basada en una combinación de las actividades inferidas,
en donde el evento clínico es la recurrencia de la enfermedad, en donde la enfermedad es cáncer de mama, en donde las rutas de señalización celular comprenden una ruta del factor de crecimiento transformante-p (TGF-p) y una o más de una ruta de fosfatidilinositido 3-quinasa (PI3K), una ruta Wnt, una ruta de receptor de estrógeno (ER) y una ruta de Hedgehog (HH),
en donde la ruta TGF-p, la ruta PI3K, la ruta Wnt, la ruta ER y la ruta HH se definen como la ruta de señalización celular que finalmente conduce a la actividad transcripcional de los respectivos elementos TF,
en donde los elementos TGF-p TF consisten en al menos un dímero de los miembros TGF-p o un trímero, el elemento PI3K TF consiste en un miembro de la familia FOXO, el elemento Wnt TF consiste en p-catenina/TCF4, el elemento ER TF consiste en el dímero ERa, y el elemento HH TF consiste en un miembro de la familia GLI, en donde:
los tres o más genes diana de TGF-p se seleccionan del grupo que consiste en: ANGPTL4, CDC42EP3, CDKN1A, CTGF, GADD45A, GADD45B, HMGA2, ID1, IL11, JUNB, PDGFB, PTHLH, SERPINE1, SGK1, SKIL, SMAD4, SMAD5, SMAD6, SMAD7, SNAI2, VEGFA,
y/o
los tres o más genes diana PI3K se seleccionan del grupo que consiste en: AGRP, BCL2L11, BCL6, BNIP3, BTG1, CAT, CAV1, CCND1, CCND2, CCNG2, CDKN1A, CDKN1B, ESR1, FASLG, FBXO32, GADD45A, INSR, MXI1, NOS3, PCK1, POMC, PPARGC1A, PRDX3, RBL2, SOD2, TNFSF10,
y/o
los tres o más genes diana Wnt se seleccionan del grupo que consiste en: CEMIP, AXIN2, CD44, RNF43, MYC, TBX3, TDGF1, SOX9, ASCL2, CXCL8, SP5, ZNRF3, EPHB2, LGR5, EPHB3, KLF6, CCND1, DEFA6 y FZD7, y/o
los tres o más genes diana de ER se seleccionan del grupo que consiste en: CDH26, SGK3, PGR, GREB1, CA12, XBP1, CELSR2, WISP2, DSCAM, ERBB2, CTSD, TFF1, PDZK1, IGFBP4, ESR1, SOD1, AP1B1 y NRIP1, y/o
los tres o más genes diana de HH se seleccionan del grupo que consiste en: GLI1, PTCH1, PTCH2, IGFBP6, SPP1, CCND2, FST, FOXL1, CFLAR, TSC22D1, RAB34, S100A9, S100A7, MYCN, FOXM1, GLI3, TCEA2, FYN y CTSL1, en donde la puntuación de riesgo se basa en una puntuación de Multirruta (MPS) que comprende una suma que incluye el término wt ■ Pt y uno o más de los términos Wp ■ Pp, Ww ■ Pw , We ■ Pe, y Wh ■ Ph, en donde Pt , Pp, Pw , Pe, y Ph denotan la actividad inferida de la ruta TGF-p, la ruta PI3K, la ruta Wnt, la ruta ER y la ruta HH, respectivamente, y en donde wt, wp, ww, we y wh son coeficientes de ponderación constantes que representan una correlación entre el riesgo de que el sujeto experimente el evento clínico dentro del período de tiempo definido y la actividad de la ruta TGF-p, la ruta PI3K, la ruta Wnt, la ruta ER, y la ruta HH, respectivamente.
La presente invención permite preferiblemente la identificación de sujetos en riesgo de experimentar un evento clínico asociado con una enfermedad dentro de un período de tiempo definido, por ejemplo, dentro de 3 meses, dentro de 6 meses, dentro de 1 año, dentro de 18 meses, dentro de 2 años, dentro de 3o meses, dentro de 3 años, dentro de 42 meses, dentro de 4 años, dentro de 5 años, dentro de 6 años, dentro de 7 años, dentro de 8 años, dentro de 9 años, o dentro de 10 años o más.
El término "sujeto", como se usa en este documento, se refiere a cualquier ser vivo. En algunas realizaciones, el sujeto es un animal, preferiblemente un mamífero. En ciertas realizaciones, el sujeto es un ser humano, preferiblemente un sujeto de medicina.
El término "elemento de factor de transcripción" o "elemento TF" como se usa en este documento se refiere preferiblemente a una proteína o complejo de proteína intermedio o precursor del factor de transcripción activo, o una proteína o complejo de proteína del factor de transcripción activo que controla la expresión del gen diana especificado. Como ejemplo ilustrativo de cómo se usa este término, el término "elemento factor de transcripción TGF-P" o "elemento TF TGF-p" o "elemento TF" se refiere a un agente de señalización corriente abajo de la unión de TGF-p a su receptor que controla la expresión del gen diana, que puede ser una proteína de factor de transcripción o un complejo proteico o un precursor de un complejo proteico de transcripción activo. En las realizaciones, puede ser un agente de señalización desencadenado por la unión de TGF-p a su receptor corriente abajo de la unión del receptor extracelular de TGF-p y corriente arriba de la formación del complejo proteico del factor de transcripción activo. Por ejemplo, se sabe que cuando TGF-p se une a un receptor de Tg F-P extracelular, inicia una ruta de señalización intracelular "SMAD" y que una o más proteínas SMAD (por ejemplo, reguladas por receptor o R-SMADs (SMAD1, SMAD2, SMAD3, SmAd5 y SMAD8) y SMAD4) participan y pueden formar un heterocomplejo que participa en la cascada de señalización de transcripción de TGF-p que controla la expresión. Los elementos del factor de transcripción para las otras rutas de señalización, PI3K, Wnt, ER y HH se definen de forma análoga en función de sus miembros de cascada de señalización específicos que controlan la expresión.
El término "gen diana", como se usa en este documento, significa un gen cuya transcripción está directa o indirectamente controlada por un elemento de factor de transcripción respectivo. El "gen diana" puede ser un "gen diana directo" y/o un "gen diana indirecto" (como se describe en el presente documento).
La inferencia de la actividad de una ruta de señalización celular en el sujeto se puede realizar, por ejemplo, inter alia (i) evaluando una parte de un modelo de ruta probabilística calibrada, preferiblemente una red bayesiana, que representa la ruta de señalización celular para un conjunto de entradas que incluyen los niveles de expresión de los tres o más genes diana de la ruta de señalización celular medidos en una muestra del sujeto, (ii) estimar un nivel de actividad en el sujeto de un elemento de factor de transcripción (TF), el elemento TF que controla la transcripción de los tres o más genes diana de la ruta de señalización celular, basándose la estimación en posibilidades condicionales que relacionan el nivel de actividad del elemento TF y los niveles de expresión de los tres o más genes diana de la ruta de señalización celular medidos en la muestra del sujeto, y (iii) inferir la actividad de la ruta de señalización celular basada en el nivel de actividad estimado del elemento TF en la muestra e del sujeto. Esto se describe en detalle en la solicitud de patente internacional publicada WO 2013/011479 A2 ("Assessment of cellular signaling pathway activity using probabilistic modeling of target gene expression").
En una alternativa de ejemplo, la inferencia de la actividad de una ruta de señalización celular en el sujeto se puede realizar, entre otras cosas, (i) determinando un nivel de actividad de un elemento de factor de transcripción (Tf ) en la muestra del sujeto, el elemento TF que controla la transcripción de los tres o más genes diana de la ruta de señalización celular, basándose la determinación en la evaluación de un modelo de ruta matemática calibrada que relaciona los niveles de expresión de los tres o más genes diana de la ruta de señalización celular con el nivel de actividad del elemento TF, el modelo de ruta matemática se basa en una o más combinaciones lineales de niveles de expresión de los tres o más genes diana, y (ii) inferir la actividad de la ruta de señalización celular en el sujeto en función del nivel de actividad determinado del elemento TF en la muestra del sujeto. Esto se describe en detalle en la solicitud de patente internacional publicada WO 2014/102668 A2 ("Assessment of cellular signaling pathway activity using linear combination(s) of target gene expressions ").
De acuerdo con una realización preferida, las rutas de señalización celular comprenden la ruta PI3K, la ruta Wnt, la ruta ER y la ruta HH.
Cada una de las rutas de TGF-p, la ruta de PI3K, la ruta de Wnt, la ruta de ER y la ruta de HH se define como la ruta de señalización celular que finalmente conduce a la actividad transcripcional de los complejos del factor de transcripción (TF) asociados con la ruta. Estos consisten en al menos un dímero de los miembros de TGF-p (SMAD 1, SMAD2, SMAD3, SMAD5 y SMAD8 con SMAD4) o un trímero (dos proteínas de SMAD1, SMAD2, SMAD3, SMAD5 y SMAD8 con SMAD4), un miembro de la familia FOXO, p-catenina/TCF4, el dímero ERa y un miembro de la familia GLI, respectivamente.
La presente invención se concentra en la ruta TGF-p y la familia SMAD TF, cuya actividad está sustancialmente correlacionada con la actividad de la ruta TGF-p, es decir, la actividad del complejo SMAD TF está sustancialmente correlacionada con la actividad de la ruta de TGF-p, mientras que la inactividad del complejo SMAD TF se correlaciona sustancialmente con la inactividad de la ruta de PI3K.
Se prefiere que las rutas de señalización celular comprendan la ruta PI3K y/o la ruta Wnt y/o la ruta ER y/o la ruta HH, en donde la puntuación de riesgo se define de manera que el riesgo indicado aumenta monotónicamente con una actividad inferida creciente de la ruta PI3K y/o una actividad inferida creciente de la ruta Wnt y/o una actividad inferida creciente de la ruta HH y/o decrece monotónicamente con una actividad inferida creciente de la ruta ER. También se prefiere que la puntuación de riesgo se defina de manera que lo indicado aumente monotónicamente con un aumento de la actividad inferida de la ruta de TGF-p.
Se prefiere además que los coeficientes de ponderación constante wt, Wp, Ww, We, y Wh sean o hayan sido determinados en función del valor del coeficiente de Cox resultante de ajustar un modelo de riesgo proporcional de Cox para la ruta de señalización celular respectiva a los datos clínicos.
La presente invención se basa en la innovación de los inventores de que una forma adecuada de identificar los efectos que ocurren en las rutas de señalización celular descritas en el presente documento puede basarse en una medición de la salida de señalización de las rutas de señalización celular, que es, entre otras, la transcripción de genes diana únicos descritos en este documento, que es controlada por los elementos del factor de transcripción (TF) que están controlados por las rutas de señalización celular. Esta innovación de los inventores supone que el nivel de actividad de TF se encuentra en un estado cuasiestacionario en la muestra que puede detectarse mediante, entre otros, los valores de expresión de los genes diana identificados de forma única.
En particular, se han identificado conjuntos únicos de genes diana de la ruta de señalización celular cuyos niveles de expresión se analizan en los modelos matemáticos de la ruta. Para su uso en los modelos de rutas matemáticas, se pueden analizar tres o más, por ejemplo, tres, cuatro, cinco, seis, siete, ocho, nueve, diez, once, doce o más, genes diana de cada ruta de señalización celular evaluada para desarrollar la puntuación de riesgo.
Se prefiere además que:
los tres o más genes diana de TGF-p se seleccionan del grupo que consiste en: ANGPTL4, CDC42EP3, CDKN1A, CTGF, GADD45B, ID1, IL11, JUNB, SERPINE1, PDGFB, SKIL, SMAD7, SNAI2 y VEGFA, preferiblemente, del grupo formado por: ANGPTL4, CDC42EP3, ID1, IL11, JUNB, SERPINE1, SKIL y SMAD7,
y/o
los tres o más genes diana PI3K se seleccionan del grupo que consiste en: FBXO32, BCL2L11, SOD2, TNFSF10, BCL6, BTG1, CCNG2, CDKN1B, BNIP3, GADD45A, INSR y MXI1,
y/o
los tres o más genes diana de Wnt se seleccionan del grupo que consiste en: AXIN2, CD44, LGR5, CEMIP, MYC, CXCL8, SOX9, EPHB3, RNF43, TDGF1, ZNRF3 y DEFA6,
y/o
los tres o más genes diana de ER se seleccionan del grupo que consiste en: TFF1, GREB1, PGR, SGK3, PDZK1, IGFBP4, NRIP1, CA12, XBP1, ERBB2, ESR1 y CELSR2,
y/o
los tres o más genes diana de HH se seleccionan del grupo que consiste en: GLI1, PTCH1, PTCH2, CCND2, IGFBP6, MYCN, FST, RAB34, GLI3, CFLAR, S100A7 y S100A9.
Se prefiere particularmente que los tres o más genes diana de TGF-p se seleccionen del grupo que consiste en: ANGPTL4, CDC42EP3, CDKN1A, CTGF, GADD45A, GADD45B, HMGA2, ID1, JUNB, PDGFB, PTHLH, SERPINE1, SGK1, SKIL, SMAD4, SMAD5, SMAD6, SMAD7, SNAI2, VEGFA, preferiblemente, del grupo que consiste en: ANGPTL4, CDC42EP3, CDKN1A, CTGF, GADD45B, ID1, JUNB, SERPINE1, SKIL, SMAD7, SNAI2 y VEGFA, más preferiblemente, del grupo formado por: ANGPTL4, CDC42EP3, ID1, JUNB, SERPINE1, SKIL y SMAD7.
Se prefiere particularmente que:
los tres o más genes diana de TGF-p son ANGPTL4, CDC42EP3, CDKN1A, CTGF, GADD45B, ID1, JUNB, SERPINE1, SKIL, SMAD7, SNAI2 y VEGFA, y/o
los tres o más genes diana PI3K son FBXO32, BCL2L11, SOD2, TNFSF10, BCL6, BTG1, CCNG2, CDKN1B, BNIP3, GADD45A, INSR y MXI1, y/o
los tres o más genes diana de Wnt son AXIN2, CD44, LGR5, CEMIP, MYC, CXCL8, SOX9, EPHB3, RNF43, TDGF1, ZNRF3 y DEFA6, y/o
los tres o más genes diana de ER son TFF1, GREB1, PGR, SGK3, PDZK1, IGFBP4, NRIP1, CA12, XBP1, ERBB2, ESR1 y CELSR2, y/o
los tres o más genes diana de HH son GLI1, PTCH1, PTCH2, CCND2, IGFBP6, MYCN, FST, RAB34, GLI3, CFLAR, S100A7 y S100A9.
La muestra o muestras que se utilicen de acuerdo con la presente invención pueden ser una muestra extraída, es decir, una muestra que se ha extraído del sujeto. Ejemplos de la muestra incluyen, pero no se limitan a, un tejido, células, sangre y/o un fluido corporal de un sujeto. Puede ser, por ejemplo, una muestra obtenida de una lesión cancerosa o de una lesión sospechosa de cáncer, o de un tumor metastásico, o de una cavidad corporal en la que hay líquido contaminado con células cancerosas (por ejemplo, cavidad pleural o abdominal o cavidad de la vejiga), o de otros fluidos corporales que contienen células cancerosas, y así sucesivamente, preferiblemente mediante un procedimiento de biopsia u otro procedimiento de extracción de muestras. Las células de las que se extrae una muestra también pueden ser células tumorales de neoplasias hematológicas (como leucemia o linfoma). En algunos casos, la muestra de células también puede ser células tumorales circulantes, es decir, células tumorales que han entrado en el torrente sanguíneo y se pueden extraer usando técnicas de aislamiento adecuadas, por ejemplo, aféresis o extracción de sangre venosa convencional. Aparte de la sangre, un fluido corporal del que se extrae una muestra puede ser orina, contenido gastrointestinal o un extravasado. El término "muestra", como se usa en este documento, también abarca el caso en donde por ejemplo, un tejido y/o células y/o un fluido corporal del sujeto se han extraído del sujeto y, por ejemplo, se han colocado en un portaobjetos de microscopio o fijador, y cuando para realizar el método reivindicado se extrae una parte de esta muestra, por ejemplo, por medio de microdisección por captura con láser (LCM), o perforando, o raspando las células de interés del portaobjetos, o mediante técnicas de clasificación de células activadas por fluorescencia. Además, el término "muestra", como se usa en este documento, también abarca el caso en donde, por ejemplo, un tejido y/o células y/o un fluido corporal del sujeto se han tomado del sujeto y se han colocado en un portaobjetos de microscopio, y el método reivindicado se realiza en el portaobjetos.
Se prefiere que el método comprenda además combinar la puntuación de riesgo y/o al menos una de las actividades inferidas con una o más puntuaciones de riesgo adicionales obtenidas de una o más pruebas de pronóstico adicionales para obtener una puntuación de riesgo combinada, en donde la puntuación de riesgo combinada indica un riesgo de que el sujeto experimente el evento clínico dentro del período de tiempo definido. Las una o más pruebas de pronóstico adicionales pueden comprender, en particular, la prueba de cáncer de mama Oncotype DX®, la prueba de cáncer de mama Mammostrat®, la prueba de cáncer de mama MammaPrint®, la prueba de cáncer de mama EndoPredict®, la prueba de cáncer de mama BluePrint™, la prueba de cáncer de mama CompanDx®, Breast Cancer IndexSM (HOXB13/IL17BR), prueba de cáncer de colon OncotypeDX® y/o una prueba de proliferación realizada midiendo la expresión del gen/proteína Ki67.
Como se mencionó anteriormente, el evento clínico es la recurrencia de la enfermedad, en donde la enfermedad es cáncer de mama. El riesgo de que el evento clínico ocurra dentro del período de tiempo definido es entonces preferentemente el riesgo de recurrencia, es decir, el regreso del cáncer, ya sea después de un tratamiento dado (también llamado "predicción de la respuesta a la terapia del cáncer") o sin ningún tratamiento (también llamado "pronóstico del cáncer"). La recurrencia puede ser local (es decir, en el lado del tumor original) o distante (es decir, metástasis, más allá del lado original). De acuerdo con otro aspecto divulgado, un aparato para determinar una puntuación de riesgo que indica un riesgo de que un sujeto experimente un evento clínico asociado con una enfermedad dentro de un período de tiempo definido comprende un procesador digital configurado para realizar el método de la presente invención como descrito aquí.
De acuerdo con otro aspecto divulgado, un medio de almacenamiento no transitorio para determinar una puntuación de riesgo que indica un riesgo de que un sujeto experimente un evento clínico asociado con una enfermedad dentro de un período de tiempo definido almacena instrucciones que son ejecutables por un dispositivo de procesamiento digital para realizar el método de la presente invención como se describe en este documento. El medio de almacenamiento no transitorio puede ser un medio de almacenamiento legible por ordenador, como un disco duro u otro medio de almacenamiento magnético, un disco óptico u otro medio de almacenamiento óptico, una memoria de acceso aleatorio (RAM), una memoria de solo lectura (ROM), memoria flash u otro medio de almacenamiento electrónico, un servidor de red, etc. El dispositivo de procesamiento digital puede ser un dispositivo de mano (por ejemplo, un asistente de datos personales o un teléfono inteligente), un ordenador portátil, un ordenador de escritorio, una tableta o dispositivo, un servidor de red remoto, etc.
De acuerdo con otro aspecto divulgado, un programa de informador para determinar una puntuación de riesgo que indica un riesgo de que un sujeto experimente un evento clínico asociado con una enfermedad dentro de un período de tiempo definido comprende medios de código de programa para provocar un dispositivo de procesamiento digital. para realizar el método de la presente invención como se describe en este documento, cuando el programa de informador se ejecuta en el dispositivo de procesamiento digital. El dispositivo de procesamiento digital puede ser un dispositivo de mano (por ejemplo, un asistente de datos personales o un teléfono inteligente), un ordenador portátil, un ordenador de escritorio, una tableta o dispositivo, un servidor de red remoto, etc.
De acuerdo con otro aspecto divulgado, un kit para medir los niveles de expresión de tres o más genes diana de cada una de dos o más rutas de señalización celular en una muestra de un sujeto y para determinar una puntuación de riesgo que indica un riesgo de que un sujeto experimentará un evento clínico asociado con una enfermedad dentro de un período de tiempo definido que comprende:
uno o más componentes para determinar los niveles de expresión de tres o más genes diana, por ejemplo, tres, cuatro, cinco, seis, siete, ocho, nueve, diez, once, doce o más, de cada una de dos o más rutas de señalización celular en una muestra del sujeto,
en donde uno o más componentes se seleccionan preferiblemente del grupo que consiste en: un chip de matriz de ADN (por ejemplo, un chip de matriz de ADN, un chip de matriz de oligonucleótidos, un chip de matriz de proteínas), un anticuerpo, una pluralidad de sondas, por ejemplo, sondas marcadas, un conjunto de componentes de secuenciación de ARN inverso-transcriptasa, y/o ARN o ADN, incluyendo ADNc, cebadores de amplificación, en donde las rutas de señalización celular comprenden una ruta TGF-p y una o más de una ruta PI3K, una ruta Wnt, una ruta ER y una ruta HH, y
el aparato de la presente invención como se describe en este documento, el medio de almacenamiento no transitorio de la presente invención como se describe en este documento, o el programa de informador de la presente invención como se describe en este documento,
en donde:
los tres o más genes diana de TGF-p se seleccionan del grupo que consiste en: ANGPTL4, CDC42EP3, CDKN1A, CTGF, GADD45A, GADD45B, HMGA2, ID1, IL11, JUNB, PDGFB, PTHLH, SERPINE1, SGK1, SKIL, SMAD4, SMAD5, SMAD6, SMAD7, SNAI2, VEGFA,
y/o
los tres o más genes diana PI3K se seleccionan del grupo que consiste en: AGRP, BCL2L11, BCL6, BNIP3, BTG1, CAT, CAVI, CCND1, CCND2, CCNG2, CDKN1A, CDKN1B, ESR1, FASLG, FBXO32, GADD45A, INSR, MXI1, NOS3, PCK1, POMC, PPARGC1A, PRDX3, RBL2, SOD2, TNFSF10,
y/o
los tres o más genes diana Wnt se seleccionan del grupo que consiste en: CEMIP, AXIN2, CD44, RNF43, MYC, TBX3, TDGF1, SOX9, ASCL2, CXCL8, SP5, ZNRF3, EPHB2, LGR5, EPHB3, KLF6, CCND1, DEFA6 y FZD7, y/o
los tres o más genes diana de ER se seleccionan del grupo que consiste en: CDH26, SGK3, PGR, GREB1, CA12, XBP1, CELSR2, WISP2, DSCAM, ERBB2, CTSD, TFF1, PDZK1, IGFBP4, ESR1, SOD1, AP1B1 y NRIP1, y/o
los tres o más genes diana de HH se seleccionan del grupo que consiste en: GLI1, PTCH1, PTCH2, IGFBP6, SPP1, CCND2, FST, FOXL1, CFLAR, TSC22D1, RAB34, S100A9, S100A7, MYCN, FOXM1, GLI3, TCEA2, FYN y CTSL1. Se prefiere además que:
los tres o más genes diana de TGF-p se seleccionan del grupo que consiste en: ANGPTL4, CDC42EP3, CDKN1A, CTGF, GADD45B, ID1, IL11, JUNB, SERPINE1, PDGFB, SKIL, SMAD7, SNAI2 y VEGFA, preferiblemente, del grupo formado por: ANGPTL4, CDC42EP3, ID1, IL11, JUNB, SERPINE1, SKIL y SMAD7,
y/o
los tres o más genes diana PI3K se seleccionan del grupo que consiste en: FBXO32, BCL2L11, SOD2, TNFSF10, BCL6, BTG1, CCNG2, CDKN1B, BNIP3, GADD45A, INSR y MXI1,
y/o
los tres o más genes diana de Wnt se seleccionan del grupo que consiste en: AXIN2, CD44, LGR5, CEMIP, MYC, CXCL8, SOX9, EPHB3, RNF43, TDGF1, ZNRF3 y DEFA6,
y/o
los tres o más genes diana de ER se seleccionan del grupo que consiste en: TFF1, GREB1, PGR, SGK3, PDZK1, IGFBP4, NRIP1, CA12, XBP1, ERBB2, ESR1 y CELSR2,
y/o
los tres o más genes diana de HH se seleccionan del grupo que consiste en: GLI1, PTCH1, PTCH2, CCND2, IGFBP6, MYCN, FST, RAB34, GLI3, CFLAR, S100A7 y S100A9.
Se prefiere particularmente que los tres o más genes diana de TGF-p se seleccionen del grupo que consiste en: ANGPTL4, CDC42EP3, CDKN1A, CTGF, GADD45A, GADD45B, HMGA2, ID1, JUNB, PDGFB, PTHLH, SERPINE1, SGK1, SKIL, SMAD4, SMAD5, SMAD6, SMAD7, SNAI2, VEGFA, preferiblemente, del grupo que consiste en: ANGPTL4, CDC42EP3, CDKN1A, CTGF, GADD45B, ID1, JUNB, SERPINE1, SKIL, SMAD7, SNAI2 y VEGFA, lo más preferiblemente, del grupo formado por: ANGPTL4, CDC42EP3, ID1, JUNB, SERPINE1, SKIL y SMAD7.
Se prefiere particularmente que:
los tres o más genes diana de TGF-p son ANGPTL4, CDC42EP3, CDKN1A, CTGF, GADD45B, ID1, JUNB, SERPINE1, SKIL, SMAD7, SNAI2 y VEGFA, y/o
los tres o más genes diana PI3K son FBXO32, BCL2L11, SOD2, TNFSF10, BCL6, BTG1, CCNG2, CDKN1B, BNIP3, GADD45A, INSR y MXI1, y/o
los tres o más genes diana de Wnt son AXIN2, CD44, LGR5, CEMIP, MYC, CXCL8, SOX9, EPHB3, RNF43, TDGF1, ZNRF3 y DEFA6, y/o
los tres o más genes diana de ER son TFF1, GREB1, PGR, SGK3, PDZK1, IGFBP4, NRIP1, CA12, XBP1, ERBB2, ESR1 y CELSR2, y/o
los tres o más genes diana de HH son GLI1, PTCH1, PTCH2, CCND2, IGFBP6, MYCN, FST, RAB34, GLI3, CFLAR, S100A7 y S100A9.
De acuerdo con otro aspecto divulgado, el kit de la presente invención como se describe en este documento se usa para realizar el método de la presente invención como se describe en este documento.
Una ventaja reside en un sistema de apoyo a la decisión clínica (CDS) que está adaptado para proporcionar recomendaciones clínicas, por ejemplo, al decidir un tratamiento para un sujeto, basado en un análisis de dos o más rutas de señalización celular, por ejemplo, usando un modelo probabilístico u otro matemático de la ruta TGF-p, la ruta PI3K, la ruta Wnt, la ruta ER y la ruta HH, en particular, en función del riesgo de que el sujeto experimente un evento clínico (recurrencia de la enfermedad) asociado con cáncer de mama dentro de un período de tiempo definido, como lo indica una puntuación de riesgo que se determina en función de una combinación de actividades inferidas de las rutas de señalización celular.
Otra ventaja reside en un sistema CDS que está adaptado para asignar un sujeto a al menos uno de una pluralidad de grupos de riesgo asociados con diferentes riesgos de que el sujeto experimente un evento clínico (recurrencia de la enfermedad) asociado con el cáncer de mama dentro de un período definido de tiempo, de acuerdo con lo indicado por una puntuación de riesgo que se determina basándose en una combinación de actividades inferidas de dos o más rutas de señalización celular.
Otra ventaja reside en combinar una puntuación de riesgo que indica un riesgo de que un sujeto experimente un evento clínico (recurrencia de la enfermedad) asociado con el cáncer de mama dentro de un período de tiempo definido y que se determina con base en una combinación de actividades inferidas de dos o más rutas de señalización celular con una o más puntuaciones de riesgo adicionales obtenidas de una o más pruebas de pronóstico adicionales.
La presente invención, como se describe en el presente documento, puede, por ejemplo, usarse también ventajosamente en relación con
pronóstico y/o predicción basados en una combinación de actividades inferidas de dos o más rutas de señalización celular, y/o
predicción de la eficacia del fármaco de por ejemplo, quimioterapia y/o tratamiento hormonal basado en una combinación de actividades inferidas de dos o más rutas de señalización celular, y/o
monitorización de la eficacia del fármaco basado en una combinación de actividades inferidas de dos o más rutas de señalización celular, y/o
desarrollo de fármacos basado en una combinación de actividades inferidas de dos o más rutas de señalización celular, y/o
desarrollo de ensayos basado en una combinación de actividades inferidas de dos o más rutas de señalización celular, y/o
estadificación del cáncer basada en una combinación de actividades inferidas de dos o más rutas de señalización celular,
en donde en cada caso, las rutas de señalización celular comprenden una ruta de TGF-p y una o más de una ruta de PI3K, una ruta de Wnt, una ruta de ER y una ruta de HH.
Otras ventajas serán evidentes para los expertos en la técnica al leer y comprender las figuras adjuntas, la siguiente descripción y, en particular, al leer los ejemplos detallados que se proporcionan más adelante.
Se entenderá que el método de la reivindicación 1, el aparato de la reivindicación 8, el medio de almacenamiento no transitorio de la reivindicación 9, el programa de informador de la reivindicación 10, el kit de la reivindicación 11 y el uso del kit de la reivindicación 12 tiene realizaciones preferidas similares y/o idénticas, en particular, como se define en las reivindicaciones dependientes.
Se entenderá que una realización preferida de la presente invención también puede ser cualquier combinación de las reivindicaciones dependientes o realizaciones anteriores con la respectiva reivindicación independiente.
Estos y otros aspectos de la invención resultarán evidentes y se aclararán con referencia a las realizaciones descritas más adelante.
La presente invención utiliza los análisis de los niveles de expresión de conjuntos únicos de genes diana. Los genes diana particularmente adecuados se describen en los siguientes pasajes de texto, así como en los ejemplos siguientes (véanse, por ejemplo, las Tablas 1 a 21 más adelante).
Por tanto, en una realización, los genes diana se seleccionan del grupo que consiste en los genes diana enumerados en la Tabla 1, Tabla 2, Tabla 3, Tabla 4, Tabla 5, Tabla 6, Tabla 7, Tabla 8, Tabla 9, Tabla 10, Tabla 11, Tabla 12, Tabla 13, Tabla 14, Tabla 15, Tabla 16, Tabla 17, Tabla 18, Tabla 19, Tabla 20 o Tabla 21.
Breve descripción de los dibujos
La Figura 1 muestra esquemática y a manera de ejemplo un modelo matemático, en este documento, un modelo de red bayesiana, utilizado para modelar el programa transcripcional de la ruta TGF-p, la ruta PI3K, la ruta Wnt, la ruta ER y la ruta HH, respectivamente.
La Figura 2 muestra un gráfico de Kaplan-Meier de la supervivencia libre de enfermedad en pacientes con cáncer de mama de E-MTAB-365, GSE20685 y GSE21653. Los tres grupos de pacientes se separan en función de los terciles de la puntuación de riesgo MPStp, que es una combinación de las actividades inferidas de la ruta TGF-p y la ruta PI3K. La diferencia entre las curvas de supervivencia de los pacientes de alto y bajo riesgo es claramente significativa (prueba de rango logarítmico: p = 1.7e-9).
La Figura 3 muestra un gráfico de Kaplan-Meier de la supervivencia libre de enfermedad en pacientes con cáncer de mama de E-MTAB-365, GSE20685 y GSE21653. Los tres grupos de pacientes se separan en función de los terciles de la puntuación de riesgo MPStw, que es una combinación de las actividades inferidas de la ruta TGF-p y la ruta Wnt. La diferencia entre las curvas de supervivencia de los pacientes de alto y bajo riesgo es claramente significativa (prueba de rango logarítmico: p = 2.9e-3).
La Figura 4 muestra un gráfico de Kaplan-Meier de la supervivencia libre de enfermedad en pacientes con cáncer de mama de E-MTAB-365, GSE20685 y GSE21653. Los tres grupos de pacientes se separan en función de los terciles de la puntuación de riesgo MPSte, que es una combinación de las actividades inferidas de la ruta TGF-p y la ruta ER. La diferencia entre las curvas de supervivencia de los pacientes de alto y bajo riesgo es claramente significativa (prueba de rango logarítmico: p = 8.7e-9).
La Figura 5 muestra un gráfico de Kaplan-Meier de la supervivencia libre de enfermedad en pacientes con cáncer de mama de E-MTAB-365, GSE20685 y GSE21653. Los tres grupos de pacientes se separan en función de los terciles de la puntuación de riesgo de MPSth, que es una combinación de las actividades inferidas de la ruta TGF-p y la ruta HH. La diferencia entre las curvas de supervivencia de los pacientes de alto y bajo riesgo es claramente significativa (prueba de rango logarítmico: p = 5.8e-9).
La Figura 6 muestra un gráfico de Kaplan-Meier de la supervivencia libre de enfermedad en pacientes con cáncer de mama de E-MTAB-365, GSE20685 y GSE21653. Los tres grupos de pacientes se separan en función de los terciles de la puntuación de riesgo MPStpw, que es una combinación de las actividades inferidas de la ruta TGF-p, la ruta PI3K y la ruta Wnt. La diferencia entre las curvas de supervivencia de los pacientes de alto y bajo riesgo es claramente significativa (prueba de rango logarítmico: p = 1.4e-8).
La Figura 7 muestra un gráfico de Kaplan-Meier de la supervivencia libre de enfermedad en pacientes con cáncer de mama de E-MTAB-365, GSE20685 y GSE21653. Los tres grupos de pacientes se separan en función de los terciles de la puntuación de riesgo MPStpe, que es una combinación de las actividades inferidas de la ruta TGF-p, la ruta PI3K y la ruta ER. La diferencia entre las curvas de supervivencia de los pacientes de alto y bajo riesgo es claramente significativa (prueba de rango logarítmico: p = 7.1e-13).
La Figura 8 muestra un gráfico de Kaplan-Meier de la supervivencia libre de enfermedad en pacientes con cáncer de mama de E-MTAB-365, GSE20685 y GSE21653. Los tres grupos de pacientes se separan de acuerdo con los terciles de la puntuación de riesgo MpStph, que es una combinación de las actividades inferidas de la ruta TGF-p, la ruta PI3K y la ruta HH. La diferencia entre las curvas de supervivencia de los pacientes de alto y bajo riesgo es claramente significativa (prueba de rango logarítmico: p = 1.5e-10).
La Figura 9 muestra un gráfico de Kaplan-Meier de la supervivencia libre de enfermedad en pacientes con cáncer de mama de E-MTAB-365, GSE20685 y GSE21653. Los tres grupos de pacientes se separan en función de los terciles de la puntuación de riesgo MPStwe, que es una combinación de las actividades inferidas de la ruta TGF-p, la ruta Wnt y la ruta ER. La diferencia entre las curvas de supervivencia de los pacientes de alto y bajo riesgo es claramente significativa (prueba de rango logarítmico: p = 4,1e-7).
La Figura 10 muestra un gráfico de Kaplan-Meier de la supervivencia libre de enfermedad en pacientes con cáncer de mama de E-MTAB-365, GSE20685 y GSE21653. Los tres grupos de pacientes se separan en función de los terciles de la puntuación de riesgo MPStwh, que es una combinación de las actividades inferidas de la ruta TGF-p, la ruta Wnt y la ruta HH. La diferencia entre las curvas de supervivencia de los pacientes de alto y bajo riesgo es claramente significativa (prueba de rango logarítmico: p = 4.2e-4).
a Figura 11 muestra un gráfico de Kaplan-Meier de la supervivencia libre de enfermedad en pacientes con cáncer de mama de E-MTAB-365, GSE20685 y GSE21653. Los tres grupos de pacientes se separan en función de los terciles de la puntuación de riesgo MPSteh, que es una combinación de las actividades inferidas de la ruta TGF-p, la ruta ER y la ruta HH. La diferencia entre las curvas de supervivencia de los pacientes de alto y bajo riesgo es claramente significativa (prueba de rango logarítmico: p = 1.3e-10).
La Figura 12 muestra un gráfico de Kaplan-Meier de la supervivencia libre de enfermedad en pacientes con cáncer de mama de E-MTAB-365, GSE20685 y GSE21653. Los tres grupos de pacientes se separan en función de los terciles de la puntuación de riesgo MPStpwe, que es una combinación de las actividades inferidas de la ruta TGF-p, la ruta PI3K, la ruta Wnt y la ruta ER. La diferencia entre las curvas de supervivencia de los pacientes de alto y bajo riesgo es claramente significativa (prueba de rango logarítmico: p = 6.8e-12).
La Figura 13 muestra un gráfico de Kaplan-Meier de la supervivencia libre de enfermedad en pacientes con cáncer de mama de E-MTAB-365, GSE20685 y GSE21653. Los tres grupos de pacientes se separan en función de los terciles de la puntuación de riesgo MPStpwh, que es una combinación de las actividades inferidas de la ruta TGF-p, la ruta PI3K, la ruta Wnt y la ruta HH. La diferencia entre las curvas de supervivencia de los pacientes de alto y bajo riesgo es claramente significativa (prueba de rango logarítmico: p = 4.5e-9).
La Figura 14 muestra un gráfico de Kaplan-Meier de la supervivencia libre de enfermedad en pacientes con cáncer de mama de E-MTAB-365, GSE20685 y GSE21653. Los tres grupos de pacientes se separan en función de los terciles de la puntuación de riesgo MPStpeh, que es una combinación de las actividades inferidas de la ruta TGF-p, la ruta PI3K, la ruta ER y la ruta HH. La diferencia entre las curvas de supervivencia de los pacientes de alto y bajo riesgo es claramente significativa (prueba de rango logarítmico: p = 2.9e-12).
La Figura 15 muestra un gráfico de Kaplan-Meier de la supervivencia libre de enfermedad en pacientes con cáncer de mama de E-MTAB-365, GSE20685 y GSE21653. Los tres grupos de pacientes se separan en función de los terciles de la puntuación de riesgo MPStweh, que es una combinación de las actividades inferidas de la ruta TGF-p, la ruta Wnt, la ruta ER y la ruta HH. La diferencia entre las curvas de supervivencia de los pacientes de alto y bajo riesgo es claramente significativa (prueba de rango logarítmico: p = 6.6e-9).
La Figura 16 muestra un gráfico de Kaplan-Meier de la supervivencia libre de enfermedad en pacientes con cáncer de mama de E-MTAB-365, GSE20685 y GSE21653. Los tres grupos de pacientes se separan en función de los terciles de la puntuación de riesgo MPStpweh, que es una combinación de las actividades inferidas de la ruta TGF-p, la ruta PI3K, la ruta Wnt, la ruta ER y la ruta HH. La diferencia entre las curvas de supervivencia de los pacientes de alto y bajo riesgo es claramente significativa (prueba de rango logarítmico: p = 8,6e-12).
La Figura 17 muestra un gráfico de Kaplan-Meier de la supervivencia libre de enfermedad en pacientes con cáncer de mama de E-MTAB-365, GSE20685 y GSE21653. Los tres grupos de pacientes se separan en función de los terciles de la puntuación de riesgo de MPSconjunto de sondas, que es una combinación de los conjuntos de sondas asociados con los genes diana seleccionados de la ruta TGF-p, la ruta PI3K, la ruta Wnt, la ruta ER y la ruta HH. La diferencia entre las curvas de supervivencia de los pacientes de alto y bajo riesgo es claramente significativa (prueba de rango logarítmico: p = 1.3e-7).
La Figura 18 muestra la probabilidad de supervivencia libre de enfermedad a los cinco (línea de puntos inferior, línea de puntos) y diez años (línea continua de arriba) usando como ejemplo el MPStpweh sin escala.
La Figura 19 muestra esquemáticamente un sistema de apoyo a la decisión clínica (CDS) configurado para determinar una puntuación de riesgo que indica un riesgo de que un sujeto experimente un evento clínico dentro de un cierto período de tiempo, como se describe en este documento.
La Figura 20 muestra un diagrama de flujo que ilustra a modo de ejemplo un proceso para determinar la puntuación de riesgo basándose en la medición de los niveles de expresión de genes diana de la ruta PI3K y rutas de señalización celular adicionales.
La Figura 21 muestra un diagrama de flujo que ilustra a modo de ejemplo un proceso para calibrar un modelo de Puntuación Multirruta (MPS) con datos de supervivencia.
La Figura 22 muestra un diagrama de flujo que ilustra a modo de ejemplo un proceso para calcular una puntuación de riesgo a partir de un modelo de puntuación de Multirruta (MPS) calibrado.
La Figura 23 muestra un diagrama de flujo que ilustra a modo de ejemplo un proceso para determinar los valores de Cq a partir del análisis RT-qPCR de los genes diana de las rutas de señalización celular.
La Figura 24A muestra la distribución de rutas activas (P>0.5) en 1294 muestras de cáncer de mama. La suma de las rutas activas excede el número total de pacientes, ya que pueden tener Multirrutas activas en su muestra.
La Figura 24B muestra la distribución de rutas marginalmente activas (P>0.2) en 1294 muestras de cáncer de mama. La suma de las rutas activas excede el número total de pacientes, ya que pueden tener Multirrutas activas en su muestra.
La Figura 25A muestra un gráfico de Kaplan-Meier de la supervivencia sin recaída de 1169 pacientes con cáncer de mama divididas de acuerdo con la actividad de la ruta.
La Figura 25B muestra un gráfico de Kaplan-Meier de la supervivencia sin recaída de 1169 pacientes con cáncer de mama divididas de acuerdo con los terciles superior (círculo) e inferior (cuadrado) del MPS.
La Figura 26 muestra la regresión de Cox univariada y multivariada de la supervivencia sin recaída de 1169 pacientes; el valor p de PAR es bilateral.
La Figura 27 muestra la frecuencia de prevalencia de combinaciones de rutas activas en 167 de 1294 (13 %) muestras de pacientes con cáncer de mama con al menos dos rutas activas.
La Figura 28A muestra la distribución de la actividad de la ruta sobre los subtipos de cáncer de mama de acuerdo con los subtipos intrínsecos del algoritmo PAM50 para el subtipo Luminal A.
La Figura 28B muestra un gráfico de Kaplin-Meier de la distribución de la actividad de la ruta sobre los subtipos de cáncer de mama de acuerdo con los subtipos intrínsecos del algoritmo PAM50; y la supervivencia libre de recaída asociada de acuerdo con los terciles más bajo (cuadrado) y más alto (círculo) de la puntuación MPS dentro de los subtipos para el subtipo Luminal A; el valor p mostrado se calcula utilizando estadísticas de rango logarítmico.
La Figura 28C muestra la distribución de la actividad de la ruta sobre los subtipos de cáncer de mama de acuerdo con los subtipos intrínsecos del algoritmo PAM50 para el subtipo Luminal B.
La Figura 28D muestra un gráfico de Kaplan-Meier de la distribución de la actividad de la ruta sobre los subtipos de cáncer de mama de acuerdo con los subtipos intrínsecos del algoritmo PAM50; y la supervivencia libre de recaída asociada de acuerdo con los terciles más bajo (cuadrado) y más alto (círculo) de la puntuación MPS dentro de los subtipos para el subtipo Luminal B; el valor p mostrado se calcula utilizando estadísticas de rango logarítmico. La Figura 28E muestra la distribución de la actividad de la ruta sobre los subtipos de cáncer de mama de acuerdo con los subtipos intrínsecos del algoritmo PAM50 para el subtipo enriquecido en HER2.
La Figura 28F muestra un gráfico de Kaplan-Meier de la distribución de la actividad de la ruta sobre los subtipos de cáncer de mama de acuerdo con los subtipos intrínsecos del algoritmo PAM50; y la supervivencia libre de recaída asociada de acuerdo con los terciles más bajo (cuadrado) y más alto (círculo) de la puntuación MPS dentro de los subtipos para el subtipo enriquecido con h ER2; el valor p mostrado se calcula utilizando estadísticas de rango logarítmico.
La Figura 28G muestra la distribución de la actividad de la ruta sobre los subtipos de cáncer de mama de acuerdo con los subtipos intrínsecos del algoritmo PAM50 para el subtipo basal.
La Figura 28H muestra un gráfico de Kaplan-Meier de la distribución de la actividad de la ruta sobre los subtipos de cáncer de mama de acuerdo con los subtipos intrínsecos del algoritmo PAM50; y la supervivencia libre de recaída asociada de acuerdo con los terciles más bajo (cuadrado) y más alto (círculo) de la puntuación MPS dentro de los subtipos para el subtipo basal; el valor p mostrado se calcula utilizando estadísticas de rango logarítmico.
La Figura 28I muestra la distribución de la actividad de la ruta sobre los subtipos de cáncer de mama de acuerdo con los subtipos intrínsecos del algoritmo PAM50 para el subtipo de tipo normal.
La Figura 28J muestra un gráfico de Kaplan-Meier de la distribución de la actividad de la ruta sobre los subtipos de cáncer de mama de acuerdo con los subtipos intrínsecos del algoritmo PAM50; y la supervivencia libre de recaída asociada de acuerdo con los terciles más bajo (cuadrado) y más alto (círculo) de la puntuación MPS dentro de los subtipos para el subtipo de tipo normal; el valor p mostrado se calcula utilizando estadísticas de rango logarítmico. La Figura 29A muestra la comparación de MPS con la puntuación de recurrencia de genes 21 (RS). Para los 1005 pacientes del conjunto de prueba, se calculó el RS, MPS y la puntuación combinada como se describe. Tasa de recurrencia de la enfermedad en función de MPS (triángulo), RS de genes 21 (cuadrado) y puntuación combinada (círculo) dentro de los 5 años.
La Figura 29B muestra la comparación de MPS con la puntuación de recurrencia de genes 21 (RS). Para los 1005 pacientes del conjunto de prueba, se calculó el RS, MPS y la puntuación combinada como se describe. Tasa de recurrencia de la enfermedad en función de MPS (triángulo), RS de genes 21 (cuadrado) y puntuación combinada (círculo) en 10 años.
La Figura 29C muestra la comparación de MPS con la puntuación de recurrencia de genes 21 (RS). Para los 1005 pacientes del conjunto de prueba, se calculó el RS, MPS y la puntuación combinada como se describe. Las distribuciones de la MPS, la puntuación de recurrencia de genes 21 (RS) y la puntuación combinada correspondientes a la Figura 29A se muestran durante 5 años.
La Figura 29D muestra la comparación de MPS con la puntuación de recurrencia de genes 21 (RS). Para los 1005 pacientes del conjunto de prueba, se calculó el RS, MPS y la puntuación combinada como se describe. Las distribuciones de la MPS, la puntuación de recurrencia de genes 21 (RS) y la puntuación combinada correspondientes a la Figura 29B se muestran durante 10 años.
La Figura 29E muestra la comparación de MPS con la puntuación de recurrencia de genes 21 (RS). Para los 1005 pacientes del conjunto de prueba, se calculó el RS, MPS y la puntuación combinada como se describe. Las curvas ROC para la recurrencia de la enfermedad en 5 años (*: p <0.05, **: p <0.01, ****: p <0.0001) muestran que MPS y RS son comparables, pero la puntuación combinada de ambas funciones es estadísticamente más precisas.
La Figura 29F muestra la comparación de MPS con la puntuación de recurrencia de genes 21 (RS). Para los 1005 pacientes del conjunto de prueba, se calculó el RS, MPS y la puntuación combinada como se describe. Las curvas ROC para la recurrencia de la enfermedad dentro de los 10 años (*: p <0.05, **: p <0.01, ****: p <0.0001) muestran que MPS es estadísticamente más precisa que RS.
La Figura 30 muestra las predicciones de la actividad de la ruta de señalización celular de TGF-p del modelo de red bayesiana entrenada usando la "lista de 11 genes diana" para células epiteliales ectocervicales (Ect1) estimuladas con plasma seminal o TGF-p3 5 ng/ml (GSE35830). (Leyenda: 1 - Control, sin TGF-p; 2 - Estimulado con plasma seminal al 10 %; 3 - Estimulado con 5 ng/mL TGF-p3)
La Figura 31 muestra las predicciones de la actividad de la ruta de señalización celular de TGF-p del modelo de red bayesiana entrenada utilizando los "11 genes diana lista SERPINE1" para las células epiteliales ectocervicales (Ect1) estimuladas con plasma seminal o 5 ng/ml de TGF-p3 (GSE35830). (Leyenda: 1 - Control, sin TGF-p; 2 -Estimulado con plasma seminal al 10 %; 3 - Estimulado con 5 ng/mL TGF-p3)
La Figura 32 muestra las predicciones de la actividad de la ruta de señalización celular de TGF-p del modelo de red bayesiana entrenada utilizando la "lista de genes de 11 diana" en cultivos 2D y 3D de líneas celulares de adenocarcinoma de pulmón A549 estimuladas con o sin un TNF de 10 ng/ml y 2 ng/ml de TGF-p (GSE42373). (Leyenda: 1 - control 2D, 2 -2D TGF-p y TNFa, 3 - control 3D, 4 - 3D TGF-p y TNFa)
La Figura 33 muestra las predicciones de la actividad de la ruta de señalización celular de TGF-p del modelo de red bayesiana entrenada utilizando los "11 genes diana lista SERPINE1" en cultivos 2D y 3D de líneas celulares de adenocarcinoma pulmonar A549 estimuladas con o sin un TNF de 10 ng/ml. y 2 ng/ml de TGF-p (GSE42373). (Leyenda: 1 - control 2D, 2 -2D TGF-p y TNFa, 3 - control 3D, 4 - 3D TGF-p y TNFa)
La Figura 34 muestra las predicciones de la actividad de la ruta de señalización celular de TGF-p del modelo de red bayesiana entrenada usando la "lista de 11 genes diana" en pacientes con glioma y algunas muestras de control de GSE16011. (Leyenda: 1 - Astrocitoma (grado II); 2 - Astrocitoma (grado III); 3 - Control; 4 - Glioblastoma multiforme (grado IV); 5 - Oligoastrocítico (grado II); 6 - Oligoastrocítico (grado III); 7 - Oligodendroglial (grado II); 8 -Oligodendroglial (grado III); 9 - Astrocitoma pilocítico (grado I))
La Figura 35 muestra las predicciones de la actividad de la ruta de señalización celular de TGF-p del modelo de red bayesiana entrenada usando los "11 genes diana lista SERPINE1" en pacientes con glioma y algunas muestras de control de GSE16011. (Leyenda: 1 - Astrocitoma (grado II); 2 - Astrocitoma (grado III); 3 - Control; 4 - Glioblastoma multiforme (grado IV); 5 - Oligoastrocítico (grado II); 6 - Oligoastrocítico (grado III); 7 - Oligodendroglial (grado II); 8 -Oligodendroglial (grado III); 9 - Astrocitoma pilocítico (grado I))
Descripción detallada de realizaciones
Los siguientes ejemplos simplemente ilustran métodos particularmente preferidos y aspectos seleccionados en relación con los mismos. Las enseñanzas proporcionadas en los mismos pueden usarse para construir varias pruebas y/o kits. Los siguientes ejemplos no deben interpretarse como limitantes del alcance de la presente invención.
Ejemplo 1: Inferir la actividad de dos o más rutas de señalización celular
Como se describe en detalle en la solicitud de patente internacional publicada WO 2013/011479 A2 ("Assessment of cellular signaling pathway activity using probabilistic modeling of target gene expression"), construyendo un modelo probabilístico, por ejemplo, un modelo bayesiano, e incorporando relaciones probabilísticas condicionales entre los niveles de expresión de varios genes diana diferentes y la actividad de la ruta de señalización celular, tal modelo puede usarse para determinar la actividad de la ruta de señalización celular con un alto grado de precisión. Además, el modelo probabilístico se puede actualizar fácilmente para incorporar conocimiento adicional obtenido por estudios clínicos posteriores, ajustando las posibilidades condicionales y/o agregando nuevos nodos al modelo para representar fuentes de información adicionales. De esta manera, el modelo probabilístico se puede actualizar de acuerdo como corresponda para incorporar los conocimientos médicos más recientes.
Cuando se usa esta metodología los genes diana Wnt, los genes diana ER y los genes diana HH se seleccionan preferiblemente de acuerdo con los métodos descritos en las secciones "Ejemplo 3: Selección de genes diana" y "Ejemplo 4: Comparación de lista curada por evidencias y lista amplia de la literatura" de WO 2013/011479 A2 y el modelo probabilístico se entrena preferiblemente de acuerdo con los métodos descritos en" Ejemplo 5: Entrenamiento y uso de la red bayesiana" de WO 2013/011479 A2. Una elección adecuada de los genes diana que se utilizan para determinar la actividad de la ruta Wnt, la ruta ER y la ruta AR se define en las reivindicaciones adjuntas.
En otra metodología fácil de comprender e interpretar descrita en detalle en la solicitud de patente internacional publicada WO 2014/102668 A2 ("Assessment of cellular signaling pathway activity using linear combination(s) of target gene expressions"), la actividad de un cierta ruta de señalización celular se determina mediante el constructo de un modelo matemático (por ejemplo, un modelo lineal o (pseudo)lineal) que incorpora relaciones entre los niveles de expresión de uno o más genes diana de una ruta de señalización celular y el nivel de actividad de un elemento de transcripción de factor (TF), el elemento TF que controla la transcripción de uno o más genes diana de la ruta de señalización celular, el modelo se basa en una o más combinaciones lineales de niveles de expresión de uno o más genes diana(s).
Cuando se usa esta metodología, los genes diana Wnt, los genes diana ER y los genes diana HH se seleccionan preferiblemente de acuerdo con los métodos descritos en las secciones "Ejemplo 2: Selección de genes diana" y "Ejemplo 3: Comparación de lista curada por evidencias y lista amplia de la literatura" de WO 2014/102668 A2 y el modelo matemático se entrena preferiblemente de acuerdo con los métodos descritos en el "Ejemplo 4: Entrenamiento y uso del modelo matemático" de WO 2014/102668 A2. La elección de los genes diana definidos en las reivindicaciones adjuntas también es útil para determinar la actividad de la ruta Wnt, la ruta ER y la ruta HH con esta metodología posterior.
Con respecto a los dos enfoques diferentes, los niveles de expresión de uno o más genes diana pueden ser preferiblemente mediciones del nivel de ARNm, que puede ser el resultado de, por ejemplo, (RT)-PCR y técnicas de microarreglos que utilizan sondas asociadas con las secuencias de ARNm del gen o genes diana y de secuenciación de ARN. En otra realización, los niveles de expresión de uno o más genes diana pueden medirse mediante niveles de proteínas, por ejemplo, las concentraciones de las proteínas codificadas por los genes diana.
Los niveles de expresión mencionados anteriormente se pueden convertir opcionalmente de muchas formas que podrían adaptarse mejor o no a la aplicación. Por ejemplo, cuatro transformaciones diferentes de los niveles de expresión, por ejemplo, niveles de ARNm basados en microarreglos, pueden ser:
• "datos continuos", es decir, niveles de expresión obtenidos después del preprocesamiento de microarreglos utilizando algoritmos bien conocidos como MAS5.0 y fRMA,
• "puntuación z", es decir, niveles de expresión continúa escalados de manera que el promedio de todas las muestras sea 0 y la desviación estándar sea 1,
• "discreto", es decir, cada expresión por encima de un cierto umbral se establece en 1 y por debajo de él en 0 (por ejemplo, el umbral para un conjunto de sondas puede elegirse como la mediana de su valor en un conjunto de un número de valores positivos y el mismo número de muestras clínicas negativas),
• "difuso", es decir, los niveles de expresión continuos se convierten a valores entre 0 y 1 usando una función sigmoidea del siguiente formato: 1/(1 exp((thr - expr)/se)), siendo expr el continuo niveles de expresión, siendo thr el umbral como se mencionó anteriormente y siendo un parámetro de ablandamiento que influye en la diferencia entre 0 y 1.
Uno de los modelos más simples que se pueden construir es un modelo que tiene un nodo que representa el elemento del factor de transcripción (TF) en una primera capa y nodos ponderados que representan mediciones directas de los niveles de intensidad de expresión de los genes diana, por ejemplo, por un conjunto de sondas que está en particular altamente correlacionado con el gen diana particular, por ejemplo, en experimentos de microarreglos o (q)PCR, en una segunda capa. Los pesos se pueden basar en cálculos de un conjunto de datos de entrenamiento o en conocimientos de expertos. Esta metodología de uso, en el caso en donde posiblemente se midan múltiples niveles de expresión por gen diana (por ejemplo, en el caso de experimentos de microarreglos, en donde un gen diana se puede medir con múltiples conjuntos de sondas), solo un nivel de expresión por gen diana es particularmente simple. Una forma específica de seleccionar el nivel de expresión que se usa para un gen diana particular es usar el nivel de expresión del conjunto de sondas que es capaz de separar mejor las muestras activas y pasivas de un conjunto de datos de entrenamiento. Un método para determinar este conjunto de sondas es realizar una prueba estadística, por ejemplo, la prueba t, y seleccionar el conjunto de sondas con el valor p más bajo. Los niveles de expresión del conjunto de datos de entrenamiento de la sonda con el valor p más bajo es, por definición, la sonda con la menor probabilidad de que los niveles de expresión de las muestras activas y pasivas (conocidas) se superpongan. Otro método de selección se basa en razones de posibilidades. En tal modelo, se proporcionan uno o más niveles de expresión para cada uno de los uno o más genes diana y una o más combinaciones lineales comprenden una combinación lineal que incluye para cada uno de los uno o más genes diana gen(s) un término ponderado, cada término ponderado se basa en un solo nivel de expresión del uno o más niveles de expresión proporcionados para el gen diana respectivo. Si se elige el único nivel de expresión por gen diana como se describe anteriormente, el modelo puede denominarse modelo de "conjuntos de sondas más discriminantes".
En una alternativa al modelo de "conjuntos de sondas más discriminantes", es posible, en el caso en donde posiblemente se midan múltiples niveles de expresión por gen diana, hacer uso de todos los niveles de expresión que se proporcionan por gen diana. En tal modelo, se proporcionan uno o más niveles de expresión para cada uno de los uno o más genes diana y la o las combinaciones lineales comprenden una combinación lineal de todos los niveles de expresión de uno o más niveles de expresión proporcionados para uno o más genes diana. En otras palabras, para cada uno de los uno o más genes diana, cada uno de los uno o más niveles de expresión proporcionados para el gen diana respectivo puede ponderarse en la combinación lineal por su propio peso (individual). Esta variante puede denominarse modelo de "todos los conjuntos de sondas". Tiene la ventaja de ser relativamente simple y al mismo tiempo hacer uso de todos los niveles de expresión proporcionados.
Ambos modelos descritos anteriormente tienen en común que son lo que pueden considerarse modelos de "capa única", en los que el nivel de actividad del elemento TF se calcula basándose en una combinación lineal de niveles de expresión.
Una vez que se ha determinado el nivel de actividad del elemento TF mediante la evaluación del modelo respectivo, el nivel de actividad del elemento TF determinado se puede establecer como umbral para inferir la actividad de la ruta de señalización celular. Un método para calcular tal umbral apropiado es comparando el nivel de actividad del elemento TF determinado wlc de muestras de entrenamiento que se sabe que tienen una ruta pasiva y muestras de entrenamiento con una ruta activa. Un método que lo hace y también tiene en cuenta la varianza en estos grupos se da mediante el uso de un umbral
Figure imgf000015_0001
donde a y p son la desviación estándar y la media de las muestras de entrenamiento. En caso de que solo haya una pequeña cantidad de muestras disponibles en las muestras de entrenamiento activas y/o pasivas, se puede agregar un pseudocontento a las varianzas calculadas en función del promedio de las varianzas de los dos grupos:
Figure imgf000015_0002
donde v es la varianza de los niveles de actividad del elemento TF determinados wlc de los grupos, x es un pseudocontento positivo, por ejemplo, 1 o 10, y nact y npas son el número de muestras activas y pasivas, respectivamente. La desviación estándar a se puede obtener tomando la raíz cuadrada de la varianza v.
El umbral se puede restar del nivel de actividad determinado del elemento TF wlc para facilitar la interpretación, lo que da como resultado la puntuación de actividad de la ruta de señalización celular, de modo que los valores negativos corresponden a una ruta de señalización celular pasiva y los valores positivos a una ruta de señalización celular activa.
Como alternativa a los modelos de "capa única" descritos, se puede utilizar un modelo de "dos capas" que represente la determinación experimental de la señalización activa de una ruta. Para cada gen diana, se calcula un nivel de resumen utilizando una combinación lineal basada en las intensidades medidas de sus conjuntos de sondas asociados ("primera capa (inferior)"). El valor de resumen calculado se combina posteriormente con los valores de resumen de los otros genes diana de la ruta usando una combinación lineal adicional ("segunda capa (superior)"). Los pesos se pueden aprender de un conjunto de datos de entrenamiento o basarse en el conocimiento de expertos o en una combinación de los mismos. Expresado de forma diferente, en el modelo de "dos capas", se proporcionan uno o más niveles de expresión para cada uno de los genes diana y la combinación o combinaciones lineales comprenden para cada uno de los o más genes diana una primera combinación lineal de todos los niveles de expresión del uno o más niveles de expresión proporcionados para el gen diana respectivo ("primera capa (inferior)". El modelo se basa además en una combinación lineal adicional que incluye para cada uno o más genes diana un término ponderado, cada término ponderado se basa en la primera combinación lineal para el gen diana respectivo ("segunda capa (superior").
El cálculo de los valores de resumen puede, en una versión preferida del modelo de "dos capas", incluir la definición de un umbral para cada gen diana utilizando los datos de entrenamiento y restando el umbral de la combinación lineal calculada, obteniendo el resumen de genes. Aquí, el umbral puede elegirse de manera que un nivel de resumen de genes negativo se corresponda con un gen diana regulado negativamente y que un nivel de resumen de genes positivo se corresponda con un gen diana regulado positivamente. Además, es posible que los valores de resumen de genes se transformen usando, por ejemplo, una de las transformaciones mencionadas anteriormente (difusa, discreta, etc.) antes de que se combinen en la "segunda capa (superior').
Una vez que se ha determinado el nivel de actividad del elemento TF mediante la evaluación del modelo de "dos capas", el nivel de actividad del elemento TF determinado se puede establecer como umbral para inferir la actividad de la ruta de señalización celular, como se describió anteriormente.
En la presente, los modelos descritos anteriormente con referencia al documento WO 2014/102668 A2 se denominan colectivamente como "modelos (pseudo)lineales".
Si bien la descripción anterior con respecto al constructo del modelo matemático también se aplica a la inferencia de la actividad de la ruta TGF-p y la ruta PI3K, la selección de los genes diana y el entrenamiento y uso del modelo matemático se modificó a algunos se extienden para la ruta TGF-p y la ruta PI3K en comparación con la ruta Wnt, la ruta ER y la ruta HH. Por lo tanto, estos pasos se describirán para la ruta de TGF-p con más detalle más adelante. A partir de entonces, esto se describirá para la ruta PI3K:
(A) Ruta de TGF-p
(i) Selección de genes diana
Un factor de transcripción (TF) es un complejo proteico (es decir, una combinación de proteínas unidas entre sí en una estructura específica) o una proteína que es capaz de regular la transcripción de genes diana uniéndose a secuencias de a Dn específicas, controlando así la transcripción de información genética del ADN al ARNm. El ARNm producido directamente debido a esta acción del complejo TF se denomina en el presente documento "gen diana directo" (del factor de transcripción). La activación de la ruta de señalización celular también puede dar como resultado una transcripción de genes más secundarios, denominados "genes diana indirectos". Más adelante, se prefieren los modelos (pseudo)lineales o modelos de red bayesiana (como modelos matemáticos de ejemplo) que comprenden o consisten en genes diana directos como enlaces directos entre la actividad de la ruta de señalización celular y el nivel de ARNm, sin embargo, la distinción entre diana directa e indirecta genes no siempre es evidente.
En este documento, se presenta un método para seleccionar genes diana directos utilizando una función de puntuación basada en los datos de la literatura científica disponible. No obstante, no se puede descartar una selección accidental de genes diana indirectos debido a la información limitada, así como a variaciones e incertidumbres biológicas. Para seleccionar los genes diana, se empleó la base de datos MEDLINE del National Institute of Health accesible en "www.ncbi.nlm.nih.gov/pubmed" y en lo sucesivo denominada "Pubmed" para generar una lista de diana seleccionada genes.
Se buscaron publicaciones que contenían genes diana de TGF-p putativos mediante consultas como ("TGF-p" Y "gen diana") en el período del cuarto trimestre de 2013 y el primer trimestre de 2014. Las publicaciones resultantes fueron analizadas en mayor profundidad de forma manual siguiendo la metodología que se describe con más detalle más adelante.
Los genes diana de ARNm de la ruta de señalización celular específica se seleccionaron de la literatura científica, usando un sistema de clasificación en donde la evidencia científica para un gen diana específico recibió una calificación, dependiendo del tipo de experimentos científicos en los que se acumuló la evidencia. Si bien algunas pruebas experimentales sugieren simplemente que un gen es un gen diana directo, como, por ejemplo, un ARNm que aumenta de acuerdo con se detecta mediante una intensidad creciente de un conjunto de sondas en un microarreglo de una línea celular en la que se sabe que el eje de señalización celular TGF-p está activo, otras pruebas pueden ser muy fuertes, como la combinación de un sitio de unión TF de la ruta de señalización celular identificada y la recuperación de este sitio en un ensayo de inmunoprecipitación de cromatina (ChIP) después de la estimulación de la ruta de señalización celular específica en la célula y aumento de ARNm después de la estimulación específica de la ruta de señalización celular en una línea celular.
En la literatura científica se pueden identificar varios tipos de experimentos para encontrar genes diana de rutas de señalización celular específicas:
1. Experimentos de ChIP en los que se muestra la unión directa de un TF de la ruta de señalización celular de interés a su sitio de unión en el genoma. Ejemplo: mediante el uso de la tecnología de inmunoprecipitación de cromatina (ChIP), posteriormente se identificaron sitios de unión de TF TGF-p funcionales putativos en el ADN de líneas celulares con y sin inducción activa de la ruta de TGF-p, por ejemplo, mediante estimulación con TGF-p, como un subconjunto de los sitios de unión reconocidos puramente con base en la secuencia de nucleótidos. La funcionalidad putativa se identificó como evidencia derivada de ChIP de que se encontró que el TF se unía al sitio de unión del ADN.
2. Ensayos de desplazamiento de movilidad electroforética (EMSA) que muestran la unión in vitro de un TF a un fragmento de ADN que contiene la secuencia de unión. En comparación con la evidencia basada en ChIP, la evidencia basada en EMSA es menos fuerte, ya que no se puede traducir a la situación in vivo.
3. Estimulación de la ruta de señalización celular y medición de la expresión de ARNm mediante microarreglos, secuenciación de ARN, PCR cuantitativa u otras técnicas, utilizando líneas celulares inducibles por ruta de señalización celular y medición de perfiles de ARNm medidos al menos en uno, pero preferiblemente en varios puntos de tiempo después de la inducción. en presencia de cicloheximida, que inhibe la traducción a proteína, se supone que los ARNm inducidos son genes diana directos.
4. Similar a 3, pero alternativamente medir la expresión de ARNm más corriente abajo con mediciones de abundancia de proteínas, como inmunoprecipitación Western.
5. Identificación de sitios de unión de TF en el genoma utilizando un enfoque bioinformático. Ejemplo para el elemento TGF-p TF: utilizando el motivo de unión SMAD 5-AGAC-3', se ejecutó un programa de software en la secuencia del genoma humano y se identificaron los sitios de unión potenciales, tanto en las regiones promotoras de genes como en otras regiones genómicas.
6. Similar a 3, solo en ausencia de cicloheximida.
7. Similar al 4, solo en ausencia de cicloheximida.
En la forma más simple, se puede dar a cada gen potencial 1 punto para cada uno de estas metodologías experimentales en las que el gen se identificó como un gen diana de la familia de factores de transcripción TGF-p. Usando esta estrategia de clasificación relativa, se puede hacer una lista de los genes diana más confiables.
Alternativamente, se puede usar la clasificación de otra manera para identificar los genes diana que tienen más posibilidades de ser genes diana directos, dando un mayor número de puntos a la tecnología que proporciona la mayor evidencia de un gen diana directo in vivo. En la lista anterior, esto significaría 8 puntos para el enfoque experimental 1), 7 para 2) y bajar a 1 punto para el enfoque experimental 8). Esta lista puede denominarse "lista general de genes diana".
A pesar de las variaciones e incertidumbres biológicas, los inventores supusieron que los genes diana directos son los que tienen más posibilidades de ser inducidos de manera independiente del tejido. Una lista de estos genes diana puede denominarse "lista de genes diana curada por evidencias". Esta lista de genes diana curada por evidencias se ha utilizado para construir modelos computacionales de la ruta TGF-p que se pueden aplicar a muestras procedentes de diferentes fuentes de tejido.
Lo siguiente ilustrará a modo de ejemplo cómo se construyó específicamente la selección de una lista de genes diana curada por evidencias para la ruta de TGF-p.
Se introdujo una función de puntuación que daba un punto para cada tipo de evidencia experimental, como ChIP, EMSA, expresión diferencial, bloqueo/anulación, ensayo de indicador del gen de luciferasa, análisis de secuencia, que se informó en una publicación. A veces, la misma evidencia experimental se menciona en varias publicaciones que dan como resultado un número correspondiente de puntos, por ejemplo, dos publicaciones que mencionan un resultado de ChIP dan como resultado el doble de la puntuación que se otorga para un único resultado de ChIP. Se realizó un análisis adicional para permitir solo genes que tenían diversos tipos de evidencia experimental y no solo un tipo de evidencia experimental, por ejemplo, expresión diferencial. Se seleccionaron aquellos genes que tenían más de un tipo de evidencia experimental disponible (como se muestra en la Tabla 1).
Los inventores realizaron una selección adicional de la lista curada por evidencias de genes diana (enumerados en la Tabla 1). Se seleccionaron los genes diana de la lista de pruebas curadas que demostraron ser más probatorios para determinar la actividad de la ruta TGF-p de las muestras de entrenamiento. Aquí, las muestras de GSE17708 estimuladas con 5 ng/ml de TGF-p durante 4 horas se eligieron como actividad de TGF-p activa o promotora de tumores, mientras que las muestras no estimuladas se eligieron como muestras de TGF-p pasivas o supresoras de tumores para el entrenamiento, alternativamente, una puede usar muestras de pacientes de células primarias u otras líneas celulares estimuladas y privadas de TGF-p, por ejemplo, GSE6653, GSE42373 y GSE18670. Todos los genes diana que tenían una relación de posibilidades "blanda" entre las muestras de entrenamiento activo y pasivo de más de 2 o menos de 0.5 para genes diana regulados negativamente se seleccionaron para la "lista corta de 20 genes diana". Los genes diana que se encontró que tenían una relación de posibilidades "blanda" de más de 10 o menos de 0,1 se seleccionan para la "lista corta de 12 genes diana". La "lista corta de 7 genes diana" consiste en genes diana que se encontró que tenían una relación de posibilidades "blanda" de más de 15 o menos de 1/15. La lista de 20 genes diana, la lista de 12 genes diana y la lista de 7 genes diana se muestran en las Tablas 2 a 4, respectivamente.
Tabla 1: "Lista curada por evidencias de genes diana" de la ruta TGF-p usada en los modelos de red bayesiana y n n n i r m ir l niv l x r i n ARNm l n i n .
Figure imgf000017_0001
continuación
Figure imgf000018_0001
Tabla 2: "Lista corta de 20 genes diana" de genes diana de TGF-p basada en la lista de genes diana curada por evidencias.
Figure imgf000018_0002
continuación
Figure imgf000019_0006
Tabla 3: "Lista corta de 12 genes diana" de genes diana de TGF-p basada en la lista de genes diana curada por evidencias.
Figure imgf000019_0001
Tabla 4: "Lista corta de 7 genes diana" de genes diana de TGF-p basada en la lista de genes diana curada por evidencias.
Figure imgf000019_0002
Figure imgf000019_0003
Figure imgf000019_0004
Figure imgf000019_0005
Figure imgf000020_0001
En enero de 2015 se realizó una revisión de la evidencia bibliográfica disponible de TGF-p, que también incluyó todos los artículos científicos nuevos hasta el 19 de enero de 2015. De manera similar, se encontraron publicaciones utilizando la base de datos MEDLINE del National Institute of Health accesible en "www.ncbi.nlm.nih.gov/pubmed "utilizando consultas como ("TGF-p "Y" gen diana "). Después de evaluar manualmente los artículos científicos en busca de evidencia experimental de que varios genes diana son un gen diana putativo de TGF-p utilizando la metodología descrita en el Ejemplo 2 anterior, varios genes diana de TGF-p putativos, sin explotar en la evaluación inicial durante el cuarto trimestre de 2013 y el primer trimestre de 2014. Se reevaluó toda la evidencia experimental disponible y se preparó una nueva clasificación de genes diana putativos basándose en la fuerza de la evidencia experimental disponible para el gen diana putativo utilizando la metodología descrita en este Ejemplo. Esto dio como resultado un gen diana de TGF-p putativo adicional, SERPINE1, que logró una puntuación de evidencia experimental por encima del umbral establecido. En consecuencia, se consideró que SERPINE1 era un gen diana directo genuino de la ruta TGF-p y se probó para cálculos mejorados del nivel de actividad de la ruta TGF-p. Uso de dos redes bayesianas basadas en los 11 genes diana mejor clasificados: ANGPTL4, CDC42EP3, CDKN1A, CTGF, GADD45B, 1D1 , JUNB, SKIL, SMAD7, SNAI2 y VEGFA más o menos el SERPINE1 recién seleccionado entrenado con los mismos datos y metodología descritos en el presente documento, lo que da como resultado un modelo de "11 genes diana lista SERPINE1" (véase Tabla 5) y un modelo de "lista de 11 genes diana" (véase Tabla 6), respectivamente.
Tabla 5: "Lista de 11 enes diana SERPINE1" o "lista revisada de 12 enes diana" de enes diana TGF- .
Figure imgf000020_0002
Tabla 6: "Lista de 11 enes diana" de enes diana de TGF- .
Figure imgf000020_0003
Figure imgf000021_0003
Con base en la inclusión adicional del gen SERPINE1, las listas de genes diana para TGF-p pueden revisarse en realizaciones no limitantes adicionales, como se describe en las Tablas 7 y 8.
Tabla 7: "Lista revisada de 20 enes diana" de enes diana de TGF- .
Figure imgf000021_0002
Tabla 8: "Lista revisada de 7 enes diana" de enes diana de TGF- .
Figure imgf000021_0001
Figure imgf000022_0001
Se espera que la inclusión de un gen diana más en la inferencia matemática de los niveles de actividad de la ruta tenga un pequeño efecto sobre las predicciones de los niveles de actividad de la ruta, que se anticipa que escalará el nivel de actividad de la ruta minuciosamente. Sin embargo, se determina que, además de este efecto anticipado, también hay niveles de actividad de la ruta marcadamente diferentes en varios ejemplos que solo pueden ser explicados por SERPINE1 que tiene un efecto ventajoso inesperado sobre la inferencia de la actividad de la ruta. Las Figuras 30 y 31 muestran las predicciones de la actividad de la ruta de señalización celular de TGF-p usando ambos modelos en líneas celulares Ect1 estimuladas con plasma seminal o TGF-p3 5 ng/ml o sin estimulación de GSE35830. Es claramente visible que incluir SERPINE1 como un gen diana adicional mejora la capacidad del modelo para detectar muestras pasivas con mayor precisión. Además, las predicciones del modelo del segundo grupo estimulado con plasma seminal y del tercer grupo estimulado con TGF-p3 son más precisas ya que predicen una mayor actividad de la ruta de señalización celular TGF-p.
Un segundo ejemplo de predicciones mejoradas de la actividad de la ruta de señalización celular de TGF-p se encuentra en muestras de líneas celulares de adenocarcinoma de pulmón A549 cultivadas en cultivos 2D y 3D estimulados con o sin TNF y TGF-p. Las predicciones del modelo que utilizan tanto el modelo de red bayesiana de "lista de 11 genes diana" y el modelo de red bayesiana de "genes de 11 objetivos SERPINE1" se muestran en las Figuras 32 y 33. La EMT solo se indujo eficazmente en el modelo de cultivo 3D con estimulación (grupo 4). Esta inducción de EMT se diagnostica con una mayor precisión en el modelo "11 genes diana lista SERPINE1" en comparación con el modelo "11 genes diana lista", también en caso de que se considere la diferencia relativa entre los grupos 3 y 4.
Un tercer ejemplo son las predicciones de la actividad de señalización celular de TGF-p usando ambos modelos en pacientes con glioma y algunas muestras de control de GSE16011. Se sabe por la literatura que la señalización de TGF-p juega un papel importante en los gliomas (véase B. Kaminska et al., "t Gf beta signaling and its role in glioma pathogenesis, Advances in Experimental Medicine and Biology, Vol. 986, 2013, páginas 171 a 187). La red bayesiana basada en la "lista de 11 genes diana SERPINE1" de genes diana TGF-p mejora la separación de muestras pasivas de las activas en comparación con la red bayesiana de la "lista de 11 genes diana". Además, se predice que una fracción mayor de pacientes tiene una ruta de señalización celular TGF-p activa que está más en línea con el consenso científico (ver, por ejemplo, Kaminska et al.). Además, se predice que las muestras de cerebro normal tienen una ruta de señalización celular de TGF-p pasiva con mayores posibilidades, lo que está de acuerdo con el hecho de que se espera que la ruta de señalización celular de TGF-p esté en su papel supresor de tumores o papel pasivo.
El último ejemplo que demuestra las predicciones mejoradas de la actividad de la ruta de señalización celular de TGF-p al incluir SERPINE1 en el modelo de la ruta matemática se muestra comparando los resultados del análisis de regresión de Cox de los 284 pacientes con glioma de GSE16011 utilizando el modelo de red bayesiana basado en el "11 genes diana lista SERPINE1" de genes diana de TGF-p y la "lista de 11 genes diana" de genes diana. Como se muestra en las Figuras 34 y 35, el cociente de riesgo de la probabilidad de actividad de la ruta de señalización celular de TGF-p es significativamente mayor en caso de que se utilice la "lista de 11 genes diana SERPINE1" de genes diana de TGF-p: 2.57, p = 7.87e-10 frente a 2.33, p = 3.06e-7.
(ii) Entrenamiento y uso del modelo de ruta matemática
Antes de que se pueda usar el modelo de ruta matemática para inferir la actividad de la ruta de señalización celular, en este documento, la ruta de TGF-p, en un sujeto, el modelo debe entrenarse adecuadamente.
Si el modelo de ruta matemática es un modelo probabilístico, por ejemplo, un modelo de red bayesiana, basado en posibilidades condicionales que relacionan el elemento TGF-p TF y los niveles de expresión de los tres o más genes diana de la ruta TGF-p medidos en la muestra del sujeto, el entrenamiento se puede realizar preferiblemente como se describe en detalle en la solicitud de patente internacional publicada WO 2013/011479 A2 ("Assessment of cellular signaling pathway activity using probabilistic modeling of target gene expression").
Si el modelo de ruta matemática se basa en una o más combinaciones lineales de niveles de expresión de los tres o más genes diana de la ruta de TGF-p medidos en la muestra del sujeto, el entrenamiento se puede realizar preferiblemente como se describe en detalle en la solicitud de patente internacional publicada WO 2014/102668 A2 ("Assessment of cellular signaling pathway activity using linear combination(s) of target gene expressions").
En este documento, se usó un modelo de red bayesiana de ejemplo como se muestra en la Figura 2 para modelar el programa transcripcional de la ruta TGF-p de una manera simple. El modelo consta de tres tipos de nodos: (a) un elemento de factor de transcripción (TF) (con estados "ausente" y "presente") en una primera capa 1; (b) genes diana TG1, TG2, TGn (con estados "abajo" y "arriba") en una segunda capa 2, y; (c) nodos de medición vinculados a los niveles de expresión de los genes diana en una tercera capa 3. Estos pueden ser conjuntos de sondas de microarreglos PSi,i, PSi,2, PSi,3, PS2,i, PSn,i, PS„,m (con estados "bajo" y "alto"), como se usa preferiblemente en este documento, pero también podrían ser otras medidas de expresión génica tales como RNAseq o RT-qPCR.
Una implementación adecuada del modelo de ruta matemática, en este documento, el modelo de red bayesiano de ejemplo, se basa en datos de microarreglos. El modelo describe (i) cómo los niveles de expresión de los genes diana dependen de la activación del elemento TF, y (ii) cómo las intensidades del conjunto de sondas, a su vez, dependen de los niveles de expresión de los respectivos genes diana. Para este último, las intensidades del conjunto de sondas pueden tomarse de microarreglos Affymetrix HG-Ui33Plus2.0 preprocesados con fRMA, que están ampliamente disponibles en El ómnibus de expresión genética (GEO, www.ncbi.nlm.nih.gov/geo) y ArrayExpress (www ebi.ac.uk/arrayexpress).
Como el modelo de red bayesiano de ejemplo es una simplificación de la biología de una ruta de señalización celular, en este documento, la ruta TGF-p, y como las mediciones biológicas suelen ser ruidosas, se optó por un enfoque probabilístico, es decir, las relaciones entre (i) el elemento TF y los genes diana, y (ii) los genes diana y sus respectivos conjuntos de sondas, se describen en términos probabilísticos. Además, se asumió que la actividad de la ruta de señalización celular oncogénica que impulsa el crecimiento tumoral no se altera transitoria y dinámicamente, sino a largo plazo o incluso irreversiblemente. Por lo tanto, se desarrolló el modelo de red bayesiana de ejemplo para la interpretación de una condición celular estática. Por esta razón, no se incorporaron al modelo características complejas de la ruta de señalización celular dinámica.
Una vez que se construye y calibra el modelo de red bayesiana de ejemplo (véase más abajo), el modelo se puede usar en datos de microarreglos de una nueva muestra ingresando las mediciones del conjunto de sondas como observaciones en la tercera capa 3, e infiriendo hacia atrás en el modelo lo que la probabilidad debe haber sido que el elemento TF estuviera "presente". Aquí, se considera "presente" el fenómeno de que el elemento TF está unido al ADN y controla la transcripción de los genes diana de la ruta de señalización celular, y "ausente" el caso de que el elemento TF no controle la transcripción. Por lo tanto, esta probabilidad es la lectura primaria que se puede usar para indicar la actividad de la ruta de señalización celular, en este documento, la ruta de TGF-p, que más adelante se puede traducir en las posibilidades de que la ruta de señalización celular esté activa tomando la relación de la probabilidad de que sea activa frente a que sea pasiva (es decir, las posibilidades vienen dadas por p/(i-p), en donde p es la probabilidad predicha de que la ruta de señalización celular esté activa).
En el modelo de red bayesiano de ejemplo, las relaciones probabilísticas se han hecho cuantitativas para permitir un razonamiento probabilístico cuantitativo. Con el fin de mejorar el comportamiento de generalización a través de los tipos de tejidos, los parámetros que describen las relaciones probabilísticas entre (i) el elemento TF y los genes diana se han seleccionado cuidadosamente. Si el elemento TF está "ausente", lo más probable es que el gen diana esté "inactivo", por lo que se elige una probabilidad de 0.95 para esto, y se elige una probabilidad de 0.05 para que el gen diana esté "activo". La última probabilidad (distinta de cero) es para dar cuenta de la posibilidad (rara) de que el gen diana esté regulado por otros factores o de que se observe accidentalmente como "activo" (por ejemplo, debido al ruido de medición). Si el elemento TF está "presente", entonces con una probabilidad de 0.70 el gen diana se considera "activo", y con una probabilidad de 0.30 el gen diana se considera "inactivo". Los últimos valores se eligen de esta manera, porque puede haber varias causas por las que un gen diana no se expresa en gran medida, aunque el elemento TF esté presente, por ejemplo, porque la región promotora del gen está metilada. En el caso de que un gen diana no esté regulado al alza por el elemento TF, sino regulado negativamente, las posibilidades se eligen de manera similar, pero reflejando la regulación negativa ante la presencia del elemento TF. Los parámetros que describen las relaciones entre (ii) los genes diana y sus respectivos conjuntos de sondas se han calibrado con datos experimentales. Para este último, en este ejemplo, se utilizaron datos de microarreglos de muestras de pacientes que se sabe que tienen una ruta TGF-p activa, mientras que se usaron muestras normales y sanas del mismo conjunto de datos como muestras de la ruta TGF-p pasiva, pero esto también podría ser realizado utilizando experimentos de líneas celulares u otras muestras de pacientes con un estado de actividad de la ruta de señalización celular conocido. Las tablas de probabilidad condicional resultantes vienen dadas por:
A: P r n i n r l iiv m n
Figure imgf000024_0001
B: Para enes diana re ulados ne ativamente
Figure imgf000024_0002
En estas tablas, las variables ALij, AHij, PL¡j y PHij indican el número de muestras de calibración con un complejo de transcripción "ausente" (A) o "presente" (P) que tienen una intensidad del conjunto de sondas "baja" (L) o "alta" (H), respectivamente. Se han agregado recuentos ficticios para evitar posibilidades extremas de 0 y 1.
Para discretizar las intensidades observadas del conjunto de sondas, para cada conjunto de sondas PSi, j se utilizó un umbral ti, j, por debajo del cual la observación se denomina "baja" y por encima del cual se denomina "alta". Este umbral se ha elegido para que sea la intensidad media (ponderada) del conjunto de sondas en el conjunto de datos de calibración utilizado. Debido al ruido de los datos de microarreglos, se utilizó un método difuso al comparar la intensidad de un conjunto de sondas observada con su umbral, asumiendo una distribución normal con una desviación estándar de 0.25 (en una escala log2) alrededor de la intensidad informada y determinando la masa de probabilidad por debajo y por encima del umbral.
Si en lugar de la red bayesiana de ejemplo descrita anteriormente, se empleó un modelo (pseudo)lineal como se describe en el presente documento anteriormente, los pesos indican el signo y la magnitud de la correlación entre los nodos y un umbral para llamar si un nodo es "ausente" o "presente" debería determinarse antes de que el modelo pudiera usarse para inferir la actividad de la ruta de señalización celular en una muestra de prueba. Se podría usar el conocimiento experto para completar los pesos y el umbral a priori, pero típicamente el modelo se entrenaría usando un conjunto representativo de muestras de entrenamiento, de las cuales preferiblemente se conoce la verdad fundamental, por ejemplo, datos de expresión de conjuntos de sondas en muestras con un complejo de factor de transcripción "presente" conocido (= ruta de señalización celular activa) o complejo de factor de transcripción "ausente" (= ruta de señalización celular pasiva).
Se conocen en el campo una multitud de algoritmos de entrenamiento (por ejemplo, regresión) que tienen en cuenta la topología del modelo y cambian los parámetros del modelo, aquí, los pesos y el umbral, de modo que el resultado del modelo, aquí, una puntuación lineal ponderada, está optimizado. Alternativamente, también es posible calcular los pesos directamente a partir de los niveles de expresión observados de la expresión sin la necesidad de un algoritmo de optimización.
Un primer método, denominado método "blanco y negro" en este documento, se reduce a un sistema ternario, en donde cada peso es un elemento del conjunto {-1, 0, 1}. Si esto se pone en un contexto biológico, -1 y 1 corresponden a genes diana o conjuntos de sondas que están regulados hacia arriba y hacia abajo en el caso de la actividad de la ruta de señalización celular, respectivamente. En caso de que no se pueda demostrar estadísticamente que un conjunto de sondas o gen diana está regulado al alza o a la baja, recibe un peso de 0. En un ejemplo, una prueba t de dos muestras del lado izquierdo y del lado derecho de los niveles de expresión de las muestras de la ruta de señalización celular activa frente a los niveles de expresión de las muestras con una ruta de señalización celular pasiva se pueden usar para determinar si una sonda o gen está regulado por incremento o por disminución dados los datos de entrenamiento utilizados. En los casos en los que el promedio de las muestras activas es estadísticamente mayor que las muestras pasivas, es decir, el valor p está por debajo de un cierto umbral, por ejemplo, 0.3, se determina que el gen o conjunto de sondas diana está regulado positivamente. A la inversa, en los casos en los que el promedio de las muestras activas es estadísticamente menor que las muestras pasivas, se determina que el gen o conjunto de sondas diana está regulado por disminución tras la activación de la ruta de señalización celular. En caso de que el valor p más bajo (del lado izquierdo o derecho) supere el umbral mencionado anteriormente, el peso del gen o conjunto de sondas diana se puede definir en 0.
Un segundo método, denominado ponderaciones de “posibilidades logarítmicas” en este documento, se basa en el logaritmo (por ejemplo, base e) de la relación de posibilidades. La relación de posibilidades para cada gen diana o conjunto de sondas se calcula en función del número de muestras de entrenamiento positivas y negativas para las que el nivel del conjunto de sondas/gen diana está por encima y por debajo de un umbral correspondiente, por ejemplo, la mediana (ponderada) de todas las muestras de entrenamiento. Se puede agregar un pseudorrecuento para eludir las divisiones entre cero. Un perfeccionamiento adicional es contar las muestras por encima/por debajo del umbral de una manera algo más probabilística, asumiendo que los niveles del gen diana/conjunto de sondas son, por ejemplo, normalmente distribuido alrededor de su valor observado con una cierta desviación estándar especificada (por ejemplo, 0.25 en una escala de 2 log), y contando la masa de probabilidad por encima y por debajo del umbral. En este documento, una relación de posibilidades calculada en combinación con un pseudorrecuento y usando masas de probabilidad en lugar de valores de medición deterministas se denomina relación de posibilidades "blanda".
Se pueden encontrar más detalles sobre la inferencia de la actividad de la ruta de señalización celular utilizando modelos matemáticos de la expresión de genes diana en Verhaegh W. et al., "Selection of personalized patient therapy through the use of knowledge-based computational models that identify tumor-driving signal transduction pathways", Cancer Research, vol. 74, núm.11, 2014, págs. 2936 a 2945.
En este documento, los datos de expresión de muestras de líneas celulares de adenocarcinoma de pulmón humano A549 que se trataron con 5 ng/ml de TGF-p, lo que resultó en una actividad promotora de tumores de la ruta de TGF-p (de ahora en adelante denominada TGF-p activo) y un experimento de control sin estimulación de TGF-p, que dio como resultado una actividad supresora de tumores de la ruta de TGF-p (en adelante denominada TGF-p pasivo), se utilizó para la calibración. Estos microarreglos están disponibles públicamente bajo GSE17708 del ómnibus de expresión génica (GEO, www.ncbi.nlm.nih.gov/geo/, último acceso el 5 de marzo de 2014). Las muestras estimuladas con 5 ng/ml de TGF-p durante 4 horas se eligieron como representantes de las líneas celulares de TGF-p activas o promotoras de tumores en función del cambio de veces observado de los genes seleccionados (véase Tabla 1) en comparación con las muestras no estimuladas que se eligieron como muestras de TGF-p pasivas o supresoras de tumores para el entrenamiento. Alternativamente, se pueden usar muestras de pacientes de células primarias u otras líneas celulares estimuladas con y privadas de TGF-p, p. GSE6653, GSE42373 y GSE18670 y/o se pueden utilizar las listas cortas de genes diana de TGF-p (véanse las Tablas 2 a 4).
(B) Ruta PI3K
(i) Selección de genes diana
En lo que sigue, se prefieren los modelos de redes bayesianas (como modelos matemáticos de ejemplo) que comprenden o consisten en genes diana directos como enlaces directos entre la actividad de la ruta de señalización celular y el nivel de ARNm, sin embargo, la distinción entre genes diana directos e indirectos no siempre es evidente. En este documento, se presenta un método para seleccionar genes diana directos utilizando una función de puntuación basada en los datos de la literatura científica disponible. No obstante, no se puede descartar una selección accidental de genes diana indirectos debido a la información limitada, así como a variaciones e incertidumbres biológicas. Para seleccionar los genes diana, se utilizaron dos repositorios de la literatura científica actualmente disponible para generar dos listas de genes diana.
La primera lista de genes diana se generó con base en la literatura científica recuperada de la base de datos MEDLINE del National Institute of Health accesible en "www.ncbi.nlm.nih.gov/pubmed" y en el presente documento también se denomina "Pubmed". Las publicaciones que contenían supuestos genes diana de FOXO se buscaron mediante consultas como ("FOXO" Y "gen diana") en el período del primer trimestre de 2013. Las publicaciones resultantes se analizaron manualmente siguiendo la metodología que se describe con más detalle más adelante.
Los genes diana de ARNm de la ruta de señalización celular específica se seleccionaron de la literatura científica, usando un sistema de clasificación en donde la evidencia científica para un gen diana específico recibió una calificación, dependiendo del tipo de experimentos científicos en los que se acumuló la evidencia. Si bien algunas pruebas experimentales sugieren simplemente que un gen es un gen diana, como por ejemplo un ARNm que aumenta en una micromatriz de una línea celular en la que se sabe que el eje de señalización celular PI3K está activo, otras pruebas pueden ser muy sólidas, como la combinación de un sitio de unión TF de la ruta de señalización celular identificada y la recuperación de este sitio en un ensayo de inmunoprecipitación de cromatina (ChIP) después de la estimulación de la ruta de señalización celular específica en la célula y el aumento de ARNm después de la estimulación específica de la ruta de señalización celular en una célula línea.
En la literatura científica se pueden identificar varios tipos de experimentos para encontrar genes diana de rutas de señalización celular específicas:
1. Experimentos con chip en los que se muestra la unión directa de una ruta de señalización celular-TF a su sitio de unión en el genoma. Ejemplo: mediante el uso de la tecnología de inmunoprecipitación de cromatina (ChIP), se identificaron posteriormente sitios putativos de unión de FOXO TF funcionales en el ADN de líneas celulares con y sin inducción activa de la ruta PI3K, como un subconjunto de los sitios de unión reconocidos puramente con base en la secuencia de nucleótidos. La funcionalidad putativa se identificó como evidencia derivada de ChIP de que se encontró que el TF se unía al sitio de unión del ADN.
2. Ensayos de desplazamiento de movilidad electroforética (EMSA) que muestran la unión in vitro de un TF a un fragmento de ADN que contiene la secuencia de unión. En comparación con la evidencia basada en ChIP, la evidencia basada en EMSA es menos fuerte, ya que no se puede traducir a la situación in vivo.
3. Estimulación de la ruta de señalización celular y medición de perfiles de ARNm en una micromatriz o mediante secuenciación de ARN, utilizando líneas celulares inducibles por ruta de señalización celular y medición de perfiles de ARNm medidos en varios puntos de tiempo después de la inducción, en presencia de cicloheximida, que inhibe la traducción a proteína, por tanto, se supone que los ARNm inducidos son genes diana directos.
4. Similar a 3, pero usando PCR cuantitativa para medir las cantidades de ARNm.
5. Identificación de sitios de unión de TF en el genoma utilizando un enfoque bioinformático. Ejemplo para el elemento FOXO TF: utilizando el motivo de unión FOXO conservado 5-TTGTTTAC-3', se ejecutó un programa de software en la secuencia del genoma humano y se identificaron los sitios de unión potenciales, tanto en las regiones promotoras de genes como en otras regiones genómicas.
6. Similar a 3, solo en ausencia de cicloheximida.
7. Similar al 4, solo en ausencia de cicloheximida.
8. Perfilado de expresión de ARNm de muestras de tejido o células específicas de las que se sabe que la ruta de señalización celular está activa, sin embargo, en ausencia de la condición de control negativo adecuada.
En la forma más simple, se puede dar a cada ARNm diana potencial 1 punto para cada uno de estas metodologías experimentales en las que se identificó el ARNm diana.
Alternativamente, los puntos se pueden dar de forma incremental, lo que significa que una tecnología un punto, una segunda tecnología agrega un segundo punto, y así sucesivamente. Usando esta estrategia de clasificación relativamente simple, se puede hacer una lista de los genes diana más confiables.
Alternativamente, la clasificación de otra manera se puede usar para identificar los genes diana que tienen más posibilidades de ser genes diana directos, dando un mayor número de puntos a la tecnología que proporciona la mayor evidencia de un gen diana directo in vivo, en la lista anterior significaría 8 puntos para el enfoque experimental 1), 7 para 2) y bajar a 1 punto para el enfoque experimental 8). Esta lista puede denominarse "lista general de genes diana".
A pesar de las variaciones e incertidumbres biológicas, los inventores supusieron que los genes diana directos son los que tienen más posibilidades de ser inducidos de una manera independiente del tejido. Una lista de estos genes diana puede denominarse "lista de genes diana curada por evidencias". Esta lista de genes diana curada por evidencias se ha utilizado para construir modelos computacionales de la ruta PI3K que se pueden aplicar a muestras procedentes de diferentes fuentes de tejidos.
Lo siguiente ilustrará a modo de ejemplo cómo se construyó específicamente la selección de una lista de genes diana curada por evidencias para la ruta de PI3K.
Con el fin de seleccionar los genes diana de PI3K utilizados como entrada para el "modelo", se utilizaron los siguientes tres criterios:
1. La región promotora/potenciadora del gen contiene un motivo de unión a FOXO:
a. Se debe demostrar que el motivo de unión de FOXO responde a una actividad de la ruta PI3K, por ejemplo, mediante un ensayo de transfección transitoria en donde el motivo FOXO específico está vinculado a un gen indicador, y
b. La presencia del motivo FOXO debe confirmarse mediante, por ejemplo, un análisis de motivo enriquecido de la región promotora/potenciadora del gen.
2. FOXO (diferencialmente) se une in vivo a la región promotora/potenciadora del gen en cuestión, demostrado, por ejemplo, mediante un experimento de ChIP/CHIP u otra técnica de inmunoprecipitación de cromatina:
a. Se ha demostrado que FOXO se une a la región promotora/potenciadora del gen cuando la ruta PI3K no está activa, y
b. (preferiblemente) no se une (o se une débilmente) a la región promotora/potenciadora del gen del gen cuando la ruta de PI3K está activa.
3. El gen se transcribe diferencialmente cuando se cambia la actividad de la ruta PI3K, demostrado por, por ejemplo, a. multiplicar el enriquecimiento del ARNm del gen en cuestión a través de PCR en tiempo real o experimento de microarreglos, o
b. la demostración de que el ARN Pol II se une a la región promotora del gen mediante un ensayo de inmunoprecipitación.
La selección se realizó definiendo como genes diana PI3K los genes para los que se recopiló evidencia experimental suficiente y bien documentada que probaba que se cumplían los tres criterios mencionados anteriormente. Un experimento adecuado para recopilar evidencia de la unión diferencial de PI3K es comparar los resultados de, por ejemplo, un experimento de ChIP-Seq en una línea celular cancerosa que expresa la actividad de la ruta PI3K en respuesta al tamoxifeno (por ejemplo, una línea celular transfectada con un constructo tamoxifeno-FOXO inducible, como FOXO.A3.ER), cuando se expone o no al tamoxifeno. Lo mismo se aplica a la recopilación de pruebas de transcripción de ARNm.
Lo anterior discute el enfoque genérico y un ejemplo más específico del procedimiento de selección de genes diana que se ha empleado para seleccionar varios genes diana con base en la evidencia encontrada usando el enfoque mencionado anteriormente. Las listas de genes diana utilizados en los modelos de red bayesiana para la ruta PI3K se muestran en la Tabla 9.
Tabla 9: "Lista curada por evidencias de genes diana" de la ruta PI3K utilizada en los modelos de red bayesiana y n n n i iliz r m ir l niv l x r i n ARNm l n i n .
Figure imgf000027_0001
continuación
Figure imgf000028_0001
continuación
Figure imgf000029_0001
La segunda lista de genes diana se generó utilizando la base de datos curada manualmente de publicaciones científicas proporcionada dentro de Metacore de Thomson-Reuters (última consulta el 14 de mayo de 2013). Se consultaron en la base de datos genes que están regulados transcripcionalmente directamente corriente abajo de la familia de factores de transcripción FOXO humanos (es decir, FOXO1, FOXO3A, FOXO4 y FOXO6). Esta consulta dio como resultado 336 genes diana de FOXO putativos que se analizaron adicionalmente de la siguiente manera. En primer lugar, se eliminaron todos los genes diana de FOXO putativos que solo tenían una publicación de apoyo. Más adelante, se introdujo una función de puntuación que daba un punto para cada tipo de evidencia experimental, como ChIP, EMSA, expresión diferencial, bloqueo/anulación, ensayo de reportero del gen de luciferasa, análisis de secuencia, que se informó en una publicación. A veces, la misma evidencia experimental se menciona en varias publicaciones que dan como resultado un número correspondiente de puntos, por ejemplo, dos publicaciones que mencionan un resultado de ChIP dan como resultado el doble de la puntuación que se otorga para un único resultado de ChIP. Se realizó un análisis adicional para permitir solo genes que tenían diversos tipos de evidencia experimental y no solo un tipo de evidencia experimental, por ejemplo, expresión diferencial. Finalmente, se calculó una puntuación de evidencia para todos los genes diana de FOXO putativos y se seleccionaron todos los genes diana de FOXO putativos con una puntuación de evidencia de 6 o más (que se muestran en la Tabla 10). El nivel de corte de 6 se eligió heurísticamente, ya que se demostró previamente que aproximadamente 30 genes diana son suficientes en gran medida para determinar la actividad de la ruta.
Una lista de estos genes diana puede denominarse "lista de genes diana basada en una base de datos". Esta lista de genes diana curada se ha utilizado para construir modelos computacionales que pueden aplicarse a muestras procedentes de diferentes fuentes de tejidos.
Tabla 10: "Lista de genes diana basada en la base de datos" de la ruta PI3K utilizada en los modelos de red bayesiana y conjuntos de sondas asociados utilizados para medir el nivel de expresión de ARNm de los genes diana.
Figure imgf000029_0002
continuación
Figure imgf000030_0001
La tercera lista de genes diana se generó sobre la base de las dos listas mencionadas anteriormente, es decir, la lista curada por evidencias (véase Tabla 9) y la lista basada en la base de datos (véase Tabla 10). Se han utilizado tres criterios para seleccionar más genes de estas dos listas. El primer criterio está relacionado con la función atribuida a los genes diana. Las funciones atribuidas a los genes se pueden encontrar en la literatura científica, pero a menudo están disponibles en bases de datos públicas como la base de datos OMIM de los NIH (accesible a través de "http://www.ncbi.nlm.nih.gov/omim"). Genes diana de la lista curada por evidencias en la Tabla 9 y la lista basada en la base de datos en la Tabla 10 que se encontró que estaban involucrados en procesos esenciales para el cáncer, como apoptosis, ciclo celular, supresión/progresión tumoral, reparación del ADN, diferenciación, fueron seleccionados en la tercera lista. Por último, se seleccionaron genes diana que se encontró que tenían una expresión diferencial alta en experimentos de líneas celulares con actividad PI3K alta conocida/FOXO baja versus actividad PI3K baja conocida/FOXO alta. En este documento, los genes diana que tenían una diferencia de expresión mínima de 205 (en este documento: en un nivel de conjunto de sondas) entre el estado "activado" y "desactivado" de la transcripción de FOXO promediado en varias muestras se incluyeron en la tercera lista. El tercer criterio estaba especialmente dirigido en la selección de los genes diana más discriminativos. Con base en los niveles de expresión en experimentos de líneas celulares con múltiples muestras con actividad PI3K alta conocida/FOXO baja y muestras múltiples con actividad PI3K baja conocida/FOXO alta, se calculó una relación de posibilidades (OR), la relación de posibilidades se calculó por conjunto de sondas utilizando el valor de la mediana como punto de corte y un límite suave que representa la incertidumbre en la medición. Los genes diana de la lista de pruebas seleccionadas y la lista basada en la base de datos se clasificaron de acuerdo con la relación de posibilidades "blanda" y se seleccionaron los genes diana con la clasificación más alta (OR >2) y la clasificación más baja (OR <1/2, es decir, genes diana regulados negativamente) para la tercera lista de genes diana.
Teniendo en cuenta la función del gen, la expresión diferencial en la señalización "activada" versus "desactivada" y una relación de posibilidades más alta, se encontró un conjunto de genes diana (que se muestra en la Tabla 11) que se consideró más probatorio para determinar la actividad de la ruta de señalización de PI3K. Tal lista de genes diana puede denominarse "lista corta de genes diana". Por lo tanto, los genes diana informados en la Tabla 11 son particularmente preferidos de acuerdo con la presente invención. No obstante, dado el valor relativo La facilidad con la que la tecnología de adquisición, como los microarreglos, puede adquirir niveles de expresión para grandes conjuntos de genes, se contempla utilizar algunos o todos los genes diana de la Tabla 11 y, opcionalmente, usar adicionalmente uno, dos, algunos o todos los genes diana restantes de la Tabla 9 y la Tabla 10. Además, se generó una "lista corta de 12 genes diana" de genes diana PI3K como se describe en este Ejemplo anterior para los genes diana de TGF-p.
Tabla 11: "Lista corta de genes diana" de la ruta PI3K basada en la lista de genes diana curada por evidencias y la lista de enes diana basada en la base de datos.
Figure imgf000031_0001
Tabla 12: "Lista corta de 12 genes diana" de genes diana PI3K basada en la lista de genes diana curada por evidencias.
Figure imgf000032_0002
La descripción anterior con respecto al entrenamiento y el uso del modelo de ruta matemática de la ruta TGF-p también se aplica al entrenamiento y el uso del modelo de ruta matemática de la ruta PI3K.
En este documento, los datos disponibles públicamente sobre la expresión de una línea celular HUVEC con una transfección estable de un constructo FOXO que es inducible tras la estimulación con 4OHT (GSE16573 disponible en El ómnibus de expresión genética, consultado por última vez el 6 de octubre de 2014) se utilizaron un ejemplo para entrenar el modelo de ruta PI3K. Las líneas celulares con el constructo FOXO inducible que fueron estimuladas durante 12 horas con 4OHT se consideraron como muestras activas de FOXO (n = 3), mientras que las muestras FOXO pasivas fueron las líneas celulares con el constructo sin estimulación 4OHT (n = 3).
(C) Ruta Wnt
La selección de genes diana Wnt se describió previamente en los documentos WO 2013/011479 A2 y WO 2014/102668 A2. La "Lista curada por evidencias de genes diana" (véase Tabla 13) para la ruta Wnt se usó como se describe en este Ejemplo anterior para los genes diana PI3K con el fin de generar la "Lista corta de genes diana" (véase Tabla 14) de Wnt. ruta y la "lista corta de 12 genes diana" (véase Tabla 15) de genes diana Wnt.
T l 1 : "Li r r vi n i n i n " l r Wn iliz n l m l r i n .
Figure imgf000032_0001
continuación
Figure imgf000033_0001
T l 14: "Li r n in" l r Wn n l li n in r r vi ni .
Figure imgf000033_0004
Figure imgf000033_0002
Figure imgf000033_0003
Figure imgf000034_0001
Tabla 15: "Lista corta de 12 genes diana" de genes diana Wnt basada en la lista de genes diana curada por evidencias.
Figure imgf000034_0002
Nótese que con respecto a los documentos WO 2013/011479 A2 y WO 2014/102668 A2, en este documento, el orden de clasificación de los genes diana de ER cambia ligeramente porque se añadió nueva evidencia bibliográfica. Los genes diana de ER se seleccionaron y clasificaron de una manera similar a la descrita en el Ejemplo 3 del documento WO 2014/102668 A2. Los genes se clasificaron combinando la puntuación de evidencia de la literatura y la capacidad individual de cada gen para diferenciar entre una ruta activa e inactiva dentro del modelo. Esta clasificación se basó en una combinación lineal de tasas ponderadas de falsos positivos y falsos negativos obtenidas para cada gen al entrenar el modelo con un conjunto de entrenamiento de muestras de líneas celulares MCF7, que se agotaron de estrógeno y posteriormente permanecieron agotadas o estuvieron expuestas a estrógeno 1 nM durante 24 horas (GSE35428) y probando el modelo con el conjunto de entrenamiento y otros dos conjuntos de entrenamiento en los que las células MCF7 se agotaron de estrógeno y posteriormente permanecieron agotadas o fueron expuestas a estrógenos 10 nM o 25 nM (GSE11352 y GSE8597, respectivamente).
Nótese que se utilizó una combinación de falsos positivos y falsos negativos ponderados (en lugar de razones de posibilidades) para tener en cuenta las diferentes condiciones experimentales utilizadas en los diversos conjuntos. Los diferentes pesos se establecieron de acuerdo con la confianza del inventor de que los falsos positivos (negativos) fueron una consecuencia del modelo y no de las diferentes condiciones experimentales a las que se había sometido la muestra. Por ejemplo, en todos los experimentos, las muestras de la línea celular MCF7 se agotaron primero en estrógeno durante un período de tiempo antes de ser expuestas a estrógeno o más agotado durante otras 24 horas. Un tiempo de agotamiento más corto podría hacer que la ruta aún esté activa a pesar del agotamiento de estrógenos, en este caso, un falso positivo tendría menos peso que cuando tanto la prueba como las muestras de entrenamiento se agotaron durante la misma cantidad de tiempo).
Basándose en la revisión de la literatura adicional y el examen de la magnitud de la expresión diferencial entre las muestras activas e inactivas como se discute con más detalle más adelante, se seleccionó PDZK1 como un gen diana directo de la ruta ER. Después de evaluar manualmente los artículos científicos adicionales en busca de pruebas experimentales de genes diana de ER putativos utilizando una metodología análoga como se describe en este ejemplo (para PI3K), se identificaron varios genes diana de ER putativos adicionales.
Se analizaron genes diana de ER putativos para determinar la presencia de una región promotora/potenciadora de genes que contiene un motivo de elemento de respuesta a estrógenos (ERE). Debe demostrarse que el motivo ERE responde a los estrógenos, por ejemplo, mediante un ensayo de transfección transitoria en donde el motivo ERE específico está ligado a un gen indicador. La presencia del motivo ERE debe confirmarse mediante, por ejemplo, un análisis de motivo enriquecido de la región promotora/potenciadora del gen. Además, ER (diferencialmente) se une in vivo a la región promotora/potenciadora del gen en cuestión, demostrado por, por ejemplo, un experimento de ChIP/CHIP o un ensayo de inmunoprecipitación de cromatina. Por ejemplo, se debe demostrar que e R se une a la región promotora/potenciadora del gen cuando la ruta de ER está activa y, por ejemplo, no se une (o sólo se une débilmente) a la región promotora/potenciadora del gen si la ruta ER no está activa. Finalmente, el gen se transcribe diferencialmente cuando la ruta e R está activa, lo que se demuestra, por ejemplo, mediante un enriquecimiento de plegamiento del ARNm del gen en cuestión mediante PCR en tiempo real, o un experimento de microarreglos, o la demostración de que el ARN Pol II se une a la región promotora del gen mediante un ensayo de inmunoprecipitación.
La selección se realizó definiendo como genes diana de ER los genes para los que se recopiló evidencia experimental suficiente y bien documentada de la literatura que demuestra que se cumplieron los tres criterios mencionados anteriormente. Un experimento adecuado para recopilar evidencia de unión diferencial ER es comparar los resultados de, por ejemplo, un experimento de ChIP/CHIP en una línea celular cancerosa que responde al estrógeno (por ejemplo, la línea celular MCF-7), cuando se expone o no se expone a estrógeno. Después de evaluar todos los artículos científicos adicionales, una nueva clasificación para todos los genes diana putativos se basó en la solidez de la evidencia experimental encontrada en la literatura. En consecuencia, un gen diana putativo de la ruta de señalización celular ER, PDZK1, logró una puntuación de evidencia experimental por encima del umbral establecido. Por lo tanto, se consideró que PDZK1 era un gen diana directo genuino de la ruta ER.
En la selección original de genes diana de ER solo se consideró la capacidad de diferenciar muestras activas frente a inactivas, calculada usando la relación de posibilidades "blanda". En el análisis actual, la magnitud de la expresión diferencial también se incluyó en la evaluación. Dado que la magnitud de la señal de expresión diferencial está próxima a la relación de posibilidades "blanda" como una característica importante de un ensayo bien diseñado, se prevé que este nuevo método de selección sea una mejora con respecto a los criterios originales. La magnitud de la expresión génica diferencial se estimó promediando la diferencia de la expresión génica media entre las muestras activas (activadas) de ER y las muestras inactivas (desactivadas) de ER en una selección de conjuntos de datos de Affymetrix HG1133Plus2, a saber, GSE35427, GSE11352, GSE21618, GSE8597 y dos internos conjuntos de datos generados que incluyen múltiples líneas celulares de cáncer de mama estimuladas con estradiol (E2) o un control. La expresión génica media se calculó por separado para cada conjunto de sondas de Affymetrix relacionado con el gen para cada conjunto de datos. Solo se tuvieron en cuenta en el promedio los conjuntos de sondas que se expresaron significativamente de manera diferente. La expresión diferencial promedio entre las muestras estimuladas con estradiol, es decir, muestras activas de ER, y muestras de control/no estimuladas, es decir, muestras pasivas de ER, de PDZK1 fue 2.08. Esta expresión diferencial es excepcionalmente alta (el promedio sobre todos los genes regulados positivamente es 0.88) y es comparable a los genes diana con la expresión diferencial más alta, por ejemplo, PGR con una expresión diferencial promedio de 2.14. Además, la relación de posibilidades "blanda" de PDZK1 (promedio 26.6) también es más alta que el promedio (19.03).
En los siguientes ejemplos, se compara el modelo original de la lista de genes diana de 13 ER (GREB1, PGR, XBP1, CA12, SOD1, CTSD, IGFBP4, TFF1, SGK3, NRIP1, CELSR2, WISP2 y AP1B1) (en adelante, modelo de lista corta) a un nuevo modelo de genes diana de 14 ER construido utilizando PDZK1 y la lista original de genes diana de 13 ER (en lo sucesivo denominada lista corta modelo PDZK1). Ambos modelos de red bayesiana se entrenaron exactamente de la misma manera (utilizando el conjunto de datos Affymetrix HGU133Plus2 GSE8597) con la única diferencia de ser la lista de genes diana de ER.
En el ejemplo 1, se calculó la actividad de la ruta de ER para una selección de conjuntos de datos de Affymetrix HGU133Plus2 que ejemplifican el cáncer de mama típico y muestras de tejido de mama normal (conjuntos de datos públicos GSE12276, GSE10870 y GSE21653) que contienen 256 muestras de cáncer de mama positivas para ER, 195 ER muestras negativas de cáncer de mama, 27 muestras de tejido mamario normal y 94 muestras de cáncer de mama con estado de ER desconocido. Si bien se espera que la ruta ER esté inactiva en el cáncer de mama ER negativo y la mama normal, se espera que entre el 50 y el 70 % de los cánceres de mama ER positivos estén activos, de acuerdo con la respuesta a los datos de la terapia hormonal. La proporción de muestras de cáncer de mama positivas para RE que se predice que estarán activas por el modelo de lista corta (74 %) y por el modelo de lista corta PDZK1 (73 %) es comparable y similar a la proporción de pacientes con cáncer de mama positivas para RE que responden a la terapia hormonal. Además, el promedio de la probabilidad de activación de e R, sobre todas las muestras positivas de ER, calculado por el modelo de lista de lista corta PDZK1 (relación de posibilidades de log2 promedio: 2.73) es ligeramente mayor que la probabilidad media de activación predicha por el modelo de lista corta (promedio de relación de posibilidades log2: 2.70, con una diferencia de 0.03 en la escala de relación de posibilidades log2) haciéndolos comparables para este tipo de muestra. Un efecto técnico beneficioso inesperado de incluir PDZK1 ocurre cuando se analizan muestras de tejido normal y cáncer de mama ER negativo: el promedio de la probabilidad de activación del RE calculado por el modelo de lista corta lista PDZK1 (relación de posibilidades promedio de log2: -7.3) es considerablemente menor que la probabilidad promedio de activación predicha por el modelo de lista corta (relación de posibilidades promedio de log2: 6.8, con una diferencia de 0.5 en la escala de relación de posibilidades log2, prueba de rango de Wilcoxon pv de 2 lados = 0.02), lo que hace que la lista corta modelo PDZK1 mejor que el modelo corto en esta situación. Además, esta mejora es más de un minuto escalado de las actividades de la ruta predichas que se anticipa en caso de que se agregue un gen diana más al modelo, por lo tanto, la adición de PDZK1 produce un efecto técnico ventajoso inesperado.
En el ejemplo 2, se calculó la actividad de la ruta ER para los conjuntos de datos públicos de Affymetrix HGU133Plus2 GSE8597, GSE35428, GSE11352, que ejemplifican experimentos en los que las líneas de células de mama sensibles al estrógeno (en este caso MCF7) se exponen o se privan de la estimulación con estrógenos. Es bien sabido que la exposición al estrógeno activa la ruta e R en las líneas celulares MCF7 y la privación de estrógeno cierra la ruta ER en las líneas celulares MCF7. Además, en este caso, el modelo de lista corta PDZK1 parece ser técnicamente superior al modelo de lista corta, tanto para el caso en donde las líneas celulares MCF7 están expuestas a estrógenos, en donde la actividad predicha calculada por el modelo de lista corta PDKZ1 (log2 promedio relación de posibilidades: 14.7) es mayor que la actividad predicha calculada por el modelo de lista corta (relación de posibilidades promedio de log2: 14.0, una diferencia de 0.7 en la escala de relación de posibilidades log2). La actividad predicha calculada para todas las muestras privadas de estimulación estrogénica por el modelo de lista corta PDKZ1 (relación de posibilidades promedio de log2: -7.7) es menor que la actividad predicha calculada por el modelo de lista corta (relación de posibilidades promedio de log2: -7.3, una diferencia de 0.4 en la escala de relación de posibilidades log2) para el 85 % de las 27 muestras que fueron privadas de estrógeno. Además, esta mejora es más de un minuto escalado de las actividades de la ruta predichas que se anticipa en caso de que se agregue un gen diana más al modelo, por lo tanto, la adición de PDZK1 produce un efecto técnico ventajoso inesperado.
Para probar el efecto del nuevo gen en ensayos de PCR, en los siguientes ejemplos se compara una lista de genes diana de 11 ER (GREB1, PGR, XBP1, CA12, SOD1, CTSD, IGFBP4, TFF1, SGK3, NRIP1, CELSR2, ERBB2 y ESR1) (en lo sucesivo denominado modelo de lista de PCR) a un nuevo modelo de gen diana de 12 ER construido utilizando PDZK1 y la lista de genes diana de 11 ER mencionada anteriormente (en lo sucesivo denominada lista de PCR modelo PDZK1). Ambos modelos de red bayesiana se entrenaron exactamente de la misma manera (utilizando datos de expresión génica generados por RT-qPCR, a partir de un experimento interno de privación/estimulación de estrógenos en líneas celulares MCF7) con la única diferencia de que se agregó la diana PDZK1 ER gen en la lista de PCR modelo PDZK1. La actividad de la ruta ER se calculó para un total de 12 muestras: 6 privadas de estrógeno y 6 estimuladas con estrógeno. Aquí nuevamente el modelo que contiene PDZK1 (lista de PCR modelo PDZK1) parece ser técnicamente superior al modelo sin PDZK1 (modelo de lista de PCR), tanto para el caso de exposición a estrógenos, en donde la actividad predicha calculada por la lista de PCR modelo PDKZ1 (relación de posibilidades log2 promedio: 4.7) es mayor que la actividad predicha calculada por el modelo de lista de PCR (relación de posibilidades log2 promedio: 3.9, una diferencia de 0.8 en la escala de relación de posibilidades log2). La actividad predicha para las muestras privadas de estrógeno calculadas por la lista de PCR modelo PDKZ1 (relación de posibilidades promedio de log2: -5.1) es menor que la actividad predicha calculada por el modelo de lista corta (relación de posibilidades promedio de log2: -4.5, una diferencia de 0.6 en la escala de relación de posibilidades log2). Esta diferencia es muy importante en los modelos que utilizan una pequeña cantidad de "sondas" para medir el perfil del gen diana ER de la muestra, ya que normalmente tienen menos poder de discriminación (Nótese el bajo promedio de actividades predichas). En conclusión, esta mejora es más de un minuto escalado de las actividades de la ruta predicha que se anticipa en caso de que se agregue un gen diana más al modelo, por lo que la adición de PDZK1 produce un efecto técnico ventajoso inesperado.
Como se discutió anteriormente, la selección de genes diana de ER se describió previamente en los documentos WO 2013/011479 A2 y WO 2014/102668 A2. La "Lista curada por evidencias de genes diana" para la ruta HH se usó como se describe en este Ejemplo anterior para los genes diana PI3K con el fin de generar la "Lista corta de genes diana" de la ruta ER y la "Lista corta de 12 genes diana" de ER genes diana, con base en la revisión de la literatura adicional y la inclusión del gen diana PDZK1.
Tabla 16: "Lista curada por evidencias de genes diana" de la ruta ER utilizada en los modelos de red bayesiana.
Figure imgf000037_0010
Figure imgf000037_0001
Figure imgf000037_0002
Figure imgf000037_0003
Figure imgf000037_0004
Figure imgf000037_0005
Figure imgf000037_0006
Figure imgf000037_0007
Figure imgf000037_0008
Figure imgf000037_0009
T l 17: "Li r n i n" l r ER n l li r r vi ni n in.
Figure imgf000037_0011
continuación
Figure imgf000038_0001
Tabla 18: "Lista corta de 12 genes diana" de genes diana de ER basada en la lista de genes diana curada por evidencias.
Figure imgf000038_0002
La selección de genes diana de HH se describió previamente en los documentos WO 2013/011479 A2 y WO 2014/102668 A2. La "Lista curada por evidencias de genes diana" (véase Tabla 19) para la ruta HH se usó como se describe en este Ejemplo anterior para los genes diana PI3K con el fin de generar la "Lista corta de genes diana" (véase Tabla 20) de h H ruta y la "lista corta de 12 genes diana" (véase Tabla 21) de genes diana HH.
Tabla 19: "Lista curada por evidencias de genes diana" de la ruta HH utilizada en los modelos de red bayesiana.
Figure imgf000039_0001
Figure imgf000039_0002
Tabla 20: "Lista corta de genes diana" de la ruta HH basada en la lista de genes diana curada por evidencias.
Figure imgf000040_0001
Tabla 21: "Lista corta de 12 genes diana" de genes diana HH basada en la lista de genes diana curada por evidencias.
Figure imgf000040_0002
Ejemplo 2: Determinación de la puntuación de riesgo
En general, se pueden idear muchas fórmulas diferentes para determinar una puntuación de riesgo que indica un riesgo de que un sujeto experimente un evento clínico dentro de un cierto período de tiempo y que se basa en una combinación de actividades inferidas de dos o más células rutas de señalización en un sujeto, es decir:
MPS = F(Pi) X, con i = 1...N, (3)
en donde MPS denota la puntuación de riesgo (el término "MPS" se usa en este documento como una abreviatura de "Puntuación de Multirruta" para indicar que la puntuación de riesgo está influenciada por las actividades inferidas de dos o más rutas de señalización celular), Pi denota la actividad de la ruta de señalización celular i, N denota el número total de rutas de señalización celular utilizadas para calcular la puntuación de riesgo, y X es un marcador de posición para posibles factores y/o parámetros adicionales que pueden entrar en la ecuación. Tal fórmula puede ser más específicamente un polinomio de cierto grado en las variables dadas, o una combinación lineal de las variables. Los coeficientes de ponderación y las potencias en dicho polinomio se pueden establecer basándose en el conocimiento de un experto, pero normalmente se utiliza un conjunto de datos de entrenamiento con una verdad del terreno conocida, por ejemplo, datos de supervivencia, para obtener estimaciones de los coeficientes de ponderación y las potencias de la Ec. (3). Las actividades inferidas se combinan usando la Ec. (3) y posteriormente generará un MPS. Más adelante, los coeficientes de ponderación y las potencias de la función de puntuación se optimizan de modo que una MPS alta se correlacione con una mayor probabilidad de que el paciente experimente el evento clínico, y viceversa. La optimización de la correlación de la función de puntuación con los datos de supervivencia se puede realizar utilizando una multitud de técnicas de análisis, por ejemplo, una prueba de riesgos proporcionales de Cox (como se usa preferiblemente en este documento), una prueba de rango logarítmico, un estimador de Kaplan-Meier junto con técnicas de optimización estándar, como el descenso de gradientes o la adaptación manual, etc.
En sus experimentos, los inventores no encontraron ninguna razón para anticipar una respuesta de la ley de potencia entre las actividades de las rutas de señalización celular y el riesgo de recurrencia, por lo tanto, Ec. (3) se puede simplificar:
MPS = W ] ' P¡ W ? ' P? ...+ W n ' Pn + JC, (4)
en donde w-i,..., wn denotan coeficientes de ponderación.
En este ejemplo, el evento clínico es cáncer, en particular, cáncer de mama, y las actividades inferidas de la ruta TGF-p, la ruta PI3K, la ruta Wnt, la ruta ER, la ruta HH se consideran, como se discutió. en detalle en el presente documento, así como en la solicitud de patente internacional publicada WO 2013/011479 A2 ("Assessment of cellular signaling pathway activity using probabilistic modeling of target gene expression") y/o en la solicitud de patente internacional publicada Wo 2014/102668 A2 ("Assessment of cellular signaling pathway activity using linear combination(s) of target gene expressions").
Las fórmulas que se usan preferiblemente en este documento tienen en cuenta las actividades de la ruta TGF-p y una o más de la ruta PI3K, la ruta Wnt, la ruta ER y la ruta HH. Estas fórmulas se basan en las observaciones de los inventores derivadas de la investigación en biología del cáncer, así como en las correlaciones descubiertas por los inventores en conjuntos de datos disponibles públicamente entre la supervivencia y las actividades de la ruta TGF-p, la ruta PI3K, la ruta Wnt, la ruta ER. y la ruta HH. Se cree que las rutas del desarrollo temprano, como la ruta Wnt y la ruta HH, juegan un papel en la metástasis causada por células cancerosas que han revertido a un fenotipo más parecido a las células madre, llamadas células madre cancerosas. De hecho, los inventores creen que hay suficientes indicaciones disponibles para que las rutas de desarrollo temprano, como la ruta Wnt, desempeñen un papel en la metástasis del cáncer, permitiendo que las células cancerosas metastásicas comiencen a dividirse en el lugar de siembra en otro órgano o tejido. La metástasis se asocia con un peor pronóstico y representa una forma de recurrencia del cáncer, por lo que los inventores esperan que la actividad de las rutas del desarrollo temprano, como la ruta Wnt y la ruta HH, en las células cancerosas sea predictiva de un peor pronóstico. El presunto papel de la ruta Wnt y la ruta HH en la progresión del cáncer y la metástasis se basa en investigaciones preclínicas y no se ha demostrado en sujetos, ya que no se dispone de métodos para medir su actividad. Además, los inventores descubrieron suficientes indicaciones en conjuntos de datos disponibles públicamente que muestran una correlación entre la actividad de la ruta ER como un mecanismo (relativamente) protector para la supervivencia y la actividad de la ruta TGF-p y la ruta PI3K, que se correlaciona con un peor pronóstico. Por consiguiente, los inventores encontraron que la pasividad de la ruta ER y la actividad de la ruta TGF-p y la ruta PI3K estaban correlacionadas con un resultado deficiente en pacientes con cáncer de mama.
Las observaciones de estos inventores a partir de la investigación biológica y las correlaciones clínicas de que las actividades de la ruta TGF-p, la ruta PI3K, la ruta Wnt y la ruta HH pueden desempeñar un papel en la recurrencia del cáncer y la supervivencia global y esa actividad de la ruta de Er parece estar vinculada a un buen resultado clínico se combinan aquí en la siguiente fórmula preferida, que es un caso especial de Ec. (4):
MPS = viv • Pr - wp Pp i H'u ■ P w + we ■ Pe w¡, ■ Ph + X r (5)
en donde Pt, Pp, Pw, Pe y Ph denotan la actividad inferida de la ruta TGF-p, la ruta PI3K, la ruta Wnt, la ruta ER y la ruta HH, respectivamente (por ejemplo, en el rango entre 0 y 1), wt es un coeficiente de ponderación constante positivo, Wp, Wv y Wh son coeficientes de ponderación constante no negativos y We es un coeficiente de ponderación constante no positivo. Con esta fórmula, el riesgo indicado de que el sujeto experimente el evento clínico dentro de un cierto período de tiempo aumenta monotónicamente con un valor creciente de la suma.
En los siguientes ejemplos, los inventores han utilizado de manera de ejemplo las actividades inferidas de las redes bayesianas de la ruta TGF-p utilizando la lista de genes diana curada por evidencias que se muestra en la Tabla 1 y el entrenamiento como se discute en este documento, la ruta PI3K utilizando la lista corta de genes diana que se muestra en la Tabla 11 y el entrenamiento como se discute en este documento, la ruta Wnt usando la lista curada por evidencias de genes diana que se muestra en la Tabla 1 del documento WO 2013/011479 A2 y el entrenamiento como se discute allí, la ruta ER usando la evidencia curada lista de genes diana mostrada en la Tabla 2 del documento WO 2013/011479 A2 y el entrenamiento discutido en el mismo, y la ruta HH usando la lista curada por evidencias de genes diana mostrada en la Tabla 3 del documento WO 2013/011479 A2 y el entrenamiento discutido en el mismo. Alternativamente, las actividades de la ruta se pueden inferir por medio de métodos alternativos tales como el uso de modelos (pseudo)lineales como se discute en este documento y con más detalle en el documento WO 2014/102668 A2 o, alternativamente, las listas de genes diana utilizadas de forma de ejemplo en este documento se pueden reemplazar por un selección adicional de los genes diana de las listas curadas por pruebas basadas en su naturaleza probatoria que se demostró que obtienen resultados comparables con respecto a las actividades de la ruta inferida. Las listas alternativas se discuten aquí para la ruta TGF-p (véase Tablas 2 a 4) y la ruta PI3K (véase Tablas 5 y 6) y se discuten en WO 2013/011479 A2 para la ruta Wnt (véase Tabla 6 de WO 2013/011479 A2), la ruta ER (véase Tabla 7 de WO 2013/011479 A2), y la ruta HH (véase Tabla 8 de WO 2013/011479 A2).
En este documento, se describe un método preferido para inferir valores apropiados para los coeficientes de ponderación wt, Wp, ww, We y Wh utilizando modelos de riesgos proporcionales de Cox. Un modelo de riesgo proporcional de Cox se ajusta a un conjunto de entrenamiento que consiste en un número adecuado (preferiblemente >100, preferiblemente representando los diversos subconjuntos de tipos de cáncer) de muestras con actividades inferidas Pt, Pp, Pw, Pe y Ph y datos de supervivencia, es decir, el tiempo de supervivencia y la información de censura utilizando, por ejemplo, MATLAB, (MATLAB R2014a, The MathWorks Inc., Natick, MA) o R (v3.0.3, R Core Team (2014). R: Un lenguaje y entorno para computación estadística. R Foundation for Statistical Computing, Viena, Austria). A modo de ejemplo, las muestras de cáncer de mama disponibles públicamente de GSE6532 procedentes del hospital de Guy (n = 87) y las muestras de GSE9195 (n = 77), accesibles en http://www.ncbi.nlm.nih.gov/geo/, consultado por última vez el 20 de julio de 2014, se utilizaron como conjunto de datos de entrenamiento. Se ajusta un modelo de regresión de riesgos proporcionales de Cox para la actividad de cada ruta, lo que da como resultado un coeficiente de Cox por actividad de la ruta, su error estándar asociado (SE) de la estimación del coeficiente, un índice de riesgo (HR), que es el exponente del coeficiente, un intervalo de confianza del 95 % de la relación de riesgo y un valor p derivado del coeficiente de Cox y el error estándar como, se puede ver en la Tabla 22. El signo de la estimación del coeficiente indica si la actividad de la ruta es protectora para el evento en caso de un coeficiente negativo o predecir un peor pronóstico en caso de un coeficiente positivo. El módulo del coeficiente indica la fuerza de la puntuación de riesgo con respecto al pronóstico.
Tabla 22: Resultados de la regresión de riesgos proporcionales de Cox en los conjuntos de entrenamiento combinados Gs E6532 GSE9195.
Figure imgf000042_0001
Los inventores han descubierto que los coeficientes de Cox ajustados para las actividades de las respectivas rutas de señalización celular en un conjunto de datos de entrenamiento, como se muestra, por ejemplo, en la Tabla 22, son buenos valores para usar como coeficientes de ponderación lineal para las puntuaciones de riesgo. Por lo tanto, estos coeficientes de Cox se utilizan preferiblemente como coeficientes de ponderación en la Ec. (5). Su idoneidad para su uso en la determinación de una puntuación de riesgo se ha evaluado con gran detalle, como se describe más adelante:
Primero, la actividad de la ruta TGF-p se combinó con la actividad de la ruta PI3K, la ruta Wnt, la ruta ER y la ruta HH, respectivamente, dando como resultado las siguientes ecuaciones:
MPStP = 0.98 (± 0.93) ■ P, + 0.80 (± 0.41) ■ Pp (6)
MPSt» = 0.98 (± 0.93) ■ Pt + 1.30 (± 0.85) ■ Pv (7)
MPSte = 0.98 (± 0.93) ■ P t ( -1.02 (± 0.52)) ■ Pe (8)
MPSth = 0.98 (± 0.93) ■ Pt + 0.83 (± 0.54) ■ Ph (9)
Más adelante, la actividad de la ruta TGF-p se combinó con las actividades de otras dos rutas del grupo que consta de la ruta PI3K, la ruta Wnt, la ruta ER y la ruta HH, dando como resultado las siguientes ecuaciones:
MPStpw = 0,98 (± 0,93) ■ Pt + 0,80 (± 0,41) ■ Pp (10)
1.30 (1 0.85) P,
MPStpe = 0.98 (± 0.93) • Pt + 0.80 (± 0.41) • Pp (11)
(-1.02 (±0.52))- Pe
MPStph = 0.98 (± 0.93) ■ Pt + 0.80 (± 0.41) ■ Pp (12)
0.83 (± 0.54) ■ Ph
MPS*Ve = 0.98 (± 0.93) • Pt + 1.30 (± 0.85) ■ Pw (13)
(-1.02 (± 0.52)) ■ Pe
MPStwh ~ 0.98 (± 0.93) P, + 1.30 (± 0.85) • Pw (14)
0.83 (±0.54) Ph
MPSteh = 0,98 (± 0,93) ■ Pt + (-1,02 (± 0,52)) ■ Pe (15)
0.83 (± 0.54) ■ Ph
Más adelante, la actividad de la ruta TGF-p se combinó con las actividades de otras tres rutas del grupo que consta de la ruta PI3K, la ruta Wnt, la ruta ER y la ruta HH, dando como resultado las siguientes ecuaciones:
MPStpwe = 0.98 (± 0.93) ■ Pt + 0.80 (± 0.41) Pp (16)
1.30 (± 0.85) ■ Pw + (-1.02 (± 0.52)) ■ Pe
MPStPw¡, - 0.98 (± 0.93) ■ Pt + 0.80 (± 0.41) • Pp (17)
1.30 (é 0.85) ■ Pw i 0.83 ( - 0.54) Pr.
MPStpeh = 0.98 (± 0.93) • Pt + 0.80 (± 0.41) ■ Pp (18)
(-1.02 (± 0.52)) ■ Pe i 0.83 (± 0.54) ■ Ph
MPStweh - 0,98 (± 0,93) • Pt + 1.30 (± 0.85) • Pw (19)
(-1.02 (± 0.52)) ■ Pe i 0.83 (± 0.54) ■ Ph
Se prefiere particularmente que los coeficientes de Cox se utilicen para parametrizar la combinación lineal de las actividades de la ruta TGF-p, la ruta PI3K, la ruta Wnt, la ruta ER y la ruta HH enumeradas en la Ec. (5), que resultó en la siguiente ecuación:
MPStpweh^ 0.98 (± 0.93) • Pt + 0.80 (± 0.41) • Pp + (20)
1.30 (± 0.85) • Pw + (-1.02 (± 0.52)) • Pe
- 0.83 (±0.54) ■ Ph
en donde los errores estándar de los coeficientes se enumeran entre paréntesis.
Alternativamente, se pueden usar modelos (pseudo)lineales para inferir la actividad de la ruta como se describe en este documento y con más detalle en el documento WO 2014/102668 A2 ("Assessment of cellular signaling pathway activity using linear combination(s) of target gene expressions") y utilizar estas actividades inferidas de una manera similar a como se discutió anteriormente con las actividades de la ruta inferidas con un modelo probabilístico. Insertando estos modelos lineales para la actividad de la ruta en las Ecs. (6) a (20) finalmente culmina, después de la expansión de las sumas, en una combinación lineal que se puede generalizar en una ecuación con una sola suma:
MPSconjunto de sondas = ^Wij. Eij (21)
en donde X es la suma de todos los i conjuntos de sondas de todas las j rutas, aquí la ruta TGF-p, la ruta PI3K, la ruta Wnt, la ruta ER y la ruta HH, wy es el peso asociado con el conjunto de sondas, que es igual al producto del peso asociado con la ruta y el conjunto de sondas o ruta, gen diana y conjunto de sondas, para los modelos lineales de "una sola capa" y "dos capas", respectivamente. Aquí, el peso Wiy se elige a manera de ejemplo igual al coeficiente de Cox estimado a partir del conjunto de datos de entrenamiento, del i-ésimo conjunto de sondas de la jésima ruta, y Eij es el i-ésimo conjunto de sondas de la j-ésima ruta. Un experto en la materia podrá adaptar esta ecuación a otras plataformas de medición como (RT-q)PCR, secuenciación, ARNm de peces y otros métodos adecuados para detectar niveles de expresión de los genes diana en lugar de los conjuntos de sondas que se originan en el Affymetrix HG-U133Plus2.0 se utiliza a modo de ejemplo en la presente.
Más adelante, las puntuaciones de riesgo descritas en el presente documento se probaron en una combinación de otros tres conjuntos de datos: GSE20685 y GSE21653 están disponibles en el omnibus de expresión génica, accesible en http://www.ncbi.nlm.nih.gov/geo/, consultado por última vez el 20 de julio de 2014, mientras que E-MTAB-365 está disponible en ArrayExpress, accesible en http://www.ebi.ac.uk/arrayexpress/experiment/, consultado por última vez el 20 de julio de 2014. Los tres conjuntos de datos combinan una diversidad conjunta de un total de 1005 pacientes con cáncer de mama con tiempo de supervivencia completo y datos de censura. Las puntuaciones de riesgo para estos pacientes se calcularon de acuerdo con las Ecs. (6) a (21) y luego se investigó el valor pronóstico de las puntuaciones de riesgo utilizando dos métodos que cuantifican dicho valor pronóstico. Estos son los modelos de regresión de riesgos proporcionales de Cox y las gráficas de Kaplan-Meier junto con la prueba estadística de rango logarítmico:
El primer método ajusta un modelo de riesgo proporcional de Cox a los datos de supervivencia con una o más covariables. En resumen, dicho modelo de riesgo explica la variación en la supervivencia (evento clínico) dentro de la población en función del valor (numérico) de las covariables. Como resultado del ajuste, a cada covariable incluida se le asignará una relación de riesgo (HR), que es el exponente del coeficiente de Cox, que cuantifica el riesgo asociado del evento clínico en función del valor de la covariable, por ejemplo, una HR de dos corresponde a un riesgo dos veces mayor del evento clínico de interés para los pacientes con un aumento de uno en el valor de la covariable. En detalle, un valor de HR = 1 significa que esta covariable no tiene impacto en la supervivencia, mientras que para HR <1, un aumento en el número de covariables significa un riesgo menor y una disminución en el número de covariables significa un riesgo más alto, y para HR >1, un aumento en el número de covariables significa un mayor riesgo y una disminución en el número de covariables significa un riesgo menor. Junto con las relaciones de riesgo, se informan el intervalo de confianza del 95 % y los valores p (es decir, la probabilidad unilateral de que la relación de riesgo sea significativamente menor o mayor que uno). Todas las puntuaciones de riesgo se escalan de tal manera que la escala (valor mínimo a máximo) de la puntuación de riesgo sea uno para hacer una comparación directa de los cocientes de riesgo directo.
El último método implica trazar una curva de Kaplan-Meier que representa la probabilidad de sobrevivir al evento clínico en función del tiempo. Por ejemplo, al trazar las curvas de Kaplan-Meier para diferentes grupos de riesgo en la población con base en una prueba de pronóstico de ejemplo, se puede visualizar la calidad de la separación del riesgo del evento clínico de ejemplo. Es decir, grupos de riesgo más divergentes indican que una puntuación de riesgo es mejor para estratificar a los pacientes de riesgo. Esta calidad se puede cuantificar aún más mediante una prueba de rango logarítmico, que calcula la probabilidad (valor p) de que dos curvas de supervivencia sean iguales teniendo en cuenta el período de seguimiento completo.
Los resultados de las puntuaciones de riesgo utilizando al menos la actividad inferida de la ruta TGF-p y una o más de la ruta Wnt, la ruta ER y la ruta HH, como se presenta en este documento, se compararon con el individuo inferido actividades Pt, Pp, Pw, Pe y Ph, es decir, las actividades inferidas de la ruta TGF-p, la ruta PI3K, la ruta Wnt, la ruta ER y la ruta HH, respectivamente, y como se describe en este documento, Combinación, no lineal de Pe, Pw, Ph y la prueba de cáncer de mama Oncotype DX® de Genomic Health. La combinación no lineal de Pe, Pw y Ph se calcula de la siguiente manera:
MPSewh = -Pe + maxOV, A ). (22)
Se demostró que la MPSewh es un buen predictor de recurrencia en pacientes con cáncer de mama. Se calculó usando la Ec. (22) y los pacientes se estratificaron en pacientes de bajo riesgo, riesgo intermedio y alto riesgo utilizando umbrales para la MPSewh como se describe en el mismo, es decir, en -0.1 y 0.1, respectivamente. Se demostró que la prueba Oncotype DX® es un buen predictor de recurrencia en pacientes con cáncer de mama ER positivo. La prueba Oncotype DX® arroja una puntuación de riesgo o recurrencia (RS) entre 0 y 100, que se escala aquí entre 0 y 1 para la comparación directa de las relaciones de riesgo, que se calcula en función de una combinación de niveles de expresión medidos para un panel de genes (véase S. Paik et al.: "A multi-gene assay to predict recurrence of Tamoxifen-treated, node-negative breast cancer", The New England Journal of Medicine, Vol.
351, No. 27, 2004, páginas 2817 a 2826; C. Fan et al.: "Concordance among gene-expression-based predictors for breast cancer", The New England Journal of Medicine, Vol. 355, No. 6, 2006, páginas 560 a 569). La RS está optimizada con respecto a la supervivencia a 10 años en pacientes con cáncer de mama con ganglios negativos para ER positivo, HER2 negativo (tinción de proteínas o FISH). La RS se calculó utilizando los datos de expresión de microarreglos informados en los conjuntos de datos mencionados siguiendo el procedimiento informado por Fan et al. (véase C. Fan et al. (2006)) y los pacientes se dividieron posteriormente en pacientes de bajo riesgo, riesgo intermedio y alto riesgo de acuerdo con el algoritmo de estratificación de riesgo Oncotype DX® (véase S. Paik et al. (2004)).
Al principio, la regresión de riesgos proporcionales de Cox se realizó en las puntuaciones de riesgo escaladas utilizando los pacientes con cáncer de mama de E-MTAB365, GSE20685 y GSE21653. El coeficiente de Cox univariante calculado, su error estándar, las relaciones de riesgo, el intervalo de confianza del 95 % asociado y el valor p se muestran en la Tabla 23. Sorprendentemente, todas las puntuaciones de riesgo que combinan la actividad de la ruta TGF-p con la actividad de una de las otras Las rutas de señalización celular funcionan mejor que las actividades de las rutas individuales, como lo muestra un módulo más alto de los coeficientes de Cox, que indican que una combinación de la actividad de la ruta de TGF-p junto con la actividad de (una) otra ruta de señalización celular(s) se desempeñó mejor que las actividades de la ruta individual con respecto al pronóstico de un evento clínico, en este caso, la supervivencia libre de enfermedad. Además, los valores p de las combinaciones de actividades de dos rutas de señalización celular también demuestran esta superioridad, ya que suelen ser más pequeños para las combinaciones de la actividad de la ruta de TGF-p con la actividad de otra ruta de señalización celular que las del individuo. actividades de la ruta. La combinación de la actividad de la ruta TGF-p con las actividades de otras dos rutas de señalización celular también mejoró los coeficientes de Cox (y los valores p) en comparación con las puntuaciones de riesgo basadas en dos actividades de la ruta. Las puntuaciones de riesgo MPStpe y MPStpweh que combinan las actividades de la ruta TGF-p, la ruta PI3K, la ruta ER, como se describe en la Ec. (11), y las actividades de la ruta TGF-p, la ruta PI3K, la ruta Wnt, la ruta ER y la ruta HH, como se describe en la Ec. (20), respectivamente, se desempeñan de manera similar y superan a las otras combinaciones, es decir, se desempeñan mejor que las actividades de la ruta individual, así como las otras combinaciones de la actividad de la ruta TGF-p con las actividades de una, dos o tres otras células. rutas de señalización, como es visible en el coeficiente, error estándar, FC y valor p. Además, la puntuación de riesgo de MPSconjunto de sondas que incluye los mismos conjuntos de sondas que se utilizan en la puntuación de MPStpweh supera a las puntuaciones de riesgo que incluyen la actividad de la ruta TGF-p y la actividad de una o dos rutas de señalización celular más, como se desprende de los resultados de la regresión de Cox. Sin embargo, el rendimiento de los MPSconjunto de sondas es marginalmente peor que el MPStpweh, lo que probablemente sea el resultado de 'sobreajustar' la puntuación de riesgo en los datos de entrenamiento debido a la gran cantidad de coeficientes ajustados (339 coeficientes en MPSconjunto de sondas frente a cinco coeficientes en MPStpweh). Todas las puntuaciones de riesgo que combinan la actividad de la ruta TGF-p y las actividades de una o más de otras rutas se desempeñaron mejor que las puntuaciones de riesgo MPSewh y RS, como se desprende del coeficiente de Cox respectivo.
Tabla 23: Resultados de la regresión de riesgo proporcional de Cox en los conjuntos de prueba combinados E-MTAB-365, GSE20685 y GSE21653. Todos las puntuaciones de riesgo están normalizadas para una comparación directa de los resultados de la regresión. El coeficiente de Cox calculado en el conjunto de pruebas da la "fuerza" (y la dirección) de la puntuación de riesgo con respecto a la supervivencia. Un valor alto (absoluto) corresponde a un r i r f r . P r l n l "f rz " n nifi i n l r r n i l n i n ri .
Figure imgf000045_0001
continuación
Figure imgf000046_0001
Utilizando las listas alternativas de genes diana de TGF-p, es decir, la "lista corta de 20 genes diana", la "lista corta de 12 genes diana" y la "lista corta de 7 genes diana" (véanse las Tablas 2 a 4), respectivamente, se dio lugar a resultados comparables. Esto puede verse en la Tabla 24, que muestra los resultados de MPStpweh utilizando la "lista de 20 genes diana", la "lista de 12 genes diana" y la "lista de 7 genes diana". Estos resultados indican que la "fuerza" de las puntuaciones de riesgo se vuelve ligeramente más baja en caso de que se utilicen las listas cortas. Sin embargo, funcionan mejor que las puntuaciones de riesgo sin la actividad de la ruta TGF-p.
Tabla 24: Resultados adicionales para la "lista corta de 20 genes diana", la "lista corta de 12 genes diana" y la "lista corta de 7 enes diana".
Figure imgf000046_0002
Más adelante, se analizó la estratificación pronóstica de las puntuaciones de riesgo de los intereses usando gráficos de Kaplan-Meier en combinación con la prueba de rango logarítmico. Un algoritmo simplista se utiliza a modo de ejemplo para las nuevas puntuaciones de riesgo descritas en este documento para estratificar a los pacientes de acuerdo con su puntuación de riesgo. Los 1005 pacientes se dividen en tres grupos de igual tamaño (n = 335) de puntuaciones de riesgo crecientes, es decir, los puntos de corte se encuentran en los terciles de las puntuaciones de riesgo respectivos de todos los pacientes. Los expertos en la técnica pueden comprender y realizar otras variaciones de la estratificación del riesgo con respecto al método mencionado utilizando técnicas de optimización conocidas. Por ejemplo, se pueden utilizar las estadísticas J de Youden para inferir umbrales de riesgo. La estratificación de riesgo de las otras puntuaciones de riesgo incluidas para la comparación se realiza de acuerdo con lo descrito por sus inventores. Es decir, las actividades de la ruta TGF-p, la ruta PI3K, la ruta Wnt, la ruta ER y la ruta HH se utilizan para estratificar a los pacientes de acuerdo con si la ruta respectiva está activa, es decir, una actividad de más de 0.5 en una escala de 0 a 1, o pasivo, es decir, una actividad de 0.5 o menos en una escala de 0 a 1. Los pacientes con una MPSewh de -0.1 o menos se consideran de bajo riesgo, los pacientes con una MPSewh mayor o igual a 0.1 se consideran de alto riesgo, y todos los pacientes restantes (con una MPSewh entre -0.1 y 0.1) se consideran de riesgo intermedio. Por otro lado, los pacientes con una RS menor de 18 se consideran de bajo riesgo, los pacientes con una RS de 31 o superior se consideran de alto riesgo y todos los pacientes restantes (con una RS entre 18 y 31) son considerados de riesgo intermedio. Las gráficas de Kaplan-Meier se proporcionan en las Figuras 2 a 9 para los nuevas puntuaciones de riesgo como se describe aquí, es decir, MPStp (véase Figura 2), MPStw (véase Figura 3), MPSte (véase Figura 4), MPSth (véase Figura 5), MPStpw (véase Figura 6), MPStpe (véase Figura 7), MPStph (véase Figura 8), MPStwe (véase Figura 9), MPStwh (véase Figura 10), MPSteh (véase Figura 11), MPStpwe (véase Figura 12), MPStpwh (véase Figura 13), MPStpeh (véase Figura 14), MPStweh (véase Figura 15), MPStpweh (véase Figura 16) y MPSconjunto de sondas (véase Figura 17). En estos gráficos, el eje vertical indica la supervivencia libre de recurrencia como una fracción del grupo de pacientes y el eje horizontal indica un tiempo en años. Los grupos de riesgo bajo, intermedio y alto (cada uno de los 335 pacientes) se representan con líneas sólidas (característicamente la parte superior), punteadas (característicamente el medio) y punteadas (característicamente la parte inferior), respectivamente. Estos gráficos muestran una clara discriminación del riesgo de que un sujeto pueda experimentar un evento clínico dentro de un cierto período de tiempo entre los diferentes grupos. Esta diferencia en la estratificación del riesgo se puede cuantificar mediante la prueba de rango logarítmico. Aquí se eligió comparar la curva de Kaplan-Meier del grupo de mayor riesgo frente al grupo de menor riesgo (en el caso de las actividades de la ruta individual, esto es activo frente a pasivo). Los valores de p de rango logarítmico se muestran en la última columna de la Tabla 23. Los gráficos de Kaplan-Meier y las estadísticas de rango logarítmico asociadas ejemplifican aún más la ventaja de las puntuaciones de riesgo que incluyen la actividad de la ruta TGF-p y la actividad de una ruta de señalización celular adicional, ya que pueden usarse para estratificar a los pacientes con menor o mayor riesgo de recurrencia de la enfermedad.
La Figura 18 muestra la probabilidad de supervivencia libre de enfermedad a los cinco (línea continua) y diez años (líneas de puntos) usando como ejemplo el MPStpweh sin sellar. La curva por porciones muestra un fuerte aumento (monotónico) en la probabilidad/riesgo entre los valores -0.4 y 1.2, por debajo y por encima de estos valores el riesgo parece estabilizarse, por lo que tendría sentido colocar puntos de corte cerca de estos valores. Además, para facilitar el uso por parte del usuario, las puntuaciones de Multirruta se pueden volver a escalar para comenzar en cero y alcanzar un cierto número positivo, por ejemplo, una puntuación entre 0 y 15 o 0 y 100, en lugar de cubrir un rango que incluye valores negativos. Por ejemplo, un MPStpweh reescalado que incluya estos umbrales podría verse así:
MPS^eh = (23)
í 0 60 (MPSCpwetl 0.5) < 0
j 60 (MPStpweh 0.5) 0 < 60 (MPStpweh + 0.5) < 100
( 100 60 {MPStpweh 0.5) > 100
Los conjuntos de puntuaciones de riesgo de MPStp, MPStw, MPSte, MPSth, MPStpw, MPStpe, MPStph, MPSte, MPStwh, MPSteh, MPStpwe, MPStpwh, MPStpeh, MPStweh, MPStpweh y MPSconjunto de sondas de los pacientes entrenados en el entrenamiento inicial de cáncer de mama en el GSE6532 Se demostró que GSE9195 se generaliza bien en otros conjuntos de datos de muestras de cáncer de mama. Alternativamente, las puntuaciones de riesgo se pueden entrenar en los conjuntos de datos descritos anteriormente, es decir, GSE6532, GSE9195, E-MTAB-365, GSE20685 y GSE21653 simultáneamente (en total 1169 pacientes con datos de supervivencia) utilizando los coeficientes de Cox estimados como se discutió anteriormente. Esto da como resultado las siguientes puntuaciones de riesgo:
MPStp = 1.27 (± 0.21) Pt + 0.70 (±0.17) ■Pp (24) MPStw - 1.27 (± 0.21) ■ Pt + 0.38 (± 0.26) P, (25) MPSte - 1.27 (± 0.21) ■Pt + (-0.87 (±0.18)) Pe (26) MPSth = 1.27 (± 0.21) Pt + 0.90 (± 0.20) ■ Ph (27) MPStp* - 1,27 (± 0.21) Pt + 0.70 (±0,17) ' Pp (28)
0.38 (± 0.26) ■Pm
MPStpe - 1.27 (± 0.21) Pt + 0.70 (±0.17) ' Pp (29)
(-0.87
Figure imgf000047_0001
MPStph = 1.27 (±0.21) Pt + 0.70 (±0.17) ■Pp (30)
±0.90 (±0.20) Ph
MPShvtí - 1.27 (±0.21) ■ Pt + 0.38 (±0.26) ■Pw (31)
± (-0.87 (± 0.18)) Pe
MPStwh = 1.27 (±0.21) ■ i 5/ ±0.38 (±0.26)- Pw (32)
±0.90 (±0.20) Ph
MPSfeh - 1.27 (±0.21) ■ Pt + (-0.87 (± 0.18)) Pe (33)
±0.90 (±0.20) Ph
MPStpwe = 1.27 (±0.21) ■ Pt + 0.70 (±0.17) •Pp (34)
±0.38 (±0.26) Pw ± (-0.87 (± 0.18)) Pe
MPStpwh - 1.27 (±0.21) ■ Pt + 0.70 (±0.17) ■Pp (35)
±0.38 (±0.26) Pw ± 0.90 (± 0.20) ■Ph
MPStpeh = 1.27 (±0.21) ■ Pt + 0.70 (±0.17) •Pp (36)
± (-0.87 (± 0.18)) ■ Pe + 0.90 (± 0.20) ■ Ph
MPStweh = 1.27 (±0.21) ■ Pt ± 0.38 (±0.26) •Pw (37)
± (-0.87 (± 0.18)) ■ Pe ± 0.90 (± 0.20) ■ Ph
MPSfpneJi= 1.27 (±0.21) • P, 0.70 (±0.17) ' Pp (38)
0.38 (± 0.26) ■ Pw ± (-0.87 (± 0.18)) • Pe
0.90 (± 0.20) • Ph
Como alternativa, los coeficientes de las puntuaciones de riesgo se pueden determinar combinando los coeficientes de Cox estimados en los conjuntos de datos de forma independiente. Los coeficientes de Cox determinados de forma independiente junto con su error estándar se utilizan para estimar el coeficiente real para la actividad de cada ruta utilizando la estimación de máxima verosimilitud. Los pacientes de ambos conjuntos de datos del hospital de Guy, GSE6532 y GSE9195, se combinaron en un conjunto de datos de entrenamiento debido a su pequeño tamaño. Los valores de los coeficientes más probables se determinaron ponderando las estimaciones de los coeficientes determinados individualmente con el número de pacientes incluidos en el conjunto de datos sobre el error estándar de la estimación del coeficiente:
Figure imgf000048_0001
en donde ni es el número de pacientes incluidos en el conjunto de datos i, b es el estimador del valor del coeficiente verdadero, bi es el coeficiente de Cox del conjunto de datos i, y ot es el error estándar del coeficiente de Cox estimado a partir del conjunto de datos i. Esta minimización se realizó para la actividad de la ruta TGF-p, la ruta PI3K, la ruta Wnt, la ruta ER y la ruta HH, respectivamente. Las varianzas de las estimaciones de coeficientes verdaderos se determinaron utilizando la matriz de información de Fisher. El uso de estos valores para parametrizar las combinaciones lineales de actividades de la ruta antes mencionadas da como resultado las siguientes puntuaciones de riesgo:
MPStP 1.20 (±0.11) Pt 0.12 (±0.16) Pp (40) AÍPStw 1.20 (±0.11) Pt + 0.19 (± 0.14) Pw (41) MPSte 1.20 (±0.11) Pt + (-0.83 (±0.07)) Pe (42) MPSth 1.20 (±0.11) Pt 0.75 (±0.18) Ph (43) MPStpw 1.20 (±0.11) Pt 0.72 (±0.16) Pp (44)
+ 0.19 (±0.14) ' Pw
MPStpe 1.20 (±0.11) Pt 0.72 (±0.16) Pp (45)
(-0.83 (± 0.07)) Pe
MPStph 1.20 (±0.11) Pr 0.72 (±0.16) Pp (46)
0.75 (±0.18) Ph
MPStwe 1.20 (±0.11) Pt 0.19 (±0.14) Pw (47)
(-0.83 (
MPStwh 1.20 (±
Figure imgf000049_0001
0.75 (±0.18) Ph
MPSíeh 1.20 (±0.11) Pt + (-0.85 (± 0.06)) Pe (49)
0.75 (±0.18) Ph
MPStpwe 1.20 (± 0.11) Pr 0.72 (±0,16) Pp (50)
0.19 (±0.14) Pw + (-0.83 (: 0.07)) ■ Pe
MPStpwh 1.20 (±0.11) Pt 0.72 (±0.16) ■Pp (51)
0.19 (±0.14) Pw + 0.75 (±0.18) ■Ph
MPStpeh 1.20 (± 0.11) Pt 0.72 (±0.16) ■Pp (52)
(-0.83 (± 0.07)) ■ Pe + 0.75 (± 0.18) ■ Ph
MPStweh 1.20 (±0.11) ■i5, 0.19 (±0.14) ■Pw (53)
(-0.83 (± 0.07)) ■ Pe + 0.75 (± 0.18) ■ Ph
MPStpwe!i ~ 1.20 (±0.11) • Pr 0,72 (±0.16) ■ Pp (54)
0.19 (± 0.14) • Pw + (-0.83 (± 0.07)) • Pe
0.75 (±0.18) • Ph
Ejemplo 3: Aplicación CDS
Con referencia a la Figura 19 (que muestra un diagrama de un sistema de soporte de decisiones clínicas (CDS) configurado para determinar una puntuación de riesgo que indica un riesgo de que un sujeto experimente un evento clínico dentro de un cierto período de tiempo, como se describe en este documento), un sistema de soporte de decisiones clínicas (CDS) 10 se implementa como un ordenador 12 configurado adecuadamente. El ordenador 12 puede configurarse para operar como el sistema 10 CDS mediante la ejecución de software, firmware u otras instrucciones adecuadas almacenadas en un medio de almacenamiento no transitorio (no se muestra), como un disco duro u otro medio de almacenamiento magnético, un disco óptico u otro medio de almacenamiento óptico, una memoria de acceso aleatorio (RAM), una memoria de solo lectura (ROM), una memoria flash u otro medio de almacenamiento electrónico, un servidor de red, etc. Si bien el sistema 10 ilustrativo de CDS es ejecutado por el ordenador 12 ilustrativo, más generalmente el sistema de CDS puede realizarse mediante un dispositivo de procesamiento digital o un aparato que comprende un procesador digital configurado para realizar métodos de soporte de decisiones clínicas como se establece en este documento. Por ejemplo, el dispositivo de procesamiento digital puede ser un dispositivo de mano (por ejemplo, un asistente de datos personales o un teléfono inteligente que ejecuta una aplicación CDS), un ordenador portátil, un ordenador de escritorio, una tableta o dispositivo, un servidor de red remoto, etc. El ordenador 12 u otro dispositivo de procesamiento digital incluye típicamente o está conectado operativamente con un dispositivo 14 de visualización a través del cual se presenta al personal médico información que incluye recomendaciones de apoyo a la decisión clínica. La ordenador 12 u otro dispositivo de procesamiento digital típicamente también incluye o está conectado operativamente con uno o más dispositivos de entrada de usuario, tales como un teclado 16 ilustrativo, o un ratón, una bola de desplazamiento, una pantalla sensible al tacto (posiblemente integrada con el dispositivo 14 de visualización), u otro dispositivo de entrada de usuario basado en punteros, a través del cual el personal médico puede introducir información tal como comandos operativos para controlar el sistema 10 CDS, datos para su uso por el sistema 10 CDS, etc.
El sistema 10 CDS recibe como información de entrada perteneciente a un sujeto (por ejemplo, un paciente de un hospital o un paciente ambulatorio que está siendo tratado por un oncólogo, médico u otro personal médico, o una persona que se somete a detección de cáncer o algún otro diagnóstico médico que se sabe o se sospecha que tiene cierto tipo de cáncer, como cáncer de colon, cáncer de mama o cáncer de hígado, etc.). El sistema 10 CDS aplica varios algoritmos de análisis de datos a esta información de entrada para generar recomendaciones de apoyo a la decisión clínica que se presentan al personal médico mediante el dispositivo 14 de visualización (o mediante un sintetizador de voz u otro dispositivo que proporcione una salida perceptible por humanos). En algunas realizaciones, estos algoritmos pueden incluir la aplicación de una guía clínica al paciente. Una guía clínica es un conjunto almacenado de recomendaciones de tratamiento estándar o "canónico", normalmente construido con base en las recomendaciones de un panel de expertos médicos y opcionalmente formateado en forma de un "diagrama de flujo" clíni
En los sistemas CDS ilustrativos descritos en este documento (por ejemplo, sistema 10 CDS), los algoritmos de análisis de datos CDS incluyen uno o más algoritmos de pruebas diagnósticas o clínicas que se realizan con información genómica y/o proteómica de entrada adquirida por uno o más laboratorio 18s médicos. Estos laboratorios pueden estar ubicados de diversas formas "en el lugar", es decir, en el hospital u otro lugar en donde el sujeto se somete a un examen médico y/o tratamiento, o "fuera del lugar", por ejemplo, un laboratorio especializado y centralizado que recibe (por correo u otro servicio de entrega) una muestra del sujeto que se ha extraído del sujeto (por ejemplo, una muestra obtenida de una lesión cancerosa, o de una lesión sospechosa de cáncer, o de un tumor metastásico, o de un cuerpo cavidad en la que hay líquido contaminado con células cancerosas (por ejemplo, cavidad pleural o abdominal o cavidad de la vejiga), o de otros líquidos corporales que contienen células cancerosas, y así sucesivamente, preferiblemente mediante un procedimiento de biopsia u otro procedimiento de extracción simple). Las células de las que se extrae una muestra también pueden ser células tumorales de neoplasias hematológicas (como leucemia o linfoma). En algunos casos, la muestra de células también puede ser células tumorales circulantes, es decir, células tumorales que han entrado en el torrente sanguíneo y se pueden extraer usando técnicas de aislamiento adecuadas, por ejemplo, aféresis o extracción de sangre venosa convencional. Aparte de la sangre, el fluido corporal del que se extrae una muestra puede ser orina, contenido gastrointestinal o un extravasado.
La muestra es procesada por el laboratorio para generar información genómica o proteómica. Por ejemplo, la muestra puede procesarse usando un microarreglo (también conocido en la técnica como un chip de gen, chip de ADN, biochip, etc.) o mediante el procesamiento cuantitativo de la reacción en cadena de la polimerasa (qPCR) para medir información probatoria genómica o proteómica, como niveles de expresión de genes de interés, por ejemplo, en forma de un nivel de ácido ribonucleico mensajero (ARNm) que se transcribe del gen, o un nivel de una proteína que se traduce del ARNm transcrito del gen. Como otro ejemplo, la muestra puede ser procesada por un laboratorio de secuenciación de genes para generar secuencias para ácido desoxirribonucleico (ADN), o para generar una secuencia de ARN, variación del número de copias, metilación, etc. Otros enfoques de medición contemplados incluyen inmunohistoquímica (IHC), citología, hibridación in situ de fluorescencia (FISH), ensayo de ligadura de proximidad, etc., realizado en un portaobjetos de patología. Otra información que se puede generar mediante el procesamiento de microarreglos, espectrometría de masas, secuenciación de genes u otras técnicas de laboratorio incluye información de metilación. También se pueden realizar diversas combinaciones de tales medidas genómicas y/o proteómicas.
En algunas realizaciones, los laboratorios 18 médicos realizan una serie de adquisiciones de datos estandarizados en la muestra del sujeto, para generar una gran cantidad de datos genómicos y/o proteómicos. Por ejemplo, las técnicas de adquisición de datos estandarizadas pueden generar una secuencia de ADN (opcionalmente alineada) para uno o más cromosomas o porciones de cromosomas, o para todo el genoma. La aplicación de una micromatriz estándar puede generar miles o decenas de miles de elementos de datos, como niveles de expresión para una gran cantidad de genes, varios datos de metilación, etc. De manera similar, las mediciones basadas en PCR se pueden usar para medir el nivel de expresión de una selección de genes. Esta plétora de datos genómicos y/o proteómicos, o porciones seleccionadas de los mismos, se introducen en el sistema 10 CDS para ser procesados a fin de desarrollar información clínicamente útil para formular recomendaciones de apoyo a la decisión clínica.
Los sistemas CDS descritos y los métodos relacionados se relacionan con el procesamiento de datos genómicos y/o proteómicos para evaluar la actividad de varias rutas de señalización celular y para determinar una puntuación de riesgo que indica un riesgo de que un sujeto experimente un evento clínico (por ejemplo, cáncer) dentro de un cierto período de tiempo. Sin embargo, debe entenderse que los sistemas CDS divulgados (por ejemplo, el sistema 10 CDS) pueden incluir opcionalmente además diversas capacidades adicionales, como la generación de recomendaciones de apoyo a la decisión clínica de acuerdo con las pautas clínicas almacenadas basadas en varios datos del paciente, como datos de monitorización de signos vitales, datos del historial del paciente, datos demográficos del paciente (por ejemplo, sexo, edad, etc.), datos de imágenes médicas del paciente, etc. Alternativamente, en algunas realizaciones, las capacidades del sistema 10 CDS pueden limitarse a realizar únicamente análisis de datos genómicos y/o proteómicos para evaluar la actividad de las rutas de señalización celular y para determinar una puntuación de riesgo que indique un riesgo de que un sujeto experimente un evento clínico (por ejemplo, cáncer) dentro de un cierto período de tiempo, como se describe en este documento.
Continuando con la referencia a la Figura 19 de ejemplo, el sistema 10 CDS infiere la actividad 22 de una o más rutas de señalización celular, aquí, la ruta TGF-p y una o más de la ruta PI3K, la ruta Wnt, la ruta ER, y la ruta de HH, en el sujeto basándose en, pero sin limitarse a, los niveles 20 de expresión de uno o más genes diana de las rutas de señalización celular medidas en la muestra del sujeto. La ruta TGF-p, la ruta PI3K, la ruta Wnt, la ruta ER y la ruta HH son de interés en diversas áreas de la oncología porque la pérdida de regulación de estas rutas puede ser una causa de la proliferación de un cáncer. Hay alrededor de 10 a 15 rutas de señalización relevantes, y cada cáncer es impulsado por al menos una ruta dominante que está desregulada. Sin limitarse a ninguna teoría particular de funcionamiento, estas rutas regulan la proliferación celular y, en consecuencia, una pérdida de regulación de estas rutas en las células cancerosas puede llevar a que la ruta esté "siempre activa", acelerando así la proliferación de células cancerosas, que a su vez se manifiesta como un crecimiento, invasión o metástasis (diseminación) del cáncer.
La medición de los niveles de expresión de ARNm de genes que codifican proteínas reguladoras de la ruta de señalización celular, como una proteína intermedia que forma parte de una cascada de proteínas que forma la ruta de señalización celular, es una medida indirecta del nivel de expresión de la proteína reguladora y puede o no correlacionarse fuertemente con el nivel real de expresión de la proteína reguladora (mucho menos con la actividad general de la ruta de señalización celular). La ruta de señalización celular regula directamente la transcripción de los genes diana; por lo tanto, los niveles de expresión de ARNm transcrito de los genes diana es un resultado directo de esta actividad reguladora. Por lo tanto, el sistema 10 CDS infiere la actividad de una o más rutas de señalización celular (aquí, la ruta TGF-p y una o más de la ruta PI3K, la ruta Wnt, la ruta ER y la ruta HH) en función de los niveles de expresión de uno o más genes diana (nivel de ARNm o proteína como medida sustituta) de las rutas de señalización celular. Esto asegura que el sistema 10 CDS infiera la actividad de la ruta basándose en información directa proporcionada por los niveles de expresión medidos del gen o genes diana.
Las actividades inferidas, en este ejemplo, Pt, Pp, Pw, Pe y Ph, es decir, las actividades inferidas de la ruta TGF-p, la ruta PI3K, la ruta Wnt, la ruta ER y la ruta HH, luego se usan para determinar 24 una puntuación de riesgo que indica un riesgo de que el sujeto experimente el evento clínico, en este ejemplo, cáncer, en particular, cáncer de mama, dentro de un cierto período de tiempo, como se describe en detalle en este documento. La puntuación de riesgo se basa en una combinación de las actividades inferidas. Por ejemplo, la puntuación de riesgo puede ser la "Puntuación de Multirruta" (MPS) calculada como se describe en detalle con referencia a la Ec. (4) o (5).
Basado en la MPS determinada, el sistema 10 CDS, en este ejemplo, asigna 26 al sujeto a al menos uno de una pluralidad de grupos de riesgo asociados con diferentes riesgos indicados de que el sujeto experimentará el evento clínico dentro del cierto período de tiempo, y/o decide 28 un tratamiento recomendado para el sujeto con base en el riesgo indicado de que el sujeto experimente el evento clínico dentro de un cierto período de tiempo.
La determinación de la MPS y/o la clasificación de riesgo para un paciente en particular mediante el sistema CDS o una implementación independiente de la MPS y la clasificación de riesgo como se describe en este documento permitirá al oncólogo, médico u otro personal médico involucrado en el diagnóstico o tratamiento o monitorización/seguimiento del paciente para adaptar el tratamiento de tal manera que el paciente tenga la mejor posibilidad de supervivencia a largo plazo con efectos secundarios no deseados, especialmente aquellos de quimioterapia agresiva y/o terapia dirigida y/o inmunoterapia y/o radioterapia y/o cirugía, se minimizan. Por lo tanto, por ejemplo, los pacientes con bajo riesgo de recurrencia del cáncer, es decir, aquellos con un MPS bajo y/o aquellos clasificados como de bajo riesgo de acuerdo con el algoritmo de estratificación del riesgo como se describe en este documento, actualmente se tratan normalmente con tratamiento hormonal solo o una combinación de tratamiento hormonal, por ejemplo, inhibidores anti-estrógenos y/o aromatasa, y un agente quimioterapéutico menos tóxico. Por otro lado, los pacientes con un riesgo intermedio o alto de recurrencia del cáncer, es decir, aquellos con un MPS medio a alto y/o aquellos clasificados como de riesgo intermedio o alto de acuerdo con el algoritmo de estratificación del riesgo como se describe en este documento, actualmente serán tratados normalmente. con quimioterapia más agresiva, como regímenes de tratamiento basados en antraciclinas y/o taxanos. Además, el MPS, posiblemente en combinación con los resultados de las pruebas de otros pacientes y/o los resultados de otras pruebas de pronóstico o predicción (por ejemplo, diagnósticas complementarias), puede dar lugar a la decisión de tratar al paciente con medicamentos dirigidos como Tamoxifeno, Trastuzumab, Bevacizumab y/u otros medicamentos terapéuticos (por ejemplo, inmunoterapia) que actualmente no forman parte del protocolo de tratamiento de línea principal para el cáncer particular del paciente, y/u otras opciones de tratamiento, como radioterapia, por ejemplo, braquiterapia, y/o diferentes horarios para el tratamiento, por ejemplo, antes y/o después del tratamiento primario.
Se observa que en lugar de utilizar directamente la puntuación de riesgo determinada (MPS) como una indicación del riesgo de que el sujeto experimente un evento clínico (por ejemplo, cáncer) dentro de un cierto período de tiempo, es posible que el sistema 10 CDS esté configurado para combinar la puntuación de riesgo con una o más puntuaciones de riesgo adicionales obtenidas de una o más pruebas de pronóstico adicionales para obtener una puntuación de riesgo combinada, en la que la puntuación de riesgo combinada indica un riesgo de que el sujeto experimente el evento clínico dentro de un determinado período de tiempo. Las una o más pruebas de pronóstico adicionales pueden comprender, en particular, la prueba de cáncer de mama Oncotype DX®, la prueba de cáncer de mama Mammostrat®, la prueba de cáncer de mama MammaPrint®, la prueba de cáncer de mama EndoPredict®, la prueba de cáncer de mama BluePrint™, la Prueba de cáncer de mama CompanDx®, Breast Cancer IndexSM (HOXB13/IL17BR), prueba de cáncer de colon OncotypeDX® y/o una prueba de proliferación realizada midiendo la expresión del gen/proteína Ki67.
Ejemplo 4: Aplicación en subtipos de cáncer de mama
Para evaluar la actividad de la ruta para cada subtipo de cáncer de mama, los modelos matemáticos de la ruta para ER, AR, Wnt, HH, TGF-p y la ruta PI3K se probaron individualmente en Affymetrix HG-U133 Plus 2.0, datos de microarreglos de 1294 tejido de cáncer de mama muestras de conjuntos de datos públicos GSE6532, GSE9195, GSE20685, GSE21653 y E-MTAB-365. Los diversos subtipos de cáncer de mama se caracterizaron por diferentes distribuciones de rutas activas (véase Figura 24A y B). De las 1294 muestras de cáncer de mama, 749 (58 %) tenían al menos una ruta activa, que se define como con una probabilidad inferida de que el complejo TF esté presente activamente por encima de 0.5 (véase la Figura 24A). Con un umbral más bajo a 0.2, que se define como probabilidad marginal de que la ruta esté activa, o como una ruta marginalmente activa, 1026 (79 %) pacientes tenían al menos una ruta marginalmente activa (véase Figura 24B). El cuarenta y uno por ciento (n = 537) de los pacientes tenían al menos la ruta ER o PI3K activa. Las muestras activas de HH, TGF-p y Wnt se encontraron con menos frecuencia, en el 11 % (n = 142), el 8.4 % (n = 109) y el 5.4 % (n = 70) de los pacientes, respectivamente (véase Figura 24B). Se encontró que solo una pequeña fracción del 2.6 % (n = 34) de los pacientes tenían una ruta de RA activa.
Los subtipos intrínsecos se determinaron utilizando la metodología descrita por Parker y colaboradores (véase J.S. Parker et al., "Supervised risk predictor of breast cancer based on intrinsic subtype", Journal of Clinical Oncololgy, Vol. 27, 2009, páginas 1160 a 1167). La expresión génica normalizada por ARNf de los 50 genes incluidos en el PAM50 se extrajo de los datos del microarreglo utilizando los conjuntos de sondas asociados con los genes PAM50.
Se seleccionó el conjunto de sondas con la varianza más alta en caso de que más de un conjunto de sondas estuviera asociado con un solo gen. Se calcularon los centroides para la luminal A, luminal B, enriquecida con HER2, basales y normales usando las muestras de GSE21653 con subtipos conocidos. Más adelante, se calcularon los coeficientes de correlación de Pearson con estos centroides para todas las muestras. Cada muestra se asignó al subtipo con la mayor correlación. Los análisis de supervivencia utilizando curvas de Kaplan-Meier y regresión de Cox univariada mostraron que las actividades de las rutas ER, Wnt, HH, PI3K y TGF-p están asociadas con la supervivencia libre de recaídas, evaluada en 1169 pacientes con cáncer de mama (véanse las Figuras 25A y 26).
La supervivencia sin recaída fue relativamente más alta en los pacientes activos en RE (véanse las Figuras 25A y B), mientras que los pacientes con una ruta TGF-p activa recayeron considerablemente antes (supervivencia libre de recaída a 3 años: 67.5 % frente a 90.4 %, prueba de rango logarítmico: 5.4e-10). Además, los pacientes con actividad de las otras rutas de señalización celular embrionarias, HH y Wnt, así como la ruta de supervivencia PI3K tuvieron un pronóstico significativamente peor en comparación con los pacientes activos en ER (prueba de rango logarítmico, p = 2.2e-6, 1.1e-3 y 2.1e-6, respectivamente). Los pacientes en los que ninguna de estas cinco rutas resultó ser activa tuvieron un pronóstico razonablemente bueno, aunque peor en comparación con los pacientes activos en sala de emergencias.
Más adelante, se evaluó adicionalmente la relación entre la probabilidad de la ruta y la supervivencia sin recaída mediante regresión de Cox. El análisis de regresión de Cox univariante sobre las posibilidades de actividad de la ruta identificó la ruta ER como la actividad más favorable, mientras que la actividad de Wnt, HH, PI3K y TGF-p se asociaron con un peor pronóstico (véase Figura 26). La probabilidad de la ruta de AR no se pudo definir claramente como favorable o perjudicial con respecto a la supervivencia sin recaídas (p = 0.2, bilateral). La probabilidad de las rutas ER, HH, PI3K y TGFp siguió siendo predictores significativos de recaída en un análisis multivariado con ER, Wnt, HH, PI3K y TGF-p, mientras que Wnt pierde su importancia si se combina con otras rutas (véase Figura 26).
En 167 (13%) muestras de pacientes, se encontró que al menos dos vías estaban activas. La combinación más prevalente consiste en vías activas ER y PI3K (ver Fig. 27). Las combinaciones de ER activo o PI3K con una o más rutas embrionarias también se encontraban entre las combinaciones más prevalentes, por ejemplo, la combinación de HH y PI3K se observó 18 veces. En un porcentaje menor de muestras, se encontraron activas dos rutas embrionarias en diversas combinaciones. Sin embargo, el número de muestras fue demasiado pequeño para identificar el valor pronóstico predictivo asociado con estas combinaciones de rutas.
Los análisis de supervivencia demuestran un poder pronóstico fuerte y en gran medida independiente de las actividades inferidas de las rutas ER, HH, PI3K y TGF-p con respecto a la supervivencia libre de recaídas en pacientes con cáncer de mama, lo que garantiza una combinación de estos en una puntuación de riesgo (véanse las Figuras 28B, D, F, H y J). La ruta Wnt, que fue casi significativa en el análisis univariante y no significativa en el análisis multivariante debido a que sólo muy pocas muestras tenían una ruta Wnt activa, se seleccionó sin embargo para ser incluida en la Puntuación Multirruta basada en los resultados significativos de la prueba de rango logarítmico de Wnt activo versus ninguna ruta activa (p = 0.0011). La ruta AR no fue informativa con respecto al pronóstico y, por lo tanto, no se incluyó en la MPS para el cáncer de mama. Como se discutió en el ejemplo 2, se obtuvo una puntuación de Multirruta (MPS) utilizando coeficientes de regresión de Cox univariantes de las rutas ER, Wnt, HH, PI3K y TGFp en 164 muestras de entrenamiento de pacientes con cáncer de mama ER positivo con resultado clínico conocido de los conjuntos de datos públicos GSE6532 y GSE9195. La prueba de esta MPS en los 1005 pacientes restantes con información de seguimiento resultó en una clara separación entre pacientes de alto riesgo y pacientes de bajo riesgo, como se puede ver en un gráfico de supervivencia de Kaplan-Meier de los terciles más bajo y más alto (p = 8.6e-12, prueba de rango logarítmico, véase la Figura 25B). La MPS se asoció altamente con el pronóstico de acuerdo con un análisis de regresión de Cox univariado (HR escalado = 4.90, p = 7.3e-15).
Las 1294 muestras de cáncer de mama se dividieron en sus subtipos intrínsecos. La distribución de la actividad de la ruta a través de estos subtipos se muestra en las Figuras 28A, C, E, G e I. La ruta ER se encontró activa con mayor frecuencia en las muestras luminales A y B, que generalmente son las muestras ER+. Dentro de las muestras luminales, la ruta ER está activa con más frecuencia en el grupo luminal A de buen pronóstico que en el grupo luminal B de mal pronóstico (véanse las Figuras 28A y C), mientras que la ruta PI3K se activa con mayor frecuencia en la luminal B muestras.
En contraste con las muestras luminales, ninguna de las muestras de tipo basal y enriquecidas con HER2 mostró una ruta ER activa, mientras que además de la ruta PI3K, las rutas embrionarias Wnt, Hh y TGF-p parecieron ser más frecuentemente activas en estos subtipos de cáncer (véanse las Figuras 28E y 28G), que se sabe que son más agresivos y se asocian con un peor pronóstico. La ruta Wnt fue una ruta activa muy prominente en el tipo basal (véase Figura 28G). La fracción más grande del subtipo HER2 tiene un PI3K activo. Además, la ruta AR se mostró activa en bastantes casos de HER2.
El cáncer de mama de tipo normal se ha clasificado como un subtipo específico porque, de acuerdo con la clasificación PAM50, se asemeja a la expresión génica en el tejido de mama normal. Sin embargo, en el análisis de la ruta, las muestras de cáncer de mama de tipo normal pudieron distinguirse claramente del tejido mamario normal y mostraron una alta frecuencia de actividad del RE (véase Fig.28I), mientras que en las muestras de tejido mamario normal la ruta del RE no se detectó como activa. Además, la actividad frecuente de la ruta HH diferencia claramente este subtipo de tumor del tejido mamario normal y del subtipo luminal.
Se realizó un análisis de regresión de Cox en el MPS y se escaló dentro de cada subtipo. La prueba MPS no solo puede distinguir los casos de buen pronóstico de los casos de mal pronóstico entre los cánceres luminales (HR escalado = 4.11, p = 2.1e-7), sino que también dentro de los grupos luminal A y B, el MPS puede estratificar significativamente a los pacientes (HR escalado = 5.15 y 2.43, p = 4.7e-5 y 1.3e-2, véanse las Figuras 28B y D, respectivamente). Además, MPS identificó casos de HER2 con un pronóstico muy precario (HR escalado = 4.81, p = 3.2e-5, ver Figura 28F) entre el grupo total de pacientes enriquecidos con HER2. Solo el 35 % de los pacientes con HER2 en el tercil más alto de MPS tuvieron una supervivencia libre de recaída a 5 años. Sin embargo, cabe señalar que estos pacientes no recibieron ningún fármaco dirigido a HER2. Dentro de la población basal, que normalmente tiene un pronóstico muy malo en comparación con los otros subtipos, MPS identifica un subgrupo con un pronóstico bastante bueno (HR escalado = 3.40, p = 3.7e-3, véase la Figura 28H). La supervivencia a cinco años de los pacientes con cáncer basal que caen en el tercil de MPS más bajo fue del 82 % en comparación con el 62 % para el tercil de MPS más alto. Dentro de los cánceres de mama de tipo normal, la puntuación de MPS fue la menos pronóstica (HR escalado = 3.53, p = 0.05, Figura 28J).
Un análisis multivariado con el MPS y el RS de genes 21 (véase Figura 29) muestra que los dos se complementan entre sí en las 1005 muestras de prueba (HRescalado = 3.32 y 1.92, p = 1.5e-7 y 7.2e- 5, respectivamente). Cuando se realizó en el subconjunto de 452 pacientes de la cohorte de prueba con una tinción IHC positiva para ER para los que la RS de genes 21 está clínicamente indicada, la puntuación de recurrencia de MPS y genes 21 todavía eran predictores independientes significativos de supervivencia sin recaída (HR multivariante escalado = 2.25 y 2.75, p = 0.025 y 4.5e-5, respectivamente), y por lo tanto, los dos también son complementarios en muestras positivas para RE.
La puntuación de recurrencia de genes 21 se calculó usando una implementación de investigación siguiendo la metodología descrita anteriormente por Paik y colaboradores (véase S. Paik et al.: "A multi-gene assay to predict recurrence of Tamoxifen-treated, node-negative breast cancer", The New England Journal of Medicine, Vol. 351, No.
27, 2004, páginas 2817 a 2826; C. Fan et al.: "Concordance among gene-expression-based predictors for breast cancer", The New England Journal of Medicine, Vol. 355, No. 6, 2006, páginas 560 a 569). La expresión normalizada por ARNf de los conjuntos de sondas asociadas con los genes 21 se utilizó como entrada para la implementación de esta investigación de la puntuación de recurrencia de genes 21. Se usó el nivel de expresión promedio en caso de que un gen fuera medido por más de un conjunto de sondas. Los niveles de expresión de los dieciséis genes de interés se normalizaron en relación con el promedio de los cinco genes de referencia y se escalaron como describen Fan et al. Más adelante, se calculó la puntuación de recurrencia sin escala (RSu) para cada muestra utilizando la ecuación y posteriormente se escaló entre 0 y 100 como se describe anteriormente por Paik et al. Posteriormente, cada paciente fue asignado a grupos de riesgo bajo, intermedio o alto utilizando los puntos de corte publicados en 18 y 31.
Los análisis de Cox univariados de la MPS para todos los 1005 casos de prueba (véase Figura 29) en los diferentes grupos de riesgo de la puntuación de recurrencia de genes 21 demostraron que la MPS es capaz de mejorar el pronóstico en cada grupo de riesgo significativamente (bajo, RS de genes 21 de riesgo intermedio y alto que dan para MPS una HR escalada = 3.03, 7.91 y 3.24, p = 0.045, 0.044 y 9.5e-7, respectivamente), mientras que la puntuación real de recurrencia de genes 21 solo es significativa dentro de su grupo de bajo riesgo (FC escalada = 2,54, p = 5,1e-3). El mejor de ambos perfiles de pronóstico, es decir, la identificación de los pacientes de riesgo alto y bajo verdadero, se obtuvo sumando el MPS escalado y el RS de genes 21 (HR escalado = 5,17, p = 7,9e-16, ver Figura 29). El RS de genes 21 es más potente en la detección de pacientes de bajo riesgo, como se puede ver en los gráficos de tasa de recurrencia de la enfermedad y las curvas ROC (véanse las figuras 29A, B y 29E, F, respectivamente); por el contrario, los pacientes de mayor riesgo son identificados con mayor eficacia por el MPS. La combinación de MPS y RS de genes 21 conserva la capacidad de identificar a los pacientes de bajo y alto riesgo después de fusionar las dos puntuaciones, y en general muestra el mejor rendimiento.
Tomados en conjunto, estos datos demuestran que la presente invención puede evaluar el pronóstico de pacientes individuales de cáncer de mama basándose en la detección de la actividad funcional de cinco rutas de señalización oncogénicas principales en una muestra de tejido canceroso. Una puntuación combinada de Multirruta (MPS) distingue claramente los casos de pronóstico bueno de los de mal pronóstico, también dentro de cada subtipo de cáncer de mama, y esta distinción se basa en la influencia de las rutas de transducción de señales individuales en la biología del cáncer causante. Las actividades de la ruta de transducción de señales identificadas proporcionan, por tanto, información sobre la fisiopatología del cáncer de mama y proporcionan información clínicamente importante que facilita la selección de la terapia dirigida. El MPS logró resultados pronósticos comparables a la puntuación de recurrencia de genes 21 en pacientes con ER positivo, mientras que proporciona mejores resultados en todos los demás subtipos de cáncer de mama, especialmente el HER2 y los subtipos basales. Además, la MPS puede estratificar de acuerdo con el riesgo dentro de todos los grupos de riesgo definidos de la puntuación de recurrencia de genes 21, en particular la estratificación en el grupo de riesgo intermedio indeciso de la puntuación de recurrencia de genes 21, y se puede utilizar como una MPS combinada genes 21-prueba de puntuación de recurrencia genética para lograr un rendimiento óptimo para este caso de prueba específico.
Ejemplo 5: información adicional para ilustrar la presente invención
(1) Medición de los niveles de expresión génica
Los datos derivados del conjunto único de genes diana descritos en este documento se utilizan además para inferir actividades de las rutas de señalización celular utilizando los métodos descritos en el presente documento.
Los métodos para analizar los niveles de expresión génica en muestras extraídas son generalmente conocidos. Por ejemplo, métodos como la inmunotransferencia Northern, el uso de PCR, PCR anidada, PCR cuantitativa en tiempo real (qPCR), RNA-seq o microarreglos pueden usarse para derivar datos del nivel de expresión génica. Todos los métodos conocidos en la técnica para analizar la expresión génica de los genes diana se contemplan en este documento.
Los métodos para determinar el producto de expresión de un gen usando métodos basados en PCR pueden ser de uso particular. Para cuantificar el nivel de expresión génica mediante PCR, la cantidad de cada producto de PCR de interés se estima típicamente utilizando PCR cuantitativa en tiempo real convencional (qPCR) para medir la acumulación de productos de PCR en tiempo real después de cada ciclo de amplificación. Esto normalmente utiliza un informador detectable, como un tinte intercalante, un tinte de unión a surcos menores o una sonda fluorogénica mediante la cual la aplicación de luz excita al informador para que emita fluorescencia y la fluorescencia resultante se detecta típicamente usando una cámara CCD o un sistema de detección de fotomultiplicador, como el que se describe en la Patente de los Estados Unidos No. 6,713,297.
En algunas realizaciones, las sondas utilizadas en la detección de productos de PCR en el ensayo de PCR cuantitativa en tiempo real (qPCR) pueden incluir un marcador fluorescente. Numerosos marcadores fluorescentes están disponibles comercialmente. Por ejemplo, Molecular Probes, Inc. (Eugene, Oreg.) Vende una amplia variedad de tintes fluorescentes. Los ejemplos no limitantes incluyen Cy5, Cy3, TAMRA, R6G, R110, ROX, JOE, FAM, Texas Red™ y Oregon Green™. Los marcadores fluorescentes adicionales pueden incluir sondas de doble extinción IDT ZEN con sondas de hidrólisis 5' tradicionales en ensayos de qPCR. Estas sondas pueden contener, por ejemplo, un colorante FAM de 5' con un extintor TAMRA de 3', un extintor de agujero negro de 3' (BHQ, Biosearch Technologies) o un extintor interno ZEN y un extintor fluorescente negro de Iowa de 3' (IBFQ).
Los colorantes fluorescentes útiles de acuerdo con la invención pueden unirse a cebadores oligonucleotídicos usando métodos bien conocidos en la técnica. Por ejemplo, una forma común de añadir un marcador fluorescente a un oligonucleótido es hacer reaccionar un éster de N-hidroxisuccinimida (NHS) del tinte con un grupo amino reactivo en la diana. Los nucleótidos se pueden modificar para que porten un grupo amino reactivo mediante, por ejemplo, la inclusión de un grupo alil amina en la nucleobase. El marcado mediante alil amina se describe, por ejemplo, en la Patente de los Estados Unidos Nos. 5,476,928 y 5,958,691. Otros medios de marcar nucleótidos, oligonucleótidos y polinucleótidos de forma fluorescente son bien conocidos por los expertos en la técnica.
Otros enfoques fluorogénicos incluyen el uso de sistemas de detección genéricos tales como colorante verde SYBR, que emite fluorescencia cuando se intercala con el ADN amplificado de cualquier producto de expresión génica como se describe en la Patente de los Estados Unidos Nos. 5,436,134 y 5,658,751.
Otro método útil para determinar los niveles de expresión génica diana incluye RNA-seq, una poderosa herramienta analítica utilizada para análisis de transcriptomas, que incluye la diferencia del nivel de expresión génica entre diferentes condiciones fisiológicas, o cambios que ocurren durante el desarrollo o durante el curso de la progresión de la enfermedad.
Otra metodología para determinar los niveles de expresión génica incluye el uso de microarreglos, por ejemplo, microarreglos de ARN y ADN, que son bien conocidos en la técnica. Los microarreglos pueden usarse para cuantificar la expresión de un gran número de genes simultáneamente.
(2) Flujo de trabajo generalizado para determinar la actividad de la señalización celular PI3K, Wnt, ER y HH La presente invención proporciona métodos y aparatos nuevos y mejorados como se describe en este documento, para evaluar el estado funcional o la actividad de las rutas TGF-p, Pl3K, Wnt, ER y HH con el fin de calcular una puntuación de riesgo de un sujeto que experimenta un evento clínico particular.
En la Figura 20 se muestra un diagrama de flujo que ilustra a modo de ejemplo un proceso para determinar la actividad de la señalización celular TGF-p y otra señalización celular de una muestra extraída de un sujeto. En primer lugar, se aísla el ARNm de una muestra (11). En segundo lugar, los niveles de expresión de ARNm de un conjunto único de al menos tres o más genes diana de TGF-p, como se describe en el presente documento, se miden (12) usando métodos para medir la expresión génica que se conocen en la técnica. Más adelante, se determina un nivel de actividad de un elemento (13) del factor de transcripción TGF-p (TF) utilizando un modelo de ruta matemática calibrada (14) que relaciona los niveles de expresión de los tres o más genes diana con el nivel de actividad del elemento TGF-p TF. Más adelante, se infiere la actividad de la ruta TGF-p en el sujeto (15) con base en el nivel de actividad determinado del elemento TGF-p TF en la muestra del sujeto.
Como se muestra en el lado derecho de la Figura 20, después de determinar el nivel de actividad del elemento TGF-p TF, un nivel de actividad de un elemento TF para al menos una ruta de señalización celular adicional (es decir, una o más de PI3K, Wnt, ER y HH). Como ejemplo, los niveles de expresión de ARNm de un conjunto único de tres o más genes diana de la ruta de señalización celular adicional, como se describe en este documento, se miden (16) usando métodos para medir la expresión génica que se conocen en la técnica. Más adelante, se determina el nivel de actividad del elemento TF (17) usando un modelo (14) de ruta matemático calibrado que relaciona los niveles de expresión de los tres o más genes diana de la ruta de señalización celular adicional con el nivel de actividad del elemento TF. Más adelante, se infiere la actividad de la ruta de señalización celular adicional en el sujeto (18) basándose en el nivel de actividad determinado del elemento TF en la muestra del sujeto. Más adelante, las actividades del TGF-p y las rutas de señalización celular adicionales se convierten en una puntuación de Multirruta (MPS) que indica un riesgo de que el sujeto experimente un evento clínico asociado con una enfermedad dentro de un período definido de tiempo (19). La determinación de la puntuación de riesgo como la MPS puede entenderse como la evaluación de un modelo de puntuación de Multirruta (MPS) calibrado, en donde los parámetros del modelo comprenden, por ejemplo, los coeficientes de ponderación (por ejemplo, we, Ww, Wh, Wp y wt), como se describe en el presente documento. Finalmente, a la muestra se le asigna una puntuación de riesgo para experimentar un evento clínico basado en el MPS calculado (20).
(3) Calibración del modelo Puntuación de Multirruta (MPS) y determinación de Puntuación de Multirruta (MPS) Como se contempla en el presente documento, se puede determinar una puntuación de riesgo correspondiente al riesgo de que ocurra un evento clínico utilizando un modelo de puntuación de Multirruta (MPS) calibrado que contiene actividades de las rutas de señalización celular asociadas con el evento clínico, como se describe más adelante.
Un modelo de puntuación de Multirruta (MPS) calibrado como se usa en la presente invención puede calibrarse con datos clínicos fácilmente disponibles sobre el evento clínico de interés y las actividades de la ruta inferida. En la Figura 21 se muestra un diagrama de flujo que ilustra de manera de ejemplo un proceso para calibrar un modelo MPS con datos de supervivencia. Como paso inicial, las actividades de la ruta relevantes inferidas usando modelos de ruta matemáticos calibrados se recuperan de una base de datos de actividades (201) de la ruta. La base de datos de actividades de la ruta contiene las actividades de la ruta TGF-p (206) y las actividades de la ruta para al menos una ruta adicional. Por ejemplo, la base de datos de actividades de la ruta contiene actividades de la ruta ER (202), actividades de la ruta Wnt (203), actividades de la ruta HH (204), actividades de la ruta PI3K (205) y actividades de la ruta TGF-p (206). Los ID de un conjunto de muestras (218) de entrenamiento en particular se emplean para recibir las actividades de la ruta relevante (219) y, por ejemplo, los datos (220) de supervivencia (si la supervivencia es el evento clínico que se analiza) que se reciben de una base de datos de datos (221) de supervivencia. Más adelante, se seleccionan (222) las actividades de la ruta con una salida de Pe, Pw, Ph, Pp y Pt en el caso de actividades de la ruta ER, actividades de la ruta Wnt, actividades de la ruta HH, actividades de la ruta PI3K y actividades de la ruta TGF-p. Los datos de supervivencia se convierten a las variables Surv y cens (223) que reflejan el tiempo de supervivencia y censuran los datos dentro de un período de tiempo determinado para el que se utilizará el MPS. Las actividades de la ruta y los datos de supervivencia se ajustan luego al modelo (224) de riesgo proporcional de Cox que da como resultado un modelo (225) de riesgo proporcional de Cox ajustado. A partir del modelo de riesgo proporcional de Cox, se recopilan (226) los coeficientes de Cox y luego se asignan a los pesos (227) con la salida We, Ww, Wh, Wp y wt. La estructura del MPS (228) y los pesos se toman juntos para calibrar el modelo MPS (229) generando un modelo MPS (210) calibrado.
En la Figura 22 se muestra un diagrama de flujo que ilustra a modo de ejemplo un proceso para determinar una puntuación de riesgo a partir de un modelo MPS calibrado. Como paso inicial, las actividades de la ruta relevantes inferidas usando modelos de ruta calibrados se recuperan de una base de datos (201) de actividades de la ruta. La base de datos de actividades de la ruta contiene las actividades de la ruta PI3K (205) y las actividades de la ruta para al menos una ruta adicional. Por ejemplo, la base de datos de actividades de la ruta contiene actividades de la ruta ER (202), actividades de la ruta Wnt (203), actividades de la ruta HH (204), actividades de la ruta PI3K (205) y actividades de la ruta TGF-p (206). Más adelante, se identifica la muestra del paciente (207) y las actividades de la ruta inicial se recopilan de la muestra y la base de datos como una medida de factores de transcripción o niveles de expresión génica, para las rutas relevantes (208). Más adelante, se infieren las actividades totales de cada una de las rutas relevantes (208) con una salida de Pe, Pw, Ph, Pp y Pt. Estas actividades luego se convierten en una puntuación de riesgo (210) utilizando un modelo MPS calibrado (211). Esta puntuación de riesgo inicial se puede ajustar aún más con otros datos relevantes para producir una puntuación de riesgo final para el paciente (212), que luego se puede utilizar para mostrar (213), asignar (214) o decidir sobre un tratamiento (215), producir los resultados de una puntuación de riesgo mostrada (216), una puntuación (217) de riesgo asignada o un tratamiento (218) decidido respectivamente.
La inferencia de la actividad de una ruta de señalización celular en el sujeto se puede realizar, por ejemplo, inter alia (i) evaluando una parte de un modelo de ruta probabilística calibrada, preferiblemente una red bayesiana, que representa la ruta de señalización celular para un conjunto de entradas que incluyen los niveles de expresión de los tres o más genes diana de la ruta de señalización celular medidos en una muestra del sujeto, (ii) estimar un nivel de actividad en el sujeto de un elemento de factor de transcripción (TF), el elemento TF controlar la transcripción de los tres o más genes diana de la ruta de señalización celular, basándose la estimación en posibilidades condicionales que relacionan el nivel de actividad del elemento TF y los niveles de expresión de los tres o más genes diana de la ruta de señalización celular medidos en la muestra del sujeto, y (iii) inferir la actividad de la ruta de señalización celular basada en el nivel de actividad estimado del elemento TF en la muestra del sujeto. Esto se describe en detalle en la solicitud de patente internacional publicada WO 2013/011479 A2 ("Assessment of cellular signaling pathway activity using probabilistic modeling of target gene expression").
En una alternativa de ejemplo, la inferencia de la actividad de una ruta de señalización celular en el sujeto se puede realizar, entre otras cosas, (i) determinando un nivel de actividad de un elemento de factor de transcripción (TF) en la muestra del sujeto, el elemento TF que controla la transcripción de los tres o más genes diana de la ruta de señalización celular, basándose la determinación en la evaluación de un modelo de ruta matemática calibrada que relaciona los niveles de expresión de los tres o más genes diana de la ruta de señalización celular con el nivel de actividad del elemento TF, el modelo de ruta matemática se basa en una o más combinaciones lineales de niveles de expresión de los tres o más genes diana, y (ii) inferir la actividad de la ruta de señalización celular en el sujeto en función del nivel de actividad determinado del elemento TF en la muestra del sujeto. Esto se describe en detalle en la solicitud de patente internacional publicada WO 2014/102668 A2 ("Assessment of cellular signaling pathway activity using linear combination(s) of target gene expressions").
Una realización proporciona un método en donde las rutas de señalización celular comprenden la ruta PI3K y/o la ruta Wnt y/o la ruta ER y/o la ruta HH, y en donde la puntuación de riesgo se define de tal manera que el riesgo indicado aumenta monotónicamente con una actividad inferida creciente de la ruta PI3K y/o una actividad inferida creciente de la ruta Wnt y/o una actividad inferida creciente de la ruta HH y/o disminuye monotónicamente con una actividad inferida creciente de la ruta ER.
En una realización, se proporciona un método en donde la puntuación de riesgo se define de manera que el riesgo indicado aumenta monotónicamente con un aumento de la actividad inferida de la ruta de TGF-p.
En una realización, la combinación de las actividades inferidas comprende una suma que incluye el término WtPt y uno o más de los términos WpPp, WwPw, WePe y WhPh, en donde Pt, Pp, Pw, Pe y Ph indican la actividad inferida de la ruta TGF-p, la ruta PI3K, la ruta Wnt, la ruta ER y la ruta HH, respectivamente, wt, Wp, Wv y Wh son coeficientes de ponderación constante positivos, we es un coeficiente de ponderación constante negativo, y el riesgo indicado de que el sujeto experimente el evento clínico dentro de un cierto período de tiempo aumenta monotónicamente con un valor creciente de la suma.
En ciertas realizaciones, los coeficientes de ponderación constantes wt, wp, ww, we y wh sean o hayan sido determinados en función del valor del coeficiente de Cox resultante de ajustar un modelo de riesgo proporcional de Cox para la ruta de señalización celular respectiva a los datos clínicos. Por ejemplo, el signo de la estimación del coeficiente indica si la actividad de la ruta es protectora para el evento clínico en caso de un coeficiente negativo o predice un pronóstico más pobre o peor en caso de un coeficiente positivo. El módulo del coeficiente indica la fuerza de la puntuación de riesgo con respecto al pronóstico.
En una realización, el evento clínico es metástasis de cáncer y wt, wp, ww y wh son coeficientes de ponderación constante no negativos, y we es un coeficiente de ponderación constante no positivo. Con estos coeficientes los MPS muestran el riesgo indicado de que el sujeto experimente el evento clínico dentro de un cierto período de tiempo que aumenta monotónicamente con un valor creciente de la suma.
(4) Procedimiento de determinación del nivel de expresión de genes diana
En la Figura 23 se muestra un diagrama de flujo de ejemplo que ilustra un proceso para derivar niveles de expresión génica diana de una muestra extraída de un sujeto. En una realización de ejemplo, las muestras se reciben y registran en un laboratorio. Las muestras pueden incluir, por ejemplo, muestras fijadas con formalina, incluidas en parafina (FFPE) (181) o muestras frescas congeladas (FF) (l80). Las muestras de FF se pueden someter a lisis (183) directamente. Para las muestras de FFPE, la parafina se puede eliminar con un paso de incubación caliente tras la adición de Proteinasa K (182). Luego, las células se lisan (183), lo que destruye las membranas celulares y nucleares, lo que hace que el ácido nucleico (NA) esté disponible para su procesamiento posterior. El ácido nucleico está unido a una fase (184) sólida que podría ser, por ejemplo, perlas o un filtro. Luego, el ácido nucleico se lava con reguladores de lavado para eliminar todos los restos celulares que están presentes después de la lisis (185). Más adelante, el ácido nucleico limpio se separa de la fase sólida con un tampón (186) de elución. El ADN se elimina mediante un tratamiento con ADNasa para garantizar que solo haya ARN presente en la muestra (187). La muestra de ácido nucleico se puede utilizar directamente en la mezcla de muestras RT-qPCR (188). Las mezclas de muestras de RT-qPCR contienen la muestra de ARN, la enzima RT para preparar el ADNc a partir de la muestra de ARN y una enzima de PCR para amplificar el ADNc, una solución reguladora para asegurar el funcionamiento de las enzimas y que potencialmente puede contener agua de grado molecular para establecer un volumen fijo de concentración. La mezcla de muestra se puede agregar a una placa de pozos múltiples (es decir, una placa de 96 pozos o de 384 pozos) que contiene ensayos (189) de RT-qPCR secos. El RT-qPCR se puede ejecutar en una máquina de PCR de acuerdo con un protocolo (190) específico. Un ejemplo de protocolo de PCR incluye i) 30 minutos a 50°C; ii) 5 minutos a 95°C; iii) 15 segundos a 95°C; iv) 45 segundos a 6o°C; v) 50 ciclos repitiendo los pasos iii y iv. Los valores de Cq se determinan luego con los datos brutos utilizando el método (191) de la segunda derivada. Los valores de Cq se exportan para su análisis (192).
(5) Enfermedades, trastornos y métodos de tratamiento.
Como se contempla en el presente documento, los métodos y aparatos de la presente invención se pueden utilizar para evaluar la actividad de la ruta de señalización celular de TGF-p, PI3K, Wnt, ER y/o HH en un sujeto, por ejemplo, un sujeto sospechoso de tener, o tener una enfermedad o trastorno en donde el estado de una de las rutas de señalización es probatorio, total o parcialmente, de la presencia o progresión de la enfermedad. En una realización, se proporciona en este documento un método para tratar a un sujeto que comprende recibir información sobre el estado de actividad de las rutas de señalización celular de TGF-p, PI3K, Wnt, ER y/o HH derivadas de una muestra aislada del sujeto usando los métodos descrito en el presente documento y administrar al sujeto un inhibidor de TGF-p, PI3K, Wnt, ER y/o HH si la información relativa a la actividad de las rutas de señalización celular es indicativa de un TGF-p activo, PI3K, Wnt, ER, y/o ruta de señalización HH.
Los inhibidores de TGF-p que se pueden usar en la presente invención son bien conocidos. Ejemplos de inhibidores de TGF-p incluyen, pero no se limitan a, Terameprocol, Fresolimumab, Sotatercept, Galunisertib, SB431542, LY2109761, LDN-193189, SB525334, SB505124, GW788388, LY364947, RepSox, LDN-193189 HCl, K02288, LDN-214117, SD-208, EW-7197, ML347, LDN-212854, DMH1, Pirfenidona, Hesperetin, Trabedersen, Lerdelimumab, Metelimumab, trx-SARA, ID11, Ki26894 o SB-431542.
Los inhibidores de PI3K son bien conocidos e incluyen, pero no se limitan a, Wortmanina, demetoxiviridina, perifosina, idelalisib, Pictilisib, Palomid 529, ZSTK474, PWT33597, CUDC-907 y AEZS-136, duvelisib, GS-9820, BKM120, GDC-0032 (Taselisib) (2-[4-[2-(2-Isopropil-5-metil-1,2,4-triazol-3-il)-5,6-dihidroimidazo[1,2-d][1,4]benzoxazepin-9-il] pirazol-1-il]-2-metilpropanamida), MLN-1117 ((2R)-1-Fenoxi-2-butanil hidrógeno (S)-metilfosfonato; o metilo(oxo){[(2R)-1-fenoxi-2-butanil]oxi}fosfonio)), BYL-719 ((2S)-N1-[4-Metil-5-[2-(2,2,2-trifluoro-1,1-dimetiletil)-4-piridinil]-2-tiazolil]-1,2-pirrolidindicarboxamida), GSK2126458 (2,4-Difluoro-N-{2-(metiloxi)-5-[4-(4-piridazinil)-6-quinolinil]-3-piridinil} bencenosulfonamida) (omipalisib), TGX-221 ((±)-7-Metil-2-(morfolin-4-il)-9-(1-fenilaminoetil)-pirido[1,2-a]-pirimidin-4-ona), GSK2636771 dihidrocloruro de ácido (2-metil-1-(2-metil-3-(trifluorometil)bencil)-6-morfolino-1H-benzo[d]imidazol-4-carboxílico), KIN-193 ácido ((R)-2-((1-(7-metil-2-morfolino-4-oxo-4H-pirido[1,2-a]pirimidin-9-il)etil)amino)benzoico), TGR-1202/RP5264, GS-9820 ((S)-1-(4-((2-(2-aminopirimidin-5-il)-7-metil-4-mohidroxipropan-1-ona), GS-1101 (5-fluoro-3-fenil-2-([S)]-1-[9H-punn-6-ilamino]-propil)-3H-quinazolin-4-ona), AMG-319, GSK-2269557, SAR245409 (N-(4-(N-(3-((3,5-dimetoxifenil)amino)quinoxalin-2-il)sulfamoil)fenil) -3-metoxi-4 metilbenzamida), BAY80-6946 (2-amino-N-(7-metoxi-8-(3-morfolinopropoxi)-2,3-dihidroimidazo[1,2-c] quinaz), AS 252424 (5-[1-[5-(4-Fluoro-2-hidroxi-fenil)-furan-2-il]-met-(Z)-iliden] -tiazolidin-2,4-diona), CZ 24832 (5-(2-amino-8-fluoro-[1,2,4]triazolo[1,5-a]piridin-6-il)-N-tert-butilpiridin-3-sulfonamida), Buparlisib (5-[2,6-Di(4-morfolinil)-4-pinmidinil]-4-(tnfluorometil)-2-pindinamina), GDC-0941 (2-(1H-indazol-4-il)-6-[[4- (metilsulfonil)-1-piperazinil]metil]-4-(4-morfolinil)tieno[3,2-d]pirimidina), GdC-0980 ((S)-1-(4-((2-(2-aminopinmidin-5-il)-7-metil-4-morfolinotieno[3,2-d] pirimidin-6 il)metil)piperazin-1-il)-2-hidroxipropan-1-ona (también conocido como RG7422)), SF1126 ((8S,14S,17S)-14-(carboximetil)-8-(3-guanidinopropil)-17-(hidroximetil)-3,6,9,12,15-pentaoxo-1-(4-(4-oxo-8-fenil-4H-cromen-2-il)morfolino-4-io)-2-oxa-7,10,13,16-tetraazaoctadecan-18-oato), PF-05212384 (N-[4-[[4-(Dimetilamino)-1-piperidinil]carbonil]fenil]-N'-[4-(4,6-di-4-morfolinil-1,3,5-triazin-2-il)fenil]urea) (gedatolisib), LY3023414, BEZ235 (2-Metil-2- {4-[3-metil-2-oxo-8-(quinolin-3-il)-2,3-dihidro-1H-imidazo[4,5-c]quinolin-1-il]fenil}propanonitrilo) (dactolisib), XL-765 (N-(3- (N-(3-(3,5-dimetoxifenilamino)quinoxalin-2-il)sulfamoil)fenil)-3-metoxi-4-metilbenzamida) y GSK1059615 (5-[[4-(4-Piridinil) -6-quinolinil]metilen]-2,4-tiazolidenodiona), PX886 ([(3aR,6E,9S,9aR,10R,11aS)-6-[[bis(prop-2-enil)amino]metiliden]-5-hidroxi-9-(metoximetil)-9a,11a-dimetil-1,4,7-trioxo-2,3,3a,9,10,11-hexahidroindeno[4,5h]isocromen-10-il] acetato (también conocido como sonolisib)), LY294002, AZD8186, PF-4989216, pilaralisib, GNE-317, PI-3065, PI-103, NU7441 (KU-57788), HS 173, VS-5584 (SB2343), CZC24832, TG100-115, A66, YM201636, CAY10505, PIK -75, PIK-93, AS-605240, BGT226 (NVP-BGT226), AZD6482, voxtalisib, alpelisib, IC-87114, TGI100713, CH5132799, PKI-402, copanlisib (BAY 80-6946), XL 147, PIK-90, PIK-293, PIK-294, 3-MA (3-metiladenina), AS-252424, AS-604850, apitolisib (GDC-0980; RG7422) y las estructuras descritas en WO2014/071109. Alternativamente, los inhibidores del complejo mTOR corriente abajo de PI3K son inhibidores valiosos de la actividad aberrante de PI3K. Alternativamente, los inhibidores del complejo HER2 corriente arriba de PI3K son inhibidores valiosos de la actividad aberrante de PI3K. Ejemplos de inhibidores de HER2 incluyen, entre otros, trastuzumab, lapatinib, pertuzumab.
La terapia endocrina se puede administrar en cánceres de mama que son receptores de estrógenos positivos. Los tratamientos de terapia endocrina que se pueden usar en la presente invención son bien conocidos. La terapia endocrina consiste en la administración de i) supresores de la función ovárica, generalmente obtenidos mediante agonistas de la hormona liberadora de gonadotropina (GnRHa), ii) moduladores selectivos del receptor de estrógeno o reguladores descendentes (SERM o SARD), o iii) inhibidores de la aromatasa (IA), o una combinación de los mismos. Los supresores de la función ovárica incluyen, por ejemplo, agonistas de la hormona liberadora de gonadotropina (GnRHa). Ejemplos de agonistas de la hormona liberadora de gonadotropina (GnRHa) pueden incluir buserelina, deslorrelina, gonadorrelina, goserelina, histrelina, leuprorelina, nafarelina y triptorelina. Los moduladores selectivos del receptor de estrógeno (SERM) incluyen, por ejemplo, tamoxifeno, toremifeno, raloxifeno, lasofoxifeno, bazedoxifeno, clomifeno, ormeloxifeno, ospemifeno, afimoxifeno y arzoxifeno. Los reguladores descendentes selectivos del receptor de estrógeno (SERD) incluyen, por ejemplo, fulvestrant, SR16234 y ZK191703. Los inhibidores de aromatasa incluyen, por ejemplo, anastrozol, letrozol, vorozol, exemestano, aminoglutetimida, testolactona, formestano, fadrozol, androstenediona, 4-hidroxiandrostenediona, 1,4,6-androstatrien-3,17-diona o 4-androsteno-3 6,17-triona. En una realización, el inhibidor de la aromatasa es un inhibidor de la aromatasa no esteroideo.
Los inhibidores de Wnt son bien conocidos e incluyen, pero no se limitan a, pirvinio, IWR-1-endo, IWP-2, FH535, WIKI4, IWP-L6, KY02111, LGK-974, Wnt-C59, XAV929, 3289-8625, FJ9, NSC 668036, PFK115-584, CGP049090, iCRT3, iCRT5, iCRT14, ICG-001, demetoxi curcumina, CCT036477, KY02111, PNU-74654 o PRI-724.
Los inhibidores de HH son bien conocidos e incluyen, pero no se limitan a, ciclopiamina, SANTI-SANT4, CUR-61414, HhAntag-691, GDC-0449, MK4101, IPI-926, BMS-833923, robotnikinina, itraconazol, Erivedge, Odomzo, calcitriol, colecalciferol, IPI-906, RU-SKI 39 o KAAD-ciclopamina. NVP-LDE225, TAK-441, XL-139, LY2940680, NVP-LEQ506, Itraconazol, MRT-10, MRT 83, PF-04449913, GANT-61, GANT-58, HPI-1, HPI-3 o HPI- 4.
En una realización, la enfermedad o trastorno es uno de los trastornos autoinmunes y otros trastornos inmunes, cáncer, asma bronquial, enfermedad cardíaca, diabetes, telangiectasia hemorrágica hereditaria, síndrome de Marfan, síndrome de Ehlers-Danlos vascular, síndrome de Loeys-Dietz, enfermedad de Parkinson, enfermedad renal crónica, esclerosis múltiple, enfermedades fibróticas como el hígado, lng o fibrosis renal, enfermedad de Dupuytren o enfermedad de Alzheimer.
En una realización particular, el sujeto padece, o se sospecha que tiene, un cáncer, por ejemplo, pero no limitado a, un tumor primario o un tumor metastásico, un tumor sólido, por ejemplo, melanoma, cáncer de pulmón (incluyendo adenocarcinoma de pulmón, carcinoma de células basales, carcinoma de células escamosas, carcinoma de células grandes, carcinoma bronquioloalveolar, carcinoma bronquiogénico, carcinoma de células no pequeñas, carcinoma de células pequeñas, mesotelioma); cáncer de mama (que incluye carcinoma ductal, carcinoma lobulillar, cáncer de mama inflamatorio, carcinoma de células claras, carcinoma mucinoso, carcinoma de mama de cavidades serosas); cáncer colorrectal (cáncer de colon, cáncer de recto, adenocarcinoma colorrectal); cáncer anal; cáncer de páncreas (que incluye adenocarcinoma de páncreas, carcinoma de células de los islotes, tumores neuroendocrinos); cáncer de próstata; adenocarcinoma de próstata; carcinoma de ovario (carcinoma epitelial de ovario o tumor del estromaepitelio de superficie que incluye tumor seroso, tumor endometrioide y cistadenocarcinoma mucinoso, tumor del estroma del cordón sexual); carcinoma de hígado y rutas biliares (incluyendo carcinoma hepatocelular, colangiocarcinoma, hemangioma); carcinoma de esófago (incluyendo adenocarcinoma de esófago y carcinoma de células escamosas); carcinoma de células escamosas oral y orofaríngeo; carcinoma adenoide quístico de glándula salival; cáncer de vejiga; carcinoma de vejiga; carcinoma de útero (incluyendo adenocarcinoma endometrial, ocular, carcinoma seroso papilar uterino, carcinoma uterino de células claras, sarcomas uterinos y leiomiosarcomas, tumores mullerianos mixtos); glioma, glioblastoma, meduloblastoma y otros tumores del cerebro; cánceres de riñón (incluyendo carcinoma de células renales, carcinoma de células claras, tumor de Wilm); cáncer de cabeza y cuello (incluidos carcinomas de células escamosas); cáncer de estómago (cánceres gástricos, adenocarcinoma de estómago, tumor del estroma gastrointestinal); cáncer testicular; tumor de células germinales; tumor neuroendocrino; cáncer de cuello uterino; carcinoides del tracto gastrointestinal, mama y otros órganos; carcinoma de células en anillo de sello; tumores mesenquimales que incluyen sarcomas, fibrosarcomas, hemangioma, angiomatosis, hemangiopericitoma, hiperplasia estromal pseudoangiomatosa, miofibroblastoma, fibromatosis, tumor miofibroblástico inflamatorio, lipoma, angiolipoma, tumor de células granulares, neurofibroma, schwanoma, angiosarcoma, liposarcoma, rabdomiosarcoma, osteosarcoma, leimioma, leimiosarcoma, piel, incluyendo melanoma, cervical, retinoblastoma, cáncer de cabeza y cuello, páncreas, cerebro, tiroides, testicular, renal, vejiga, tejidos blandos, glándula adenal, uretra, cánceres de pene, mixosarcoma, condrosarcoma, osteosarcoma, cordoma, histiocitoma fibroso maligno, linfangiosarcoma, mesotelioma, carcinoma de células escamosas; carcinoma epidermoide, tumores anexiales de piel malignos, adenocarcinoma, hepatoma, carcinoma hepatocelular, carcinoma de células renales, hipernefroma, colangiocarcinoma, carcinoma de células de transición, coriocarcinoma, seminoma, carcinoma de células embrionarias, glioma anaplásico; glioblastoma multiforme, neuroblastoma, meduloblastoma, meningioma maligno, schwannoma maligno, neurofibrosarcoma, carcinoma de paratiroides, carcinoma medular de tiroides, carcinoide bronquial, feocromocitoma, carcinoma de células de los islotes, carcinoide maligno, paraganglioma maligno, melanoma, neoplasias de células de Merkel, cistosarcoma filoide, cánceres salivales, carcinomas tímicos y cánceres de vagina entre otros.
En una realización, los métodos descritos en este documento son útiles para tratar a un huésped que padece un linfoma o un trastorno o anomalía de la proliferación linfocítica o mielocítica. Por ejemplo, el sujeto que padece un linfoma de Hodgkin de un linfoma no Hodgkin. Por ejemplo, el sujeto puede padecer un linfoma no Hodgkin tal como, pero sin limitarse a: un linfoma relacionado con el SIDA; Linfoma anaplásico de células grandes; Linfoma angioinmunoblástico; Linfoma blástico de células NK; Linfoma de Burkitt; Linfoma tipo Burkitt (linfoma de células pequeñas no escindidas); Leucemia linfocítica crónica/linfoma linfocítico pequeño; Linfoma cutáneo de células T; Linfoma difuso de células B grandes; Linfoma de células T de tipo enteropatía; Linfoma folicular; Linfoma hepatoesplénico de células T gama-delta; Linfoma linfoblástico; Linfoma de células del manto; Linfoma de la zona marginal; Linfoma nasal de células T; Linfoma pediátrico; Linfomas periféricos de células T; Linfoma primario del sistema nervioso central; Leucemias de células T; Linfomas transformados; Linfomas de células T relacionados con el tratamiento; o macroglobulinemia de Waldenstrom.
Alternativamente, el sujeto puede padecer un linfoma de Hodgkin, tal como, pero sin limitarse a: linfoma de Hodgkin clásico de esclerosis nodular (CHL); CHL de celularidad mixta; CHL con agotamiento de linfocitos; CHL rico en linfocitos; Linfoma de Hodgkin con predominio de linfocitos; o HL con predominio de linfocitos nodulares.
En una realización, el sujeto puede padecer un linfoma, un trastorno proliferativo o una anomalía específicos de células T, células B o células NK. Por ejemplo, el sujeto puede padecer un linfoma de células T o de células NK específico, por ejemplo, pero sin limitarse a: linfoma de células T periféricas, por ejemplo, linfoma de células T periféricas y linfoma de células T periféricas no de otra manera especificado (PTCL-NOS); linfoma anaplásico de células grandes, por ejemplo linfoma anaplásico quinasa (ALK) positivo, linfoma anaplásico de células grandes ALK negativo o linfoma anaplásico cutáneo primario de células grandes; linfoma angioinmunoblástico; linfoma cutáneo de células T, por ejemplo micosis fungoide, síndrome de Sezary, linfoma anaplásico cutáneo primario de células grandes, trastorno cutáneo primario linfoproliferativo de células T CD30+; linfoma de células T citotóxico epidermotrópico primario cutáneo agresivo CD8+; linfoma cutáneo primario de células T gamma-delta; linfoma cutáneo primario de células T CD4+ pequeñas/medianas y papulosis linfomatoide; Leucemia/linfoma de células T adultas (ATLL); Linfoma blástico de células NK; Linfoma de células T de tipo enteropatía; Linfoma de células T hematoesplénico gamma-delta; Linfoma linfoblástico; Linfomas nasales de células NK/T; Linfomas de células T relacionados con el tratamiento; por ejemplo, linfomas que aparecen después de un trasplante de órganos sólidos o de médula ósea; Leucemia prolinfocítica de células T; Leucemia linfocítica granular de células T; Trastorno linfoproliferativo crónico de células NK; Leucemia agresiva de células NK; Enfermedad linfoproliferativa de células T sistémica por VEB+ de la infancia (asociada con infección crónica activa por VEB); Linfoma tipo hidroa vacciniforme; Leucemia/linfoma de células T adultas; Linfoma de células T asociado a enteropatía; Linfoma hepatoesplénico de células T; o linfoma de células T tipo paniculitis subcutánea.
Alternativamente, el sujeto puede padecer un linfoma de células B específico o un trastorno proliferativo tal como, pero no limitado a: mieloma múltiple; Linfoma difuso de células B grandes; Linfoma folicular; Linfoma de tejido linfático asociado a mucosas (MALT); Linfoma linfocítico de células pequeñas; Linfoma de células del manto (MCL); Linfoma de Burkitt; Linfoma mediastínico de células B grandes; Macroglobulinemia de Waldenstrom; Linfoma de células B de zona marginal nodal (NMZL); Linfoma esplénico de la zona marginal (SMZL); Linfoma intravascular de células B grandes; Linfoma de derrame primario; o granulomatosis linfomatoide; Leucemia linfocítica crónica/linfoma de linfocitos pequeños; Leucemia prolinfocítica de células B; Leucemia de células pilosas; Linfoma/leucemia esplénica, no clasificable; Linfoma esplénico difuso de células B pequeñas de pulpa roja; variante de leucemia de células pilosas; Linfoma linfoplasmocítico; Enfermedades de cadena pesada, por ejemplo, enfermedad de cadena pesada alfa, enfermedad de cadena pesada Gamma, enfermedad de cadena pesada Mu; Mieloma de células plasmáticas; Plasmocitoma solitario de hueso; Plasmocitoma extraóseo; Linfoma cutáneo primario del centro del folículo; Linfoma de células B grandes rico en linfocitos T/histiocitos; DLBCL asociado con inflamación crónica; Virus de Epstein-Barr (EBV) DLBCL de los ancianos; Linfoma de células B grandes mediastínico primario (tímico); DLBCL cutáneo primario, tipo pierna; ALK linfoma de células B grandes; Linfoma plasmablástico; Linfoma de células B grandes que surge en multicéntrico asociado a HHV8; Enfermedad de Castleman; Linfoma de células B, no clasificable, con características intermedias entre el linfoma difuso de células B grandes y el linfoma de Burkitt; Linfoma de células B, inclasificable, con características intermedias entre el linfoma difuso de células B grandes y el linfoma de Hodgkin clásico; Linfoma de Hodgkin clásico de esclerosis nodular; Linfoma de Hodgkin clásico rico en linfocitos; Linfoma de Hodgkin clásico de celularidad mixta; o linfoma de Hodgkin clásico con agotamiento de linfocitos.
En una realización, el sujeto sufre leucemia. Por ejemplo, el sujeto puede sufrir una leucemia aguda o crónica de origen linfocítico o mielógeno, tal como, pero sin limitarse a: leucemia linfoblástica aguda (LLA); Leucemia mielógena aguda (AML); Leucemia linfocítica crónica (CLL); Leucemia mielógena crónica (LMC); leucemia mielomonocítica juvenil (JMML); leucemia de células pilosas (HCL); leucemia promielocítica aguda (un subtipo de AML); Leucemia prolinfocítica de células T (TPLL); leucemia linfocítica granular grande; o leucemia crónica de células T adultas; leucemia linfocítica granular grande (LGL). En una realización, el paciente padece una leucemia mielógena aguda, por ejemplo, una LMA indiferenciada (M0); leucemia mieloblástica (M1; con o sin maduración celular mínima); leucemia mieloblástica (M2; con maduración celular); leucemia promielocítica (variante M3 o M3 [M3V]); leucemia mielomonocítica (variante M4 o M4 con eosinofilia [M4E]); leucemia monocítica (M5); eritroleucemia (M6); o leucemia megacarioblástica (M7).
En una realización particular, el sujeto padece, o se sospecha que padece, cáncer de mama, cáncer de pulmón, cáncer de colon, cáncer de páncreas o cáncer de cerebro. En una realización particular, el sujeto padece, o se sospecha que padece, un cáncer de mama.
En la realización particular del cáncer, los pacientes con alto riesgo de experimentar el evento clínico pueden recibir quimioterapia o terapia dirigida además de las modalidades de tratamiento estándar de atención tales como, pero no limitado a, cirugía, radioterapia, terapia con medicamentos (dirigida). Alternativamente, los pacientes con bajo riesgo de experimentar el evento clínico pueden abstenerse de las modalidades de atención estándar como, entre otras, cirugía, radioterapia, quimioterapia.
En una realización, la determinación de si administrar un terapéutico, o abstenerse de administrar un terapéutico, puede basarse en una puntuación umbral de MPS, por ejemplo, un umbral establecido para asignar a un paciente a un grupo de bajo riesgo o un umbral establecido para asignar a un paciente a un grupo de alto riesgo. Por ejemplo, en una realización, el umbral para asignar pacientes al grupo de bajo riesgo puede basarse en el riesgo de que el evento clínico a los 5, 6, 7, 8, 9, 10 o más años sea menor o igual al 5 %, 10 %, 15 %, 20 %, mientras que el umbral para asignar pacientes al grupo de alto riesgo puede basarse en el riesgo de que el evento clínico a los 5, 6, 7, 8, 9, 10 o más años sea mayor o igual al 20 %, 25 %, 30 %, 35 %, 40 %, 45 %, 50 % o más. Por ejemplo, utilizando la ilustración anterior, en el caso particular de MPStpweh, esto da como resultado un umbral para el grupo de pacientes de bajo riesgo que es de -0,5, -0,4, -0,3, -0,2, -0,1, 0 y el umbral para el grupo de paciente de alto riesgo es 0, 0.1, 0.2, 0.3, 0.4, 0.5, 0.6, 0.7, 0.8, 0.9, 1, 1.1, 1.2.
En un aspecto de la presente invención, el evento clínico por el cual un sujeto puede ser asignado a un grupo de bajo o alto riesgo puede incluir una recurrencia, progresión, metástasis, muerte por cáncer o un evento clínico como se describe en otro lugar del presente documento.
En la realización particular, la asignación de un riesgo alto o bajo es para un sujeto con cáncer de mama, pacientes con un tumor ER+ o HR+ o subtipo luminal A o luminal B (es decir, una muestra de tumor que se ha teñido positivamente para ER o un receptor de hormonas (HR)) y con alto riesgo de experimentar el evento clínico pueden recibir quimioterapia (neo)adyuvante además del tratamiento hormonal como, entre otros, tamoxifeno o inhibidores de la aromatasa. ER+ tumor o subtipo luminal A o luminal B y con bajo riesgo de experimentar el evento clínico pueden recibir tratamiento hormonal (neo)adyuvante (y abstenerse de quimioterapia). Los pacientes con un tumor HER2+/HR- o subtipo enriquecido en HER2 y con alto riesgo de experimentar el evento clínico pueden recibir quimioterapia (neo)adyuvante además del tratamiento anti-HER2 como, entre otros, trastuzumab, mientras que HER2+/HR- tumor o subtipo enriquecido con HER2 y con bajo riesgo de experimentar el evento clínico pueden recibir tratamiento (neo)adyuvante anti-HER2 (y abstenerse de quimioterapia). Los pacientes con un tumor HER2+/HR+ y con un alto riesgo de experimentar el evento clínico pueden recibir quimioterapia (neo)adyuvante con tratamiento anti-HER2 además del tratamiento hormonal como, entre otros, tamoxifeno o inhibidores de la aromatasa, mientras que los pacientes con un tumor HER2+/HR+ y un riesgo bajo de experimentar el evento clínico pueden recibir tratamiento hormonal (neo)adyuvante (y abstenerse de quimioterapia y/o tratamiento anti-HER2). Los pacientes con un subtipo basal o tumor triple negativo (HER2-/ER-/PR- o HER2-/HR-) y con un alto riesgo de experimentar el evento clínico pueden recibir quimioterapia (neo)adyuvante además de la terapia dirigida como, pero no limitado a, descrito en este documento, mientras que los pacientes con un subtipo basal o tumor triple negativo y un riesgo bajo de experimentar el evento clínico pueden recibir terapia dirigida (neo)adyuvante (y abstenerse de quimioterapia).
Ejemplo 6: Un kit y herramientas de análisis para determinar una puntuación de riesgo
Se puede traducir el conjunto de genes diana que se encuentra que indican mejor la actividad de la ruta de señalización celular respectiva, de acuerdo con la investigación basada en secuenciación de microarreglos/ARN utilizando, por ejemplo, el modelo bayesiano o el modelo (pseudo)lineal en, por ejemplo, un ensayo de PCR cuantitativo multiplex o biochips de microarreglos dedicados para realizar en una muestra de un sujeto. Se puede usar una selección de la secuencia génica como se describe en el presente documento para seleccionar, por ejemplo, un conjunto de sonda-cebador para RT-PCR u oligonucleótidos para el desarrollo de micromatrices. Para desarrollar una prueba aprobada por la FDA para la determinación de la puntuación de riesgo y la actividad de la ruta, se requiere el desarrollo de un kit de prueba estandarizado, que debe ser validado clínicamente en ensayos clínicos para obtener la aprobación regulatoria.
Esta solicitud describe varias realizaciones preferidas. Pueden ocurrirse modificaciones y alteraciones a otras personas al leer y comprender la descripción detallada anterior. Se pretende que la solicitud se interprete con la inclusión de todas estas modificaciones y alteraciones en la medida en que entren dentro del alcance de las reivindicaciones adjuntas o sus equivalentes.
Los expertos en la técnica pueden comprender y realizar otras variaciones de las realizaciones descritas al poner en práctica la invención reivindicada, a partir de un estudio de los dibujos, la descripción y las reivindicaciones adjuntas. En las reivindicaciones, la palabra "que comprende" no excluye otros elementos o etapas, y el artículo indefinido "un" o "una" no excluye una pluralidad.
Una sola unidad o dispositivo puede cumplir las funciones de varios elementos enumerados en las reivindicaciones. El mero hecho de que se mencionen determinadas medidas en reivindicaciones dependientes diferentes entre sí no indica que una combinación de estas medidas no pueda utilizarse ventajosamente.
Cálculos tales como la determinación de la puntuación de riesgo realizada por una o varias unidades o dispositivos pueden realizarse mediante cualquier otro número de unidades o dispositivos.
Un programa de informador puede almacenarse/distribuirse en un medio adecuado, como un medio de almacenamiento óptico o un medio de estado sólido, suministrado junto con o como parte de otro hardware, pero también puede distribuirse en otras formas, como a través de Internet u otros sistemas de telecomunicaciones alámbricos o inalámbricos.
Cualquier signo de referencia en las reivindicaciones no debe interpretarse como una limitación del alcance.
Ejemplo 7: Listados de secuencias utilizadas en la solicitud
Listados de secuencias
Seq. No. Gen:
Seq. 1 ADRA2C
Seq. 2 AGRP
Seq. 3 ANGPTL4
Seq. 4 AP1B1
(continuación) Seq. No. Gen:
Seq. 5 ASCL2
Seq. 6 ATG14
Seq. 7 ATP5J
Seq. 8 ATP8A1
Seq. 9 AXIN2
Seq. 10 BCL2
Seq. 11 BCL2L 11
Seq. 12 BCL6
Seq. 13 BIRC5
Seq. 14 BMP7
Seq. 15 BNIP3
Seq. 16 BTG1
Seq. 17 C10orf10
Seq. 18 CA12
Seq. 19 CAT
Seq. 20 CAV1
Seq. 21 CBLB
Seq. 22 CCND1
Seq. 23 CCND2
Seq. 24 CCNG2
Seq. 25 CD44
Seq. 26 CDC42EP3
Seq. 27 CDH26
Seq. 28 CDKN1A
Seq. 29 CDKN1B
Seq. 30 CDKN2B
Seq. 31 CELSR2
Seq. 32 CFLAR
Seq. 33 COL18A1
Seq. 34 COX7A2L
Seq. 35 CTGF
Seq. 36 CTSD
Seq. 37 CTSL
Seq. 38 DDB1
Seq. 39 DEFA6
Seq. 40 DKK1
Seq. 41 DSCAM
Seq. 42 DYRK2
Seq. 43 EBAG9
(continuación)
Seq. No. Gen:
Seq. 44 EPHB2
Seq. 45 EPHB3
Seq. 46 ERBB2
Seq. 47 ERBB3
Seq. 48 EREG
Seq. 49 ESR1
Seq. 50 EXT1
Seq. 51 FASLG
Seq. 52 FAT1
Seq. 53 FBXO32
Seq. 54 FGFR2
Seq. 55 FOXA2
Seq. 56 FOXF1
Seq. 57 FOXL1
Seq. 58 FOXM1
Seq. 59 FST
Seq. 60 FYN
Seq. 61 FZD7
Seq. 62 GADD45A
Seq. 63 GADD45B
Seq. 64 GLI1
Seq. 65 GLI3
Seq. 66 GLUL
Seq. 67 GREB1
Seq. 68 H19
Seq. 69 HHIP
Seq. 70 HMGA2
Seq. 71 HNF1A
Seq. 72 HSPB1
Seq. 73 ID1
Seq. 74 IGF1R
Seq. 75 IGFBP1
Seq. 76 IGFBP3
Seq. 77 IGFBP4
Seq. 78 IGFBP6
Seq. 79 IL11
Seq. 80 IL1R2
Seq. 81 CXCL8 (anteriormente conocido como IL8) Seq. 82 INPP5D
(continuación)
Seq. No. Gen:
Seq. 83 INSR
Seq. 84 JAG2
Seq. 85 JUNB
Seq. 86 JUP
Seq. 87 CEMIP (anteriormente conocido como KIAA1199) Seq. 88 KLF2
Seq. 89 KLF4
Seq. 90 KLF6
Seq. 91 KRT19
Seq. 92 LECT2
Seq. 93 LEF1
Seq. 94 LGMN
Seq. 95 LGR5
Seq. 96 MIF
Seq. 97 MMP2
Seq. 98 MMP9
Seq. 99 MXI1
Seq. 100 MYC
Seq. 101 MYCN
Seq. 102 MYLK
Seq. 103 MYOD1
Seq. 104 NDUFV3
Seq. 105 NKD1
Seq. 106 NKX2-2
Seq. 107 NKX2-5
Seq. 108 NKX2-8
Seq. 109 NOS3
Seq. 110 NRIP1
Seq. 111 OAT
Seq. 112 OVOL1
Seq. 113 PCK1
Seq. 114 PDGFB
Seq. 115 PDK4
Seq. 116 PGR
Seq. 117 PISD
Seq. 118 PITRM1
Seq. 119 POMC
Seq. 120 PPARG
Seq. 121 PPARGC 1A
(continuación) Seq. No. Gen:
Seq. 122 PPM1D
Seq. 123 PRDM15
Seq. 124 PRDX3
Seq. 125 PTCH1
Seq. 126 PTCH2
Seq. 127 PTHLH
Seq. 128 PTMA
Seq. 129 RAB34
Seq. 130 RAG1
Seq. 131 RAG2
Seq. 132 RARA
Seq. 133 RBL2
Seq. 134 REG1B
Seq. 135 RNF43
Seq. 136 S100A7
Seq. 137 S100A9
Seq. 138 SEMA3C
Seq. 139 SEPP1
Seq. 140 SESN1
Seq. 141 SGK1
Seq. 142 SGK3
Seq. 143 SIRT1
Seq. 144 SKIL
Seq. 145 SLC1A2
Seq. 146 SLC5A3
Seq. 147 SMAD4
Seq. 148 SMAD5
Seq. 149 SMAD6
Seq. 150 SMAD7
Seq. 151 SNAI1
Seq. 152 SNAI2
Seq. 153 SOD1
Seq. 154 SOD2
Seq. 155 SOX9
Seq. 156 SP5
Seq. 157 SPP1
Seq. 158 STK11
Seq. 159 TBX3
Seq. 160 TCEA2
(continuación) Seq. No. Gen:
Seq. 161 TCF7L2
Seq. 162 TDGF1
Seq. 163 TFF1
Seq. 164 TIMP1
Seq. 165 TLE4
Seq. 166 TNFSF10
Seq. 167 TOM1
Seq. 168 TRIM25
Seq. 169 TSC22D1
Seq. 170 TXNIP
Seq. 171 VEGFA
Seq. 172 WISP2
Seq. 173 XBP1
Seq. 174 ZNRF3
Seq. 175 SERPINE1
Seq. 176 PDZK1
Tabla 25: Secuencias de oli o ara enes diana de TGF-
Figure imgf000066_0001
continuación
Figure imgf000067_0001
Tabla 26: Secuencias de olio ara enes diana PI3K
Figure imgf000067_0002
continuación
Figure imgf000068_0002
Tabla 27: Secuencias de olio ara enes diana Wnt
Figure imgf000068_0001
continuación
Figure imgf000069_0002
Tabla 28: Secuencias de olio ara enes diana ER
Figure imgf000069_0001
continuación
Figure imgf000070_0002
Tabla 29: Secuencias de olio ara enes diana de HH
Figure imgf000070_0001
continuación
Figure imgf000071_0001
Tabla 30: Secuencias de olio ara enes de referencia
Figure imgf000071_0002
continuación
Figure imgf000072_0001

Claims (12)

REIVINDICACIONES
1. Un método implementado por ordenador para determinar una puntuación de riesgo que indica un riesgo de que un sujeto experimente un evento clínico asociado con una enfermedad dentro de un período de tiempo definido realizado por un dispositivo de procesamiento digital, en donde la determinación comprende:
inferir la actividad de cada una de dos o más rutas de señalización celular en el sujeto basándose en la evaluación de un modelo de ruta matemática calibrada que relaciona los niveles de expresión de tres o más genes diana de la ruta de señalización celular respectiva medida en una muestra del sujeto con un nivel de actividad de los respectivos elemento(s) del factor de transcripción (TF) de la ruta de señalización celular respectiva en la muestra del sujeto, el elemento o elementos de TF controlan la transcripción de los tres o más genes diana de la ruta de señalización celular respectiva, la actividad de la ruta de señalización celular respectiva se define por el nivel de actividad de los respectivos elementos de TF, siendo el modelo de ruta matemática calibrada un modelo que se calibra utilizando un conjunto de datos verdaderos del terreno que incluye muestras en las cuales la transcripción de los tres o más genes diana de la respectiva señalización celular es inducida por los respectivos elementos TF y muestras en las cuales la transcripción de los tres o más genes diana no son inducidos por los respectivos elementos TF, y determinar el puntuación de riesgo con base en una combinación de las actividades inferidas,
en donde el evento clínico es la recurrencia de la enfermedad, en donde la enfermedad es cáncer de mama, en donde las rutas de señalización celular comprenden una ruta TGF-p y una o más de una ruta PI3K, una ruta Wnt, una ruta ER y una ruta HH,
en donde la ruta TGF-p, la ruta PI3K, la ruta Wnt, la ruta ER y la ruta HH se definen como la ruta de señalización celular que finalmente conduce a la actividad transcripcional de los respectivos elementos TF,
en donde los elementos TGF-p TF consisten en complejos de proteínas que contienen un dímero de un miembro seleccionado del grupo que consiste en SMAD1 SMAD2, SMa D3, SMAd5 y SMAD8 con SMAD4 o un trímero de dos miembros seleccionados del grupo que consiste en SMAD1, SMAD2, SMAD3, SMAD5 y SMAD8 con SMAD4, el elemento PI3K TF consiste en un miembro de la familia FOXO, el elemento Wnt TF consiste en p-catenina/TCF4, el elemento ER TF consiste en el dímero ERa, y el elemento HH TF consiste en un miembro de la familia GLI, en donde:
los tres o más genes diana de TGF-p se seleccionan del grupo que consiste en: ANGPTL4, CDC42EP3, CDKN1A, CTGF, GADD45A, GADD45B, HMGA2, ID1, IL11, JUNB, PDGFB, PTHLH, SERPINE1, SGK1, SKIL, SMAD4, SMAD5, SMAD6, SMAD7, SNAI2, VEGFA,
y/o
los tres o más genes diana PI3K se seleccionan del grupo que consiste en: AGRP, BCL2L11, BCL6, BNIP3, BTG1, CAT, CAV1, CCND1, CCND2, CCNG2, CDKN1A, CDKN1B, ESR1, FASLG, FBXO32, GADD45A, INSR, MXI1, NOS3, PCK1, POMC, PPARGC1A, PRDX3, RBL2, SOD2, TNFSF10,
y/o
los tres o más genes diana Wnt se seleccionan del grupo que consiste en: CEMIP, AXIN2, CD44, RNF43, MYC, TBX3, TDGF1, SOX9, ASCL2, CXCL8, SP5, ZNRF3, EPHB2, LGR5, EPHB3, KLF6, CCND1, DEFA6 y FZD7, y/o
los tres o más genes diana de ER se seleccionan del grupo que consiste en: CDH26, SGK3, PGR, GREB1, CA12, XBP1, CELSR2, WISP2, DSCAM, ERBB2, CTSD, TFF1, PDZK1, IGFBP4, ESR1, SOD1, AP1B1 y NRIP1, y/o
los tres o más genes diana de HH se seleccionan del grupo que consiste en: GLI1, PTCH1, PTCH2, IGFBP6, SPP1, CCND2, FST, FOXL1, CFLAR, TSC22D1, RAB34, S100A9, S100A7, MYCN, FOXM1, GLI3, TCEA2, FYN y CTSL1, en donde la puntuación de riesgo se basa en una puntuación de Multirruta (MPS) que comprende una suma que incluye el término wt ■ Pt y uno o más de los términos Wp ■ Pp, Ww ■ Pw, We ■ Pe, y Wh ■ Ph, en donde Pt, Pp, Pw, Pe y Ph denotan la actividad inferida de la ruta TGF-p, la ruta PI3K, la ruta Wnt, la ruta ER y la ruta HH, respectivamente, y en donde wt, wp, ww, we, y wh son coeficientes de ponderación constantes que representan una correlación entre el riesgo de que el sujeto experimente el evento clínico dentro del período de tiempo definido y la actividad de la ruta TGF-p, la ruta PI3K, la ruta Wnt, la ruta ER, y la ruta HH, respectivamente.
2. El método de la reivindicación 1, en donde las rutas de señalización celular comprenden la ruta Wnt y/o la ruta PI3K y/o la ruta ER y/o la ruta HH, y en donde la puntuación de riesgo se define de manera que el riesgo indicado aumenta monotónicamente con una actividad inferida creciente de la ruta PI3K y/o una actividad inferida creciente de la ruta Wnt y/o una actividad inferida creciente de la ruta HH y/o disminuye monotónicamente con una actividad inferida creciente de la ruta ER.
3. El método de la reivindicación 1 o 2, en donde la puntuación de riesgo se define de tal manera que el riesgo indicado aumenta monotónicamente con una actividad inferida creciente de la ruta de TGF-p.
4. El método de la reivindicación 3, en donde los coeficientes de ponderación constantes wt, Wp, Wv, We y Wh sean o hayan sido determinados en función del valor del coeficiente de Cox resultante de ajustar un modelo de riesgo proporcional de Cox para la respectiva ruta de señalización celular hacia los datos clínicos.
5. El método de cualquiera de las reivindicaciones 1 a 4, en donde:
los tres o más genes diana de TGF-p se seleccionan del grupo que consiste en: ANGPTL4, CDC42EP3, CDKN1A, CTGF, GADD45B, ID1, IL11, JUNB, SERPINE1, PDGFB, SKIL, SMAD7, SNAI2 y VEGFA, preferiblemente, del grupo formado por: ANGPTL4, CDC42EP3, ID1, IL11, JUNB, SERPINE1, SKIL y SMAD7,
y/o
los tres o más genes diana PI3K se seleccionan del grupo que consiste en: FBXO32, BCL2L11, SOD2, TNFSF10, BCL6, BTG1, CCNG2, CDKN1B, BNIP3, GADD45A, INSR y MXI1,
y/o
los tres o más genes diana de Wnt se seleccionan del grupo que consiste en: AXIN2, CD44, LGR5, CEMIP, MYC, CXCL8, SOX9, EPHB3, RNF43, TDGF1, ZNRF3 y DEFA6,
y/o
los tres o más genes diana de ER se seleccionan del grupo que consiste en: TFF1, GREB1, PGR, SGK3, PDZK1, IGFBP4, NRIP1, CA12, XBP1, ERBB2, ESR1 y CELSR2,
y/o
los tres o más genes diana de HH se seleccionan del grupo que consiste en: GLI1, PTCH1, PTCH2, CCND2, IGFBP6, MYCN, FST, RAB34, GLI3, CFLAR, S100A7 y S100A9.
6. El método de la reivindicación 5, en donde los tres o más genes diana de TGF-p se seleccionan del grupo que consiste en: ANGPTL4, CDC42EP3, CDKN1A, CTGF, GADD45A, GADD45B, HMGA2, ID1, JUNB, PDGFB, PTHLH, SERPINE1, SGK1, SKIL, SMAD4, SMAD5, SMAD6, SMAD7, SNAI2, VEGFA, preferiblemente, del grupo formado por: ANGPTL4, CDC42EP3, CDKN1A, CTGF, GADD45B, ID1, JUNB, SERPINE1, SKIL, SMAD7, SNAI2 y VEGFA, más preferiblemente, del grupo que consiste en: ANGPTL4, CDC42EP3, ID1, JUNB, SERPINE1, SKIL y s Ma D7.
7. El método de cualquiera de las reivindicaciones 1 a 6, que además comprende:
asignar al sujeto a al menos uno de una pluralidad de grupos de riesgo asociados con diferentes riesgos indicados de que el sujeto experimente el evento clínico dentro del período de tiempo definido,
y/o
decidir un tratamiento recomendado para el sujeto en función del riesgo indicado de que el sujeto experimente el evento clínico dentro del período de tiempo definido.
8. Un aparato para determinar una puntuación de riesgo que indica un riesgo de que un sujeto experimente un evento clínico asociado con una enfermedad dentro de un período de tiempo definido que comprende un procesador digital configurado para realizar el método de cualquiera de las reivindicaciones 1 a 7.
9. Un medio de almacenamiento no transitorio para determinar una puntuación de riesgo que indica un riesgo de que un sujeto experimente un evento clínico asociado con una enfermedad dentro de un período de tiempo definido, almacenando instrucciones que son ejecutables por un dispositivo de procesamiento digital para realizar el método de cualquiera de las reivindicaciones 1 a 7.
10. Un programa de informador para determinar una puntuación de riesgo que indica un riesgo de que un sujeto experimente un evento clínico asociado con una enfermedad dentro de un período de tiempo definido que comprende medios de código de programa para hacer que un dispositivo de procesamiento digital realice un método de cualquiera de las reivindicaciones 1 a 7, cuando el programa de ordenador se ejecuta en el dispositivo de procesamiento digital.
11. Un kit para medir los niveles de expresión de tres o más genes diana de cada una de dos o más rutas de señalización celular en una muestra de un sujeto y para determinar una puntuación de riesgo que indique un riesgo de que un sujeto experimente un evento clínico asociado con una enfermedad dentro de un período de tiempo definido, que comprende:
uno o más componentes para determinar los niveles de expresión de tres o más genes diana de cada una de dos o más rutas de señalización celular en una muestra del sujeto,
en donde uno o más componentes se seleccionan preferiblemente del grupo que consiste en: un chip de microarreglos, un anticuerpo, una pluralidad de sondas, por ejemplo, sondas marcadas, un conjunto de componentes de secuenciación de a Rn transcriptasa inversora y/o ARN o ADN, incluyendo ADNc, cebadores de amplificación,
en donde las rutas de señalización celular comprenden una ruta TGF-p y una o más de una ruta PI3K, una ruta Wnt, una ruta ER y una ruta HH, y
en donde el kit comprende además el aparato de la reivindicación 8, el medio de almacenamiento no transitorio de la reivindicación 9 o el programa de informador de la reivindicación 10,
en donde:
los tres o más genes diana de TGF-p se seleccionan del grupo que consiste en: ANGPTL4, CDC42EP3, CDKN1A, CTGF, GADD45A, GADD45B, HMGA2, ID1, IL11, JUNB, PDGFB, PTHLH, SERPINE1, SGK1, SKIL, SMAD4, SMAD5, SMAD6, SMAD7, SNAI2, VEGFA,
y/o
los tres o más genes diana PI3K se seleccionan del grupo que consiste en: AGRP, BCL2L11, BCL6, BNIP3, BTG1, CAT, CAV1, CCND1, CCND2, CCNG2, CDKN1A, CDKN1B, ESR1, FASLG, FBXO32, GADD45A, INSR, MXI1, NOS3, PCK1, POMC, PPARGC1A, PRDX3, RBL2, SOD2, TNFSF10,
y/o
los tres o más genes diana Wnt se seleccionan del grupo que consiste en: CEMIP, AXIN2, CD44, RNF43, MYC, TBX3, TDGF1, SOX9, ASCL2, CXCL8, SP5, ZNRF3, EPHB2, LGR5, EPHB3, KLF6, CCND1, DEFA6 y FZD7, y/o
los tres o más genes diana de ER se seleccionan del grupo que consiste en: CDH26, SGK3, PGR, GREB1, CA12, XBP1, CELSR2, WISP2, DSCAM, ERBB2, CTSD, TFF1, PDZK1, IGFBP4, ESR1, SOD1, AP1B1 y NRIP1, y/o
los tres o más genes diana de HH se seleccionan del grupo que consiste en: GLI1, PTCH1, PTCH2, IGFBP6, SPP1, CCND2, FST, FOXL1, CFLAR, TSC22D1, RAB34, S100A9, S100A7, MYCN, FOXM1, GLI3, TCEA2, FYN y CTSL1.
12. Uso de un kit para realizar el método de cualquiera de las reivindicaciones 1 a 7, comprendiendo el kit:
uno o más componentes para determinar los niveles de expresión de tres o más genes diana de cada una de dos o más rutas de señalización celular en una muestra del sujeto, en donde el uno o más componentes se seleccionan preferiblemente del grupo que consiste en: un chip de microarreglos, un anticuerpo, una pluralidad de sondas, por ejemplo, sondas marcadas, un conjunto de componentes de secuenciación de transcriptasa inversora de ARN, y/o ARN o ADN, incluyendo ADNc, cebadores de amplificación,
en donde las rutas de señalización celular comprenden una ruta TGF-p y una o más de una ruta PI3K, una ruta Wnt, una ruta ER y una ruta HH,
en donde:
los tres o más genes diana de TGF-p se seleccionan del grupo que consiste en: ANGPTL4, CDC42EP3, CDKN1A, CTGF, GADD45A, GADD45B, HMGA2, ID1, IL11, JUNB, PDGFB, PTHLH, SERPINE1, SGK1, SKIL, SMAD4, SMAD5, SMAD6, SMAD7, SNAI2, VEGFA,
y/o
los tres o más genes diana PI3K se seleccionan del grupo que consiste en: AGRP, BCL2L11, BCL6, BNIP3, BTG1, CAT, CAV1, CCND1, CCND2, CCNG2, CDKN1A, CDKN1B, ESR1, FASLG, FBXO32, GADD45A, INSR, MXI1, NOS3, PCK1, POMC, PPARGC1A, PRDX3, RBL2, SOD2, TNFSF10,
y/o
los tres o más genes diana Wnt se seleccionan del grupo que consiste en: CEMIP, AXIN2, CD44, RNF43, MYC, TBX3, TDGF1, SOX9, ASCL2, CXCL8, SP5, ZNRF3, EPHB2, LGR5, EPHB3, KLF6, CCND1, DEFA6 y FZD7, y/o
los tres o más genes diana de ER se seleccionan del grupo que consiste en: CDH26, SGK3, PGR, GREB1, CA12, XBP1, CELSR2, WISP2, DSCAM, ERBB2, CTSD, TFF1, PDZK1, IGFBP4, ESR1, SOD1, AP1B1 y NRIP1, y/o
los tres o más genes diana de HH se seleccionan del grupo que consiste en: GLI1, PTCH1, PTCH2, IGFBP6, SPP1, CCND2, FST, FOXL1, CFLAR, TSC22D1, RAB34, S100A9, S100A7, MYCN, FOXM1, GLI3, TCEA2, FYN y CTSL1.
ES15785100T 2014-10-24 2015-10-26 Pronóstico médico y predicción de la respuesta a tratamiento usando múltiples actividades de la ruta de señalización celular Active ES2838923T3 (es)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
EP14190275 2014-10-24
PCT/EP2015/074704 WO2016062893A1 (en) 2014-10-24 2015-10-26 Medical prognosis and prediction of treatment response using multiple cellular signaling pathway activities

Publications (1)

Publication Number Publication Date
ES2838923T3 true ES2838923T3 (es) 2021-07-02

Family

ID=51945683

Family Applications (1)

Application Number Title Priority Date Filing Date
ES15785100T Active ES2838923T3 (es) 2014-10-24 2015-10-26 Pronóstico médico y predicción de la respuesta a tratamiento usando múltiples actividades de la ruta de señalización celular

Country Status (9)

Country Link
US (1) US11610644B2 (es)
EP (1) EP3210144B1 (es)
JP (1) JP7065610B6 (es)
CN (1) CN108064380A (es)
AU (1) AU2015334842B2 (es)
BR (1) BR112017007962A2 (es)
CA (1) CA2965408C (es)
ES (1) ES2838923T3 (es)
WO (1) WO2016062893A1 (es)

Families Citing this family (29)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP3431582A1 (en) 2017-07-18 2019-01-23 Koninklijke Philips N.V. Cell culturing materials
EP3461916A1 (en) * 2017-10-02 2019-04-03 Koninklijke Philips N.V. Assessment of jak-stat3 cellular signaling pathway activity using mathematical modelling of target gene expression
EP3462349A1 (en) * 2017-10-02 2019-04-03 Koninklijke Philips N.V. Assessment of notch cellular signaling pathway activity using mathematical modelling of target gene expression
EP3461915A1 (en) * 2017-10-02 2019-04-03 Koninklijke Philips N.V. Assessment of jak-stat1/2 cellular signaling pathway activity using mathematical modelling of target gene expression
US20200240979A1 (en) 2017-10-02 2020-07-30 Koninklijke Philips N.V. Determining functional status of immune cells types and immune response
WO2019074491A1 (en) * 2017-10-10 2019-04-18 Flagship Biosciences, Inc. PATIENT STRATIFICATION METHOD USING IMAGE ANALYSIS PARAMETER DELIVERY FUNCTIONS
EP3502279A1 (en) 2017-12-20 2019-06-26 Koninklijke Philips N.V. Assessment of mapk-ap 1 cellular signaling pathway activity using mathematical modelling of target gene expression
CN108154935B (zh) * 2017-12-26 2021-06-25 北京嘉和美康信息技术有限公司 一种临床事件存储方法及装置
CA3103980A1 (en) * 2018-06-29 2020-01-02 Fresenius Medical Care Holdings, Inc. Systems and methods for identifying risk of infection in dialysis patients
WO2020037203A2 (en) * 2018-08-17 2020-02-20 Genentech, Inc. Diagnostic and therapeutic methods for the treatment of breast cancer
CN109859801B (zh) * 2019-02-14 2023-09-19 辽宁省肿瘤医院 一种含有七个基因作为生物标志物预测肺鳞癌预后的模型及建立方法
EP3812474A1 (en) 2019-10-22 2021-04-28 Koninklijke Philips N.V. Methods of prognosis in high-grade serous ovarian cancer
US11674185B2 (en) 2019-05-03 2023-06-13 Koninklijke Philips N.V. Methods of prognosis in high-grade serous ovarian cancer
EP3739588A1 (en) 2019-05-13 2020-11-18 Koninklijke Philips N.V. Assessment of multiple signaling pathway activity score in airway epithelial cells to predict airway epithelial abnormality and airway cancer risk
EP3882363A1 (en) 2020-03-17 2021-09-22 Koninklijke Philips N.V. Prognostic pathways for high risk sepsis patients
EP3978628A1 (en) 2020-10-01 2022-04-06 Koninklijke Philips N.V. Prognostic pathways for viral infections
WO2021209567A1 (en) 2020-04-16 2021-10-21 Koninklijke Philips N.V. Prognostic pathways for viral infections
CN111554402A (zh) * 2020-04-24 2020-08-18 山东省立医院 基于机器学习的原发性肝癌术后复发风险预测方法及***
EP3940704A1 (en) 2020-07-14 2022-01-19 Koninklijke Philips N.V. Method for determining the differentiation state of a stem cell
CN112053751A (zh) * 2020-09-02 2020-12-08 成都域时信息科技有限公司 机器学习定量预测间充质干细胞疗法后软骨修复率的方法
EP3965119A1 (en) 2020-09-04 2022-03-09 Koninklijke Philips N.V. Methods for estimating heterogeneity of a tumour based on values for two or more genome mutation and/or gene expression related parameter, as well as corresponding devices
EP3974540A1 (en) 2020-09-25 2022-03-30 Koninklijke Philips N.V. Method for predicting immunotherapy resistance
EP4015651A1 (en) 2020-12-17 2022-06-22 Koninklijke Philips N.V. Treatment prediction and effectiveness of anti-tnf alpha treatment in ibd patients
EP4039825A1 (en) 2021-02-09 2022-08-10 Koninklijke Philips N.V. Comparison and standardization of cell and tissue culture
CN112961919B (zh) * 2021-03-08 2021-12-14 镇江市第一人民医院 一种环状RNA hsa_circ_0059706及其特异性扩增引物和应用
WO2022189530A1 (en) 2021-03-11 2022-09-15 Koninklijke Philips N.V. Prognostic pathways for high risk sepsis patients
CN113161000B (zh) * 2021-05-06 2024-05-28 复旦大学附属中山医院 混合细胞型肝癌的预后评分模型及其构建方法
CN114239738B (zh) * 2021-12-21 2023-10-24 中国人民解放军国防科技大学 小样本的医疗数据分类方法及相关设备
WO2023201054A1 (en) * 2022-04-15 2023-10-19 Memorial Sloan-Kettering Cancer Center Multi-modal machine learning to determine risk stratification

Family Cites Families (67)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4711955A (en) 1981-04-17 1987-12-08 Yale University Modified nucleotides and methods of preparing and using same
US6004761A (en) 1986-11-19 1999-12-21 Sanofi Method for detecting cancer using monoclonal antibodies to new mucin epitopes
US5660985A (en) 1990-06-11 1997-08-26 Nexstar Pharmaceuticals, Inc. High affinity nucleic acid ligands containing modified nucleotides
US5658751A (en) 1993-04-13 1997-08-19 Molecular Probes, Inc. Substituted unsymmetrical cyanine dyes with selected permeability
US5436134A (en) 1993-04-13 1995-07-25 Molecular Probes, Inc. Cyclic-substituted unsymmetrical cyanine dyes
US5545531A (en) 1995-06-07 1996-08-13 Affymax Technologies N.V. Methods for making a device for concurrently processing multiple biological chip assays
US6720149B1 (en) 1995-06-07 2004-04-13 Affymetrix, Inc. Methods for concurrently processing multiple biological chip assays
US6146897A (en) 1995-11-13 2000-11-14 Bio-Rad Laboratories Method for the detection of cellular abnormalities using Fourier transform infrared spectroscopy
US6391550B1 (en) 1996-09-19 2002-05-21 Affymetrix, Inc. Identification of molecular sequence signatures and methods involving the same
NZ516848A (en) 1997-06-20 2004-03-26 Ciphergen Biosystems Inc Retentate chromatography apparatus with applications in biology and medicine
WO1999005591A2 (en) 1997-07-25 1999-02-04 Affymetrix, Inc. Method and apparatus for providing a bioinformatics database
US6953662B2 (en) 1997-08-29 2005-10-11 Human Genome Sciences, Inc. Follistatin-3
US6020135A (en) 1998-03-27 2000-02-01 Affymetrix, Inc. P53-regulated genes
US6884578B2 (en) 2000-03-31 2005-04-26 Affymetrix, Inc. Genes differentially expressed in secretory versus proliferative endometrium
WO2002042733A2 (en) 2000-11-16 2002-05-30 Ciphergen Biosystems, Inc. Method for analyzing mass spectra
US7299134B2 (en) 2001-02-16 2007-11-20 Bio-Rad Laboratories, Inc. Method for correlating gene expression profiles with protein expression profiles
EP2258872B1 (en) 2002-03-13 2013-08-14 Genomic Health, Inc. Gene expression profiling in biopsied tumor tissues
US7097976B2 (en) 2002-06-17 2006-08-29 Affymetrix, Inc. Methods of analysis of allelic imbalance
WO2004046386A1 (en) 2002-11-15 2004-06-03 Genomic Health, Inc. Gene expression profiling of egfr positive cancer
US20040231909A1 (en) 2003-01-15 2004-11-25 Tai-Yang Luh Motorized vehicle having forward and backward differential structure
US20040180341A1 (en) 2003-03-07 2004-09-16 Brown University Transcriptional regulation of kinase inhibitors
EP3170906B1 (en) 2003-06-24 2018-08-22 Genomic Health, Inc. Prediction of likelihood of cancer recurrence
DK1644858T3 (da) 2003-07-10 2018-01-22 Genomic Health Inc Funktionel beklædning med mindst et yderlag og en indermembran.
CN1930188B (zh) * 2004-03-10 2012-01-11 克赖顿大学 ***受体和使用方法
JP5813908B2 (ja) 2004-04-09 2015-11-17 ジェノミック ヘルス, インコーポレイテッド 化学療法剤に対する応答を予測するための遺伝子発現マーカー
EP1836629B1 (en) 2004-11-05 2020-03-04 Genomic Health, Inc. Predicting response to chemotherapy using gene expression markers
CA2602951A1 (en) 2005-03-23 2006-09-28 Bio-Rad Laboratories, Inc. Diverse chemical libraries bound to small particles with paramagnetic properties
US20060234911A1 (en) 2005-03-24 2006-10-19 Hoffmann F M Method of reversing epithelial mesenchymal transition
US20090186024A1 (en) 2005-05-13 2009-07-23 Nevins Joseph R Gene Expression Signatures for Oncogenic Pathway Deregulation
ES2545383T3 (es) * 2005-08-01 2015-09-10 The Ohio State University Research Foundation Métodos y composiciones basados en microARN para el diagnóstico, pronóstico y tratamiento de cáncer de mama
WO2007044860A2 (en) * 2005-10-11 2007-04-19 Tethys Bioscience, Inc. Diabetes-associated markers and methods of use thereof
KR100806274B1 (ko) 2005-12-06 2008-02-22 한국전자통신연구원 멀티 쓰레디드 프로세서 기반의 병렬 시스템을 위한 적응형실행 방법
MX2008008973A (es) 2006-01-11 2008-11-26 Genomic Health Inc Marcadores de expresion de genes para pronostico de cancer colorectal.
WO2007123772A2 (en) 2006-03-31 2007-11-01 Genomic Health, Inc. Genes involved in estrogen metabolism
JP2009533030A (ja) 2006-04-11 2009-09-17 ビオ−ラド・パストゥール リアルタイムマルチプレックス増幅によるhpv検出および定量化
WO2008115419A2 (en) * 2007-03-15 2008-09-25 Genomic Health, Inc. Gene expression markers for prediction of patient response to chemotherapy
DK2152258T3 (en) * 2007-05-10 2016-08-22 Dogwood Pharmaceuticals Inc Derivatives of fluorene, anthracene, xanthene, acridine dibenzosuberone AND DERIVATIVES AND USES
EP2162552A4 (en) 2007-05-11 2010-06-30 Univ Johns Hopkins BIOMARKERS FOR MELANOMES
US20090105962A1 (en) 2007-06-14 2009-04-23 The Regents Of The University Of Michigan Methods and systems for identifying molecular pathway elements
EP2201135A2 (en) 2007-09-28 2010-06-30 Duke University Individualized cancer treatments
JP5745273B2 (ja) 2007-11-30 2015-07-08 クラリエント ダイアグノスティック サービシーズ, インコーポレイテッド 化学療法のためのマーカーとしてのtle3
WO2009114836A1 (en) 2008-03-14 2009-09-17 Genomic Health, Inc. Gene expression markers for prediction of patient response to chemotherapy
WO2009124251A1 (en) 2008-04-03 2009-10-08 Sloan-Kettering Institute For Cancer Research Gene signatures for the prognosis of cancer
CA2730277A1 (en) 2008-07-08 2010-01-14 Source Precision Medicine, Inc. D/B/A Source Mdx Gene expression profiling for predicting the survivability of prostate cancer subjects
CA2743473C (en) 2008-11-17 2022-06-14 Veracyte, Inc. Methods and compositions of molecular profiling for disease diagnostics
JP2012515538A (ja) * 2009-01-21 2012-07-12 ユニヴァーシタ デグリ ステューディ ディ パドヴァ 2つの遺伝子の発現の観察による乳癌患者の予後診断
US8952130B2 (en) * 2009-02-24 2015-02-10 The Salk Institute For Biological Studies Designer ligands of TGF-β superfamily
US8765383B2 (en) 2009-04-07 2014-07-01 Genomic Health, Inc. Methods of predicting cancer risk using gene expression in premalignant tissue
SG175832A1 (en) * 2009-05-01 2011-12-29 Genomic Health Inc Gene expression profile algorithm and test for likelihood of recurrence of colorectal cancer and response to chemotherapy
US8911940B2 (en) 2009-07-31 2014-12-16 The Translational Genomics Research Institute Methods of assessing a risk of cancer progression
US8451450B2 (en) 2009-09-14 2013-05-28 Bio-Rad Laboratories, Inc. Near real time optical phase conjugation
RU2012148699A (ru) * 2010-04-16 2014-05-27 Дженентек, Инк. Foxo3a как прогностический биомаркер для эффективности ингибитора пути киназы pi3k/акт
CN102859528A (zh) 2010-05-19 2013-01-02 加利福尼亚大学董事会 使用生物网络识别药物靶点的***和方法
GB201009798D0 (en) * 2010-06-11 2010-07-21 Immunovia Ab Method,array and use thereof
ES2667547T3 (es) * 2010-12-09 2018-05-11 Biotheranostics, Inc. Pronóstico de cáncer de mama después del tratamiento
KR102165122B1 (ko) * 2011-04-01 2020-10-13 제넨테크, 인크. 암 치료에 대한 감수성을 예측하기 위한 바이오마커
US8703736B2 (en) 2011-04-04 2014-04-22 The Translational Genomics Research Institute Therapeutic target for pancreatic cancer cells
US9970057B2 (en) * 2011-05-06 2018-05-15 Albert Einstein College Of Medicine, Inc. Human invasion signature for prognosis of metastatic risk
CA2840066A1 (en) * 2011-06-27 2013-01-03 Dana-Farber Cancer Institute, Inc. Signatures and determinants associated with prostate cancer progression and methods of use thereof
EP2549399A1 (en) * 2011-07-19 2013-01-23 Koninklijke Philips Electronics N.V. Assessment of Wnt pathway activity using probabilistic modeling of target gene expression
EP2780469A1 (en) 2011-11-18 2014-09-24 Vanderbilt University Markers of triple-negative breast cancer and uses thereof
JP6351112B2 (ja) 2012-01-31 2018-07-04 ジェノミック ヘルス, インコーポレイテッド 前立腺癌の予後を定量化するための遺伝子発現プロフィールアルゴリズムおよび試験
JP2013213688A (ja) * 2012-03-30 2013-10-17 Kanagawa Academy Of Science And Technology 高脂血症又は糖尿病の検出方法及び疾患の治療剤のスクリーニング方法
CN105074005A (zh) * 2012-12-26 2015-11-18 皇家飞利浦有限公司 使用靶基因表达的线性组合评价细胞信号传导途径活性
JP2014166164A (ja) * 2013-02-28 2014-09-11 Ritsumeikan 発毛調節物質のスクリーニング方法
WO2014174003A1 (en) 2013-04-26 2014-10-30 Koninklijke Philips N.V. Medical prognosis and prediction of treatment response using multiple cellular signalling pathway activities
CN112795650A (zh) 2014-01-03 2021-05-14 皇家飞利浦有限公司 使用靶基因表达的数学建模评价pi3k细胞信号传导途径活性

Also Published As

Publication number Publication date
US20160117439A1 (en) 2016-04-28
EP3210144B1 (en) 2020-10-21
BR112017007962A2 (pt) 2018-01-23
US11610644B2 (en) 2023-03-21
JP7065610B2 (ja) 2022-05-12
CN108064380A (zh) 2018-05-22
JP2018501778A (ja) 2018-01-25
WO2016062893A1 (en) 2016-04-28
EP3210144A1 (en) 2017-08-30
CA2965408C (en) 2023-10-24
AU2015334842B2 (en) 2022-02-17
AU2015334842A1 (en) 2017-06-15
CA2965408A1 (en) 2016-04-28
JP7065610B6 (ja) 2022-06-06

Similar Documents

Publication Publication Date Title
ES2838923T3 (es) Pronóstico médico y predicción de la respuesta a tratamiento usando múltiples actividades de la ruta de señalización celular
ES2857953T3 (es) Pronóstico médico y predicción de la respuesta al tratamiento usando las actividades de múltiples rutas de señalización celular
EP3372695B1 (en) Medical prognosis and prediction of treatment response using multiple cellular signaling pathway activities
JP7186700B2 (ja) 腫瘍抑制foxo活性を酸化ストレスから区別する方法
ES2833543T3 (es) Evaluación de la actividad de la ruta de señalización celular de TGF usando modelos matemáticos de la expresión de genes diana
ES2878196T3 (es) Evaluación de la actividad de la vía de señalización celular mediante el uso de una o más combinaciones lineales de expresiones de genes diana
JP6077178B2 (ja) 標的遺伝子発現の数学的モデリングを用いるpi3k細胞内シグナル伝達経路活性の評価
JP6704861B2 (ja) 癌処置のための個別化三剤治療を選択するための方法