MX2014009283A - Algoritmo de perfil de expresion genica y prueba para determinar la prognosis de cancer de prostata. - Google Patents

Algoritmo de perfil de expresion genica y prueba para determinar la prognosis de cancer de prostata.

Info

Publication number
MX2014009283A
MX2014009283A MX2014009283A MX2014009283A MX2014009283A MX 2014009283 A MX2014009283 A MX 2014009283A MX 2014009283 A MX2014009283 A MX 2014009283A MX 2014009283 A MX2014009283 A MX 2014009283A MX 2014009283 A MX2014009283 A MX 2014009283A
Authority
MX
Mexico
Prior art keywords
genes
gene
group
record
expression
Prior art date
Application number
MX2014009283A
Other languages
English (en)
Other versions
MX351626B (es
Inventor
Tara Maddala
Robert J Pelham
Michael Crager
Steve Shak
Mark Lee
William Novotny
Diana Cherbavaz
Carl L Millward
Dejan Knezevic
Original Assignee
Genomic Health Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Genomic Health Inc filed Critical Genomic Health Inc
Publication of MX2014009283A publication Critical patent/MX2014009283A/es
Publication of MX351626B publication Critical patent/MX351626B/es

Links

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B25/00ICT specially adapted for hybridisation; ICT specially adapted for gene or protein expression
    • G16B25/10Gene or protein expression profiling; Expression-ratio estimation or normalisation
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6883Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
    • C12Q1/6886Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material for cancer
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B25/00ICT specially adapted for hybridisation; ICT specially adapted for gene or protein expression
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/30ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for calculating health indices; for individual health risk assessment
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/118Prognosis of disease development
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/158Expression markers

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Chemical & Material Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Physics & Mathematics (AREA)
  • General Health & Medical Sciences (AREA)
  • Medical Informatics (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Organic Chemistry (AREA)
  • Pathology (AREA)
  • Molecular Biology (AREA)
  • Biophysics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biotechnology (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Analytical Chemistry (AREA)
  • Immunology (AREA)
  • Public Health (AREA)
  • Theoretical Computer Science (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • General Engineering & Computer Science (AREA)
  • Hospice & Palliative Care (AREA)
  • Microbiology (AREA)
  • Oncology (AREA)
  • Biochemistry (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Epidemiology (AREA)
  • Primary Health Care (AREA)
  • Biomedical Technology (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Investigating Or Analysing Biological Materials (AREA)
  • Complex Calculations (AREA)

Abstract

La presente invención proporciona ensayos moleculares basados en algoritmo que implica en la medición de los niveles de expresión de los genes, o sus genes co-expresados, de una muestra biológica obtenida de un paciente con cáncer de próstata. Los genes se pueden agrupar en subconjuntos de genes funcionales para calcular un registro cuantitativo útil para predecir una probabilidad de un resultado clínico para un paciente con cáncer de próstata.

Description

ALGORITMO DE PERFIL DE EXPRESION GENICA Y PRUEBA PARA DETERMINAR LA PROGNOSIS DE CANCER DE PROSTATA Campo de la Invención La presente descripción se refiere a ensayos de diagnóstico moleculares que proporcionan información con respecto a los perfiles de expresión génica para determinar la información pronostica para pacientes con cáncer. Específicamente, la presente descripción proporciona un algoritmo que comprende genes, o genes co-expresados , los niveles de expresión de los cuales se pueden utilizar para determinar la probabilidad de que un paciente con cáncer de próstata experimentará un resultado clínico positivo o negativo .
Antecedentes de la Invención La introducción de la clasificación del antígeno específico de próstata (PSA, por sus siglas en inglés) en 1987 ha conducido al diagnóstico y tratamiento agresivo de muchos casos de cáncer de próstata indolente que nunca habrían sido clínicamente significativos o provocaran la muerte. La razón para esto es que la historia natural del cáncer de próstata es inusual entre las malignidades en que la mayoría de casos son indolentes y aún si no se tratan no progresarían durante el curso de la vida de un hombre para provocar sufrimiento o muerte. Aunque aproximadamente la ef: 250039 mitad de hombres desarrollan cáncer de próstata invasivo durante su tiempo de vida (como es detectado por estudios de autopsia) (B. Halpert y colaboradores, Cáncer 16: 737-742 (1963); B. Holund, Scand J Urol Nephrol 14: 29-35 (1980); S. Lundberg y colaboradores, Scand J Urol Nephrol 4: 93-97 (1970); M. Yin y colaboradores, J Urol 179: 892-895 (2008)), solamente 17% serán diagnosticados con cáncer de próstata y solamente 3% morirán como resultado del cáncer de próstata. Cáncer Facts and Figuras. Atlanta, GA: American Cáncer Society (2010); JE Damber y colaboradores, Lancet 371: 1710-1721 (2008) .
Sin embargo, actualmente, más de 90% de hombres quienes son diagnosticados con cáncer de próstata, aún con cáncer de próstata de bajo riesgo, son tratados con ya sea prostatectomía radical inmediata o terapia de radiación definitiva. MR Cooperberg y colaboradores, J Clin Oncol 28: 1117-1123 (2010) ; MR Cooperberg y colaboradores, J Clin Oncol 23: 8146-8151 (2005). La cirugía y terapia de radiación reducen el riesgo de recurrencia y muerte de cáncer de próstata (AV D'Amico y colaboradores, Jama 280: 969-974 (1998) ; M Han y colaboradores, Urol Clin North Am 28: 555-565 (2001); WU Shipley y colaboradores, Jama281: 1598-1604 (1999) ; AJ Stephenson y colaboradores, J Clin Oncol 27: 4300-4305 (2009) ) , sin embargo las estimaciones del número de hombres que se deben tratar para prevenir una muerte de cáncer de próstata varía de 12 a 100. A Bill-Axelson y colaboradores, J" Nati Cáncer Inst 100: 1144-1154 (2008); J Hugosson y colaboradores, Lancet Oncol 11: 725-732 (2010); LH Klotz y colaboradores, Can J Urol 13 Suppl 1: 48-55 (2006); S Loeb y colaboradores, J Clin Oncol 29: 464-467 (2011); FH Schroder y colaboradores, N Engl J Med 360: 1320-1328 (2009) . Este sobre-tratamiento de cáncer de próstata tiene un costo de dinero y toxicidad. Por ejemplo, la mayoría de hombres quienes se someten a prostatectomía radical sufren incontinencia e impotencia como resultado del procedimiento (MS Litwin y colaboradores, Cáncer 109: 2239-2247 (2007); MG Sanda y colaboradores, N Engl J Med 358: 1250-1261 (2008), y tanto como 25% de los hombres lamentan su elección de tratamiento para el cáncer de próstata. FR Schroeck y colaboradores, Eur Urol 54: 785-793 (2008).
Una de las razones para el sobre-tratamiento de cáncer de próstata es la falta de herramientas para pronóstico adecuadas para distinguir a los hombres quienes necesitan terapia definitiva inmediata de aquellos quienes son candidatos apropiados para aplazar la terapia inmediata y someterse en cambio a vigilancia activa. Por ejemplo, de los hombres quienes parecen que tienen enfermedad de bajo riesgo basado en los resultados de la estadificación clínica, el PSA de tratamiento, y el registro de Gleason de biopsia, y se han manejado con vigilancia activa en los protocolos, 30-40% experimentan progresión de la enfermedad (diagnosticada por la elevación de PSA, un registro de Gleason incrementado en la biopsia de repetición, o progresión clínica) durante los primeros pocos años de seguimiento, y algunos de ellos pueden haber perdido la oportunidad para terapia curativa. HB Cárter y colaboradores, J Urol 178: 2359-2364 and discussion 2364-2355 (2007); MA Dall'Era y colaboradores, Cáncer 112: 2664-2670 (2008); L Klotz y colaboradores, J Clin Oncol 28: 126-131 (2010) . También, de los hombres quienes parecen que son candidatos para vigilancia activa, pero quienes se someten a prostatectomía inmediata de todas maneras, 30-40% se encuentran en cirugía por tener enfermedad de riesgo más alto que la esperada como es definida por tener enfermedad de alto grado (registro de Gleason de 3+4 o más alto) o confinada no a órganos (extensión extracapsular (ECE) o complicación de las vesículas seminal (SVI) ) . SL y colaboradores, J Urol 181: 1628-1633 and discussion 1633-1624 (2009) ; CR Griffin y colaboradores, J" Urol 178: 860-863 (2007); PW Mufarrij y colaboradores, J Urol 181: 607-608 (2009).
Las estimaciones de riesgo de recurrencia en las decisiones de tratamiento en el cáncer de próstata se basan actualmente principalmente los niveles de PSA y/o la etapa tumoral clínica. Aunque la etapa tumoral clínica ha mostrado que tiene una asociación significativa con el resultado, suficiente para ser incluido en los reportes de patología, the College of American Pathologists Consensus Statement notó que existen variaciones en el procedimiento a la adquisición, interpretación, reporte y análisis de esta información. C. Compton, y colaboradores, Arch Pathol Lab Med 124:979-992 (2000) . Como una consecuencia, los métodos de estadificación patológica existentes han sido criticados por carecer de capacidad de reproducción y por lo tanto pueden proporcionar estimaciones imprecisas de riesgo de pacientes individuales.
Breve Descripción de la Invención Esta solicitud describe ensayos moleculares que implican la medición del (de los) nivel (es) de expresión de uno o más genes o subconj untos de genes de una muestra biológica obtenida de un paciente con cáncer de próstata, y análisis de los niveles de expresión medidos para proporcionar información con respecto a la probabilidad de un resultado clínico. Por ejemplo, la probabilidad de un resultado clínico se puede describir en términos de un registro cuantitativo basado en intervalos sin recurrencias clínica o bioquímica, supervivencia total, supervivencia específica de cáncer de próstata, eclipsado/aumento de la biopsia para prostatectomía radical, o presencia de enfermedad de alto grado o confinada no a órgano en la prostatectomía radical .
Además, esta solicitud describe ensayos moleculares que implican la medición del (de los) nivel (es) de expresión de uno o más genes o subconjuntos de genes de una muestra biológica obtenida para identificar una clasificación de riesgo para un paciente con cáncer de próstata. Por ejemplo, los pacientes se pueden estratificar utilizando el (los) nivel (es) de expresión de uno o más genes, positivamente o negativamente, con el resultado clínico positivo del cáncer de próstata, o con un factor de pronóstico. En una modalidad ejemplar, el factor de pronóstico es el registro de Gleason.
La presente invención proporciona un método para predecir la probabilidad de un resultado clínico para un paciente con cáncer de próstata que comprende la determinación de un nivel de uno o más transcritos de ARN, o un producto de expresión de los mismos, en una muestra biológica que contiene células tumorales obtenidas del paciente, en donde el transcrito de ARN o su producto de expresión, se selecciona de 81 mostrados en la Figura 1 y listados en las Tablas 1A y IB. El método comprende asignar el uno o más transcritos de ARN, o un producto de expresión de los mismos, a uno más grupos de genes seleccionados de un grupo de genes de organización celular, grupo de genes epitelial básales, un grupo de genes de respuesta de tensión, un grupo de genes de andrógeno, un grupo de genes de respuesta estromal y un grupo de genes de proliferación. El método comprende además calcular un registro cuantitativo para el paciente al ponderar el nivel del uno o más transcritos de ARN o un producto de expresión de los mismos, por su contribución a un resultado clínico y predecir la probabilidad de un resultado clínico para el paciente basado en el registro cuantitativo. En una modalidad de la invención, un incremento en el registro cuantitativo se correlaciona con una probabilidad incrementada de un resultado clínico negativo.
En una modalidad particular, el uno o más transcritos de AR , o un producto de expresión de los mismos se selecciona de BIN1, IGF1, C7, GSN, DES, TGFB1I1 , TPM2 , VCL, FLNC, ITGA7 , COL6A1, PPP1R12A, GSTM1, GSTM2 , PAGE , PPAP2B, SRD5A2 , PRKCA, IGFBP6, GPM6B, OLFML3 , HLF, CYP3A5 , KRT15, KRT5 , LAMB3 , SDC1, DUSP1, EGFR1 , FOS, JU , EGR3 , GADD45B, ZFP36 , FAM13C, KLK2 , ASPN, SFRP4 , BGN, THBS2 , INHBA, C0L1A1, C0L3A1 , C0L1A2 , SPARC, COL8A1, C0L4A1 , FN1 , FAP, COL5A2 , CDC20, TPX2 , UBE2T, MYBL2, y CDK 2C. BIN1, IGF1, C7, GSN, DES, TGFB1I1, TPM2 , VCL, FLNC, ITGA7 , C0L6A1, PPP1R12A, GSTM1, GSTM2 , PAGE4 , PPAP2B, SRD5A2, PRKCA, IGFBP6 , GPM6B, OLFML3 , y HLF se asignan al grupo de genes de organización celular. CYP3A5 , KRT15, KRT5, LAMB3, y SDC1 se asignan al grupo de genes epitelial basal . DUSP1, EGFR1, FOS, JUN, EGR3 , GADD45B, y ZFP36 se asignan al grupo de genes de respuesta al tensión. FAM13C, KLK2, AZGP1, y SRD5A2 se asignan al grupo de genes de andrógeno. ASPN, SFRP4, BGN, THBS2, INHBA, COL1A1, COL3A1, C0L1A2, SPARC, C0L8A1, COL4A1, FN1 , FAP y COL5A2 se asignan al grupo de genes de respuesta estromal . CDC20, TPX2 , UBE2T, MYBL2, y CDK 2C se asignan al grupo de genes de proliferación. El método puede comprender además determinar el nivel de por lo menos un transcrito de ARN, o un producto de expresión del mismo, seleccionado de STAT5B, NFAT5 , AZGP1, ANPEP, IGFBP2, SLC22A3, ERG, AR, SRD5A2 , GSTM1 , y GSTM2.
En una modalidad de la invención, el nivel de uno o más transcritos de ARN o un producto de expresión de los mismos, de cada uno del grupo de genes de respuesta estromal y el grupo de genes de organización celular son determinador . En otra modalidad, el nivel de uno o más transcritos de ARN, o los productos de expresión de los mismos, de cada uno del grupo de genes de respuesta estromal y el grupo de genes de PSA son determinados. Adicionalmente , el nivel de uno o más transcritos de ARN, o los productos de expresión de los mismos, del grupo de genes de organización celular y/o grupo de genes de proliferación se pueden determinar. En esta modalidad, el (los) gen(es) que se somete a ensayo del grupo de genes de respuesta estromal se puede seleccionar de ASPN, ÉGN, COL1A1, SPARC, FN1 , COL3A1 , COL4A1 , INHBA, THBS2 , y SFRP4; el (los) gen(es) que se somete a ensayo del grupo de genes de andrógeno se puede seleccionar de FAM13C y KLK2 ; el (los) gen(es) que se somete a ensayo del grupo de genes de organización celular se puede seleccionar de FLNC, GSN, GSTM2, IGFBP6, PPAP2B, PPP1R12A, BIN1, VCL, IGF1 , TPM2 , C7 , y GSTM1; y el (los) gen(es) que se somete a ensayo del grupo de genes de proliferación se puede seleccionar de TPX2 , CDC20, y MYBL2.
En una modalidad particular, los transcritos de ARN, o sus productos de expresión, se seleccionan de BGN, C0L1A1, SFRP4, FLNC, GSN, TPM2 , TPX2 , FAM13C, KLK2 , AZGP1 , GSTM2 , y SRD5A2. BGN, C0L1A1, y SFRP4 se asignan al grupo de genes de respuesta estromal; FLNC, GSN, y TPM2 se asignan al grupo de genes de organización celular; y FAM13C y KLK2 se asignan al grupo de genes de andrógeno. El nivel de los transcritos de ARN, o sus productos de expresión, que comprenden por lo menos uno de los grupos de gen seleccionados del grupo de genes de respuesta estromal, grupo de genes de organización celular, y grupo de genes de andrógeno, se pueden determinar para el método de la invención. En cualquiera de las modalidades, el grupo de genes de andrógeno puede comprender además AZGP1 y SRD5A2.
Además, el nivel de cualquiera de las combinaciones de genes mostradas en la Tabla 4 se puede determinar. Por ejemplo, el modelo RSO en la Tabla 4 comprende determinar los niveles de los transcritos de ARN, o los productos de expresión del gen de los mismos, de ASPN, BGN, C0L1A1, SPARC, FLNC, GSN, GSTM2, IGFBP6 , PPAP2B, PPP1R12A, TPX2 , CDC20, MYBL2, FAM13C, KLK2 , STAT5B, y NFAT5. Adicionalmente , cualquiera de los algoritmos mostrados en la Tabla 4 se pueden utilizar para calcular el registro cuantitativo para el paciente.
Breve Descripción de las Figuras La Figura 1 es un dendograma que representa la asociación de los 81 genes seleccionados del estudio de identificación del gen.
Las Figuras 2A, 2B, 2C, 2D y 2E son gráficas de dispersión que muestran la comparación de la expresión del gen normalizada (Cp) para muestras coincidentes de cada paciente donde el eje x en la expresión del gen de la muestra RP de patrón de Gleason primaria (PGP) y el eje y es la expresión del gen de la muestra de biopsia (BX) . La Figura 2A: Todos los genes ECM (de respuesta estromal) ; Figura 2B: Todos los genes de migración (organización celular) ; Figura 2C: Todos los genes de proliferación; Figura 2D: PSA (andrógeno) ; Figura 2E: otros genes de la lista de 81 genes que no se encuentran dentro de ninguno de estos cuatro grupos de genes.
Las Figuras 3A, 3B, 3C y 3D son gráficas de intervalo de la expresión de los genes individuales dentro de cada grupo de genes en las muestras de biopsia (BX) y PGP RP. Figura 3A: Todos los ECM (respuesta estromal); Figura 3B : Todos los genes de migración (organización celular); Figura 3C: Todos los genes de proliferación; Figura 3D: otros genes de 81 genes que no se encuentran dentro de ninguno de los grupos de genes.
La Figura 4 es una ilustración esquemática del método de grupos selectos-apilados utilizados para identificar los genes o co-expresados .
Las Figuras 5A, 5B y 5C muestran ejemplos de grupos selectos y apilados. La Figura 5A es un ejemplo de una gráfica que no es un grupo selecto; la Figura 5B es un ejemplo de un grupo selecto; la Figura 5C es un ejemplo de un grupo selecto pero no es un grupo selecto máximo.
La Figura 6 es una gráfica que muestra dos grupos selectos máximos: 1-2-3-4-5 y 1-2-3-4-6.
La Figura 7 ilustra esquemáticamente el apilado de dos grupos selectos máximos.
La Figura 8 es una gráfica que muestra que los grupos de riesgo RS27 y CAPRA predicen la libertad de la enfermedad de alto grado o confinada no a órganos.
La Figura 9 es una gráfica que muestra que los grupos de riesgo RS27 y AUA predicen la libertad de la enfermedad de alto grado o confinada no a órganos.
La Figura 10 es una gráfica que muestra el tiempo a la recurrencia clínica de pacientes con bajo PTEN y PTEN normal del estudio de identificación de genes.
La Figura 11 es una gráfica que muestra el tiempo a la recurrencia clínica de los pacientes del estudio de identificación de genes estratificado en bajo/normal de PTEN y negativo/positivo de TMPRSS-ERG.
Descripción Detallada de la Invención DEFINICIONES A menos que se defina de otra manera, los términos técnicos y científicos utilizados en la presente tienen el mismo significado como es entendido comúnmente por una persona de experiencia ordinaria en el campo a la cual esta invención pertenece. Singleton y colaboradores, Dictionary of Microbiology and Molecular Biology 2nd ed. , J. Wiley & Sons (New York, NY 1994) , and March, Advanced Organic Chemistry Reactions, Mechanisms and Structure 4th ed. , John Wiley & Sons (Nueva York, NY 1992) , proporcionan a un experto en el campo con una guía general para mucho de los términos utilizados en la presente solicitud.
Una persona experta en el campo reconocerá muchos métodos y materiales similares o equivalentes a aquellos descritos en la presente, que se pueden utilizar en la práctica de la presente invención. De hecho, la presente invención no está de ninguna manera limitada a los métodos y materiales descritos en la presente. Para propósitos de la invención, los siguientes términos se definen a continuación.
Los términos "tumor" y "lesión" como se utilizan en la presente, se refieren a todo el crecimiento y proliferación celular neoplásica, ya sea maligno o benigno, y todas las células precancerosas y cancerosas y tejidos. Aquellas personas expertas en el campo sabrán que una muestra de tejido tumoral puede comprender múltiples elementos biológicos, tales como una o más células cancerosas, células parciales o fragmentadas, tumores en varias etapas, que circundan el tejido que parece histológicamente normal y/o tejido macro o diseccionado.
Los términos "cáncer" y "canceroso" se refiere a o describe la condición fisiológica en mamíferos que se caracteriza típicamente por el crecimiento celular no regulado. Ejemplos de cánceres en la presente descripción incluye cáncer del tracto urogenital, tal como cáncer de próstata .
Como se utiliza en la presente, el término "cáncer de próstata" se utiliza en el sentido más amplio y se refiere a todas las etapas y todas las formas de cáncer que surgen del tejido de la glándula de la próstata.
La estadificación del cáncer ayuda a un médico a evaluar que tan lejos la enfermedad ha progresado y planear un tratamiento para el paciente. La estadificación se puede hacer clínicamente (estadificación clínica) por examinación física, pruebas de sangre o respuesta a la terapia de radiación, y/o basada patológicamente (estadificación patológica) en la cirugía, tal como prostatectomía radical. De acuerdo con el sistema de estadificación de tumor, nodo, metástasis (TNM, por sus siglas en inglés) del American Joint Committee on Cáncer (AJCC) , AJCC Cáncer Staging Manual (7th Ed., 2010), las diversas etapas del cáncer de próstata se definen como sigue: Tumor: Ti: tumor clínicamente no evidente no palpable o visible por la formación de imágenes, Tía: descubrimiento histológico incidental del tumor en 5% o menos del tejido resecado, Tlb : descubrimiento histológico incidental del tumor en más de 5% del tejido resecado, Tic: tumor identificado por biopsia por aguja; T2 : tumor confinado dentro de la próstata, T2a: el tumor implica una mitad de un lóbulo o menos, T2b: el tumor implica más de la mitad de un lóbulo, pero no ambos lóbulos, T2c: el tumor implica ambos lóbulos; T3 : el tumor se extiende a través de la cápsula prostática, T3a: extensión extracapsular (unilateral o bilateral), T3b: el tumor invade la vesícula(s) seminal; T : el tumor se fija o invade las estructuras adyacentes diferentes a las vesículas seminales (cuello de la vejiga, esfínter externo, recto, músculos elevadores, o pared pélvica) . Generalmente, una etapa T clínica (cT) es TI o T2 y la etapa T patológica (pT) es T2 o más alta. Nodo: NO: metástasis de nodos linfáticos no regional; NI: metástasis en los nodos linfáticos regionales. Metástasis: M0 : metástasis no distante; Mi: metástasis distante presente.
El sistema de clasificación de Gleason se utiliza para ayudar a evaluar la prognosis de hombres con cáncer de próstata. Junto con otros parámetros, se incorpora en una estrategia de estadificación de cáncer de próstata, que predice la prognosis y ayuda a guiar la terapia. Un "registro" o "grado" de Gleason se proporciona al cáncer de próstata basado en su apariencia microscópica. Los tumores con un registro bajo de Gleason se desarrollan típicamente suficientemente lentos que pueden no poseer una amenaza significativa a los pacientes en sus tiempos de vida. Estos pacientes se monitorean ("espera en observación" o "vigilancia activa") a través del tiempo. Los cánceres con un registro de Gleason más alto son más agresivos y tienen una peor prognosis, y estos pacientes se tratan generalmente con cirugía (por ejemplo, prostatectomía radial) y, en algunos casos, terapia (por ejemplo, radiación, hormonas, de ultrasonido, quimioterapia) . Los registros de Gleason (o sumas) comprenden grados de los dos patrones de tumores más comunes. Estos patrones son referidos como patrones de Gleason 1-5, con el patrón 1 que es el más bien diferenciado. La mayoría tienen una mezcla de patrones. Para obtener un registro o grado de Gleason, el patrón dominante se agrega al segundo patrón más prevalente para obtener un número entre 2 y 10. Los Grados de Gleason incluyen: Gl : bien diferenciado (anaplasia ligera) (Gleason 2-4); G2 : moderadamente diferenciado (anaplasia moderada) (Gleason 5-6); G3-4: deficientemente diferenciado/no diferenciado (anaplasia marcada) (Gleason 7-10) .
Agrupamientos de etapa: Etapa I: Tía NO M0 Gl; Etapa II: 1 (Tía NO MO G2-4) o (Tlb, c, TI, T2 , NO MO cualquier G) ; Etapa III: T3 NO MO cualquier G; Etapa IV: (T4 NO MO cualquier G) o (cualquier T NI MO cualquier G) o (cualquier T cualquier N MI cualquier G) .
El término "aumento" como se utiliza en la presente se refiere a un incremento en el grado de Gleason determinado de la biopsia al grado de Gleason determinado de la prostatectomía radical (RP) . Por ejemplo, el aumento incluye un cambio en el grado de Gleason de 3+3 o 3+4 en la biopsia a 3+4 o mayor en la RP. "Aumento significativo" o "aumento 2" como se utiliza en la presente, se refiere a un cambio en el grado Gleason de 3+3 o 3+4 determinado de la biopsia a 4+3 o mayor, o complicación de la vesícula seminal (SVI, por sus siglas en inglés) , o complicación extracapsular (ECE) como se determina del RP.
El término "alto grado" como se utiliza en la presente se refiere al registro de Gleason de >=3+4 o >=4+3 en RP. El término "grado bajo" como se utiliza en la presente se refiere a un registro de Gleason de 3+3 en RP. En una modalidad particular, "enfermedad de alto grado" se refiere a un registro de Gleason de por lo menos 4 patrones mayores, 5 patrones menores, o 5 patrones terciarios.
El término "reclasificación" como se utiliza en la presente se refiere a un incremento en la etapa tumoral de la biopsia a la etapa tumoral en RP. Por ejemplo, la reclasificación es un cambio en la etapa tumoral de la etapa TI o T2 clínica en la biopsia a etapa T3 patológica en RP.
El término "enfermedad confinada no a órgano" como se utiliza en la presente se refiere a tener la enfermedad T3 de etapa patológica en RP. El término "confinada a órgano" como se utiliza en la presente se refiere a la etapa patológica pT2 en RP.
El término "patología adversa" como se utiliza en la presente se refiere a una enfermedad de alto grado como se define en lo anterior, o enfermedad no confinada a órgano como se define en lo anterior. En una modalidad particular, "patología adversa" se refiere a cáncer de próstata con un registro de Gleason de >=3+4 o >=4+3 o etapa patológica T3.
En otra modalidad, el término "enfermedad de alto grado o confinada no a órgano" se refiere al cáncer de próstata con un registro de Gleason de por lo menos 4 patrones mayores, 5 patrones menores, o 5 patrones terciarios, o etapa patológica T3.
Como se utiliza en la presente, los términos "vigilancia activa" y "espera en observación" significan estrechamente monitorear la condición de un paciente sin dar ningún tratamiento hasta que los síntomas se presenten o cambien. Por ejemplo, en el cáncer de próstata, la espera en observación se utiliza usualmente en hombres mayores con otros problemas médicos y enfermedad de etapa temprana.
Como se utiliza en la presente, el término "cirugía" aplica a métodos quirúrgicos llevados a cabo para la remoción de tejido canceroso, incluyendo linfadenectomía pélvica, prostatectomía radical, resección transuretral de la próstata (TURP, por sus siglas en inglés) , escisión, disección, y biopsia/remoción del tumor. El tejido o secciones de tumor utilizado para el análisis de expresión génica pueden haber sido obtenidos de cualquiera de estos métodos.
Como se utiliza en la presente, el término "muestra biológica que contiene células cancerosas" se refiere a una muestra que comprende material tumoral obtenido de un paciente con cáncer. El término abarca muestras de tejido tumoral, por ejemplo, tejido por prostatectomía radical y tejido obtenido por biopsia, tal como por ejemplo una biopsia de núcleo o una biopsia de aguja fina. La muestra biológica puede ser reciente, congelada, o una muestra de tejido incrustada en cera, fija, tal como una muestra de tejido incrustada en parafina, fijada formalina. Una muestra biológica también abarca fluidos corporales que contienen células cancerosas, tales como sangre, plasma, suero, orina, y similares. Adicionalmente , el término "muestra biológica que contiene células cancerosas" abarca una muestra que comprende células tumorales obtenidas de sitios diferentes al tumor primario, por ejemplo, células tumorales circulantes. El término también abarca células que son la progenie de las células tumorales del paciente, por ejemplo muestras de cultivo celular derivadas de células tumorales primarias o células tumorales circulantes. El término abarca además muestras que pueden comprender material de proteínas o ácido nucleico arrojado de células tumorales in vivo, por ejemplo, médula ósea, sangre, plasma suero y similares. El término también abarca muestras que se han enriquecido para las células tumorales o de otra manera manipuladas después de su procuración y las muestras que comprenden polinucleótidos y/o polipéptidos que se obtienen del material tumoral de un paciente .
Los factores de pronóstico son aquellos variable relacionados con la historia natural del cáncer que incluye en las velocidades de recurrencia y resultado de los pacientes una vez que han desarrollado cáncer. Los parámetros clínicos que se han asociado con una peor prognosis incluyen, por ejemplo, etapa tumoral incrementada, nivel de PSA alto en la presentación, hígado o patrón de Gleason alto. Los factores de pronóstico se utilizan frecuentemente para categorizar pacientes en subgrupos con diferentes riesgos de recurrencia de línea base.
El término "prognosis" se utiliza en la presente para referirse a la probabilidad de que un paciente con cáncer tendrá una muerte o progresión atribuible al cáncer, recurriendo recurrencia, propagación metastásica, y resistencia a fármacos, de una enfermedad neoplásica, tal como cáncer de próstata. Por ejemplo, una "buena prognosis" incluiría supervivencia a largo plazo sin recurrencia y una "mala prognosis" incluiría recurrencia de cáncer.
Un "resultado clínico positivo" se puede evaluar utilizando cualquier punto final que indica un beneficio para el paciente, incluyendo, sin limitación, (1) inhibición, algún grado, del crecimiento tumoral, incluyendo desaceleración y detención completa del crecimiento; (2) reducción en el número de células tumorales; (3) reducción en el tamaño del tumor; (4) inhibición (es decir, reducción, desaceleración, o detección completa) de la infiltración de células tumorales en órganos y/o tejidos periféricos adyacentes; (5) inhibición de la metástasis; (6) mejora de la respuesta inmune anti-tumor, dando por resultado posiblemente la regresión o rechazo del tumor; (7) alivio, algún grado, de uno o más síntomas asociados con el tumor; (8) incremento en la duración de la supervivencia después del tratamiento; y/o (9) mortalidad disminuida en un punto de tiempo dado después del tratamiento. El resultado clínico positivo también se puede considerar en el contexto de un resultado de un individuo relativo con un resultado de una población de pacientes que tienen una diagnosis clínica comparable, y se pueden evaluar utilizando varios puntos finales tales como un incremento en la duración del Intervalo sin Recurrencia (RFI, por sus siglas en inglés) , un incremento en el tiempo de supervivencia (Supervivencia Total (OS) ) o tiempo de supervivencia específico de cáncer de próstata (Supervivencia Específica de Cáncer de Próstata (PCSS, por sus siglas en inglés) ) en una población, sin reclasificación o aumento en la etapa tumoral o el grado de Gleason entre la biopsia y la prostatectomía radical, presencia de grado 3+3 y enfermedad confinada a órgano en la prostatectomía radical y similares.
El término "clasificación de riesgos" significa un agrupamiento de sujetos para el nivel de riesgo (o probabilidad) de que el sujeto experimentará un resultado clínico negativo particular. Un sujeto se puede clasificar en un grupo de riesgo o clasificar en un nivel de riesgo basado en los resultados de la presente descripción, por ejemplo riesgo alto, medio o bajo. Un "grupo de riesgo" es un grupo de sujetos o individuos con un nivel similar de riesgo para un resultado clínico particular.
El término supervivencia "a largo plazo" se utiliza en la presente para referirse a la supervivencia durante un periodo de tiempo particular, por ejemplo, durante por lo menos 5 años, o durante por lo menos 10 años.
El término "recurrencia" se utiliza en la presente para referirse a la recurrencia local o distante (es decir, metástasis) del cáncer. Por ejemplo, el cáncer de próstata puede recurrir localmente en el tejido junto a la próstata o en las vesículas seminales. El cáncer también puede afectar los ganglios linfáticos circundantes en la pelvis o los ganglios linfáticos fuera de esta área. El cáncer de próstata también se puede propagar a los te idos junto a la próstata, tales como los músculos pélvicos, huesos, u otros órganos. La recurrencia se puede determinar por recurrencia clínica detectada por, por ejemplo, estudio o biopsia de formación de imágenes, o recurrencia bioquímica detectada por, por ejemplo, niveles de antígeno especifico de próstata de seguimiento sostenido (PSA) = 0.4 ng/mL o el inicio de la terapia de rescate como resultado de un aumento del nivel de PSA.
El término "intervalos sin recurrencia clínica (cRFI, por sus siglas en ingl s)" se utiliza en la presente en el momento de la cirugía a la primera recurrencia clínica o muerte debido a la recurrencia clínica del cáncer de próstata. Si el seguimiento termina sin ocurrencia de las recurrencia clínica, u otros canceres primarios o muerte se presentó antes de la recurrencia clínica, en tiempo al cRFI se considera censurado; cuando esto se presenta, la única información conocida es que a través del tiempo de censura, la recurrencia clínica no se ha presentado en este sujeto. Las recurrencias bioquímicas son ignoradas para los propósitos de calcular el cRFI .
El término "intervalo sin recurrencia bioquímica (bRFI, por sus siglas en inglés) " se utiliza en la presente para proponer el tiempo de la cirugía a la primera recurrencia bioquímica del cáncer de próstata. Si la recurrencia clínica se presentó antes de la recurrencia bioquímica, el seguimiento terminó sin ocurrencia de bRFI, u otros canceres primarios o muerte se presentaron antes de la recurrencia bioquímica, el tiempo a la recurrencia bioquímica se considera censurado en el primero de estos.
El término "Supervivencia General (OS)" se utilizó en la presente para referirse al tiempo de la cirugía a la muerte de cualquier causa. Si el sujeto aún estuvo vivo en un momento del último seguimiento, el tiempo de supervivencia se considera censurado en el tiempo del último seguimiento. La recurrencia bioquímica y la recurrencia clínica se ignoran para los propósitos de calcular la OS.
El término "Supervivencia Especifica de Cáncer de próstata (PCSS)" se utiliza en la presente para describir el tiempo de la cirugía a la muerte del cáncer de próstata. Si el paciente no murió de cáncer de próstata antes de la terminación del seguimiento, o murió debido a otras causas, la PCSS se considera censurada en este tiempo. La recurrencia clínica y recurrencia bioquímica se ignoran para los propósitos de calcular la PCSS.
En la práctica, el cálculo de las mediciones de tiempo a evento listadas en lo anterior puede variar de estudio a estudio dependiendo de la definición de los eventos que se consideran censurados.
Como se utiliza en la presente, el término "Nivel de expresión" como se aplica a un gen se refiere al nivel normalizado de un producto de gen, por ejemplo el valor normalizado determinado para el nivel de ARN de un gen o para el nivel de polipéptido de un gen.
El término "producto de gen" o "producto de expresión" se utilizan en la presente para referirse a los productos (transcritos) de transcripción de ARN (ácido ribonucleico) del gen, incluyendo ARNm, y los productos de traducción del polipéptido de tales transcritos de ARN. Un producto de gen puede ser, por ejemplo, un ARNm no empalmado, una ARNm, una ARNm variante de empalme, un micro-ARN, una ARN fragmentado, un polipéptido, un polipéptido pos-traduccionalmente modificado, un polipéptido variante de empalme, etc.
El término "transcrito de ARN" , como se utiliza en la presente se refiere a los productos de transcripción de ARN de un gen, incluyendo, por ejemplo, ARNm, una ARNm no empalmado, una ARNm variante de empalme, un micro-ARN y una ARN fragmentado.
A menos que se indique de otra manera, cada nombre de gen utilizado en la presente corresponde al Símbolo Oficial asignado al gen y proporcionado por Entrez Gene (URL: www. cbi . nlm. nih . gov/sites/entrez) a partir de la fecha de presentación de esta solicitud.
El término "micro arreglo" se refiere a un arreglo ordenado de elementos de arreglos hibridables, por ejemplo, sondas de oligonucleótidos o polinucleótidos , en un sustrato.
El término "polinucleótido" se refiere generalmente a cualquier polirribonucleótido o polidesoxirribonucleótido, que puede ser ARN o ADN no modificado o ARN o ADN modificado. De esta manera, por ejemplo, los polinucleótidos como se definen en la presente incluyen, sin limitación, ADN de hebra individual y doble hebra, ADN que incluye regiones de hebra individual y doble hebra, ARN de hebra individual y doble hebra, y ARN que incluye regiones de hebra individual y doble hebra, moléculas híbridas que comprenden ADN y ARN que pueden ser de hebra individual o, más típicamente, de doble hebra o incluyen regiones de hebra individual y doble hebra. Además, el término "polinucleótido" como se utiliza en la presente se refiere a regiones de triple hebra que comprenden ARN o ADN o tanto ARN como ADN. Las hebras en tales regiones pueden ser de la misma molécula o de diferentes moléculas. Las regiones pueden incluir todo o una o más de las moléculas, pero típicamente implican solo una región de algunas de las moléculas. Una de las moléculas de una región triple helicoidal es frecuentemente un oligonucleótido . El término "polinucleótido" incluye ADNcs. El término incluye ADNs (incluyendo ADNcs) y ARNs que contienen una o más bases modificadas. De esta manera, los ADNs o ARNs con cadenas principales modificadas para estabilidad o por otras razones, son "polinucleótidos" ya que ese término se propone en la presente. Por otra parte, los ADNs o ARNs que comprenden bases inusuales, tal como inosina, o bases modificadas, tales como bases tritiadas, se incluyen dentro del término "polinucleótidos" como se define en la presente. En general, el término "polinucleótidos" abarca todas las formas química, enzimática y/o metabólicamente modificadas de polinucleótidos no modificados, así como las formas químicas de ADN y ARN característica de los virus y células, incluyen células simples y complejas.
El término "oligonucleótido" se refiere a un polinucleótido relativamente corto, incluyendo, sin limitación, desoxiribonucleótidos , de hebra individual, ribonucleótidos de hebra individual o doble hebra, híbridos de ARNrADN y ADNs de doble hebra. Los oligonucleótidos, tales como oligonucleótidos de sonda de ADN de hebra individual, se sintetizan frecuentemente por métodos químicos, por ejemplo utilizando sintetizadores de oligonucleótidos automatizados que son comercialmente disponibles. Sin embargo, los oligonucleótidos se pueden elaborar por una variedad de otros métodos, incluyendo técnicas mediadas por ADN recombinante in vitro y por la expresión de ADNs en células y organismos.
El término "Ct" como se utiliza en la presente se refiere al ciclo de umbral, el numero de ciclo en la reacción en cadena de la polimerasa cuantitativa (qPCR) en la cual la fluorescencia generada dentro de un pocilio de reacción excede el umbral definido, es decir el punto durante la reacción en la cual el número suficiente de amplicones se han acumulado para cumplir con el umbral definido.
El término "Cp" como se utiliza en la presente se refiere a "punto de cruce" . El valor Cp se calcula al determinar los segundos derivados de las curvas de amplificación qPCR completas y su valor máximo. El valor Cp representa el ciclo en el cual el incremento de la fluorescencia es más alto y donde la fase logarítmica de una PCR comienza.
Los términos "umbral" o "formación de umbrales" se refieren a un procedimiento utilizado para dar cuenta de las relaciones no lineales entre las mediciones de la expresión génica y la respuesta clínica así como para reducir adicionalmente la variación en los registros de pacientes reportados. Cuando la formación de umbrales se aplica, todas las mediciones abajo o arriba de un umbral se ajustan para ese valor de umbral. Una relación no lineal entre la expresión génica y el resultado se puede examinar utilizando lengüetas más lisas o cubicas para modelar la expresión génica en intervalos sin recurrencia utilizando la regresión Cox PH o un estado de patología adverso que utiliza la regresión logística. D. Cox, Journal of the Royal Statistical Society, Series B 34:187-220 (1972). La variación en los registros de pacientes reportados se podría examinar como una función de variabilidad en la expresión génica en el límite de cuantificación y/o detección para un gen particular.
Como se utiliza en la presente, el término "amplicón," se refiere a piezas de ADN que se han sintetizado utilizando técnicas y amplificación, tales como reacciones en cadena de la polimerasa (PCR) y reacciones en cadena de ligasa.
"Astringencia" de las reacciones de hibridación es fácilmente determinable por una persona de experiencia ordinaria en el campo, y generalmente es un cálculo empírico dependiente de la longitud de la sonda, temperatura de lavado y concentración de sal. En general, las sondas más largas requieren temperaturas más altas para el recocido apropiado, mientras que las sondas más cortas necesitan temperaturas más bajas. La hibridación depende generalmente de la capacidad del ADN desnaturalizado para recocerse cuando las hebras complementarias están presentes en un entorno por debajo de su temperatura de fusión. Mientras es más alto el grado de homología deseada entre la sonda y la secuencia hibridable, es más alta la temperatura relativa que se puede utilizar. Como resultado, resulta que las temperaturas relativas más altas tendrían a hacer las condiciones de reacción más de severidad, mientras que las temperaturas más bajas lo harían menos. Para detalles adicionales y explicación de la astringencia de las reacciones de hibridación, ver Ausubel y colaboradores, Current Protocols in Molecular Biology (Wiley Interscience Publishers, 1995) .
"Condiciones de severidad" o "condiciones de alta severidad", como se definen en la presente, típicamente: (1) emplean resistencia iónica baja y temperatura alta para el lavado, por ejemplo cloruro de sodio 0.015 M /citrato de sodio 0.0015 M /0.1% de dodecil sulfato de sodio a 50°C; (2) emplean durante la hibridación un agente desnaturalizante, tal como formamida por ejemplo, 50% de formamida (v/v) con 0.1% de albúmina de suero bovino/0.1% de Ficol/0.1% de polivinilpirrolidona/solución amortiguadora de sulfato de sodio 50mM en pH 6.5 con cloruro de sodio 750 mM, citrato de sodio 75 mM a 42°C; o (3) emplean 50% de formamida, 5 x SSC (NaCl 0.75 M, citrato de sodio 0.075 M) , fosfato de sodio 50 mM (pH 6.8), 0.1% de pirofosfato de sodio, 5 x de solución de Denhardt, ADN de esperma de salmón pasado por ondas sonoras (50 pg/ml) , 0.1% de SDS, y 10% de sulfato de dextrano a 42°C, con lavados a 42 °C en 0.2 x de SSC (cloruro de sodio/citrato de sodio) y 50% de formamida, seguido por un lavado de alta astringencia que consiste de 0.1 x de SSC que contiene EDTA a 55°C.
"Condiciones moderadamente severas" se pueden identificar como se describe por Sambrook y colaboradores, Molecular Cloning: A Laboratory Manual, New York: Cold Spring Harbor Press, 1989, e incluyen el uso de solución de lavado y condiciones de hibridación (por ejemplo, temperatura, resistencia iónica y % de SDS) menos astringente que aquellas descritas en lo anterior. Un ejemplo de condiciones moderadamente de severidad es incubación durante la noche a 37°C en una solución que comprende: 20% de formamida, 5 x de SSC (NaCl 150 mM, citrato de trisodio 15 mM) , fosfato de sodio 50 mM (pH 7.6) , 5 x de solución de Denhardt, 10% de sulfato de dextrano, y 20 mg/ml de ADN de esperma de salmón cortado desnaturalizado, seguido por lavado de los filtros en 1 x SSC a aproximadamente 37-500C. El artífice experto reconocerá como ajustar la temperatura, resistencia iónica, etc., como sea necesario para adaptar los factores tales como longitud de la sonda y similares.
Los términos "empalme" y "empalme de ARN" se utilizan intercambiablemente y se refieren a procesamiento de ARN que remueven los intrones y uniones de los exones para producir ARN maduro con secuencia de codificación continua que se mueven en el citoplasma de una célula eucariótica. Como se utiliza en la presente, el término "fusión TMPRSS" y "fusión TMPRSS2" se utilizan intercambiablemente y se refieren a una fusión del gen TMPRSS2 conducido por andrógeno con el oncogén ERG, que ha mostrado que tiene una asociación significativa con el cáncer de próstata. S. Perner, y colaboradores, Urologe A. 46 (7) : 754-760 (2007); S.A. Narod, y colaboradores, Br J Cáncer 99 (6) : 847-851 (2008). Como se utiliza en la presente, el estado de fusión TMP SS positive indica que la fusión TMPRSS está presente en una muestra del tejido, mientras que el estado de fusión TMPRSS negativo indica que la fusión TMPRSS no está presente en una muestra del tejido. Los expertos en el campo reconocerán que existen numerosas formas para determinar el estado de fusión TMPRSS, tal como PCR cuantitativa, en tiempo real o una secuenciación de alto rendimiento. Ver por ejemplo, K. Mertz, y colaboradores, Neoplasis 9 (3):200-206 (2007); C. Maher, Nature 458 (7234 ): 97-101 (2009) .
Los términos "correlacionado" y "asociado" se utilizan intercambiablemen e en la presente para referirse a la asociación entre dos mediciones (o entidades medidas) . La descripción proporciona genes o subconjuntos de genes, los niveles de expresión de los cuales se asocian con el resultado clínico. Por ejemplo, el nivel de expresión incrementado de un gen se puede correlacionar positivamente (asociado positivamente) con un resultado clínico bueno o positivo. Tal correlación positiva se puede mostrar estadísticamente en varias formas, por ejemplo por una relación de peligro de recurrencia de cáncer menor que una relación de probabilidades de aumento o reclasificación de cáncer de menor que uno. En otro ejemplo, el nivel de expresión incrementado de un gen se puede correlacionar negativamente (asociado negativamente) con un resultado clínico bueno o positivo. En este caso, por ejemplo, el paciente puede experimentar una recurrencia de cáncer o mejora/recurrencia del cáncer, y esto se puede mostrar estadísticamente en varias formas, por ejemplo, una relación de peligro mayor que uno o una relación de probabilidades mayores que uno. "correlación" también se utiliza en la presente para referirse a la Resistencia de la asociación entre los niveles de expresión de dos genes diferentes, tal que el nivel de expresión de un primer gen se puede sustituir con un nivel de expresión de un segundo gen en un algoritmo dado si sus niveles de expresión se correlacionan en gran medida. Tal "expresión correlacionada" de dos genes que son sustituibles en un algoritmo son usualmente los niveles de expresión génica que se correlacionan positivamente uno con otro, por ejemplo, si la expresión incrementada de un primer gen se correlaciona positivamente con un resultado (por ejemplo, probabilidad incrementada de un resultado clínico bueno) , entonces el segundo gen que se co-expresa y muestra la expresión correlacionada con el primer gen también se correlaciona positivamente con el mismo resultado.
Los términos "co-expresa" y "co-expresado" , como se utiliza en la presente, se refiere a una correlación estadística entre las cantidades de diferentes secuencias de transcritos a través de una población de diferentes pacientes. La co-expresión en pares se puede calcular por varios métodos conocidos en la técnica, por ejemplo, al calcular los coeficientes de correlación de Pearson o los coeficientes de correlación de Spearman. Los grupos selectos de genes co-expresados también se pueden identificar al sembrar y al apilar la enumeración de grupos selectos máxima (MCE, por sus siglas en inglés) descrita en el Ejemplo 4 en la presente. Un análisis de co-expresión se puede calcular utilizando datos de expresión normalizados. Los genes dentro del mismo subconjunto de genes también se considera que se co-expresan .
Un "sistema basado en computadora" se refiere a un sistema de hardware, software, y medio de almacenamiento de datos utilizados para analizar la información. El hardware mínimo de un sistema basado en computadora del paciente comprende una unidad de procesamientos central (CPU, por sus siglas en inglés) , y hardware para la entrada de datos, salidas de datos (por ejemplo, pantalla) , y almacenamiento de datos. Un artífice ordinariamente experto puede apreciar fácilmente que cualquiera de los sistemas y/o componentes basados en computadora actualmente disponibles de los mismos son adecuados para el uso con relación con los métodos de la presente descripción. El medio de almacenamiento de datos puede comprender cualquier fabricación que comprenda una grabación de la presente información como se describe en lo anterior, o un dispositivo de acceso de memoria que pueda acceder a tal fabricación.
Para "registrar" los datos, la programación u otra información en el medio legible por computadora se refiere a un proceso para almacenar información, utilizando cualquiera de tales métodos conocidos en la técnica. Cualquier estructura de almacenamiento de datos convenientes se puede elegir, basado en los medios utilizados para accede a la información almacenada. Una variedad de programas procesadores de datos y formatos se pueden utilizar para almacenar, por ejemplo archivo de texto de procesamiento de palabras, formato de base de datos, etc.
Un "procesador" o "medio de computación" se refiere a cualquier combinación de hardware y/o software que llevará a cabo las funciones requeridas por él. Por ejemplo, un procesador adecuado puede ser un microprocesador digital programable tal como disponible en la forma de un controlador electrónico, estructura principal, servidor o computadora personal (de escritorio o portátil) . Donde el procesador es programable, la programación adecuada se puede comunicar desde una ubicación remota al procesador, o guardar previamente en un producto de programa de computadora (tal como un medio de almacenamiento legible por computadora portátil o fija, ya sea un dispositivo de estado óptico o solido, magnético o basado) . Por ejemplo, un medio magnético o disco óptico puede llevar la programación, y se puede leer por un lector adecuado que se comunica con cada procesador en su estación correspondiente.
Métodos Basados en Algoritmo y Subconjuntos de Genes La presente invención proporciona un ensayo de diagnóstico molecular basado en algoritmo para predecir un resultado clínico para un paciente con cáncer de próstata. El nivel de expresión de uno o más genes se puede utilizar solo o arreglado en subcon untos de genes funcionales para calcular un registro cuantitativo que se puede utilizar para predecir la probabilidad de un resultado clínico. El ensayo basado en algoritmo e información asociada proporcionada por la práctica de los métodos de la presente invención facilitan la toma de decisiones del tratamiento óptimo en el cáncer de próstata. Por ejemplo, tal herramienta clínica permitiría que los médicos identificaran pacientes quienes tienen una baja probabilidad de tener un cáncer agresivo y por lo tanto no necesitarían RP,- o quienes tienen una alta probabilidad de tener un cáncer agresivo y por lo tanto necesitarían RP.
Como se utiliza en la presente, un "registro cuantitativo" es un valor numérico aritmética o matemáticamente calculado para ayudar en simplificar o describir o informar el análisis de la información cuantitativa más compleja, tal como la correlación de ciertos niveles de expresión de los genes o subconjuntos de genes descritos a una probabilidad de un resultado clínico de un paciente con cáncer de próstata. Un registro cuantitativo se puede determinar por la aplicación de un algoritmo específico. El algoritmo utilizado para calcular el registro cuantitativo en los métodos descritos en la presente puede agrupar los valores del nivel de expresión de los genes. El agrupamiento de genes se puede llevar a cabo por lo menos en parte basado en el conocimiento de la contribución relativa de los genes de acuerdo con las funciones fisiológicas o las características celulares componentes, tal como en los grupos planteados en la presente. Un registro cuantitativo se puede determinar para un grupo de genes ("registro de grupos de genes") . La formación de los grupos, además, puede facilitar la ponderación matemática de la contribución de varios niveles de expresión de genes o subconjuntos de genes a registro cuantitativo. La ponderación de un gen o grupos de genes que representa un proceso fisiológico o característica celular componente puede reflejar la contribución de este proceso o característica a la patología del cáncer y el resultado clínico, tal como recurrencia o aumento/reclasificación del cáncer. La presente invención proporciona un número de algoritmos para calcular los registros cuantitativos, por ejemplo, como se expone en la Tabla 4. En una modalidad de la invención, un incremento en el registro cuantitativo indica una probabilidad incrementada de un resultado clínico negativo.
En una modalidad, un registro cuantitativo es un "registro de recurrencia" , que indica la probabilidad de una recurrencia de cáncer, aumento o reclasificación de un cáncer, patología adversa, enfermedad confinada no a órgano, enfermedad de alto grado y/o enfermedad de alto grado o confinada no a órgano. Un incremento en el registro de recurrencia puede correlacionarse con un incremento en la probabilidad de recurrencia de cáncer, aumento o reclasificación de un cáncer, patología adversa, enfermedad confinada no a órgano, enfermedad de alto grado y/o enfermedad de alto grado o confinada no a órganos.
Los subconjuntos de genes de la presente invención incluyen un grupo de genes ECM, grupo de genes de migración, grupo de genes de andrógeno, grupos de genes de proliferación, grupo de genes epiteliales, y grupo de genes de tensión.
Los subcon untos de genes referidos en la presente como el "grupo de genes ECM", "grupo de genes estromales" , y "grupo de genes de respuesta estromales" se utilizan intercambiablemente e incluyen genes que se sintetizan predominantemente por células estromales y se implican en la respuesta estromal y los genes que se co-expresan, los genes del grupo de genes ECM. "Células estromales" se refieren en la presente como células de tejido conectivo que constituyen la estructura de soporte de los tejidos biológicos. Las células estromales incluyen fibroblastos, células inmunes, pericitos, células endoteliales , y células inflamatorias. "Respuesta estromal" se refiere a una respuesta desmoplásica de los tejidos hospederos en el sitio de un tumor primario o invasión. Ver, por ejemplo, E. Rubin, J. Farber, Pathlogy, 985-986 (Ed. final 1994) . El grupo de genes ECM incluye, por ejemplo, ASPN, SFRP4, BGN, THBS2, INHBA, C0L1A1, C0L3A1 , C0L1A2, SPARC, C0L8A1, C0L4A1 , FN1, FAP, y COL5A2 , y los genes co-expresados de los mismos. Los genes co-expresados ejemplares incluyen los genes y/o grupos selectos de genes mostrados en la Tabla 8.
Los subconjuntos de genes referidos en la presente como el "grupo de genes de migración" o "grupo de genes de regulación de migración" o "grupo de genes citoesqueléticos" o "grupo de genes de organización celular" se utilizan intercambiablemente e incluyen genes y genes co-expresados que son parte de una red de microfilamentos dinámica de actina y proteínas accesorios y que proporcionan soporte intracelular a las células, generan las fuerzas físicas para el movimiento celular y la división celular, así como facilitan el transporte intracelular de las vesículas y los organelos celulares. El grupo de genes de migración incluye, por ejemplo, BIN1, IGF1, C7, GSN, DES, TGFB1I1, TPM2 , VCL, FLNC, ITGA7 , C0L6A1, PPP1R12A, GSTM1, GSTM2 , PAGE4 , ????2?, SRD5A2, PRKCA, IGFBP6 , GPM6B, 0LFML3 , y HLF, y genes coexpresados de los mismos. Los genes co-expresados ejemplares y/o grupos selectos de genes se proporcionan en la Tabla 9.
El subconjunto de genes referido en la presente como el "grupo de genes de andrógeno" , "grupo de genes de PSA" , y "grupo de genes de regulación de PSA" se utilizan intercambiablemente e incluyen genes que son los miembros de la familia de calicreína de las serinas proteasas (por ejemplo calicreína 3 [PSA] ) , y los genes que se co-expresan con los genes del grupo de genes de andrógeno. El grupo de genes de andrógeno incluye, por ejemplo, FAM13C y KLK2 , y genes co-expresados de los mismos. El grupo de genes de andrógeno puede comprender además AZGPl y SRD5A2 , y los genes co-expresados de los mismos.
Los subconjuntos de genes referidos en la presente como el "grupo de genes de proliferación" y "grupo de genes del ciclo celular" se utilizan intercambiablemente e incluyen genes que se implican con las funciones del ciclo celular y los genes que se co-expresan con los genes del grupo de genes de proliferación. "Funciones del ciclo celular" como sí utiliza en la presente se refiere a la proliferación celular y al control del ciclo celular, por ejemplo, punto de chequeo/transición de fase de Gl a S . El grupo de genes de proliferación incluye de esta manera, por ejemplo, CDC20, TPX2, UBE2T, MYBL2 y CD N2C, y los genes co-expresados de los mismos. Los genes co-expresados ejemplares y/o los grupos selectos de genes se proporcionan en la Tabla 10.
Los subconjuntos de genes referidos en la presente como el "grupo de genes epiteliales" y "grupo de genes de epiteliales básales" se utilizan intercambiablemente e incluyen genes que se expresan durante la diferenciación de un epitelio polarizado y que proporcionan integridad estructural intracelular para facilitar las interacciones físicas con las células epiteliales vecinas, y los genes que se co-expresan con los genes de los grupos de genes epiteliales. El grupo de genes epiteliales incluye, por ejemplo, CYP3A5, KRT15, KRT5 , LAMB3 y SDC1 y los genes coexpresados de los mismos.
El subconjunto de genes referido en la presente como el "grupo de genes de tensión" , "grupo de genes de respuesta de tensión" , y "grupo de genes de respuesta temprana" se utilizan intercambiablemente, e incluye genes y genes coexpresados que son los factores de transcripción y las proteínas de ligación a ADN activadas rápidamente y transitoriamente en respuesta a la tensión celular y otras señales extracelulares . Estos factores, a su vez, regulan la transcripción de un intervalo diverso de genes. El grupo de genes de tensión incluye, por ejemplo, DUSP1, EGR1, FOS, JU , EGR3, GADD45B y ZFP36, y genes co-expresados de los mismos.
Los genes co-expresados ejemplares y/o grupos selectos de genes se proporcionan en la Tabla 11.
Los niveles de expresión de otros genes y sus genes coexpresados se pueden utilizar con uno más de los subcon untos de genes anteriores para predecir una probabilidad de un resultado clínico de un paciente con cáncer de próstata. Por ejemplo, el nivel de expresión de uno o más genes seleccionados de 81 genes de la Figura 1 o Tabla 1A o IB que no se encuentran dentro de ninguno de los subconjuntos de genes descritos se puede utilizar con uno o más de los subcon untos de genes descritos. En una modalidad de la invención, uno o más de STAT5B, NFAT5, AZGP1, A PEP, IGFBP2 , SLC22A3, ERG, AR, SRD5A2 , GST 1 , y GSTM2 se puede utilizar en uno o más subconjuntos de genes descritos en lo anterior anteriormente para predecir la probabilidad de un resultado clínico .
La presente invención también proporciona métodos para determinar un nivel de expresión de umbral para un gen particular. Un nivel de expresión de umbral se puede calcular para un gen específico. Un nivel de expresión de umbral para un gen se puede basar en un nivel de expresión normalizado. En un ejemplo, un nivel de expresión de umbral Cp se puede calcular al evaluar las formas funcionales utilizando la regresión logística o la regresión de peligro proporcional Cox .
La presente invención proporciona además métodos para determinar los genes que se co-expresan con los genes particulares identificados por, por ejemplo, RT-PCR cuantitativa (qRT-PCR) , como biomarcadores validados relevantes a un tipo particular de cáncer. Los genes coexpresados son biomarcadores útiles. Los genes co-expresados se pueden sustituir por los genes con los que cuales se coexpresan. Los métodos pueden incluir identificar el grupo selecto de genes de los datos de microarreglo, normalizar los datos de microarreglo, calcular una matriz de correlación Spearman en pares para las sondas de arreglo, filtrar las sondas co-expresadas significativas a través de diferentes estudios, construir una gráfica, mapear la sonda a los genes, y generar un reporte de grupos selectos de genes. Un método ejemplar para identificar los genes co-expresados se describe en el Ejemplo 3 a continuación, y los genes co-expresados identificados utilizando este método se proporcionan en las Tablas 8-11. Los niveles de expresión de uno o más genes de un grupo selecto de genes se pueden utilizar para calcular la probabilidad de que un paciente con cáncer de próstata experimentará un resultado clínico positivo, tal como una menor probabilidad reducida de una recurrencia de cáncer.
Cualquiera de una o más combinaciones de grupos de genes se puede someter a ensayo en el método de la presente invención. Por ejemplo, un grupo de genes de respuesta estromal se puede someter a ensayo, solo o en combinación, con un grupo de genes de organización celular, un grupo gen de proliferación, y/o un grupo de genes de andrógeno. Además, cualquier variedad de genes dentro de cada grupo de genes se puede someter a ensayo.
En una modalidad específica de la invención, un método para predecir un resultado clínico para un paciente con cáncer de próstata comprende medir un nivel de expresión de por lo menos un gen de un grupo de genes de respuesta estromal, o un gen co-expresado del mismo, y por lo menos un gen de un grupo de genes de organización celular, o un gen co-expresado del mismo. En otra modalidad, el nivel de expresión de por lo menos dos genes de un grupo de genes de respuesta estromal, o un gen co-expresado del mismo, y por lo menos dos genes de un grupo de genes de organización celular, o un gen co-expresado del mismo, se miden. En todavía otra modalidad, los niveles de expresión de por lo menos tres genes se miden de cada uno del grupo de genes de respuesta estromal y el grupo de genes de organización celular. En una modalidad adicional, los niveles de expresión de por lo menos cuatro genes se miden de cada uno del grupo de genes de respuesta estromal y el grupo de genes de organización celular. En otra modalidad, los niveles de expresión de por lo menos cinco genes se miden de cada uno de los grupos de genes de respuesta estromal y el grupo de genes de organización celular. En todavía una modalidad adicional, los niveles de expresión de por lo menos seis genes se miden de cada uno del grupo de genes de respuesta estromal y el grupo de genes de organización celular.
En otra modalidad específica, el nivel de expresión de por lo menos un gen del grupo de genes de respuesta estromal, o un gen co-expresado del mismo, se puede medir, además del nivel de expresión de por lo menos un gen de un grupo de genes de andrógeno, o un gen co-expresado del mismo. En una modalidad particular, los niveles de expresión de por lo menos tres genes, o genes co-expresados de los mismos, del grupo de genes de respuesta estromal, y el nivel de expresión de por lo menos un gen, o gen co-expresado del mismo, del grupo de genes de andrógeno se pueden medir.
En una modalidad adicional, el nivel de expresión de por lo menos un gen de cada uno del grupo de genes de respuesta estromal, el grupo de genes de andrógeno, y el grupo de genes de organización celular, o genes co-expresados de los mismos, se pueden medir. En una modalidad particular, el nivel de por lo menos tres genes del grupo de genes de respuesta estromal, por lo menos un gen del grupo de genes de andrógeno, y por lo menos tres genes del grupo de genes de organización celular se pueden medir. En otra modalidad, el nivel de expresión de por lo menos un gen cada uno del grupo de genes de respuesta estromal, el grupo de genes de andrógeno, y el grupo genes de proliferación, o los genes co-expresados de los mismos, se pueden medir. En una modalidad particular, el nivel de por lo menos tres genes del grupo de genes de respuesta estromal, por lo menos un gen del grupo de genes de andrógeno, y por lo menos un gen del grupo de genes de proliferación se puede medir. En cualquiera de estas combinaciones, por lo menos dos genes del grupo de genes de andrógeno también se pueden medir. En cualquiera de las combinaciones, por lo menos cuatro genes del grupo de genes de andrógeno también se pueden medir.
En otra modalidad, el nivel de expresión de por lo menos un gen de cada uno del grupo de genes de respuesta estromal, el grupo de genes de andrógeno, el grupo de genes de organización celular, y el grupo de genes de proliferación, o genes co-expresados de los mismos, se pueden medir. En una modalidad particular, el nivel de por lo menos tres genes del grupo de genes de respuesta estromal, por lo menos tres genes del grupo de genes de organización celular, por lo menos un gen del grupo de genes de proliferación, y por lo menos dos genes del grupo de genes de androgenos se pueden medir. En cualquiera de las modalidades, por lo menos cuatro genes del grupo de genes de androgenos se pueden medir.
Adicionalmente , los niveles de expresión de uno o más genes que no se encuentran dentro de los subconjuntos de genes descritos en la presente se pueden medir con cualquiera de las combinaciones de los subconjuntos de genes descritos en la presente. Alternativamente, cualquier gen que se encuentre dentro de un subconjunto de genes se puede analizar separadamente del subconjunto de genes, o en otro subconjunto de genes. Por ejemplo, los niveles de expresión de por lo menos uno, por lo menos dos, por lo menos tres, o por lo menos 4 genes se pueden medir, además de los subconjuntos de genes descritos en la presente. En una modalidad de la invención, el (los) gen(es) adicional se selecciona de STAT5B, NFAT5, AZGP1, A PEP, IGFBP2, SLC22A3, ERG, AR, SRD5A2 , GSTM1, y GSTM2.
En una modalidad específica, el método de la invención comprende medir los niveles de expresión de las combinaciones específicas de genes y subconjuntos de genes mostrados en la Tabla 4. En una modalidad adicional, un (unos) registro (s) de grupo de genes y el (los) registro (s) cuantitativo (s) se calcula (n) de acuerdo con el algoritmo (s) mostrado (s) en la Tabla 4.
Varios procedimientos tecnológicos para la determinación de los niveles de expresión de los genes descritos se exponen en esta especificación, incluyendo, sin limitación, RT-PCR, microarreglos , secuenciación de alto rendimiento, análisis en serie de la expresión génica (SAGE, por sus siglas en inglés) y Expresión Génica Digital (DGE, por sus siglas en inglés) , que se plantearán en detalle posteriormente. En aspectos particulares, el nivel de expresión de cada gen se puede determinar en relación con varias características de los productos de expresión de los exones que incluyen genes, intrones, epítopos de proteína y actividad de proteína.
El producto de expresión que se somete a ensayo puede ser, por ejemplo, ARN o un polipéptido. El producto de expresión se puede fragmentar. Por ejemplo, el ensayo puede usar cebadores que son complementarios a las secuencias objetivo de un producto de expresión y de esta manera podrían medir los transcritos totales así como aquellos productos de expresión fragmentados que contienen la secuencia objetivo. La información adicional se proporciona en la Tabla A.
El producto de expresión de ARN se puede someter a ensayo directamente o por detección de un producto de ADNc que resulta de un método de amplificación basado en PCR, por ejemplo, reacción en cadena de la polimerasa de transcripción inversa cuantitativa (1RT-PCR) . (Ver por ejemplo, Patente de EUA No. 7,587,279). El producto de expresión del polipéptido se puede someter a ensayo utilizando inmunohistoquímica (IHC) mediante técnicas proteómicas. Además, tanto los productos de expresión de ARN como de polipéptido también se pueden someter a ensayo utilizando microarreglos .
Métodos para Someter a Ensayo los Niveles de Expresión de un Producto de Gen Los métodos del perfilado de expresión de genes incluyen métodos basados en el análisis de hibridación de los polinucleótidos, métodos basados en la secuenciación de los polinucleótidos, y métodos basados proteómicos . Los métodos ejemplares conocidos en la técnica para la cuantificación de la expresión del ARN en una muestra incluyen tinción de Northern e hibridación in situ (Parker & Barnes, Methods in Molecular Biology 106:247-283 (1999)); ensayos de protección de ARNasa (Hod, Biotechniques 13:852-854 (1992)); y los métodos basados en PCR, tal como la PCR de transcripción inversa (RT-PCR) (Weis Y Colaboradores, Trends in Genetics 8:263-264 (1992)). Se pueden emplear anticuerpos que pueden reconocer los duplexos específicos de secuencia, incluyendo duplexos de ADN, duplexos de ARN, y duplexos híbridos de ADN-ARN o duplexos de proteína de ADN. Los métodos representativos para el análisis de expresión génica basado en secuenciación incluyen el Análisis en Serie de la Expresión Génica (SAGE) , y análisis de expresión génica por la secuenciación de firma masivamente paralela (MPSS) . Se pueden utilizar otros métodos conocidos en la técnica.
PCR de Transcripción Inversa (RT-PCR) Típicamente, el ARNm se aisla de una muestra de prueba. El material de partida es ARN típicamente total aislado de un tumor humano, usualmente en un tumor primario. Opcionalmente , los tejidos normales del mismo paciente se pueden utilizar como un control interno. Tal tejido normal que se presenta histológicamente adyacente a un tumor. El ARNm se puede extraer de una muestra de tejido, por ejemplo, de una muestra que es reciente, congelada (Por ejemplo congelada reciente) , o incrustada y fija en parafina (por ejemplo fija en formalina) .
Los métodos generales para la extracción del ARNm son bien conocidos en el campo y se describen en los libros de texto estándares de biología molecular, incluyendo Ausubel y colaboradores, Current Protocols of Molecular Biology, John Wiley and Sons (1997) . Métodos para la extracción de ARN de tejidos incrustados en parafina son descritos, por ejemplo, en Rupp y Locker, Lab Invest . 56: A67 (1987), y De Andrés y colaboradores, BioTechniques 18:42044 (1995). En particular, el aislamiento del ARN se puede llevar a cabo utilizando un kit de purificación, un conjunto de soluciones amortiguadoras y proteasa de fabricantes comerciales, tal como Qiagen, de acuerdo con las instrucciones del fabricante. Por ejemplo, el ARN total de las células en el cultivo se puede aislar utilizando las mini-columnas Qiagen RNeasy. Otros kits de aislamiento de ARN comercialmente disponibles incluyen el equipo de purificación de ADN y ARN completo MasterPureMR (EPICENTRE®, Madison, WI) , y el aislamiento de ARN de Bloque de Parafina (Ambion, Inc.). El ARN total de las muestras de tejido total se puede aislar utilizando el RNA Stat-60 (Tel- Test) . El ARN preparado de tumor se puede aislar, por ejemplo, por centrifugación en gradiente de densidad de cloruro de cesio.
La muestra que contiene el ARN luego se somete a transcripción inversa para producir el ADNc de la plantilla de ARN, seguido por la amplificación exponencial en una reacción PCR. Las dos transcriptasas inversas más comúnmente utilizadas son la transcriptasa inversa de virus de mieloblastosis avilo (AMV-RT) y la transcriptasa inversa de virus de leucemia de murino Moloney (MMLV-RT) . La etapa de transcripción inversa se ceba prepara típicamente utilizando cebadores específicos, hexámeros aleatorios o cebadores oligo-dT, dependiendo de las circunstancias y el objetivo del perfilado de expresión. Por ejemplo, el ARN extraído se puede transcribir de manera cruzada utilizando un equipo de ARN PCR GeneAmp (Perkin Elmer, CA, EUA) , siguiendo las instrucciones del fabricante. El ADNc derivado luego se puede utilizar como una plantilla en la reacción PCR subsecuente.
Los métodos basados en PCR usan una ADN-polimerasa dependiente de ADN termoestable , tal como una Taq ADN polimerasa. Por ejemplo, la TaqMan® PCR utiliza típicamente la actividad de 5'-nucleasa de Taq o Tth polimerasa para hidrolizar una sonda de hibridación ligada a su amplicón objetivo, pero cualquier enzima con actividad de nucleasa 5' equivalente se puede utilizar. Dos cebadores de oligonucleótidos se utilizan para generar un amplicón típico para un producto de reacción de PCR. Un tercer oligonucleótido, o sonda, se pueden distinguir para facilitar la detección de una secuencia de nucleótidos del amplicón situado entre los sitios de hibridación en los dos cebadores de PCR. La sonda se puede etiquetar detectablemente , por ejemplo, con un tinte reportero, y se puede proporcionar adicionalmente con tanto un tinte fluorescente como un tinte fluorescente de enfriamiento rápido, como en una configuración de sonda TaqMan® . Donde se utiliza una sonda TaqMan®, durante la reacción de amplificación, la enzima Taq ADN polimerasa escinde la sonda en una manera dependiente de plantilla. Los fragmentos de sonda resultantes se disocian en solución, y la señal del tinte reportero liberado está libre del efecto de enfriamiento rápido del segundo fluoroforo. Una molécula del tinte reportero se libera por cada nueva molécula sintetizada, y la detección del tinte reportero no enfriado rápidamente proporciona la base para la interpretación cuantitativa de los datos.
La RT-PCR TaqMan® se puede llevar a cabo utilizando el equipo comercialmente disponible, tal como, por ejemplo, plataformas de alto rendimiento, tales como ABI PRISM 7700 Sequence Detection System® (Perkin-Elmer-Applied Biosystems, Foster City, CA, EUA) , o Ciclador ligero (Roche Molecular biochemicals , Mannheim, Alemania) . En una modalidad preferida, el procedimiento se ejecuta en un sistema de PCT en tiempo real LightCycler® 480 (Roche Diagnostics) , que es una plataforma cicladora basada en placas de microtítulo.
Los datos del ensayo de 5' -nucleasa se expresan comúnmente de manera inicial como un ciclo de umbral ( "Ct" ) · Los valores de fluorescencia se registran durante cada ciclo y representan la cantidad del producto amplificado a ese punto en la reacción de amplificación. El ciclo umbral (Ct) se describe generalmente como el punto cuando la señal fluorescente primero se registra como estadísticamente significat va. Alternativamente, los datos se pueden expresar como un punto de cruce ("Cp") . El valor de Cp se calcula al determinar los segundos derivados de las curvas de amplificación qPCR completas y su valor máximo. El valor Cp representa el ciclo en el cual el incremento de la fluorescencia es más alto y donde la fase logarítmica de una PCR comienza.
Para minimizar los errores y el efecto de la variación de muestra a muestra, la RT-PCR se lleva a cabo usualmente utilizando un estándar interno. El gen estándar interno ideal (también referido como gen de referencia) se expresa en un nivel muy constante entre el tejido canceroso y no canceroso del mismo origen (es decir, un nivel que no es significativamente diferente entre los tejidos normales y cancerosos) , y no se ve afecta significativamente por el tratamiento experimental (es decir, no muestra una diferencia significativa en el nivel de expresión en el tejido relevante, como resultado de la exposición a la quimioterapia) , y se expresa en un nivel muy constante entre el mismo tejido tomado de diferentes pacientes. Por ejemplo, los genes de referencia útiles en los métodos descritos en la presente no deben mostrar niveles de expresión significativamente diferentes en la próstata cancerosa como es comparado con el tej ido de próstata normal . Los genes de referencia ejemplares utilizados para la normalización comprenden uno o más de los siguientes genes: AAMP, ARF1, ATP5E, CLTC, GPS1, y PGK1. Las mediciones de la expresión génica se pueden normalizar relativas al medio de uno o más genes de referencia (por ejemplo, 2, 3, 4, 5, o más) . Las mediciones de expresión normalizadas por referencia pueden variar de 2 a 15, donde un incremento unitario refleja generalmente un incremento de 2 veces en la cantidad de ARN.
La PCR en tiempo real es compatible tanto con la PCR competitiva cuantitativa, donde un competidor interno para cada secuencia objetivo se utiliza para normalización, y con la PCR comparativa cuantitativa que utiliza un gen de normalización contenido dentro de la muestra, o un gen de mantenimiento para RT-PCR. Para detalles adicionales, ver, por ejemplo Held y colaboradores, Genoma Research 6:986-994 (1996) .
Las etapas de un protocolo representativo para el uso en los métodos de la presente descripción usan tejidos incrustados en parafina, fijos como la fuente de ARN. Por ejemplo, el aislamiento del ARNm, purificación, extensión de cebador y amplificación se pueden llevar a cabo de acuerdo con métodos disponibles en la técnica. (Ver, por ejemplo, Godfrey y colaboradores, J. Molec. Diagnostics 2:84-91 (2000) ; Specht y colaboradores, Am. J. Pathol 158:419-29 (2001) ) . Brevemente, un proceso representativo comienza con el corte de aproximadamente secciones de 10 µt? de grueso de muestras de tejido tumoral incrustadas en parafina. El ARN luego se extrae, y la proteína y el ADN agotado de la muestra que contiene ARN. Después del análisis de la concentración de ARN, el ARN se transcribe de manera inversa utilizando los cebadores específicos de genes seguido por la RT-PCR para proporcionar productos de amplificación de ADNc.
Diseño de Cebadores y Sondas de PCR Basadas en Intrón Los cebadores y sondas de PCR se pueden diseñar basados en la secuencia de exones o intrones presentes en el transcrito de ARNm del gen de interés. El diseño de cebador/ sonda se puede llevar a cabo utilizando software públicamente disponible, tal como el software ADN BLAT desarrollado por Kent, W.J., Genome Res. 12(4) :656-64 (2002), o por el software BLAST incluyendo sus variaciones.
Donde sea necesario o se desee, las secuencias repetitivas de la secuencia objetivo se pueden enmascarar para mitigar las señales no específicas. Las herramientas ejemplares para lograr esto incluyen el programa Repeat Masker disponible en línea a través del Baylor College of Medicine, que clasifica secuencias de ADN contra una biblioteca de elementos repetitivos y regresa a una secuencia de petición en la cual los elementos repetitivos se enmascaran. Las secuencias de intrones enmascaradas luego se pueden utilizar para diseñar las secuencias cebadores y sondas que utilizan para cualquiera de los paquetes de diseño de cebador/sonda públicamente disponibles, tal como Primer Express (Applied Biosystems) ; MGB assay-by-design (Applied Biosystems) ; Primer3 (Steve Rozen y Helen J. Skaletsky (2000) Primer3 on the WWW por general users and for biologist programmers . Ver S. Rrawetz, S. Misener, Bioinformatíes Methods y Protocols: Methodos in Molecular Biology, páginas 365-386 (Humana Prensa) .
Otros factores que pueden incluir en un diseño del cebador de PCR incluyen la longitud del cebador, la temperatura de fusión (Tm) , y contenido G/C, especificidad, secuencias de cebadores complementarias, y secuencia de extremo 3'. En general, los cebadores de PCR óptimos son generalmente 17-30 bases en longitud, y contienen aproximadamente 20-80%, tal como, por ejemplo, aproximadamente 50-60% de bases G+C, y muestran Tm's entre 50 y 80 °C, por ejemplo de aproximadamente 50 a 70 °C.
Para las directrices adicionales para el cebador de PCR y el diseño de la sonda ver, por ejemplo Dieffenbach, C . y colaboradores, "General Concepts for PCR Primer Design" in: PCR Primer, A Laboratory Manual, Cold Spring Harbor Laboratory Press,. Nueva York, 1995, pp. 133-155; Innis and Gelfand, "Optimization of PCRs" in: PCR Protocols, A Guide to Methods and Applications, CRC Press, Londres, 1994, pp. 5-11; and Plasterer, T.N. Primerselect : Primer and probé design. Methods Mol. Biol . 70:520-527 (1997), las descripciones completas de las cuales se incorporan expresamente en la presente a manera de referencia.
La Tabla A proporciona información adicional con respecto a las secuencias de cebadores, sondas y amplicones asociadas con los ejemplos descritos en la presente.
Sistema MassARRAY* En los métodos basados en MassARRAY, tal como el método ejemplar desarrollado por Sequenom, Inc. (San Diego, CA) después del aislamiento del ARN y la transcripción inversa, el ADNc obtenido se enriquece con una molécula de ADN sintética (competidor) , que coincide la región de ADNc objetivo en todas las posiciones, excepto en una base individual, y sirve como un estándar interno. La mezcla de ADNc/competidor se amplifica por PCR y se somete a un tratamiento de enzimas de fosfatasa alcalina de camarón (SAP) pos-PCR, lo cual da por resultado la fosforilación de los nucleótidos restantes. Después de la inactivación de la fosfatasa alcalina, los productos de PCR del competidor y ADNc se someten a la extensión del cebador, lo cual genera señales de masa distintas para los productos de PCR derivados de competidor y ADNc. Después de la purificación estos productos se dispensan en un arreglo de chip, que se precarga en componentes necesarios para el análisis con el análisis de espectrometría de masas de tiempo de vuelo de ionización de desorción láser asistido por matriz (MALDI-TOF MS) . El ADNc presente en la reacción luego se cuantifica al analizara las relaciones en las áreas pico en el espectro de masa generado. Para detalles adicionales ver, por ejemplo, Ding and Cantor, Proc. Nati. Acad. Sci . USA 100:3059-3064 (2003).
Otros Métodos Basados en PCR Las técnicas basadas adicionales que pueden encontrar uso en los métodos descritos en la presente incluyen, por ejemplo, terminología BeadArray"1* (Illumina, San Diego, CA; Oliphant y colaboradores, Discovery of arkers for Disease (Supplement to Biotechniques) , June 2002; Ferguson y colaboradores, Analytical Chemistry 72:5618 (2000)); BeadsArray for Detection of Gene ExpressionMR (BADGE) , que utiliza el sistema LuminexlOO LabMAPMR comercialmente disponible y microesferas codificadas con múltiples colores (Luminex Corp., Austin, TX) en un ensayo rápido para la expresión génica (Yang y colaboradores, Genome Res. 11:1888-1898 (2001) ) ; y el análisis de perfil de expresión de cobertura alta (Fukumura y colaboradores, Nucí. Acids. Res. 31 (16) e94 (2003) .
Microarreglo Los niveles de expresión de un gen o microarreglo de interés también se pueden evaluar utilizando la técnica de microarreglo. En este método, las secuencias de polinucleótidos de interés (incluyendo ADNcs y oligonucleótidos) se arreglan por un substrato. Las secuencias arregladas luego se ponen en contacto bajo condiciones adecuadas para hibridación específica con el ADNc detectablemente etiquetado generado de ARN de una muestra de prueba. Como en el método RT-PCR, la fuente de ARN es típicamente ARN total aislado de una muestra de tumor, y opcionalmente de tejido normal del mismo paciente como un control interno o línea de células. El ARN se puede extraer, por ejemplo, de muestras de tejido congeladas o incrustadas y fijas en parafina archivadas (por ejemplo fijadas en formalina) .
Por ejemplo, los insertos amplificados por PCR de los clones de ADNc de un gen que se somete a ensayo se amplían en un sustrato en un arreglo denso. Usualmente, por lo menos 10,000 secuencias de nucleótidos se aplican al substrato. Por ejemplo, los genes microarreglados, movilizados sobre el microchip en 10,000 elementos cada uno, son adecuados para hibridación bajo condiciones de severidad. Las sondas de ADNc fluorescentemente etiquetadas se pueden generar a través de la incorporación de nucleótidos fluorescentes por transcripción inversa del ARN extraído de tejidos de interés. Las sondas de ADNc etiquetadas aplicadas al chip se hibridan con especificidad a cada puno de ADN en el arreglo. Después del lavado bajo condiciones de severidad para remover las sondas no específicamente ligadas, el chip se escanea con microscopía de láser confocal o por otro método de detección, tal como una cámara CCD. La cuantificación de la hibridación de cada elemento arreglado permite la evaluación de la abundancia de ARN correspondiente.
Con fluorescencia de color doble, las sondas de ADNc separadamente etiquetadas generadas de dos fuentes de ARN se hibridan en pares al arreglo. La abundancia relativa de los transcritos de las dos fuentes que corresponden a cada gen especificado se determina de esta manera simultáneamente. La escala miniaturizada de la hibridación permite una evaluación conveniente y rápida del patrón de expresión para grandes números de genes. Tales métodos han mostrado que tienen la sensibilidad requerida para detectar los transcritos raros, que se expresan en algunas copias por célula, y para detectar de manera reproducible por lo menos aproximadamente diferencias de dos veces en los niveles de expresión (Schena et at, Proc. Nati . Acad. ScL USA 93 (2) : 106-149 (1996)). El análisis de microarreglo se puede llevar a cabo por equipo comercialmente disponible, siguiendo los protocolos del fabricante, tal como al utilizar la tecnología Affymetrix GenChipMR, o tecnología de microarreglo de Incyte .
Análisis en Serie de la Expresión Génica (SAGE) El análisis en serie de la expresión génica (SAGE) es un método que permite el análisis simultáneo cuantitativo de un gran número de transcritos de gen, sin la necesidad de proporcionar una sonda de hibridación individual para cada transcrito. Primero, se genera una etiqueta de secuencia corta (aproximadamente 10-14 pb) que contiene suficiente información para identificar de manera única un transcrito, con la condición que la etiqueta se obtenga de una posición única dentro de cada transcrito. Después, muchos transcritos se ligan conjuntamente para formar moléculas en serie largas, que se pueden secuenciar, revelando la identidad de las múltiples etiquetas simultáneamente. El patrón de expresión de cualquier población del transcrito se puede evaluar cuantitativamente al determinar la abundancia de las etiquetas individuales, y al identificar el gen que corresponde a cada etiqueta. Para más detalle ver, por ejemplo, Velculescu y colaboradores, Science 270:484-487 (1995); y Velculescu y colaboradores, Cell 88:243-51 (1997). Análisis de la Expresión Génica por la Secuenciación de Ácido Nucleico Las tecnologías de secuenciación de ácidos nucleicos son métodos adecuados para el análisis de la expresión génica. El principio que subyace a estos métodos es que el número de veces en que se detecta una secuencia de ADNc en una muestra se relaciona directamente a la expresión relativa del ARN que corresponde a esa secuencia. Estos métodos algunas veces son referidos por el término Expresión Génica Digital (DGE) para reflejar la propiedad numérica discreta de los datos resultantes. Los métodos tempranos que aplican este principio fueron el análisis en Serie de la Expresión Génica (SAGE) y la secuenciación de firma nocivamente paralela (MPSS) . Ver, por ejemplo, S. Brenner, y colaboradores, Nature Biotechnology 18 (6) .- 630-634 (2000). Más recientemente, el advenimiento de las tecnologías de secuenciación "de próxima generación" ha hecho el DGE, más simple, de rendimiento más alto, y más asequible. Como resultado, más laboratorios son capaces de utilizar la DGE para clasificar la expresión de más genes en más muestras de pacientes individuales que previamente posibles. Ver, por ejemplo, J. Marioni, Genome Research 18 ( 9) : 1509-1517 (2008); R . Morin, Genome Research 18 (4) : 610-621 (2008); A. Mortazavi, Nature Methods 5(7): 621-628 (2008); N. Cloonan, Nature Methods 5(7):613-619 (2008).
Aislamiento de ARN de Fluidos Corporales Se han descrito métodos para aislar el ARN para el análisis de expresión de sangre, plasma y suero (ver, por ejemplo, K. Enders, y colaboradores, Clin Chem 48,1647-53 (2002) (y las referencias citadas en la presente) y de orina (véase, por ejemplo, R. Boom, y colaboradores, J Clin Microbiol. 28, 495-503 (1990) y referencias citadas en la presente) .
Inmunohistoquímica Los métodos de inmunohistoquímica también son adecuados para detectar los niveles de expresión de los genes y se aplican al método descrito en la presente. Los anticuerpos (por ejemplo, anticuerpos monoclonales) que ligan específicamente un producto de gen de un gen de interés se pueden utilizar en tales métodos. Los anticuerpos se pueden detectar por etiquetado directo de los anticuerpos mismos, por ejemplo, con etiquetas radioactivas, etiquetas fluorescentes, etiquetas de afteno tales como, biotina, o enzima tal como peroxidasa de rábano picante o fosfatasa alcalina. Alternativamente, el anticuerpo primario no etiquetado se puede utilizar en conjunción con un anticuerpo secundario etiquetado específico para el anticuerpo primario. Los protocolos y kits de inmunohistoquímica son bien conocidos en el campo y son comercialmente disponibles.
Proteómica El término "proteoma" se define como la totalidad de las proteínas presentes en una muestra (por ejemplo tejido, organismo, o tejido celular) en un cierto punto de tiempo. La proteómica incluye, entre otras cosas, el estudio de los cambios globales de la expresión de la proteína en una muestra (también referida como "proteómica de expresión") . La proteómica incluye las siguientes etapas: (1) separación de las proteínas individuales en una muestra por el electroforesis en gel 2-D (2-D PAGE) ; (2) identificación de las proteínas individuales recuperadas del gel, por ejemplo por espectrometría de masas o secuenciación N-terminal, y (3) análisis de los datos que utilizan bioinformát ica .
Descripción General del Aislamiento, Purificación y Ampl ficación de la ARNm Las etapas de un protocolo representativo para perfilar la expresión génica utilizando tejidos incrustados en parafina, fijos, como la fuente de ARN, incluyendo aislamiento de ARN, purificación, extensión de cebadores y amplificación se proporcionan en varios artículos de revista publicados. (Ver, por ejemplo, T.E. Godfrey, y colaboradores, J. olec. Diagnostics 2: 84-91 (2000) ; K. Specht y colaboradores, Am. J. Pathol . 158: 419-29 (2001) , M. Cronin, y colaboradores, Am J Pathol 164:35-42 (2004)) . Brevemente, un proceso representativo comienza con el corte de una sección de muestra de tejido (por ejemplo de aproximadamente sección de 10 µta. de grueso de una muestra de tejido tumoral incrustada en parafina) . El ARN luego se extrae, y la proteína y el ADN se remueven. Después del análisis de la concentración de ARN, la reparación del AR se lleva a cabo si se desea. La muestra luego se somete a análisis, por ejemplo por transcripción inversa utilizando promotores específicos de gen seguido por RT-PCR.
Análisis Estadístico de los Niveles de Expresión en la Identificación de Genes Una persona experta en el campo reconocerá que existen muchos métodos estadísticos que se pueden utilizar para determinar si existe una relación significativa entre un resultado clínico de interés (por ejemplo, recurrencia) y niveles de expresión de un gen marcador como se describe en la presente. En una modalidad ejemplar, la presente invención incluye tres estudios. El primer estudio es un diseño de muestreo de cohorte estratificado (una forma de muestreo de caso-control) que utiliza tejidos y datos de pacientes con cáncer de próstata. La selección de muestras se estratificó por etapa T clínica (TI, T2) , año de cirugía (<1993, =1993) , y registro de Gleason de prostactectomía (baj o/intermedio, alto) . Se seleccionaron todos los pacientes con recurrencia clínica y se seleccionó una muestra aleatoria certificada de pacientes quienes no experimentaron una recurrencia clínica. Para cada paciente, hasta dos muestras de tumor enriquecidas y una muestra de tejido que parece normal se sometieron a ensayo. El segundo estudio utilizó un subconjunto de 70 pacientes del primer estudio de quienes se sometió a ensayo el tejido de tumor de biopsia de próstata coincidente. El tercer estudio incluyó todos los pacientes (170 pacientes evaluables) quienes habían tenido cirugía para su cáncer de próstata entre 1999 y 2010 en la Cleveland Clinic (CC) y tuvieron riesgo bajo o intermedio (por AUA) de cáncer de próstata clínicamente localizado quienes podrían haber sido candidato razonables para vigilancia activa pero quienes se sometieron a RP en CC dentro de 6 meses de la diagnosis de cáncer de próstata por biopsia. La biopsia de tejido tumoral de estos pacientes se sometió a ensayo.
Todas las pruebas de hipótesis se reportaron utilizando los valores p de dos lados. Para investigar si hay una relación significativa de resultados (por ejemplo, intervalos sin recurrencia clínica (cRFI) , intervalo sin recurrencia bioquímica (bRFI) , supervivencia especifica de cáncer de próstata (PCSS) , supervivencia general (OS) ) con genes individuales, y covariables demográficas o clínicas) , modelos de peligros proporcionales Cox (PH) que utilizan estimadores de pseudo-probabilidad parcial ponderados máximos se utilizaron y se reportan los valores p de las pruebas de Wald de la hipótesis nula de que la relación de peligro (HR) es uno. Para investigar si hay una relación significativa entre los genes individuales y el patrón de Gleason de una muestra particular, se utilizan modelos de regresión logística ordinales utilizando los métodos de pseudoprobabilidad ponderados máximos y se reportan los valores p de las pruebas de Wald de la hipótesis nula de que la relación de posibilidades (O ) es uno. Para investigar si existe una relación significativa entre genes individuales y el aumento y/o reclasificación o patología adversa en RP, se utilizaron modelos de regresión logística que utilizan métodos de pseudoprobabilidad ponderados máximos y se reportan valores p de las pruebas de Wald de la hipótesis nula que la relación de posibilidades (OR) es uno.
Análisis de Coexpresión En una modalidad ejemplar, la correlación de unión de los niveles de expresión génica entre las muestras de cáncer próstata bajo el estudio se pueden evaluar. Para este propósito, las estructuras de correlación entre los genes y las muestras se pueden examinar a través de métodos de agrupamiento jerárquicos. Esta información se puede utilizar para confirmar que los genes que son conocidos por ser correlacionados sumamente en las muestras de cáncer de próstata se agrupan conjuntamente como lo esperado. Solamente los genes que muestran una relación nominalmente significativa (no ajustada p < 0.05) con cRFI en el análisis de regresión de Cox PH no variado se incluyen en estos análisis .
Una persona experta en el campo reconocerá que muchos métodos de análisis de co-expresión ahora conocidos o desarrollados posteriormente estarán dentro del alcance y espíritu de la presente invención. Estos métodos pueden incorporar, por ejemplo, coeficientes de correlación, análisis de red de coexpresión, análisis de grupos selectos, etc., y se pueden basar en los datos de expresión de RT-PCR, microarreglos , secuenciación, y otras tecnologías similares. Por ejemplo, los agrupamientos de expresión génica se pueden identificar utilizando análisis en pares de la correlación basada en los coeficientes de correlación de Pearson o Spearman. (Ver, por ejemplo, Pearson K. and Lee A., Biometrika 2, 357 (1902) ; C. Spearman, Amer. J. Psychol 15:72-101 (1904); J. Myers, A. Well, Research Design and Statistical Analysis, p. 508 (2nd Ed. , 2003)). Un método ejemplar para identificar los genes co-expresados se describen en el Ejemplo 3 posteriormente.
Normalización de los Niveles de Expresión Los datos de expresión utilizados en los métodos descritos en la presente se pueden normalizar. La normalización se refiere a un proceso para corregir (normalizar) , por ejemplo, las diferencias en la cantidad de ARN sometido a ensayo y la variabilidad en la calidad del AR utilizado, para remover las fuentes no deseadas de variación enzimática en las mediciones Ct o Cp, y similares. Con respecto a los experimentos de RT-PCR que implican muestras de tejido incrustadas en parafina fijas archivadas, las fuentes de variación sistemáticas son conocidas por incluir el grado de degradación de ARN relativo a la edad de la muestra de paciente y el tipo de fijador utilizado para almacenar la muestra. Otras fuentes de variación sistemática son atribuibles a las condiciones de procesamiento de laboratorio .
Los ensayos pueden proporcionar la normalización al incorporar la expresión de ciertos genes de normalización, que no difieren significativamente en los niveles de expresión bajo las condiciones relevantes. Los genes de normalización ejemplares descritos en la presente incluyen genes de mantenimiento. (Ver, por ejemplo, E. Eisenberg, y colaboradores, Trends in Genetics 19 (7) : 362-365 (2003)). La normalización se puede basar en la señal media o mediana (Ct o Cp) de todos los genes sometidos a ensayo o un subconjunto grande del mismo (procedimiento de normalización global) . En general, los genes de normalización, también referidos como genes de referencia, son típicamente genes que son conocidos por no mostrar la expresión significativamente diferente en el cáncer de próstata como es comparado con el tejido de próstata no canceroso, y se rastrea con varias condiciones de muestra y proceso, proporcionan de esta manera la normalización de efectos extraños.
En las modalidades ejemplares, uno o más de los siguientes genes se utilizan como referencias por lo cual los datos de expresión en ARNm se normalizan: AA P, ARF1, ATP5E, CLTC, GPS1, y PGK1. Las mediciones de CT o Cp promedio ponderadas calibradas para cada uno de los genes de pronóstico y predictivos se pueden normalizar relativos con la media de cinco o más a genes de referencia.
Aquellas personas expertas en el campo reconocerán que la normalización se puede lograr en numerosas formas, y las técnicas descritas en lo anterior se proponen solamente para ser ejemplares, no exhaustivas.
Estandarización de los Niveles de Expresión Los datos de expresión utilizados en los métodos descritos en la presente se pueden estandarizar. La estandarización se refiere a un proceso para poner de manera efectiva todos los genes en una escala comparable. Esto se lleva a cabo debido a que algunos genes mostrarán más variación un intervalo más amplio de expresión (un intervalo más amplio de expresión) que otros. La estandarización se lleva a cabo al dividir cada valor de expresión por su desviación estándar a través de todas las muestras para este gen. Las relaciones de peligro luego se interpretan como el cambio proporcional en el peligro para el punto final clínico (recurrencia clínica, recurrencia biológica, muere debido al cáncer de próstata, o muerte debido a cualquier causa) por un incremento de desviación estándar 1 en la expresión.
Kits de la Invención Los materiales para el uso en los métodos de la presente invención son adecuados para la preparación de kits producidos de acuerdo con los procedimientos bien conocidos. La presente descripción proporciona de esta manera kits que comprenden que comprenden agentes, que pueden incluir sondas y/o cebadores específicos de gen o selectivos de gen, para cuantificar la expresión de los genes descritos para predecir el resultado o respuesta de pronóstico al tratamiento. Tales kits pueden contener opcionalmente reactivos para la extracción del ARN de muestras de tumor, en particular muestras de tejido incrustadas en parafina fijas, y/o reactivos para la amplificación de ARN. Además, los kits pueden comprender opcionalmente el reactivo (s) con una descripción o etiqueta o instrucciones de identificación con relación a su uso en los métodos de la presente invención. Los kits pueden comprender recipientes (incluyendo placas de microtitulación adecuadas para el uso en una implementación automatizada de los métodos) , cada uno con uno o más de los diversos materiales o reactivos (típicamente en forma concentrada) utilizadas en los métodos, incluyendo, por ejemplo, columnas cromatográficas , microarreglos prefabricados, soluciones amortiguadoras, los trifosfatos de nucleótidos apropiados (por ejemplo, dATP, dCTP, dGTP y dTTP; o rATP, rCTP, rGTP y UTP) , transcriptasa inversa, ADN polimerasa, AR polimerasa, y una o más sondas y cebadores de la presente invención (por ejemplo, cebadores poli(T) o aleatorios de longitud apropiadas ligados a un promotor reactivo con la ARN polimerasa) . Los algoritmos matemáticos utilizados para estimar o cuantificar la información de pronóstico predictiva también son apropiadamente componentes potenciales de kits.
Reportes Los métodos de esta invención, cuando se practican para propósitos de diagnóstico comerciales, producen generalmente un reporte o breve descripción de la información obtenida de los métodos descritos en la presente. Por ejemplo, un reporte puede incluir información con respecto a los niveles de expresión de uno o más genes, clasi icación del tumor o el riesgo de ocurrencia del paciente, probablemente clasificación de prognosis o riesgo del paciente, factores clínicos y patológicos, y/u otra información. Los métodos y reportes de esta invención pueden incluir adicionalmente almacenar el reporte en una base de datos . El método puede crear un registro en una base de datos para el sujeto y poblar el registro con datos. El reporte puede ser un reporte de papel, un reporte de auditoría, o un registro electrónico. El reporte se puede mostrar y/o almacenar en un dispositivo de computación (por ejemplo, dispositivo portátil, computadora de escritorio, dispositivo portátil, computadora de escritorio, dispositivo inteligente, sitio de la red, etc.) . Se contempla que el reporte se proporcione a un médico y/o al paciente. La recepción del reporte puede incluir además establecer una conexión de red a una computadora de servidor que incluye los datos y reporta y solicita los datos y los reporta desde la computadora servidor.
Programa de computadora Los valores de los ensayos descritos en lo anterior, tales como datos de expresión, se pueden calcular y almacenar manualmente. Alternativamente, las etapas descritas en lo anterior se pueden llevar a cabo completa o parcialmente por un producto de programa de computadora. La presente invención proporciona además un producto de programa de computadora que incluye un medio de almacenamiento legible por computadora que tiene un programa de computadora almacenado en él . El programa puede cuando se lee por una computadora, ejecutar cálculos relevantes basados en los valores obtenidos de los análisis de una o más muestras biológicas de un individuo (por ejemplo, niveles de expresión génica, normalización, estandarización, formación de umbrales, y conversión de los valores de los ensayos a un registro y/o a un texto o representación gráfica de la información de etapa del tumor y relacionadas) . El producto de programa de computadora tiene almacenado en el mismo un programa de computadora tiene almacenado en el mismo un programa de computadora para llevar a cabo el cálculo.
La presente descripción proporciona sistemas para ejecutar el programa descrito en lo anterior, el sistema que incluye generalmente: a) un entorno de computación central; b) un dispositivo de entrada, operativamente conectado al entorno de computación, para recibir datos del paciente, en donde los datos del paciente pueden incluir, por ejemplo, nivel de expresión u otro valor obtenido de un ensayo que utiliza una muestra biológica del paciente, o datos de microarreglo , como se describe con detalle en lo anterior; c) un dispositivo de salida, conectado al entorno de computación, para proporcionar información a un usuario (por ejemplo, personal médico) ; y d) un algoritmo ejecutado por el entorno de computación central (por ejemplo, un procesador) , donde el algoritmo se ejecuta basado en los datos recibidos por el dispositivo de entrada, y en donde el algoritmo calcula un registro de expresión, formación de umbral, otras funciones descritas en la presente. Los métodos proporcionados por la presente invención también se pueden automatizar en totalidad o en parte.
Habiendo descrito la invención, la misma será más fácilmente entendida mediante la referencia a los siguientes ejemplos, que se proporcionan a manera de ilustración, y no se proponen para limitar la invención de ninguna manera.
Ej emplos EJEMPLO 1: SELECCIÓN DE 81 GENES PARA EL DESARROLLO DEL ALGORITMO Un estudio de identificación de genes para identificar los genes asociados con la recurrencia clínica, recurrencia bioquímica y/o muerte de cáncer de próstata se describe en las Solicitudes Provisionales de E.U.A. Nos. 61/368,217, presentada el 27 de Julio de 2010; 61/414,310, presentada el 16 de Noviembre de 2010; y 61/485,536, presentadas el 12 de Mayo de 2011, y la Publicación de E.U.A. No. 20120028264, presentada el 25 de Julio de 2011, y publicada el 2 de Febrero de 2012 (todas de las cuales se incorpora en la presente a manera de referencia) . El análisis RT-PCR se utilizó para determinar los niveles de expresión de ARN para 732 genes y los genes de referencia en el tejido de cáncer de próstata y el tejido de apariencia normal circundante (NAT) en pacientes con cáncer de próstata de etapa temprana tratados con prostatectomía radical . Se determinaron los genes asociados significativamente (p<0.05) con intervalos sin recurrencia clínica (cRFI) , intervalos sin recurrencia bioquímica (bRFI) , supervivencia específica de cáncer de próstata (PCSS) , y aumento/reclasificación.
De los genes que se identificaron por ser asociados con el resultado, 81 genes se seleccionaron para el desarrollo de algoritmos subsecuentes. Los cebadores, sondas, y secuencias de amplicones de los 81 genes (y los 5 genes de referencia) se listan en la Tabla A. Los genes seleccionados fueron entre los más de pronóstico con respecto al cRFI y otras propiedades y se mostraron en las Tablas 1A-1B. Otras propiedades consideradas fueron: 1) Genes más potentes con respecto a la regresión a la relación de peligro estandarizada corregida media para la asociación de la expresión génica y cRFI en el tumor en el patrón de Gleason primario; 2) consistencia en la asociación (relación de peligro) con el cRFI que utiliza el tumor de patrón de Gleason más alto; 3) Asociado con la supervivencia específica de cáncer de próstata (PCSS) ; 4) Relación de peligro potente después del ajuste para The University of San Francisco Cáncer of the Prostate Risk Assessment (CAPRA) (Cooperberg y colaboradores, J. Urol . 173:1983-1942, 2005); 5) Relación de posibilidades estadísticamente significativas para la asociación entre la expresión génica y el patrón de Gleason quirúrgico del tumor; 6) Variabilidad total grande con mayor variabilidad entre pacientes que la variabilidad dentro del paciente preferible; y 7) Sumamente expresado.
El grado de tasa de descubrimiento real del método de asociación (TDRDA) (Crager, Stat Med. 2010 Jan 15;29 (1) :33-45. ) se utilizó en el análisis de la expresión génica y el cRFI los resultados se muestra en la Tabla 1A. La tasa de descubrimiento real es la contraparte a la tasa de descubrimiento falsa. Los modelos de regresión Cox PH no variados se adaptaron y el método TDRDA se utilizó para corregir las relaciones de peligro estandarizadas estimadas para la regresión a la media (RM) y evaluar las tasas de descubrimiento falsas para la identificación de los genes con una relación de peligro estandarizada absoluta de por lo menos un nivel especificado. Las tasas de descubrimiento falsas se controlaron a 10%. El método TDRDA identifica los conjuntos de genes entre los cuales una proporción especificada se espera que tenga una asociación absoluta (en este punto, la relación de peligro estandarizada absoluta) de un grado especificado o más. Esto conduce a un método de clasificación de genes que utiliza el grado ligado más bajo máximo (MLB) de asociación para lo cual cada gen pertenece a un conjunto de TDRDA. Las estimaciones de cada grado de asociación actual del gen con corrección aproximada para "sesgo de selección" debido a la regresión al medio se puede derivar utilizando teoría normal bivariada simple y procedimiento de Bayes empírico de Efron y Tibshirani . Efron, Annals of Applied Statistics 2:197-223 (2008); Efron and Tibshirani. Genetic Epidemiology 23: 70-86. La Tabla 1A muestra la estimación de RM-corregida de la relación de peligro estandarizada y la MLB para cada gen que utiliza ya sea la expresión génica de muestras de patrón de Gleason primario (PGP) o patrón de Gleason más alto (HGP) . Los genes marcados con una dirección de asociación de -1 se asocian con una probabilidad reducida de recurrencia clínica, mientras que aquellos marcados con una dirección de asociación de 1 se asocian con una probabilidad incrementada de recurrencia clínica.
Los componentes de varianza dentro del paciente y entre paciente se estimaron utilizando un modelo mezclado que trata el efecto del paciente como aleatorio. La desviación media y estándar general de la expresión génica normalizadas así como los componentes dentro y entre el paciente de la varianza se muestran en la Tabla 1A.
Los modelos de regresión Cox PH no variados que utilizan la estimación de pseudoprobabilidad parcial ponderada máxima se utilizaron para estimar la asociación entre la expresión génica y la supervivencia específica de cáncer de próstata (PCSS) . La relación de peligro estandarizado (HR) , el valor p y el valor q que utilizan el método FDR de Storey se reporta en la Tabla IB. Storey, Journal of the Royal Statistical Society, Series B 64:479-498 (2002). El valor q se puede interpretar como la probabilidad posterior de Bayes empírica dada a los datos que el gen identificado es un descubrimiento falso, es decir, la probabilidad que no tiene asociación con la recurrencia clínica.
Los modelos de regresión logísticos ordinales no variados se utilizaron para estimar la asociación entre la expresión génica y el patrón de Gleason del tumor de patrón de Gleason primario (3, 4, 5). La relación de probabilidades estandarizadas (O ) , valor p y valor q que utilizan el método FDR de Storey se reporta en la Tabla IB .
La Figura 1 muestra un ej emplo de un dendrograma que representa la asociación de los 81 genes . El ej e y corresponde a la distancia promedio entre las agrupaciones medidas como 1-Pearson r. Mientras es más pequeño el número (medida de distancia) , más sumamente se correlacionan los genes . El método de amalgamación es el promedio del grupo pares ponderados . Los genes que se co-e presaron se identificaron del dendrograma y se agrupan en los grupos de genes . Basado en la Figura 1 , los genes del estudio de identif icación de genes se formaron en los siguientes grupos o subconj untos de genes : Grupo de genes de organización celular (BINl; IGFl; C7; GSN; DES; TGFB1I1; TPM2 ; VCL; FL C; ITGA7; C0L6A1; PPP1R12A; GSTM1; GST 2; PAGE4; PPAP2B; SRD5A2; PRKCA; IGFBP6; GPM6B; OLFML3 ; HLF) Grupo de genes epiteliales básales (CYP3A5; KRT15 ; KRT5; LAMB3 ; SDC1) Grupo de genes de respuesta de tensión (DUSPl; EGRl; POS; JUN; EGR3 ; GADD45B; ZFP36) Grupo de genes de andrógeno (FA 13C; KLK2 ; AZGP1; SRD5A2) Grupo de genes estromales (ASPN; SFRP4; BGN; THBS2; INHBA; C0L1A1; GQL3A1; 00L1A2 ; SPARC; COL8A1; COL4A1; FN1; FAP; COL5A2) Grupo de gen de proliferación (CDC20; TPX2 ; UBE2T; MYBL2 ; CDKN2C) LD LD Tabla 1A Tabla 1A Tabla IB Tabla IB Tabla IB Tabla IB 5 10 15 EJEMPLO 2: DESARROLLO DE ALGORITMO BASADO EN LOS DATOS DE UN ESTUDIO COMPLEMENTARIO El estudio complementario Cleveland Clinic ("CC") consiste de tres cohortes de pacientes y análisis separados para cada cohorte como se describe en la Tabla 2. El primer cohorte (Tabla 2) incluye hombres con riesgo bajo alto (basados en los criterios AUA) de cáncer de próstata del estudio Gene ID 09-002 quien se sometieron a RP en CC entre 1987 y 2004 y tuvieron tejido de biopsia de diagnóstico disponible a CC. Los cohortes 2 y 3 incluyen hombres con riesgo bajo e intermedio clínicamente localizado (basado en los criterios AUA) de cáncer de próstata, respectivamente, quienes podrían haber sido candidatos razonables para la vigilancia activa pero quienes se sometieron a prostatectomía radical (RP) dentro de 6 meses de la diagnosis del cáncer de próstata por biopsia. El objetivo principal de Cohorte 1 fue comparar el perfil molecular del tejido de biopsia con aquel del tejido de prostatectomía radical. El objetivo principal de los Cohortes 2 y 3 fue desarrollar un indicador de múltiples genes de aumento/reclasificación en RP utilizando el tejido de biopsia en pacientes con riesgo bajo a intermedio en diagnosis.
Las muestras de biopsia coincidentes se obtuvieron para un subconjunto de los pacientes (70 pacientes) del estudio de identificación del gen. La expresión génica de los 81 genes seleccionados y los 5 genes de referencia (ARF1, ATP5E, CLTC, GPS1, PGK1) se compararon en las muestras de RP el tejido de biopsia obtenido de estos 70 pacientes.
Los 81 genes se evaluaron en los Cohortes 2 y 3 para asociación con el aumento y reclasificación. La asociación entre 81 genes y el aumento y reclasificación en los Cohortes 2 y 3 se muestran en la Tabla 3. Se proporcionan los valores p y la relación de posibilidades estandarizadas.
En este contexto, "aumento" se refiere a un incremento en el grado de Gleason de 3+3 o 3+4 en el momento de la biopsia a mayor que o igual a 3+4 en el momento de RP. "Aumento 2" se refiere a un incremento en el grado de Gleason de 3+3 o 3+4 en el momento de la biopsia a mayor que o igual a 4+3 en el momento de RP.
TABLA 2 Se exploraron varios modelos diferentes para comparar la expresión entre las muestras de RP y biopsia. Los genes se eligieron basados en la consistencia de la expresión entre las muestras de RP y biopsia. Las Figuras 2A-2E son las gráficas de dispersión que muestran la comparación de la expresión génica normalizada (Cp) para muestras coincidentes de cada paciente donde el eje x es la expresión génica normalizada de la muestra PGP RP (PGP) y el eje y es la expresión génica normalizada de la muestra de biopsia (BX) . Las Figuras 3A-3D muestras gráficas de intervalo de la expresión génica de genes individuales dentro de cada grupo de genes en las muestras de biopsia (BX) y PGP RP.
Después de evaluar la concordancia de la expresión génica en las muestras de biopsia RP, se desarrollaron los siguientes algoritmos (modelos RS) mostrados en la Tabla 4 donde las alturas se determinan utilizando los datos no estandarizados, pero normalizados. Algunos genes, tales como SRD5A2 y GSTM2, que se encuentran dentro del grupo de genes de organización celular, también se evaluaron separadamente y se asignaron coeficientes independientes (ver la "otra" categoría en la Tabla 4) . En otros casos, GSTM1 y GSMT2 se agruparon como un grupo "de tensión" oxidante y un coeficiente se asignó a este grupo de "tensión" (ver modelos RS20 y RS22) . Otros genes, tales como AZGP1 y SLC22A3, que no se encuentran dentro de cualquiera de los grupos de genes, también se incluyeron en ciertos algoritmos (ver la "otra" categoría en la Tabla 4) . Adicionalmente, el grupo de genes de andrógeno se estableció para incluir FAM13C, KLK2, AZGP1, y SRD5A2. Algunos genes tales como BGN, SPARC, FLNC, GSN, TPX2 y SRD5A2 se formaron en umbral antes de ser evaluados en modelos. Por ejemplo, los valores de expresión normalizados por debajo de 4.5 se ajustaron a 4.5 para TPX2 y los valores de expresión normalizados por abajo de 5.5 se ajustaron a 5.5 para SRD5A2.
Tabla 3; Asociación entre los 81 genes y Aumento y Reclasificación en los Cohortes 2/3 Aumento Aumento Aumento Aumento 95% de Aumento de valor 95% de Aumento de valor 95% de de de OR Aumento de 2 de 2 de OR Aumento 2 de de OR Aumento de Gen N valor p estándar CI valor p estándar de CI valor p estándar CI ALDH1A2 167 0 .501 1. 11 (0 .82,1. 52) 0. 932 1. , 02 (0 .70,1. 47) 0 .388 0. 86 (0 .61, 1. 22) ANPEP 167 0 .054 1. 36 (0 .99, 1. 87) 0. 933 0. , 98 (0 .68,1. 42) 0 .003 0. 58 (0 .40, 0. 83) AR 167 0 .136 1. 27 (0 .93,1. 74) 0. 245 0. .81 (0 .56,1. 16) 0 .005 0. 60 (0 .42,0. 86) ARF1 167 0 .914 0. 98 (0 .72,1. 34) 0. .051 1. .45 (1 .00,2. 11) c .371 1. 17 (0 .83,1. 66) ASPN 167 0 .382 1. 15 (0 .84,1. 56) 0. 040 1. .60 (1 .02,2. 51) 0 .069 1. 46 (0 .97,2. 19) ATP5E 167 0 .106 1. 30 (0 .95,1. 77) 0. .499 0. .88 (0 .61,1. 27) 0 .572 0. 90 (0 .64,1. 28) AZGP1 167 0 .192 1. 23 (0 .90, 1. 68) 0. .190 0. .79 (0 .55, 1. 13) 0 .005 0. 59 (0 .41,0. 85) BGN 167 0 .568 0. 91 (0 .67,1. 25) 0. .001 2. .15 (1 .39,3. 33) 0 .020 1. 56 (1 .07,2. 28) BIN1 167 0 .568 1. 09 (0 .80,1. .49) 0. .63 0. .92 (0 .64,1. 32) 0 .104 0. 75 (0 .54,1. 06) BMP6 167 0 .509 0. 90 (0 .66,1. 23) 0. ,01 1. .59 (1 .09,2. 30) 0 .650 1. 08 (0 .77, 1. 54) C7 167 0 .677 1. 07 (0 .78,1. ,46) 0. .01 1. .66 (1 .11,2. 47) 0 .223 0. 80 (0 .56,1. 14) CADM1 167 0 .082 0. .74 (0 .52, 1. ,04) 0. .235 0 .81 (0 .57,1. 15) 0 .039 0. 69 (0 .48,0. 98) CD276 167 0 .454 0. .89 (0 .65,1. ,21) 0. ,362 0 .84 (0 .58, 1. 22) 0 .214 1. 25 (0 .88,1. 78) CD 4 167 0 .122 1. ,28 (0 .94,1. .75) 0 , ,305 1 .23 (0 .83 , 1. 81) 0 .876 0. 97 (0 .69,1. 38) CDC20 166 0 .567 1. ,10 (0 .80, 1. .50) 0. ,298 1 .21 (0 .84, 1. 75) 0 .279 1. 21 (0 .86, 1. 71) CDK 2C 152 0 .494 0. ,89 (0 .64,1. ,24) 0 , .908 0 .98 (0 .67, 1. 43) 0 .834 1. 04 (0 .72, 1. 49) CLTC 167 0 .102 0. .76 (0 .55, 1. .06) 0 .300 0 .82 (0 .57,1. 19) 0 .264 0. , 82 (0 .58,1. 16) 15 C0L1A1 167 0 .732 1. ,06 (0 .77,1. ,44) 0. .000 3 .04 (1 .93,4. 79) 0 .006 1. ,65 (1 .15,2. 36) C0L1A2 167 0 .574 0. , 91 (0 .67,1. .25) 0 .017 1 .65 (1 .09,2. 50) 0 .521 0. .89 (0 .63,1. .26) COL3A1 167 0 .719 0 , .94 (0 .69,1. .29) 0 .000 2 .98 (1 .88,4. 71) 0 .020 1. .53 (1 .07,2. .20) L67 0 .682 0. .94 (0 .69, 1. .28) 0 .000 2 .12 (1 .39,3. 22) 0 .762 0. , 95 (0 .67,1. .35) Aumento Aumento Aumento Aumento 95% de Aumento de valor 95% de Aumento de valor 95% de de de OR Aumento de 2 de 2 de OR Aumento 2 de de OR Aumento de Gen N valor p estándar CI valor p estándar de CI valor p estándar CI COL5A2 167 0 .499 1. 11 (0 .82, 1. 52) 0. 009 1. .81 (1. , 16, 2. ,83) 0. .516 0. 89 (0, .63,1, .26) C0L6A1 167 0 .878 0. 98 (0 .72, 1. 33) 0. 001 2. .14 (1. ,37,3. .34) 0. , 883 1. , 03 (0. .72,1, .46) C0L8A1 165 0 .415 0. 88 (0 .64,1. 20) 0. 000 3. .24 (1, , 88, 5 , .61) 0. , 044 1. ,51 (1. .01,2, .25) CSF1 167 0 .879 1. 02 (0 .75,1. 40) 0. 187 1. .31 (0, .88,1. .96) 0. .110 0. , 76 (0. .54, 1 , .07) CSRP1 165 0 .258 1. 20 (0 .87,1. 65) 0. 226 1. .26 (0. .87,1. .82) 0. .641 0. , 92 (0. .65,1, .31) CYP3A5 167 0 .989 1. 00 (0 .73,1. 36) 0. 188 1 , .28 (0. .88, 1. .87) 0. .937 1. , 01 (0, .71,1, .44) DES 167 0 .776 1. 05 (0 .77, 1. 43) 0. 0E 1. .40 (0. , 95, , .05) 0. .242 0. , 81 (0. .57,1, .15) DPP4 167 0 .479 0. 89 (0 .65, 1. 22) 0. OC 0 , .60 (0. .42, 0. .85) 0. .000 0. , 51 (0, .36,0, .74) DUSP1 167 0 .295 0. 84 (0 .61,1. 16) 0. .26 0 .82 (0. .58,1, .16) 0. .427 0. , 87 (0 .62, 1 .22) EGR1 167 0 .685 0. 94 (0 .69,1. 28) 0. .21/ 1 .27 (0. .87,1. .85) 0. .370 1. .18 (0 .83,1 .68) EGR3 166 0 .025 0. 69 (0 .50, 0. 95) 0. 539 0. .89 (0. .62, 1. .29) 0. .735 1. , 06 (0, .75,1, .51) ERG 166 0 .002 0. 58 (0 .42,0. 81) 0. .000 0. .42 (0. .28,0. .64) 0. .768 1. .05 (0, .74,1 .50) F2R 160 0 .324 0. 85 (0 .62,1. 17) 0. ,009 1 , .77 (1. .16,2, .70) 0. .000 2. .39 (1 .52,3 .76) RAMIO7A 143 0 .832 1. 04 (0 .74,1. 45) 0. ,088 1. .42 (0. .95, 2 , .11) 0, .687 1. .08 (0 .74,1 .58) FAM13C 167 0 .546 1. 10 (0 .81, 1. 50) 0. .041 0 .68 (0. .47,0 .98) 0. .003 0, .58 (0 .40,0 .83) FAP 167 0 .540 0. 91 (0 .67, 1. 24) 0. ,093 1. .37 (0. .95, 1 , .97) 0. .001 1. .85 (1, .28,2 .68) FLNC 167 0 .963 1. 01 (0 .74,1. 37) 0. .254 1. .26 (0. .85, 1. .87) 0. .030 0. .68 (0, .48,0 .96) FN1 167 0 .530 0. 91 (0 .66,1. 23) 0. .005 1. .73 (1. .18, 2 .53) 0. .364 1. .17 (0 .83 , 1 .66) FOS 167 0 .649 0. 93 (0 .68,1. 27) 0. , 071 1 .38 (0. .97, 1 .97) 0 , .015 1. .53 (1 .09,2 .16) GADD45B 167 0 .978 1. 00 (0 .73,1. 36) 0. .105 1 .38 (0, .94, 2 .04) 0 , .876 0. .97 (0 .69,1 .38) GPM6B 159 0 .944 0. 99 (0 .72 , 1. 36) 0. .002 1 .95 (1. .27,2 .97) 0 .266 0 , .81 (0 .57,1 .17) GPS1 167 0 .404 1. 14 (0 .84,1. 56) 0. ,609 0. .91 (0, .62, 1 .32) 0. .125 1. .31 (0 .93,1 .86) GSN 167 0 .272 0. 84 (0 .61,1. .15) 0. ,309 0 .83 (0. .57,1 .19) 0. .027 0. .67 (0 .47,0 .96) GSTM1 167 0 .178 1. 24 (0 .91, 1. 69) 0. .762 0 .95 (0, .66,1 .36) 0. .000 0. .50 (0 .34,0 .72) GSTM2 167 0 .145 1. 26 (0 .92,1. 73) 0. .053 1 .48 (1, .00, 2 .20) 0 .654 0 , .92 (0 .65,1 .31) Aumento Aumento Aumento Aumento 95% de Aumento valor 95% de Aumento de valor 95% de de de OR Aumento de 2 de de OR Aumento 2 de de OR Aumento de Gen N valor p estándar CI valor p tándar de CI valor p estándar CI HLF 167 0 .979 1. 00 (0 .73,1. 36) 0. 602 1.11 (0 .76, 1. 62) 0 .030 0. 69 (0 .49,0. 96) IGF1 167 0 .313 1. 17 (0 .86,1. 60) 0. 878 0.97 (0 .67,1. 40) 0 .146 0. 77 (0 .55,1. 09) IGFBP2 167 0 .253 1. 20 (0 .88,1. 64) 0. 493 0.88 (0 .61,1. 27) 0 .051 0. 70 (0 .49,1. 00) IGFBP6 167 0 .336 0. 86 (0 .62,1. 17) 0. 510 1.14 (0 .78, 1. 66) 0 .204 0. 80 (0 .57,1. 13) IL6ST 167 0 .774 1. 05 (0 .77, 1. 43) 0. 541 1.12 (0 .77,1. 63) 0 .235 0. 81 (0 .57, 1. 15) INHBA 167 0 .104 1. 30 (0 .95,1. 78) 0. 002 1.89 (1 .26, 2. 84) 0 .077 1. 38 (0 .97, 1. 97) ITGA7 167 0 .990 1. 00 (0 .73,1. 36) 0. 780 1.05 (0 .73,1. 53) 0 .470 0. 88 (0 .62, 1. 25) JUN 167 0 .586 1. 09 (0 .80,1. 48) 0. 538 0.89 (0 .62, 1. 28) 0 .259 0. 82 (0 .59,1. 15) KLK2 167 0 .267 0. 84 (0 .61, 1. 15) 0. 003 0.56 (0 .38,0. 82) 0 .007 0. 61 (0 .42, 0. 87) KRT15 167 0 .500 0. 90 (0 .65, 1. 23) 0. 738 0.94 (0 .65,1. 35) 0 .987 1. 00 (0 .71, 1. 42) KRT5 152 0 .834 0. 97 (0 .70, 1. 34) 0. 632 1.10 (0 .74, 1. 63) 0 .908 0. 98 (0 .68,1. 40) LAMB3 167 0 .090 1. 31 (0 .96, 1. 79) 0. 013 1.73 (1 .12,2. 68) 0 .132 1. 33 (0 .92,1. 94) LGALS3 166 0 .345 1. 16 (0 .85,1. 59) 0. 405 1.18 (0 .80,1. 72) 0 .208 0. 80 (0 .57,1. 13) MMP11 167 0 .715 1. 06 (0 .78,1. 45) 0. 080 1.37 (0 .96, 1. 96) 0 .257 1. 22 (0 .87,1. 71) MYBL.2 167 0 .235 1. 21 (0 .88,1. 67) 0. 868 1.03 (0 .71, 1. 49) 0 .266 1. 21 (0 .86, 1. 70) NFAT5 167 0 .514 0. 90 (0 .66, 1. 23) 0. 058 0.70 (0 .48,1. 01) 0 .530 0. 89 (0 .63,1. 27) 0LFML3 167 0 .448 0. 89 (0 .65, 1. 21) 0. 056 1.50 (0 .99, 2. 28) 0 .129 0. 77 (0 .54,1. 08) PAGE4 167 0 .914 0. 98 (0 .72,1. 34) 0. 211 0.80 (0 .56, 1. 14) 0 .005 0. 61 (0 .43,0. 86) PGK1 167 0 .138 0. 78 (0 .56, 1. 08) 0. 666 0.92 (0 .64, 1. 33) 0 .292 0. 83 (0 .59,1. 17) PPAP2B 167 0 .952 0. 99 (0 .73,1. 35) 0. 989 1.00 (0 .69, 1. 44) 0 .221 0. 80 (0 .56,1. 14) PPP1R12A 167 0 .547 0. ,91 (0 .66, 1. 24) 0. 563 0.90 (0 .63, 1. 29) 0 .001 0. 55 (0 .38,0. 79) PRKCA 167 0 .337 1. .17 (0 .85, 1. ,59) 0. , 141 1.35 (0 .90, 2. 03) 0 .029 0. 67 (0 .46,0. ,96) SDC1 167 0 .064 1. 36 (0 .98,1. 87) 0. 013 1.83 (1 .14,2. 96) 0 .037 1. 58 (1 .03,2. ,42) SFRP4 166 0 .986 1. 00 (0 .73, 1. ,37) 0. , 047 1.47 (1 .01, 2. 15) 0 .031 1. 49 (1 .04,2. 14) SHMT2 167 0 .133 0. .78 (0 .56, 1. , 08) 0. .147 0.77 (0 .53, 1. 10) 0 .715 0. , 94 (0 .66,1. ,33) Aumento Aumento Aumento Aumento 95% de Aumento i valor 95% de Aumento de valor 95% de de de OR Aumento de 2 de de OR Aumento 2 de de OR Aumento de Gen N valor p estándar CI valor p tándar de CI valor p estándar CI SLC22A3 167 0 .828 1. 03 (0 .76, 1. 41) 0. 044 0.69 (0 .48,0. 99) 0 .050 0. 71 (0 .50,1. 00) SMAD4 167 0 .165 1. 25 (0 .91, 1. 71) 0. 333 0.83 (0 .58, 1. 21) 0 .021 0. 65 (0 .45, 0. 94) SPARC 167 0 .810 0. 96 (0 .71,1. 31) 0. 000 2.15 (1 .40,3. 30) 0 .154 1. 30 (0 .91,1. 86) SRC 167 0 .083 1. 34 (0 .96,1. 86) 0. 750 1.06 (0 .72, 1. 56) 0 .550 0. 90 (0 .64 , 1. 26) SRD5A2 167 0 .862 0. 97 (0 .71, 1. 33) 0. 122 0.75 (0 .53,1. 08) 0 .010 0. 63 (0 .45,0. 90) STAT5B 167 0 .298 0. 84 (0 .62,1. 16) 0. 515 0.89 (0 .62, 1. 27) 0 .016 0. 65 (0 .46,0. 92) TGFB1I1 167 0 .985 1. 00 (0 .74,1. 37) 0. 066 1.45 (0 .98, 2. 14) 0 .131 0. 76 (0 .54,1. 08) THBS2 167 0 .415 1. 14 (0 .83 , 1. 56) 0. 001 1.91 (1 .30,2. 80) 0 .288 1. 21 (0 .85,1. 70) TNFRSFIOB 167 0 .214 1. 22 (0 .89, 1. 66) 0. 805 0.95 (0 .66,1. 38) 0 .118 0. 76 (0 .54 , 1. 07) TPM2 167 0 .996 1. 00 (0 .73,1. 36) 0. .527 1.13 (0 .78, 1. 64) 0 .094 0. 74 (0 .52,1. 05) TPX2 167 0 .017 1. 48 (1 .07,2. 04) 0. 002 1.89 (1 .26,2. 83) 0 .001 1. 91 (1 .30,2. 80) TUBB2A 167 0 .941 0. 99 (0 .73 , 1. 35) 0. 182 0.78 (0 .54, 1. 12) 0 .111 0. 75 (0 .53,1. 07) UBE2T 167 0 .095 1. 36 (0 .95,1. 96) 0. 009 1.58 (1 .12, 2. 23) 0 .084 1. 33 (0 .96,1. 84) VCL 167 0 .954 0. 99 (0 .73,1. 35) 0. 165 1.31 (0 .90, 1. 91) 0 .265 0. 82 (0 .57,1. 16) ZFP36 167 0 .685 1. 07 (0 .78, 1. 45) 0. .784 0.95 (0 .66, 1. 37) 0 .610 0. 91 (0 .64,1. 29) Tabla 4 10 La Tabla 5A muestra la relación de posibilidades estandarizadas de cada uno de los modelos RS utilizando los datos del estudio Gene ID original descrito en el Ejemplo 1 para el tiempo a cR y para amento y reclasificación en la combinación de aumento y recl sificación significati a. La Tabla 5B muestra el desempeño de cada uno de los modelos RS que utiliza los datos del estudio complementario CC (Cohortes 2 y 3) para aumento y reclasificación y la combinación del aumento y reclasificación significativos. En este contexto, "amento" se refiere a un incremento en el grado Gleason de 3 + 3 o 3 +4 en la biopsia a mayor que o igual a 3+4 en la prostatectomía radical. "Aumento significativo" en este contexto se refiere al aumento del grado de Gleason 3 + 3 o 3 +4 en la biopsia a igual o mayor que 4+3 en la pros tatectomía radical.
Además, los grupos de genes utilizados en el modelo RS25 se evaluaron solos y en varias combinaciones. La Tabla 6A muestra los resultados de este análisis que utiliza los datos del estudio Identificación del Gen y la Tabla 6B muestra los resultados de este análisis que utiliza los datos de los Cohortes 2 y 3 del estudio complementario CC.
La expresión génica para algunos genes se puede 00 formar en umbral, por ejemplo SRD5A2 Thresh = 5.5 si SRD5A2 <5.5 o SRD5A2 si SRD5A2 >5.5 y TPX2 Thresh = 5.0 si TPX2 <5.0 o TPX2 si TPX2 >5.0, en donde los símbolos de genes representan los valores de expresión génica normalizada.
Los registros RS no escalados derivados de la Tabla 4 también se pueden volver a escalar para estar entre 0 y 100. Por ejemplo, RS27 se puede volver a escalar para estar entre 0 y 100 como sigue: RS (escala) = 0 si 13.4 x ( RSu+ 10.5 ) < 0 ; 13.4 x (RSu+10.5) si 0<13.4x (RSu+10.5 ) <100 ; o 100 si 13.4 x (RSu+10.5 ) >100.
Utilizando el RS escalado, los pacientes se pueden clasificar en grupos RS bajos, intermedios altos que utilizan los puntos de corte pre-especificados definidos a continuación en la Tabla B. Estos puntos de corte definen los límites entre los grupos RS bajos e intermedios y entre los grupos RS intermedios y altos. Los puntos de corte se derivaron del estudio de descubrimiento con la intensión de identificar proporciones sustanciales de pacientes quienes en promedio tuvieron un riesgo bajo o alto clínicamente significativo de enfermedad agresiva. En RS escalado se redondea a número entero más cercano antes que se apliquen los puntos de corte que definen los grupos RS .
TABLA B Tabla 5A Aumento o Reclasificación N Aumento Aumento Significativo Reclasificación Signif cativos RS OR 95% de CI OR 95% de CI OR 95% de CI OR 95% de CI RSO 280 1.72 (1 22,2 41) 7. 51 (4. .37,12 .9) 2. .01 (1. .41, 2. .88) 2. .91 (1. .95, 4. .34) RS1 287 1.73 (1 21,2 48) 5. 98 Í3. .30,10 .8) 1. .99 (1. .40,2 .82) 2 .68 (1. .80, 3. .97) RS2 287 1.72 (1 19,2 48) 5. 89 (3. .18,10 • 9) 2. .02 (1. .42, 2 , .86) 2. .67 (1. .80,3. .95) RS3 287 1.71 (1 20,2 45) 6 30 (3. .66,10 .8) 1. .96 (1. .38,2 .80) 2 .69 (1. .8 , 3. .93) RS4 287 1.69 (1 18,2 42) 6 06 (3. .48, 10 .5) 1. .99 (1. ,40,2. .82) 2. .65 (1. .82, 3. .86) RS5 288 1.78 (1 21,2 62) 5 60 (3. .56,8.81) 2. .24 (1. .59,3 .15) 2 .87 (1. ,93,4. .28) RS6 287 1.94 (1 37,2 74) 10 .16 (5. .82, 17 .8) 2. .07 (1. .48, 2 .91) 3. .11 (2. .07,4 .67) RS7 288 1.91 (1 34,2 71) 9 34 (5. .25,16 .6) 2. .06 (1. .47, 2 .89) 3 .01 (2. .02, 4. .48) RS8 289 1.80 (1 27,2 55) 7 49 (4. .02, 14 .0) 2 , .09 11 .49,2 .92) 2 .86 (1. .97 , .14) RS9 288 2.00 (1 39,2 89) 9. 56 (5. ,06,18 .0) 1. .99 (1. .42, 2 .79) 3 .09 (2. .08, 4. .60) RS10 287 1.94 (1 37,2 75) 10 .12 (5. .79, 17 .7) 2. .09 (1 .49,2 .94) 3 .14 (2. .08, .74) RS11 288 2.09 (1 43,3 05) 9. 46 (5. .18, 17 .3) 2. .17 (1. .54,3 .05) 3 .42 (2. .24,5 .23) RS12 287 2.10 (1 45,3 04) 10 .41 (5. .92, 18 .3) 2. .17 (1 .55,3 .06) 3 .52 (2. .30,5 .40) RS13 287 2.10 (1 44, 3 05) 9. 40 (5. .50, 16 .1) 2. .20 (1. .55,3 .13) 3. .50 (2. .25,5 .43) RS14 287 2.06 (1 42,2 99) 9 71 (5. .65, 16 .7) 2. .18 (1. .55,3 .08) 3 .53 (2. .29,5 .44) RS15 288 1.92 (1 32 , 2 78) 7 93 (4 .56, 13 .8) 2 .12 (1 .51 , 2 .99) 3 .25 (2 .20,4 .80) RS16 288 1.76 (1 23,2 52) 7 10 (4. .12, 12 .2) 1. .99 (1. .41,2 .82) 2 .94 (1. .98,4 .38) RS17 286 2.23 (1 52,3 27) 7 52 (4 .18, 13 .5) 2 .91 (1 .93,4 .38) 4 .48 (2 .72,7 .38) RS18 286 2.12 (1 46, 3 08) 7 04 (3. .87, 12 .8) 2 .89 (1 .91,4 .37) 4 .30 (2. .62,7 .06) RS19 287 2.14 (1 46, 3 13) 6 90 (3 .80, 12 .5) 2 .88 (1 .96,4 .23) 4 .20 (2 .66,6 .63) RS20 286 2.30 (1 55, 3 42) 8 41 ( .65,15 .2) 2 .90 (1 .98,4 .25) 4 .78 (3 .00,7 .61) RS21 287 2.36 (1 59,3 52) 8 83 ( .87, 16 .0) 2 .63 (1 .76,3 .94) 4 .93 (3 .06,7 .93) RS22 286 2.16 (1 48,3 .15) 7 57 (4 .14,13 .8) 2 .90 (1 .96,4 .27) 4 .39 (2 .75,7 .01) 287 2.26 (1 53, 3 .35) 7 46 (4 .24,13 .1) 2 .80 (1 .85,4 .24) 4 .79 (2 .98,7 .68) Aumento o Reclasificación N Aumento Aumento Significativo Reclasificación Significativos RS24 286 2 .21 (1.50,3. .24) 8.01 (4.38,14.7) 2. .93 (1.99,4.31) 4. .62 (2.89,7. 39) RS25 287 2 .25 (1.53,3 .31) 7.70 (4.25,14.0) 2 , .76 (1.83,4.16) 4 .76 (2.99, 7. 58) RS26 287 2 .23 (1.51,3 .29) 6.67 (3.52,12.7) 2. .64 (1.81, 3.86) 4 .01 (2.56 , 6. 28) RS27 287 2 .23 (1.51,3 .29) 6.67 (3.52,12.7) 2. .64 (1.81,3.86) 4 .01 (2.56,6. 28) 5 o 10 15 Tabla 5B Aumento o Reclasificación Aumento Aumento Significativo Reclasificación Significativos O OR OR Modelo N Estándar 95% de CI OR Estándar 95% de CI Estándar 95% de CI Estándar 95% de CI RS 0 166 1 16 (0 84, 1 58) 2. 45 (1 61,3 73) 2 42 (1 61, 3 62) 3 (1 98,4 56) RS 1 167 1 05 (0 77, 1 43) 2. 46 (1 63,3 71) 2 38 (1 61, 3 53) 3 36 (2 18, 5 18) RS 2 167 1 04 (0 76, 1 42) 2. 45 (1 63,3 69) 2 34 (1 58, 3 46) 3 25 (2 12,4 99) RS 3 167 1 04 (0 76, 1 41) 2. 56 (1 69,3 89) 2 28 {1 55, 3 36) 3 27 (2 13, 5 03) RS 4 167 1 03 (0 75, 1 40) 2. 54 (1 68,3 86) 2 23 (1 52, 3 27) 3 16 (2 07, 4 82) RS 5 167 1 02 (0 75, 1 39) 1 89 (1 28,2 78) 1 77 (1 23,2 55) 2 21 (1 52, 3 20) RS 6 167 1 08 (0 79,1 48) 2 49 (1 64,3 79) 2 42 (1 62, 3 62) 3 22 (2 09,4 96) RS 7 167 1 03 (0 75, 1 40) 2 31 (1 54,3 48) 2 28 (1 54,3 38) 2 97 (1 96,4 51) RS 8 167 0 94 (0 69,1 28) 2 34 (1 55, 3 53) 2 31 (1 56, 3 43) 2 87 (1 91,4 30) RS 9 167 1 02 (0 75, 1 39) 2 19 (1 47,3 27) 2 22 (1 51, 3 27) 2 77 (1 85, 4 14) RS10 167 1 08 (0 79,1 48) 2 49 (1 63,3 78) 2 41 (1 61, 3 61) 3 22 (2 09,4 95) RS11 167 0 99 (0 73,1 35) 2 18 (1 46,3 24) 2 17 (1 48,3 19) 2 83 (1 88, 4 25) RS12 167 1 06 (0 78,1 45) 2 36 (1 57,3 56) 2 34 (1 57, 3 48) 3 12 (2 04,4 78) RS13 166 1 01 (0 74 , 1 37) 2 17 (1 45, 3 23) 2 41 (1 61,3 60) 2 99 (1 97, 4 54) RS14 166 1 03 (0 76,1 41) 2 22 (1 48,3 31) 2 33 (1 57, 3 46) 2 95 (1 94,4 47) RS15 166 1 (0 73,1 36) 1 98 (1 34,2 92) 2 12 (1 44,3 12) 2 58 (1 74,3 84) RS16 166 0 94 (0 69,1 28) 1 .7 (1 16,2 48) 2 07 (1 41, 3 03) 2 24 (1 54,3 25) RS17 165 0 98 (0 72,1 34) 1 96 (1 33,2 89) 2 63 (1 73,3 98) 3 02 (1 99,4 60) RS18 165 0 .97 (0 71,1 33) 1 86 (1 26,2 73) 2 71 (1 78 , 4 13) 3 01 (1 98 , 4 56) RS19 165 0 .93 (0 68,1 .27) 1 86 (1 27,2 72) 2 .4 (1 61, 3 .58) 2 75 (1 84,4 10) RS20 166 1 .07 (0 78,1 46) 2 .2 (1 48,3 29) 2 47 (1 65, 3 69) 3 .1 (2 04,4 72) RS21 166 1 .06 (0 77,1 .45) 2 .2 (1 47, 3 28) 2 48 (1 65, 3 • 71) 3 11 (2 04,4 74) RS22 166 1 .04 (0 76,1 .43) 2 21 (1 48,3 .29) 2 47 (1 65, 3 .70) 3 14 (2 05,4 79) Aumento o Reclasificación Aumento Aumento Significativo Reclasificación Significativos OR OR OR Modelo N Estándar 95% de CI OR Estándar 95% de CI Estándar 95% de CI Estándar 95% de CI RS23 165 1.02 (0 75, 1 40) 2·01 (1.36,2.97) 2.52 (1.67,3. 79) 2.94 (1.95,4.44) RS24 166 1.04 (0 76,1 42) 2.18 (1.46,3.26) 2.52 (1.68,3. 78) 3.14 (2.06,4.80) RS25 166 1.04 (0 76, 1 42) 2.11 (1.42,3.13) 2.45 (1.64,3. 67) 3 (1.98,4.54) (1.38, (1.63 RS26 166 0.99 (0 72,1 35) 2.05 3.04) 2.43 3.65) 2.82 (1.88, 4.21) (1.38, (1.63 RS27 166 0.99 (0 72 , 1 35) 2.05 3.04) 2.43 3.65) 2.82 (1.88, 4.21) Tabla 6A Tabla 6B Aumento o Reclas ficación Aumento Aumento Significativo Reclasi icación Signi icativos OR OR OR OR Hodel N Es ándar 95% de CI Estándar 95% de CI Estándar 95% de CI Estándar 95% de CI RS25 166 1 04 (0 76, 1 42) 2.11 (1 42, 3 13) 2.45 (1 64,3 67) 3 (1 98,4 54) Estromal 166 0 99 (0 73, 1 35) 2.19 (1 45, 3 32) 1.65 (1 15,2 38) 1 .86 (1 31,2 65) Organización Celular 167 1 06 (0 77, 1 44) 0.93 (0 64, 1 36) 1.49 (1 04,2 13) 1 .44 (1 03,2 00) PSA 167 1 04 (0 76, 1 42) 1.68 (1 16, 2 44) 1.78 (1 24,2 57) 1 .96 (1 37,2 81) Organización Celular ECM 166 1 04 (0 76, 1 42) 1.96 (1 32,2 91) 2.32 (1 55,3 45) 2 .6 (1 76,3 85) ECM PSA 166 1 02 (0 75, 1 39) 2.14 (1 44,3 20) 1.84 (1 28,2 67) 2 .11 (1 47,3 04) Organización Celular PSA 167 1 07 (0 78, 1 46) 1.36 (0 94,1 97) 2.06 (1 40,3 04) 2 .12 (1 47,3 06) Organización Celular ECM TPX2 166 1 15 (0 84, 1 58) 2.24 (1 49,3 37) 2.55 (1 69,3 85) 2 .95 (1 96, 4 45) ECM PSA TPX2 166 1 .2 (0 88, 1 65) 2.66 (1 71,4 13) 2.28 (1 53,3 40) 2 .72 (1 82,4 07) Organización Celular PSA TPX2 167 1 .3 (0 95, 1 79) 1.77 (1 21,2 60) 2.42 (1 62,3 63) 2 .65 (1 79, 3 92) Organización Celular ECM GSTM2 166 0 96 (0 70, 1 30) 1.76 (1 20,2 57) 2.12 (1 44,3 12) 2 .34 (1 60,3 42) ECM PSA GSTM2 166 0 91 (0 67, 1 24) 1.69 (1 16,2 46) 1.85 (1 28,2 67) 2 .05 (1 42, 2 94) Organización Celular PSA GSTM2 167 0 89 (0 65, 1 22) 1.13 (0 78,1 62) 1.72 (1 19,2 48) 1 .75 <1 23,2 48) Organización Celular ECM GSTM2 TPX2 AZGP1 SRD5A2 166 1 04 (0 76, 1 42) 2.14 (1 44 , 3 20) 2.47 (1 65, 3 70) 2 .94 (1 95,4 44) ECM PSA GSTM2 TPX2 AZGP1 SRD5A2 166 1 03 (0 75, 1 41) 2.11 (1 42,3 13) 2.39 (1 61, 3 57) 2 .94 (1 95,4 45) Organización Celular PSA GSTM2 TPX2 AZGP1 SRD5A2 167 1 07 (0 78, 1 46) 1.84 (1 26 , 2 68) 2.22 (1 51, 3 27) 2 .73 (1 83, 4 09) EJEMPLO 3: ANÁLISIS DE GRUPOS SELECTOS - APILADO PARA IDENTIFICAR LOS GENES CO-EXPRESADOS El propósito del método de grupos selectos-apilados de genes descritos en este ejemplo fue para encontrar un conjunto de biomarcadores co-expresados (o sustitutos) que se pueden utilizar para predecir con conflabilidad el resultado así como mejorar los genes descritos en lo anterior. El método utilizado para identificar los marcadores coexpresados se ilustra en la Figura 4. El conjunto de biomarcadores co-expresados se obtuvo al sembrar la enumeración de grupos selectos máxima (MCE) con biomarcadores curados extraídos de la literatura científica. El método de enumeración de grupos selectos máxima (MCE) [Bron y colaboradores, 1973] agrega genes en los grupos estrechamente co-expresados tal que todos los genes en el grupo tienen un perfil de expresión similar. Cuando todos los genes en un grupo satisfacen una condición de similitud mínima, el grupo es llamado un grupo selecto. Cuando un grupo selecto es tan grande como sea posible sin admitir ninguno de los genes "disimilares" en el grupo selecto, entonces el grupo se dice que es máximo. Utilizando el método MCE, todos los grupo selectos máximos se buscan dentro de un conjunto de datos, la utilización de este método, casi cualquier grado de solapamiento entre los grupos selectos máximos se puede encontrar, siempre y cuando el solapamiento se soporte por los datos. La enumeración de grupos selectos máxima ha mostrado [Borate y colaboradores, 2009] que es una forma eficaz de identificar módulos de genes co-expresados (CGMs) . Definiciones La siguiente tabla define algunos términos comúnmente utilizados en los análisis de grupos selectos-apilados de genes .
Tabla 7 2. Ejemplos de grupos selectos y apilados Las Figuras 5A-5C muestran una familia de tres gráficas diferentes. Una gráfica consiste de nodos (numerados) y bordes de conexión (líneas) . La Figura 5A no es un grupo selecto debido a que no existe bordes que conecten los nodos 3 y 4. La Figura 5B es un grupo selecto debido a que existe un borde que conecta todas las combinaciones en pares de los nodos en la gráfica. La Figura 5C es un grupo selecto, pero no un grupo selecto máximo debido a que está contenido en un grupo selecto (b) . Dada una gráfica con los bordes de conexión, el algoritmo MCE dispara sistemáticamente todos los grupos selectos máximos con 3 o más nodos. Por ejemplo, la gráfica en la Figura 6 tiene dos grupos selectos máximos: 1-2-3-4-5 y 1-2-3-4-6.
Cando se basa en los datos de expresión génica, existen típicamente números grandes de grupos selectos máximos que son muy similares entre sí. Estos grupos máximos se pueden fusionar en apilados de grupos selectos máximos. Los apilados son los módulos de genes finales de interés y generalmente son mucho menos el número que son los grupos selectos máximos. La Figura 7 ilustra esquemáticamente el apilado de dos grupos selectos máximos. 3. Siembra Para los propósitos de encontrar marcadores coexpresados sustitutos, los biomarcadores de la literatura se pueden identificar y luego utilizar para sembrar los algoritmos MCE y de apilado. La idea básica es como sigue: para cada semilla, calcular un conjunto de grupos selectos máximos (utilizando el algoritmo MCE paralelo) . Luego apilar los grupos selectos máximos obtenidos de cada semilla, producir un conjunto de apilados sembrados. Finalmente, el apilado de los apilados sembrados para obtener un "apilado de apilado sembrados" . El apilado de los apilados sembrados es una aproximación a los apilados que se obtendrían al utilizar los algoritmos MCE/de apilado (es decir no sembrados) convencionales. El método utilizado para identificar los genes que se co-expresan con los genes descritos en lo anterior se describen en la Figura 4 y se describen con más detalle a continuación. 3.1 Algoritmo MCE Sembrado (etapas 1-4) 1. El proceso comienza al identificar un conjunto apropiado, Ss, de genes de siembra. En el presente caso los genes de siembra se seleccionaron de los subconjuntos de genes descritos en lo anterior. 2. Con los genes de siembra especificados, seleccionar una medición de la correlación, R(gi,g2) , entre los perfiles de expresión génica de cualquiera de los dos genes, g.,g2/ junto con un umbral de correlación por debajo del cual gi,g2, se puede considerar no correlacionado. Para cada gen de siembra s en el conjunto de siembra Ss, encontrar todos los pares de genes (s,g) en el conjunto de datos tal que R(s,g) es mayor que o igual al umbral de correlación. Dejar que Gs sea la unión de s y el conjunto de todos los genes correlacionados con s. Para el presente estudio, el coeficiente Spearman se utilizó como la medición de la correlación y 0.7 como el umbral de correlación. 3. Calcular el coeficiente de correlación para cada combinación en pares de genes ( i; ) en Gs . Dejar que Xs sea el conjunto de todos los pares de genes por lo cual R(gi,gj) es mayor que o igual a el umbral de correlación. Si los genes se graficaron como en la Figura 5, podría haber un borde (línea) entre cada par de genes en Xs . 4. Ejecutar el algoritmo MCE, como se describe por Schmidt y colaboradores (J. Parallel Distrib. Comput . 69 (2009) 417-428) en los pares de genes Xs para cada gen de siembra . 3.2 Algoritmo de apilado sembrado (etapas 5-6) El propósito del apilado es para reducir el número de grupos selectos a un número manejable de módulos de genes (apilados). Continuando con las etapas 5 y 6 de la Figura 4: 5. Para cada gen de siembra, los grupos selectos del más grande al más pequeño, es decir el número más grande de nodos al número más pequeño de nodos. De los grupos selectos restantes, encontrar el grupo selecto con el solapamiento más grande. Si el solapamiento excede un umbral específico de usuario T, fusionar los dos grupos selectos para formar el primer apilado. Volver a ordenar los grupos selectos y el apilado (s) desde el más grande al más pequeño y repetir la prueba de solapamiento y fusión. Repetir el proceso hasta que ya no se presente una nueva fusión. 6. Ahora se tiene un conjunto de apilados para cada gen de siembra. En la etapa final, todos los apilados sembrados se combinan en un conjunto de apilados, s. Como el cálculo final, todos los apilados en s se apilan, justo como en la etapa 5. Este apilado de apilados es el conjunto de módulos de genes utilizados para el presente estudio.
Los genes que se mostraron para co-expresarse con los genes identificados por este método se muestran en las Tablas 8-11. "ID del apilado" en las Tablas es simplemente un índice para numerar los apilados y "Peso de la sonda" se refiere al peso de la sonda, o el número de veces en que una sonada (gen) se presenta en el apilado.
Tabla 8 5 15 10 15 Tabla 9 5 10 5 15 5 10 15 5 5 10 5 15 5 10 Tabla 10 5 10 15 5 10 15 5 10 ??? 5 10 15 5 15 5 15 Tabla 11 5 10 15 Ejemplo 4: Estudio de Validación Prospectivo de RS27 Diseño del Estudio y Métodos Estadísticos El algoritmo RS27 en la Tabla 4 se sometió a prueba en un estudio de validación clínica prospectivo que incluyó 395 pacientes evaluables quienes tuvieron cirugía para su cáncer de próstata entre 1997 y 2010 en la University of California, San Francisco (UCSF) . Los pacientes tuvieron riesgo Bajo o intermedio (por CAPRA) para el cáncer de próstata clínicamente localizado quienes podrían haber sido candidatos razonables para su vigilancia activa pero se sometieron a RP en UCSF dentro de 6 meses de la diagnosis del cáncer de próstata por biopsia. No se llevó a cabo aleatorización para la selección de pacientes. Para cada paciente, las muestras de biopsia de próstata de un bloque de tejido incrustado en parafina, fijo (FPET) que contiene uno o más núcleos de agujas que contienen tumor se evaluó.
Para investigar si hay una relación significativa entre RS27 o cualquier componente de RS27 y patología adversa en RP, se utilizaron modelos de regresión logísticas multinominales multivariables y univariables y se reportaron los valores p de las pruebas de relación de probabilidad (LR) de la hipótesis anular que la relación de probabilidades (OR) es una. El modelo logístico multinominal también se utilizó para calcular las estimaciones con 95% de intervalos de confidencia de la probabilidad de enfermedad de alto grado o confinada no a órganos. Para evaluar la relación entre RS27, las co-variables de línea base, y las combinaciones de estos factores con enfermedad de alto grado o confinada no a órganos, se utilizaron modelos de regresión logística binarios multivariables y no variables y se reportaron los valores p de las pruebas de relación de probabilidad de la hipótesis nula que la relación de probabilidades (OR) es una.
El punto final primario se formuló como sigue: Tabla 12 : Punto Final Clínico - Grado y Etapa RP donde el registro de Gleason <3+3 y pT2 (indicado "1") es la categoría de referencia y todas las otras categorías (2-6) se compararan a la categoría de referencia.
Las combinaciones de células de la Tabla 12 evaluadas en los modelos de regresión logística binaria incluyen lo siguiente : Células 2, 4, 6 vs. 1, 3, 5: enfermedad confinada no a órganos Células 5, 6 s. 1, 2, 3, 4: enfermedad de alto grado Células 2, 4, 5, 6 vs. I y 3: enfermedad de alto grado o confinada no a órganos.
Algoritmo RS27 El RS27 en una escala de 0 a 100 se derivó de las mediciones de expresión génica normalizada de referencia como sigue .
El RS27 no escalado (RS27u) se definió como en la Tabla 4 : Grupo RS27u = 0.735*ECM (Respuesta a Estromal) -grupo de migración 0.368* (Organización Celular) - grupo 0.352*PSA (Andrógeno) Proliferación +0.095* (TPX2) Donde : El registro del grupo ECM (Respuesta Estromal) 0.527*BGN + 0.457*COL1A1 + 0.156*SFRP4 Registro del grupo de migración (Organización Celular) = 0.163*FLNC + 0.504*GSN + 0.421*TPM2 + 0.394*GSTM2 Registro del grupo PSA (Andrógeno) = 0.634*FAM13C + 1.079*KLK2 + 0.642*AZGP1 + 0.997*SRD5A2 Thresh Registro de proliferación (TPX2) = Umbral TPX2 donde los registros de genes formados en umbral para SRD5A2 y TPX2 se calculan como sigue: Umbral SRD5A2 = TPX2 < 5.0 Umbral TPX2 = otra manera RS27u luego se vuelve a escalar para estar entre 0 y 100 como sigue : 0 si 13.4 (RS27u+10.5) < 0 RS27 (escalado) 13.4 (RS27U+10.5) si 0 < 13.4 x (RS27u+10.5) < 100 100 si 13.4 x (RS27u+10.5) > 100 Los pacientes se clasificaron en grupos RS27 bajos, intermedios altos utilizando los puntos de corte pre-especificados definidos en la Tabla 13 a continuación. Estos puntos de corte definieron los límites entre los grupos RS27 bajos e intermedios y entre los grupos RS27. Los puntos de corte se derivaron del estudio de descubrimiento con la intensión de identificar proporciones sustanciales de pacientes quienes en promedio tuvieron riesgo bajo o alto relativamente significativo de patología adversa. El RS27 se redondeó al número entero más cercano antes de que se aplique los puntos de corte que definen los grupos RS27.
Tabla 13 Métodos de Ensayo La parafina de las muestras se removió con sustituto de Xileno Shandon (Thermo Scientific, Kalamazoo, MI) . Los ácidos nucleicos se aislaron utilizando el kit AgencourtMRFormaPureMR XP (Beckman Coulter, Beverly, MA) .
La cantidad de ARN se determinó utilizado el kit de ensayo de ARN Quant-iTMR RiboGreenMR ( InvitrogenMR, Carlsbad, CA) . El ARN cuantificado se convirtió a ADN complementario utilizando el kit OmniscriptMR (Qiagen, Valencia, CA) y se combinó con los cebadores inversos para los 12 genes de RS27 y 5 genes de normalización (ARF1, ATP5E, CLTC, GPS1, PGK1) como se muestra en la Tabla A. La reacción se incubó a 37°C durante 60 minutos y luego se inactivo a 93 °C durante 5 minutos .
El ADNc se pre-amplificó utilizando una mezcla maestra TaqManR PreAmp a la medida heca para Genomic Health, Inc. by Life Technologies (Carlsbad, CA) y los cebadores delanteros e inversos para todos los objetivos como se muestra en la Tabla A. La reacción se colocó en un termociclador (DNA EngineMR PTC 200G, Bio-Rad, Hercules, CA) y se incubó bajo las siguientes condiciones: A) 95°C durante 15 seg; B) 60°C durante 4 min; C) 95°C durante 15 seg; y D) las etapas B y C se repitieron 8 veces. El producto amplificado luego se mezcló con los cebadores delanteros e inversos y las sondas para cada uno de los objetivo como se muestra en la Tabla A y la mezcla maestra de Ensayo de Cebador QuantiTectMR (Qiagen, Valencia, CA) y se amplificó para 45 ciclos en LightCyclerMR 480 (Roche Applied Science, Indianapolis , IN) . El nivel de expresión se calculó utilizando el método de punto de cruce. (Cp) . Resultados RS27 predijo significativamente la patología adversa, de enfermedad confinada no a órganos, enfermedad de grado alto, y enfermedad de grado alto o confinada no a órganos, y agrega valor más allá del registro de Gleason como se muestra en las Tablas 14, 15, 16, y 17, respectivamente.
Tabla 14 Predicción de la Patología Adversa Los resultados obtenidos del modelo logístico multinominal multivariable para las células 2, 3, 4, 5, y 6 vs 1 en la Tabla 12.
DF = grados de libertad Tabla 15 Predicción de la Enfermedad Confinada no a Órganos Los resultados obtenidos de los modelos de regresión logística binaria unívariable y multivariable para las células 2, 4, 6 vs. 1, 3, 5 en la Tabla 12 Relación de probabilidades para RS27 fue por 20 de incremento unitario Tabla 16 predicción de la enfermedad de alto grado Modelos de regresión logística binaria unívariable multivariable para las células 5, 6 vs . 1-4 en la Tabla 12 Relación de probabilidades para RS27 fue por 20 de incremento unitario Tabla 17 predicción de la enfermedad de alto grado o confinada no a órganos *Resultados obtenidos de los modelos de regresión logística binarios no variables y multivariables para células 2, 4, 5, 6 vs. 1, 3 en la Tabla 12 Relación de probabilidades para RS17 fue por 20 de incremento unitario Además, el RS27 predijo la patología adversa más allá de los factores de tratamiento clínicos/patológicos convencionales como se muestra en la Tabla 18.
Tabla 18 Predicción de la Patología Adversa más Allá de los Factores de Tratamiento Clínicos/de Patología Convencionales Cuando se agregan a herramientas clínicas/patológicas convencionales tal como CAPRA, el RS27 refino adicionalmente el riesgo de enfermedad de alto grado o confinada no a órganos. Utilizando el CAPRA solo, 5% de los pacientes se identificaron por tener mayor que 85% probabilidades de estar libres de enfermedad de alto grado o confinada no a órganos comparados con 22% de pacientes identificados por estar libres de enfermedad de alto grado o confinada no a órganos que utilizan RS27 además de CAPRA (Figura 8) .
Cuando se agregan a herramientas clínicas/patológicas convencionales tal como AUA (D'Amico y colaboradores, JAMA 280:969-974, 1998), el RS27 refina adicionalmente el riesgo de enfermedad de alto grado o confinada no a órganos. Como se muestra en la Figura 9, utilizando el AUA solo, 0% de los pacientes se identifican por tener mayor que 80% de probabilidades de estar libres de enfermedad de alto grado o confinada no a órganos comparados con 27% de pacientes identificados de estar libres de enfermedad de alto grado o confinada no a órganos utilizando GPS además de AUA.
Los genes individuales y los grupos de genes de RS27 también se asociaron con la patología adversa, enfermedad de alto grado, enfermedad confinada no a órganos, y enfermedad de alto grado o confinada no a órganos, en Análisis Univariables como se muestra en las Tablas 19, 20, 21, y 22, respectivamente .
Tabla 19 Asociación de Genes y Grupos de Genes con Patología Adversa, Análisis Univariables Tabla 20 Asociación de Genes y Grupos de Genes con Enfermedad de Alto Grado, Análisis Univariables Tabla 21 Asociación de Genes y Grupos de Genes con Enfermedad Confinada no a Órganos, Análisis Univariable a 22 Asociación de Genes y Grupos de Genes con Enfermedad alto grado o Confinada no a Órganos, Análisis Univariable Ejemplo 5: El RS27 Agrega Valor Más Allá del Estado PTEN/TMPRSS2 -ERG en Predecir la Recurrencia Clínica La mutación PTEN y los genes de fusión TMPRSS2 -ERG se asocian comúnmente con prognosis deficiente de cáncer de próstata. En este punto, RS27 se analizó para determinar si puede proporcionar valor más allá del estado PTEN/T PRSS2 -ERG en predecir la recurrencia clínica.
Los niveles de expresión de fusión PTEN y TMPRSS2 -ERG obtenidos en el estudio de identificación de genes descrito en el Ejemplo 1 anterior y en la publicación de E.U.A. No. 20120028264 se utilizaron para estratificar pacientes en grupos bajos de PTEN y normales de PTEN. El Estado PTEN y TMPRSS2-ERG ("T2-ERG") de los pacientes se encontró como: Tabla 23. Distribución de la expresión de PTEN por el Estado T2-ERG Un punto de corte para "bajo de PTEN" se hizo en <=8.5, que incluyó aproximadamente 13% de pacientes negativos T2-ERG y 28% de los pacientes positivos de T2-ERG. El PTEN normal se definió como >8.5.
Los peligros proporcionados de Cox Univariables se aplicaron para evaluar la asociación entre el estado PTEN y el tiempo a la recurrencia clínica (cR) . La Figura 10 y la Tabla 24 muestran que los pacientes con PTEN bajo tienen un riesgo más alto de recurrencia comparado con los pacientes con PTEN normal .
Tabla 24.
Chi al Cuadrado Valor P HR 95% de CI 12.44 <0.001 0.38 (0.22,0.65) Cuando los pacientes se certificaron adicionalmente en PTEN baj o/T2-ERG negativo ("categoría 0"), PTEN baj o/T2 -ERG positivo ("categoría 1"), PTEN normal/T2 -ERG negativo ("categoría 2"), y PTEN normal/T2-ERG positivo ("categoría 3"), ambas categorías de PTEN bajo tuvieron las tasas de recurrencia más bajas comparados con los pacientes con PTEN normal como se muestra en la Figura 11 y la Tabla 25.
Tabla 25.
Categorías PTEN/T2 -ERG CHISQ VALOR P 95% de CI Cat 1 v 0 0.93 0.34 (0.28,1.55) Cat 2 v 0 11.80 <0.01 (0.12,0.56) Cat 3 v 0 7.05 0.01 (0.16,0.76) Las tablas a continuación resumen los resultados de un modelo multivariable con estado de PTEN/T2 -ERG (Tabla 26) o estado de PTEN (Tabla 27), RS27, y Registro de Gleason de Biopsia (Bx GS) , que muestran que el RS27 agrega valor más allá de los marcadores PTEN y T2-ERG y GS de Biopsia en predecir la recurrencia clínica.
Tabla 26.
Tabla 27.
Tabla A 5 15 5 10 15 5 10 15 Se hace constar que con relación a esta fecha, el mejor método conocido por la solicitante para llevar a la práctica la citada invención, es el que resulta claro de la presente descripción de la invención.

Claims (22)

REIVINDICACIONES Habiéndose descrito la invención como antecede, se reclama como propiedad lo contenido en las siguientes reivindicaciones :
1. Un método para predecir una probabilidad de un resultado clínico para un paciente con cáncer de próstata, caracterizado porque comprende: (a) medir los niveles de transcritos de ARN de los siguientes genes: BGN, C0L1A1, SFRP4 , FLNC, GSN, TPM2 , GSTM2 , FAM13C, KLK2, AZGP1, SRD5A2 , y TPX2 , en una muestra biológica que contiene células cancerosas obtenidas del paciente; (b) normalizar el nivel de los transcritos de ARN para obtener los niveles de expresión génica normalizados; (c) calcular un registro cuantitativo para el paciente, en donde el registro cuantitativo (QS) se calcula como sigue: QS = 0.735 x registro de grupo ECM (Respuesta Estromal) -0.368 x registro de grupo de migración (Organización celular) -0.352 x registro de grupo PSA (Andrógeno) +0.095 x Registro de proliferación (TPX2) , en donde registro de grupo ECM (Respuesta Estromal) = 0.527 x BGN + 0.457 x COL1A1 + 0.156 x SFRP4 registro de grupo de migración (Organización celular) registro de grupo = 0.163 x FLNC + 0.504 x GSN + 0.421 x TPM2 + 0.394 x GSTM2 registro de grupo PSA (Andrógeno) = 0.634 x FAM13C + 1.079 x KLK2 + 0.642 x AZGP1 + 0.997 x de registro de umbral SRD5A2 registro de proliferación (TPX2) = registro de umbral TPX2 , en donde f == S¡ S DSA2 <=.= SRD5A2 Registro de Umbral = i SRD5A2 de otra manera y Í5.0 Si TPX2 < S.O TPX Registro de Umbral = ITPX2 de otra manera , y en donde los símbolos de genes en las ecuaciones representan los niveles de expresión génica normalizados de los transcritos de ARN de los genes respectivos; y (d) predecir la probabilidad de un resultado clínico para el paciente basado en el registro cuantitativo.
2. El método de conformidad con la reivindicación 1, caracterizado porque los niveles de expresión normalizados de BGN, COL1A1, SFRP4 , FLNC, GSN, TPM2 , GSTM2 , FAM13C, KLK2 , AZGP1, SRD5A2 , y TPX2 se normalizan relativos con los niveles de expresión de ARF1, ATP5E, CLTC, GPS1, y PGK1.
3. El método de conformidad con la reivindicación 1, caracterizado porque en el registro cuantitativo se correlaciona con una probabilidad incrementada de un resultado clínico negativo.
4. El método de conformidad con la reivindicación 1, caracterizado porque el resultado clínico es el aumento de cáncer de próstata.
5. El método de conformidad con la reivindicación 1, caracterizado porque el resultado clínico es la reclasificación del cáncer de próstata.
6. El método de conformidad con la reivindicación 1, caracterizado porque el resultado clínico es la recurrencia de cáncer de próstata.
7. El método de conformidad con la reivindicación 1, caracterizado porque el resultado clínico es enfermedad confinada no a órganos.
8. El método de conformidad con la reivindicación 1, caracterizado porque el resultado clínico es patología adversa.
9. El método de conformidad con la reivindicación 1, caracterizado porque la determinación del nivel de los transcritos de ARN incluye la reacción en cadena de la polimerasa cuantitativa.
10. El método de conformidad con la reivindicación 1, caracterizado porque además comprende crear un reporte que resume la probabilidad de un resultado clínico.
11. El método de conformidad con la reivindicación 1, caracterizado porque la muestra biológica que contiene células cancerosas está incrustado en parafina, fija, o es reciente o congelada.
12. El método de conformidad con la reivindicación 1, caracterizado porque además comprende escalar el registro cuantitativo como sigue: Registro cuantitativo (en
13. El método de conformidad con la reivindicación 12, caracterizado porque los niveles de expresión normalizados de BGN, COL1Al, SFRP4 , FLNC, GSN, TPM2 , GSTM2 , FAM13C, KLK2 , AZGP1, SRD5A2 , y TPX2 se normalizan relativos con los niveles de expresión de ARF1, ATP5E, CLTC, GPS1, y PGK1.
14. El método de conformidad con la reivindicación 12, caracterizado porque un incremento en el registro cuantitativo se correlaciona con una probabilidad incrementada de un resultado clínico negativo.
15. El método de conformidad con la reivindicación 12, caracterizado porque el resultado clínico es el aumento de cáncer de próstata.
16. El método de conformidad con la reivindicación 12, caracterizado porque el resultado clínico es la reclasificación de cáncer de próstata.
17. El método de conformidad con la reivindicación 12, caracterizado porque el resultado clínico es la recurrencia de cáncer de próstata.
18. El método de conformidad con la reivindicación 12, caracterizado porque el resultado clínico es enfermedad confinadas no a órganos.
19. El método de conformidad con la reivindicación 12, caracterizado porque el resultado clínico es patología adversa .
20. El método de conformidad con la reivindicación 12, caracterizado porque la determinación de nivel de los transcritos de ARJST incluye reacción en cadena de la polimerasa cuantitativa.
21. El método de conformidad con la reivindicación 12, caracterizado porque además comprende crear un reporte que resume la probabilidad de un resultado clínico.
22. El método de conformidad con la reivindicación 12, caracterizado porque la muestra biológica que contiene células cancerosas está incrustada en parafina, fija, o es reciente o congelada.
MX2014009283A 2012-01-31 2013-01-28 Algoritmo de perfil de expresion genica y prueba para determinar la prognosis de cancer de prostata. MX351626B (es)

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
US201261593106P 2012-01-31 2012-01-31
US201261672679P 2012-07-17 2012-07-17
US201261713734P 2012-10-15 2012-10-15
PCT/US2013/023409 WO2013116144A1 (en) 2012-01-31 2013-01-28 Gene expression profile algorithm and test for determining prognosis of prostate cancer

Publications (2)

Publication Number Publication Date
MX2014009283A true MX2014009283A (es) 2014-09-11
MX351626B MX351626B (es) 2017-10-23

Family

ID=48870540

Family Applications (3)

Application Number Title Priority Date Filing Date
MX2017013491A MX366164B (es) 2012-01-31 2013-01-28 Algoritmo de perfil de expresion genica y prueba para determinar la prognosis de cancer de prostata.
MX2014009283A MX351626B (es) 2012-01-31 2013-01-28 Algoritmo de perfil de expresion genica y prueba para determinar la prognosis de cancer de prostata.
MX2019007814A MX2019007814A (es) 2012-01-31 2014-07-31 Algoritmo de perfil de expresion genica y prueba para determinar la prognosis de cancer de prostata.

Family Applications Before (1)

Application Number Title Priority Date Filing Date
MX2017013491A MX366164B (es) 2012-01-31 2013-01-28 Algoritmo de perfil de expresion genica y prueba para determinar la prognosis de cancer de prostata.

Family Applications After (1)

Application Number Title Priority Date Filing Date
MX2019007814A MX2019007814A (es) 2012-01-31 2014-07-31 Algoritmo de perfil de expresion genica y prueba para determinar la prognosis de cancer de prostata.

Country Status (14)

Country Link
US (3) US8725426B2 (es)
EP (3) EP3739595A3 (es)
JP (3) JP6351112B2 (es)
AU (3) AU2013215448B2 (es)
CA (1) CA2863040C (es)
CO (1) CO7051010A2 (es)
DK (1) DK3179393T3 (es)
ES (1) ES2812105T3 (es)
HK (1) HK1201881A1 (es)
IL (3) IL233709A (es)
MX (3) MX366164B (es)
NZ (2) NZ627887A (es)
SG (3) SG11201404390WA (es)
WO (1) WO2013116144A1 (es)

Families Citing this family (33)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP3739595A3 (en) * 2012-01-31 2021-01-27 Genomic Health, Inc. Gene expression profile algorithm and test for determining prognosis of prostate cancer
GB201322034D0 (en) 2013-12-12 2014-01-29 Almac Diagnostics Ltd Prostate cancer classification
WO2015094854A1 (en) * 2013-12-18 2015-06-25 Pacific Biosciences Inc. Iterative clustering of sequence reads for error correction
CN103695560B (zh) * 2014-01-09 2016-09-14 上海交通大学医学院附属瑞金医院 Ppp1r12a基因在结直肠癌化疗疗效判断和检测试剂盒中的应用
CN112322735A (zh) * 2014-01-16 2021-02-05 启迪公司 用于***癌复发的预后的基因表达面板
US20170016903A1 (en) * 2014-02-28 2017-01-19 The Johns Hopkins University Genes encoding secreted proteins which identify clinically significant prostate cancer
EP3210143B1 (en) 2014-10-24 2020-12-09 Koninklijke Philips N.V. Medical prognosis and prediction of treatment response using multiple cellular signaling pathway activities
CN107077536B (zh) 2014-10-24 2021-09-28 皇家飞利浦有限公司 使用靶基因表达的数学建模评价TGF-β细胞信号传导途径的活性
CA2965408C (en) 2014-10-24 2023-10-24 Koninklijke Philips N.V. Medical prognosis and prediction of treatment response using multiple cellular signaling pathway activities
CN104880565A (zh) * 2015-05-04 2015-09-02 贵州省人民医院 Zfp36***癌预后诊断的检测试剂及其试剂盒
DK3303618T3 (da) * 2015-05-29 2019-12-16 Koninklijke Philips Nv Fremgangsmåder til prognose af prostatacancer
KR20180082328A (ko) * 2015-05-29 2018-07-18 코닌클리케 필립스 엔.브이. 전립선 암 예측 방법
WO2017002943A1 (ja) * 2015-07-01 2017-01-05 学校法人慶應義塾 癌組織の不均一性マーカー及びその使用
US11450409B2 (en) 2015-08-14 2022-09-20 Innosign B.V. Determination of NFkB pathway activity using unique combination of target genes
US11174518B2 (en) 2015-10-05 2021-11-16 Cedars-Sinai Medical Center Method of classifying and diagnosing cancer
EP3405583B1 (en) * 2016-01-20 2024-04-03 Dana-Farber Cancer Institute, Inc. Compositions and methods for screening and identifying clinically aggressive prostate cancer
ES2688213T3 (es) * 2016-07-15 2018-10-31 Proteomedix Ag Método para detectar proteínas en muestras humanas y usos de dichos métodos
WO2018039490A1 (en) 2016-08-24 2018-03-01 Genomedx Biosciences, Inc. Use of genomic signatures to predict responsiveness of patients with prostate cancer to post-operative radiation therapy
US11586674B2 (en) * 2016-12-28 2023-02-21 Khalifa University of Science and Technology Methods and systems for searching
MX2019009027A (es) * 2017-02-13 2020-01-27 Genomic Health Inc Algoritmos y metodos para evaluar criterios de valoracion tardios en cancer de prostata.
CA3055925A1 (en) * 2017-03-09 2018-09-13 Decipher Biosciences, Inc. Subtyping prostate cancer to predict response to hormone therapy
EP3461915A1 (en) 2017-10-02 2019-04-03 Koninklijke Philips N.V. Assessment of jak-stat1/2 cellular signaling pathway activity using mathematical modelling of target gene expression
EP3701532A1 (en) * 2017-10-27 2020-09-02 King Abdullah University Of Science And Technology A graph-based constant-column biclustering device and method for mining growth phenotype data
EP3502279A1 (en) 2017-12-20 2019-06-26 Koninklijke Philips N.V. Assessment of mapk-ap 1 cellular signaling pathway activity using mathematical modelling of target gene expression
EP3502280A1 (en) * 2017-12-21 2019-06-26 Koninklijke Philips N.V. Pre-surgical risk stratification based on pde4d7 expression and pre-surgical clinical variables
JP7471601B2 (ja) * 2018-01-25 2024-04-22 ソルボンヌ ウニベルシテ 分子シグネチャー及び低悪性度前立腺癌の同定のためのその使用
CN112673115A (zh) * 2018-02-22 2021-04-16 液体活检研究有限责任公司 用于***癌检测和治疗的方法
CA3003032A1 (en) * 2018-04-27 2019-10-27 Nanostics Inc. Methods of diagnosing disease using microflow cytometry
CN109001467A (zh) * 2018-07-20 2018-12-14 贵州省人民医院 一种用于***癌的基因联合预后检测试剂及其制备方法
GB201816820D0 (en) * 2018-10-16 2018-11-28 Univ York Diagnostic method
EP3874274B1 (en) 2018-10-31 2024-01-03 Regents of the University of Minnesota Methods for predicting a response to bevacizumab or platinum-based chemotherapy or both in patients with ovarian cancer
AU2020329191A1 (en) 2019-08-12 2022-03-31 Regeneron Pharmaceuticals, Inc. Macrophage stimulating 1 receptor (MST1R) variants and uses thereof
EP3901288A1 (en) * 2020-04-20 2021-10-27 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Multi-gene expression assay for prostate carcinoma

Family Cites Families (65)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB2339200B (en) 1998-06-06 2001-09-12 Genostic Pharma Ltd Genostics
WO1999064627A2 (en) 1998-06-06 1999-12-16 Genostic Pharma Limited Probes used for genetic profiling
AU1853600A (en) 1999-01-06 2000-07-24 Choong-Chin Liew Method for the detection of gene transcripts in blood and uses thereof
FI990382A0 (fi) 1999-02-23 1999-02-23 Arctic Partners Oy Ab Uusi diagnostinen menetelmä
US6960439B2 (en) 1999-06-28 2005-11-01 Source Precision Medicine, Inc. Identification, monitoring and treatment of disease and characterization of biological condition using gene expression profiles
US6692916B2 (en) 1999-06-28 2004-02-17 Source Precision Medicine, Inc. Systems and methods for characterizing a biological condition or agent using precision gene expression profiles
JP2003519491A (ja) 2000-01-13 2003-06-24 ジェネンテック・インコーポレーテッド 新規なstra6ポリペプチド
AU2002214576A1 (en) 2000-10-13 2002-04-22 The Government Of The United States Of America, As Represented By The Secretary, Department Of Health And Human Services Genes related to development of refractory prostate cancer
AU2002251844A1 (en) 2001-02-02 2002-10-03 Corixa Corporation Compositions and methods for the therapy and diagnosis of colon cancer
US20060088823A1 (en) 2001-03-29 2006-04-27 Brian Haab Microarray gene expression profiling in clear cell renal cell carcinoma : prognosis and drug target identification
US20030108963A1 (en) 2001-07-25 2003-06-12 Millennium Pharmaceuticals, Inc. Novel genes, compositions, kit, and methods for identification, assessment, prevention and therapy of prostate cancer
US20100297657A1 (en) 2001-08-02 2010-11-25 The Regents Of The University Of Michigan Expression profile of prostate cancer
WO2003040404A1 (en) 2001-11-09 2003-05-15 Source Precision Medicine, Inc. Identification, monitoring and treatment of disease and characterization of biological condition using gene expression profiles
WO2003050243A2 (en) 2001-12-10 2003-06-19 Millennium Pharmaceuticals Inc. Novel genes encoding colon cancer antigens
US6949342B2 (en) * 2001-12-21 2005-09-27 Whitehead Institute For Biomedical Research Prostate cancer diagnosis and outcome prediction by expression analysis
WO2003076610A2 (fr) 2002-03-14 2003-09-18 Exonhit Therapeutics Sa Variants de kallikrein-2 et kallikrein-3 humaines et leurs utilisations
AUPS187002A0 (en) 2002-04-22 2002-05-30 Queensland University Of Technology Condition-specific molecules and uses therefor
EP1552293A4 (en) 2002-09-10 2006-12-06 Guennadi V Glinskii METHOD FOR SEGREGATION OF GENES AND CLASSIFICATION OF BIOLOGICAL SAMPLES
US7659062B2 (en) 2003-06-03 2010-02-09 The Board of Trustee of the University of Arkansas System Gene expression profiling of uterine serous papillary carcinomas and ovarian serous papillary tumors
DK1644858T3 (da) 2003-07-10 2018-01-22 Genomic Health Inc Funktionel beklædning med mindst et yderlag og en indermembran.
US20070048738A1 (en) 2003-07-14 2007-03-01 Mayo Foundation For Medical Education And Research Methods and compositions for diagnosis, staging and prognosis of prostate cancer
JP2007507204A (ja) 2003-07-29 2007-03-29 ブリストル−マイヤーズ スクイブ カンパニー サイクリン依存性キナーゼモデュレーションのバイオマーカー
WO2005076005A2 (en) 2004-01-30 2005-08-18 Medizinische Universität Wien A method for classifying a tumor cell sample based upon differential expression of at least two genes
JP2005211023A (ja) 2004-01-30 2005-08-11 Hayashibara Biochem Lab Inc 腎細胞癌の転移若しくは再発の可能性を予測する方法
EP2163650B1 (en) 2004-04-09 2015-08-05 Genomic Health, Inc. Gene expression markers for predicting response to chemotherapy
US20070224596A1 (en) 2004-04-09 2007-09-27 Mariana Nacht Compositions and methods for the modifying hypoxia induced gene regulation
WO2005113816A2 (en) 2004-05-07 2005-12-01 Henry M. Jackson Foundation For The Advancement Of Military Medicine Methods of diagnosing or treating prostate cancer using the erg gene, alone or in combination with other over or under expressed genes in prostate cancer
CN101023185A (zh) 2004-05-27 2007-08-22 威特克斯医药股份有限公司 用于监测impdh通路抑制作用的生物学标记
US7587279B2 (en) 2004-07-06 2009-09-08 Genomic Health Method for quantitative PCR data analysis system (QDAS)
JP2008509673A (ja) 2004-08-13 2008-04-03 ミレニアム ファーマシューティカルズ, インコーポレイテッド ヒト前立腺癌の同定、評価、予防および治療のための遺伝子、組成物、キットおよび方法
WO2006091776A2 (en) 2005-02-25 2006-08-31 The Brigham And Women's Hospital, Inc. Biomarkers for predicting prostate cancer progression
WO2006110264A2 (en) 2005-03-16 2006-10-19 Sidney Kimmel Cancer Center Methods and compositions for predicting death from cancer and prostate cancer survival using gene expression signatures
WO2006124836A1 (en) 2005-05-13 2006-11-23 Duke University Gene expression signatures for oncogenic pathway deregulation
EP1899486A4 (en) 2005-06-08 2009-07-22 Millennium Pharm Inc METHOD FOR IDENTIFYING, ASSESSING AND TREATING PATIENTS IN CANCER THERAPY
US20070099209A1 (en) 2005-06-13 2007-05-03 The Regents Of The University Of Michigan Compositions and methods for treating and diagnosing cancer
WO2006138275A2 (en) 2005-06-13 2006-12-28 The Regents Of The University Of Michigan Compositions and methods for treating and diagnosing cancer
AU2006287175A1 (en) 2005-09-01 2007-03-08 Precision Therapeutics, Inc. Chemo-sensitivity assays using tumor cells exhibiting persistent phenotypic characteristics
JP5512125B2 (ja) 2005-09-12 2014-06-04 ザ リージェンツ オブ ザ ユニバーシティ オブ ミシガン 前立腺癌における再発性遺伝子融合
US8445198B2 (en) 2005-12-01 2013-05-21 Medical Prognosis Institute Methods, kits and devices for identifying biomarkers of treatment response and use thereof to predict treatment efficacy
WO2007072225A2 (en) 2005-12-01 2007-06-28 Medical Prognosis Institute Methods and devices for identifying biomarkers of treatment response and use thereof to predict treatment efficacy
US20090215054A1 (en) 2005-12-13 2009-08-27 Carter Scott L Prognosis indicators for solid human tumors
EP2412822A1 (en) 2006-01-11 2012-02-01 Genomic Health, Inc. Gene expression markers for colorectal cancer prognosis
ES2300176B1 (es) 2006-02-15 2009-05-01 Consejo Superior Investig. Cientificas Metodo para el diagnostico molecular de cancer de prostata, kit para implementar el metodo.
US7914988B1 (en) * 2006-03-31 2011-03-29 Illumina, Inc. Gene expression profiles to predict relapse of prostate cancer
WO2007123772A2 (en) 2006-03-31 2007-11-01 Genomic Health, Inc. Genes involved in estrogen metabolism
EP2029020A4 (en) 2006-06-22 2010-04-21 Wisconsin Alumni Res Found USE OF STROMA COLLAGEN IN THE DIAGNOSIS AND CHARACTERIZATION OF BREAST CANCER
WO2008067065A2 (en) 2006-10-19 2008-06-05 Shiv Srivastava Methods, kits, and systems for diagnosing and prognosing prostate cancer using secreted biomarkers
EP2074422A4 (en) * 2006-11-13 2010-02-17 Life Technologies Corp METHOD AND KITS FOR DETECTING PROSTATE CANCER BIOMARKERS
EP2140020A2 (en) 2007-03-15 2010-01-06 Genomic Health, Inc. Gene expression markers for prediction of patient response to chemotherapy
US8835480B2 (en) * 2007-04-23 2014-09-16 California Institute Of Technology Inhibitors for steroid response elements and related methods
US20090123439A1 (en) 2007-11-09 2009-05-14 The Jackson Laboratory Diagnostic and prognosis methods for cancer stem cells
US8067178B2 (en) 2008-03-14 2011-11-29 Genomic Health, Inc. Gene expression markers for prediction of patient response to chemotherapy
EP2806054A1 (en) * 2008-05-28 2014-11-26 Genomedx Biosciences Inc. Systems and methods for expression-based discrimination of distinct clinical disease states in prostate cancer
US20090298082A1 (en) * 2008-05-30 2009-12-03 Klee George G Biomarker panels for predicting prostate cancer outcomes
CN102159727A (zh) 2008-07-16 2011-08-17 达纳-法伯癌症研究院有限公司 与***癌有关的信号和胆碱磷酸决定子以及它们的使用方法
US20110230361A1 (en) 2008-11-14 2011-09-22 Emory University Prostate cancer biomarkers to predict recurrence and metastatic potential
EP2370813A4 (en) 2008-12-04 2012-05-23 Univ California MATERIALS AND METHODS FOR DIAGNOSIS AND PROGNOSIS OF PROSTATE CANCER
EP2382331B1 (en) 2009-01-07 2016-06-08 Myriad Genetics, Inc. Cancer biomarkers
US8765383B2 (en) 2009-04-07 2014-07-01 Genomic Health, Inc. Methods of predicting cancer risk using gene expression in premalignant tissue
US20100303795A1 (en) 2009-05-27 2010-12-02 Soerensen Karina Dalsgaard Marker of prostate cancer
AU2010270227B2 (en) 2009-07-08 2015-01-22 Worldwide Innovative Network Method for predicting efficacy of drugs in a patient
EP2504451B1 (en) 2009-11-23 2019-06-05 Genomic Health, Inc. Methods to predict clinical outcome of cancer
SG181806A1 (en) 2010-01-11 2012-07-30 Genomic Health Inc Method to use gene expression to determine likelihood of clinical outcome of renal cancer
ES2741745T3 (es) 2010-07-27 2020-02-12 Genomic Health Inc Método para usar la expresión génica para determinar el pronóstico de cáncer de próstata
EP3739595A3 (en) * 2012-01-31 2021-01-27 Genomic Health, Inc. Gene expression profile algorithm and test for determining prognosis of prostate cancer

Also Published As

Publication number Publication date
MX2019007814A (es) 2019-09-05
AU2018201688A1 (en) 2018-04-05
AU2013215448B2 (en) 2018-01-04
IL233709A0 (en) 2014-09-30
AU2013215448A1 (en) 2014-08-21
NZ722902A (en) 2017-12-22
EP2809812A4 (en) 2016-01-27
IL262648B (en) 2020-07-30
DK3179393T3 (da) 2020-07-27
CO7051010A2 (es) 2014-09-10
CA2863040C (en) 2022-04-19
IL254255A0 (en) 2017-10-31
AU2020202164B2 (en) 2022-02-10
ES2812105T3 (es) 2021-03-16
EP2809812A1 (en) 2014-12-10
EP3179393B1 (en) 2020-07-08
JP6908571B2 (ja) 2021-07-28
IL233709A (en) 2017-09-28
AU2020202164A1 (en) 2020-04-16
JP2017113008A (ja) 2017-06-29
SG10201605210PA (en) 2016-08-30
MX366164B (es) 2019-07-01
MX351626B (es) 2017-10-23
JP2015511814A (ja) 2015-04-23
SG10201912312YA (en) 2020-02-27
CA2863040A1 (en) 2013-08-08
SG11201404390WA (en) 2014-08-28
US8725426B2 (en) 2014-05-13
US20140303002A1 (en) 2014-10-09
EP3739595A3 (en) 2021-01-27
WO2013116144A1 (en) 2013-08-08
EP3179393A3 (en) 2017-09-13
IL262648A (en) 2018-12-31
IL254255B (en) 2018-11-29
EP3179393A2 (en) 2017-06-14
US11011252B1 (en) 2021-05-18
AU2018201688B2 (en) 2020-02-27
JP6351112B2 (ja) 2018-07-04
US20130196321A1 (en) 2013-08-01
JP2019013255A (ja) 2019-01-31
EP3739595A2 (en) 2020-11-18
NZ627887A (en) 2016-08-26
HK1201881A1 (en) 2015-09-11

Similar Documents

Publication Publication Date Title
JP6908571B2 (ja) 前立腺癌の予後を定量化するための遺伝子発現プロフィールアルゴリズムおよび試験
JP6246845B2 (ja) 遺伝子発現を用いた前立腺癌の予後を定量化する方法
KR101530689B1 (ko) 직장결장암용 예후 예측
JP6404304B2 (ja) メラノーマ癌の予後予測
CA3049844C (en) Algorithms and methods for assessing late clinical endpoints in prostate cancer
AU2017268510A1 (en) Method for using gene expression to determine prognosis of prostate cancer

Legal Events

Date Code Title Description
FG Grant or registration