ES2494843T3 - Métodos y materiales para identificar el origen de un carcinoma de origen primario desconocido - Google Patents

Métodos y materiales para identificar el origen de un carcinoma de origen primario desconocido Download PDF

Info

Publication number
ES2494843T3
ES2494843T3 ES06814892.3T ES06814892T ES2494843T3 ES 2494843 T3 ES2494843 T3 ES 2494843T3 ES 06814892 T ES06814892 T ES 06814892T ES 2494843 T3 ES2494843 T3 ES 2494843T3
Authority
ES
Spain
Prior art keywords
origin
markers
gene
tissue
human
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
ES06814892.3T
Other languages
English (en)
Inventor
Yixin Wang
Abhijit Mazumder
Dmitri Talantov
Timothy Jatkoe
Jonathan Baden
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Janssen Diagnostics LLC
Original Assignee
Janssen Diagnostics LLC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Janssen Diagnostics LLC filed Critical Janssen Diagnostics LLC
Application granted granted Critical
Publication of ES2494843T3 publication Critical patent/ES2494843T3/es
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/50Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
    • G01N33/53Immunoassay; Biospecific binding assay; Materials therefor
    • G01N33/574Immunoassay; Biospecific binding assay; Materials therefor for cancer
    • G01N33/57484Immunoassay; Biospecific binding assay; Materials therefor for cancer involving compounds serving as markers for tumor, cancer, neoplasia, e.g. cellular determinants, receptors, heat shock/stress proteins, A-protein, oligosaccharides, metabolites
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6883Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
    • C12Q1/6886Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material for cancer
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/50Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
    • G01N33/5005Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing involving human or animal cells
    • G01N33/5091Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing involving human or animal cells for testing the pathological state of an organism
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/112Disease subtyping, staging or classification
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/158Expression markers
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H10/00ICT specially adapted for the handling or processing of patient-related medical or healthcare data
    • G16H10/40ICT specially adapted for the handling or processing of patient-related medical or healthcare data for data related to laboratory analysis, e.g. patient specimen analysis
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02ATECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
    • Y02A90/00Technologies having an indirect contribution to adaptation to climate change
    • Y02A90/10Information and communication technologies [ICT] supporting adaptation to climate change, e.g. for weather forecasting or climate simulation

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Immunology (AREA)
  • Engineering & Computer Science (AREA)
  • Molecular Biology (AREA)
  • Pathology (AREA)
  • Analytical Chemistry (AREA)
  • Biomedical Technology (AREA)
  • Hematology (AREA)
  • Urology & Nephrology (AREA)
  • Physics & Mathematics (AREA)
  • General Health & Medical Sciences (AREA)
  • Biotechnology (AREA)
  • Organic Chemistry (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Microbiology (AREA)
  • Cell Biology (AREA)
  • Biochemistry (AREA)
  • Genetics & Genomics (AREA)
  • Wood Science & Technology (AREA)
  • Hospice & Palliative Care (AREA)
  • Oncology (AREA)
  • Medicinal Chemistry (AREA)
  • Zoology (AREA)
  • Food Science & Technology (AREA)
  • General Physics & Mathematics (AREA)
  • Biophysics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Engineering & Computer Science (AREA)
  • Physiology (AREA)
  • Tropical Medicine & Parasitology (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Investigating Or Analysing Biological Materials (AREA)
  • Apparatus Associated With Microorganisms And Enzymes (AREA)

Abstract

Método de identificación del origen de una metástasis de origen desconocido que comprende las etapas de a. medir los Biomarcadores asociados con tres carcinomas diferentes en una muestra que contiene células metastásicas, en el que los Biomarcadores son los niveles de expresión de genes Marcadores y en el que los genes Marcadores están seleccionados de entre: i. SP-B, TTF y DSG3, que son marcadores para el cáncer de pulmón; ii. F5 y PSCA, que son marcadores para el cáncer de páncreas; y iii. CDH17, que es un marcador para el cáncer de colon; b. combinar los datos de los Biomarcadores en un algoritmo en el que el algoritmo i. normaliza los Biomarcadores frente a una referencia; e ii. impone un punto de corte que optimiza la sensibilidad y la especificidad de cada Biomarcador, pondera la prevalencia de los carcinomas y selecciona un tejido de origen; c. determinar el origen en base a la probabilidad más alta determinada por el algoritmo o determinar que el carcinoma no se deriva de un conjunto concreto de carcinomas; y d. opcionalmente medir los Biomarcadores específicos para uno o más carcinomas diferentes adicionales, y repetir las etapas c) y d) para los Biomarcadores adicionales.

Description

CAMPO DE LA INVENCIÓN
La presente invención proporciona métodos, usos de kits, etc. para identificar el origen de un carcinoma de origen primario desconocido.
ANTECEDENTES DE LA INVENCIÓN
El carcinoma de origen primario desconocido (CUP) es un conjunto de neoplasias heterogéneas, confirmadas por biopsia, en las que la enfermedad metastásica se presenta sin un tejido de origen (ToO) o sitio del tumor primario identificable. Este problema representa aproximadamente el 3%-5% de todos los cánceres, por lo que es la séptima neoplasia más común. Ghosh et al. (2005); y Mintzer et al. (2004). El pronóstico y régimen terapéutico de los pacientes dependen del origen del tumor primario, lo que recalca la necesidad de identificar el sitio del tumor primario. Greco et al. (2004); Lembersky et al. (1996); y Schlag et al. (1994).
Actualmente se utilizan diversos métodos para resolver este problema. En las figuras 1-2 se esquematizan varios métodos seguidos. Pueden utilizarse Marcadores tumorales séricos para el diagnóstico diferencial. Aunque carecen de especificidad adecuada, pueden utilizarse en combinación con la información clínica y patológica. Ghosh et al. (2005). Pueden utilizarse métodos de inmunohistoquímica (IHC) para identificar el linaje del tumor, pero muy pocos Marcadores IHC son específicos al 100%. Por lo tanto, los patólogos suelen utilizar un panel de Marcadores IHC. Varios estudios han demostrado precisiones del 66%-88% utilizando de cuatro a 14 Marcadores IHC. Brown et al. (1997); DeYoung et al. (2000); y Dennis et al. (2005a). Las pruebas diagnósticas más caras incluyen métodos de formación de imágenes tales como la radiografía de tórax, la tomografía computarizada (CT) y la tomografía de emisión de positrones (PET). Cada uno de estos métodos puede identificar el primario en un 30% a 50% de los casos. Ghosh et al. (2005); y Pavlidis et al. (2003). A pesar de estas sofisticadas tecnologías, la capacidad para resolver los casos de CUP es sólo del 20%-30% ante mortem. Pavlidis et al. (2003); y Varadhachary et al. (2004).
Un nuevo enfoque prometedor reside en la capacidad de determinar perfiles de expresión génica de todo el genoma para identificar el origen de los tumores. Ma et al. (2006); Dennis et al. (2005b); Su et al. (2001); Ramaswamy et al. (2001); Bloom et al. (2004); Giordano et al. (2001); y el documento 20060094035. Estos estudios demostraron la viabilidad de la identificación del tejido de origen en base al perfil de expresión génica. Para que estas tecnologías de determinación de perfiles de expresión sean útiles en la práctica clínica, deben superarse dos obstáculos principales. En primer lugar, puesto que la determinación de perfiles de expresión génica se lleva a cabo totalmente en tejidos primarios, los marcadores génicos candidatos deben validarse en los tejidos metastásicos para confirmar que su expresión específica de tejido se conserva en la metástasis. En segundo lugar, la tecnología de determinación de perfiles de expresión génica debe ser capaz de utilizar tejido fijado en formalina e incluido en parafina (FFPE), ya que las muestras de tejidos fijados son el material convencional en la práctica actual. La fijación en formalina da como resultado la degradación del ARN (Lewis et al. (2001); y Masuda et al. (1999)) por lo que los protocolos de micromatrices existentes no funcionarán con la misma fiabilidad. Bibikova et al. (2004). Además, la tecnología de determinación de perfiles debe ser robusta, reproducible y fácilmente accesible.
Se ha demostrado que la RTPCR cuantitativa (qRTPCR) genera resultados fiables a partir de tejido FFPE. Abrahamsen et al. (2003); Specht et al. (2001); Godfrey et al. (2000); y Cronin et al. (2004). Por lo tanto, un enfoque más práctico sería utilizar un método pangenómico como herramienta de descubrimiento y desarrollar un ensayo de diagnóstico en base a una tecnología más robusta. Ramaswamy (2004). Sin embargo, este paradigma requiere un conjunto de genes más pequeño para su desarrollo. Oien y colaboradores utilizaron el análisis en serie de la expresión génica (SAGE) para identificar 61 Marcadores tumorales a partir de los que desarrollaron un método RTPCR en base a once genes para cinco tipos de tumores. Dennis et al. (2002). Otro estudio que acoplaba SAGE y qRTPCR desarrolló un panel de cinco genes para cuatro tipos de tumores y consiguió una exactitud del 81%. Buckhaults et al. (2003). Un estudio más reciente acoplaba la determinación de perfiles mediante micromatrices con qRTPCR, pero utilizaba 79 Marcadores. Tothill et al. (2005).
RESUMEN DE LA INVENCIÓN
La presente invención proporciona un método de identificación del origen de una metástasis de origen desconocido como se define en las reivindicaciones.
BREVE DESCRIPCIÓN DE LOS DIBUJOS
Las figuras 1-2 representan los métodos de la técnica anterior de identificación del origen de una metástasis de origen desconocido. La figura 3 representa el presente algoritmo de diagnóstico de CUP.
La figura 4 representa los datos de micromatriz que muestran las intensidades de dos genes en un panel de tejidos. (A) Antígeno de células madre de próstata (PSCA). (B) Factor de coagulación V (F5). Los gráficos de barras muestran la intensidad en el eje Y, y el tejido en el eje X. Panc Ca, cáncer de páncreas; Panc N, páncreas normal. La figura 5 representa los electroferogramas obtenidos a partir de un Agilent Bioanalyzer. Se aisló el ARN a partir de tejido FFPE mediante digestión con proteinasa K durante tres horas (A) o dieciséis horas (B). La muestra C22 (rojo) era un bloque de un año, mientras que la muestra C23 (azul) era un bloque de cinco años. En verde se muestra un marcador de tamaño. La figura 6 representa una comparación de los valores de Ct obtenidos a partir de tres métodos de qRTPCR diferentes: cebado con hexámeros aleatorios en la transcripción inversa seguido de qPCR con el ADNc resultante (etapa RH 2), cebado específico de gen (cebador inverso) en la transcripción inversa seguido de qPCR con el ADNc resultante (etapa SPG 2) o cebado específico de gen y qRTPCR en una reacción de una sola etapa (etapa GSP 1). Se dividió ARN de once muestras en los tres métodos y se midieron los niveles de ARN de tres genes: β-actina (A), HUMSPB (B) y TTF (C). La mediana del valor de Ct obtenida con cada método se indica mediante la línea continua. La figura 7 representa los diagramas de placas del ensayo de CUP. La figura 8 es una serie de gráficos que representan el rendimiento del ensayo a lo largo de un intervalo de concentraciones de ARN. La figura 9 es un diagrama de flujo de trabajo experimental: designación y validación de Marcadores candidatos (9A); y optimización del ensayo y construcción y ensayo del algoritmo de predicción (9B). La figura 10 representa la expresión de 10 Marcadores génicos candidatos específicos de tejido seleccionados en adenocarcinoma primario de próstata y carcinomas metastásicos FFPE. Para cada gráfico el eje X representa el valor de expresión de Marcador normalizado. La figura 11 representa la optimización del ensayo. (A y B) Electroferogramas obtenidos de un Agilent Bioanalyzer. Se aisló el ARN a partir de tejido FFPE mediante digestión con proteinasa K durante tres horas (A) o dieciséis horas (B). La muestra C22 (rojo) era un bloque de un año, mientras que la muestra C23 (azul) era un bloque de cinco años. En verde se muestra un marcador de tamaño. (C y D) Comparación de los valores de Ct obtenidos a partir de tres métodos de qRTPCR diferentes: cebado con hexámeros aleatorios en la transcripción inversa seguido de qPCR con el ADNc resultante (etapa RH 2), cebado específico de gen (cebador inverso) en la transcripción inversa seguido de qPCR con el ADNc resultante (etapa SPG 2) o cebado específico de gen y qRTPCR en una reacción de una sola etapa (GSP 1 etapa). Se dividió ARN de once muestras en los tres métodos y se midieron los niveles de ARN para dos genes: β-actina (C), HUMSPB (D). La mediana del valor de Ct obtenida con cada método se indica mediante la línea continua. La figura 12 es un mapa de calor que muestra los niveles relativos de expresión del panel de 10 Marcadores en 239 muestras. El color rojo indica mayor expresión.
DESCRIPCIÓN DETALLADA
La identificación del sito primario en pacientes con carcinoma metastásico de origen primario desconocido (CUP) puede permitir la aplicación de regímenes terapéuticos específicos y puede prolongar la supervivencia. Se validaron Marcadores candidatos mediante reacción en cadena de la polimerasa con transcriptasa inversa (RT-PCR) en 205 carcinomas metastásicos FFPE procedentes de estos seis tejidos, así como metástasis procedentes de otros tipos de cáncer para determinar la especificidad. Se seleccionó una firma genética de diez genes que predijo el tejido de origen de los carcinomas metastásicos para estos seis tipos de cáncer. A continuación, se optimizaron los métodos de qRTPCR y aislamiento de ARN para estos diez Marcadores, y se aplicó el ensayo qRTPCR a un conjunto de 260 tumores metastásicos, generando una exactitud global del 78%. Por último, se ensayó un conjunto independiente de 48 muestras metastásicas. Es importante señalar que treinta y siete muestras en este conjunto tenían un primario conocido o inicialmente presentado como CUP, pero se resolvieron posteriormente, y el ensayo demostró una precisión del 78%.
Un Biomarcador es cualquier indicio del nivel de expresión de un gen Marcador indicado. Los indicios pueden ser directos o indirectos y medir la sobreexpresión o subexpresión del gen dados los parámetros fisiológicos y en comparación con un control interno, el tejido normal u otro carcinoma. Los Biomarcadores incluyen, sin limitación, los ácidos nucleicos (sobreexpresión y subexpresión y directo e indirecto). El uso de ácidos nucleicos como Biomarcadores puede incluir cualquier método conocido en la técnica, incluidos, sin limitación, la medición de la amplificación de ADN, ARN, micro ARN, la pérdida de heterocigosidad (LOH), los polimorfismos de nucleótido único (SNPs, Brookes (1999)), ADN microsatélite, hipometilación o hipermetilación de ADN. El uso de proteínas como Biomarcadores incluye cualquier método conocido en la técnica, incluidos, sin limitación, la medición de la cantidad, la actividad, modificaciones tales como glicosilación, fosforilación, ribosilación de ADP, ubiquitinación, etc.,
o inmunohistoquímica (IHC). Otros Biomarcadores incluyen formación de imágenes, recuento celular y Marcadores de apoptosis.
Los genes indicados proporcionados en el presente documento son los asociados con un tipo de tejido o tumor concreto. Un gen Marcador puede asociarse con numerosos tipos de cáncer, pero siempre que la expresión del gen esté lo suficientemente asociada con un tipo de tejido o tumor a identificar utilizando el algoritmo descrito en el presente documento para que sea específico para un origen concreto, puede utilizarse el gen en la invención
reivindicada para determinar el tejido de origen para un carcinoma de origen primario desconocido (CUP). En la técnica se conocen numerosos genes asociados con uno o más tipos de cáncer. La presente invención proporciona genes Marcadores preferentes y combinaciones de genes Marcadores aún más preferentes tal como se define en las reivindicaciones. Estas se describen detalladamente en el presente documento.
"Origen" en la expresión “tejido de origen” se refiere al tipo de tejido (pulmón, colon, etc.) o al tipo
histológico (adenocarcinoma, carcinoma de células escamosas, etc.) en función de las circunstancias médicas
concretas y será entendido por cualquier experto en la materia.
Un gen Marcador corresponde a la secuencia indicada mediante una SEQ ID NO cuando contiene esa secuencia. Un fragmento o segmento génico corresponde a la secuencia de tal gen cuando contiene una porción de la secuencia referenciada o su complemento suficiente para distinguirla como la secuencia del gen. Un producto de expresión génica corresponde a tal secuencia cuando su ARN, ARNm o ADNc hibrida con la composición que tiene tal secuencia (por ejemplo, una sonda) o, en el caso de un péptido o proteína, que está codificada por tal ARNm. Un
15 segmento o fragmento de un producto de expresión génica corresponde a la secuencia de tal gen o producto de expresión génica cuando contiene una porción del producto de expresión génica referenciado o su complemento suficiente para distinguirlo como la secuencia del gen o producto de expresión génica.
Los métodos y usos de la invención incluyen uno o más genes Marcadores como se define en las reivindicaciones. "Marcador" o "gen Marcador" se utiliza a lo lago de la presente memoria para referirse a los genes y productos de expresión génica que se corresponden con cualquier gen cuya sobreexpresión o subexpresión esté asociada con un tipo de tejido o tumor. Los genes Marcadores preferentes se describen más detalladamente en la Tabla 1.
Tabla 1
La presente invención proporciona un método de identificación del origen de una metástasis de origen desconocido tal como se define en las reivindicaciones.
Los genes Marcadores se seleccionan de entre i) SP-B, TTF y DSG3, ii) F5 y PSCA o iii) CDH17. Preferentemente, los genes Marcadores son SP-B, TTF, DSG3, KRT6F, p73H y/o SFTPC. Más preferentemente, los genes Marcadores son SP-B, TTF y/o DSG3. Los genes Marcadores adicionalmente pueden incluir o ser reemplazados por KRT6F, p73H y/o SFTPC.
En una forma de realización, los genes Marcadores son F5, PSCA, ITGB6, KLK10, CLDN18, TR10 y/o FKBP10. Más preferentemente, los genes Marcadores son F5 y/o PSCA. Preferentemente, los genes Marcadores pueden incluir o ser reemplazados por ITGB6, KLK10, CLDN18, TR10 y/o FKBP10.
En otra forma de realización, los genes Marcadores son CDH17, CDX1 y/o FABP1, preferentemente, CDH17. Los genes Marcadores adicionalmente pueden incluir o ser reemplazados por CDX1 y/o FABP1.
En una forma de realización, la expresión génica se mide utilizando al menos una de las SEQ ID NO: 11-58.
La presente descripción también abarca métodos que miden la expresión génica obteniendo y midiendo la formación de al menos uno de los amplicones SEQ ID NO: 14, 18, 22, 26, 30, 34, 38, 42, 46, 50, 54 y/o 58.
En una forma de realización, los genes Marcadores puede seleccionarse de un Marcador específico de género seleccionado de al menos uno de entre: i) en el caso de un paciente masculino KLK3, KLK2, NGEP o NPY; o ii) en el caso de una paciente femenina PDEF, MGB, PIP, B305D, B726 o GABA-Pi; y/o WT1, PAX8, STAR o EMX2. Preferentemente, el gen Marcador es KLK2 o KLK3. En esta forma de realización, los genes Marcadores pueden incluir o ser reemplazados por NGEP y/o NPY. En una forma de realización, los genes Marcadores son PDEF, MGB, PIP, B305D, B726 o GABA-Pi, preferentemente, PDEF y MGB. En esta forma de realización, los genes Marcadores pueden incluir o ser reemplazados por PIP, B305D, B726 o GABA-Pi. En una forma de realización, los genes Marcadores son WT1, PAX8, STAR o EMX2, preferentemente, WT1. En esta forma de realización, los genes Marcadores pueden incluir o ser reemplazados por PAX8, STAR o EMX2.
La presente descripción proporciona métodos para obtener información clínica adicional, incluido el sitio de metástasis para determinar el origen del carcinoma; obtener conjuntos de Biomarcadores óptimos para carcinomas que comprenden las etapas de utilizar metástasis de origen conocido, determinar los Biomarcadores para ello y comparar los Biomarcadores con los Biomarcadores de metástasis de origen desconocido; proporcionar orientación para el tratamiento determinando el origen de una metástasis de origen desconocido e identificar los tratamientos apropiados para ello; y proporcionar un pronóstico determinando el origen de una metástasis de origen desconocido e identificar el pronóstico correspondiente para ello.
La presente descripción proporciona adicionalmente métodos para encontrar Biomarcadores determinando el nivel de expresión de un gen Marcador en una metástasis concreta, medir un Biomarcador para el gen Marcador para determinar la expresión del mismo, analizar la expresión del gen Marcador según cualquiera de los métodos
proporcionados en el presente documento o conocidos en la técnica y determinar si el gen Marcador es realmente específico para el tumor de origen.
La presente invención proporciona adicionalmente el uso de una composición que contiene al menos una secuencia aislada seleccionada de entre las SEQ ID NO: 11-58 en los métodos de la invención. La presente invención proporciona adicionalmente el uso de un kit para llevar a cabo un ensayo según los métodos proporcionados en el presente documento que contiene ARN o ADNc que hibrida con los genes Marcadores utilizados en los métodos de la invención.
La presente invención proporciona adicionalmente el uso de micromatrices o matrices génicas para llevar a cabo los métodos descritos en el presente documento.
La presente descripción proporciona adicionalmente carteras de diagnóstico/pronóstico que contienen secuencias aisladas de ácidos nucleicos, sus complementos, o porciones de los mismos de una combinación de genes como se describe en el presente documento, en los que la combinación es suficiente para medir o caracterizar la expresión génica en una muestra biológica con células metastásicas con respecto a células de diferentes carcinomas o tejido normal.
Cualquier método descrito en la presente descripción puede incluir adicionalmente medir la expresión de al menos un gen expresado constitutivamente en la muestra.
Preferentemente, los Marcadores para el cáncer de páncreas son el factor de coagulación V (F5), el antígeno de células madre de próstata (PSCA), la integrina β6 (ITGB6), la calicreína 10 (KLK10), claudina18 (CLDN18), la isoforma trio (TR10) y la proteína hipotética FLJ22041 similar a proteínas de unión a FK506 (FKBP10). Preferentemente, los Biomarcadores para F5 y PSCA se miden conjuntamente. Pueden medirse los Biomarcadores para ITGB6, KLK10, CLDN18, TR10 y FKBP10, además de o en lugar de F5 y/o PSCA. F5 se describe por ejemplo en los documentos 20040076955; 20040005563 y W02004031412. PSCA se describe por ejemplo en los documentos WO1998040403; 20030232350 y W02004063355. ITGB6 se describe, por ejemplo, en los documentos WO2004018999 y 6339148. KLK10 se describe, por ejemplo, en los documentos WO2004077060 y 20030235820. CLDN18 se describe, por ejemplo, en los documentos WO2004063355 y WO2005005601. TR10 se describe por ejemplo en el documento 20020055627. FKBP10 se describe, por ejemplo, en el documento WO2000055320.
Preferentemente, los genes Marcadores del cáncer de colon son el transportador asociado al péptido intestinal HPT-1 (CDH17), el factor de transcripción 1 de la caja homeótica de tipo caudal (CDX1) y la proteína 1 de unión a ácidos grasos (FABP1). Preferentemente, un Biomarcador para CDH17 se mide en solitario. Pueden medirse los Biomarcadores para CDX1 y FABP1, además de, o en lugar de un Biomarcador para CDH17. CDH17 es descrito por ejemplo por Takamura et al. (2004); y en el documento W02004063355. CDX1 es descrito por ejemplo por Pilozzi et al. (2004); en los documentos 20050059008 y 20010029020. FABP1 es descrito por ejemplo por Borchers et al. (1997); Chan et al. (1985); Chen et al. (1986); y Lowe et al. (1985).
Preferentemente, los genes Marcadores para el cáncer de pulmón son la proteína B surfactante (PS-B), el factor de transcripción tiroideo (TTF), la desmogleína 3 (DSG3), la queratina 6 isoforma 6F (KRT6F), el gen relacionado con p53 (p73H) y la proteína C surfactante (SFTPC). Preferentemente, los Biomarcadores para SP-B, TTF y DSG3 se miden conjuntamente. Pueden medirse los Biomarcadores para KRT6F, p73H y SFTPC, además de,
o en lugar de cualquiera de los Biomarcadores para SP-B, TTF y/o DSG3. SP-B es descrito, por ejemplo, por Pilot-Mathias et al. (1989); en los documentos 20030219760 y 20030232350. TTF es descrito, por ejemplo, por Jones et al. (2005); en los documentos US20040219575; WO1998056953; WO2002073204; 20030138793 y WO2004063355. DSG3 es descrito, por ejemplo, por Wan et al. (2003); en los documentos 20030232350; aWO2004030615 y W02002101357. KRT6F es descrito, por ejemplo, por Takahashi et al. (1995); en los documentos 20040146862 y 20040219572. p73H es descrito, por ejemplo, por Senoo et al. (1998); y en el documento 20030138793. SFTPC es descrito, por ejemplo, por Glasser et al. (1988).
Los genes Marcadores pueden seleccionarse adicionalmente de un Marcador específico de género tal como, en el caso de un paciente masculino KLK3, KLK2, NGEP o NPY; o en el caso de una paciente femenina PDEF, MGB, PIP, B305D, B726 o GABA-Pi; y/o WT1, PAX8, STAR o EMX2.
Preferentemente, los genes Marcadores para el cáncer de mama son el factor epitelial derivado de próstata (PDEF), la mamaglobina (MG), la proteína inducible por prolactina (PIP), B305D, B726 y GABA-π. Preferentemente, los Biomarcadores para PDEF y MG se miden conjuntamente. Pueden medirse los Biomarcadores para PIP, B305D, B726 y GABA-Pi, además de, o en lugar de los Biomarcadores para PDEF y/o MG. PDEF es descrito, por ejemplo, en los documentos WO2004030615; WO2000006589; WO2001073032; por Wallace et al. (2005); Feldman et al. (2003); y Oettgen et al. (2000). MG es descrito, por ejemplo, en los documentos W02004030615; 20030124128; por Fleming et al. (2000); Watson et al. (1996 y 1998); y en el documento 5668267. PIP es descrito, por ejemplo, por Autiero et al. (2002); Clark et al. (1999); Myal et al. (1991) y Murphy et al. (1987). B305D, B726 y GABA-Pi son descritos por Reinholz et al. (2005). NGEP es descrito, por ejemplo, por Bera et al. (2004).
Preferentemente, los Marcadores para el cáncer de ovario son el tumor de Wilms 1 (WT1), PAX8, la proteína reguladora aguda esteroidogénica (STAR) y EMX2. Preferentemente, se miden los Biomarcadores para WT1. Pueden medirse los Biomarcadores para STAR y EMX2, además de o en lugar de los Biomarcadores para WT1. WT1 es descrito, por ejemplo en los documentos 5350840; 6232073; 6225051; 20040005563; y por Bentov et al. (2003). PAX8 es descrito, por ejemplo, en el documento 20050037010; por Poleev et al. (1992); Di Palma et al. (2003); Marques et al. (2002); Cheung et al. (2003); Goldstein et al. (2002); Oji et al. (2003); Rauscher et al. (1993); Zapata-Benavides et al. (2002); y Dwight et al. (2003). STAR es descrito, por ejemplo, por Gradi et al. (1995); y Kim et al. (2003). EMX2 es descrito, por ejemplo, por Noonan et al. (2001).
Preferentemente, los Marcadores para el cáncer de próstata son KLK3, KLK2, NGEP y NPY. Preferentemente, se miden los Biomarcadores para KLK3. Pueden medirse los Biomarcadores para KLK2, NGEP y NPY, además de o en lugar de KLK3. KLK2 y KLK3 son descritos, por ejemplo, por Magklara et al. (2002). KLK2 se describe, por ejemplo, en los documentos 20030215835 y 5786148. KLK3 se describe, por ejemplo, en el documento 6261766.
El método también puede incluir obtener información clínica adicional, incluido el sitio de metástasis para determinar el origen del carcinoma. En la figura 3 se proporciona un diagrama de flujo.
La descripción proporciona adicionalmente un método para obtener conjuntos de Biomarcadores óptimos para carcinomas utilizando metástasis de origen conocido, determinar los Biomarcadores para ello y comparar los Biomarcadores con los Biomarcadores de metástasis de origen desconocido.
La descripción proporciona adicionalmente un método para proporcionar orientación para el tratamiento determinando el origen de una metástasis de origen desconocido según los métodos descritos en el presente documento e identificando el tratamiento apropiado para ello.
La descripción proporciona adicionalmente un método para proporcionar un pronóstico determinando el origen de una metástasis de origen desconocido según los métodos descritos en el presente documento e identificando el pronóstico correspondiente para ello.
La descripción proporciona adicionalmente un método para encontrar Biomarcadores que comprende determinar el nivel de expresión de un gen Marcador en una metástasis concreta, medir un Biomarcador para el gen Marcador para determinar la expresión del mismo, analizar la expresión del gen Marcador según los métodos descritos en el presente documento y determinar si el gen Marcador es realmente específico para el tumor de origen.
La invención proporciona adicionalmente el uso de composiciones que comprenden al menos una secuencia aislada seleccionada de entre las SEQ ID NO: 11-58 en los métodos de la invención.
La invención proporciona adicionalmente el uso de kits, micromatrices o matrices génicas para llevar a cabo los ensayos descritos en el presente documento.
Sólo en raras ocasiones se ha descubierto que la mera presencia o ausencia de secuencias concretas de ácidos nucleicos en una muestra de tejido tenga valor diagnóstico o pronóstico. Por otro lado, se considera cada vez más importante la información sobre la expresión de diversas proteínas, péptidos o ARNm. La mera presencia de secuencias de ácidos nucleicos que tengan el potencial de expresar proteínas, péptidos o ARNm (tales secuencias conocidas como "genes") dentro del genoma por sí misma no es determinante de si una proteína, péptido, o ARNm se expresa en una determinada célula. Que un determinado gen capaz de expresar proteínas, péptidos o ARNm, lo haga o no, y en qué medida se produzca tal expresión, en todo caso, viene determinado por diversos factores complejos. Independientemente de las dificultades en la comprensión y la evaluación de estos factores, el ensayo de la expresión génica puede proporcionar información útil sobre la existencia de eventos importantes, tales como la tumorogénesis, la metástasis, la apoptosis, y otros fenómenos clínicamente pertinentes. Los indicios relativos del grado en que los genes son activos o inactivos pueden encontrarse en los perfiles de expresión génica. Los perfiles de expresión génica de la presente invención se utilizan para proporcionar un diagnóstico y para tratar a los pacientes de CUP.
La preparación de la muestra requiere la recogida de muestras de pacientes. Las muestras de pacientes utilizadas en el método de la invención son las que se sospecha contienen células enfermas, tales como células tomadas de un ganglio en una biopsia por aspiración con aguja fina (FNA) de tejido. La preparación de la masa de tejido obtenida de una biopsia o una muestra quirúrgica y la microdisección de captura por láser también son adecuadas para su uso. La tecnología de microdisección de captura por láser (LCM) es una manera de seleccionar las células a estudiar, minimizando la variabilidad debida a la heterogeneidad del tipo de célula. Por consiguiente, pueden detectarse fácilmente cambios moderados o pequeños en la expresión del gen Marcador entre las células normales o benignas y las cancerosas. Las muestras también pueden comprender células epiteliales circulantesextraídas de sangre periférica. Éstas pueden obtenerse según varios métodos, pero el método más preferente es la técnica de separación magnética descrita en el documento 6136182. Una vez se ha obtenido la muestra que
contiene las células de interés, se obtiene un perfil de expresión génica utilizando un Biomarcador, para los genes en las carteras apropiadas.
Los métodos preferentes para establecer los perfiles de expresión génica incluyen determinar la cantidad de ARN que es producido por un gen que puede codificar una proteína o péptido. Esto se logra mediante PCR con transcriptasa inversa (RT-PCR), RT-PCR competitivo, RT-PCR en tiempo real, RT-PCR de presentación diferencial, análisis de Northern Blot y otros ensayos relacionados. Aunque es posible llevar a cabo estas técnicas mediante reacciones de PCR individuales, es mejor amplificar ADN complementario (ADNc) o ARN complementario (ARNc) producido a partir de ARNm y analizarlo mediante micromatrices. Los expertos en la materia conocen varios métodos y configuraciones de matriz diferentes para su producción y se describen, por ejemplo, en los documentos 5445934, 5532128, 5556752, 5242974, 5384261, 5405783, 5412087, 5424186, 5429807, 5436327, 5472672, 5527681, 5529756, 5545531, 5554501, 5561071, 5571639, 5593839, 5599695, 5624711, 5658734 y 5700637.
La tecnología de micromatrices permite medir a nivel del ARNm en estado estacionario de miles de genes simultáneamente, lo que proporciona una poderosa herramienta para la identificación de efectos tales como la aparición, detención o modulación de la proliferación celular incontrolada. Actualmente se encuentra muy extendido el uso de dos tecnologías de micromatrices, las matrices de oligonucleótidos y de ADNc. Aunque existen diferencias en la construcción de estas matrices, esencialmente todas las salidas y análisis de datos de bajada son iguales. El producto de estos análisis son por lo general mediciones de la intensidad de la señal recibida desde una sonda marcada utilizada para detectar una secuencia de ADNc de la muestra que hibrida con una secuencia de ácido nucleico en una ubicación conocida en el micromatriz. Por lo general, la intensidad de la señal es proporcional a la cantidad de ADNc, y por lo tanto de ARNm, expresado en las células de la muestra. Se dispone de un gran número de tales técnicas y resultan útiles. Los métodos preferentes para determinar la expresión génica pueden encontrarse en los documentos 6271002, 6218122, 6218114 y 6004755.
El análisis de los niveles de expresión se lleva a cabo comparando tales intensidades de señal. Esto se realiza mejor generando una matriz de relación de las intensidades de expresión de los genes en una muestra de ensayo frente a las de una muestra de control. Por ejemplo, las intensidades de expresión génica de un tejido enfermo pueden compararse con las intensidades de expresión generadas a partir de tejido benigno o normal del mismo tipo. Una relación de estas intensidades de expresión indica el número de veces que cambia la expresión génica entre las muestras de ensayo y de control.
La selección puede basarse en ensayos estadísticos que producen listas ordenadas relacionadas con la evidencia de significación para la expresión diferencial de cada gen entre los factores relacionados con el sitio de origen original del tumor. Los ejemplos de tales ensayos incluyen ANOVA y Kruskal-Wallis. Las clasificaciones pueden utilizarse como ponderaciones en un modelo diseñado para interpretar la adición total de tales ponderaciones, hasta un punto de corte, como la preponderancia de la evidencia a favor de una clase sobre otra. También puede utilizarse la evidencia anterior como se describe en la literatura para ajustar las ponderaciones.
En la presente invención, se eligieron 10 Marcadores que mostraron evidencia significativa de expresión diferencial entre 6 tipos de tumores. El proceso de selección incluía un grupo ad hoc de ensayos estadísticos, optimización de la media-varianza y el conocimiento de expertos. En una forma de realización alternativa, los métodos de extracción de características podrían automatizarse para seleccionar y ensayar los Marcadores a través de enfoques de aprendizaje supervisado. A medida que crece la base de datos, puede repetirse la selección de Marcadores con el fin de producir la mayor precisión diagnóstica posible en cualquier estado determinado de la base de datos.
Una forma de realización preferente es normalizar cada medición identificando un conjunto de control estable y escalando este conjunto a varianza cero en todas las muestras. Este conjunto de control se define como cualquier transcrito endógeno único o conjunto de transcritos endógenos influidos por el error sistemático en el ensayo, y que no se sepa que cambien independientemente de este error. Todos los Marcadores se ajustan mediante el factor específico de muestra que genera varianza cero para cualquier estadístico descriptivo del conjunto de control, tal como la media o la mediana, o para una medición directa. Como alternativa, si la premisa de variación de los controles relacionados solamente con el error sistemático no es cierta, y sin embargo el error de clasificación resultante es menor cuando se realiza la normalización, el conjunto de control seguirá siendo utilizado como se indica. También podrían ser útiles los controles de adición no endógenos, pero no resultan preferentes.
Después del Marcador de selección, se utilizan estas variables seleccionadas en un clasificador diseñado para producir la mayor precisión de clasificación posible. Puede utilizarse un algoritmo de aprendizaje supervisado diseñado para relacionar un conjunto de medidas de entrada con un conjunto de salida de predictores con el fin de construir un modelo a partir de las 10 entradas para predecir el tejido de origen. El problema puede enunciarse como: los datos de entrenamiento dados {(x1, y),., (xn, y)} producen un clasificador h: X → Y que mapea una muestra x ∈X a su etiqueta de tejido de origen y ∈Y. Las predicciones se basan en los casos resueltos con anterioridad que están contenidos en la base de datos y por lo tanto componen el conjunto de entrenamiento.
El algoritmo de aprendizaje supervisado debe encontrar parámetros basados en las relaciones entre las variables de entrada y las salidas conocidas que minimicen el error de clasificación esperado. A continuación,
pueden utilizarse estos parámetros para predecir el tejido de origen a partir de la entrada de una nueva muestra. Ejemplos de estos algoritmos incluyen modelos lineales de clasificación, clasificadores cuadráticos, métodos basados en árboles, redes neuronales y métodos de prototipo tales como un clasificador de k vecinos más cercanos
o algoritmos de cuantificación de vectores de aprendizaje.
Una forma de realización específica para diseñar los 10 Marcadores normalizados es el método LDA,
LDA puede generalizarse a un análisis discriminante para múltiples clases, donde y tiene N posibles estados, en lugar de sólo dos. Se hace una estimación de las medias y varianzas de clase a partir de los valores contenidos en la base de datos para los Marcadores elegidos. En una forma de realización preferente, la matriz de covarianza se pondera por las probabilidades a priori iguales de cada tipo de tumor sujeta a la siguiente. La predicción en los pacientes masculinos se realiza mediante un modelo en el que las distribuciones de probabilidad a priori son cero para cada grupo de tumores de los órganos reproductores femeninos. Del mismo modo, la predicción en las pacientes femeninas se realiza mediante un modelo en el que las distribuciones de probabilidad a priori son cero para los órganos reproductores masculinos. En la presente invención, las distribuciones de probabilidad a priori son cero para los ensayos en mujeres para próstata y cero para hombres sometidos a ensayo para mama y ovario. Además, las muestras con un antecedente idéntico a una etiqueta de clase se someten a ensayo mediante un modelo en el que la probabilidad a priori es cero para esa etiqueta de clase concreta.
El problema anterior puede verse como una maximización del cociente de Rayleigh manejado como un problema de valor propio generalizado. El subespacio reducido se utiliza en la clasificación calculando la distancia de cada muestra al centroide en el subespacio elegido. El modelo puede ajustarse mediante la máxima verosimilitud, y las probabilidades posteriores se calculan mediante el teorema de Bayes.
Un método alternativo puede incluir encontrar un mapa del espacio de características de dimensión n, donde n es el número de variables utilizadas, a un conjunto de etiquetas de clasificación implicará el reparto del espacio de características en regiones, a continuación, asignar una clasificación a cada región. Las puntuaciones de estos algoritmos de tipo vecinos más cercanos están relacionados con la distancia entre límites de decisión y no se traducen necesariamente en probabilidades de clase.
Si hay demasiadas variables para elegir, y muchas de ellas son ruido aleatorio, la selección de variables y el modelo corren el riesgo de una sobrevaloración del problema. Por lo tanto, suele utilizarse una lista clasificada en diversos puntos de corte como entradas con el fin de limitar el número de variables. También pueden utilizarse algoritmos de búsqueda tal como un algoritmo genético para seleccionar un subconjunto de variables que ensayan una función de coste. Puede intentarse un apareamiento simulado para limitar el riesgo de alcanzar la función de coste en un mínimo local. Sin embargo, estos procedimientos deben validarse con muestras independientes al proceso de selección y modelización.
También pueden utilizarse enfoques de variable latente. Puede utilizarse cualquier algoritmo de aprendizaje no supervisado para hacer una estimación de variedades de baja dimensión a partir de un espacio de alta dimensión para descubrir asociaciones entre las variables de entrada y lo bien que pueden ajustarse a un conjunto menor de variables latentes. Aunque las estimaciones de la eficacia de las reducciones son subjetivas, puede aplicarse un algoritmo supervisado en el conjunto de variables reducido con el fin de hacer una estimación de la precisión de la clasificación. Por lo tanto, un clasificador, que puede construirse a partir de las variables latentes, también puede construirse a partir de un conjunto de variables correlacionadas significativamente con las variables latentes. Un ejemplo de esto podría incluir el uso de variables correlacionadas con los componentes principales, a partir de un análisis de componentes principales, como entradas para cualquier modelo de clasificación supervisada.
Estos algoritmos pueden implementarse en cualquier código de software que tenga métodos para introducir las variables, entrenar las muestras con una función, ensayar una muestra en base al modelo y devolver los resultados a una consola. R, Octave, C, C++, Fortran, Java, Perl y Python tienen bibliotecas disponibles bajo una
licencia de código abierto para realizar muchas de las funciones enumeradas anteriormente. Los paquetes comerciales tales como S+ y Matlab también contienen muchos de estos métodos.
El código realiza las siguientes etapas en el siguiente orden utilizando R versión 2.2.1 (http://www.r-project.org) con la biblioteca MASS (Venables et al. (2002)) instalada. El término LDA se refiere a la función lda en el espacio de nombres MASS.
1) Los valores de CT para 10 genes Marcadores y 2 controles se almacenan en un disco duro para todas las muestras de conjunto de entrenamiento disponibles. 2) Para cada muestra, la resta del promedio específico de la muestra de los controles de cada marcador normaliza los 10 valores de gen marcador. 3) El conjunto de datos de entrenamiento está compuesto por las metástasis con sitios de origen conocidos, donde cada muestra tiene al menos uno de sus marcadores diana específico para el tejido de origen marcado con un valor de CT normalizado inferior a 5. 4) LDA construye 4 conjuntos de 2 modelos LDA a partir de los datos de entrenamiento en (3). En cada conjunto, un modelo que es específico para los hombres, y tiene la probabilidad a priori para mama y ovario establecida en cero, así como la probabilidad a priori para próstata ajustada a las distribuciones de probabilidad a priori equivalentes de las demás etiquetas de clase. El otro modelo en cada par es específico para las mujeres con la probabilidad a priori de próstata establecida en cero, y con las distribuciones de probabilidad a priori para mama y ovario ajustadas a las distribuciones de probabilidad a priori equivalentes encontradas en las demás etiquetas de clase.
a.
El primer conjunto se utiliza para ensayar muestras de CUP encontradas en el colon, las probabilidades a priori para colon se establecen en cero y todas las demás etiquetas de clase de no reproductivo se ajustan a las distribuciones de probabilidad a priori equivalentes.
b.
Un segundo conjunto de modelos es específico para un CUP encontrado en el ovario, con la probabilidad a priori para ovario establecida en cero y las demás etiquetas de clase de no reproductivo ajustadas a las distribuciones de probabilidad a priori equivalentes.
c.
Un tercer conjunto es un CUP encontrado en el pulmón, con probabilidad a priori para pulmón establecida en cero. Todas las demás etiquetas de clase de no reproductivo tienen distribuciones de probabilidad a priori equivalentes.
d.
El modelo general utilizado para todos los demás tejidos de fondo. Todas las distribuciones de probabilidad a priori se ajustan de manera equivalente a excepción de las etiquetas de clase específicas de reproductivo que se ajustan tal como se ha definido en 4.
Con el fin de ensayar una muestra, se ejecuta un programa R que realiza lo siguiente.
1) Lee un conjunto de datos de ensayo. 2) Genera un promedio específico de la muestra de ambos controles. 3) Para cada muestra, utiliza el promedio específico de la muestra a restar de cada Marcador. 4) Reemplaza cualquier CT normalizado generado a partir de un CT sin procesar de 40 con 12. 5) Para cada muestra en el conjunto de ensayo se ensaya lo siguiente.
a.
Si el promedio de ambos controles es superior a 34, la muestra se etiqueta como 'CTR_FAILURE' con ceros para las probabilidades a posteriori.
b.
Se verifican los antecedentes para colon, ovario o pulmón. Si se encuentra una coincidencia, se marca también el género. A continuación se utilizan los antecedentes y un modelo específico de género para evaluar la muestra.
c.
Si se encuentra mama, páncreas, SCC de pulmón o próstata como etiqueta de antecedentes, a continuación se da a la muestra una etiqueta de 'FAILURE_ineligible_sample', y todas las probabilidades a posteriori se establecen en cero.
d.
Para todas las demás muestras se utiliza el modelo general para masculino o femenino.
Los resultados se formatean y se escriben en un archivo.
La presente descripción incluye carteras de expresión génica obtenidas mediante este proceso.
Los perfiles de expresión génica pueden presentarse de varias maneras. Lo más común es disponer una matriz de relación o las intensidades de fluorescencia sin procesar en un dendrograma en el que las columnas indican las muestras de ensayo y las filas indican los genes. Los datos se disponen de manera los genes con perfiles de expresión similares estén próximos entre sí. La relación de expresión para cada gen se visualiza en un color. Por ejemplo, una relación inferior a uno (disminución de la expresión) aparece en la porción azul del espectro, mientras que una relación superior a uno (aumento de la expresión) aparece en la porción roja del espectro. Se dispone en el mercado de programas de software para presentar este tipo de datos, incluido "GeneSpring" (Silicon Genetics, Inc.) y "Discovery" e "Infer" (Partek, Inc.)
Las mediciones de la abundancia de especies de ARN únicas se recogen de tumores primarios o de tumores metastásicos de primarios de origen conocido. Estas lecturas, junto con la historia clínica, incluida, pero no limitada a la edad del paciente, el sexo, el lugar de origen del tumor primario y el sitio de metástasis (en caso de ser aplicable) se utilizan para generar una base de datos relacional. La base de datos se utiliza para seleccionar los transcritos de ARN y los factores clínicos que pueden utilizarse como variables de Marcador para predecir el origen primario de un tumor metastásico.
En el caso de medir los niveles de proteína para determinar la expresión génica, cualquier método conocido en la técnica es adecuado siempre que dé como resultado una especificidad y sensibilidad adecuadas. Por ejemplo, pueden medirse los niveles de proteína mediante unión a un anticuerpo o fragmento de anticuerpo específico para la proteína y midiendo la cantidad de proteína unida al anticuerpo. Los anticuerpos pueden marcarse mediante reactivos radiactivos, fluorescentes u otros reactivos detectables para facilitar la detección. Los métodos de detección incluyen, sin limitación, el ensayo inmunoabsorbente ligado a enzimas (ELISA) y técnicas de inmunotransferencia.
Los genes modulados utilizados en los métodos de la invención se describen en los Ejemplos. Los genes que se expresan diferencialmente presentan un aumento o una disminución de la expresión en pacientes con carcinoma de un origen concreto con respecto a aquellos con carcinomas de diferentes orígenes. “Aumento de la expresión” y “disminución de la expresión” son expresiones relacionadas que se refieren a que se encuentra una diferencia detectable (más allá de la contribución del ruido en el sistema utilizado para medirlo) en la cantidad de expresión de los genes con respecto a una línea basal. En este caso, la línea basal se determina en base al algoritmo. Los genes de interés en las células enfermas presentan entonces un aumento o una disminución de la expresión con respecto al nivel de la línea basal utilizando el mismo método de medición. “Enfermo/a”, en este contexto, se refiere a una alteración del estado de un cuerpo que interrumpe o altera, o que tiene el potencial de alterar, el rendimiento adecuado de las funciones corporales tal como ocurre con la proliferación incontrolada de células. Se da un diagnóstico de enfermedad cuando algún aspecto del genotipo o fenotipo de la persona concuerda con la presencia de la enfermedad. Sin embargo, el acto de llevar a cabo un diagnóstico o pronóstico puede incluir la determinación de cuestiones sobre la enfermedad/estado, tal como la determinación de la probabilidad de recaída, el tipo de tratamiento y el control del tratamiento. En el control del tratamiento, se emiten juicios clínicos sobre el efecto de un determinado ciclo terapéutico comparando la expresión de los genes a lo largo del tiempo para determinar si los perfiles de expresión génica han cambiado o están cambiando a patrones más conformes con el tejido normal.
Los genes pueden agruparse de manera que la información obtenida sobre el conjunto de genes en el grupo proporcione una base sólida para emitir un juicio clínicamente pertinente, tal como el diagnóstico, el pronóstico
o la elección del tratamiento. Estos conjuntos de genes componen las carteras descritas en el presente documento. Al igual que con la mayoría de los Marcadores de diagnóstico, a menudo resulta deseable utilizar el menor número de Marcadores suficiente para emitir un juicio médico correcto. Esto evita un retraso en el tratamiento a la espera de un análisis adicional, así como un uso improductivo de tiempo y recursos.
Un método para establecer carteras de expresión génica es mediante algoritmos de optimización tal como el algoritmo de varianza media ampliamente utilizado en el establecimiento de carteras de acciones. Este método se describe detalladamente en el documento 20030194734. Esencialmente, el método requiere establecer un conjunto de entradas (acciones en las aplicaciones financieras, expresión medida mediante la intensidad en el presente documento) que optimizará el retorno (por ejemplo, la señal que se genera) que se recibe para utilizarlo minimizando al mismo tiempo la variabilidad del retorno. Se dispone de muchos programas comerciales de software para llevar a cabo tales operaciones. Resulta preferente "Wagner Associates Mean-Variance Optimization Application", denominada "Wagner Software" a lo largo de la presente memoria. Este software utiliza las funciones de la "Wagner Associates Mean-Variance Optimization Library" para determinar una frontera eficaz y resultan preferentes las carteras óptimas en el sentido de Markowitz. Markowitz (1952). El uso de este tipo de software requiere la transformación de los datos de micromatriz de manera que puedan tratarse como una entrada en la forma en que se utilizan la rentabilidad de las acciones y las medidas de riesgo cuando el software se utiliza para los fines previstos de análisis financiero.
El proceso de selección de una cartera también puede incluir la aplicación de reglas heurísticas. Preferentemente, tales reglas se formulan en base a la biología y la comprensión de la tecnología utilizada para producir resultados clínicos. Más preferentemente, se aplican a la salida del método de optimización. Por ejemplo, puede aplicarse el método de la varianza media de selección de la cartera a los datos de micromatriz para varios genes expresados diferencialmente en sujetos con cáncer. La salida del método sería un conjunto optimizado de genes que podrían incluir algunos genes que se expresan en sangre periférica así como en tejido enfermo. Si las muestras utilizadas en el método de ensayo se obtienen a partir de sangre periférica y determinados genes expresados diferencialmente en casos de cáncer también puedan expresarse diferencialmente en sangre periférica, entonces puede aplicarse una regla heurística en la que una cartera se selecciona de la frontera eficaz excluyendo las que se expresan diferencialmente en sangre periférica. Por supuesto, la regla puede aplicarse antes de la formación de la frontera eficaz, por ejemplo, aplicando la regla durante la preselección de datos.
Pueden aplicarse otras reglas heurísticas que no están necesariamente relacionadas con la biología en cuestión. Por ejemplo, puede aplicarse una regla de que sólo un porcentaje prescrito de la cartera pueda estar representado por un gen o grupo de genes concreto. El software disponible en el mercado tal como el Wagner Software se ajusta fácilmente a estos tipos de heurísticos. Esto puede ser útil, por ejemplo, cuando factores distintos de la exactitud y la precisión (por ejemplo, derechos de licencia previstos) tengan un impacto sobre la conveniencia de incluir uno o más genes.
Los perfiles de expresión génica descritos en el presente documento también pueden utilizarse junto con otros métodos de diagnóstico no genéticos útiles en el diagnóstico, el pronóstico o el control del tratamiento del cáncer. Por ejemplo, en algunas circunstancias es beneficioso combinar la potencia diagnóstica de los métodos basados en la expresión génica descritos anteriormente con datos procedentes de Marcadores convencionales tales como Marcadores de proteína sérica (por ejemplo, el Antígeno de Cáncer 27.29 ("CA 27.29")). Existe una variedad de tales Marcadores, incluidos analitos tales como CA 27.29. En uno de tales métodos, se extrae periódicamente sangre de un paciente tratado y a continuación se somete a un inmunoensayo enzimático para uno de los Marcadores séricos descritos anteriormente. Cuando la concentración del Marcador sugiere la reaparición de tumores o el fracaso del tratamiento, se obtiene una fuente de muestras susceptible de análisis de la expresión génica. Cuando exista una masa sospechosa, se hace una biopsia por aspiración con aguja fina (FNA) y a continuación se analizan los perfiles de expresión génica de las células obtenidas de la masa como se ha descrito anteriormente. Como alternativa, las muestras de tejido pueden obtenerse de las áreas adyacentes al tejido del cual se eliminó anteriormente un tumor. Este enfoque puede ser especialmente útil cuando otros ensayos producen resultados ambiguos.
Los kits preparados como se describe en el presente documento incluyen ensayos formateados para determinar los perfiles de expresión génica. Estos pueden incluir todos o algunos de los materiales necesarios para llevar a cabo los ensayos, tal como reactivos e instrucciones y un medio a través del cual se ensayan los Biomarcadores.
Los artículos descritos en el presente documento incluyen representaciones de los perfiles de expresión génica útiles para tratar, diagnosticar, pronosticar y evaluar de otro modo las enfermedades. Estas representaciones de perfiles se reducen a un medio que puede ser leído automáticamente por una máquina tal como medios legibles por ordenador (magnético, óptico, y similares). Los artículos también pueden incluir instrucciones para evaluar los perfiles de expresión génica en dichos medios. Por ejemplo, los artículos pueden comprender un CD ROM con instrucciones de ordenador para comparar los perfiles de expresión génica de las carteras de genes descritas anteriormente. Los artículos también pueden tener perfiles de expresión génica registrados digitalmente en los mismos de manera que puedan compararse con los datos de expresión génica de muestras de pacientes. Como alternativa, los perfiles pueden grabarse en un formato de representación diferente. Un registro gráfico es uno de tales formatos. Los algoritmos de agrupación como los incorporados en el software "DISCOVERY" e "INFER" de Partek, Inc. mencionados anteriormente pueden ayudar mejor a visualizar estos datos.
Los diferentes tipos de artículos de fabricación como se describen en el presente documento son ensayos formateados o medios utilizados para revelar los perfiles de expresión génica. Estos pueden comprender, por ejemplo, micromatrices en las que las sondas o complementos de secuencia están fijados a una matriz con la que se combinan las secuencias indicativas de los genes de interés creando un determinante legible de su presencia. Como alternativa, los artículos tal como se describen en el presente documento pueden fabricarse en forma de kits de reactivos para llevar a cabo la hibridación, la amplificación y la generación de señales indicativas del nivel de expresión de los genes de interés para la detección del cáncer.
Los siguientes ejemplos se proporcionan para ilustrar pero no limitar la invención reivindicada.
Ejemplo 1
Materiales y Métodos
Descubrimiento genético de Marcadores de cáncer pancreático.
Se aisló ARN a partir de tejidos de tumor pancreático, de páncreas normal, de pulmón, de colon, de mama y de ovario utilizando Trizol. A continuación se utilizó el ARN para generar ARN marcado amplificado (Lipshutz et al. (1999)) que a continuación se hibridó en matrices Affymetrix U133A. A continuación se analizaron los datos de dos maneras.
En el primer método, se filtró este conjunto de datos para conservar sólo los genes con al menos dos lecturas actuales por todo el conjunto de datos. Este filtrado dejó 14.547 genes. Se determinó que 2.736 genes se sobreexpresaban en el cáncer de páncreas frente al páncreas normal con un valor de p inferior a 0,05. Cuarenta y cinco genes de los 2.736 también se sobreexpresaban al menos el doble en comparación con la intensidad máxima encontrada a partir de tejidos de pulmón y colon. Por último, se descubrieron seis conjuntos de sondas que se
sobreexpresaban al menos el doble en comparación con la intensidad máxima encontrada a partir de tejidos de pulmón, colon, mama y ovario.
En el segundo método, se filtró este conjunto de datos para conservar sólo aquellos genes con no más de dos lecturas actuales en tejidos de mama, colon, pulmón y ovario. Este filtrado dejó 4.654 genes. Se descubrió que 160 genes de los 4.654 tenían al menos dos lecturas actuales en los tejidos pancreáticos (normales y cancerosos). Finalmente, se seleccionaron ocho conjuntos de sondas que presentaron la mayor expresión diferencial entre el cáncer pancreático y los tejidos normales.
Muestras de tejido.
Se obtuvieron un total de 260 tejidos primarios y metástasis FFPE de diversos proveedores comerciales. Las muestras ensayadas fueron: 30 metástasis de mama, 30 metástasis de colorrectal, 56 metástasis de pulmón, 49 metástasis de ovario, 43 metástasis de páncreas, 18 tumores primarios de próstata y 2 metástasis de próstata y 32 de otros orígenes (6 de estómago, 6 de riñón, 3 de laringe, 2 de hígado, 1 de esófago, 1 de faringe, 1 de conducto biliar, 1 de pleura, 3 de vejiga, 5 melanomas, 3 linfomas).
Extracción de ARN.
El aislamiento de ARN a partir de secciones de tejido en parafina se basó en los métodos y reactivos descritos en el manual High Pure RNA Paraffin Kit (Roche) con las siguientes modificaciones. Se seccionaron muestras de tejido incluidas en parafina según el tamaño de la metástasis incluida (2-5 mm = 9 X 10 µm, 6-8 mm = 6 X 10 µm, 8-≥ 10 mm = 3 X 10 µm), y se colocaron en tubos Eppendorf de 1,5 ml con ARNasa/ADNasa. Se desparafinaron las secciones mediante la incubación en 1 ml de xileno durante 2-5 minutos a temperatura ambiente después de una agitación en vórtex de 10-20 segundos. A continuación se centrifugaron los tubos y se eliminó el sobrenadante y se repitió la etapa de desparafinación. Después de eliminar el sobrenadante, se añadió 1 ml de etanol y se agitó en vórtex la muestra durante 1 minuto, se centrifugó y se eliminó el sobrenadante. Este proceso se repitió una vez más. Se eliminó el etanol residual y se secó el sedimento en un horno a 55°C durante 5-10 minutos y se resuspendió en 100 µl de tampón de lisis tisular, 16 µl de SDS al 10% y 80 µl de proteinasa K. Las muestras se agitaron en vórtex y se incubaron en un agitador-calentador puesto a 400 rpm durante 2 horas a 55°C. Se añadieron 325 µl de tampón de unión y 325 µl de etanol a cada muestra, que a continuación se mezcló, se centrifugó y el sobrenadante se añadió a la columna de filtración. La columna de filtración junto con el tubo de recogida se centrifugó durante 1 minuto a 8.000 rpm y se descartó el flujo a través. Se realizó una serie de lavados secuenciales (500 µl de tampón de lavado I → 500 µl de tampón de lavado II → 300 µl de tampón de lavado II) en la que se añadió cada solución a la columna, se centrifugó y se descartó el flujo a través. A continuación, se centrifugó la columna a velocidad máxima durante 2 minutos, se colocó en un tubo de 1,5 ml nuevo y se añadieron 90 µl de tampón de elución. Se obtuvo ARN después de una incubación de 1 minuto a temperatura ambiente, seguida de una centrifugación de 1 minuto a 8.000 rpm. La muestra se trató con ADNasa con adición de 10 µl de tampón de incubación ADNasa, 2 µl de ADNasa I y se incubó durante 30 minutos a 37°C. Se inactivó la ADNasa después de la adición de 20 µl de tampón de lisis tisular, 18 µl de SDS al 10% y 40 µl de proteinasa K. Nuevamente, se añadieron 325 µl de tampón de unión y 325 µl de etanol a cada muestra que a continuación se mezcló, se centrifugó y el sobrenadante se añadió a la columna de filtración. Los lavados secuenciales y la elución de ARN continuaron como se ha indicado anteriormente salvo que se utilizaron 50 µl de tampón de elución para eluir el ARN. Para eliminar la contaminación de la fibra de vidrio transferida desde la columna, se centrifugó el ARN durante 2 minutos a velocidad máxima y se eliminó el sobrenadante en un tubo Eppendorf de 1,5 ml. Las muestras se cuantificaron mediante lecturas de DO 260/280 obtenidas mediante un espectrofotómetro y se diluyeron las muestras hasta 50 ng/µl. El ARN aislado se almacenó en agua libre de ARNasa a -80°C hasta su uso.
Cebador TaqMan y diseño de sondas.
Se utilizaron los números de referencia de la secuencia de referencia de ARNm apropiada junto con Oligo
6.0 para desarrollar ensayos de CUP TaqMan® (Marcadores pulmonares: proteína B asociada a surfactante pulmonar humana (HUMPSPBA), factor de transcripción tiroideo 1 (TTF1), desmogleína 3 (DSG3), Marcador colorrectal: cadherina 17 (CDH17), Marcadores de mama: mamaglobina (MG), factor de transcripción Ets derivado de próstata (PDEF), Marcador de ovario: tumor de Wilms 1 (WT1), Marcadores pancreáticos: antígeno de células madre de próstata (PSCA), factor de coagulación V (F5), Marcador prostático calicreína 3 (KLK3)) y los ensayos de mantenimiento β actina, hidroximetilbilano sintasa (PBGD). Los cebadores y las sondas de hidrólisis para cada ensayo se enumeran en la Tabla 2. Se excluyó la amplificación de ADN genómico diseñando ensayos alrededor de los sitios de corte y empalme de exón-intrón. Las sondas de hidrólisis se marcaron en el nucleótido 5' con FAM como colorante indicador y en el nucleótido 3' con BHQ1-TT como colorante de extinción interno.
Reacción en cadena de la polimerasa en tiempo real cuantitativa.
Se llevó a cabo la cuantificación de ARN específico de gen en una placa de 384 pocillos en el sistema de detección de secuencias ABI Prism 7900HT (Applied Biosystems). Para cada ciclo de agitador-calentador se amplificaron los patrones y las curvas patrón. Los patrones para cada Marcador consistieron en transcritos in vitro de
genes diana que se diluyeron en ARN portador de riñón de rata a 1x105 copias. Las curvas patrón para los Marcadores de mantenimiento consistieron en transcritos in vitro de genes diana que se sometieron a dilución en serie en ARN portador de riñón de rata a 1x107, 1x105 y 1x103 copias. También se incluyeron en cada ciclo de ensayo controles no diana para asegurar que no hubiese contaminación ambiental. Todas las muestras y los controles se procesaron por duplicado. Se realizó la qRTPCR con reactivos de uso general en el laboratorio en una reacción de 10 µl que contenía: tampón de RT-PCR (Bicina/KOH 50 nM pH 8,2, KAc 115 nM, glicerol al 8%, MgCl2 2,5 mM, MnSO4 3,5 mM, 0,5 mM de cada uno de dCTP, dATP, dGTP y dTTP), aditivos (Tris-Cl 2 mM pH 8, albúmina bovina 0,2 mM, trehalosa 150 mM, Tween 20 al 0,002%), mezcla de enzimas (2U de Tth (Roche), 0,4 mg/µl de Ac TP6-25), mezcla de sonda y cebador (0,2 µM de sonda, 0,5 µm de cebadores). Se siguieron los siguientes parámetros de ciclación: 1 ciclo a 95°C durante 1 minuto; 1 ciclo a 55°C durante 2 minutos; Rampa 5%; 1 ciclo a 70°C durante 2 minutos; y 40 ciclos de 95°C durante 15 segundos, 58°C durante 30 segundos. Una vez terminada la reacción de PCR, se establecieron los valores iniciales y umbral en el software ABI 7900HT Prism y los valores de Ct calculados se exportaron a Microsoft Excel.
Reacción de una sola etapa vs. de dos etapas.
Se llevó a cabo la síntesis de la primera hebra utilizando 100 ng de hexámeros aleatorios o cebadores específicos de gen por reacción. En la primera etapa, se calentaron 11,5 µl de Mezcla-1 (cebadores y 1 ug de ARN total) a 65°C durante 5 minutos y a continuación se enfriaron en hielo. Se añadieron a la Mezcla-1 8,5 µl de Mezcla-2 (1x tampón, DTT 0,01 mM, 0,5 mM de cada uno de los dNTP, 0,25 U/µl de RNasin®, 10 U/µl de Superscript III) y se incubaron a 50°C durante 60 minutos, seguido de 95°C durante 5 minutos. El ADNc se almacenó a -20°C hasta el momento de utilizarlo. La qRTPCR para la segunda etapa de la reacción en 2 etapas se realizó como se ha indicado anteriormente con los parámetros de ciclación: 1 ciclo a 95°C durante 1 minuto; 40 ciclos de 95°C durante 15 segundos, 58°C durante 30 segundos. La qRTPCR para la reacción de una sola etapa se realizó exactamente como se ha indicado en el párrafo anterior. Las reacciones de una sola etapa y de dos etapas se llevaron a cabo en 100 ng de molde (ARN/ADNc). Una vez terminada la reacción de PCR, se establecieron los valores iniciales y umbral en el software ABI 7900HT Prism y los valores de Ct calculados se exportaron a Microsoft Excel.
Generación de un mapa de calor.
Para cada muestra, se calculó un ∆Ct tomando el Ct medio de cada Marcador CUP y restando el Ct medio de un promedio de los Marcadores de mantenimiento (HK) (∆Ct = Ct(Marcador CUP) - Ct(Marcador HK med.)). Se determinó para cada muestra el ∆Ct mínimo para cada conjunto de Marcadores del tejido de origen (pulmón, mama, próstata, colon, ovario y páncreas). Se puntuó el tejido de origen con el ∆Ct mínimo global y todos los demás tejidos de origen se puntuaron cero. Se ordenaron los datos según el diagnóstico patológico. Se llenó Partek Pro con los datos de viabilidad modificados y se generó un diagrama de intensidad.
Resultados.
Descubrimiento de Marcadores pancreáticos novedosos del estado del cáncer y del tumor de origen.
En primer lugar, se analizaron cinco Marcadores candidatos de páncreas: antígeno de células madre de próstata (PSCA), inhibidor de serin-proteinasa, clado A miembro 1 (SERPINA1), citoqueratina 7 (KRT7), metaloproteasa de matriz 11 (MMP11) y mucina 4 (MUC4) (Varadhachary et al. (2004); Fukushima et al. (2004); Argani et al. (2001); Jones et al. (2004); Prasad et al. (2005); y Moniaux et al. (2004)) utilizando micromatrices de ADN y un panel de 13 adenocarcinomas ductales pancreáticos, cinco tejidos normales de páncreas y 98 muestras de tumores de mama, colorrectal, de pulmón y de ovario. Sólo el PSCA demostró sensibilidad moderada (se detectaron seis de trece o el 46% de los tumores pancreáticos) a una alta especificidad (91 de 98 o el 93% fueron identificados correctamente como no de origen pancreático) (figura 4A). Por el contrario, KRT7, SERPINA1, MMP11 y MUC4 demostraron una sensibilidad del 38%, 31%, 85% y 31%, respectivamente, a especificidades del 66%, 91%, 82% y 81%, respectivamente. Estos datos estaban en concordancia con la qRTPCR realizada en 27 metástasis de origen pancreático y 39 metástasis de origen no pancreático para todos los Marcadores excepto para MMP11 que presentó una sensibilidad y especificidad más escasas con qRTPCR y las metástasis. En conclusión, los datos de micromatriz en tejido primario congelado de forma instantánea, sirven como buen indicador de la capacidad del Marcador para identificar una metástasis FFPE como de origen pancreático utilizando qRTPCR aunque pueden resultar útiles Marcadores adicionales para un rendimiento óptimo.
Debido a que el adenocarcinoma ductal pancreático se desarrolla a partir de células del epitelio ductal que comprenden sólo un pequeño porcentaje de todas las células pancreáticas (comprendiendo las células acinares y las células de los islotes la mayoría) y a que los tejidos de adenocarcinoma pancreático contienen una cantidad significativa de tejido normal adyacente (Prasad et al. (2005); e Ishikawa et al. (2005)), ha resultado difícil identificar Marcadores de cáncer pancreático (es decir, con aumento de la expresión en cáncer) que también diferencien este órgano de los órganos. Para su uso en un panel CUP, es necesaria tal diferenciación. El primero método de consulta (véase Materiales y Métodos) devolvió seis conjuntos de sondas: el factor de coagulación V (F5), una proteína hipotética FLJ22041 similar a proteínas de unión a FK506 (FKBP10), integrina β6 (ITGB6), transglutaminasa 2 (TGM2), ribonucleoproteína nuclear heterogénea A0 (HNRP0) y BAX delta (BAX). El segundo método de consulta
(véase Materiales y Métodos) devolvió ocho conjuntos de sondas: F5, TGM2, factor de transcripción 1 de homeodominio similar a paired (PITX1), ARNm isoforma trio (TRIO), ARNm para p73H (P73), una proteína desconocida para MGC: 10264 (SCD) y dos conjuntos de sondas para claudina18. F5 y TGM2 estaban presentes en ambos resultados de la consulta y, de los dos, F5 parecía el más prometedor (figura 4B).
Optimización de la preparación de muestras y qRTPCR utilizando tejidos FFPE.
A continuación, se optimizaron los métodos de qRTPCR y aislamiento de ARN utilizando tejidos fijados antes de examinar el rendimiento del panel de Marcadores. En primer lugar, se analizó el efecto de la reducción del tiempo de incubación con proteinasa K de dieciséis horas a 3 horas. No hubo ningún efecto sobre el rendimiento. Sin embargo, algunas muestras presentaron fragmentos más largos de ARN cuando se utilizó la etapa de proteinasa K más corta (figura 5). Por ejemplo, cuando se aisló el ARN a partir de un bloque de un año (C22), no se observó diferencia en los electroferogramas. Sin embargo, cuando se aisló el ARN a partir de un bloque de cinco años (C23), se observó una mayor fracción de ARN de alto peso molecular, según la evaluación de la joroba en el hombro, cuando se utilizó la digestión con proteinasa K más corta. Esta tendencia se mantuvo generalmente cuando se procesaron otras muestras, independientemente del órgano de origen para la metástasis FFPE. En conclusión, acortar el tiempo de digestión con proteinasa K no sacrifica los rendimientos de ARN y puede ayudar a aislar ARN menos degradado y más largo.
A continuación, se compararon tres métodos diferentes de transcripción inversa: transcripción inversa con hexámeros aleatorios seguida de qPCR (dos etapas), transcripción inversa con un cebador específico de gen seguida de qPCR (dos etapas) y qRTPCR de una sola etapa utilizando cebadores específicos de gen. Se aisló ARN de once metástasis y se compararon los valores de Ct entre los tres métodos para la β-actina, la proteína B surfactante humana (HUMSPB) y el factor de transcripción tiroideo (TTF) (figura 6). Hubo diferencias estadísticamente significativas (p <0,001) para todas las comparaciones. Para los tres genes, la transcripción inversa con hexámeros aleatorios seguida de qPCR (reacción de dos etapas) dio los valores de Ct más altos mientras que la transcripción inversa con un cebador específico de gen seguida de qPCR (reacción de dos etapas) dio valores de Ct ligeramente más bajos (pero estadísticamente significativos) que la correspondiente reacción en una etapa. Sin embargo, la RTPCR en dos etapas con cebadores específicos de gen tenía una etapa de transcripción inversa más larga. Cuando los valores de Ct de HUMSPB y TTF se normalizaron al valor de β-actina correspondiente para cada muestra, no hubo diferencias en los valores de Ct normalizados entre los tres métodos. En conclusión, la optimización de las condiciones de reacción de RTPCR puede generar valores de Ct más bajos, lo que puede ayudar en el análisis de los bloques de parafina más viejos (Cronin et al. (2004)), y una reacción de RTPCR de una sola etapa con cebadores específicos de gen puede generar valores de Ct comparables a los generados en la correspondiente reacción de dos etapas.
Rendimiento diagnóstico de un ensayo qRTPCR de CUP.
A continuación, se realizaron 12 reacciones de qRTPCR (10 Marcadores y dos genes de mantenimiento) en 239 metástasis FFPE. Los Marcadores utilizados para el ensayo se muestran en la Tabla 2. Los Marcadores de pulmón fueron proteína B asociada a surfactante humana (HUMPSPB), factor de transcripción tiroideo 1 (TTF1) y desmogleína 3 (DSG3). El Marcador colorrectal fue cadherina 17 (CDH17). Los Marcadores de mama fueron mamaglobina (MG) y el factor de transcripción Ets derivado de próstata (PDEF). El Marcador de ovario fue tumor de Wilms 1 (WT1). Los Marcadores pancreáticos fueron el antígeno de células madre de próstata (PSCA) y el factor de coagulación V (F5), y el Marcador prostático fue calicreína 3 (KLK3). Para las descripciones de los genes, véase la Tabla 31.
Tabla 2. Secuencias de cebador y sonda, números de registro y longitudes de amplicón
Diana
SEQ ID NO Secuencia (5’-3’) Descripción SEQ ID NO
SP-B
59 cacagccccgacctttgatga Cebador directo 11
ggtcccagagcccgtctca
Cebador inverso 12
agctgtccagctgcaaaggaaaagcc
Sonda* 13
cacagccccgacctttgatgagaactcagctgtccagctgcaaaggaaaagc caagtgagacgggctctgggacc
Amplicón 14
TTF1
60 ccaacccagacccgcgc Cebador directo 15
cgcccatgccgctcatgttca
Cebador inverso 16
cccgccatctcccgcttcatg
Sonda* 17
ccaacccagacccgcgcttccccgccatctcccgcttcatgggcccggcgagc ggcatgaacatgagcggcatgggcg
Amplicón 18
DSG3
61 gcagagaaggagaagataactcaa Cebador directo 19
actccagagattcggtaggtga
Cebador inverso 20
attgccaagattacttcagattacca
Sonda* 21
gcagagaaggagaagataactcaaaaagaaacccaattgccaagattacttc agattaccaagcaacccagaaaatcacctaccgaatctctggagt
Amplicón 22
CDH17
62 tccctcggcagtggaagctta Cebador directo 23
tcctcaaactctgtgtgcctggta
Cebador inverso 24
ccaaaatcaatggtactcatgcccgactg
Sonda* 25
tccctcggcagtggaagcttacaaaacgactgggaagtttccaaaatcaatggt actcatgcccgactgtctaccaggcacacagagtttgagga
Amplicón 26
MG
63 agttgctgatggtcctcatgc Cebador directo 27
cacttgtggattgattgtcttgga
Cebador inverso 28
ccctctcccagcactgctacgca
Sonda* 28
agttgctgatggtcctcatgctggcggccctctcccagcactgctacgcaggctct ggctgccccttattggagaatgtgatttccaagacaatcaatccacaagtg
Amplicón 30
PDEF
64 cgcccacctggacatctgga Cebador directo 31
cactggtcgaggcacagtagtga
Cebador inverso 32
gtcagcggcctggatgaaagagcgg
Sonda* 33
cgcccacctggacatctggaagtcagcggcctggatgaaagagcggacttca cctgggctcgattcactactgtgcctcgaccagtg
Amplicón 34
WT1
65 gcggagcccaatacagaatacac Cebador directo 35
cggggctactccaggcaca
Cebador inverso 36
tcagaggcattcaggatgtgcgacg
Sonda* 37
gcggagcccaatacagaatacacacgcacggtgtcttcagaggcattcagga tgtgcgacgtgtgcctggagtagccccg
Amplicón 38
PSCA
66 ctgttgatggcaggcttggc Cebador directo 39
ttgctcacctgggctttgca
Cebador inverso 40
gcagccaggcactgccctgct
Sonda* 41
ctgttgatggcaggcttggccctgcagccaggcactgccctgctgtgctactcct gcaaagcccaggtgagcaa
Amplicón 42
F5
67 tgaagaaatatcctgggattattca Cebador directo 43
tatgtggtatcttctggaatatcatca
Cebador inverso 44
acaaagggaaacagatattgaagactc
Sonda* 45
tgaagaaatatcctgggattattcagaatttgtacaaagggaaacagatattgaa gactctgatgatattccagaagataccacata
Amplicón 46
KLK3
68 cccccagtgggtcctcaca Cebador directo 47
aggatgaaacaagctgtgccga
Cebador inverso 48
caggaacaaaagcgtgatcttgctgg
Sonda* 49
cccccagtgggtcctcacagctgcccactgcatcaggaacaaaagcgtgatct
Amplicón 50
tgctgggtcggcacagcttgtttcatcct
β actina
69 gccctgaggcactcttcca Cebador directo 51
cggatgtccacgtcacacttca
Cebador inverso 52
cttccttcctgggcatggagtcctg
Sonda* 53
gccctgaggcactcttccagccttccttcctgggcatggagtcctgtggcatccac gaaactaccttcaactccatcatgaagtgtgacgtggacatccg
Amplicón 54
PBGD
70 ccacacacagcctactttccaa Cebador directo 55
tacccacgcgaatcactctca
Cebador inverso 56
aacggcaatgcggctgcaacggcggaa
Sonda* 57
ccacacacagcctactttccaagcggagccatgtctggtaacggcaatgcggc tgcaacggcggaagaaaacaacccaaagatgagagtgattcgcgtgggta
Amplicón 58
*Las sondas son 5’FAM-3’BHQ1-TT
El análisis de los valores de Ct normalizados en un mapa de calor reveló la alta especificidad de los Marcadores de mama y próstata, la especificidad moderada de los Marcadores de colon, pulmón y ovario, y la especificidad algo menor de los pancreáticos. La combinación de los datos normalizados de qRTPCR con el 65 refinamiento computacional mejora el rendimiento del panel de Marcadores. Los resultados se obtuvieron a partir de los datos normalizados de qRTPCR combinados con el algoritmo y se determinó la precisión del ensayo qRTPCR.
Análisis.
En este ejemplo, se utilizó la determinación de perfiles de expresión basada en micromatrices en tumores primarios para identificar los Marcadores candidatos para su uso con las metástasis. El hecho de que los tumores primarios pueden utilizarse para descubrir Marcadores del tumor de origen para las metástasis es coherente con varios hallazgos recientes. Por ejemplo, Weigelt y colaboradores han demostrado que los perfiles de expresión génica de los tumores de mama primarios se mantienen en las metástasis a distancia. Weigelt et al. (2003). Italiano y colaboradores descubrieron que el estado de EGFR, según la evaluación de IHC, era similar en los 80 tumores colorrectales primarios y las 80 metástasis relacionadas. Italiano et al. (2005). Sólo cinco de los 80 presentaron discordancia en el estado de EGFR. Italiano et al. (2005). Backus y colaboradores identificaron supuestos Marcadores para detectar metástasis de cáncer de mama utilizando un análisis de la expresión génica de todo el genoma de mama y otros tejidos, y demostraron que la mamaglobina y CK19 detectaban metástasis clínicamente tratables en los ganglios linfáticos centinela de la mama con un 90% de sensibilidad y un 94% de especificidad. Backus et al. (2005).
Los estudios basados en micromatrices con tejido primario confirmaron la especificidad y la sensibilidad de los Marcadores conocidos. Como resultado, a excepción de F5, todos los Marcadores utilizados tienen alta especificidad para los tejidos estudiados en el presente documento. Argani et al. (2001; Backus et al. (2005); Cunha et al. (2005); Borgono et al. (2004); McCarthy et al. (2003); Hwang et al. (2004); Fleming et al. (2000); Nakamura et al. (2002); Khoor y et al. (1997) Un estudio reciente determinó que, utilizando IHC, el PSCA se sobreexpresa en las metástasis de cáncer de próstata. Lam et al. (2005) Dennis et al. (2002) también demostraron que podría utilizarse PSCA como Marcador del tumor de origen para páncreas y próstata. Como se muestra en el presente documento, se descubrió una fuerte expresión de PSCA en algunos tejidos de próstata a nivel del ARN pero, debido a la inclusión del PSA en el ensayo, ya pueden separarse los cánceres de próstata y páncreas. Un hallazgo novedoso de este estudio fue el uso de F5 como Marcador complementario (de PSCA) para tejido de origen pancreático. En el conjunto de datos de micromatriz con tejido primario y el conjunto de datos de qRTPCR con metástasis FFPE, F5 complementaba a PSCA (figura 4 y Tabla 3).
Tabla 3. Datos de viabilidad
Mama
Colon Pulmón Otro Ovario Páncreas Próstata Total
Total ensayados
30 30 56 32 49 43 20 260
#Correcto
22 27 45 16 43 31 20 204
#Otro / Ningún ensayo
1 1 3 n/a 1 4 0 10
#Incorrecto
7 2 8 16 5 8 0 46
% ensayado
96,67 96,67 94,64 100 97,96 90,70 100 96,15
% correcto de ensayados
75,86 93,10 84,91 0 89,58 79,49 100 81,60
Correcto del total (%)
73,33 90,00 80,36 50,00 87,76 72,09 100 78,46
Investigadores anteriores han generado ensayos de CUP utilizando IHC o micromatrices. Su et al. (2001); Ramaswamy et al. (2001); y Bloom et al. (2004). Más recientemente, se ha acoplado SAGE a un pequeño panel de Marcadores qRTPCR. Dennis (2002); y Buckhaults et al. (2003). Este estudio es el primero en combinar perfiles de expresión en base a micromatrices con un pequeño panel de ensayos de qRTPCR. Los estudios de micromatrices con tejido primario identificaron algunos, pero no todos, de los mismos Marcadores de tejido de origen que los identificados anteriormente mediante estudios SAGE. Algunos estudios han demostrado que existe una concordancia moderada entre los datos de perfiles basados en micromatrices de ADN y basados en SAGE y que la correlación mejora para los genes con niveles de expresión más altos. Van Ruissen et al. (2005); y Kim (2003). Por ejemplo, Dennis y colaboradores identificaron PSA, MG, PSCA y HUMSPB mientras que Buckhaults y colaboradores (Dennis et al. (2002)) identificaron PDEF. Resulta preferente ejecutar el ensayo de CUP utilizando qRTPCR porque es una tecnología robusta y puede tener ventajas de rendimiento frente a IHC. Al-Mulla et al. (2005); y Haas et al. (2005). Como se muestra en el presente documento, se mejoró el protocolo qRTPCR mediante el uso de cebadores específicos de gen en una reacción de una sola etapa. Esta es la primera demostración del uso de cebadores específicos de gen en una reacción de qRTPCR de una sola etapa con tejido FFPE. Otros investigadores han realizado un qRTPCR de dos etapas (síntesis de ADNc en una reacción seguida de qPCR) o han utilizado hexámeros aleatorios o cebadores específicos de gen truncados. Abrahamsen et al. (2003); Specht et al. (2001); Godfrey et al. (2000); Cronin et al. (2004); y Mikhitarian et al. (2004).
Ejemplo 2
Protocolo de aislamiento de ARN total de CUP FFPE
(Kit Highpure Cat #3270289)
Objetivo:
Aislamiento de ARN total a partir de tejido FFPE
Procedimiento: Preparación de las soluciones de trabajo
1.
Proteinasa K (PK) en kit
Disolver liofilizado en 4,5 ml de tampón de elución. Alicuotar y almacenar a -20°C, estable durante 12 meses. PK-4x250mg (cat #3115852) Disolver liofilizado en 12,5 ml de tampón de elución (1x tampón TE (pH 7,4-7). Alicuotar y almacenar a -20°C.
2.
Tampón de lavado I Añadir 60 ml de etanol absoluto al tampón de lavado I, almacenar a temperatura ambiente.
3.
Tampón de lavado II Añadir 200 ml de etanol absoluto al tampón de lavado II, almacenar a temperatura ambiente.
4.
ADNasa I
Disolver liofilizado en 400 µl de tampón de elución. Alicuotar y almacenar a -20°C, estable durante 12 meses.
Corte de bloques de parafina ~ 30-45 minutos para 12 bloques (12 bloques x 2 tubos = 24 tubos)
Las secciones cortadas del bloque deben procesarse de inmediato para la extracción de ARN
1.
Utilizar una hoja de afeitar limpia y afilada en el micrótomo para cortar 6 secciones de 10 micras de espesor de los bloques de tejido recortado (tamaño 3-4 x 5-10mm).
Comentario: Bloque nuevo - Descartar secciones de cera hasta la sección de tejido obtenida. Bloque utilizado – Descartar las 3 primeras secciones de tejido.
2.
Colocar inmediatamente el tejido cortado en tubos de microcentrífuga de 1,5 ml y tapar herméticamente para minimizar la humedad.
3.
Se recomienda tomar el número de secciones en función del tamaño del tumor que se muestra en la Tabla 4. Tabla 4
Tamaño de MET
Secciones/Tubo
8-10 mm
6
6-8 mm
12
2-4 mm
18
Desparafinación ~ 30-45 minutos
1. Añadir a cada muestra 1,0 ml de xileno y agitar en vórtex enérgicamente durante 10-20 segundos e incubar a temperatura ambiente 2-5 minutos. Centrifugar 2 minutos a velocidad máxima. Eliminar el sobrenadante cuidadosamente.
Comentario: si el tejido parece flotar, centrifugar durante 2 minutos más.
2.
Repetir la etapa 1.
3.
Centrifugar 2 minutos a velocidad máxima. Eliminar el sobrenadante.
4.
Añadir 1 ml de etanol abs. y agitar en vórtex enérgicamente 1 minuto. Centrifugar 2 minutos a velocidad máxima. Eliminar el sobrenadante.
5.
Repetir la etapa 4.
6.
Secar el tubo brevemente sobre una toalla de papel para deshacerse de los residuos de etanol.
7.
Secar en horno el sedimento de tejido durante 5-10 minutos a 55°C. Comentario: es muy importante eliminar completamente el etanol y secar bien los sedimentos, el etanol residual puede inhibir la digestión con PK.
Comentario: si la PK está a -20C, calentar a temperatura ambiente 20-30 minutos.
Extracción de ARN ~ 2,5-3 horas
1.
Añadir a un sedimento de tejido 100 µl de tampón de lisis tisular, 16 µl de SDS al 10% y 80 µl de solución de trabajo de proteinasa K, agitar en vórtex brevemente en varios intervalos e incubar 2 horas a 55°C agitando a 400 rpm.
2.
Añadir 325 µl de tampón de unión y 325 µl de etanol abs. Mezclar suavemente pipeteando arriba y abajo.
3.
Centrifugar el lisado a velocidad máxima durante 2 minutos.
4.
Combinar el tubo de filtración y el tubo de recogida (12 tubos), y pipetear el sobrenadante de lisado en el filtro.
5.
Centrifugar durante 30 segundos a 8.000 rpm y descartar el flujo a través.
Comentario: puede repetirse la etapa 4-5, si necesita combinarse el ARN con 2 preparaciones más de sedimentos de tejido.
6.
Repetir la centrifugación a 8.000 rpm durante 30 segundos para secar el filtro.
7.
Añadir a la columna 500 µl de solución de trabajo de tampón de lavado I y centrifugar durante 15-30 segundos a
8.000 rpm, descartar el flujo a través.
8.
Añadir 500 µl de solución de trabajo de tampón de lavado II. Centrifugar durante 15-30 segundos a 8.000 rpm, descartar el flujo a través.
9.
Añadir 300 µl de solución de trabajo de tampón de lavado II, centrifugar durante 15-30 segundos a 8.000 rpm, descartar el flujo a través.
10.
Centrifugar el filtro High Pure durante 2 minutos a velocidad máxima.
11.
Colocar el tubo de filtración High Pure en un nuevo tubo de 1,5 ml y añadir 90 µl de tampón de elución. Incubar durante 1-2 minutos a temperatura ambiente. Centrifugar 1 minuto a 8.000 rpm. Tratamiento con ADNasa I ~ 1,5 horas.
12.
Añadir al eluato 10 µl de 10x tampón de incubación de ADNasa y 1,0 µl de solución de trabajo de ADNasa I y mezclar. Incubar durante 45 minutos a 37°C (o 2,0 µl de ADNasa I durante 30 minutos).
13.
Añadir 20 µl de tampón de lisis tisular, 18 µl de SDS al 10% y 40 µl de solución de trabajo de proteinasa K. Agitar en vórtex brevemente. Incubar durante 30 minutos (30-60 minutos) a 55°C.
14.
Añadir 325 µl de tampón de unión y 325 µl de etanol abs. Mezclar y pipetear en un nuevo tubo de filtración High Pure con el tubo de recogida (12 tubos).
15.
Centrifugar durante 30 segundos a 8.000 rpm y descartar el flujo a través.
16.
Repetir la centrifugación a 8.000 rpm durante 30 segundos para secar el filtro.
17.
Añadir 500 µl de solución de trabajo de tampón de lavado I a la columna. Centrifugar durante 15 segundos a
8.000 rpm, descartar el flujo a través.
18.
Añadir 500 µl de solución de trabajo de tampón de lavado II. Centrifugar durante 15 segundos a 8.000 rpm, descartar el flujo a través.
19.
Añadir 300 µl de solución de trabajo de tampón de lavado II. Centrifugar durante 15 segundos a 8.000 rpm, descartar el flujo a través.
20.
Centrifugar el filtro High Pure durante 2 minutos a velocidad máxima.
21.
Colocar el tubo de filtración High Pure en un nuevo tubo de 1,5 ml. Añadir 50 µl de tampón de elución; incubar durante 1-2 minutos a temperatura ambiente. Centrifugar durante 1 minuto a 8.000 rpm para recoger el ARN eluido.
22.
Centrifugar el eluato durante 2 minutos a velocidad máxima y transferir el sobrenadante a un nuevo tubo sin agitar las fibras de vidrio del fondo.
23.
Tomar una lectura de DO a 260/280 y diluir a 50 ng/µl. Almacenar a -80°C. Protocolo del Ensayo ASR de CUP (ABI 7900) Objetivo: Utilizar qRTPCR para determinar el tejido de origen de una muestra de CUP Preparación del control:
1. Controles positivos (Consultar la Tabla 5 y la Placa C en Preparación de Placas, figura 7)
Tabla 5. Diluciones en serie de IVT – 5 µl 1x108 en 470 µl de H2O + 25 µl de 10.000 ARNr
Control IVT
CE/µl Muestra Agua ARNr residual
BACTIN
100E+05 50 425 25
CDH17
100E+05 50 425 25
DSG3
100E+05 50 425 25
F5
100E+05 50 425 25
Hump
100E+05 50 425 25
MG
100E+05 50 425 25
PBGD
100E+05 50 425 25
PDEF
100E+05 50 425 25
PSCA
100E+05 50 425 25
TTF1
100E+05 50 425 25
WT1
100E+05 50 425 25
1E6. Tabla 5 Diluir 50.000 CE/µl de ARNr a 500 CE/µl - 5 µl 50.000 CE/µl + 495 µl de H2O Alicuotar 10 µl por tira de tubos (2 placas); Colocar la mezcla a -80°C hasta el momento de utilizarla.
2. Curvas patrón (Consúltense la Tabla 6 y la Placa C en Preparación de Placas, figura 7)
Etapa 1: La curva patrón se preparó exactamente como se muestra en la Tabla 6.
Tabla 7. Solución de reserva - 1x108 IVT. Diluir 50.000 CE/µl de ARNr a 500 CE/µl – 5 µl 50.000 CE/µl + 495 µl de H2O
Control IVT
CE/µl Muestra Agua ARNr residual
BACTIN-1
100E+07 50 425 25
BACTIN-2
100E+06 50 425 25
BACTIN-3
100E+05 50 425 25
BACTIN-4
100E+04 50 425 25
BACTIN-5
100E+03 50 425 25
PBGD-1
100E+07 50 425 25
PBGD-2
100E+06 50 425 25
PBGD-3
100E+05 50 425 25
PBGD-4
100E+04 50 425 25
PBGD-5
100E+03 50 425 25

Alicuotar 10 µl por tira de tubos (2 placas); Colocar la mezcla a -80°C hasta el momento de utilizarla.
Mezcla de enzimas:
25 1. Mezcla maestra: Enzima (Tth) / Anticuerpo (TP6-25), véase la tabla 7. Tabla 7
Reactivo
2x
Enzima Tth (5U/µl)
600,00
Anticuerpo: TP6-25 (1mg/ml)
600,00
Agua
300,00
Total
1.500,00
Alicuotar 500 µl/tubo y congelar a -20°C.
Mezcla maestra de CUP:
1. 2,5X Mezcla maestra de CUP (Tablas 8-11):
Tabla 8
Dejar que el reactivo se mezcle completamente > 15 minutos
55 Tabla 9
ml
5x Aditivos 2,5x Conc.
0,50
1M Tris-Cl pH 8 5mM
1,25
40mg/ml de Albúmina, bovina 500µg/ml
37,50
Trehalosa de reserva 1M 375mM
2,5
Tween 20 al 20% v 0,50%
7,00
ddH2O
48,75
ml
5x Aditivos 2,5 x Conc
12,50
Bicina/hidróxido de potasio 1M pH 8,2 125mM
5,75
Acteato de potasio 5M 287,5mM
20,00
Glicerol (V x D = M -> 19,6 x 1,26 = 24,6 g) 20%
1,25
Cloruro de magnesio 500mM 6,25mM
1,75
Cloruro de magnesio 500mM 8,75mM
5,00
ddH2O
46,25
Dejar que el reactivo se mezcle completamente > 15 minutos; Combinar las mezclas anteriores en un recipiente estéril - añadir lo siguiente
Tabla 10
ml
5x Aditivos 2,5x Conc.
1,25
dATP 100mM 1,25mM
1,25
dCTP 100mM 1,25mM
1,25
dTTP 100mM 1,25mM
1,25
dGTP 100mM 1,25mM
100,00
Dejar que el reactivo se mezcle completamente > 15 minutos; alicuotar 1,8 ml/tubo y congelar a -20°C
Tabla 11
Cebador/sonda
Reserva (µM) FC (µM) µl
Cebador directo
100 10 100,0
Cebador inverso
100 10 100,0
Sonda (5’FAM/3’BHQ1-TT)
100 4 40,0
Agua DI
760,0
Total
1.000,0
25 Mezcla de cebador y sonda:
Alicuotar 250 µl/tubo y congelar a -20°C
Mezcla de reacción:
1. Mezcla maestra de CUP (CMM): (Consúltense las tablas 12-14 y la Placa A en Preparación de Placas, figura 7)
Tabla 12 35
Reactivo
FC X1 (10µl) 450
2,5 x Mezcla maestra de CUP
1X 4,00 1800
ROX
1x 0,20 90
2x mezcla TthAb
2U 1,00 450
Agua
2,3 1035
Total
7,50 3375
Preferentemente, cada ciclo/placa no tendrá más de 356 reacciones: 12 muestras con 12 Marcadores (288 45 reacciones con 2 repeticiones para cada una) + 10 controles de curva patrón por duplicado (20) + 2 controles positivos y 2 controles negativos para cada Marcador. (4x12 = 48)
Ajustar el agua para el volumen de muestra - 4,3 µl de muestra MAX; Mezclar bien
Tabla 13
Reactivo
FC X1 (10µl) 34
Cebadores 10µM/Sonda 4µM
0,5µM/0,2µM 0,50 17
CMM
1x 7,50 255
Total
8,00 272
2. Marcadores ToO: Mezclar bien
Tabla 14
Reactivo
FC X1 (10µl) 44
Cebadores 10µM/Sonda 4µM
0,5µM/0,2µM 0,50 22
CMM
1x 7,50 330
Total
8,00 352
3. Marcadores β-actina y PBGD: Mezclar bien
Preparación de la muestra:
Tabla 15
Muestra
ID de la muestra Conc Agua añadida = 50ng/µl
A1
A2
A3
A4
A5
A6
A7
A8
A9
A10
A11
A12
1. Muestras de CUP: 12 muestras en placas de 96 pocillos: A1-A12 (Consúltense la Tabla 16 y la Placa B en Preparación de Placas, figura 7);
25 Alicuotar 50 µl de 50 ng/µl (2 µl/rxn)
Cargar la placa:
1. Preparación de placa de 384 pocillos: (Consúltese la Placa de D en Preparación de Placas, figura 7)
Se cargan sobre la placa 2 µl de muestra y 8 µl de CMM. (muestra = 50 ng/µl)
Se cargan sobre la placa 4 µl de muestra y 6 µl de CMM (muestra = 25 ng/µl)
Se sella y se etiqueta la placa. Se centrifuga a 2.000 rpm durante 1 minuto. Preparación de ABI 7900HT:
Colocar en el ABI 7900. Seleccionar el programa "CUP 384" y pulsar “inicio”. 35 Tabla 16
Condiciones de termociclación
95C x 60s
55C x 2m
RAMPA 5 %
70C x 2m
40 ciclos de
95C x 15s
58C x 30s
ROX conectado
Los datos se analizan, se extraen los Ct y se insertan en el algoritmo
Ejemplo 3
Algoritmo CUP
55 Los valores ∆Ct normalizados de actina para HPT, MGB, PDEF, PSA, SP-B, TFF, DSG, WT1, PSCA y F5 se colocan en 6 conjuntos en base al tejido de origen del que se seleccionaron originalmente. Se restan las constantes 9,00, 11,00, 7,50, 5,00, 10,00, 9,50, 6,50, 8,00, 9,00 y 800 de cada ∆Ct respectivamente. A continuación, para cada muestra se selecciona el valor de CT mínimo de cada uno de los 6 conjuntos (HPT, min (MGB o PDEF), PSA, min (SP-B, TFF o DSG), WT1, y min (PSCA o F5)) como variable representativa para el grupo.
Estas variables, y el sitio de metástasis se utilizan para clasificar la muestra utilizando discriminantes lineales. Deben construirse dos modelos diferentes, uno para hombres y otro para mujeres, a partir de los datos de entrenamiento que utilizan la función de biblioteca MASS "lda" (Venables et al. (2002) en R (versión 2.0.1). A continuación se calcula una probabilidad a posteriori para cada ToO utilizando la función “predict” para el modelo
65 masculino o femenino.
Las variables utilizadas en los modelos masculinos son HPT, PSA, el mínimo de ('SP-B', 'TFF', 'DSG3'), el mínimo de ('PSCA', 'F5') y el sitio de metástasis. La categoría sitio de metástasis tiene 4 niveles correspondientes a colon, pulmón, ovario y resto de los tejidos. Para los modelos femeninos, las variables son HPT, el mínimo de ('MGB', 'PDEF'), el mínimo de ('SP-B', 'TFF', 'DSG3'), WT1, el mínimo de ('PSCA', 'F5') y el sitio de metástasis.
Ejemplo de Código R:
#Entrenar el modelo masculino
dat.m<-CUP2.MIN.NORM[, c
(’HPT’, ’PSA’, ’SP.B.TTF.DSG3’, ’PSCA.F5’, ’Class’, ’background’)] CUP.lda.m<-lda(Class∼.,dat.m,prior=
c(0,0.09,0.23,0.43,0,0.16,0.02)/sum(c (0, 0.09, 0.23, 0.43, 0, 0.16, 0.02)))
#Entrenar el modelo femenino dat.f<-CUP2.MIN.NORM[, c (’HPT’, ’MFB.PDEF’, ’SP.B.TTF.DSG3’, ’WT1’, ’PSCA.F5’, ’Class’, ’background’)] CUP.lda.f<-lda(Class~.,dat.f,prior= c(0.03, 0.09, 0.23, 0.43, 0.04, 0.16,0)/sum(c (0.03, 0.09, 0.23, 0.43, 0.04, 0.16,0)))
#si la muestra desconocida (i) es de hombre
predict(CUP.lda.m, CUP2.MIN.NORM.TEST[i,])
#si la muestra desconocida (i) es de mujer
predict(CUP.lda.f, CUP2.MIN.NORM.TEST[i,])
Para ejecutar este código, una trama de datos llamada CUP2.MIN.NORM debe contener los datos de entrenamiento con el valor mínimo calculado para cada tejido de origen establecido como se ha descrito anteriormente.
“Class” (clase) se corresponde con el tejido de origen, y “background” (antecedentes) se corresponde con los sitios de metástasis descritos anteriormente.
Los datos de ensayo pueden estar contenidos en CUP2. MIN.NORM.TEST, y puede ensayarse una muestra específica en la fila i utilizando la función “predict”. Una vez más, los datos de ensayo deben estar en el mismo formato que el conjunto de entrenamiento y tener los ajustes de valor mínimo aplicados a él también.
Ejemplo 4
Muestras resueltas de CUP
Se compararon 48 muestras resueltas y no resueltas de CUP para determinar la correlación con respecto a las muestras de CUP verdaderas. Los métodos utilizados fueron los descritos en los Ejemplos 1-3. Los resultados obtenidos se presentan en la Tabla 17. Se ensayaron 11 muestras de CUP no resuelto, el diagnóstico se realizó en 8 muestras, 3 eran de otra categoría.
Tabla 17
Categoría de muestra
Muestra # Correcto Incorrecto Ningún ensayo % de Precisión
ToO conocido
15 11 3 1 79
CUP resuelto
22 17 4 1 81
CUP no resuelto
11 8 N/a 3 73
Ejemplo 5
Límites del ensayo de CUP
La figura 8 representa los resultados obtenidos, utilizando los métodos descritos en los Ejemplos 1-3, para determinar los límites de los ensayos de CUP. Se puso a prueba el rendimiento del ensayo a lo largo de un intervalo de concentraciones de ARN y se descubrió que los ensayos de CUP son eficaces en el intervalo de 100 ng - 12,5 ng de ARN.
Ejemplo 6
Ensayo qRTPCR
Materiales y métodos. Muestras de tejido congeladas para análisis de micromatrices. Se utilizó un total de 700 tejidos humanos primarios congelados para los perfiles de micromatrices de expresión génica. Las muestras se obtuvieron de diversas instituciones académicas, como la Universidad de Washington (St. Louis, MO), el Centro Médico Erasmus (Rotterdam, Países Bajos) y empresas de banco de tejidos comerciales, incluidas Genomics Collaborative, Inc (Cambridge, MA), Asterand (Detroit, MI), Oncomatrix (La Jolla, CA) y Clinomics Biosciences (Pittsfield, MA). Para cada muestra, se recogió también información clínica, patológica y demográfica del paciente. Se revisaron las características histopatológicas de cada muestra para confirmar el diagnóstico, y para hacer una estimación de la conservación de la muestra y del contenido del tumor.
Extracción de ARN e hibridación con Affymetrix Gene Chip. Se diseccionaron muestras de cáncer congeladas con más de un 70% de células tumorales, benignas y muestras normales, y se homogeneizaron con un homogeneizador mecánico (UltraTurrex T8, Alemania) en reactivo Trizol (Invitrogen, Carlsbad, CA). Se homogeneizó el tejido en reactivo Trizol siguiendo el protocolo estándar de Trizol para el aislamiento de ARN a partir de tejidos congelados (Invitrogen, Carlsbad, CA). Después de la centrifugación se recogió la fase líquida superior y se hizo precipitar el ARN total con alcohol isopropílico a -20ºC. Los sedimentos de ARN se lavaron con etanol al 75%, se resolvieron en agua y se almacenaron a -80°C hasta su uso.
Se examinó la calidad del ARN con un equipo Agilent 2100 Bioanalyzer RNA 6000 Nano Assay (Agilent Technologies, Palo Alto, CA). Se preparó el ARNc marcado y se hibridó con la matriz de oligonucleótidos de alta densidad Hu133A Gene Chip (Affymetrix, Santa Clara, CA), que contenía un total de 22.000 conjuntos de sondas, según el protocolo estándar del fabricante. Se exploraron las matrices utilizando los protocolos y escáneres de Affymetrix. Para su posterior análisis, cada conjunto de sonda se consideró un gen distinto. Los valores de expresión para cada gen se calcularon utilizando el software de análisis Affymetrix Gene Chip MAS 5.0. Todas las matrices cumplían tres estándares de control de calidad: el porcentaje de lectura "actual" para la matriz fue superior al 35%, el factor de escala fue inferior a 12 cuando se escalaba a una intensidad diana global de 600, y el nivel basal medio fue inferior a 150.
Selección de Marcadores candidatos. Para la selección de los Marcadores candidatos de tejido de origen (ToO) para tejidos de pulmón, colon, mama, ovario y próstata, se midieron los niveles de expresión de los conjuntos de sonda en las muestras de ARN incluyendo un total de 682 tejidos normales, benignos y cancerosos de mama, colon, pulmón, ovario, próstata. Los Marcadores candidatos específicos de tejido se seleccionaron en base al número de consultas estadísticas.
Con el fin de generar candidatos pancreáticos, se utilizaron perfiles de expresión génica de 13 muestras de adenocarcinoma ductal pancreático primario, 5 muestras normales de páncreas y 98 muestras de cáncer de pulmón, colon, mama y ovario para seleccionar los Marcadores de adenocarcinoma pancreático. Se realizaron dos consultas. En la primera consulta, se creó un conjunto de datos contenía 14.547 genes con al menos 2 lecturas “actuales” en muestras de páncreas. Se identificó un total de 2.736 genes que se sobreexpresaban en el cáncer de páncreas en comparación con la normalidad mediante la t de Student (p <0,05). Se seleccionaron los genes cuya mínima expresión en el 11º percentil de cáncer de páncreas era al menos 2 veces superior al máximo en el cáncer de colon y de pulmón, generando 45 conjuntos de sondas. Como etapa final, se seleccionaron 6 genes con una expresión máxima al menos 2 veces superior a la máxima expresión en cánceres de colon, pulmón, mama y ovario. En una segunda consulta, se creó un conjunto de datos de 4.654 conjuntos de sondas con un máximo de 2 lecturas “actuales” en las muestras de mama, colon, pulmón y ovario. Se seleccionó un total de 160 genes con al menos 2 lecturas “actuales” en muestras normales y cancerosas de páncreas. De los 160 genes, se seleccionaron 10 genes después de comparar su nivel de expresión entre los tejidos normales y de páncreas. Se combinaron los resultados de ambas consultas de páncreas.
Además del análisis de los perfiles de expresión génica, se seleccionaron algunos Marcadores de la literatura. Se combinaron los resultados de todas las consultas para crear una lista corta de Marcadores candidatos ToO para cada tipo de tejido. Se hizo una estimación de la sensibilidad y la especificidad de cada Marcador. Los Marcadores que demostraron la mayor capacidad para diferenciar los tejidos por su origen se designaron para el ensayo de RT-PCR en base a la redundancia y complementariedad de los Marcadores.
Tejidos de CUP y de carcinoma metastásico FFPE de origen conocido. Se adquirió un total de 386 carcinomas metastásicos FFPE (estadio III-IV) de origen conocido y 24 adenocarcinomas primarios de próstata FFPE de diversos proveedores comerciales, incluidos Proteogenex (Los Angeles, CA), Genómica Collaborative, Inc. (Cambridge, MA), Asterand (Detroit, MI), Ardáis (Lexington, MA) y Oncomatrix (La Jolla, CA). Se obtuvo un conjunto independiente de 48 tejidos de CUP y de carcinoma metastásico de primario conocido, de Albany Medical College (Albany, NY). Para cada muestra, se recogió información clínica, patológica y demográfica del paciente. Se revisaron las características histopatológicas de cada muestra para confirmar el diagnóstico, y para hacer una estimación de la conservación de la muestra y del contenido del tumor. Para las muestras metastásicas, se establecieron de manera inequívoca los diagnósticos de carcinoma metastásico y ToO en base a la historia clínica del paciente y la evaluación histológica del carcinoma metastásico en comparación con los correspondientes primarios.
Aislamiento de ARN a partir de muestras FFPE. El aislamiento de ARN a partir de secciones de tejido en parafina fue tal como se describe en el manual del kit High Pure RNA Paraffin (Roche) con las siguientes modificaciones. Las muestras de tejido incluidas en parafina se seccionaron según el tamaño de la metástasis incluida (2-5 mm = 9 X 10 µm, 6-8 mm = 6 X 10 µm, 8-≥ 10 mm = 3 X 10 µm). Las secciones se desparafinaron como se describe en el manual del kit, el sedimento de tejido se secó en un horno a 55°C durante 5-10 minutos y se resuspendió en 100 µl de tampón de lisis tisular, 16 µl de SDS al 10% y 80 µl de proteinasa K. Las muestras se agitaron en vórtex y se incubaron en un agitador-calentador puesto a 400 rpm durante 2 horas a 55°C. El posterior procesamiento de la muestra se realizó según el manual del kit High Pure RNA Paraffin. Las muestras se cuantificaron mediante lecturas de OD 260/280 obtenidas mediante un espectrofotómetro y las muestras se diluyeron a 50 ng/µl. El ARN aislado se almacenó en agua libre de ARNasa a -80°C hasta su uso.
qRTPCR para el cribado previo de Marcadores candidatos. Se sometió a transcripción inversa con hexámeros aleatorios un µg de ARN total de cada muestra, utilizando la transcriptasa inversa Superscript II según las instrucciones del fabricante (Invitrogen, Carlsbad, CA). Los cebadores y las sondas MGB para los Marcadores génicos candidatos ensayados y el gen de control ACTB se diseñaron utilizando el software Primer Express (Applied Biosystems, Foster City, CA), o bien se utilizó ABI Assay-on-Demand (Applied Biosystems, Foster City, CA). Se ensayaron todos los cebadores y sondas de diseño propio para una eficacia de amplificación óptima superior al 90%. La amplificación por RT-PCR se llevó a cabo en una mezcla de reacción de 20 ml que contenía 200 ng de ADNc molde, 2 x de mezcla TaqMan® Universal PCR Master Mix (10 ml) (Applied Biosystems, Foster City, CA), 500 nM de cebadores directo e inverso y 250 nM de sonda. Las reacciones se llevaron a cabo en un sistema de detección de secuencias ABI PRISM 7900HT (Applied Biosystems, Foster City, CA). Las condiciones de ciclación fueron: 2 minutos de activación de AmpErase UNG a 50ºC, 10 minutos de activación de la polimerasa a 95°C y 50 ciclos a 95°C durante 15 segundos y temperatura de hibridación (60°C) durante 60 segundos. En cada ensayo, se incluyó por duplicado el control "no molde" junto con ADNc molde para el gen de interés y para el gen de control. La expresión relativa de cada gen diana se representó como ∆Ct, que es igual al Ct del gen diana menos el Ct del gen de control (ACTB).
qRTPCR de una sola etapa optimizada. Se utilizaron los números de referencia de la secuencia de referencia del ARNm apropiada junto con Oligo 6.0 para desarrollar los ensayos de CUP TaqMan® (Marcadores de pulmón: proteína B asociada a surfactante pulmonar humana (HUMPSPBA), factor de transcripción tiroideo 1 (TTF1), desmogleína 3 (DSG3), Marcador colorrectal: cadherina 17 (CDH17), Marcadores de mama: mamaglobina (MG), factor de transcripción Ets derivado de próstata (PDEF), Marcador de ovario: tumor de Wilms 1 (WT1), Marcadores pancreáticos: antígeno de células madre de próstata (PSCA), factor de coagulación V (F5), Marcador prostático: calicreína 3 (KLK3)) y ensayos de mantenimiento beta actina (β-actina), hidroximetilbilano sintasa (PBGD). Los cebadores específicos de gen y las sondas de hidrólisis para el ensayo de qRT-PCR de una sola etapa optimizado se enumeran en la Tabla 2 (SEQ ID NO: 11-58). Se excluyó la amplificación de ADN genómico diseñando los ensayos alrededor de los sitios de corte y empalme de exón-intrón. Se marcaron las sondas de hidrólisis en el nucleótido 5' con FAM como colorante indicador y en el nucleótido 3' con BHQ1-TT como colorante de extinción interno.
La cuantificación de ARN específico de gen se llevó a cabo en una placa de 384 pocillos en el sistema de detección de secuencias ABI Prism 7900HT (Applied Biosystems). Para cada ciclo del agitador-calentador, se amplificaron los patrones y las curvas patrón. Los patrones para cada Marcador consistieron en transcritos in vitro de genes diana que se diluyeron en ARN portador de riñón de rata a 1x105 copias. Las curvas patrón para los Marcadores de mantenimiento consistieron en transcritos in vitro de genes diana que se sometieron a dilución en serie en ARN portador de riñón de rata a 1x107, 1x105 y 1x103 copias. También se incluyeron en cada ciclo de ensayo controles no diana para asegurar que no hubiese contaminación ambiental. Todas las muestras y los controles se procesaron por duplicado. La qRTPCR se realizó con reactivos de uso general en el laboratorio en una reacción de 10 µl que contenía: tampón de RT-PCR (Bicina/KOH 50 nM pH 8,2, KAc 115 nM, glicerol al 8%, MgCl2 2,5 mM, MnSO4 3,5 mM, 0,5 mM de cada uno de dCTP, dATP, dGTP y dTTP), aditivos (Tris-Cl 2 mM pH 8, albúmina bovina 0,2 mM, trehalosa 150 mM, Tween 20 al 0,002%), mezcla de enzimas (2U de Tth (Roche), 0,4 mg/µl de Ac TP6-25), mezcla de cebador y sonda (0,2 µM de sonda, 0,5 µM de cebadores). Se siguieron los siguientes parámetros de ciclación: 1 ciclo a 95°C durante 1 minuto; 1 ciclo a 55°C durante 2 minutos; rampa 5%; 1 ciclo a 70°C durante 2 minutos; y 40 ciclos de 95°C durante 15 segundos, 58°C durante 30 segundos. Una vez terminada la reacción de PCR, se establecieron los valores iniciales y umbral en el software ABI 7900HT Prism y los valores de Ct calculados se exportaron a Microsoft Excel.
Reacción de una sola etapa vs. de dos etapas. Para comparar las reacciones de RT-PCR de dos etapas y de una sola etapa, se llevó a cabo la síntesis de la primera hebra de la reacción de dos etapas utilizando 100 ng de hexámeros aleatorios o cebadores específicos de gen por reacción. En la primera etapa, se calentaron 11,5 µl de Mezcla-1 (cebadores y 1 µg de ARN total) a 65°C durante 5 minutos y a continuación se enfriaron en hielo. Se añadieron a la Mezcla-1, 8,5 µl de Mezcla-2 (1x de tampón, DTT 0,01 mM, 0,5 mM de cada dNTP, 0,25 U/µl de RNasin®, 10 U/µl de Superscript III) y se incubó a 50°C durante 60 minutos, seguido de 95°C durante 5 minutos. El ADNc se almacenó a -20°C hasta el momento de utilizarlo. La qRTPCR para la segunda etapa de la reacción de dos etapas se realizó como se ha indicado anteriormente con los siguientes parámetros de ciclación: 1 ciclo a 95°C durante 1 minuto; 40 ciclos de 95°C durante 15 segundos, 58°C durante 30 segundos. La qRTPCR para la reacción
de una sola etapa se realizó exactamente como se ha indicado en el párrafo anterior. La reacción de una sola etapa y la de dos etapas se llevaron a cabo en 100 ng de molde (ARN/ADNc). Una vez terminada la reacción de PCR, se establecieron los valores inicial y umbral en el software ABI 7900HT Prism y los valores de Ct calculados se exportaron a Microsoft Excel.
Desarrollo del algoritmo. Se construyeron discriminadores lineales utilizando la función de biblioteca MASS (Venables y Ripley) '1da' en el lenguaje R (versión 2.1.1). El modelo utilizado depende del tejido del que se extrajo la metástasis, así como del género del paciente. Cuando se encuentra un sitio de metástasis de pulmón, colon u ovario, se establece en cero la clase distribución de probabilidad a priori para la clase que es equivalente al sitio de metástasis. Además, se establece en cero la probabilidad a priori para la clase mama y ovario en los pacientes masculinos, mientras que en pacientes femeninas, la distribución de probabilidad a priori de la clase próstata se establece en cero. Todas las demás probabilidades a priori utilizadas en los modelos son equivalentes. Además, la clasificación para cada muestra se basa en la probabilidad a posteriori más alta determinada por el modelo para cada clase. Para hacer una estimación del rendimiento de los modelos, se realizó la validación cruzada dejando uno fuera. Además de esto, los conjuntos de datos se dividieron al azar en mitades, preservando al mismo tiempo la relación proporcional entre cada clase, en conjuntos de entrenamiento y de ensayo. Esta división aleatoria se repitió tres veces.
Resultados. El objetivo de este estudio fue desarrollar un ensayo qRTPCR para predecir el tejido de origen del carcinoma metastásico. El trabajo experimental consistió en dos partes principales. La primera parte incluía la designación de Marcadores candidatos específicos de tejido, su validación en tejidos de carcinoma metastásico FFPE y la selección de diez Marcadores para el ensayo (figura 9A.). La segunda parte incluía la optimización del ensayo qRTPCR seguida de la implementación del ensayo en otro conjunto de carcinomas metastásicos FFPE, la construcción de un algoritmo de predicción, su validación cruzada y la validación en un conjunto independiente de muestras (figura 9B).
Características de la muestra. Se utilizó ARN de un total de 700 muestras de tejido primario congelado para la determinación del perfil de expresión génica y la identificación de genes específicos del tipo de tejido. Las muestras incluyeron 545 carcinomas primarios (29 de pulmón, 13 de páncreas, 315 de mama, 128 de colorrectal, 38 de próstata, 22 de ovario), 37 lesiones benignas (1 de pulmón, 4 de colorrectal, 6 de mama, 26 de próstata) y 118 tejidos normales (36 de pulmón, 5 de páncreas, 36 de colorrectal, 14 de mama, 3 de próstata, 24 de ovario).
En el estudio se utilizó un total de 375 carcinomas metastásicos de origen conocido (estadio III-IV) y 26 muestras de adenocarcinoma primario de próstata. Los carcinomas metastásicos de origen pulmonar, pancreático, colorrectal, ovárico, prostático, así como otros tipos de cáncer. La categoría de muestra "otro" consistió en metástasis derivadas de tejidos distintos de pulmón, páncreas, colon, mama, ovario y próstata. Las características de los pacientes se resumen en la Tabla 18.
Tabla 18
CUP
Conjunto de
metastasico
Muestras
Número total
401 48
Promedio de edad
57,8±11* 62,13±11,7
Genero
Femenino 241 20
Masculino
160 28
Tejido de origen
Pulmón
65 9
Páncreas
63 2
Colorrectal
61 4
Mama
63 5
Ovario
82 2
Próstata
27 2
Riñón
8 8
Estómago
7 0
Otro**
25 5
Carcinoma de primario desconocido
11
Diagnóstico histopatológico
Adenocarcinoma, moderadamente/bien diferenciado
306 27
Adenocarcinoma, poco diferenciado
49 4
Carcinoma de células escamosas
16 5
Carcinoma poco diferenciado
16 10
Carcinoma de células pequeñas
3
Melanoma
5
Linfoma
3
Carcinoma hepatocelular
2
Mesotelioma
1
Otro***
14 2
Sitio de metástasis
Nódulos linfáticos
73 1
Cerebro
17 14
Pulmón
20 7
Hígado
75 11
Región pélvica (ovario, vejiga, trompas de falopio)
53 2
Abdomen (epiplón (epiplón, mesenterio, colon,
91 5
peritoneo)
Otro (piel, tiroides, pared torácica, zona umbilical)
44 8
Desconocido
2
Primario (próstata)
26
* Se desconoce la edad de 26 pacientes
** esófago, vejiga, pleura, vesícula biliar del hígado, conductos biliares, laringe, faringe, linfoma no Hodgkin *** de células pequeñas, mesotelioma, hepatocelular, melanoma, linfoma
Las muestras se separaron en dos conjuntos: el conjunto de validación (205 muestras), que se utilizó para validar la expresión diferencial específica de tejido de los Marcadores candidatos y el conjunto de entrenamiento (260 muestras), que se utilizó para ensayar el procedimiento qRTPCR de una sola etapa optimizado y entrenar un algoritmo de predicción. El primer conjunto de 205 muestras incluyó 25 metástasis de cáncer de pulmón, 41 de páncreas, 31 de colorrectal, 33 de mama, 33 de ovario, 1 de próstata, 23 de otras metástasis de cáncer y 18 cánceres primarios de próstata. El segundo conjunto consistió en 260 muestras que incluyeron 56 metástasis de cáncer de pulmón, 43 de páncreas, 30 de colorrectal, 30 de mama, 49 de ovario, 32 de otras metástasis de cáncer y 20 cánceres primarios de próstata. Sesenta y cuatro muestras, incluidas 16 metástasis de pulmón, 21 de páncreas, 15 de otras metástasis, y 12 carcinomas primarios de próstata fueron del mismo paciente en ambos conjuntos.
El conjunto independiente de muestras obtenido de Albany Medical College estaba compuesto por 33 muestras de CUP con un primario sugerido para 22 de ellos, y 15 carcinomas metastásicos de origen conocido. Para los CUP con un primario sugerido, el diagnóstico se hizo en base a las características morfológicas y/o a los resultados de ensayo con un panel de Marcadores IHC. Las características demográficas, clínicas y patológicas de los pacientes se presentan en la Tabla 18.
Selección de Marcadores candidatos. El análisis de los perfiles de expresión génica de 5 tipos de tejidos primarios (pulmón, colon, mama, ovario, próstata) dio como resultado la designación de los 13 Marcadores candidatos específicos de tejido para el ensayo qRTPCR. Se han identificado los mejores candidatos en estudios
anteriores de cánceres in situ. Argani et al. (2001); Backus et al. (2005); Cunha et al. (2005); Borgono et al. (2004); McCarthy et al. (2003); Hwang et al. (2004); Fleming et al. (2000); Nakamura et al. (2002); y Khoor et al. (1997). Además del análisis de los datos de micromatriz, se seleccionaron dos Marcadores de la literatura, incluido un Marcador DSG3 complementario de carcinoma de células escamosas de pulmón y el Marcador de mama PDEF. Backus et al. (2005). Los datos de micromatriz confirmaron la elevada sensibilidad y especificidad de estos Marcadores.
Se utilizó un enfoque especial para identificar los Marcadores específicos de páncreas. En primer lugar, se analizaron cinco Marcadores candidatos de páncreas: antígeno de células madre de próstata (PSCA), inhibidor de serin-proteinasa, clado A miembro 1 (SERPINA1), citoqueratina 7 (KRT7), metaloproteasa de matriz 11 (MMP11) y mucina 4 (MUC4) (Varadhachary et al. (2004); Argani et al. (2001); Jones et al. (2004); Prasad et al. (2005); y Moniaux et al. (2004)) utilizando micromatrices de ADN y un panel de 13 adenocarcinomas ductales pancreáticos, cinco tejidos normales de páncreas y 98 muestras de tumores de mama, colorrectal, de pulmón y de ovario. Sólo PSCA demostró sensibilidad moderada (se detectaron seis de trece o el 46% de los tumores pancreáticos) con elevada especificidad (91 de 98 o el 93% se identificaron correctamente como no de origen pancreático). Por el contrario, KRT7, SERPINA1, MMP11 y MUC4 demostraron una sensibilidad del 38%, 31%, 85% y 31%, respectivamente, con especificidades del 66%, 91%, 82% y 81%, respectivamente. Estos datos estaban en concordancia con la qRTPCR realizada en 27 metástasis de origen pancreático y 39 metástasis de origen no pancreático para todos los Marcadores excepto para MMP11 que presentó la sensibilidad y especificidad más escasas con qRTPCR y las metástasis. En conclusión, los datos de micromatriz en tejido primario congelado de forma instantánea, sirve como buen indicador de la capacidad del Marcador para identificar una metástasis FFPE como de origen pancreático utilizando qRTPCR, aunque pueden resultar útiles Marcadores adicionales para un rendimiento óptimo.
El adenocarcinoma ductal pancreático se desarrolla a partir de células del epitelio ductal que comprenden sólo un pequeño porcentaje de todas las células pancreáticas (comprendiendo las células acinares y de los islotes la mayoría) en el páncreas normal. Además, los tejidos de adenocarcinoma pancreático contienen una cantidad significativa de tejido normal adyacente. Prasad et al. (2005); e Ishikawa et al. (2005). Debido a esto, los Marcadores pancreáticos candidatos se enriquecieron para los genes elevados en el adenocarcinoma de páncreas con respecto a las células pancreáticas normales. El primer método de consulta devolvió seis conjuntos de sondas: factor de coagulación V (F5), una proteína hipotética FLJ22041 similar a proteínas de unión a FK506 (FKBP10), integrina beta 6 (ITGB6), transglutaminasa 2 (TGM2), ribonucleoproteína nuclear heterogénea A0 (HNRP0) y BAX delta (BAX). El segundo método de consulta (véase la sección de Materiales y Métodos para más detalles) devolvieron ocho conjuntos de sondas: F5, TGM2, factor de transcripción 1 de homeodominio similar a paired (PITX1), ARNm isoforma trio (TRIO), ARNm para p73H (p73), una proteína desconocida para MGC:10264 (SCD) y dos conjuntos de sondas para claudina18.
Se seleccionó un total de 23 Marcadores candidatos específicos de tejido para su posterior validación mediante RT-PCR en tejidos FFPE de carcinoma metastásico mediante qRT-PCR. Los Marcadores candidatos se ensayaron en 205 carcinomas metastásicos FFPE, de pulmón, páncreas, colon, mama, ovario, próstata y carcinomas primarios de próstata. La Tabla 19 proporciona los símbolos de genes de los Marcadores específicos de tejido seleccionados para la validación por RT-PCR y también resume los resultados de los ensayos realizados con estos Marcadores.
Tabla 19
Tipo de tejido
SEQ ID NO Método ID Filtros de selección de Marcadores ¿Marcador adecuado?
Micromatriz
Lit. Tejido met. corres. baja expr. Redundancia de Marcador Reactividad cruzada de tejido
Pulmón
1/59 X X X
60
x X X
61
X X X
Páncreas
66 X X
67
X X
71
X X
72
X X
73
X
74
X
75
X
76
X
Colon
4/85 X X X
77
X X
78
X X X
79
X X X
Próstata
9/86 X X X
80
X X X
Mama
63 X X X
81
X X X
64
X X
Ovario
82 X X X
83
X X X
65
X X X
35 De 23 Marcadores ensayados, se rechazaron trece en base a su reactividad cruzada, bajo nivel de expresión en los tejidos metastásicos correspondientes o redundancia. Se seleccionaron diez Marcadores para la versión final del ensayo. Los Marcadores pulmonares fueron proteína B asociada a surfactante pulmonar humana (HUMPSPB), factor de transcripción tiroideo 1 (TTF1) y desmogleína 3 (DSG3). Los Marcadores pancreáticos fueron el antígeno de células madre de próstata (PSCA) y el factor de coagulación V (F5), y el Marcador prostático fue calicreína 3 (KLK3). El Marcador colorrectal fue cadherina 17 (CDH17). Los Marcadores de mama fueron mamaglobina (MG) y factor de transcripción Ets derivado de próstata (PDEF). El Marcador de ovario fue tumor de Wilms 1 (WT1). En la figura 10 se presentan los valores de expresión relativos normalizados medios de los Marcadores seleccionados en diferentes tejidos metastásicos.
45 Optimización de la preparación de muestras y qRT-PCR utilizando tejidos FFPE. A continuación, se optimizaron los métodos de qRTPCR y aislamiento de ARN utilizando tejidos fijados antes de examinar el rendimiento del panel de Marcadores. En primer lugar, se analizó el efecto de la reducción del tiempo de incubación con proteinasa K de dieciséis horas a 3 horas. No hubo ningún efecto sobre el rendimiento. Sin embargo, algunas muestras presentaron fragmentos más largos de ARN cuando se utilizó la etapa de proteinasa K más corta (figura 11A, B). Por ejemplo, cuando el ARN se aisló a partir de un bloque de un año (C22), no se observó ninguna diferencia en los electroferogramas. Sin embargo, cuando el ARN se aisló a partir de un bloque de cinco años (C23), se observó una fracción mayor de ARN de mayor peso molecular, según lo evaluado por la joroba en el hombro, cuando se utilizó la digestión con proteinasa K más corta. Esta tendencia se mantuvo generalmente cuando se
55 procesaron otras muestras, independientemente del órgano de origen para la metástasis FFPE. En conclusión, acortar el tiempo de digestión con proteinasa K no sacrifica el rendimiento de ARN y puede ayudar a aislar ARN menos degradado y más largo.
A continuación, se compararon tres métodos diferentes de transcripción inversa: transcripción inversa con hexámeros aleatorios seguida de qPCR (dos etapas), transcripción inversa con un cebador específico de gen seguida de qPCR (dos etapas) y qRTPCR de una sola etapa utilizando cebadores específicos de gen. Se aisló ARN de once metástasis y se compararon los valores de Ct entre los tres métodos para β-actina, HUMSPB (figura 11C, D) y TTF. Los resultados mostraron diferencias estadísticamente significativas (p <0,001) para todas las comparaciones. Para ambos genes, la transcripción inversa con hexámeros aleatorios seguida de qPCR (reacción 65 de dos etapas) dio los valores más altos de Ct mientras que la transcripción inversa con un cebador específico de gen seguida de qPCR (reacción de dos etapas) dio valores de Ct ligeramente más bajos (pero estadísticamente
significativos) que la reacción de 1 etapa correspondiente. Sin embargo, la RT-PCR de dos etapas con cebadores específicos de gen tenía una etapa de transcripción inversa más larga. Cuando los valores de Ct de HUMSPB se normalizaron al valor de β-actina correspondiente para cada muestra, no hubo diferencias en los valores de Ct normalizados entre los tres métodos. En conclusión, la optimización de las condiciones de reacción de RT-PCR puede generar valores de Ct más bajos, lo que ayuda a analizar los bloques de parafina más viejos (Cronin et al. (2004)), y una reacción de RTPCR de una sola etapa con cebadores específicos de gen puede generar valores de Ct comparables a los generados en la reacción de dos etapas correspondiente.
Rendimiento diagnóstico del ensayo qRTPCR optimizado. Se realizaron 12 reacciones de qRTPCR (10 Marcadores y 2 genes de mantenimiento) en un nuevo conjunto de 260 metástasis FFPE. Veintiún muestras dieron valores de Ct altos para los genes de mantenimiento por lo que sólo se utilizaron 239 en un análisis de mapa de calor. El análisis de los valores de Ct normalizados en un mapa de calor reveló la alta especificidad de los Marcadores de mama y próstata, una especificidad moderada de los de colon, pulmón y ovario, y una especificidad algo más baja de los Marcadores pancreáticos (figura 12). La combinación de los datos de qRTPCR normalizados con refinamiento computacional mejora el rendimiento del panel de Marcadores.
Utilizando los valores de expresión, normalizados a la media de la expresión de dos genes de mantenimiento, se desarrolló un algoritmo para predecir el tejido metastásico de origen combinando los datos de qRTPCR normalizados con el algoritmo y se determinó la precisión del ensayo qRTPCR realizando una validación cruzada dejando uno fuera (LOOCV). Para los seis tipos de tejidos incluidos en el ensayo, se estimó por separado que tanto el número de lecturas falsos positivos, cuando una muestra se predijo erróneamente como otro tipo de tumor incluido en el ensayo (páncreas como de colon, por ejemplo), como el número de veces que una muestra no se predijo como aquellos incluidos en los tipos de tejidos de ensayo (otros). Los resultados de la LOOCV se presentan en la Tabla 20.
Tabla 20
Tejido de origen
Predicción
Mama Colon Pulmón Ovario Páncreas Próstata Otro Total
Mama
22 0 2 1 1 0 0
Colon
1 27 3 2 4 0 4
Pulmón
1 2 45 2 3 0 5
Otro
1 1 3 1 4 0 16
Ovario
5 0 0 43 0 0 1
Páncreas
0 0 3 0 31 0 6
Próstata
0 0 0 0 0 20 0
Total
30 30 56 49 43 20 32 260
#Correcto
22 27 45 43 31 20 16 204
Precisión
72,3 90,0 87,8 87,8 72,1 100,0 50,0 78,5
El tejido de origen se predijo correctamente para 204 de 260 muestras analizadas, con una precisión global del 78%. Una proporción significativa de las lecturas falsos positivos se debieron a la reactividad cruzada de los Marcadores en tejidos histológicamente similares. Por ejemplo, tres carcinomas metastásicos de células escamosas de origen faríngeo, laríngeo y esofágico se predijeron erróneamente como pulmonar debido a la expresión de DSG3 en estos tejidos. La expresión positiva de CDH17 en carcinomas distintos del GI de colon, incluidos estómago y páncreas, hicieron que se clasificaran erróneamente como de colon 4 de 6 metástasis de cáncer de estómago ensayadas y 3 de 43 metástasis de cáncer de páncreas ensayadas.
Además de un ensayo LOOCV, los datos se dividieron aleatoriamente en 3 pares de conjuntos de ensayo y de entrenamiento separados. Cada división contenía aproximadamente un 50% de las muestras de cada clase. A divisiones 50/50 en tres pares de conjuntos de ensayo y de entrenamiento separados, las precisiones de clasificación globales del ensayo fueron 77%, 71% y 75%, lo que confirma la estabilidad de rendimiento del ensayo.
Por último, se ensayó otro conjunto independiente de 48 carcinomas metastásicos FFPE que incluía carcinoma metastásico de origen primario conocido, muestras de CUP con un diagnóstico de tejido de origen emitido por la evaluación patológica incluida IHC y muestras de CUP que siguieron siendo CUP después del ensayo IHC. Se hizo una estimación por separado de la precisión de la predicción del tejido de origen para cada categoría de muestras. La Tabla 21 resume los resultados de ensayo.
Tabla 21
Ensayado
Correcto Precisión
Met. conocida
15 11 73,3
CUP resuelto
22 17 77,3
CUP no resuelto
11
La predicción del tejido de origen concordaba, con sólo unas pocas excepciones, con el diagnóstico del tejido de origen o primario conocido evaluado mediante evaluación clínica/patológica incluida IHC. Al igual que en el conjunto de entrenamiento, el ensayo no fue capaz de diferenciar los carcinomas de células escamosas procedentes de diferentes fuentes y se predijeron falsamente como de pulmón.
El ensayo también realizó diagnósticos de supuesto tejido de origen para ocho de once muestras que siguieron siendo CUP después de ensayos de diagnóstico convencionales. Uno de los casos CUP fue especialmente interesante. Se diagnosticó carcinoma metastásico en pulmón y pleura a un paciente masculino con antecedentes de cáncer de próstata. Los ensayos de PSA en suero e IHC con anticuerpos para PSA en el tejido metastásico dieron negativo, por lo que el diagnóstico del patólogo fue de CUP con una inclinación hacia los tumores gastrointestinales. El ensayo predijo claramente (probabilidad a posteriori del 0,99) que el tejido de origen era colon.
Análisis. En este estudio, se utilizó la determinación de perfiles de expresión en base a micromatrices de tumores primarios para identificar Marcadores candidatos para su uso con metástasis. El hecho de que los tumores primarios pueden utilizarse para descubrir Marcadores del tumor de origen para las metástasis concuerda con varios hallazgos recientes. Por ejemplo, Weigelt y colaboradores han demostrado que los perfiles de expresión génica de tumores primarios de mama se mantienen en las metástasis distantes. Weigelt et al. (2003). Backus y colaboradores identificaron supuestos Marcadores para detectar metástasis de cáncer de mama utilizando un análisis de expresión génica de todo el genoma de mama y otros tejidos y demostraron que la mamaglobina y CK19 detectaban metástasis clínicamente tratables en los ganglios linfáticos centinela de mama con un 90% de sensibilidad y un 94% de especificidad. Backus et al. (2005).
Durante el desarrollo del ensayo, la selección se centró en seis tipos de cáncer, incluido pulmón, páncreas y colon que se encuentran entre los más prevalentes en el CUP (Ghosh et al. (2005); y Pavlidis et al. 2005)) y mama, ovario y próstata para los cuales el tratamiento podría ser potencialmente más beneficioso para los pacientes. Ghosh et al. (2005). Sin embargo, pueden añadirse al panel Marcadores y tipos de tejido adicionales, siempre y cuando no se comprometa la precisión global del ensayo y, en su caso, no se afecte a la logística de las reacciones de RT-PCR.
Los estudios basados en micromatrices con tejido primario confirmaron la especificidad y la sensibilidad de los Marcadores conocidos. Como resultado, la mayoría de los Marcadores específicos de tejido tiene una alta especificidad para los tejidos estudiados en el presente documento. Un estudio reciente descubrió que, mediante IHC, PSCA se sobreexpresa en las metástasis de cáncer de próstata. Lam et al. (2005). Dennis et al. (2002) también demostraron que podría utilizarse PSCA como Marcador del tumor de origen para páncreas y próstata. Hubo una fuerte expresión de PSCA en algunos tejidos de próstata a nivel del ARN pero, debido a la inclusión del PSA en el ensayo, ya pueden separarse los cánceres de próstata y de páncreas. Un nuevo hallazgo de este estudio fue el uso de F5 como Marcador complementario (para PSCA) para tejido de origen pancreático. Tanto en el conjunto de datos de micromatriz con el tejido primario como en los datos de qRTPCR establecidos con metástasis FFPE, se descubrió que F5 complementaba a PSCA.
Investigadores anteriores han generado ensayos de CUP mediante IHC (Brown et al. (1997). DeYoung et al. 2000); y Dennis et al. (2005a)) o micromatrices. Su et al. (2001); Ramaswamy et al. (2001); y Bloom et al. (2004). Más recientemente, se ha acoplado SAGE a un pequeño panel de Marcadores qRTPCR. Dennis et al. (2002); y Buckhaults et al. (2003). Este estudio es el primero en combinar la determinación de perfiles de expresión basada en micromatrices con un pequeño panel de ensayos de qRTPCR. Los estudios de micromatrices con tejido primario identificaron algunos, pero no todos, de los mismos Marcadores de tejido de origen que los identificados anteriormente mediante estudios SAGE. Este hallazgo no resulta sorprendente dados los estudios que han demostrado que existe una concordancia moderada entre los datos de perfiles basados en micromatrices de ADN y basados en SAGE y que la correlación mejora para los genes con niveles de expresión más altos. Van Ruissen et al. (2005); y Kim et al. (2003). Por ejemplo, Dennis y colaboradores identificaron PSA, MG, PSCA y HUMSPB mientras que Buckhaults y colaboradores (Buckhaults et al. (2003)) identificaron PDEF.
La ejecución del ensayo de CUP se realiza preferentemente mediante qRTPCR debido a que es una tecnología robusta y puede tener ventajas de rendimiento frente a IHC. Al-Mulla et al. (2005); y Haas et al. (2005). Además, como se muestra en el presente documento, se ha mejorado el protocolo qRTPCR mediante el uso de cebadores específicos de gen en una reacción de una sola etapa. Esta es la primera demostración de la utilización de cebadores específicos de gen en una reacción qRTPCR de una sola etapa con tejido FFPE. Otros investigadores han realizado una qRTPCR de dos etapas (síntesis de ADNc en una reacción seguida de qPCR) o han utilizado
hexámeros aleatorios o cebadores específicos de gen truncados. Abrahamsen et al. (2003); Specht et al. (2001); Godfrey et al. (2000); Cronin et al. (2004); y Mikhitarian et al. (2004).
En resumen, la precisión global del 78% del ensayo para seis tipos de tejido supera a otros estudios. Brown 5 et al. (1997); DeYoung et al. (2000); Dennis et al. (2005a); Su et al. (2001); Ramaswamy et al. (2001); y Bloom et al. (2004).
Ejemplo 7
En este estudio se construyeron carteras de marcadores génicos que utilizaban un clasificador, eligiendo de MVO y utilizando este clasificador para predecir el origen del tejido y el estado del cáncer para cinco tipos principales de cáncer incluidos de mama, colon, pulmón, ovario y próstata. Se analizaron 103 muestra de tejido humano normal congelado de forma instantánea, 23 de lesiones epiteliales proliferativas benignas y trescientas setenta y ocho de cáncer primario, mediante Affymetrix Human U133A GeneChip. También se analizaron muestras de leucocitos con
15 el fin de restar la expresión génica potencialmente enmascarada por la co-expresión en células leucocitarias de fondo. Se desarrolló un nuevo método bioinformático basado en MVO para seleccionar carteras de marcadores génicos para los tejidos de origen y el estado del cáncer. Los datos demostraron que podría utilizarse un panel de 26 genes como clasificador para predecir con precisión el tejido de origen y el estado del cáncer de entre los 5 tipos de cáncer. Por lo tanto, puede obtenerse un método de clasificación de múltiples cánceres determinando los perfiles de expresión génica de un número razonablemente pequeño de marcadores génicos.
La Tabla 22 muestra los Marcadores identificados para los orígenes de tejido indicados. Para las descripciones de los genes, véase la Tabla 31.
25 Tabla 22
Tejido
SEQ ID NO: Nombre
Pulmón
59 SP-B
60
TTF1
61
DSG3
Páncreas
66 PSCA
67
F5
71
ITGB6
72
TGM2
84
HNRPA0
Colon
85 HPT1
77
FABP1
78
CDX1
79
GUCY2C
Próstata
86 PSA
80
hKLK2
Mama
63 MGB1
81
PIP
64
PDEF
Ovario
82 HE4
83
PAX8
65
WT1
El conjunto de muestras incluía un total de 299 carcinomas metastásicos de colon, mama, páncreas, ovario,
próstata, pulmón y otros carcinomas y muestras de cáncer primario de próstata. Se implementó una QC basada en
la evaluación histológica, el rendimiento de ARN y la expresión del gen de control beta-actina. Otras categorías de
65 muestras incluían metástasis originadas a partir de carcinomas de estómago (5), de riñón (6) colangiocarcinoma/de
vesícula biliar (4), de hígado (2), de cabeza y cuello (4), de íleon (1) y un mesotelioma. Los resultados se resumen en la Tabla 23.
Tabla 23
Tipo de tejido
Recogido QC histología QC aislamiento de ARN QC pto. corte ACTB
Pulmón
41 37 36 25
Páncreas
63 57 49 41
Colon
45 42 42 31
Mama
40 35 35 34
Ovario
37 36 35 33
Próstata
27 27 25 19
Otro
46 34 29 23
Total
299 268 251 205
El ensayo de las muestras anteriormente indicadas dio como resultado la reducción del conjunto de Marcadores a los de la Tabla 24, con los resultados que se observan en la Tabla 25.
Tabla 24
Tabla final de Marcadores
Pulmón
proteína asociada a surfactante SP-B
factor de transcripción tiroideo 1
TTF1
desmogleína 3
DSG3
Páncreas
antígeno de células madre de próstata PSCA
factor de coagulación 5
F5
Colon
transportador asociado a péptido intestinal HPT1
Próstata
antígeno específico de próstata PSA
Mama
mamaglobina MGB
Factor de transcripción Ets
PDEF
Ovario
Tumor de Wilms WT1 1
Tabla 25
Cáncer
Muestras # Macador Correcto Sensi. % Incorrecto Espec. %
Pulmón
25/180 SP-B 13/25 52 0/180 100
TTF
12/25 48 1/180 99
DSG3
5/25 20 0/180 100
Páncreas
41/164 PSCA 24/41 59 6/164 96
F5
6/41 15 4/164 98
Colon
31/174 HPT1 22/31 71 2/174 99
Mama
33/172 MGB 23/33 70 3/172 98
PDEF
16/33 48 1/172 99
Próstata
19/186 PSA 19/19 100 0/186 100
PDEF
19/19 100 2/186 99
Ovario
33/172 WT1 24/33 71 1/172 99
Total
205
55 Los resultados demostraron que de 205 tumores metastásicos incluidos en parafina; 166 muestras (81%) presentaron resultados de ensayo concluyentes, Tabla 26.
Tabla 26
Candidato
Correcto Incorrecto Sin Precisión (%)
Pulmón
SP-B + TFF+DSG3 19 0 6 76
Páncreas
PSCA+F5 27 1 13 66
Colon
HPT1 24 2 5 78
Próstata
PSA 19 0 0 100
Mama
MGB + PDEF 23 3 7 70
Ovario
WT1 23 2 8 70
Otro
20 3 87
Global
155 11 39 76
15
De los resultados falsos positivos, muchos falsos provenían de tejidos histológicamente y
embriológicamente similares, Tabla 27.
Tabla 27
ID de la muestra
Diagnóstico Predicho
OV_26
Ovario Mama
Br_24
Mama Colon
Br_37
Mama Colon
CRC_25
Colon Ovario
Pn_59
Páncreas Colon
Cont_27
Estómago Páncreas
Cont_34
Estómago Colon
Cont_35
Estómago Colon
Cont_43
Conducto biliar Páncreas
Cont_44
Conducto biliar Páncreas
Cong_25
Hígado Páncreas
Se consideraron los siguientes parámetros para el desarrollo de modelos:
35 Separar los Marcadores en conjuntos femeninos y masculinos y calcular la probabilidad de CUP por separado para los pacientes masculinos y femeninos. El conjunto masculino incluía: SP_B, TTF1, DSG3, PSCA, F5, PSA, HPT1; el conjunto femenino incluía: SP_B, TTF1, DSG3, PSCA, F5, HPT1, MGB, PDEF, WT1. Se excluyó la expresión de fondo de los resultados de ensayo: Pulmón: SP_B, TTF1, DSG3; Ovario: WT1; y Colón: HPT1.
El modelo CUP se ajustó a la prevalencia de CUP (%): pulmón 23, páncreas 16, colorrectal 9, mama 3,
ovario 4, próstata 2, otro 43. La prevalencia para mama y ovario se ajustó al 0% para los pacientes masculinos y la
próstata se ajustó al 0% para las pacientes femeninas.
45 Se tomaron las siguientes etapas: colocar los Marcadores a escala similar; reducir el número de variables de 12 a 8 seleccionando el valor mínimo de cada conjunto específico de tejido; dejar fuera 1 muestra; construir el modelo a partir de las muestras restantes; ensayar la muestra dejada fuera; repetir hasta haber ensayado el 100% de las muestras; dejar fuera al azar ~50% de las muestras (~50% por tejido); construir el modelo a partir de las muestras restantes; ensayar ~50% de las muestras; y repetir para 3 divisiones aleatorias diferentes.
Se ajustó la precisión de la clasificación a la prevalencia del tipo de cáncer para producir los resultados que se resumen en la Tabla 28 con los datos no tratados que se muestran en la Tabla 29.
Tabla 28
Mama
Colon Pulmón Otro Ovario Pánc. Próstata Gobal Ajustado
Correcto
23 29 22 19 24 35 19 171
Sin ensayo
3 2 2 2 3 0 12
Incorrecto
7 0 1 4 7 3 0 22
Prevalencia
0,03 0,09 0,23 0,43 0,04 0,16 0,02
Ensayados/total %
91 94 92 100 94 93 100 94 95
Correctos/total %
70 94 88 83 73 85 100 89 89
Sin ensayo %
9 6 8 n/a 6 7 0 6 5
Correcto
23 25 19 20 20 24 19 150
Sin ensayo %
7 6 5 10 15 0 43
Incorrecto
3 0 1 3 3 2 0 12
Prevalencia
0,03 0/09 0,23 0,43 0,04 0,16 0,02
Ensayados/total %
79 81 80 100 70 63 100 79 83
Correctos/total %
70 81 76 87 61 59 100 73 76
Correctos/ensayados %
88 100 95 87 87 92 100 93 91
Sin ensayo %
21 19 20 n/a 30 37 0 21 17
Ejemplo 8
Estudio prospectivo de firma genética del cáncer metastásico de sitio primario desconocido CUP para predecir el tejido de origen
El objetivo específico de este estudio era determinar la capacidad de la firma genética de 10 genes para predecir el tejido de origen del carcinoma metastásico en pacientes con carcinoma de origen primario desconocido (CUP).
Objetivo principal: Confirmar la viabilidad de realizar el análisis genético a partir de muestras de biopsia core en pacientes consecutivos con CUP.
Objetivo secundario: correlacionar los resultados del ensayo de RT-PCR de firma genética de 10 genes con la evaluación diagnóstica realizada en el M.D. Anderson Cancer Center (MDACC). Tercer objetivo: Correlacionar la prevalencia 6 tipos de cáncer predichos por el ensayo con la prevalencia proveniente de la literatura y de la experiencia del MDACC.
Se utilizó el método descrito en el presente documento para realizar un análisis de expresión génica con micromatriz de 700 carcinomas primarios congelados, y muestras benignas y normales y marcadores génicos candidatos identificados, específicos para carcinomas de pulmón, páncreas, colon, mama, próstata y ovario. Se ensayaron los marcadores génicos candidatos mediante RT-PCR en 205 muestras fijadas en formalina e incluidas en parafina (FFPE) de carcinoma metastásico (estadio III-IV) originado a partir de pulmón, páncreas, colon, mama, ovario y próstata, así como metástasis originadas a partir de otros tipos de cáncer para el control de la especificidad. Los demás tipos de cáncer metastásico incluían carcinomas gástrico, de células renales, hepatocelular, colangiocarcinoma/de vesícula biliar y de cabeza y cuello. Los resultados permitieron seleccionar una firma genética de 10 genes que predijo el tejido de origen del carcinoma metastásico y dio una precisión global del 76%. El CV medio para mediciones repetidas en los experimentos de RT-PCR es del 1,5%, calculado en base a 4 puntos de datos duplicados. Se utilizó la beta-actina (ACTB) como gen de mantenimiento y la mediana de su expresión fue similar en muestras metastásicas de origen diferente (CV = 5,6%).
El objetivo específico de este estudio era validar la capacidad de la firma genética de 10 genes para predecir el tejido de origen del carcinoma metastásico en los pacientes con CUP en comparación con la evaluación diagnóstica exhaustiva.
Elegibilidad de los pacientes
El paciente debe tener al menos 18 años de edad con un estado funcional ECOG de 0-2. Se aceptaron pacientes con diagnóstico de adenocarcinoma o diagnóstico de carcinoma poco diferenciado. El grupo de pacientes con adenocarcinoma incluye tumores bien, moderadamente y poco diferenciados.
Pacientes han cumplido los criterios para CUP: ningún primario detectado después de una evaluación completa que se define como la historia completa y un examen físico, un examen detallado de laboratorio, estudios de formación de imágenes y estudios invasivos dirigidos a los síntomas o signos. Sólo se permitió participar en el estudio a los pacientes no tratados.
Si un paciente ha sido tratado con quimioterapia o radiación, se permite su participación en el estudio si se dispone de tejido anterior (al tratamiento) en forma de bloques archivados dentro del período de 10 años.
Los pacientes dieron su consentimiento/autorización por escrito para participar en este estudio.
Diseño del estudio
Se permitió participar en el estudio a pacientes con diagnóstico de CUP que se habían sometido a una biopsia core o biopsia por escisión de la lesión metastásica más accesible. Sólo los pacientes con biopsia FNA no fueron elegibles. Se admitió a los primeros 60 pacientes consecutivos que se presentaron que cumplían con los criterios de inclusión y el consentimiento para el estudio. Si el MDACC solicitaba una biopsia repetida para fines de diagnóstico para su tratamiento, se obtenía tejido adicional para el estudio si el paciente daba su consentimiento. Se registró a todos los participantes en el protocolo en el sistema de gestión de datos de pacientes (PDMS) institucional.
Se realizó una evaluación diagnóstica completa, que incluía evaluaciones clínicas y patológicas, en todos los pacientes incluidos según las normas del MDACC. La parte de patología de la evaluación diagnóstica puede haber incluido ensayos de inmunohistoquímica (IHC) con Marcadores que incluían CK-7, CK-20, TTF-1 y otros que el patólogo consideró indicados. Esto es parte del trabajo de rutina de todos los pacientes que se presentan con CUP.
Recogida de muestras de tejido
El estudio incluía muestras de carcinoma metastásico fijadas en formalina e incluidas en parafina recogidas de pacientes con CUP.
Se utilizaron seis secciones de 10 µm para el aislamiento de ARN, las muestras de tejido más pequeñas requieren nueve secciones de 10 µm. Se confirmaron el diagnóstico histopatológico y el contenido del tumor para cada muestra utilizada para el aislamiento de ARN en una sección adicional teñida con hematoxilina y eosina (HE). La muestra de tumor debía tener más de un 30% de contenido del tumor en la sección HE.
Los datos clínicos fueron suministrados de forma anónima a Veridex e incluían la edad del paciente, el sexo, la histología del tumor mediante microscopia óptica, el grado de malignidad del tumor (diferenciación), el sitio de metástasis, la fecha de obtención de la muestra, la descripción de la evaluación diagnóstica realizada para cada paciente.
Procesamiento de tejidos y experimentos de RT-PCR
Se extrajo el ARN total de cada muestra de tejido utilizando el protocolo descrito anteriormente. Sólo se utilizaron las muestras que produjeron más de 1 µm de ARN total de la cantidad estándar de tejido para el posterior ensayo de RT-PCR. Las muestras con menos rendimiento de ARN se consideran degradadas y se excluyeron de los posteriores experimentos. Se llevó a cabo control de la integridad del ARN en base a la expresión de mantenimiento con el fin de excluir las muestras con ARN degradado, según el procedimiento estándar de Veridex.
Se utilizó un ensayo de RT-PCR que incluye un panel de 10 genes y 1-2 genes de control para el análisis de las muestras de ARN. El ensayo de PCR y la transcripción inversa se llevan a cabo utilizando los protocolos descritos anteriormente.
Se calculó el valor de expresión relativa para cada gen ensayado presentado como ∆Ct, que es igual al Ct del gen diana menos el Ct de los genes de control, y se utilizó para la predicción del tejido de origen.
Tamaño de muestra e interpretación de datos
Se estudió un tamaño de muestra limitado de 60 pacientes debido a la naturaleza exploratoria del estudio piloto. Hasta la fecha, se han sometido a ensayo 22 pacientes. Las muestras de un paciente no consiguieron producir suficiente ARN para la RT-PCR y 3 no lograron pasar el control QC evaluado mediante RT-PCR con genes de control. Se utilizó un total de 18 pacientes para determinada la probabilidad de lesión metastásica del paciente.
Se utilizó el modelo estadístico para determinar la probabilidad del tejido de origen del carcinoma metastásico de las siguientes siete categorías: pulmón, páncreas, colon, mama, próstata, ovario y ningún ensayo (otro). Para cada muestra, la probabilidad para cada categoría se calcula a partir de un modelo de clasificación lineal. Los resultados de ensayo se resumen en la Tabla 30.
La probabilidad de lesión metastásica de un paciente (con primarios conocidos) que viene de uno de estos 6 sitios (colon, páncreas, pulmón, próstata, ovario, mama) es de aproximadamente un 76%. Este número proviene de la literatura dada la incidencia de diversos tipos de cáncer y el potencial de propagación y datos no publicados generados en el M.D. Anderson a partir de registro de tumores. Para las muestras ensayadas, la prevalencia de 6 sitios fue del 67% (12 de 18 muestras ensayadas), en estrecha concordancia con las observaciones anteriores.
Tabla 30
Datos del paciente
Probabilidad a posteriori ToO (%)
ID
M/F predicción Mama Colon Pulmón SCC pulmón Otro Ovario Páncreas Próstata
1
M Otro 0,00 0,00 0,81 0,00 98,68 0,00 0,51 0,00
4
F Colon 0,00 99,70 0,00 0,00 0,09 0,20 0,01 0,00
5
M Pulmón 0,00 33,29 52,27 0,01 13,30 0,00 1,13 0,00
6
F Colon 0,00 99,91 0,00 0,00 0,09 0,00 0,00 0,00
2
M Colon 0,00 93,19 0,01 0,00 2,90 0,00 3,90 0,00
10
F Otro 0,02 2,04 0,03 0,03 61,43 1,12 35,34 0,00
16
F Colon 0,00 48,59 0,01 1,57 47,62 0,17 2,05 0,00
22
M SCC pulmón 0,00 8,85 0,01 71,69 11,84 0,00 7,62 0,00
23
M Colon 0,00 99,27 0,01 0,00 0,72 0,00 0,00 0,00
24
F Colon 0,00 90,59 0,00 0,00 2,36 0,00 7,04 0,00
26
F Pulmón 0,00 0,00 99,93 0,00 0,06 0,00 0,01 0,00
17
M Otro 0,00 0,07 0,02 0,09 94,06 0,00 5,77 0,00
19
F Otro 0,02 0,11 0,04 0,22 76,36 23,24 0,01 0,00
21
F Páncreas 0,00 6,97 0,00 0,00 2,37 8,43 82,23 0,00
27
F Otro 0,00 0,04 0,04 0,59 99,06 0,14 0,13 0,00
11
M Otro 0,00 0,23 0,07 0,09 99,52 0,00 0,09 0,00
32
F Ovario 0,00 0,01 0,00 0,00 7,23 92,63 0,13 0,00
34
M SCC pulmón 0,00 0,03 0,00 65,64 7,96 0,00 26,38 0,00
3
F no pasó el ctrl. 0,00 0,00 0,00 0,00 0,00 0,00 0,00 0,00
8
M no pasó el ctrl. 0,00 0,00 0,00 0,00 0,00 0,00 0,00 0,00
20
F no pasó el ctrl. 0,00 0,00 0,00 0,00 0,00 0,00 0,00 0,00
Aunque la invención precedente se ha descrito con cierto detalle a modo de ilustración y ejemplo con fines
de claridad de comprensión, las descripciones y los ejemplos no deben interpretarse como limitativos del alcance de
la invención.
35
45
55
Tabla 31
Nombre
SEQ ID NO Registro Descripción
CDH17
62 NM_004063 cadherina 17
CDX1
78 NM_001804 Factor de transcripción 1 de la caja homeótica
DSG3
61/3 NM_001944 desmogleína 3
F5
67/6 NM_000130 factor de coagulación V
FABP1
71 NM_001443 proteína de unión a ácidos grasos 1, hígado
GUCY2C
79 NM_004963 guanilato ciclasa 2C
HE4
82 NM_006103 supuesto marcador de carcinoma de ovario
KLK2
80 BC005196 calicreína 2, de próstata
HNRPA0
84 NM 006805 ribonucleoproteína nuclear heterogénea A0
HPT1
85/4 U07969 Transportador asociado a péptido intestinal
ITGB6
71 NM_000888 Integrina, beta 6
KLK3
68 NM_001648 calicreina 3
MGB1
63/7 NM_002411 mamaglobina 1
PAX8
83 BC001060 Gen paired box 8
PBGD
70 NM_000190 hidroximetilbilano sintasa
PDEF
64/8 NM_012391 Factor de transcripción Ets que contiene dominio
PIP
81 NM_002652 Proteína inducida por prolactina
PSA
86/9 U17040 Precursor de antígeno específico de próstata
PSCA
66/5 NM_005672 Antígeno de células madre de próstata
SP-B
59/1 NM_198843 proteína B asociada a surfactante pulmonar
TGM2
72 NM 004613 transglutaminasa 2
TTF1
60/2 NM_003317 similar a factor de transcripción tiroideo 1
WT1
65/10 NM_024426 Tumor de Wilms 1
β-actin
69 NM_001101 β-actina
KRT6F
87 L42612 queratina 6 isoforma K6f
p73H
88 AB010153 proteína relacionada con p53
SFTPC
89 NM_003018 proteína C asociada a surfactante pulmonar
KLK10
90 NM_002776 calicreina 10
CLDN18
91 NM_016369 Claudina 18
TR10
92 BD280579 Receptor del factor de necrosis tumoral
B305D
93
B726
94
GABA-pi
95 BC109105 receptor de ácido gamma-aminobutírico A, pi
StAR
96 NM_01007243 reguladora esteroidogénica aguda
EMX2
97 NM 004098 homólogo 2 de espiráculos vacíos (Drosophila)
NGEP
98 AY617079 variante larga de NGEP
NPY
99 NM_000905 neuropéptido Y
SERPINA1
100 NM_000295 inhibidor de serpin peptidasa, clado A miembro 1
KRT7
101 NM_005556 Queratina 7
MMP11
102 NM_005940 metalopeptidasa de matriz 11 (estromelisina 3)
MUC4
103 NM_018406 asociada a mucina 4 de superficie celular
FLJ22041
104 AK025694
BAX
105 NM_138763 Variante ∆ de transcrito proteína asociada a BCL2
PITX1
106 NM_002653 factor 1 de trans de homeodominio similar a paired
MGC:10264
107 BC005807 estearoil-CoA desaturasa (∆-9-desaturasa)
REFERENCIAS Patentes y publicaciones de solicitud de patentes de los Estados Unidos
5242974
5700637 20030194733
5350840
5786148 20030198970
5384261
6004755 20030215803
5405783
6136182 20030215835
5412087
6218114 20030219760
5424186
6218122 20030219767
5429807
6225051 20030232350
5436327
6232073 20030235820
5445934
6261766 20040005563
5472672
6271002 20040009154
5527681
6339148 20040009489
5529756
20010029020 20040018969
5532128
20020055627 20040029114
5545531
20020068288 20040076955
5554501
20020168647 20040126808
5556752
20030044859 20040146862
5561071
20030087818 20040219572
5571639
20030104448 20040219575
5593839
20030124128 20050037010
5599695
20030124579 20050059008
5624711
20030138793 20060094035
5658734
20030190656
Patentes y publicaciones de patentes extranjeras
WO1998040403
WO2001073032 WO2004030615
WO1998056953
WO2002046467 WO2004031412
WO2000006589
WO2002073204 WO2004063355
WO2000055320
WO2002101357 WO2004077060
WO2001031342
WO2004018999 WO2005005601
Artículos de revistas
Abrahamsen et al. (2003) Towards quantitative mRNA analysis in paraffin-embedded tissues using real-time reverse transcriptase-polymerase chain reaction J Mol Diag 5:34-41 Al-Mulla et al. (2005) BRCA1 gene expression in breast cancer: a correlative study between real-time RT-PCR and immunohistochemistry J Histochem Cytochem 53:621-629 Argani et al. (2001) Discovery of new Markers of cancer through serial analysis of gene expression: prostate stem cell antigen is overexpressed in pancreatic adenocarcinoma Cancer Res G1:4320-4324 Autiero et al. (2002) Intragenic amplification and formation of extrachromosomal small circular DNA molecules from the PIP gene on chromosome 7 in primary breast carcinomas Int J Cancer 99:370-377 Backus et al. (2005) Identification and characterization of optimal gene expression Markers for detection of breast cancer metastasis J Mol Diagn 7:327-336 Bentov et al. (2003) The WT1 Wilms’ tumor suppressor gene: a novel target for insulin-like growth factor-I action Endocrinol 144:4276-4279 Bera et al. (2004) NGEP, a gene encoding a membrane protein detected only in prostate cancer and normal prostate Proc Natl Acad Sci USA 101:3059-3064 Bibikova et al (2004) Quantitative gene expression profiling in formalin-fixed, paraffin-embedded tissues using universal bead arrays Am j Pathol 165:1799-1807 Bloom et al. (2004) Multi-platform, multi-site, microarray-based human tumor classification Am J Pathol 164:9-16 Borchers et al. (1997) Heart-type fatty acid binding protein - involvement in growth inhibition and differentiation Prostaglandins Leukot Essent Fatty Acids 57:77-84 Borgono et al. (2004) Human tissue kallikreins: physiologic roles and applications in cancer Mol Cancer Res 2:257-280 Brookes (1999) The essence of SNPs Gene 23:177-186 Brown et al. (1997) Immunohistochemical identification of tumor Markers in metastatic adenocarcinoma. A diagnostic adjunct in the determination of primary site Am J Clin Pathol 107:12-19 Buckhaults et al. (2003) Identifying tumor origin using a gene expression-based classification map Cancer Res 63:4144-4149 Chan et al. (1985) Human liver fatty acid binding protein cDNA and amino acid sequence. Functional and evolutionary implications J Biol Chem 260:2629-2632 Chen et al. (1986) Human liver fatty acid binding protein gene is located on chromosome 2 Somat Cell Mol Genet 12:303-306 Cheung et al. (2003) Detection of the PAX8-PPAR gamma fusion oncogene in both follicular thyroid carcinomas and adenomas J Clin Endocrinol Metab 88:354-357 Clark et al. (1999) The potential role for prolactin-inducible protein (PIP) as a Marker of human breast cancer micrometastasis Br J Cancer 81:1002-1008
Cronin et al. (2004) Measurement of gene expression in archival paraffin-embedded tissue Am J Pathol 164:35-42 Cunha et al. (2006) Tissue-specificity of prostate specific antigens: Comparative analysis of transcript levels in prostate and non-prostatic tissues Cancer Lett 236:229-238 Dennis et al. (2002) Identification from public data of molecular Markers of adenocarcinoma characteristic of the site of origin Can Res 62:5999-6005 Dennis et al. (2005a) Hunting the primary: novel strategies for defining the origin of tumors J Pathol 205:236-247 Dennis et al. (2005b) Markers of adenocarcinoma characteristic of the site of origin: development of a diagnostic algorithm Clin Can Res 11:3766-3772 DeYoung et al. (2000) Immunohistologic evaluation of metastatic carcinomas of unknown origin: an algorithmic approach Semin Diagn Pathol 17:184-193 Di Palma et al. (2003) The paired domain-containing factor Pax8 and the homeodomain-containing factor TTF-1 directly interact and synergistically activate transcription Biol Chem 278:3395-3402 Dwight et al. (2003) Involvement of the PAX8 peroxisome proliferator-activated receptor gamma rearrangement in follicular thyroid tumors J Clin Endocrinol Metab 88:4440-4445 Feldman et al. (2003) PDEF expression in human breast cancer is correlated with invasive potential and altered gene expression Cancer Res 63:4626-4631 Fleming et al. (2000) Mammaglobin, a breast-specific gene, and its utility as a Marker for breast cancer Ann N Y Acad Sci 923:78-89 Fukushima et al. (2004) Characterization of gene expression in mucinous cystic neoplasms of the pancreas using oligonucleotide microarrays Oncogene 23:9042-9051 Ghosh et al (2005) Management of patients with metastatic cancer of unknown primary Curr Probl Surg 42:12-66 Giordano et al. (2001) Organ-specific molecular classification of primary lung, colon, and ovarian adenocarcinomas using gene expression profiles Am J Pathol.159:1231-1238 Glasser et al (1988) cDNA, deduced polypeptide structure and chromosomal assignment of human pulmonary surfactant proteolipid, SPL(pVal) J Biol Chem 263:9-12 Godfrey et al. (2000) Quantitative mRNA expression analysis from formalin-fixed, paraffin-embedded tissues using 5’ nuclease quantitative reverse transcription-polymerase chain reaction J Mol Diag 2:84-91 Goldstein et al. (2002) WT1 immunoreactivity in uterine papillary serous carcinomas is different from ovarian serous carcinomas Am J Clin Pathol 117:541-545 Gradi et al. (1995) The human steroidogenic acute regulatory (StAR) gene is expressed in the urogenital system and encodes a mitochondrial polypeptide Biochim Biophys Acta 1258:228-233 Greco et al. (2004) Carcinoma of unknown primary site: sequential treatment with paclitaxel/carboplatin/etoposide and gemcitabine/irinotecan: A Minnie Pearl cancer research network phase II trial The Oncologist 9:644-652 Haas et al. (2005) Combined application of RT-PCR and immunohistochemistry on paraffin embedded sentinel lymph nodes of prostate cancer patients Pathol Res Pract 200:763-770 Hwang et al. (2004) Wilms tumor gene product: sensitive and contextually specific Marker of serous carcinomas of ovarian surface epithelial origin Appl Immunohistochem Mol Morphol 12:122-126 Ishikawa et al. (2005) Experimental trial for diagnosis of pancreatic ductal carcinoma based on gene expression profiles of pancreatic ductal cells Cancer Sci 96:387-393 Italiano et al. (2005) Epidermal growth factor receptor (EGFR) status in primary colorectal tumors correlates with EGFR expression in related metastatic sites: biological and clinical implications Ann Oncol 16:1503-1507 Jones et al. (2004) Comprehensive analysis of matrix metalloproteinase and tissue inhibitor expression in pancreatic cancer: increased expression of matrix metalloproteinase-7 predicts poor survival Clin Cancer Res 10:2832-2845 Jones et al. (2005) Thyroid transcription factor 1 expression in small cell carcinoma of the urinary bladder: an immunohistochemical profile of 44 cases Hum Pathol 36:718-723 Khoor et al. (1997) Expression of surfactant protein B precursor and surfactant protein B mRNA in adenocarcinoma of the lung Mod Pathol 10:62-67 Kim (2003) Comparison of oligonucleotide-microarray and serial analysis of gene expression (SAGE) in transcript profiling analysis of megakaryocytes derived from CD34+ cells Exp Mol Med 35:460-466 Kim et al. (2003) Steroidogenic acute regulatory protein expression in the normal human brain and intracranial tumors Brain Res 978:245-249 Lam et al. (2005) Prostate stem cell antigen is overexpressed in prostate cancer metastases Clin Can Res 11:2591-2596 Lembersky et al. (1996) Metastases of unknown primary site Med Clin North Am. 80:153-171 Lewis et al. (2001) Unlocking the archive-gene expression in paraffin-embedded tissue J Pathol 195:66-71 Lipshutz et al. (1999) High density synthetic oligonucleotide arrays Nature Genetics 21:S20-24 Lowe et al. (1985) Human liver fatty acid binding protein. Isolation of a full length cDNA and comparative sequence analyses of orthologous and paralogous proteins J Biol Chem 260:3413-3417 Ma et al. (2006) Molecular classification of human cancers using a 92-gene real-time quantitative polymerase chain reaction assay Arch Pathol Lab med 130:465-473 Magklara et al. (2002) Characterization of androgen receptor and nuclear receptor co-regulator expression in human breast cancer cell lines exhibiting differential regulation of kallikreins 2 and 3 Int J Cancer 100:507-514 Markowitz (1952) Portfolio Selection J Finance 7:77-91
Marques et al. (2002) Expression of PAX8-PPAR gamma 1 rearrangements in both follicular thyroid carcinomas and adenomas J Clin Endocrinol Metab 87:3947-3952 Masuda et al. (1999) Analysis of chemical modification of RNA from formalin-fixed samples and optimization of molecular biology applications for such samples Nucl Acids Res 27:4436-4443 McCarthy et al. (2003) Novel Markers of pancreatic adenocarcinoma in fine-needle aspiration: mesothelin and prostate :stem cell antigen labeling increases accuracy in cytologically borderline cases Appl Immunohistochem Mol Morphol 11:238-243 Mikhitarian et al. (2004) Enhanced detection of RNA from paraffin-embedded tissue using a panel of truncated genespecific primers for reverse transcription BioTechniques 36:1-4 Mintzer et al. (2004) Cancer of unknown primary: changing approaches, a multidisciplinary case presentation from the Joan Karnell Cancer Center of Pennsylvania Hospital The Oncologist 9:330-338 Moniaux et al. (2004) Multiple roles of mucins in pancreatic cancer, a lethal and challenging malignancy Br J Cancer 91:1633-1638 Murphy et al. (1987) Isolation and sequencing of a cDNA clone for a prolactin-inducible protein (PIP). Regulation of PIP gene expression in the human breast cancer cell line, T-47D J Biol Chem 262:15236-15241 Myal et al. (1991) The prolactin-inducible protein (PIPGCDFP-15) gene: cloning, structure and regulation J Mol Cell Endocrinol 80:165-175 Nakamura et al. (2002) Expression of thyroid transcription factor-1 in normal and neoplastic lung tissues Mod Pathol 15:1058-1067 Noonan et al. (2001) Characterization of the homeodomain gene EMX2: sequence conservation, expression analysis, and a search for mutations in endometrial cancers Genomics 76:37-44 Oettgen et al. (2000) PDEF, a novel prostate epithelium-specific Ets transcription factor, interacts with the androgen receptor and activates prostate-specific antigen gene expression J Biol Chem 275:1216-1225 Oji et al. (2003) Overexpression of the Wilms’ tumor gene WT1 in head and neck squamous cell carcinoma Cancer Sci 94:523-529 Pavlidis et al. (2003) Diagnostic and therapeutic management of cancer of an unknown primary Eur J Can 39: 990-2005 Pilot-Mathias et al. (1989) Structure and organization of the gene encoding human pulmonary surfactant proteolipid SP-B DNA 8:75-86 Pilozzi et al. (2004) CDX1 expression is reduced in colorectal carcinoma and is associated with promoter hypermethylation J Pathol 204:289-295 Poleev et al. (1992) PAX8, a human paired box gene: isolation and expression in developing thyroid, kidney and Wilms’ tumors Development 116:611-623 Prasad et al. (2005) Gene expression profiles in pancreatic intraepithelial neoplasia reflect the effects of Hedgehog signaling on pancreatic ductal epithelial cells Cancer Res 65:1619-1626 Ramaswamy (2004) Translating cancer genomics into clinical oncology N Engl J Med 350:1814-1816 Ramaswamy et al. (2001) Multiclass cancer diagnosis using tumor gene expression signatures Proc Natl Acad Sci USA 98:15149-15154 Rauscher (1993) The WT1 Wilms tumor gene product: a developmentally regulated transcription factor in the kidney that functions as a tumor suppressor FASEB J 7:896-903 Reinholz et al. (2005) Evaluation of a panel of tumor Markers for molecular detection of circulating cancer cells in women with suspected breast cancer Clin Cancer Res 11:3722 Schlag et al. (1994) Cancer of unknown primary site Ann Chir Gynaecol 83:8-12 Senoo et al. (1998) A second p53-related protein, p73L, with high homology to p73 Biochem Biophys Res Comm 248:603-607 Specht et al. (2001) Quantitative gene expression analysis in microdissected archival formalin-fixed and paraffinembedded tumor tissue Amer J Pathol 158:419-429 Su et al. (2001) Molecular classification of human carcinomas by use of gene expression signatures Cancer Res 61:7388-7393 Takahashi et al. (1995) Cloning and characterization of multiple human genes and cDNAs encoding highly related type II keratin 6 isoforms J Biol Chem 270:18581-18592 Takamura et al. (2004) Reduced expression of liver-intestine cadherin is associated with progression and lymph node metastasis of human colorectal carcinoma Cancer Lett 212:253-259 Tothill et al. (2005) An expression-based site of origin diagnostic method designed for clinical application to cancer of unknown origin Can Res 65:4031-4040 van Ruissen et al. (2005) Evaluation of the similarity of gene expression data estimated with SAGE and Affymetrix GeneChips BMC Genomics 6:91 Varadhachary et al. (2004) Diagnostic strategies for unknown primary cancer Cancer 100:1776-1785 Venables et al. (2002) Modern Applied Statistics with S. Fourth edition. Springer Wallace et al. (2005) Accurate Molecular detection of non-small cell lung cancer metastases in mediastinal lymph nodes sampled by endoscopic ultrasound-guided needle aspiration Cest 127:430-437 Wan et al. (2003) Desmosomal proteins, including desmoglein 3, serve as novel negative Markers for epidermal stem cell-containing population of keratinocytes J Cell Sci 116:4239-4248 Watson et al. (1996) Mammaglobin, a mammary-specific member of the uteroglobin gene family, is overexpressed in human breast cancer Cancer Res 56:860-865
Watson et al. (1998) Structure and transcriptional regulation of the human mammaglobin gene, a breast cancer associated member of the uteroglobin gene family localized to chromosome 11q13 Oncogene 16:817-824 Weigelt et al. (2003) Gene expression profiles of primary breast tumors maintained in distant metastases Proc Natl Acad Sci USA 100:15901-15905
5 Zapata-Benavides et al. (2002) Downregulation of Wilms’ tumor 1 protein inhibits breast cancer proliferation Biochem Biophys Res Commun 295:784-790
LISTADO DE SECUENCIAS
<110> Veridex, LLC Wang, Yixin Mazumder, Abhijit Talantov, Dmitri Jatkoe, Timothy Baden, Jonathan
<120> Métodos y materiales para identificar el origen de un carcinoma de origen primario desconocido
<130> VDX5007WOPCT 15
<150> 60/718.501
<151>
<150> 60/725.680
<151>
<160> 107
<170> PatentIn versión 3.3 25
<210> 1
<211> 476
<212> ADN
<213> humano
<400> 1
<210> 2
<211> 493
<212> ADN
<213> humano
55 <400> 2
<210> 3
<211> 545 25 <212> ADN
<213> humano
<400> 3
<210> 4
<211> 284
<212> ADN
<213> humano
<400> 4
15 <210> 5
<211> 394
<212> ADN
<213> humano
<220>
<221> misc_feature
<222> (58)..(58)
<223> n es a, c, g, o t
25 <220>
<221> misc_feature
<222> (95)..(95)
<223> n es a, c, g, o t
<220>
<221> misc_feature
<222> (99).. (99)
<223> n es a, c, g, o t
35 <220>
<221> misc_feature
<222> (119)..(119)
<223> n es a, c, g, o t
<220>
<221> misc_feature
<222> (123)..(123)
<223> n es a, c, g, o t
45 <220>
<221> misc_feature.
<222> (130)..(130)
<223> n es a, c, g, o t
<220>
<221> misc_feature
<222> (151)..(151)
<223> n es a, c, g, o t
55 <220>
<221> misc_feature
<222> (155)..(155)
<223> n es a, c, g, o t
<220>
<221> misc_feature
<222> (161)..(161)
<223> n es a, c, g, o t65
<220>
<221> misc_feature
<222> (212)..(212)
<223> n es a, c, g, o t
<400> 5
<210> 6 25 <211> 470
<212> ADN
<213> humano
<220>
<221> misc_feature
<222> (61)..(61)
<223> n es a, c, g, o t
<220> 35 <221> misc_feature
<222> (82) .. (82)
<223> n es a, c, g, o t
<400> 6
<210> 7
<211> 396
<212> ADN
<213> humano
<400> 7
<210> 8
<211> 491
<212> ADN
<213> humano
<400> 8
<210> 9
<211> 265
<212> ADN
<213> humano
<400> 9
65 <210> 10
<211> 441
<212> ADN
<213> humano
<400> 10
25
<210> 11 <211> 21 <212> ADN <213> humano
<400> 11 21 cacagccccg acctttgatg a
21
35
<210> 12 <211> 19 <212> ADN <213> humano
<400> 12 ggtcccagag cccgtctca
19
<210> 13 <211> 26 <212> ADN <213> humano
45
<400> 13 agctgtccag ctgcaaagga aaagcc 26
<210> 14 <211> 75 <212> ADN <213> humano
<400> 14
<210> 15
<211> 17
<212> ADN
<213> humano
<400> 15
ccaacccaga cccgcgc
17
5
<210> 16 <211> 21 <212> ADN <213> humano
<400> 16 cgcccatgcc gctcatgttc a
21
15
<210> 17 <211> 21 <212> ADN <213> humano <400> 17 cccgccatct cccgcttcat g 21
<210> 18 <211> 78 <212> ADN <213> humano
25
<400> 18
35
<210> 19 <211> 23 <212> ADN <213> humano
<400> 19 gagagaagga gaagataact caa
23
45
<210> 20 <211> 22 <212> ADN <213> humano <400> 20 actccagaga ttcggtaggt ga 22
<210> 21 <211> 26 <212> ADN <213> humano
55
<400> 21 attgccaaga ttacttcaga ttacca 26
<210> 22 <211> 97 <212> ADN <213> humano
<400> 22
65
<210> 23 <211> 21 <212> ADN <213> humano
15
<400> 23 tccctcggca gtggaagctt a <210> 24 <211> 24 <212> ADN <213> humano 21
<400> 24 tcctcaaact ctgtgtgcct ggta
24
25
<210> 25 <211> 29 <212> ADN <213> humano
<400> 25 ccaaaatcaa tggtactcat gcccgactg
29
35
<210> 26 <211> 95 <212> ADN <213> humano
<400> 26
45
<210> 27 <211> 21 <212> ADN <213> humano
<400> 27 agttgctgat ggtcctcatg c
21
55
<210> 28 <211> 24 <212> ADN <213> humano
<400> 28 cacttgtgga ttgattgtct tgga
24
65
<210> 29 <211> 23 <212> ADN <213> humano
<400> 29 ccctctccca gcactgctac gca 23
<210> 30
<211> 107
<212> ADN
<213> humano
<400> 30
<210> 31 <211> 20 <212> ADN <213> humano
25
<400> 31 cgcccacctg gacatctgga <210> 32 <211> 23 <212> ADN <213> humano 20
<400> 32 cactggtcga ggcacagtag tga
23
35
<210> 33 <211> 25 <212> ADN <213> humano
<400> 33 gtcagcggcc tggatgaaag agcgg
25
45
<210> 34 <211> 86 <212> ADN <213> humano
<400> 34
55
<210> 35 <211> 23 <212> ADN <213> humano
<400> 35 gcggagccca atacagaata cac
23
65
<210> 36 <211> 19 <212> ADN
<213> humano
5
<400> 36 cggggctact ccaggcaca <210> 37 <211> 25 <212> ADN <213> humano 19
<400> 37 tcagaggcat tcaggatgtg cgacg
25
15
<210> 38 <211> 80 <212> ADN <213> humano
<400> 38
<210> 39 <211> 20 <212> ADN <213> humano
35
<400> 39 ctgttgatgg caggcttggc <210> 40 <211> 20 <212> ADN <213> humano 20
<400> 40 ttgctcacct gggctttgca
20
45
<210> 41 <211> 21 <212> ADN <213> humano
<400> 41 gcagccaggc actgccctgc t
21
55
<210> 42 <211> 74 <212> ADN <213> humano
<400> 42
5
<210> 43 <211> 25 <212> ADN <213> humano
<400> 43 tgaagaaata tcctgggatt attca
25
<210> 44 <211> 27 <212> ADN <213> humano
15
<400> 44 tatgtggtat cttctggaat atcatca 27
<210> 45 <211> 27 <212> ADN <213> humano
25
<400> 45 acaaagggaa acagatattg aagactc <210> 46 <211> 87 <212> ADN <213> humano 27
<400> 46
<210> 47 <211> 19 <212> ADN <213> humano
45
<400> 47 cccccagtgg gtcctcaca 19
<210> 48 <211> 22 <212> ADN <213> humano
55
<400> 48 aggatgaaac aagctgtgcc ga <210> 49 <211> 26 <212> ADN <213> humano 22
<400> 49 caggaacaaa agcgtgatct tgctgg
26
65
<210> 50 <211> 82 <212> ADN
<213> humano
<400> 50
15
<210> 51 <211> 19 <212> ADN <213> humano <400> 51 gccctgaggc actcttcca 19
<210> 52 <211> 22 <212> ADN <213> humano
25
<400> 52 cggatgtcca cgtcacactt ca 22
<210> 53 <211> 25 <212> ADN <213> humano
<400> 53 cttccttcct gggcatggag tcctg
25
35
<210> 54 <211> 100 <212> ADN <213> humano
<400> 54
<210> 55 <211> 22 <212> ADN <213> humano
55
<400> 55 ccacacacag cctactttcc aa 22
<210> 56 <211> 21 <212> ADN <213> humano
65
<400> 56 tacccacgcg aatcactctc a <210> 57 21
<211> 27 <212> ADN <213> humano
5
<400> 57 aacggcaatg cggctgcaac ggcggaa 27
<210> 58 <211> 103 <212> ADN <213> humano
<400> 58
15
<210> 59
<211> 2724
<212> ADN
25
<213> humano
<400> 59
35
45
55
<210> 60
<211> 2352
<212> ADN 45 <213> humano
<400> 60
<210> 61
<211> 3336
<212> ADN
<213> humano
<400> 61 <210> 62
<211> 3697
<212> ADN
<213> humano
<400> 62
<210> 63
<211> 503
<212> ADN
<213> humano
<400> 63
<210> 64
<211> 1894
<212> ADN
<213> humano
<400> 64 <210> 65
<211> 3029
<212> ADN
<213> humano
<400> 65
<210> 66
<211> 1064
<212> ADN
<213> humano
<400> 66 <210> 67
<211> 6962
<212> ADN
<213> humano
<400> 67
<210> 68
<211> 1464
<212> ADN
<213> humano
<400> 68 <210> 69
<211> 1793
<212> ADN
<213> humano
<400> 69 <210> 70
<211> 1526
<212> ADN
<213> humano
<400> 70 <210> 71
<211> 2397
<212> ADN
<213> humano
<400> 71
<210> 72
<211> 2118
<212> ADN
<213> humano
<400> 72 <210> 73
<211> 2832
<212> ADN
<213> humano
<400> 73 <210> 74
<211> 1607
<212> ADN
<213> humano
<400> 74 <210> 75
<211> 1753
<212> ADN
<213> humano
<400> 75 <210> 76
<211> 2255
<212> ADN
<213> humano
<400> 76
<210> 77
<211> 462
<212> ADN
<213> humano
<400> 77
<210> 78
<211> 2108
<212> ADN
<213> humano
<400> 78 <210> 79
<211> 3745
<212> ADN
<213> humano
<400> 79
<210> 80
<211> 901
<212> ADN
<213> humano
<400> 80
<210> 81
<211> 618
<212> ADN
<213> humano
<400> 81 <210> 82
<211> 594
<212> ADN
<213> humano
<400> 82
<210> 83
<211> 1372
<212> ADN
<213> humano
<400> 83 <210> 84
<211> 2983
<212> ADN
<213> humano
<400> 84
<210> 85
<211> 3345
<212> ADN
<213> humano
<400> 85 <210> 86
<211> 990
<212> ADN
<213> humano
<400> 86 <210> 87
<211> 1805
<212> ADN
<213> humano
<400> 87 <210> 88
<211> 2820
<212> ADN
<213> humano
<400> 88
<210> 89
<211> 991
<212> ADN
<213> humano
<400> 89
<210> 90
<211> 1580
<212> ADN
<213> humano
<400> 90
<210> 91
<211> 3359
<212> ADN
<213> humano
<400> 91
<210> 92
<211> 733
<212> ADN
<213> humano
<400> 92 <210> 93
<211> 1076
<212> ADN
<213> humano
<400> 93 <210> 94
<211> 3675
<212> ADN
<213> humano
<400> 94
<210> 95
<211> 2658
<212> ADN
<213> humano
<400> 95 <210> 96
<211> 2531
<212> ADN
<213> humano
<400> 96
<210> 97
<211> 2849
<212> ADN
<213> humano
<400> 97 <210> 98
<211> 3308
<212> ADN
<213> humano
<400> 98
<210> 99
<211> 551
<212> ADN
<213> humano
<400> 99 <210> 100
<211> 1607
<212> ADN
<213> humano
<400> 100 <210> 101
<211> 1753
<212> ADN
<213> humano
<400> 101 <210> 102
<211> 2276
<212> ADN
<213> humano
<400> 102 <210> 103
<211> 7381
<212> ADN
<213> humano
<400> 103
<210> 104
<211> 2323
<212> ADN
<213> humano
<400> 104 <210> 105
<211> 741
<212> ADN
<213> humano
<400> 105 <210> 106
<211> 2373
<212> ADN
<213> humano
<400> 106 <210> 107
<211> 1314
<212> ADN
<213> humano
<400> 107

Claims (9)

  1. REIVINDICACIONES
    1. Método de identificación del origen de una metástasis de origen desconocido que comprende las etapas de
    a.
    medir los Biomarcadores asociados con tres carcinomas diferentes en una muestra que contiene células metastásicas, en el que los Biomarcadores son los niveles de expresión de genes Marcadores y en el que los genes Marcadores están seleccionados de entre:
    i. SP-B, TTF y DSG3, que son marcadores para el cáncer de pulmón;
    ii. F5 y PSCA, que son marcadores para el cáncer de páncreas; y
    iii. CDH17, que es un marcador para el cáncer de colon;
    b.
    combinar los datos de los Biomarcadores en un algoritmo en el que el algoritmo
    i. normaliza los Biomarcadores frente a una referencia; e
    ii. impone un punto de corte que optimiza la sensibilidad y la especificidad de cada Biomarcador, pondera la prevalencia de los carcinomas y selecciona un tejido de origen;
    c.
    determinar el origen en base a la probabilidad más alta determinada por el algoritmo o determinar que el carcinoma no se deriva de un conjunto concreto de carcinomas; y
    d.
    opcionalmente medir los Biomarcadores específicos para uno o más carcinomas diferentes adicionales, y repetir las etapas c) y d) para los Biomarcadores adicionales;
  2. 2.
    Método según la reivindicación 1 en el que la expresión génica se mide utilizando al menos una de las SEQ ID NO: 11-54 y 57-58.
  3. 3.
    Método según la reivindicación 1, que comprende adicionalmente obtener información clínica adicional, incluido el sitio de metástasis, para determinar el origen del carcinoma.
  4. 4.
    Método según la reivindicación 1 que comprende adicionalmente medir la expresión de al menos un gen expresado constitutivamente en la muestra.
  5. 5.
    Método de orientación para el tratamiento determinando el origen de una metástasis de origen desconocido según la reivindicación 1 e identificando el tratamiento apropiado para ello.
  6. 6.
    Método para proporcionar un pronóstico determinando el origen de una metástasis de origen desconocido, según la reivindicación 1 e identificando el correspondiente pronóstico para ello.
  7. 7.
    Uso de una composición que comprende al menos una secuencia aislada seleccionada de entre las SEQ ID NO: 11-54 y 57-58 en el método según cualquiera de las reivindicaciones 1-6.
  8. 8.
    Uso de un kit que comprende ARN o ADNc que hibrida con los genes marcadores según la reivindicación 1 en un método según cualquiera de las reivindicaciones 1-6.
  9. 9.
    Uso de una micromatriz o matriz génica para llevar a cabo el método según la reivindicación 1.
ES06814892.3T 2005-09-19 2006-09-19 Métodos y materiales para identificar el origen de un carcinoma de origen primario desconocido Active ES2494843T3 (es)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US71850105P 2005-09-19 2005-09-19
US718501P 2005-09-19
US72568005P 2005-10-12 2005-10-12
US725680P 2005-10-12
PCT/US2006/036355 WO2007035676A2 (en) 2005-09-19 2006-09-19 Methods and materials for identifying the origin of a carcinoma of unknown primary origin

Publications (1)

Publication Number Publication Date
ES2494843T3 true ES2494843T3 (es) 2014-09-16

Family

ID=37889439

Family Applications (2)

Application Number Title Priority Date Filing Date
ES11163930.8T Active ES2525545T3 (es) 2005-09-19 2006-09-19 Métodos y usos para identificar el origen de un carcinoma de origen primario desconocido
ES06814892.3T Active ES2494843T3 (es) 2005-09-19 2006-09-19 Métodos y materiales para identificar el origen de un carcinoma de origen primario desconocido

Family Applications Before (1)

Application Number Title Priority Date Filing Date
ES11163930.8T Active ES2525545T3 (es) 2005-09-19 2006-09-19 Métodos y usos para identificar el origen de un carcinoma de origen primario desconocido

Country Status (9)

Country Link
US (2) US20080050726A1 (es)
EP (3) EP1934615B1 (es)
JP (2) JP2009508493A (es)
BR (2) BRPI0616211A2 (es)
CA (2) CA2623775A1 (es)
DK (2) DK2402758T3 (es)
ES (2) ES2525545T3 (es)
HK (1) HK1128524A1 (es)
WO (2) WO2007035676A2 (es)

Families Citing this family (34)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE10254601A1 (de) 2002-11-22 2004-06-03 Ganymed Pharmaceuticals Ag Differentiell in Tumoren exprimierte Genprodukte und deren Verwendung
DE102004024617A1 (de) 2004-05-18 2005-12-29 Ganymed Pharmaceuticals Ag Differentiell in Tumoren exprimierte Genprodukte und deren Verwendung
EP1790664A1 (en) 2005-11-24 2007-05-30 Ganymed Pharmaceuticals AG Monoclonal antibodies against claudin-18 for treatment of cancer
WO2010123874A1 (en) 2009-04-20 2010-10-28 Oxford Biotherapeutics Ltd. Antibodies specific to cadherin-17
US8535677B2 (en) 2006-06-06 2013-09-17 Oxford Biotherapeutics, Ltd. Antibody drug conjugate treatment of colorectal cancer
EP2125034A4 (en) * 2007-02-01 2010-01-27 Veridex Llc METHODS AND SUBSTANCES FOR IDENTIFYING THE ORIGIN OF AN UNKNOWN UNKNOWN MAIN CARCINOMA
CA2689714A1 (en) * 2007-06-01 2008-12-04 Agendia B.V. Prognostic gene expression signature for non small cell lung cancer patients
WO2009021019A1 (en) * 2007-08-06 2009-02-12 Health Research Inc. Methods for analysis of pdef and survivin as interconnected cancer biomarkers and targets for personalized medicine
EP3222290A1 (en) * 2007-10-09 2017-09-27 CureVac AG Composition for treating prostate cancer (pca)
WO2009046739A1 (en) 2007-10-09 2009-04-16 Curevac Gmbh Composition for treating prostate cancer (pca)
MX2010008009A (es) * 2008-01-22 2010-08-10 Veridex Llc Deteccion de hipermetilacion de gstp1 en el cancer de prostata.
WO2010037408A1 (en) 2008-09-30 2010-04-08 Curevac Gmbh Composition comprising a complexed (m)rna and a naked mrna for providing or enhancing an immunostimulatory response in a mammal and uses thereof
US9207242B2 (en) * 2008-10-09 2015-12-08 The University Of Hong Kong Cadherin-17 as diagnostic marker and therapeutic target for liver cancer
KR100996143B1 (ko) 2008-10-31 2010-11-24 한국전기연구원 자계 고노출 직업군의 개인노출자계 추정방법
EP2380025B1 (en) 2009-01-14 2013-09-11 The United States of America, as represented by The Secretary, Department of Health and Human Services Ratio based biomarkers and methods of use thereof
WO2010134023A2 (en) * 2009-05-20 2010-11-25 Koninklijke Philips Electronics N.V. Biomarkers based on sets of molecular signatures
US9151762B2 (en) 2009-06-12 2015-10-06 The United States Of America, As Represented By The Secretary, Department Of Health And Human Services Identification of DSG-3 as a biomarker for the detection of metastasis in lymph nodes
US20130078642A1 (en) * 2010-06-03 2013-03-28 Porto Conte Richerche S.R.L. Biomarkers for lung neuroendocrine tumors
US20140141996A1 (en) * 2011-06-22 2014-05-22 Oncocyte Corporation Methods and Compositions for the Treatment and Diagnosis of Cancer
WO2013167153A1 (en) 2012-05-09 2013-11-14 Ganymed Pharmaceuticals Ag Antibodies useful in cancer diagnosis
WO2013174404A1 (en) 2012-05-23 2013-11-28 Ganymed Pharmaceuticals Ag Combination therapy involving antibodies against claudin 18.2 for treatment of cancer
WO2013174432A1 (en) 2012-05-24 2013-11-28 Fundació Institut D'investigació Biomèdica De Bellvitge (Idibell) Method for the identification of the origin of a cancer of unknown primary origin by methylation analysis
WO2014036444A1 (en) * 2012-08-30 2014-03-06 Abbott Laboratories Prame detection assays
SG11201503593UA (en) 2012-11-13 2015-06-29 Biontech Ag Agents for treatment of claudin expressing cancer diseases
CN104937112B (zh) 2013-01-22 2018-04-24 大塚制药株式会社 对WT1 mRNA的表达量进行定量的方法
WO2014127785A1 (en) 2013-02-20 2014-08-28 Ganymed Pharmaceuticals Ag Combination therapy involving antibodies against claudin 18.2 for treatment of cancer
EP2971101A2 (en) 2013-03-15 2016-01-20 Janssen Pharmaceutica N.V. Assay for predictive biomarkers
WO2014146672A1 (en) 2013-03-18 2014-09-25 Ganymed Pharmaceuticals Ag Therapy involving antibodies against claudin 18.2 for treatment of cancer
CA2952390A1 (en) * 2013-06-20 2014-12-24 The Trustees Of The University Of Pennsylvania Methods for diagnosing pancreatic cancer
EP3578984A3 (en) 2013-10-28 2020-03-04 Salivatech Co., Ltd. Salivary biomarkers for oral cancer
KR102196884B1 (ko) 2013-11-01 2020-12-30 화이자 인코포레이티드 전립선-연관 항원의 발현을 위한 벡터
JP6410343B2 (ja) * 2014-07-01 2018-10-24 学校法人順天堂 脂肪組織由来幹細胞から表皮角化細胞への誘導
WO2020205993A1 (en) * 2019-04-01 2020-10-08 The University Of North Carolina At Chapel Hill Purity independent subtyping of tumors (purist), a platform and sample type independent single sample classifier for treatment decision making in pancreatic cancer
CN116798520A (zh) * 2023-06-28 2023-09-22 复旦大学附属肿瘤医院 鳞状细胞癌组织起源位点蛋白标志物预测模型的构建方法

Family Cites Families (72)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5700637A (en) 1988-05-03 1997-12-23 Isis Innovation Limited Apparatus and method for analyzing polynucleotide sequences and method of generating oligonucleotide arrays
GB8822228D0 (en) * 1988-09-21 1988-10-26 Southern E M Support-bound oligonucleotides
US5242974A (en) 1991-11-22 1993-09-07 Affymax Technologies N.V. Polymer reversal on solid surfaces
US5143854A (en) * 1989-06-07 1992-09-01 Affymax Technologies N.V. Large scale photolithographic solid phase synthesis of polypeptides and receptor binding screening thereof
US5424186A (en) 1989-06-07 1995-06-13 Affymax Technologies N.V. Very large scale immobilized polymer synthesis
US5527681A (en) * 1989-06-07 1996-06-18 Affymax Technologies N.V. Immobilized molecular synthesis of systematically substituted compounds
DE3924454A1 (de) * 1989-07-24 1991-02-07 Cornelis P Prof Dr Hollenberg Die anwendung von dna und dna-technologie fuer die konstruktion von netzwerken zur verwendung in der chip-konstruktion und chip-produktion (dna chips)
EP0453560B1 (en) 1989-11-13 1999-05-26 Massachusetts Institute Of Technology Localization and characterization of the wilms' tumor gene
US5804604A (en) * 1989-12-21 1998-09-08 Biogen, Inc. Tat-derived transport polypeptides and fusion proteins
US5962643A (en) * 1991-07-11 1999-10-05 The Regents Of The University Of California Integrin β subunit and uses thereof
IL103674A0 (en) * 1991-11-19 1993-04-04 Houston Advanced Res Center Method and apparatus for molecule detection
US5412087A (en) 1992-04-24 1995-05-02 Affymax Technologies N.V. Spatially-addressable immobilization of oligonucleotides and other biological polymers on surfaces
US5384261A (en) * 1991-11-22 1995-01-24 Affymax Technologies N.V. Very large scale immobilized polymer synthesis using mechanically directed flow paths
US5786148A (en) 1996-11-05 1998-07-28 Incyte Pharmaceuticals, Inc. Polynucleotides encoding a novel prostate-specific kallikrein
US5554501A (en) * 1992-10-29 1996-09-10 Beckman Instruments, Inc. Biopolymer synthesis using surface activated biaxially oriented polypropylene
US5472672A (en) * 1993-10-22 1995-12-05 The Board Of Trustees Of The Leland Stanford Junior University Apparatus and method for polymer synthesis using arrays
US5429807A (en) * 1993-10-28 1995-07-04 Beckman Instruments, Inc. Method and apparatus for creating biopolymer arrays on a solid support surface
US5571639A (en) * 1994-05-24 1996-11-05 Affymax Technologies N.V. Computer-aided engineering system for design of sequence arrays and lithographic masks
US5556752A (en) * 1994-10-24 1996-09-17 Affymetrix, Inc. Surface-bound, unimolecular, double-stranded DNA
US5599695A (en) * 1995-02-27 1997-02-04 Affymetrix, Inc. Printing molecular library arrays using deprotection agents solely in the vapor phase
US5624711A (en) 1995-04-27 1997-04-29 Affymax Technologies, N.V. Derivatization of solid supports and methods for oligomer synthesis
US5668267A (en) 1995-05-31 1997-09-16 Washington University Polynucleotides encoding mammaglobin, a mammary-specific breast cancer protein
US5545531A (en) 1995-06-07 1996-08-13 Affymax Technologies N.V. Methods for making a device for concurrently processing multiple biological chip assays
US5658734A (en) * 1995-10-17 1997-08-19 International Business Machines Corporation Process for synthesizing chemical compounds
US5837507A (en) * 1995-11-13 1998-11-17 The Regents Of The University Of California Hox-induced enhancement of in vivo and in vitro proliferative capacity and gene therapeutic methods
US5642711A (en) * 1996-02-15 1997-07-01 Automated Waste Equipment Co., Inc. Apparatus for automatically controlling operation of the throttle assembly of a motor vehicle engine system during operation of power take-off equipment
JP3122771B2 (ja) 1996-04-16 2001-01-09 岸本 忠三 固形癌細胞及び組織異型性の検出方法並びに骨髄移植及び末梢血幹細胞移植用組織の検査方法
CA2281877C (en) 1997-03-10 2010-01-05 The Regents Of The University Of California Psca: prostate stem cell antigen
WO1998056953A1 (en) 1997-06-10 1998-12-17 Johns Hopkins University School Of Medicine Methods for thyroid cell detection
US6218114B1 (en) * 1998-03-27 2001-04-17 Academia Sinica Methods for detecting differentially expressed genes
US6004755A (en) 1998-04-07 1999-12-21 Incyte Pharmaceuticals, Inc. Quantitative microarray hybridizaton assays
US6218122B1 (en) 1998-06-19 2001-04-17 Rosetta Inpharmatics, Inc. Methods of monitoring disease states and therapies using gene expression profiles
US6262249B1 (en) * 1998-06-23 2001-07-17 Chiron Corporation Pancreatic cancer genes
US20010010934A1 (en) 1998-07-31 2001-08-02 Towia Aron Libermann Prostate derived ets factor
US6232073B1 (en) 1999-02-05 2001-05-15 Virginia Commonwealth University Nucleic acid marker for cancer
AU3395900A (en) 1999-03-12 2000-10-04 Human Genome Sciences, Inc. Human lung cancer associated gene sequences and polypeptides
US20030040617A9 (en) 1999-03-12 2003-02-27 Rosen Craig A. Nucleic acids, proteins and antibodies
US6271002B1 (en) 1999-10-04 2001-08-07 Rosetta Inpharmatics, Inc. RNA amplification method
US20040146862A1 (en) 2000-03-15 2004-07-29 Eos Biotechnology, Inc. Methods of diagnosis of breast cancer, compositions and methods of screening for modulators of breast cancer
AU2001249549A1 (en) 2000-03-27 2001-10-08 Corixa Corporation Compositions and methods for the therapy and diagnosis of prostate cancer
US20030235820A1 (en) 2001-02-27 2003-12-25 Eos Biotechnology, Inc. Novel methods of diagnosis of metastatic colorectal cancer, compositions and methods of screening for modulators of metastatic colorectal cancer
CN1554025A (zh) 2001-03-12 2004-12-08 Īŵ���ɷ����޹�˾ 患病状态的细胞为基础的检测和鉴别
CA2450379A1 (en) 2001-06-10 2002-12-19 Irm Llc Molecular signatures of commonly fatal carcinomas
US7189507B2 (en) * 2001-06-18 2007-03-13 Pdl Biopharma, Inc. Methods of diagnosis of ovarian cancer, compositions and methods of screening for modulators of ovarian cancer
FR2826168B1 (fr) 2001-06-19 2003-12-05 Eads Airbus Sa Procede de realisation d'une couche acoustiquement resistive renforcee, couche resistive ainsi obtenue et panneau utilisant une telle couche
AU2002322280A1 (en) 2001-06-21 2003-01-21 Millennium Pharmaceuticals, Inc. Compositions, kits, and methods for identification, assessment, prevention, and therapy of breast cancer
US20040076955A1 (en) * 2001-07-03 2004-04-22 Eos Biotechnology, Inc. Methods of diagnosis of bladder cancer, compositions and methods of screening for modulators of bladder cancer
US20040009489A1 (en) * 2001-09-28 2004-01-15 Golub Todd R. Classification of lung carcinomas using gene expression analysis
US20030232350A1 (en) * 2001-11-13 2003-12-18 Eos Biotechnology, Inc. Methods of diagnosis of cancer, compositions and methods of screening for modulators of cancer
US20030215835A1 (en) 2002-01-15 2003-11-20 Zairen Sun Differentially-regulated prostate cancer genes
US7348142B2 (en) * 2002-03-29 2008-03-25 Veridex, Lcc Cancer diagnostic panel
DE10230276B4 (de) 2002-07-05 2005-05-19 Daimlerchrysler Ag AS-Druckgusslegierung und Verfahren zum Herstellen eines Aggregatteils aus einer derartigen AS-Druckgusslegierung
US20040021572A1 (en) * 2002-08-05 2004-02-05 Schoen Marc L. Electronic baggage tracking and identification
EP1565581B1 (en) 2002-08-20 2011-08-10 Millennium Pharmaceuticals, Inc. Compositions, kits, and methods for identification, assessment, prevention, and therapy of cervical cancer
WO2004029200A2 (en) * 2002-09-26 2004-04-08 Children's Medical Center Corporation Method of enhancing proliferation and/or hematopoietic differentiation of stem cells
US20050260639A1 (en) * 2002-09-30 2005-11-24 Oncotherapy Science, Inc. Method for diagnosing pancreatic cancer
US7601826B2 (en) * 2002-09-30 2009-10-13 Oncotherapy Science, Inc. Genes and polypeptides relating to human pancreatic cancers
EP1594447A2 (en) 2002-10-02 2005-11-16 Genentech, Inc. Compositions and methods for the diagnosis and treatment of tumor
WO2004055519A2 (en) * 2002-12-17 2004-07-01 Sinogenomax Co. Ltd. Specific markers for pancreatic cancer
JP2006524035A (ja) 2002-12-26 2006-10-26 シーマインズ リミテッド ライアビリティ カンパニー 癌の診断、予後診断および治療のための方法および組成物
WO2004063355A2 (en) 2003-01-10 2004-07-29 Protein Design Labs, Inc. Novel methods of diagnosis of metastatic cancer, compositions and methods of screening for modulators of matastatic cancer
AU2003900747A0 (en) * 2003-02-18 2003-03-06 Garvan Institute Of Medical Research Diagnosis and treatment of pancreatic cancer
EP1601922B1 (en) 2003-02-26 2007-05-09 Delta Process Engineering APS Dual scraped, thin film, heat exchanger for viscous fluid
WO2004077060A2 (en) 2003-02-27 2004-09-10 Mount Sinai Hospital Assay for detection of renal cell carcinoma
US20060265138A1 (en) * 2003-03-14 2006-11-23 David Bowtell Expression profiling of tumours
US20050009067A1 (en) * 2003-05-19 2005-01-13 Craig Logsdon Expression profile of pancreatic cancer
CA2528669A1 (en) 2003-06-09 2005-01-20 The Regents Of The University Of Michigan Compositions and methods for treating and diagnosing cancer
US20050081341A1 (en) 2003-10-15 2005-04-21 Mcdougall William B.S. Woven touch fastener products
CN101258249A (zh) * 2004-06-24 2008-09-03 维里德克斯有限责任公司 检测黑素瘤的方法和试剂
US20060029987A1 (en) * 2004-08-06 2006-02-09 Applera Corporation Diagnosis of pancreatic cancer by using pancreatic targets
US9667980B2 (en) 2005-03-01 2017-05-30 Qualcomm Incorporated Content-adaptive background skipping for region-of-interest video coding
EP2125034A4 (en) * 2007-02-01 2010-01-27 Veridex Llc METHODS AND SUBSTANCES FOR IDENTIFYING THE ORIGIN OF AN UNKNOWN UNKNOWN MAIN CARCINOMA

Also Published As

Publication number Publication date
EP1934615B1 (en) 2014-06-04
WO2007035690A2 (en) 2007-03-29
WO2007035676A2 (en) 2007-03-29
DK1934615T3 (da) 2014-07-14
WO2007035676A3 (en) 2007-12-27
EP1934378A4 (en) 2008-10-29
CA2623425A1 (en) 2007-03-29
BRPI0616090A2 (pt) 2011-06-07
US20080050726A1 (en) 2008-02-28
EP1934615A4 (en) 2009-02-11
EP1934378A2 (en) 2008-06-25
EP2402758B1 (en) 2014-09-10
JP2009509502A (ja) 2009-03-12
BRPI0616211A2 (pt) 2011-06-14
JP5405110B2 (ja) 2014-02-05
EP2402758A3 (en) 2012-10-31
CA2623775A1 (en) 2007-03-29
DK2402758T3 (da) 2014-11-03
US20070065859A1 (en) 2007-03-22
WO2007035690A3 (en) 2007-06-14
HK1128524A1 (zh) 2009-10-30
JP2009508493A (ja) 2009-03-05
EP1934615A2 (en) 2008-06-25
EP2402758A2 (en) 2012-01-04
ES2525545T3 (es) 2014-12-26

Similar Documents

Publication Publication Date Title
ES2494843T3 (es) Métodos y materiales para identificar el origen de un carcinoma de origen primario desconocido
US20170073758A1 (en) Methods and materials for identifying the origin of a carcinoma of unknown primary origin
Vachani et al. A 10-gene classifier for distinguishing head and neck squamous cell carcinoma and lung squamous cell carcinoma
US9097715B2 (en) Bladder cancer diagnosis and/or prognosis method
Altman et al. The diagnostic utility of TP53 and CDKN2A to distinguish ovarian high-grade serous carcinoma from low-grade serous ovarian tumors
WO2014160645A2 (en) Neuroendocrine tumors
JP7463357B2 (ja) Pde4d7及びdhx9発現に基づく術前のリスク層別化
BR112019011031A2 (pt) Método para estratificação de risco, produto de programa de computador, kit de diagnóstico e uso de um perfil de expressão gênica para estratificação de risco
BR112020012280A2 (pt) composições e métodos para diagnosticar cânceres de pulmão usando perfis de expressão de gene
EP3953492A1 (en) Method for determining rcc subtypes
Hamlat et al. Proposal of a scoring scale as a survival predictor in intracranial oligodendrogliomas
CN101365950B (zh) 用于鉴别原发起源不明癌的起源的方法和材料
CN109073651A (zh) 结肠直肠癌分类的标志物基因、判断***转移以预后结肠直肠癌的方法及用于其的试剂盒
MX2008003932A (es) Metodos y materiales para identificar el origen de un carcinoma de origen primario desconocido
MX2008003933A (es) Metodos para diagnosticar el cancer pancreatico