ES2525545T3 - Métodos y usos para identificar el origen de un carcinoma de origen primario desconocido - Google Patents

Métodos y usos para identificar el origen de un carcinoma de origen primario desconocido Download PDF

Info

Publication number
ES2525545T3
ES2525545T3 ES11163930.8T ES11163930T ES2525545T3 ES 2525545 T3 ES2525545 T3 ES 2525545T3 ES 11163930 T ES11163930 T ES 11163930T ES 2525545 T3 ES2525545 T3 ES 2525545T3
Authority
ES
Spain
Prior art keywords
origin
gene
tissue
biomarkers
dna
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
ES11163930.8T
Other languages
English (en)
Inventor
Yixin Wang
Abhijit Mazumder
Dmitri Talantov
Timothy Jatkoe
Jonathan Baden
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Janssen Diagnostics LLC
Original Assignee
Janssen Diagnostics LLC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Janssen Diagnostics LLC filed Critical Janssen Diagnostics LLC
Application granted granted Critical
Publication of ES2525545T3 publication Critical patent/ES2525545T3/es
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/50Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
    • G01N33/53Immunoassay; Biospecific binding assay; Materials therefor
    • G01N33/574Immunoassay; Biospecific binding assay; Materials therefor for cancer
    • G01N33/57484Immunoassay; Biospecific binding assay; Materials therefor for cancer involving compounds serving as markers for tumor, cancer, neoplasia, e.g. cellular determinants, receptors, heat shock/stress proteins, A-protein, oligosaccharides, metabolites
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6883Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
    • C12Q1/6886Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material for cancer
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/50Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
    • G01N33/5005Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing involving human or animal cells
    • G01N33/5091Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing involving human or animal cells for testing the pathological state of an organism
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/112Disease subtyping, staging or classification
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/158Expression markers
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H10/00ICT specially adapted for the handling or processing of patient-related medical or healthcare data
    • G16H10/40ICT specially adapted for the handling or processing of patient-related medical or healthcare data for data related to laboratory analysis, e.g. patient specimen analysis
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02ATECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
    • Y02A90/00Technologies having an indirect contribution to adaptation to climate change
    • Y02A90/10Information and communication technologies [ICT] supporting adaptation to climate change, e.g. for weather forecasting or climate simulation

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Immunology (AREA)
  • Engineering & Computer Science (AREA)
  • Molecular Biology (AREA)
  • Pathology (AREA)
  • Analytical Chemistry (AREA)
  • Biomedical Technology (AREA)
  • Hematology (AREA)
  • Urology & Nephrology (AREA)
  • Physics & Mathematics (AREA)
  • General Health & Medical Sciences (AREA)
  • Cell Biology (AREA)
  • Organic Chemistry (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Biotechnology (AREA)
  • Microbiology (AREA)
  • Biochemistry (AREA)
  • Hospice & Palliative Care (AREA)
  • Zoology (AREA)
  • General Physics & Mathematics (AREA)
  • Wood Science & Technology (AREA)
  • Oncology (AREA)
  • Genetics & Genomics (AREA)
  • Medicinal Chemistry (AREA)
  • Food Science & Technology (AREA)
  • Biophysics (AREA)
  • Tropical Medicine & Parasitology (AREA)
  • Physiology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Engineering & Computer Science (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Investigating Or Analysing Biological Materials (AREA)
  • Apparatus Associated With Microorganisms And Enzymes (AREA)

Abstract

Un método de identificar el origen de una metástasis de origen desconocido que comprende los pasos de a. medir los Biomarcadores asociados con al menos seis carcinomas diferentes en una muestra que contiene células metastásicas en donde los Biomarcadores son niveles de expresión de al menos los genes Marcadores siguientes: SP-B, TTF1, DSG3, PSCA, F5, HPT1, PSA, MGB/MG, WT1 y PDEF; b. combinar los datos de los Biomarcadores en un algoritmo donde el algoritmo i. normaliza los Biomarcadores frente a la referencia; y ii. impone un punto de corte que optimiza la sensibilidad y especificidad de cada Biomarcador, pondera la prevalencia de los carcinomas y selecciona un tejido de origen; c. determinar el origen en base a la probabilidad más alta determinada por el algoritmo o determinar que el carcinoma no se deriva de un conjunto particular de carcinomas; y d. medir opcionalmente los Biomarcadores específicos para uno o más carcinomas diferentes adicionales, y repetir los pasos c) y d) para los Biomarcadores adicionales.

Description

CAMPO DE LA INVENCION
La invención proporciona métodos para identificar el origen de un carcinoma de origen primario desconocido.
ANTECEDENTES DE LA INVENCION
El carcinoma de origen primario desconocido (CUP) es un conjunto de tumores malignos confirmados por biopsia, heterogéneos, en donde la enfermedad metastásica presenta sin un sitio del tumor primario identificable o tejido de origen (toO). Este problema representa aproximadamente un 3-5% de todos los cánceres, haciendo de él el séptimo tumor maligno más común. Ghosh et al. (2005); y Mintzer et al. (2004). El pronóstico y régimen terapéutico de los pacientes son dependientes del origen del tumor primario, destacando la necesidad del sitio del tumos primario. Greco et al. (2004); Lembersky et al. (1996); y Schlag et al. (1994).
Se usan actualmente una variedad de métodos para resolver este problema. Varios métodos seguidos se esquematizan en las Figuras 1-2. Se pueden usar Marcadores tumorales séricos para diagnosis diferencial. Aunque carecen de especificidad adecuada, pueden ser usados en combinación con información patológica o clínica. Los métodos de Ghosh et al. (2005). Immunohistochemical (IHC) pueden ser usados para identificar el linaje tumoral pero pocos Marcadores IHC son 100% específicos. Por lo tanto, los patólogos usan a menudo un panel de Marcadores IHC. Varios estudios han demostrado precisiones del 66-88% usando de cuatro a 14 Marcadores IHC. Brown et al. (1997); DeYoung et al. (2000) y Dennis et al. (2005a). Estudios diagnósticos más caros incluyen métodos de obtención de imágenes como radiografía de tórax, tomografía computarizada (TC), y tomografías de emisión de positrones (PET). Cada uno de estos métodos puede identificar el primario en un 30 a 50% de los casos. Ghosh et al. (2005); y Pavlidis et al. (2003). A pesar de estas sofisticadas tecnologías, la capacidad de resolver casos de CUP es sólo del 20-30% ante mortem. Pavlidis et al. (2003); y Varadhachary et al. (2004).
Un nuevo enfoque prometedor reside en la capacidad de perfilado de expresión génica de todo el genoma para identificar el origen de los tumores. Ma et al. (2006); Dennis et al. (2005b); Su et al. (2001); Ramaswamy et al. (2001); Bloom et al. (2004); Giordano et al. (2001) y 20060094035. Estos estudios demostraron la factibilidad del tejido de identificación del origen en base al perfil de expresión génica. Para que estas tecnologías de perfilado de expresión sean útiles en el ámbito clínico, se deben superar dos obstáculos principales. Primero, como el perfilado de la expresión génica se realizó completamente en tejidos primarios, los candidatos a marcador de genes deben ser validados en tejidos metastásicos para confirmar que su expresión específica del tejido se conserva en la metástasis. Segundo, la tecnología de perfilado de expresión génica debe de ser capaz de usar tejido fijado en formalina, embebido en parafina (FFPE), ya que las muestras de tejido fijado son el material estándar en la práctica actual. Los fijación en formalina resulta en la degradación del ARN (Lewis et al. (2001) y Masuda et al. (1999)) por lo que los protocolos de micromatriz existentes no se realizarán con fiabilidad. Bibikova et al. (2004). Adicionalmente, la tecnología de perfilado debe ser robusta, reproducible y fácilmente accesible.
El RTPCR cuantitativo (qRTPCR) ha demostrado que genera resultados fiables de tejido FFPE. Abrahamsen et al. (2003); Specht et al. (2001); Godfrey et al. (2000) y Cronin et al. (2004). Por lo tanto, un enfoque más práctico sería usar un método de todo el genoma como una herramienta de descubrimiento y desarrollar un ensayo diagnóstico basado en una tecnología más robusta. Ramaswamy (2004). este paradigma, sin embargo, requiere un conjunto de genes más pequeño para ser desarrollado. Oien y sus compañeros usaron análisis en serie de la expresión génica (SAGE) para identificar 61 Marcadores tumorales de los que desarrollaron el método RTPCR en base a once genes para cinco tipos de tumores. Dennis et al. (2002). Otro estudio que acopla SAGE y qRTPCR desarrolló un panel de cinco genes para cuatro tipos de tumores y consiguió una precisión del 81%. Buckhaults et al. (2003). Un estudio más reciente acopló perfilado de micromatrices con qRTPCR, pero usó 79 Marcadores. Tothill et al. (2005).
RESUMEN DE LA INVENCION
La presente invención proporciona un método para identificar el origen de una metástasis de origen desconocido en una muestra que contiene células metastásicas que comprende los pasos de a) medir los Biomarcadores asociados con al menos seis carcinomas diferentes en donde los Biomarcadores son niveles de expresión de genes Marcadores en donde los genes Marcadores son SP-B, TTFI, DSG3, PSCA, F5, HPT1, PSA, MGB/MB, WT1 y PDEF, b) combinar los datos de los Biomarcadores en un algoritmo donde el algoritmo: normaliza los Biomarcadores frente a la referencia; e impone un punto de corte que optimiza la sensibilidad y especificidad de cada Biomarcador, pondera la prevalencia de carcinomas y selecciona un tejido de origen; c)determinar el origen en base a la probabilidad más alta determinada por el algoritmo o determinar que el carcinoma no se deriva de un conjunto particular de carcinomas; y d) medir opcionalmente Biomarcadores específicas para uno o más carcinomas
diferentes adicionales, y repetir los pasos c) y d) como sea necesario para Biomarcadores adicionales.
BREVE DESCRIPCION DE LOS DIBUJOS
Las Figuras 1-2 representan métodos del estado de la técnica para identificar el origen de una metástasis de origen desconocido. La Figura 3 representa el algoritmo de diagnóstico CUP actual. La Figura 4 representa datos de micromatrices que muestran intensidades de dos genes en un panel de tejidos. (A) Antígeno de células madre de próstata (PSCA). (B) Factor de coagulación V (F5). Los gráficos de barras muestran la intensidad en el eje y y el tejido en el eje x. Panc Ca, cáncer de páncreas; Panc N, páncreas normal. La Figura 5 representa electroferogramas obtenidos de un Bioanalizador Agilent. El ARN fue aislado de tejido FFPE usando una digestión de proteinasa K de tres horas (A) o dieciséis horas (B). La muestra C22 (roja) era un bloque de un año de edad mientras que la muestra C23 (azul) era un bloque de cinco años de edad. Se muestra una escala de tamaño en verde. La Figura 6 representa una comparación de valores de Ct obtenidos de tres métodos qRTPCR diferentes: cebado de hexámeros aleatorio en la transcripción inversa seguido por qPCR con el ADNc resultante (paso RH 2), cebado específico de genes (cebador inverso) en la transcripción inversa seguido por qPCR con el ADNc resultante (paso GSP 2), o cebado específico de genes y qRTPCR en una reacción de una etapa (paso GSP 1). Se dividió ARN de once muestran en los tres métodos y se midieron los niveles de ARN para los tres genes; β-actina (A), HUMSPB (B), y TTF (C). El valor de Ct mediano obtenido con cada método se indica por la línea sólida. La Figura 7 representa diagramas de placas de ensayo CUP. La Figura 8 es una serie de gráficos que representan el rendimiento del ensayo sobre un intervalo de concentraciones ARN. La Figura 9 es un diagrama de flujo de trabajo experimental; nominación y validación de candidatos a Marcadores (9A); y optimización de ensayos y construcción y prueba del algoritmo de predicción (9B). La Figura 10 representa la expresión de 10 candidatos a Marcadores de genes específicos de tejidos seleccionados en carcinomas metastásicos de FFPE y adenocarcinoma primario de próstata. Para cada gráfico el eje X representa el valor de expresión del Marcador normalizado. La Figura 11 representa la optimización del ensayo (a y B) Electroferogramas obtenidos de un Bioanalizador Agiletn. El ARN se aisló de tejido FFPE usando una digestión de proteinasa K de tres horas (A) o dieciséis horas. La muestra C22 (roja) era un bloque de un año de edad mientras que la muestra C23 (azul) era un bloque de cinco años de edad. Se muestra una escala de tamaño en verde. (C y D). Comparación de valores de Ct obtenidos de tres métodos qRTPCR diferentes: cebado de hexámeros aleatorio en la transcripción inversa seguido por qPCR con el ADNc resultante (paso RH 2), cebado específico de genes (cebador inverso) en la transcripción inversa seguido por qPCR con el ADNc resultante (paso GSP 2), o cebado específico de genes y qRTPCR en una reacción de una etapa (paso GSP 1). Se dividió ARN de once muestran en los tres métodos y se midieron los niveles de ARN para los dos genes; β-actina (C) y HUMSPB (D). El valor de Ct mediano obtenido con cada método se indica por la línea sólida. La Figura 12 es un mapa térmico que muestra los niveles de expresión relativos de los 10 paneles de Marcadores a través de 239 muestra. El rojo indica expresión más alta.
DESCRIPCION DETALLADA
El identificar el sitio primario en pacientes con carcinoma metastásico de origen primario desconocido (CUP) puede permitir la aplicación de regímenes terapéuticos específicos y puede prolongar la supervivencia. Los candidatos a marcador fueron entonces validados por reacción en cadena de la polimerasa de transcriptasa inversa (RT-PCR) en 205 carcinomas metastásicos FFPE originarios de estos seis tejidos así como metástasis originarias de otros tipos ce cáncer para determinar la especificidad. Se seleccionó una firma de diez genes que predecía el tejido de origen de carcinomas metastásicos para estos seis tipos de cáncer. Después, se optimizaron los métodos de aislamiento de ARN y qRTPCR para estos diez Marcadores, y se aplicó el ensayo qRTPCR a un conjunto de 260 tumores metastásicos, generando una precisión general del 78%. Por último, se probó un conjunto independiente de 48 muestras metastásicas. Es importante destacar que treinta y siete muestras en este conjunto tenían o un primario conocido o se presentaban inicialmente como CUP pero se resolvieron posteriormente, y el ensayo demostró una precisión del 78%.
Un Biomarcador es cualquier indicio del nivel de expresión de un gen Marcador indicado. El indicio puede ser directo o indirecto y medir la sobre-o bajo-expresión del gen dados los parámetros fisiológicos y en comparación con un control interno, tejido normal u otro carcinoma. Los Biomarcadores incluyen, sin limitación, ácidos nucleicos (tanto sobre y -bajo-expresión y directos e indirectos). Usar ácidos nucleicos como Biomarcadores puede incluir cualquier método conocido en la técnica incluyendo, sin limitación, medir de la amplificación de ADN, ARN, micro ARN, pérdida de heterocigosidad (LOH), polimorfismos de nucleótido único (SNPs, Brookes (1999)), ADN de microsatélites, hipo-o hiper-metilación de ADN. Usar proteínas como Biomarcadores incluye cualquier método conocido en la técnica incluyendo, sin limitación, medir la cantidad, actividad, modificaciones como glicosilación,
fosforilación, ADP-ribosilación, ubiquitinación, etc., o inmunohistoquímica (IHC). Otros Biomarcadores incluyen obtención de imágenes, recuento celular y Marcadores de apoptosis.
Los genes indicados proporcionados en la presente son los asociados con un tumor o tipo de tejido
5 particular. Un gen Marcador puede estar asociado con numerosos tipos de cáncer pero siempre que la expresión del gen esté lo suficientemente asociada con un tumor o tipo de tejido a ser identificado usando el algoritmo descrito en la presente para ser específico para un origen particular, el gen puede ser usado en la invención reivindicada para determinar el tejido de origen para un carcinoma de origen primario desconocido (CUP). Se conocen en la técnica numerosos genes asociados con uno o más cánceres. La presente invención proporciona genes Marcadores preferidos e incluso más preferido combinaciones de genes Marcadores. Estos se describen en la presente con detalle. "Origen" como se refiere en "tejido de origen" significa o el tipo de tejido "pulmón, colon, etc.) o el tipo histológico (adenocarcinoma, carcinoma de células escamosas, etc.) dependiendo de las circunstancias médicas particulares y se entenderá por cualquiera experto en la técnica.
15 Un gen Marcador corresponde a la secuencia designada por una SEQ ID NO cuando contiene esa secuencia. Un segmento o fragmento de gen corresponde a la secuencia de dicho gen cuando contiene una porción de la secuencia referenciada o su complemento suficiente para distinguirlo como de la secuencia del gen. Un producto de la expresión del gen corresponde a dicha secuencia cuando su ARN, ARNm o ADNc hibrida con la composición que tiene dicha secuencia (por ejemplo, una sonda) o, en el caso de un péptido o proteína, está codificado por dicho ARNm. Un segmento o fragmento de un producto de la expresión del gen corresponde a la secuencia de dicho gen o producto de expresión del gen cuando contiene una porción del producto de expresión del gen referenciado o su complemento suficiente para distinguirlo como de la secuencia del gen o producto de expresión del gen.
25 Los métodos de la invención descritos y reivindicados en esta especificación incluyen genes Marcadores, como se definen en las reivindicaciones. "Marcador" o "gen Marcador" se usa a lo largo de esta especificación para referirse a genes y productos de la expresión de genes que corresponden con cualquier gen la sobre-o bajoexpresión del cual está asociada con un tumor o tipo de tejido. Los genes Marcadores se describen con más detalle en la Tabla 1.
Tabla 1
Panel CUP
SEQ ID NO:
Nombre Designación del Chip secuencia
1
SP-B 209810_at
2
TTF1 211024_s_at
(continuada)
Panel CUP
SEQ ID NO:
Nombre Designación del Chip secuencia
3
DSG3 205595_at
4
HPT1 209847_at
5
PSCA 205319_at
6
F5 204713_s_at
7
MGB1 206378_at
(continuada)
Panel CUP
SEQ ID NO:
Nombre Designación del Chip secuencia
8
PDEF 220192_x_at
9
PSA 204582_s_at
10
WT1 206067_s_at
La presente invención proporciona un método para identificar el origen de una metástasis de origen
desconocido midiendo Biomarcadores asociados con al menos seis carcinomas diferentes en una muestra que
contiene células metastásicas en donde los Biomarcadores son niveles de expresión de genes y donde los genes
45 Marcadores son SP-8, JTFI, DSG3, PSCA, F5, HPT1, PSA, MGB/MG. WT1 y PDEF; combinando los datos de los Biomarcadores en un algoritmo donde el algoritmo: normaliza los Biomarcadores frente a la referencia; e impone un punto de corte que optimiza la sensibilidad y especificidad de cada Biomarcador, pondera la prevalencia de carcinomas y selecciona un tejido de origen; determina el origen en base a la probabilidad más alta determinada por el algoritmo o determina que el carcinoma no se deriva de un conjunto particular de carcinomas; y mide opcionalmente Biomarcadores específicos para uno o más carcinomas diferentes adicionales, y repite los pasos como sea necesario para Biomarcadores adicionales.
La presente invención proporciona un método para identificar el origen de una metástasis de origen desconocido en una muestra que contiene células metastásicas como se define en las reivindicaciones, que
55 comprende: medir los Biomarcadores asociados con al menos seis carcinomas diferentes; combinar los datos de los Biomarcadores en un algoritmo donde el algoritmo i) normaliza los Biomarcadores frente a la referencia; y ii) impone un punto de corte que optimiza la sensibilidad y especificidad de cada Biomarcador, pondera la prevalencia de carcinomas y selecciona un tejido de origen; determinar el origen en base a la probabilidad más alta determinada por el algoritmo o determinar que el carcinoma no se deriva de un conjunto particular de carcinomas; y medir opcionalmente Biomarcadores específicos para uno o más carcinomas diferentes adicionales, y repetir los pasos c) y d) para Biomarcadores adicionales.
Los genes Marcadores son i) SP-B, TTF1, DSG3, PSCA, F5, HPT1, PSA, MCB/MC, WT1 y PDEF. Los genes Marcadores pueden incluir además KRT6F, p73H, y/o SFTPC. 65
Preferiblemente, los genes Marcadores pueden además incluir ITGB6, KLK10, CLDN18, TR10 y/o FKB 10.
En otra realización, los genes Marcadores pueden además incluir CDX1 y/o FABP1.
En una realización, la expresión génica se mide usando al menos una de las SEQ ID NOs: 11-58.
La presente divulgación también proporciona métodos que miden la expresión génica obteniendo y midiendo la formación de al menos uno de los amplicones SEQ ID NOs: 14, 18, 22, 26, 30, 34, 38, 42, 46, 50, 54 y/o
58.
En una realización, los genes Marcadores pueden comprender además un Marcador específico del género seleccionado de al menos uno de: i) en el caso de un paciente masculino KLK2, NGEP o NPY; o ii) en el caso de un paciente femenino PIP, B305D, B726 o GABA-Pi; y/o PAX8, STAR o EMX2. Preferiblemente los genes Marcadores comprenden además KLK2. En esta realización, los genes marcadores pueden comprender además NGEP y/o NPY. En una realización, en el caso de un paciente femenino, los genes Marcadores comprenden además PIP, B305D, B726 o GABA-Pi. En una realización, en el caso de un paciente femenino los genes Marcadores comprenden además, PAX8, STAR o EMX2.
La presente divulgación proporciona métodos para obtener información clínica adicional incluyendo el sitio de metástasis para determinar el origen del carcinoma; obtener conjuntos de biomarcadores óptimos para carcinomas que comprende los pasos de usar metástasis de origen conocido, determinar Biomarcadores para ello y comparar los Biomarcadores con Biomarcadores de metástasis de origen desconocido; proporcionar dirección de terapia determinando el origen de una metástasis de origen desconocido e identificar el tratamiento apropiado para ello; y proporcionar un pronóstico determinando el origen de una metástasis de origen desconocido e identificar el pronóstico correspondiente para ello.
La presente divulgación proporciona además métodos de encontrar Biomarcadores determinando el nivel de expresión de un gen Marcador en una metástasis particular, medir un Biomarcador para el gen Marcador para determinar la expresión del mismo, analizar la expresión del gen Marcador de acuerdo con cualquiera de los métodos proporcionados en la presente o conocidos en la técnica y determinar si el gen Marcador es efectivamente específico para el tumor de origen.
La presente divulgación proporciona además una composición que contiene al menos una secuencia aislada seleccionada de las SEQ ID NOs: 11-58. La presente invención proporciona además el uso de kits para realizar un ensayo de acuerdo con los métodos proporcionados en la presente, en donde el kit comprende ARN o ADNc que hibrida con los genes marcadores de la invención, una micromatriz o un chip génico.
La presente invención proporciona además el uso de micromatrices o chips génicos para realizar los métodos descritos en la presente.
La presente divulgación proporciona además carpetas de diagnóstico/pronóstico que contienen secuencias de ácidos nucleicos aislados, sus complementos, o porciones de los mismos de una combinación de genes como se describe en la presente donde al combinación es suficiente para medir o caracterizar la expresión génica en una muestra biológica que tiene células metastásicas con respecto a células de carcinomas o tejido normal diferentes.
Cualquier método descrito en la presente invención puede además incluir medir la expresión de al menos un gen expresado constitutivamente en la muestra.
Los Marcadores para el cáncer de páncreas son factor de coagulación V (F5), antígeno de células madre de próstata (PSCA), integrina, β6 (ITGB6), calicreína 10 (KLK10), claudina 18 (CLDN18), isoforma trío (TR10), y proteína hipotética FLJ22041 similar a las proteínas de unión a FK506 (FKBP10). Los Biomarcadores para F5 y PSCA se miden juntos. Los Biomarcadores para ITGB6, KLK10,CLDN18, TR10, y FKBP10 se pueden medir además de para F55 y PSCA. El F5 se describe por ejemplo por 20040076955; 20040005563 y WO2004031412. El PSCA se describe por ejemplo por la WO1998040403; 20030232350 y WO2004063355. La ITGB6 se describe por ejemplo por la WO2004018999 y 6339148. La KLK 10 se describe por ejemplo por la WO20040770 y 20030235820. El CLDN18 se describe por ejemplo por la WO2004063355 y WO2005005601. El TR10 se describe por ejemplo por la 20020055627. El FKBP10 se describe por ejemplo por la WO2000055320.
Los genes Marcadores para el cáncer de colon son el transportador asociado a péptidos intestinal HPT-1 (CDF17), el factor de transcripción de la caja homeótica de tipo caudal 1 (CDX 1) y la proteína de enlace de ácidos grasos 1 (FABP1). Los Biomarcadores para CDX1 y FABP1 se pueden medir en adición a un Biomarcador para CDH 17. El CDH17 se describe por ejemplo por Takamura et al. (2004) y la WO2004063355. El CDX1 se describe por ejemplo por Pilozzi et al. (2004); 20050059008y la 20010029020. El FABP11 se describe por ejemplo por Borchers et al. (1997); Chan et al. (1985); Chen et al. (1986); y Lowe et al. (1985).
Los genes Marcadores para el cáncer de pulmón son la proteína surfactante B (SP-B), el factor de transcripción tiroideo (TTF), desmogleína 3 (DSG3), isoforma 6F de la queratina 6 (KRT6F), gen relacionado con el p53 (p73H), y la proteína surfactante C (SFTPC). Los Biomarcadores para SP-B, TTF y DSG3 se miden juntos. Los Biomarcadores para KRT6F, p73H y SFTPC se pueden medir en adición a cualquiera de los Biomarcadores para SP-B, TTF y/o DSG3. La SP-B se describe por ejemplo por Pilot-Mathias et al. (1989); 20030219760 y 20030232350. El TTF se describe por ejemplo por Jones et al. (2005); US20040219575; WO1998056953; WO2002073204; 20030138793 y WO2004063355. La DSG3 se describe por ejemplo por Wan et al. (2003); 20030232350; aWO2004030615; y WO2002101357. La KRT6F se describe por ejemplo por Takahashi et al. (1995); 20040146862 y 20040219572. El p73H se describe por ejemplo por Senoo et al. (1998) y 20030138793. La SFTPC se describe por ejemplo por Glasser et al. (1988).
Los genes Marcadores pueden ser seleccionados además de un Marcador específico del género como, en el caso de un paciente masculino KLK2, NGEP o NPY; o en el caso de un paciente femenino PIP, B305D, B726 o GABA-Pi; y/o PAX8, STAR o EMX2.
Los genes Marcadores para el cáncer de mama son el factor epitelial derivado de la próstata (PDEF), mamaglobina (MG), proteína prolactininducible (PIP), B305D, B726, y GABA-π. Los biomarcadores para PDEF y MG se miden juntos. Los Biomarcadores para PIP, B305D, B726 y GABA-Pi se pueden medir en adición a los Biomarcadores para PDEF y MG. El PDES se describe por ejemplo por la WO2004030615; WO2000006589; WO2001073032; Wallace et al. (2005); Feldman et al. (2003); y Oettgen et al. (2000). La MG se describe por ejemplo por la WO2004030615; 20030124128; Fleming et al (2000); Watson et al. (1996 and 1998) y 5668267. La PIP se describe pro ejemplo por Autiero et al. (2002); Clark et al. (1999); Myal et al. (1991) y Murphy et al. (1987). B305D, B726 y GABA-Pi se describen por Reinholz et al. (2005). El NGEP se describe por ejemplo por Bera et al. (2004).
Los Marcadores para el cáncer de ovarios son el tumor de Wilm I (WT1), PAX8, proteína reguladora aguda esteroidogénica (STAR) y EMX2. Preferiblemente, se miden los Biomarcadores para WT1. Los Biomarcadores para STAR y EMX2 pueden ser medidos en adición a los Biomarcadores para WT1. El WT1 se describe por ejemplo por 350840; 6232073; 6225051; 20040005563 y Bentov et al. (2003). El PAX8 se describe por ejemplo por 20050037010; Poleev et al. (1992); Di Palma et al. (2003); Marques et al. (2002); Cheung et al. (2003); Goldstein et al. (2002); Oji et al. (2003); Rauscher et al. (1993); Zapata-Benavides et al. (2002) y Dwight et al. (2003). La STAR se describe por ejemplo por Gradi et al. (1995) y Kim et al. (2003). El EMX2 se describe por ejemplo por Noonan et al. (2001).
Los Marcadores para el cáncer de próstata son KLK3, KLK22, NGEP y NPY. Se miden los Biomarcadores para KLK3. Los Biomarcadores para KLK2, NGEP y NPY pueden ser medidos en adición a KLK3. El KLK2 y KLK3 se describen por ejemplo por Magklara et al. (2002). El KLK2 se describe por ejemplo por US 20030215835 y US 5786148, El KLK3 se describe por ejemplo por US 6261766.
El método puede también incluir obtener información clínica adicional que incluya el sitio de metástasis para determinar el origen del carcinoma. En la Figura 3 se proporciona un diagrama de flujo.
La divulgación proporciona además un método para obtener conjuntos de Biomarcadores óptimos para carcinomas usando metástasis de origen conocido, determinando Biomarcadores para ello y comparando los Biomarcadores con Biomarcadores de metástasis de origen desconocido.
La divulgación proporciona además un método para proporcionar dirección de terapia determinando el origen de una metástasis de origen desconocido de acuerdo con los métodos descritos en la presente e identificando el tratamiento apropiado para ello.
La divulgación proporciona además un método para proporcionar un pronóstico determinando el origen de una metástasis de origen desconocido de acuerdo con los métodos descritos en la presente e identificando el pronóstico correspondiente para ello.
La divulgación proporciona además un método para encontrar Biomarcadores que comprende determinar el nivel de expresión de un gen Marcador en una metástasis particular, medir un Biomarcador para el gen Marcador para determinar la expresión del mismo, analizar la expresión del gen Marcador de acuerdo con los métodos descritos en la presente y determinar si el gen Marcador es efectivamente específico para el tumor de origen.
La divulgación proporciona además composiciones que comprenden al menos una secuencia aislada seleccionada de las SEQ ID NOs: 11-58.
La invención proporciona además el uso de kits, micromatrices o chips génicos para llevar a cabo los ensayos descritos en la presente, como se define en las reivindicaciones.
Se ha encontrado sólo en raras ocasiones que la mera presencia o ausencia de secuencias de ácidos nucleicos particulares en una muestra de tejido tenga valor diagnóstico o de pronóstico. La información sobre la expresión de varias proteínas, péptidos o ARNm, por otro lado, se considera cada vez más como importante. La mera presencia de secuencias de ácidos nucleicos que tienen el potencial de expresar proteínas, péptidos o ARNm (tales secuencias referidas como "genes") dentro del genoma por sí mismo no es determinante de si una proteína, péptido a ARNm se expresa en una célula dada. Si un gen dado capaz de expresar proteínas, péptidos o ARNm lo hace y a que extensión tiene lugar tal expresión, en todo caso, se determina por una variedad de factores complejos. Independientemente de las dificultades de entender y evaluar estos factores, el ensayar la expresión génica puede proporcionar información útil sobre la ocurrencia de eventos importantes como tumorogénesis, metástasis, apoptosis, y otros fenómenos clínicamente relevantes. Las indicaciones relativas del grado a los que los genes son activos o inactivos puede encontrarse en los perfiles de expresión génica. Los perfiles de expresión génica obtenidos de los métodos de esta invención se usan para proporcionar diagnóstico y tratar pacientes de CUP.
La preparación de la muestra requiere la recogida de muestras de pacientes. Las muestras de pacientes usadas en el método de la invención son las que se sospecha que contienen células enfermas como las células tomadas de un nódulo en un aspirado de aguja fina (FNA) del tejido. La preparación del tejido bruto obtenido de una biopsia o espécimen quirúrgico y microdisección por captura láser también son adecuadas para el uso. La tecnología por microdisección por captura láser (LCM) es una manera de seleccionar las células a ser estudiadas, minimizando la variabilidad causada por la heterogeneidad del tipo celular. Consecuentemente, los cambios moderados o pequeños en la expresión del gen Marcador entre células normales o benignas y cancerosas pueden ser detectados fácilmente. Las muestras pueden también comprender células epiteliales circulantes extraídas de sangre periférica. Estas se pueden obtener de acuerdo con un número de métodos pero el método más preferido es la técnica de separación magnética descrita en la 6136182. Una vez que se ha obtenido la muestra que contiene las células de interés, se obtiene un perfil de expresión génica usando un Biomarcador, para los genes en las carpetas apropiadas.
Los métodos preferidos para establecer los perfiles de expresión génica incluyen determinar la cantidad de ADN que se produce por un gen que puede codificar para una proteína o péptido. Esto se consigue por PCR con transcriptasa inversa (TR-PCR), RT-PCR competitiva, RT-PCR en tiempo real, RT-PCR con visualización diferencial, análisis Northern Blot y otras pruebas relacionadas. Aunque es posible llevar a cabo estas técnicas usando reacciones de PCR individuales, es mejor amplificar el ADN complementario (ADNc) o el ARN complementario (ARNc) producido por el ARNm y analizarlo a través de micromatrices. Se conocen una variedad de configuraciones de matrices y métodos para su producción diferentes por los expertos en la técnica y se describen e por ejemplo, 5445934; 5532128; 5556752; 5242974; 5384261; 5405783; 5412087; 5424186; 5429807; 5436327; 5472672; 5527681; 5529756; 5545531; 5554501; 5561071; 5571639; 5593839; 5599695; 5624711; 5658734 y 5700637.
44 La tecnología de micromatrices permite la medición del nivel de ARNm en estado estacionario de miles de genes proporcionando simultáneamente una herramienta poderosa para identificar efectos como el inicio, detención
o modulación de la proliferación celular no controlada. Hay actualmente en uso generalizado dos tecnologías de micromatrices, ADNc y matrices de oligonucleótidos. Aunque existen diferencias en la construcción de estos chips, esencialmente todo el análisis de datos secuencia abajo y salida son lo mismo. El producto de estos análisis son típicamente mediciones de la intensidad de la señal recibida de una sonda etiquetada usada para detectar una secuencia de ADNc de la muestra que hibrida con una secuencia de ácidos nucleicos en una localización conocida en la micromatriz. Típicamente, la intensidad de la señal es proporcional a la cantidad de ADNc, y por lo tanto de ARNm, expresada en las células de la muestra. Un gran número de dichas técnicas están disponibles y son útiles. Los métodos preferidos para determinar la expresión génica se pueden encontrar en 6271002; 6218122; 6218114 y 6004755.
El análisis de los niveles de expresión se lleva a cabo comparando dichas intensidades de señal. Esto se hace mejor generando una matriz de relación de las intensidades de la expresión de los genes en una muestra de prueba frente a las de las muestras de control. Por ejemplo, las intensidades de la expresión génica de un tejido enfermo se pueden comparar con las intensidades de la expresión generadas de tejido benigno o normal del mismo tipo. Una relación de estas intensidades de expresión indica las veces de cambio en la expresión génica entre las muestras de prueba y control.
La selección se puede basar en pruebas estadísticas que producen listas clasificadas relacionadas con la evidencia de significancia de cada expresión diferencial del gen entre factores relacionados con el sitio de origen original del tumor. Ejemplos de tales pruebas incluyen ANOVA y Kruskal-Wallis. Las clasificaciones pueden ser usadas como ponderaciones en un modelo diseñado para interpretar la suma de dichas ponderaciones, hasta un punto de corte, como la preponderancia de la evidencia a favor de una clase sobre otra. La evidencia anterior como se describe en la bibliografía también se puede usar para ajustar las ponderaciones.
En la presente invención, se eligieron 10 marcadores que mostraron evidencia significativa de expresión diferencial entre 6 tipos de tumores. El proceso de selección incluía una recogida ad-hoc de pruebas estadísticas, optimización de varianza media y conocimiento experto. En una realización alternativa los métodos de extracción de características podrían ser automatizados para seleccionar y probar marcadores a través de enfoques de
aprendizaje supervisados. A medida que crece la base de datos, la selección de marcadores se puede repetir para producir la precisión de diagnóstico más alta posible en cualquier estado dado de la base de datos.
Una realización preferida es normalizar cada medición identificando un conjunto de control estable y modificando a escala este conjunto a varianza cero en todas las muestras. Este conjunto de control se define como cualquier transcripción endógena individual o conjunto de transcripciones endógenas afectadas por el error sistemático en el ensayo, y que no se conoce que cambie independientemente de este error. Todos los marcadores son ajustados por el factor específico de la muestra que genera la varianza cero para cualquier estadística descriptiva del conjunto de control, como la media o mediana, o para una medición directa. Alternativamente, si la premisa de variación de los controles relacionados sólo con el error sistemático no es cierta, todavía el error de clasificación resultante es menor que cuando se realiza la normalización, el conjunto de control todavía se usará como se ha expuesto. Los controles pico no endógenos también podrían ser útiles, pero no se prefieren.
Después de la selección de marcadores, estas variables seleccionadas se usan en un clasificados diseñado para producir una precisión de clasificación tan alta como sea posible. Se puede usar un algoritmo de aprendizaje supervisado diseñado para relacionar un conjunto de mediciones de entrada con un conjunto de salidas de predictores a fin de construir un modelo de las 10 entradas para predecir el tejido de origen. El problema se puede plantear como: dado los datos de aprendizaje {(x1, y), ..., (xn, y)} producir un clasificador h: χ→γ que mapea una muestra x ∈ χ de su tejido de etiqueta de origen y ∈ γ. Las predicciones se basan en casos anteriormente resueltos que están contenidos en la base de datos y por lo tanto componen el conjunto de aprendizaje.
El algoritmo de aprendizaje supervisado debería encontrar parámetros en base a las relaciones de las variables de entrada con las salidas conocidas que minimizarán el error de clasificación esperados. Estos parámetros pueden ser entonces usados para predecir el tejido de origen de una nueva entrada de la muestra. Ejemplos de estos algoritmos incluyen modelos de clasificación lineal, clasificadores cuadráticos, métodos basados en árbol, redes neuronales y métodos prototipo como un clasificador de elemento afín k o algoritmos de cuantificación del vector de aprendizaje.
Una realización específica al modelo de 10 marcadores normalizados es el método LDA, usando parámetros por defecto, como se describe en Venables y Ripley (2002). Este método se basa en el Análisis discriminante lineal de Fisher, donde las medias dadas µy=0, µy=1 y las covarianzas Σy=0, Σy=1 para las etiquetas clases y 0 y 1, buscamos una combinación lineal de w.x que tendría medias w.µy=i y varianzas wTΣy=iw que maximizarán la proporción de la varianza entre las cales con la varianza dentro de las clases.
La LDA puede ser generalizada a un análisis discriminante de clase múltiple, donde y tiene N estados posibles, en lugar de sólo dos. Las medias y varianzas de clase se estiman de los valores contenidos en la base de datos para los marcadores elegidos. En una realización preferida, la matriz de la covarianza es ponderada por probabilidades anteriores iguales de cada tipo de tumor sometido a lo siguiente. Los pacientes masculinos se predicen por un modelo donde los anteriores son cero para cada para cada grupo de tumor de órgano reproductor femenino. Igualmente, los pacientes femeninos se predicen por un modelo donde el anterior es cero para los órganos reproductores masculinos. En la presente invención, los anteriores son cero para pruebas en mujeres para próstata y cero para varones probados para mama y ovarios. Además, las muestras con un antecedente idéntico a una etiqueta de clase se prueban por un modelo donde la probabilidad anterior es cero para esa etiqueta de clase particular.
El problema anterior se pude ver como una maximización del cociente de Rayleigh manejado como un problema de valor propio generalizado. El subespacio reducido se usa en la clasificación calculando cada distancia de la muestra al centroide en el subespacio elegido. El modelo puede ser ajustado por probabilidad máxima, y las probabilidades posteriores se calculan usando el teorema de Bayes.
Un método alternativo puede incluir encontrar un mapa de un espacio característico n-dimensional, donde n es el número de variables usadas, a un conjunto de etiquetas de clasificación que implicará particionar el espacio característico en regiones, asignando después una clasificación para cada región. Las puntuaciones de estos algoritmos de tipo afines están relacionadas con la distancia entre los límites de decisión y no se traducen necesariamente en probabilidades de clase.
Si hay demasiadas variables de las que seleccionar, y muchas de ellas son ruido aleatorio, entonces la selección de variable y el riesgo del modelo ajustan en exceso el problema. Por lo tanto, se usan a menudo listas
clasificadas en varios puntos de corte como entradas a fin de limitar el número de variables. También se pueden usar algoritmos de búsqueda como un algoritmo genético para seleccionar un sub-conjunto de variables ya que ponen a prueba una función de costes. Se puede intentar hibridación simulada para limitar el riesgo de tomar la función de coste en un mínimo local. Sin embargo, estos procedimientos deben ser validados con muestras independientes al proceso de selección y de modelado.
También se pueden usar enfoques variables latentes. Se puede usar cualquier algoritmo de aprendizaje sin supervisar para estimar variedades de baja dimensión de espacio de alta dimensión para descubrir asociaciones entre las variables de entrada y lo bien que pueden encajar un conjunto más pequeño de variables latentes. Aunque las estimaciones de la efectividad de estas reducciones son subjetivas, se puede aplicar un algoritmo supervisado en el conjunto de variables reducido a fin de estimar la precisión de la clasificación. Por lo tanto un clasificador, que puede ser construido de las variables latentes, también se puede construir de un conjunto de variables correlacionadas significativamente con las variables latentes. Un ejemplo de esto incluiría usar variables correlacionadas con los componentes principales, de un análisis de componentes principales, como entradas a cualquier modelo de clasificación supervisado.
Estos algoritmos se pueden implementar en cualquier código de software que tenga métodos para introducir las variables, aprender las muestras con una función, probar una muestra basada en el modelo, y extraer los resultados a una consola. R, Octave, C, C++, Fortran, Java, Perl y Python tienen todos bibliotecas disponibles bajo licencia de código abierto para realizar muchas de las funciones enumeradas anteriormente. Los paquetes comerciales como S+ y Matlab también incluyen muchos de estos métodos.
El código realiza los siguientes pasos en el orden siguiente usando la versión R 2.2.1 (http://www.rproject.org) con la biblioteca MASS (Venables et al. (2002)) instalada. El término LDA se refiere a la función Ida en el espacio de nombres MASS.
1) se almacenan valores de CT para 10 genes marcadores y 2 controles en un disco duro para todas las muestras del conjunto de aprendizaje disponibles. 2) Para cada muestra, restar la media específica de la muestra de los controles de cada marcador normaliza los 10 valores de genes marcadores. 3) El conjunto de datos de aprendizaje está compuesto de metástasis con sitios conocidos de origen donde cada muestra tiene al menos uno de sus marcadores objetivo específicos para el tejido etiquetado de origen con un valor de CT normalizado menor de 5. 4) El LDA construye 4 conjuntos de 2 modelos de LDA de los datos de aprendizaje en (3). En cada conjunto, un modelo es específico para varones, y tiene probabilidades anteriores para mama y ovario establecidas en cero así como las probabilidades anteriores para la próstata establecidas a los anteriores equivalentes de otras etiquetas de clase. El otro modelo en cada par es específico para mujeres con las probabilidades anteriores de próstata establecidas a cero, y con los anteriores para mama y ovario establecidos a los anteriores equivalentes encontrados en otras etiquetas de clase.
a.
El primer conjunto se usa para probar muestras de CUP encontradas en el colon, las probabilidades anteriores para el colon están establecidas a cero y todas las otras etiquetas de clase no reproductoras están establecidas a los anteriores equivalentes.
b.
Un segundo conjunto del modelo es específico para una CUP encontrado en el ovario, cono las probabilidades anteriores para el ovario establecidas a cero y todas las otras etiquetas de clase no reproductoras establecidas a anteriores equivalentes.
c.
Un tercer conjunto para un CUP encontrado en el pulmón, con las probabilidades anteriores para el pulmón establecidas a cero. Todas las otras etiquetas de clase no reproductoras tienen anteriores equivalentes.
d.
EL modelo general usado para todos los otros tejidos de fondo. Todos los anteriores están establecidos equivalentemente con la excepción de las etiquetas de clase específicas reproductoras que están establecidas como se define en 4.
Para probar una muestra, ejecutamos un programa R que realiza lo siguiente.
1) Lee en un conjunto de datos de prueba. 2) Genera una media específica de la muestra de ambos controles. 3) Para cada muestra, usa la media específica de la muestra para restarla de cada marcador. 4) Reemplaza cualquier CT normalizado generado de un CT bruto de 40 con 12. 5) Para cada muestra en el conjunto de prueba se prueban los siguientes.
a.
Si la media de ambos controles son mayores de 34 que la muestra es etiquetada con 'CTR_FALLO' con ceros para probabilidades posteriores.
b.
Se comprueban los antecedentes para colon, ovario o pulmón. Si se encuentra una coincidencia se comprueba también el género. El modelo específico de los antecedentes y género se usa entonces para
evaluar la muestra.
c.
Si se encuentra mama, páncreas, pulmón, SCC o próstata como la etiqueta de antecedentes, entonces se da una etiqueta de "FALLO-muestra_inelegible" a la muestra, y las probabilidades posteriores son todas establecidas en cero.
d.
El modelo general ya sea para varón o mujer se usa para todas las otras muestras.
Los resultados son formateados y escritos en un archivo.
La presente divulgación incluye carpetas de expresión génica obtenidos por este proceso.
Los perfiles de expresión génica se pueden mostrar de varias maneras. La más común es organizar las intensidades de fluorescencia brutas o matriz de relación en un dendograma gráfico donde las columnas indican las muestras de prueba y las filas indican los genes. Los datos son organizados de tal manera que los genes que tienen perfiles génicos similares están próximos entre sí. La relación de la expresión para cada gen se visualiza como un color. Por ejemplo, una relación de menos de uno (regulación hacia abajo) aparece en la porción azul del espectro mientras que una relación mayor de uno (regulación hacia arriba) aparece en la porción roja del espectro. Hay disponibles programas de software de ordenador comercialmente disponibles para mostrar dichos datos incluyendo "GeneSpring" (Silicon Genetics, Inc.) y "Discovery" e "Infer" (Partek, Inc.).
Las mediciones de la abundancia de especies de ARN únicas se recogen de tumores primarios o tumores metastásicos de primarios de origen desconocido. Estas lecturas junto con los registros clínicos incluyendo, pero no limitado a, edad del paciente, género, sitio de origen del tumor primario, y sitio de metástasis (si es aplicable) se usan para generar una base de datos relacional. La base de datos se usa para seleccionar transcritos de ARN y factores clínicos que pueden ser usados como variables de marcadores para predecir el origen primario de un tumos metastásico.
En el caso de medir niveles de proteínas para determinar la expresión génica, es adecuado cualquier método conocido en la técnica siempre que resulte en sensibilidad y especificidad adecuadas. Por ejemplo, los niveles de proteínas pueden ser medidor enlazándolas con un anticuerpo o fragmento de anticuerpo específico para la proteína y midiendo la cantidad de proteína enlazada al anticuerpo. Los anticuerpos pueden ser etiquetados por reactivos radioactivos, fluorescentes u otros reactivos detectables para facilitar la detección. Los métodos de detección incluyen, sin limitación, ensayo inmunoabsorbente ligado a enzimas (ELISA) y técnicas de inmunotransferencia.
Los genes modulados usados en los métodos de la invención se describen en los Ejemplos. Los genes que son expresados diferencialmente son o regulados hacia arriba o regulados hacia abajo en pacientes con carcinomas de un origen particular en relación con los carcinomas de orígenes diferentes. Regulación hacia arriba y regulación hacia abajo son términos relativos que significan que se encuentra una diferencia detectable (más allá de la contribución del ruido en el sistema usado para medirla) en la cantidad de expresión de los genes en relación con alguna línea de base. En este caso, la línea de base se determina en base al algoritmo. Los genes de interés en las células enfermas son entonces o regulados hacia arriba o regulados hacia abajo en relación al nivel de la línea de base usando el mismo método de medición. Enfermo, en este contexto, se refiere a una alteración del estado de un cuerpo que interrumpe o perturba, o tiene el potencial de perturbar, el rendimiento adecuado de las funciones corporales como ocurre con la proliferación no controlada de células. Alguien es diagnosticado con una enfermedad cuando algún aspecto del genotipo o fenotipo de esa persona es consistente con la presencia de la enfermedad. Sin embargo, el acto de realizar un diagnóstico o pronóstico puede incluir la determinación de cuestiones de enfermedad/ estado como determinar la probabilidad de recaída, tipo de terapia y monitorización de la terapia. En la monitorización de la terapia, los juicios clínicos se hacen con respecto al efecto de un curso de terapia dado comparando la expresión de genes durante el tiempo para determinar si los perfiles de expresión génica han cambiado o están cambiado a patrones más consistentes con el tejido normal.
Los genes pueden ser agrupados de tal forma que la información obtenida sobre el conjunto de genes en el grupo proporcione una base sólida para hacer un juicio clínicamente relevante como un diagnóstico, pronóstico o elección de tratamiento. Estos conjuntos de genes componen las carpetas de la divulgación. Como con la mayoría de los Marcadores de diagnóstico, es a menudo deseable usar el menor número de Marcadores suficiente para hacer un juicio médico correcto. Esto evita un retraso en el tratamiento pendiente de análisis adicionales así como el uso improductivo de tiempo y recursos.
Un método de establecer carpetas de expresión génica es a través del uso de algoritmos de optimización como el algoritmo de varianza media usado ampliamente para establecer carteras de acciones. Este método se describe con detalle en la 20030194734. Esencialmente, el método designa el establecimiento de un conjunto de entradas (acciones en aplicaciones financieras, expresión medida por intensidad aquí) que optimizarán el retorno (por ejemplo, la señal que se genera) una vez que se recibe para su uso a la vez que se minimiza la variabilidad del retorno. Muchos programas de software comerciales están disponibles para realizar tales operaciones. Se prefiere el "Wagner Associates Mean-Variance Optimization Application," referida como "Wagner Software" a lo largo de esta
especificación. Este software usa funciones de la "Wagner Associates Mean-Variance Optimization Library" para determinar una frontera eficiente y carpetas óptimas en el sentido de Markowitz se prefiere. Markowitz (1952). El uso de este tipo de software requiere que los datos de micromatrices sean transformados para que puedan ser tratados como una entrada en la manera en que las mediciones de riesgo y retorno de acciones son usadas cuando el software se usa para sus propósitos de análisis financieros pretendidos.
El proceso de seleccionar una carpeta también puede incluir la aplicación de reglas heurísticas. Preferiblemente, dichas reglas se formulan en base a la biología y una comprensión de la tecnología usada para producir resultados clínicos. Más preferiblemente, se aplican a una salida del método de optimización. Por ejemplo el método de la varianza media de la selección de carpetas se pude aplicar a datos de micromatrices para un número de genes expresados diferencialmente en sujetos con cáncer. La salida del método será un conjunto optimizado de genes que podrían incluir algunos genes que son expresados en la sangre periférica así como en tejido enfermo. Si las muestras usadas en el método de prueba se obtienen de sangre periférica y ciertos genes expresados diferencialmente en casos de cáncer podrían ser también expresados diferencialmente en sangre periférica, entonces se puede aplicar una regla heurística en la que una carpeta es seleccionada de la frontera eficiente excluyendo las que se expresan diferencialmente en sangre periférica. Por supuesto, la regla puede ser aplicada antes de la formación de la frontera eficiente, por ejemplo, aplicando la regla durante la pre-selección de datos.
Se pueden aplicar otras reglas heurísticas que no están necesariamente relacionadas con la biología en cuestión. Por ejemplo, alguien puede aplicar una regla de que sólo un porcentaje prescrito de la carpeta puede estar representado por un gen particular o grupo de genes. El software comercialmente disponible como el Wagner Software acomoda fácilmente estos tipos de heurísticos. Esto puede ser útil, por ejemplo, cuando factores distintos de la exactitud y precisión (por ejemplo, derechos de licencia anticipados) tienen un impacto en la deseabilidad de incluir uno o más genes.
Los perfiles de expresión génica de esta divulgación también pueden ser usados en conjunción con otros métodos de diagnóstico no genéticos útiles en el diagnóstico, pronóstico o monitorización del tratamiento del cáncer. Por ejemplo, en algunas circunstancias es beneficioso combinar el poder diagnóstico de la expresión génica basado en métodos descritos anteriormente con datos de Marcadores convencionales como Marcadores de proteínas de suero (por ejemplo Antígeno del cáncer 27.29 ("27.29")). Existe una variedad de tales Marcadores incluyendo analitos como el CA27.29. En uno de dichos métodos, la sangre se toma periódicamente de un paciente tratado y se somete entonces a un inmunoensayo enzimático para uno de los Marcadores de suero descritos anteriormente. Cuando la concentración del Marcador sugiere la vuelta de tumores o el fallo de la terapia, se toma una fuente de muestra susceptible al análisis de expresión génica. Cuando existe una masa sospechosa, se toma un aspirado de aguja fina (FNA) y los perfiles de expresión génica de células tomadas de la masa se analizan como se ha descrito anteriormente. Alternativamente, se pueden tomar muestras de tejido de áreas adyacentes al tejido del que se ha retirado anteriormente el tumor. Este enfoque puede ser particularmente útil cuando otras pruebas producen resultados ambiguos.
Los kits hechos de acuerdo con la divulgación incluyen ensayos con formato para determinar los perfiles de expresión génica. Estos pueden incluir todos o algunos de los materiales necesarios para realizar los ensayos como reactivos e instrucciones y un medio a través del cual se ensayan los Biomarcadores.
Los artículos de esta divulgación incluyen representaciones de perfiles de expresión génica útiles para tratar, diagnosticar, pronosticar y evaluar de otras maneras enfermedades. Estas representaciones de perfiles se reducen a un medio que puede ser leído automáticamente por una máquina como un medio legible por ordenador (magnético, óptico y similar). Los artículos pueden incluir también instrucciones para evaluar los perfiles de expresión génica en dicho medio. Por ejemplo, los artículos pueden comprender un CD ROM que tiene instrucciones informáticas para comparar perfiles de expresión génica de las carpetas de genes descritas anteriormente. Los artículos pueden tener también perfiles de expresión génica grabados digitalmente en ellos de tal forma que pueden ser comparados con datos de expresión génica de muestras de pacientes. Alternativamente, los perfiles pueden ser grabados en un formato de representación diferente. Una inscripción gráfica es uno de dichos formatos. Los algoritmos de agrupación como los incorporados en el software "DISCOVERY" e "INFER" de Partek, Inc. mencionados anteriormente pueden ayudar mejor a la visualización de dichos datos.
Diferentes tipos de artículos de fabricación de acuerdo con la divulgación son medios o ensayos formateados usados para revelar los perfiles de expresión génica. Estos pueden comprender, por ejemplo, micromatrices en las que los complementos o sondas de secuencia están fijados a una matriz a la que las secuencias indicativas de genes de interés se combinan creando un determinante legible de su presencia. Alternativamente, los artículos de acuerdo con la divulgación pueden ser pueden ser modelados en kits de reactivos para realizar hibridación, amplificación y generación de señal indicativos del nivel de expresión de los genes de interés para detectar cáncer.
Los siguientes ejemplos se proporcionan para ilustrar pero no limitar la invención reivindicada.
Ejemplo 1
Materiales y Métodos
Descubrimiento de genes Marcadores de cáncer de páncreas
El ARN se aisló de tejidos de tumor de páncreas, páncreas normal, pulmón, colon, mama y ovario usando Trizol. El ARN se usó entonces para generar ARN etiquetado, amplificado (Lipshutz et al. (1999)) que fue después hibridado en matrices Affymetrix U133A. Los datos fueron después analizados de dos maneras.
En el primer método, este conjunto de datos se filtró para conservar sólo aquellos genes con al menos dos designaciones presentes a través del conjunto de datos completo. El filtrado dejó 14.547 genes. Se determinó que
2.736 genes estaban sobreexpresados en el cáncer de páncreas frente al páncreas normal con un valor de p menor de 0,05. Cuarenta y cinco genes de los 2.736 estaban también sobreexpresados al menos dos veces en comparación con la intensidad máxima encontrada en tejidos de pulmón y colon. Finalmente, se encontraron seis conjuntos de sonda que estaban sobreexpresados al menos dos veces en comparación con la intensidad máxima de tejidos de pulmón, colon, mama y ovarios.
En el segundo método, este conjunto de datos se filtró para conservar sólo aquellos genes con no más de dos designaciones presentes en tejidos de mama, colon, pulmón y ovario. Este filtrado dejó 4.654 genes. Se descubrió que 160 genes de los 4.654 genes tenían al menos dos designaciones presentes en tejidos de páncreas (normal y cáncer). Finalmente, se seleccionaron ocho conjuntos de sondas que mostraron la expresión diferencial mayor entre el cáncer de páncreas y los tejidos normales.
Muestras de tejido
Se adquirieron un total de 260 tejidos primario y de metástasis de FFPE de una variedad de vendedores comerciales. Las muestras probadas incluían: 30 metástasis de mama, 30 metástasis colorrectal, 56 metástasis de pulmón, 49metástasis de ovario, 43 metástasis de páncreas, 18 primarios de próstata y 2 metástasis de próstata y 32 de otros orígenes (6 de estómago, 6 de riñón, 3 de laringe, 2 de hígado, 1 de esófago, 1 de faringe, 1 de conducto biliar, 1 de pleura, 3 de vejiga, 5 de melanoma, 3 de linfoma).
Extracción de ARN
El aislamiento de ARN de secciones de tejido de parafina se basó en los métodos y reactivos descritos en el manual del High Pure RNA Paraffin Kit (Roche) con las siguientes modificaciones. Se seccionaron muestras de tejido embebidas en parafina de acuerdo al tamaño de la metástasis embebida (2-5mm = 9 X 10µm, 6-8mm = 6 X 10µm, 8 -≥ 10mm = 3 X 10 µm) y se colocaron en tubos Eppendorf de 1.5 ml de RNasa/DNasa. Las secciones se desparafinaron por incubación en 1ml de xileno durante 2-5 min a temperatura ambiente seguido por 10 a 20 segundos de agitación en vórtice. Los tubos fueron entonces centrifugados y se retiro el sobrenadante y se repitió el paso de desparafinización. Después de que el sobrenadante se hubo retirado, se añadió 1 ml de etanol y la muestra se agitó en vórtice durante1 minuto, se centrifugó y se retiro el sobrenadante. Este proceso se repitió una vez adicional. Se retiró el etanol residual y el pellet se secó en un horno a 55º C durante 5-10 minutos y se resuspendió en 100 µl de tampón de lisis de tejido, 16 µl de 10% SDS y 80 µl de Proteinasa K. Las muestras se agitaron en vórtice y se incubaron en un conjunto termomezclador a 400 rpm durante 2 horas a 55º C. Se añadieron 325 µl de tampón de unión y 325 µl de etanol a cada muestra que fue entonces mezclada, centrifugada y se añadió el sobrenadante en la columna de filtro. Se centrifugaron la columna de filtro junto con el tubo de recogida durante 1 minuto a 8000 rpm y se descartó el flujo a través. Se realizaron una serie de lavados secuenciales (500 µl de Tampón de Lavado I → 500 µl de Tampón de Lavado II →300 µl de Tampón de Lavado II) en los que se añadió cada solución a la columna, se centrifugó y se descartó el flujo a través. La columna fue entonces centrifugada a máxima velocidad durante 2 minutos, colocada en un tubo de 1,5 ml nuevo y se añadieron 90 µl de tampón de elución. El ARN se obtuvo después de 1 minutos de incubación a temperatura ambiente seguido por una centrifugación de 1 minuto a 8000 rpm. La muestra fue tratada con DNasa con la adición de 10 µl de tampón de incubación de DNasa, 2 µl de DNasa I y se incubó 30 minutos a 37º C. La DNasa fue inactiva después de la adición de 20 µl de tampón de lisis de tejido, 18 µl de 10% SDS y 40 µl de Proteinasa K. De nuevo, se añadieron 325 µl de tampón de unión y 325 µl de etanol a cada muestra que fue entonces mezclada, centrifugada y se añadió el sobrenadante en la columna de filtro. Los lavados secuenciales y la elución del ARN procedieron como se ha señalado anteriormente con la excepción de que se usaron 50µl de tampón de elución para eluir el ARN. Para eliminar la contaminación de fibra de vidrio arrastrada de la columna el ARN se centrifugó durante 2 minutos a toda velocidad y el sobrenadante se retiro a un tubo Eppendorf de 1,5 ml nuevo. Las muestras fueron cuantificadas por lecturas OD 260/280 obtenidas por un espectrómetro y las muestras se diluyeron a 50 ng/µl. El ARN aislado se almacenó en agua libre de RNasa a -80º C hasta su uso.
Cebador TaqMan y Diseño de la Sonda
Se usaron los números de acceso de la secuencia de referencia de ARNm apropiados en conjunción con Oligo 6.0 para desarrollar ensayos TaqMan® CUP (Marcadores pulmonares: proteína B asociada al pulmón surfactante humano (HUMPSPBA), factor de transcripción tiroideo 1 (TTF1), desmogleína 3 (DSG3), Marcador colorrectal: cadherina 17 (CDH17), Marcadores de mama: mamaglobina (MG), factor de transcripción ets derivado de próstata (PDEF), Marcador de ovario: tumor de Wilms 1 (WT1), Marcadores de páncreas: antígeno de células madre de próstata (LCSP), factor de coagulación V (F5), Marcador de próstata calicreína 3 (KLK3)) y ensayos domésticos de β actina, hidroximetilbilano sintasa (PBGD). Los cebadores y sondas de hidrólisis para cada ensayo se enumeran en la Tabla 2. La amplificación del ADN genómico se excluyó diseñando ensayos alrededor de sitios de corte y empalme exon-intron. Las sondas de hidrólisis se etiquetaron en el nucleótido 5' con FAM como el colorante indicador y en el nucleótido 3' con BHQ1-TT como el colorante de extinción interno.
Reacción en Cadena de Polimerasa en Tiempo Real Cuantitativa
La cuantificación de ARN específico del gen se llevo a cabo en una placa de 384 pocillos en el sistema de detección de secuencias ABI Prism 7900HT (Applied Biosystems). Para cada ejecución de termo-ciclador se amplificaron los calibradores y las curvas estándar. Los calibradores para cada Marcador consistieron de transcritos in vitro del gen objetivo que fueron diluidos en un ARN portador de riñón de rata a 1X105 copias. Las curvas estándar para Marcadores domésticos consistieron de transcritos in vitro del gen objetivo que fueron diluidos en serie en ARN portador de riñón de rata a 1X107, 1X105 y 1X103 copias. No se incluyeron controles del objetivo en cada ejecución del ensayo para asegurar la carencia de contaminación ambiental. Todas las muestras y controles se ejecutaron por duplicado. Se realizó qRTPCR con reactivos de uso de laboratorio en general en una reacción de 10µl que contenía: Tampón de RT-PCR (50 nM Bicina/KOH pH 8,2, 115nM KAc, 8% de glicerol, 2,5 mM de MgCl2, 3,5 mM de MnSO4, 0,5 mM cada uno de dCTP, dATP, dGTP y dTTP), aditivos (2 mM de Tris-Cl pH 8, 0,2 mM de albúmina bovina, 150 mM de trehalosa, 0,002% de Tween 20), mezcla de enzimas (2U Tth (Roche), 0,4 mg/µl Ab TP6-25), Cebador y mezcla de sondas (0,2 µM de Sondas, 0.5µM de cebadores). Siguieron los siguientes parámetros de ciclación; 1 ciclo a 95º C durante 1 minuto; 1 ciclo a 55º C durante 2 minutos; Desnivel 5%; 1 ciclo a 70º C durante 2 minutos; y 40 ciclos de 95º C durante 15 segundos; 58º C durante 30 segundos. Después de que se completó la reacción de PCR, se establecieron los valores de la línea de base y umbral en el software ABI 7900HT Prism y los valores de Ct calculados se exportaron a Microsoft Excel.
Reacción de Un Paso frente a Dos Pasos
La síntesis de la primera cadena se llevo a cabo usando o 100 ng de hexámeros aleatorios o cebadores específicos de genes por reacción. En el primer paso, se calentaron 11,5 µl de Mezcla-1 (cebadores y lug de ARN total) a 65º C durante 5 minutos y después se refrigeraron en hielo. Se añadieron 8,5 µl de Mezcla-2 (1x Tampón, 0,01 mM de DTT, 0,5 mM de cada dNTP, 0.25U/µl de RNasin®, 10 U/µl Superscript III) a Mezcla-1 y se incubó a 50º C durante 60 minutos seguido por 95º C durante 5 minutos. El ADNc fue almacenado a -20º C hasta que estaba listo para el uso. El qRTPCR para el segundo paso de la reacción de 2 pasos se realizo como se ha señalado anteriormente con los parámetros de ciclación: 1 ciclo a 95° C durante 1 minuto; 40 ciclos de 95° C durante 15 segundos, 58° C durante 30 segundos. El qRTPCR para la reacción de un paso se realizó exactamente como se ha señalado en el párrafo anterior. Las reacciones de tanto un paso como la de dos pasos se realizaron en 100 ng de plantilla (ARN/ADNc). Después de que se completó la reacción de PCR se establecieron los valores de línea de base y umbral en el software ABI 7900HT Prism y los valores de Ct calculados se exportaron a Microsoft Excel.
Generación de un mapa de calor
Para cada muestra, se calculo un ∆Ct tomando el Ct medio para cada Marcador de CUP y restando el Ct medio de una media de los Marcadores domésticos (∆Ct = Ct(Marcador de CUP) -Ct (Marcador Doméstico medio). El ∆Ct mínimo para cada tejido del conjunto de Marcadores de origen (pulmón, mama, próstata, colon, ovario y páncreas) se determinó para cada muestra. El tejido de origen con el ∆Ct mínimo general se obtuvo una vez y todos los otros tejidos de origen obtuvieron cero. Los datas fueron ordenados de acuerdo con el diagnóstico patológico. Se rellenó un Partek Pro con los datos de viabilidad modificados y se generó un gráfico de intensidad.
Resultados.
Descubrimiento de nuevo tumor de origen de páncreas y Marcadores del estado del cáncer
Primero se analizaron cinco candidatos para Marcador de páncreas: antígeno de células madre de próstata (PSCA), inhibidor de proteinasa de serina, miembro 1 de clade A (SERPINA1), citoqueratina 7 (KRT7), metaloproteasas de matriz 11 (MMP11), y mucin4 (MUC4) (Varadhachary et al (2004); Fukushima et al. (2004); Argani et al. (2001); Jones et al. (2004); Prasad et al. (2005); y Moniaux et al. (2004)) usando micromatrices de ADN y un panel de 13 adenocarcinomas ductales de páncreas, cinco tejidos de páncreas normales y 98 muestras de tumores de mama, colorrectales, pulmón y ovario. Solo el PSCA demostró sensibilidad moderada (se detectaron seis de trece o 46% de tumores) a un especificidad alta (se identificaron correctamente 91 de 98 o 93% como no ser de origen pancreático) (Figura 4A). Por el contrario KRT7, SERPINA1, MMP11 y MUC4 demostraron sensibilidades del
38%, 31%, 85% y 31% respectivamente, a especificidades del 66%, 91%, 82% y 81 % respectivamente. Estos datos se encontraban en buena concordancia con el qRTPCR realizado en 27 metástasis de origen pancreático y 39 metástasis de origen no pancreático para todos los Marcadores excepto el MMP11 que mostró una sensibilidad y especificidad más pobres con el qRTPCR y las metástasis. En conclusión, los datos de la micromatriz en tejido primario congelado rápidamente sirve como un buen indicador de la capacidad del Marcador para identificar a una metástasis de FFPE como pancreática en origen usando qRTPCR pero esos Marcadores adicionales pueden ser útiles para un rendimiento óptimo.
Como el adenocarcinoma ductal de páncreas se desarrolla de células epiteliales ductales que comprenden sólo un pequeño porcentaje de todas las células pancreáticas (con células acinares y células de los islotes que comprenden la mayoría) y como los tejidos de adenocarcinoma de páncreas contienen una cantidad significativa de tejido normal adyacente (Prasad et al. (2005) y Ishikawa et al. (2005)), ha sido difícil identificar Marcadores de cáncer de páncreas (es decir, regulados hacia arriba en cáncer) que también diferenciarían este órgano de los órganos. Para su uso en un panel CUP dicha diferenciación es necesaria. El primer método de consulta (ver Materiales y Métodos) devolvió seis conjuntos de sonda: factor de coagulación V (F5), una proteína hipotética FLJ22041 similar a las proteínas de unión a FK506 (FKBP10), integrina β 6 (ITGB6), transglutaminasa 2 (TGM2), ribonucleoproteina heterogénea nuclear A0 (HNRP0), y BAX delta (BAX). El segundo método de consulta (ver Materiales y Métodos) devolvió ocho conjuntos de sonda: F5, TGM2, factor de transcripción de homeodominio tipo emparejado 1 (PITX1), isoforma trío ARNm (TRIO), ARNm para p73H (P73), una proteína desconocida para MGC: 10264 (SCD), y dos conjuntos de sonda para claudina18. F5 y TGM2 estaban presentes en ambos resultados de consulta y, de los dos, el F5 parecía el más prometedor (Figura 4B).
Optimización de la preparación de las muestras y qRTPCR usando tejidos FFPE
Después del aislamiento de ARN y qRTPCR los métodos se optimizaron usando tejidos fijados antes de examinar el rendimiento del panel de Marcadores. Primero se analizó el efecto de reducir el tiempo de incubación de la proteinasa K de dieciséis horas a 3 horas. No hubo efecto en el rendimiento. Sin embargo, algunas muestras mostraron fragmentos más largos de ARN cuando se uso el paso de proteinasa K más corto (Figura 5). Por ejemplo, cuando el ARN se aisló de un bloque de un año (c2"), no se observó diferencia en los electroferogramas. Sin embargo, cuando el ARN se aisló de un bloque de cinco años (C23), se observó una fracción más grande de ARNs de peso molecular más alto, según lo evaluado por la protuberancia en el desnivel, cuando se usó la digestión de proteinasa K más corta. Esta tendencia se mantuvo generalmente cuando se procesaron otras muestras, independientemente del órgano de origen para la metástasis de FFPE. En conclusión, acortar el tiempo de digestión de la proteinasa K no sacrifica rendimientos de ARN y puede ayudar a aislar ARN menos degradado, más largo.
Después, se compararon tres métodos diferentes de transcripción inversa: transcripción inversa con hexámeros aleatorios seguido por qPCR (dos pasos), transcripción inversa con un cebador específico del gen seguido por qPCR (dos pasos), y un qRTPCR de un paso usando cebadores específicos de los genes. El ARN se aisló de once metástasis y se comparó con valores de Ct a través de los tres métodos para β-actina, proteína surfactante humana B (HUMSPB) y factor de transcripción tiroideo (TTF) (Figura 6). Hubo diferencias estadísticamente significativas (p<0,001) para todas las comparaciones. Para los tres genes, la transcripción inversa sin hexámeros aleatorios seguido por qPCR (reacción de dos pasos) dieron los valores de Ct más altos mientras que la transcripción inversa con un cebador específico del gen seguido por qPCR (reacción de dos pasos) dio valores de Ct ligeramente (pero estadísticamente significativos) más bajos que los correspondientes a la reacción de 1 paso. Sin embargo, el REPCR de 2 pasos con cebadores específicos de los genes tenía un paso de transcripción inversa más largo. Cuando los valores de Ct de HUMSPB y TTF se normalizaron al valor de β-actina correspondiente para cada muestra, no hubo diferencias en los valores de Ct normalizados a través de los tres métodos. En conclusión, la optimización de las condiciones de reacción de RTPCR pueden generar valores de Ct más bajos, lo que puede ayudar a analizar bloques de parafina más viejos (Cronin et al (2004)), y una reacción de RTPCR de un paso con cebadores específicos de los genes puede generar valores de Ct comparables a los generados en la reacción de dos pasos correspondiente.
Rendimiento de diagnóstico de un ensayo qRTPCR de CUP.
Después se realizaron 12 reacciones de qRTPCR (10 Marcadores y dos genes domésticos) en 239 metástasis de FFPE. Los Marcadores usados para el ensayo se muestran en la Tabla 2. Los Marcadores del pulmón eran proteína B asociada al pulmón surfactante humana (HUMPSPB), factor de transcripción tiroideo 1 (TTF1), y desmogleína 3 (DSG3). El Marcador colorrectal era cadherina 17 (CDH 17). Los Marcadores de mama eran mamaglobina (MG) y factor de transcripción derivado de la próstata Ets (PDEF). El Marcador de ovario era el tumor de Wilms 1 (WT1). Los Marcadores de páncreas eran antígeno de células madre de la próstata (PSCA) y factor de coagulación V (f5), y el Marcador de próstata era calicreína 3 (KLK3). Para la descripción de los genes, ver la Tabla
31.
55 5
El análisis de los valores de Ct normalizados en un mapa de calor reveló la alta especificidad de los Marcadores de mama y próstata, especificidad moderada de colon, pulmón y ovario, y especificidad algo menor de los Marcadores de páncreas. Combinar los datos qRTPCR normalizados con refinamiento computacional mejora el rendimiento del panel de Marcadores. Los resultados se obtuvieron de los datos de qRTPCR normalizados combinados con el algoritmo y se precisó la precisión del ensayo qRTPCR.
Discusión
En este ejemplo, la realización de perfiles de expresión basados en micromatrices se uso en tumores primarios para identificar Marcadores candidatos para su uso con metástasis. El hecho de que los tumores primarios puedan ser usados para descubrir tumores de Marcadores de origen para metástasis es consistente con varios descubrimientos recientes. Por ejemplo, Weigelt y sus colaboradores han demostrado que los perfiles de expresión génica de tumores de mama primarios se mantienen en metástasis distantes. Weigelt et al. (2003). Italiano y sus colaboradores descubrieron que el estado de EGFR, evaluado por IHC, era similar en 80 tumores colorrectales primarios y las 80 metástasis relacionadas. Italiano et al. (2005). Solo cinco de los 80 mostraron discordancia en el estado de EGFR. Italiano et al. (2005). Backus y sus colaboradores identificaron Marcadores putativos para detectar metástasis de cáncer de mama usando un análisis de expresión génica de genoma amplio de la mama y otros tejidos y demostraron que la mamaglobina y CK19 detectaron metástasis clínicamente procesable en ganglios linfáticos centinelas de mama con un 90% de sensibilidad y un 94% de especificidad. Backus et al. (2005).
Los estudios basados en micromatrices con tejido primario confirmaron la especificidad y sensibilidad de Marcadores conocidos. Como resultado, con la excepción de F5, todos los Marcadores usados tenían alta especificidad para los tejidos estudiados en la presente. Argani et al (2001; Backus et al. (2005); Cunha et al. (2005); Borgono et al. (2004); McCarthy et al. (2003); Hwang et al. (2004); Fleming et al. (2000); Nakamura et al. (2002) y Khoor et al. (1997). Un estudio reciente determinó que usando IHC, el PSCA se sobreexpresa en la metástasis del cáncer de próstata. Lam et al. (2005). Dennis et al. (2002) también demostró que el PSCA podría ser usado como un tumor de Marcador de origen para páncreas y próstata. Como se muestra en la presente, la expresión fuerte del PSCA se encuentra en algunos tejidos de próstata a nivel de ARN pero, como se incluye el PSA en el ensayo, ahora se pueden segregar los cánceres de próstata y cáncer. Un descubrimiento nuevo de este estudio fue el uso del F5 como un Marcador complementario (a PSCA) para el tejido pancreático de origen. En tanto el conjunto de datos de micromatrices con tejido primario como el conjunto de datos de qRTPCR con metástasis de FFPE, el F5 complementó al PSCA (Figura 4 y Tabla 3).
Tabla 3 datos de viabilidad
Mama
Colon Pulmón Otro Ovario Páncreas Próstata Total
Total probado
30 30 56 32 49 43 20 260
#Correcto
22 27 45 16 43 31 20 204
#Otro / No probado
1 1 3 n/a 1 4 0 10
#Incorrecto
7 2 8 16 5 8 0 46
% Probado
96.67 96.67 94.64 100 97.96 90.70 100 96.15
% Correcto de probados
75.86 93.10 84.91 0 89.58 79.49 100 81.60
Correcto del total (%)
73.33 90.00 80.36 50.00 87.76 72.09 100 78.46
Investigadores anteriores han generado ensayos de CUP usando IHC o micromatrices. Su et al. (2001); Ramaswamy et al. (2001) y Bloom et al. (2004). Más reciente, se ha acoplado SAGE a un panel de Marcadores qRTPCR pequeño. Dennis (2002) y Buckhaults et al. (2003). Este estudio es el primero en combinar perfiles de expresión basados en micromatrices con un panel pequeño de ensayos qRTPCR. Los estudios de micromatrices con tejido primario identificaron algunos, pero no todos, de los mismos Marcadores del tejido de origen como los identificados anteriormente por estudios SAGE. Algunos estudios han demostrado que existe un acuerdo modesto entre los datos de perfiles basados en micromatrices de ADN y SAGE y que la correlación mejora para genes con niveles de expresión más altos, van Ruissen et al. (2005) y Kim (2003). Por ejemplo, Dennis y sus colaboradores identificaron PSA, MG, PSCA y HUMSPB mientras Buckhaults y sus colaboradores (Dennis y otros, (2002)) identificaron PDEF. Se prefiere ejecutar el ensayo CUP usando qRTPCR ya que es una tecnología robusta y puede tener ventajas de rendimiento sobre el IHC. Al-Mulla et al. (2005); y Haas et al. (2005). Como se muestra en la presente, el protocolo de qRTPCR se mejoró a través del uso de cebadores específicos de genes en una reacción de un paso. Esta es la primera demostración del usos de cebadores específicos de genes en una reacción de qRTPCR de un paso con tejido de FFPE. Otros investigadores o han hecho un qRTPCR de dos pasos (síntesis de ADNc en una reacción seguido por qPCR) o han usado hexámeros aleatorios o truncado cebadores específicos de genes. Abrahamsen et al. (2003); Specht et al. (2001); Godfrey et al. (2000); Cronin et al. (2004) y Mikhitarian et al.
(2004).
Ejemplo 2
Protocolo de Aislamiento de ARN Total CUP FFPE (kit Highpure Cat#3270289)
Propósito
Aislamiento del ARN total del tejido de FFPE
Procedimiento: Preparación de soluciones de trabajo
1.
Proteinasa k (PK) en el kit
Disolver liofilizado en 4.5 ml de Tampón de Elución. Alícuota y almacenar a -20º , estable durante 12 meses. PK-4x250mg (cat #3115852) Disolver liofilizado en 12,5 ml de Tampón de Elución (1x Tampón TE (pH 7,4-7). Alícuota y almacenar a -20º C.
2.
Tampón de Lavado I Añadir 60 ml de etanol absoluto a Tampón de Lavado I, almacenar a temperatura ambiente.
3.
Tampón de Lavado II Añadir 200 ml de etanol absoluto a Tampón de Lavado II, almacenar a temperatura ambiente.
4.
DNasa I
Disolver liofilizado en 400 µl de Tampón de Elución. Alícuota y almacenar a -20º C, estable durante 12 meses.
Seccionar Bloques de Parafina de -30-45 minutos para 12 bloques (12 bloques x 2 tubos = 24 tubos)
Las secciones cortadas del bloque deberían ser procesadas inmediatamente para la extracción de ARN
1.
Usar una hoja de afeitar afilada limpia en Micrótomo para cortar secciones de 6 x 10 micras de grosor de bloques de tejido recortados (tamaño 3-4 x 5-10 mm). Nota: Bloque Nuevo-Descartar las secciones de cera hasta que se ha obtenido la sección del tejido. Bloques usados-Descartar las 3 primeras secciones de tejido
2.
Inmediatamente colocar el tejido cortado en tubos de microcentrífuga de 1,5 mL y tapar firmemente para minimizar la humedad.
3.
Se recomienda tomar el número de secciones en base al tamaño del tumor mostrado en la Tabla 4.
Tabla 4
Tamaño de
Secciones/Tubo
MET
8-10 mm
6
6-8 mm
12
2-4 mm
18
Desparafinización ~ 30-45 minutos
1.
Añadir 1.0 ml de xileno a cada muestra y agitar en vórtice vigorosamente durante 10-20 segundos e incubar RT durante 25 minutos. Centrifugar a toda velocidad 2 minutos. Retirar el sobrenadante con cuidado.
2.
Repetir el paso 1.
3.
Centrifugar a toda velocidad durante 2 minutos. Retirar el sobrenadante.
4.
Añadir 1 ml de etanol abs. y agitar en vórtice vigorosamente 1 min. Centrifugar a toda velocidad 2 minutos.
Retirar el sobrenadante.
5.
Repetir el paso 4.
6.
Secar el tubo brevemente en una toalla de papel para deshacerse de los residuos de etanol.
7.
Secar el pellet seco durante 5-10 minutos a 55º C en un horno. Nota: es crítico que el etanol sea retirado completamente y los pellets sean secados concienzudamente, el etanol residual puede inhibir la digestión de PK.
Nota: si la PK está a -20C, calentarla en RT 20-30 minutos
Extracción de ARN ~2,5-3 horas
1.
Añadir 100 µl de Tampón de Lisis de Tejido, 16 µl de 10% SDS y 80 µl de solución de trabajo de Proteinasa K a un pellet de tejido, agitar en vórtice brevemente en varios intervalos e incubar 2 horas a 55º C agitando a 400 rpm,
2.
Añadir 325 µl de Tampón de Unión y 325 µl de etanol abs. Mezclar suavemente pipeteando arriba y abajo.
3.
Centrifugar el lisado a toda velocidad durante 2 minutos.
4.
Combinar el tubo de filtro y el tubo de colección (12 tubos), y pipetear el sobrenadante del lisado en el filtro.
5.
Centrifugar durante 30 segundos a 800 rpm y descartar el exceso de flujo.
Nota: El Paso 4-5 se puede repetir, si el ARN necesita ser agrupado con 2 preparaciones de pellet de tejido más.
6.
Repetir la centrifugación a 8000 rpm durante 30 segundos para secar el filtro.
7.
Añadir 500 µl de solución de trabajo de Tampón de Lavado I a la columna y centrifugar durante 15-30 segundos a 8000 rpm, descartar el exceso de flujo.
8.
Añadir 500 µl de solución de trabajo de Tampón de Lavado II. Centrifugar durante 15-30 segundos a 8000 rpm, descartar el exceso de flujo.
9.
Añadir 300 µl de solución de trabajo de Tampón de Lavado II, centrifugar durante 15-30 segundos a 8000 rpm, descartar el exceso de flujo.
10.
Centrifugar el filtro High Pure durante 2 minutos a máxima velocidad.
11.
Colocar el tubo del filtro High Pure en un tubo de 1,5 ml nuevo y añadir 90 µl de Tampón de Elución. Incubar durante 1-2 minutos a temperatura ambiente. Centrifugar 1 minuto a 800 rpm. Tratamiento de DNasa I ~ 1,5 horas.
12.
Añadir 10 de µl de Tampón de Incubación de 10x DNasa y 1,0 µl de solución de trabajo de DNasa I al eluido y mezclar. Incubar durante 45 minutos a 37º C (o 2,0 µl de DNasa I durante 30 minutos).
13.
Añadir 20 µl de Tampón de Lisis de Tejido, 18 µl de 10% SDS y 40 µl de solución de trabajo de Proteinasa K. Agitar en vórtice brevemente. Incubar durante 30 minutos (30-60 minutos) a 55º C
14.
Añadir 325 µl de Tampón de Unión y 325 µl de etanol abs. Mezclar y pipetear en un tubo de filtro High Pure nuevo con tubo de recolección (12 tubos).
15.
Centrifugar durante 30 segundos a 8000 rpm y descartar el exceso de flujo.
16.
Repetir la centrifugación a 8000 rpm durante 30 segundos para secar el filtro.
17.
Añadir 500 µl de solución de trabajo de Tampón de Lavado I a la columna. Centrifugar durante 15 segundos a 8000 rpm, descartar el exceso de flujo.
18.
Añadir 500 µl de solución de trabajo de Tampón de Lavado II. Centrifugar durante 15 segundos a 8000 rpm, descartar el exceso de flujo.
19.
Añadir 300 µl de solución de trabajo de Tampón de Lavado II. Centrifugar durante 15 segundos a 8000 rpm, descartar el exceso de flujo.
20.
Centrifugar el filtro High Pure durante 2 minutos a máxima velocidad.
21.
Colocar el tubo del filtro High Pure en un tubo de 1,5 ml nuevo. Añadir 50 µl de Tampón de Elución; incubar durante 1-2 minutos a temperatura ambiente. Centrifugar durante 1 minuto a 8000 rpm para recoger el ARN eluido.
22.
Centrifugar el eluido durante 2 minutos a toda velocidad y transferir el sobrenadante a un nuevo tubo sin perturbar las fibras de vidrio en el fondo.
23.
Tomar la lectura de 260/280 OD y diluir a 50 ng/µl. Almacenar a -80º C.
Protocolo de Ensayo CUP ASR (ABI 7900)
Propósito: Usar qRTPCR para determinar el tejido de origen de una muestra de CUP
Configuración del Control:
1. Controles Positivos (Consultar la Tabla 5 y Placa C en la Configuración de Placas, Figura 7)
Tabla 5 diluciones en Serie de IVT -5µl 1X108 en 470 µl de H2O + 25µl de 10000 ARNr
Control IVT
CE/µl Muestra Agua ARNr de fondo
BACTIN
100E+05 50 425 25
CDH 17
100E+05 50 425 25
DSG3
100E+05 50 425 25
F5
100E+05 50 425 25
Hump
100E+05 50 425 25
MG
100E+05 50 425 25
PBGD
100E+05 50 425 25
PDEF
100E+05 50 425 25
PSCA
100E+05 50 425 25
TTF1
100E+05 50 425 25
WT1
100E+05 50 425 25
1E6. Tabla 5. Diluir 50,000 CE/µl de ARNr a 500 CE/µl -5µl 50,000 CE/µl + 495 µl H2O

Alícuotas 10 µl por tubo de tira (2 placas); Colocar la Mezcla a -80º C hasta que esté lista para el uso.
2. Curvas estándar (Consultar la Tabla 6 y la Placa C en la Configuración de Placas, Figura 7)
Paso 1: La curva estándar se configuro exactamente como se muestra en la Tabla 6.
Tabla 6. Solución Madre -1X108 IVT. Diluir 50,000 CE/µl de ARNr a 500 CE/µl -5ml 50,000 CE/µl + 495 µl H2O
Control IVT
CE/µl Muestra Agua ARNr de fondo
BACTIN-1
100E+07 50 425 25
BACTIN-2
100E+06 50 425 25
BACTIN-3
100E+05 50 425 25
BACTIN-4
100E+04 50 425 25
BACTIN-5
100E+03 50 425 25
PBGD-1
100E+07 50 425 25
PBGD-2
100E+06 50 425 25
PBGD-3
100E+05 50 425 25
PBGD-4
100E+04 50 425 25
PBGD-5
100E+03 50 425 25

Alícuotas 10 µl por tubo de tira (2 placas); Colocar la Mezcla a -80º C hasta que esté lista para el uso.
Mezcla de Enzimas:
1. Mezcla Maestra: Enzima (Tth) / Anticuerpo (TP6-25), ver Tabla 7.
Tabla 7
Reactivo
2x
Enzima Tth (5U/µl)
600.00
Anticuerpo: TP6-25 (1mg/ml)
600.00
Agua
300.00
Total
1500.00
Alícuota 500 µl/tubo y congelar a -20º C. 15 Mezcla Maestra CUP:
1. 2.5X Mezcla Maestra CUP (Tablas 8-11):
Tabla 8
Tabla 9
ml
5x Aditivos 2.5x Conc.
0.50
1M Tris-Cl pH 8 5mM
1.25
40mg/ml de Albumina, bovina 500µg/ml
37.50
1M Trehalosa madre 375mM
2.5
20%v Tween 20 0.50%
7.00
ddH2O
48.75
Permitir que el reactivo se mezcle completamente > 15 minutos
ml
5x Aditivos 2.5 x Conc
12.50
1M Bicina/Hidróxido de Potasio pH 8.2 125mM
5.75
5M Acetato de Potasio 287.5mM
20.00
Glicerol (V x D = M -> 19.6 x 1.26 = 24.6 g) 20%
1.25
500mM Cloruro de Magnesio 6.25mM
1.75
500mM Cloruro de Magnesio 8.75mM
5.00
ddH2O
46.25
Permitir que el reactivo se mezcle completamente > 15 minutos; Combinar las mezclas anteriores en un contenedor estéril añadir lo siguiente
Tabla 10
ml
5x Aditivos 2.5x Conc.
1.25
100mM dATP 1.25mM
1.25
100mM dCTP 1.25mM
1.25
100mM dTTP 1.25mM
1.25
100mM dGTP 1.25mM
100.00
Permitir que el reactivo se mezcle completamente > 15 minutos; Alícuota 1.8ml/tubo y congelar a -20°C
Tabla 11
Cebador/Sonda
Madre (µM) FC (µM) Σl
Cebador Directo
100 10 100.0
Cebador Inverso
100 10 100.0
Sonda (5’FAM/3’BHQ1-TT)
100 4 40.0
Agua DI
760.0
Total
1000.0
Mezcla de Cebador y Sonda:
Alícuota 250 µl/tubo y congelar a -20º C
35 Mezcla de la Reacción:
1. Mezcla Maestra de CUP (CMM): (Consultar las Tablas 12-14 y la Placa A en la Configuración de Placas, Figura 7)
Tabla 12
Reactivo
FC X1 (10µl) 450
2.5 x Mezcla Maestra CUP
1X 4.00 1800
ROX
1x 0.20 90
2x MezclaTthAb
2U 1.00 450
Agua
2.3 1035
Total
7.50 3375
Preferiblemente, cada ejecución/placa no tendrá más de 356 reacciones: 12 muestras con 12 Marcadores
(288 reacciones con 2 replicados para cada una) +10 controles de curva estándar por duplicado (20) + 2 controles
positivos y 2 negativos para cada Marcador (4X12=48).
Ajustar el agua para el volumen de muestra -4,3 µl Muestra MAX; Mezclar Bien
Tabla 13
Reactivo
FC X1 (10µl) 34
Cebadores 10µM/Sonda 4µM
0.5 µM/0.2 µM 0.50 17
CMM
1x 7.50 255
Total
8.00 272
2. Marcadores ToO: Mezclar Bien
Tabla 14
Reactivo
FC X1 (10µl) 44
Cebadores 10µM/Sonda 4µM
0.5µM/0.2µM 0.50 22
CMM
1x 7.50 330
Total
8.00 352
3. Marcadores de β-Actina y PBGD: Mezclar bien
Configuración de la Muestra:
Tabla 15
Muestra
ID de la Muestra Conc Agua Añadida = 50ng/µll
A1
A2
A3
A4
A5
A6
A7
A8
A9
A10
A11
A12
1. Muestras de CUP: 12 muestras en Placa de 96 pocillos: A1-A12 (Consultar la Tabla 16 y la Placa B en la Configuración de Placas, Figura 7); Alícuota 50 µl de 50 ng/µl (2µl/rxn)
Placa de Carga:
1. Configuración de Placa de 384 Pocillos: (Consultar la Placa D en la Configuración de Placas, Figura 7)
Se cargan 2 µl de muestra y 8 µl de CMM en la placa. (muestra=50ng/µl). Se cargan 4 µl de muestra y 6 µl de CMM en la placa. (muestra=25ng/µl). La placa se sella y se etiqueta. Centrifugar a 2000 rpm durante 1 minuto. Configuración de ABI 7900 HT:
Colocar en el ABI 7900. Seleccionar el programa "CUP 384" y presionar comenzar. 55
Tabla 16
Condiciones de termociclado
95C x 60s
55C x 2m
RAMP 5%
70C x 2m
40 ciclos de
95C x 15s
58C x 30s
ROX Encendido
Se analizan los datos, los de Ct extraídos e insertados en el Algoritmo.
Ejemplo 3
Algoritmo de CUP
Los valores de ∆Ct normalizados de actina para HPT, MGB, PDEF, PSA, SP-B, TFF, DSG, WT1, PSCA, y F5 se colocan en 6 conjuntos basados en el tejido de origen para el que fueron originalmente seleccionados. Las constantes 9.00, 11.00, 7.50, 5.00, 10.00, 9.50, 6.50, 8.00, 9.00, y 8.00 se restan de cada ∆Ct respectivamente. Después, para cada muestra se selecciona el valor de CT mínimo de cada uno de los 6 conjuntos (HPT, min (MGB,
o PDEF), PSA, min (SP-B, TFF, o DSG), WT1, and min (PSCA, o F5)) como la variable representativa para el grupo.
Estas variables, y el sitio de metástasis se usan para clasificar la muestra usando discriminantes lineales. se deben construir dos modelos diferentes, uno para hombres y uno para mujeres, de los datos de aprendizaje usando la función 'Ida' de ll librería MASS (Venables et al. (2002) en R (version 2.0.1). Se calcula entonces una probabilidad posterior para cada ToO usando la función 'predecir2 para cada modelo masculino o femenino.
Las variables usadas en los modelos masculinos son HPT, PSA, el mínimo de ('SP-B', 'TFF', 'DSG3'), el mínimo de ('LCSP', 'F5'), y el sitio de metástasis. La categoría del sitio de metástasis tiene 4 niveles correspondientes a colon, pulmón, ovario y todos los otros tejido. Para los modelos femeninos, las variables son HPT, el mínimo de ('MGB', 'PDEF'), el mínimo de ('SP-B', 'TFF', 'DSG3'), WT1, el mínimo de ('LCSP', 'F5'), y el sitio de metástasis.
Ejemplo de Código R
#Training the male model dat.m<-CUP2.MIN.NORM[,c (’HPT’,’PSA’,’SP.B.TTF.DSG3’,’PSCA.F5’,’Class’,’background’)] CUP.lda.m<lda(Class~.,dat.m,prior=c(0,0.09,0.23,0.43,0,0.16,0.02)/sum(c (0,0.09,0.23,0.43,0,0.16,0.02))) #Training the female model dat.f<-CUP2.MIN.NORM[,c (’HPT’,’MFB.PDEF’,’SP.B.TTF.DSG3’,’WT1’,’PSCA.F5’,’Class’,’back ground’)] CUP.lda.f<lda(Class~.,dat.f,prior=c(0.03,0.09,0.23,0.43,0.04,0.16,0)/sum(c (0.03,0.09,0.23,0.43.0.04,0.16,0))) #if unknown sample (i) is male predict(CUP.lda.m, CUP2.MIN.NORM.TEST[i,]) #if unknown sample (i) is female
predict(CUP.lda.f, CUP2.MIN.NORM.TEST[i,])
Para ejecutar este código, un marco de datos llamado CUP2.MIN.NORM necesita contener los datos de
aprendizaje con el valor mínimo calculado para cada conjunto de tejido de origen como se ha descrito anteriormente.
La clase se corresponde con el tejido de origen, y el fondo se corresponde con los sitios de metástasis descritos anteriormente.
Los datos de la prueba pueden ser contenidos en el CUP2.MIN.NORM.TEST, y una muestra específica en la fila i puede ser probada usando la función predecir. De nuevo, los datos de prueba deben estar en el mismo formato que el conjunto de aprendizaje y tener también los ajustes del valor mínimo aplicados a él.
Ejemplo 4
Muestras resueltas de CUP
Se compararon 48 muestras resueltas y no resultas de CUP para determinar la correlación con las muestras de CUP verdaderas. Los métodos usados fueron los descritos en los Ejemplos 1-3. Los resultados obtenidos se presentan en la Tabla 17. Se probaron 11 muestras de CUP no resueltas, el diagnóstico se hizo en 8 muestras, 3 fueron de otra categoría.
Tabla 17
Categoría de la Muestra
Muestra # Correcta Incorrecta sin prueba % de precisión
ToO Conocido
15 11 3 1 79
CUP resuelto
22 17 4 1 81
CUP no resuelto
11 8 N/a 3 73
Ejemplo 5
Límites del Ensayo de CUP
La figura 8 representa los resultados obtenidos, usando los métodos descritos en los Ejemplos 1-3, para determinar los límites de los ensayos de CUP. El rendimiento del ensayo se probó sobre un intervalo de concentraciones de ARN y se descubrió que los ensayos de CUP son eficientes en el intervalo de 100 -12.5 ng de ARN.
Ejemplo 6
Ensayo de qRTPCR
Materiales y Métodos. Muestras de Tejido congeladas para Análisis de Micromatrices. Se usaron un total de 700 tejidos humanos primarios congelados para ella realización de perfiles de micromatrices de expresión génica. Las muestras se obtuvieron de una variedad de instituciones académicas, incluyendo la Universidad de Washington(St. Louis, MO), el Erasmus Medical Center (Rotterdam, Países Bajos), y compañías de banco de tejidos comerciales, incluyendo Genomics Collaborative, Inc (Cambridge, MA), Asterand (Detroit, MI), Oncomatrix (La Jolla, CA) y Clinomics Biosciences (Pittsfield, MA). Para cada espécimen, , se recogió también información demográfica del paciente, clínica y patológica. Las características histopatológicas de cada muestra se revisaron para confirmar el diagnóstico y para estimar la conservación de la muestra y el contenido tumoral.
Extracción de ARN e Hibridación del Chip Génico Affymetrix. Se diseccionaron y homogeneizaron muestras de cáncer congeladas con más de un 70% de células tumorales, muestras benignas y normales con homogeneizador mecánico (UltraTurrex T8, Alemania) en reactivo Trizol (Invitrogen, Carlsbad, CA). El tejido fue homogeneizado en reactivo Trizol siguiendo el protocolo de Trizol estándar para el aislamientos de ARN de tejidos congelados (Invitrogen, Carlsbad, CA). Después de la centrifugación la fase de líquido superior se recogió y se precipitó el ARN total con alcohol isopropílico a -20º C. Los pellets de ARN se lavaron con 75% de etanol, se resolvieron en agua y se almacenaron a -80º C hasta su uso.
La calidad del ARN se examinó con un Agilent 2100 Bioanalyzer RNA 6000 Nano Assay (Agilent Technologies, Palo Alto, CA). El ARNc etiquetado se preparó e hibridó con el Chip Génico Hu133A de matriz de oligonucleótidos de alta densidad (Affymetrix, Santa Clara, CA) que contiene un total de 22.000 conjuntos de sonda de acuerdo con el protocolo del fabricante estándar. Las matrices fueron escaneadas usando protocolos y escáneres de Affymetrix. Para análisis posteriores, cada conjunto de sondas se consideró un gen separado. Los valores de expresión para cada gen se calcularon usando el software de análisis de Chip Génico de Affymetrix MAS 5.0. Todos los chips cumplían tres estándares de control de calidad: el porcentaje de designación "presente" para la matriz era mayor del 35%, el factor de escala era menor de 12 cuando se modificó a escala a una intensidad objetivo global de
600 y el nivel de fondo medio era menor de 150.
Selección de Candidatos a Marcadores. Para la selección de los candidatos a Marcadores del tejido de origen (ToO) para tejidos de pulmón, colon, mama, ovario y próstata, los niveles de expresión de los conjuntos de sondas se midieron en muestras de ARN que cubrían un total de 682 tejidos normales, benignos y cancerosos de mama, colon, pulmón, ovario, próstata. Los candidatos a Marcador específico del tejido fueron seleccionados en base al número de consultas estadísticas.
Para generar candidatos pancreáticos, se usaron perfiles de expresión génica de 13 adenocarcinomas ductales de páncreas primarios, 5 de páncreas normales y 98 especímenes de cáncer de pulmón, colon, mama y ovario para seleccionar los Marcadores de adenocarcinoma de páncreas. Se realizaron dos consultas. En la primera consulta, se creó un conjunto de datos que contenía 14547 genes con al menos 2 designaciones "presentes" en muestras de páncreas. Se identificó un total de 2736 genes que sobreexpresaban en cáncer de páncreas en comparación con el normal por prueba T (p<0,05). Se seleccionaron genes con expresión mínima en el percentil 11º de cáncer de páncreas que era al menos 2 veces más alto que el máximo en cáncer de colon y pulmón, haciendo 45 conjuntos de sondas. Como un paso final, se seleccionaron 6 genes con expresión máxima al menos 2 veces más alta que la expresión máxima en cánceres de colon, pulmón, mama y ovario. En una segunda consulta, se creó un conjunto de datos de 4654 conjuntos de sonda con un máximo de 2 designaciones "presentes" en especímenes de mama, colon, pulmón y ovario. Se seleccionaron un total de 160 genes que tenían al menos 2 designaciones "presentes" en muestras de cáncer y normal de páncreas. Fuera de los 160 genes, se seleccionaron 10 genes después de comparar su nivel de expresión entre tejidos de páncreas y normales. Los resultados de ambas consultas de páncreas se combinaron.
Además del análisis de los perfiles de expresión génica, se seleccionaron unos pocos Marcadores de la bibliografía. Los resultados de todas las consultas fueron combinados para hacer una lista corta de candidatos a Marcador de ToO para cada tipo de tejido. Se estimaron la sensibilidad y especificidad de cada Marcador. Los Marcadores que demostraron la mejor capacidad para diferenciar tejidos por su origen fueron nominados para pruebas de RT-PCR en base a la redundancia y complementariedad de los Marcadores.
Carcinoma metastásico de FFPE de origen conocido y tejidos de CUP. Se adquirieron un total de 386 carcinomas metastásicos de FFPE (Etapa III-IV) de origen conocido y 24 adenocarcinomas primarios de próstata de FFPE de una variedad de vendedores comerciales, incluyendo Proteogenex (Los Angeles, CA), Genomics Collaborative, Inc. (Cambridge, MA), Asterand (Detroit, MI), Ardais (Lexington, MA) y Oncomatrix (La Jolla, CA). se obtuvo un conjunto independiente de 48 carcinomas metastásicos de primario conocido y tejidos de CUP del Albany Medical College (Albany, NY). Para cada espécimen, se recogió información demográfica del paciente, clínica y patología. Se revisaron las características histopatológicas de cada muestra para confirmar el diagnóstico, y para estimar la conservación de la muestra y el contenido tumoral. Para las muestras metastásicas, se establecieron inequívocamente diagnósticos del carcinoma metastásico y ToO en base a la historia clínica del paciente y la evaluación histológica del carcinoma metastásico en comparación con los primarios correspondientes.
Asilamiento de ADN de muestras de FFPE. El aislamiento de ARN de secciones de tejido de parafina fue como se describe en el manual del High Pure RNA Paraffin Kit (Roche) con las siguientes modificaciones. Se seccionaron muestras de tejido embebidas en parafina de acuerdo al tamaño de la metástasis embebida (2-5mm = 9 X 10µm, 6-8mm = 6 X 10µm, 8 -≥ 10mm = 3 X 10 µm). Las secciones fueron desparafinadas como se describe en el manual del Kit, el pellet de tejido se seco en un horno a 55º C durante 5-10 minutos y se resuspendió en 100 µl de tampón de lisis de tejido, 16µl de 10% SDS y 80 µl de Proteinasa K. Las mezclas se agitaron en vórtice y se incubaron en un conjunto termomezclador a 400 rpm durante 2 horas a 55º C. El procesamiento de muestras posterior se realizó de acuerdo al manual del High Pure RNA Paraffin Kit. Se cuantificaron las muestras por lecturas de OD 260/280 obtenidas por un espectrómetro y las muestras se diluyeron a 50 ng/µl . El ARN aislado fue almacenado en agua libre de RNasa a 80º C hasta su uso.
qRTPCR para Pre-cribado de candidatos a Marcadores. Un µg de ARN total de cada muestra fue sometido a transcripción inversa con hexámeros aleatorios usando la transcriptasa inversa Superscript II de acuerdo con las instrucciones del fabricante (Invitrogen, Carlsbad, CA). Se diseñaron cebadores y sondas MGB para los candidatos a Marcadores génicos probados y el gen de control ACTB usando software Primer Express (Applied Biosystems, Foster City, CA) o ABI Assay-on-Demand (Applied Biosystems, Foster City, CA). Todos los cebadores y sondas diseñados internamente se probaron para eficiencia de amplificación óptima por encima del 90%. La amplificación por RT-PCR se llevó a cabo en una mezcla de reacción de 20 ml que contenía 200 ng de ADNc de plantilla, 2 x mezcla maestra de PCR universal TaqMan® (10 ml) (Applied Biosystems, Foster City, CA), 500 nM de cebadores directos e inversos, y 250 nM de sonda. Las reacciones se ejecutaron en un Sistema de Detección de Secuencias ABI PRISM 7900HT (Applied Biosystems, Foster City, CA). Las condiciones de ciclación fueron: 2 minutos de activación de AmpErase UNG a 50º C, 10 minutos de activación de polimerasa a 95º C y 50 ciclos a 95º C durante 15 segundos y temperatura de hibridación (60º C) durante 60 segundos. En cada ensayo, el control "sin plantilla" junto con el ADNc de plantilla fue incluido por duplicado para tanto el gen de interés como el gen de control. La expresión relativa de cada gen objetivo fue representada como ∆Ct, que es igual al Ct del gen objetivo restado por el
Ct del gen de control (ACTB).
qRTPCR de un paso optimizado. Se usaron los números de acceso de secuencias de ARNm apropiadas en conjunción con Oligo 6.0 para desarrollar ensayos de CUP TaqMan® (Marcadores de pulmón, surfactante humano, proteína B asociada al pulmón (HUMPSPBA), factor de transcripción tiroideo 1 (TTF1), desmogleína 3 (DSG3), marcador colorrectal: cadherina 17 (CDH17), marcadores de mama: mamaglobina (MG), factor de transcripción ets derivado de la próstata (PDEF), Marcador de ovario: tumor de Wilms 1 (WT1), marcadores de páncreas: antígeno de células madre de próstata (LCSP), factor de coagulación V (F5), calicreína del marcador de próstata 3 (KLK3)) y actina beta (β-actina) de ensayos domésticos, hidroximetilbilano sintasa (PBGD). Los cebadores específicos de los genes y las sondas de hidrólisis para el ensayo qRT-PCR de un paso optimizado se enumeran en la Tabal 2 (SEQ ID NOs: 11-58). La amplificación del ADN genómico fue excluida diseñando los ensayos alrededor de sitios de escisión exón-intrón. Las sondas de hidrólisis fueron etiquetadas en el nucleótido 5' con FAM como el colorante indicador y en el nucleótido 3' con BHQ1-TT como el colorante de extinción interno.
La cuantificación de ARN específico del gen se llevo a cabo en una placa de 384 pocillos en el sistema de detección de secuencias ABI Prism 7900HT (Applied Biosystems). Para cada ejecución de termo-ciclador se amplificaron los calibradores y las curvas estándar. Los calibradores para cada Marcador consistieron de transcritos in vitro del gen objetivo que fueron diluidos en ARN portador de riñón de rata a 1X105 copias. Las curvas estándar para Marcadores domésticos consistieron de transcritos in vitro del gen objetivo que fueron diluidos en serie en ARN portador de riñón de rata a 1X107, 1X105 y 1X103 copias. No se incluyeron tampoco controles del objetivo en cada ejecución del ensayo para asegurar la carencia de contaminación ambiental. Todas las muestras y controles se ejecutaron por duplicado. Se realizó qRTPCR con reactivos de uso de laboratorio en general en una reacción de 10µl que contenía: Tampón de RT-PCR (50 nM Bicina/KOH pH 8,2, 115nM KAc, 8% de glicerol, 2,5 mM de MgCl2, 3,5 mM de MnSO4, 0,5 mM cada uno de dCTP, dATP, dGTP y dTTP), aditivos (2 mM de Tris-Cl pH 8, 0,2 mM de albúmina bovina, 150 mM de trehalosa, 0,002% de Tween 20), Mezcla de Enzimas (2U Tth (Roche), 0,4 mg/µl Ab TP6-25), Cebador y mezcla de sondas (0,2 µM de Sondas, 0.5µM de cebadores). Siguieron los siguientes parámetros de ciclación; 1 ciclo a 95º C durante 1 minuto; 1 ciclo a 55º C durante 2 minutos; Desnivel 5%; 1 ciclo a 70º C durante 2 minutos; y 40 ciclos de 95º C durante 15 segundos; 58º C durante 30 segundos. Después de que se completó la reacción de PCR, se establecieron los valores de la línea de base y umbral en el software ABI 7900HT Prism y los valores de Ct calculados se exportaron a Microsoft Excel.
Reacción de Un paso frente a Dos Pasos. Para la comparación de las reacciones de RT-PCR de dos pasos con la de un paso, se llevó a cabo la síntesis de la primera cadena de la reacción de dos pasos usando o 100 ng de hexámeros aleatorios o cebadores específicos del gen por reacción. En el primer paso, se calentaron 11,5 µl de Mezcla-1 (cebadores y 1 µg de ARN total) a 65º C durante 5 minutos y después se enfrió en hielo. Se añadieron 8,5 µl de Mezcla-2 (1x Tampón, 0,01 mM de DTT, 0,5 mM de cada uno de los dNTP, 0,25 U/µl de RNasin®, 10 U/µl de Superscript III) a la Mezcla-1 y se incubó a 50º C durante 60 minutos seguido por 95º C durante 5 minutos. El ADNc fue almacenado a -20º C hasta que estuvo listo para el uso, el qRTPCR para el segundo paso de la reacción de dos pasos se realizó como se ha indicado anteriormente con los siguientes parámetros de ciclación: 1 ciclo a 95° C durante 1 minuto; 40 ciclos de 95° C durante 15 segundos, 58° C durante 30 segundos. El qRTPCR para la reacción de un paso se realizó exactamente como se ha señalado en el párrafo anterior. Las reacciones de tanto un paso como la de dos pasos se realizaron en 100 ng de plantilla (ARN/ADNc). Después de que se completó la reacción de PCR se establecieron los valores de línea de base y umbral en el software ABI 7900HT Prism y los valores de Ct calculados se exportaron a Microsoft Excel.
Desarrollo del Algoritmo. se construyeron discriminadores lineales usando la función 'idea' de la biblioteca MASS (Venables y Ripley) en el lenguaje R (versión 2.1.1). El modelo usado es dependiente del tejido del que se extrajo la metástasis, así como del género del paciente. Cuando se encuentra un sitio de metástasis de pulmón, colon u ovario, el antecedente de clase es establecido a cero para la clase que es equivalente al sitio de metástasis. Además, las probabilidades anteriores son establecidas a cero para la clase de mama y ovario en pacientes masculinos, mientras que en pacientes femeninos, el antecedente de la clase de próstata es establecido a cero. Todas las otras probabilidades anteriores usadas en los modelos son equivalentes. Además, la clasificación para cada muestra se basa en la probabilidad posterior más alta determinada por el modelo para cada clase. Para estimar el rendimiento del modelo, se realizó una validación cruzada dejando uno fuera. Además de esto, los conjuntos de datos fueron divididos aleatoriamente en mitades., conservando la relación proporcional entre cada clase, en conjuntos de aprendizaje y prueba. Esta división aleatorio se repitió tres veces.
Resultados. El objetivo de este estudio era desarrollar un ensayo qRTPCR para predecir el tejido de origen de carcinoma metastásico. El trabajo experimental consistió de dos partes principales. La primera parte incluía la nominación de candidatos a Marcador específicos del tejido, su validación en tejidos de carcinoma metastásico de FFPE, y la selección de diez Marcadores para el ensayo (Figura 9A). La segunda parte incluía la optimización del ensayo qRTPCR seguido por la implementación del ensayo en otro conjunto de carcinomas metastásicos de FFPE, la construcción de un algoritmo de predicción, su validación cruzada y validación en un conjunto de muestras independiente. (Figura 9B).
Número Total
Edad Media
Género
Femenino
Masculino
Tejido de Origen
Pulmón
Páncreas
Colorrectal
Mama
Ovario
Próstata
Riñón
Estomago
Otro**
Carcinoma de Primario Desconocido
Diagnóstico Histopatológico Adenocarcinoma, moderadamente/bien diferenciado Adenocarcinoma, pobremente diferenciado carcinoma de células escamosas Carcinoma pobremente diferenciado Carcinoma de células pequeñas Melanoma Linfoma Carcinoma Hepatocelular Mesotelioma Otro***
Sitio de Metástasis Nódulos Linfáticos Cerebro Pulmón Hígado Región pélvica (ovario, vejiga, trompas de Falopio) Abdomen(epiplón (epiplón,mesenterio,colon,peritoneo) Otro (piel, tiroides, pared torácica, ombligo) Desconocido Primario (próstata)
Características de la Muestra. Se usó el ARN de un total de 700 muestras de tejido primario congeladas para la realización del perfil de expresión génico e identificación del gen específico del tipo de tejido. Las muestras incluían 545 carcinomas primarios (296 de pulmón, 13 de páncreas, 315 de mama, 128 colorrectales, 38 de próstata. 22 de ovario), 37 lesiones benignas (1 de pulmón, 4 colorrectales, 6 de mama, 26 de próstata) y 118 (36 de pulmón, 5 de páncreas, 36 colorrectales, 14 de mama, 3 de próstata, 24 de ovario) tejidos normales.
Se usaron en este estudio un total de 375 carcinomas metastásicos de origen conocido (Etapa III-IV) y 26 muestras de adenocarcinoma primario de próstata. Los carcinomas metastásicos se originaron a partir de pulmón, páncreas, colorrectal, de ovario, de próstata, así como otros tipos de cáncer. La categoría de muestra "otro" consintió de metástasis derivada de tejidos distintos de pulmón, páncreas, colon, mama, ovario y próstata. Las características de los pacientes se resumen en la Tabla 18.
Tabla 18
CUP Metastásico Conjunto de la
Muestra
401 48
57.8 ±11* 62.13 ±11.7 241 20 160 28
65 9 63 2 61 4 63 5 82 2 27 2 88 70 25 5
306 27 49 4 16 5 16 10
3 5 3 2 1
14 2
73 1 17 14 20 7 75 11 53 2 91 5 44 8
* La edad es desconocida para 26 pacientes
** esófago, vejiga, pleura, vesícula biliar del hígado, conductos biliares, laringe, faringe, linfoma no Hodgkin *** de células pequeñas, mesotelioma, hepatocelular, melanoma, linfoma
Las muestras fueron separadas en dos conjuntos: el conjunto de validación (205 especímenes) que fue usado para validar la expresión diferencial específica del tejido de los candidatos a Marcador y el conjunto de aprendizaje (260 especímenes) que fue usado para probar el procedimiento qRTPCR de un paso optimizado y para el aprendizaje de un algoritmo de predicción. El primer conjunto de 205 muestras incluía 25 de pulmón, 41 de páncreas, 31 colorrectales, 33 de mama, 33 de ovario, 1 de próstata, 23 otras metástasis de cáncer y 18 cánceres primarios de próstata. El segundo conjunto consistía de 260 muestras incluidos 56 de pulmón, 43 de páncreas, 30 colorrectales, 30 de mama, 49 de ovario, 32 otras metástasis de cáncer y 20 cánceres primarios de próstata. Sesenta y cuatro especímenes, incluyendo 16 de pulmón, 21 de páncreas, 15 otros metastásicos y 12 carcinomas primarios de próstata fueron del mismo paciente en ambos conjuntos.
El conjunto de muestra independiente obtenido del Albany Medical College estaba comprendido de 33 especímenes de CUP con un primario sugerido para 22 de ellos, y 15 carcinomas metastásicos de origen conocido. Para los CUPs que tenían un primario sugerido, se hizo un diagnóstico en base a características morfológicas y/o resultados de pruebas con un panel de Marcadores IHC. Las características demográficas del paciente, clínicas y de patología se presentan en la Tabla 18.
Selección de candidatos a Marcador. El análisis de los perfiles de expresión génica de 5 tipos de tejido primario (pulmón, colon, mama, ovario, próstata) resulto en la nominación de 13 candidatos a Marcador específicos del tejido para las pruebas qRTPCR. Los candidatos principales han sido identificados en estudios previos de cánceres in situ. Argani et al. (2001); Backus et al. (2005); Cunha et al. (2005); Borgono et al. (2004); McCarthy et al. (2003); Hwang et al. (2004); Fleming et al. (2000); Nakamura et al. (2002); y Khoor et al. (1997). Además del análisis de los datos de micromatrices, se seleccionaron dos Marcadores de la bibliografía, incluyendo un DSG3 Marcador de carcinoma de células escamosas de pulmón complementario y el Marcador de mama PDEF. Backus et al. (2005). Los datos de las micromatrices confirmaron la alta sensibilidad y especificidad de estos Marcadores.
Se uso un enfoque especial para identificar los Marcadores específicos del páncreas. Primero, se analizaron cinco candidatos a Marcador de páncreas: antígeno de células madre de próstata (PSCA), inhibidor de proteinasa serina, miembro de clade A 1 (SERPINA1), citoqueratina 7 (KRT7), metaloproteasas de matriz 11 (MMP11), y mucina 4 (MUC4) (Varadhachary et al. (2004); Argani et al. (2001); Jones et al. (2004); Prasad et al. (2005) y Moniaux et al. (2004)) usando micromatrices de ADN y un panel de 13 adenocarcinomas ductales de páncreas, cinco tejidos de páncreas normal y 98 muestras de tumores de mama, colorrectales, pulmón, y ovario. Sólo el PSCA demostró sensibilidad moderada (se detectaron seis de 13 o el 46% de los tumores de páncreas) a una alta especificidad (94 de 98 o el 93% fueron correctamente identificados como no siendo de origen pancreático). Por el contrario, KRT7, SERPINA1, MMP11, y MUC4 demostraron sensibilidades del 38%, 31%, 85% y 31%, respectivamente, a especificidades del 66%, 91%, 82% y 81%, respectivamente. Estos datos se encontraban en concordancia con el qRTPCR realizado en 27 metástasis de origen pancreático y 39 metástasis de origen no pancreático para todos los Marcadores excepto el MMP11 que mostró sensibilidad y especificidad más pobres con el qRTPCR que las metástasis. En conclusión los datos de las micromatriz en tejido primario congelado rápidamente sirve como un buen indicador de la capacidad del Marcador para identificar una metástasis de FFPE como pancreática en origen usando qRTPCR pero esos Marcadores adicionales pueden ser útiles para un rendimiento óptimo.
El adenocarcinoma ductal pancreático se desarrolla de células epiteliales ductales que comprende sólo un pequeño porcentaje de todas las células pancreáticas (con células acinares y células de los islotes que comprenden la mayoría) en el páncreas normal. Además, los tejidos de adenocarcinoma de páncreas contienen una cantidad significativa de tejido normal adyacente (Prasad et al. (2005) y Ishikawa et al. (2005)). Debido a esto los Marcadores de páncreas candidatos han sido enriquecidos para genes elevados en adenocarcinoma de páncreas en relación a las células de páncreas normales. El primer método de consulta devolvió seis conjuntos de sonda: factor de coagulación V (F5), una proteína hipotética FLJ22041 similar a las proteínas de unión a FK506 (FKBP10), integrina beta 6 (ITGB6), transglutaminasa 2 (TGM2), ribonucleoproteina heterogénea nuclear A0 (HNRP0), y BAX delta (BAX). El segundo método de consulta (ver Materiales y Métodos para los detalles) devolvió ocho conjuntos de sonda: F5, TGM2, factor de transcripción de homeodominio tipo emparejado 1 (PITX1), isoforma trío ARNm (TRIO), ARNm para p73H (P73), una proteína desconocida para MGC: 10264 (SCD), y dos conjuntos de sonda para claudina18.
Se seleccionaron un total de 23 candidatos a Marcador específicos del tejido para validación por RT-PCR adicional en tejidos de FFPE de carcinoma metastásicos por qRT-PCR. Los candidatos a Marcador se probaron en 205 carcinomas metastásicos de FFPE, de pulmón, páncreas, colon, mama, ovario, próstata y carcinomas primarios de próstata. La Tabla 19 proporciona los símbolos génicos de los Marcadores específicos de tejido seleccionados de la validación por RT-PCR y también resume los resultados de las pruebas realizadas con estos Marcadores.
Tabla 19
Tipo de Tejido
SEQ ID NOs Método de ID Filtros de selección de Marcador Marcador adecuado?
Micro matriz
Lit Baja expresión en Tejido met correspondiente Redundancia del Marcador Reactividad cruzada del Tejido
Pulmón
1/59 X X X
60
X X X
61
X X X
Páncreas
66 X X
67
X X
71
X X
72
X X
73
X
74
X
75
X
76
X
Colon
4/85 X X X
77
X X
78
X X X
79
X X X
Próstata
9/86 X X X
80
X X X
Mama
63 X X X
81
X X X
64
X X
Ovario
82 X X X
83
X X X
65
X X X
De los 23 marcadores probados, trece fueron rechazados en base a su reactividad cruzada, bajo nivel de expresión en los tejidos metastásicos correspondientes, o redundancia. Diez Marcadores se seleccionaron para la versión final del ensayo. Los Marcadores de pulmón eran proteína B asociada al pulmón surfactante humana (HUMPSPBA), factor de transcripción tiroideo 1 (TTF1) y desmogleína 3 (DSG3). Los Marcadores de páncreas eran antígeno de células madre de próstata (PSCA) y factor de coagulación V (F5), y el Marcador de próstata era calicreína 3 (KLK3). El Marcador colorrectal era cadherina 17 (CDH17) Lo Marcadores de mama eran mamaglobina (MG) y factor de transcripción ets derivado de próstata (PDEF). El Marcador de ovario era tumor de Wilms 1 (WT1). 55 Los valores de expresión relativos normalizados medios de los Marcadores seleccionados en diferentes tejidos metastásicos se presentan en la Figura 10.
Optimización de la preparación de la muestra y qRT-PCR usando tejidos de FFPE. Después los métodos de aislamiento de ARN y qRTPCR se optimizaron usando tejidos fijados antes de examinar el rendimiento del panel de Marcadores. Primero se analizó el efecto de reducir el tiempo de incubación de la proteinasa K de dieciséis horas a 3 horas. No hubo efecto en el rendimiento. Sin embargo, algunas muestras mostraron fragmentos más largos de ARN cuando su uso el paso de proteinasa K más corto (Figura 11A, B). Por ejemplo, cuando el ARN fue aislado de un bloque de un año (C22), no se observó diferencia en los electroferogramas. Sin embargo, cuando el ARN se aisló de un bloque de cinco años (C23), se observó una fracción más grande de ARNs de peso molecular más alto, según 65 lo evaluado por la protuberancia en el desnivel, cuando se usó la digestión de proteinasa K más corta. Esta
tendencia se mantuvo generalmente cuando se procesaron otras muestras, independientemente del órgano de origen para la metástasis de FFPE. En conclusión, acortar el tiempo de digestión de la proteinasa K no sacrifica rendimientos de ARN y puede ayudar a aislar ARN menos degradado, más largo.
Después se compararon tres métodos diferentes de transcripción inversa: transcripción inversa con hexámeros aleatorios seguida por qPCR (dos pasos), transcripción inversa con un cebador específico del gen seguida por qPCR (dos pasos) y una qRTPRC de un paso usando cebadores específicos de los genes. El ARN se aisló de once metástasis y se comparó con los valores de Ct a través de tres métodos con β-actina, HUMSPB (Figuras 11C, D) y TTF. Los resultados mostraron diferencias estadísticamente significativas (p<0,001) para todas las comparaciones. Para ambos genes, la transcripción inversa con hexámeros aleatorios seguida por qPCR (reacción de dos pasos) dio los valores de Ct más altos mientras que la transcripción inversa con un cebador específico del gen seguida por qPCR (reacción de dos pasos) dio valores de Ct ligeramente más bajos (pero estadísticamente significativos) que la reacción de un paso correspondiente. Sin embargo, la RTPCR de dos pasos con cebadores específicos de los genes tuvo un paso de transcripción inversa más largo. Cuando los valores de Ct de HUMSPB se normalizaron al valor de β-actina correspondiente para cada muestra, no hubo diferencias en los valores de Ct normalizados a través de los tres métodos. En conclusión, la optimización de las condiciones de reacción de RTPCR pueden generar valores de Ct más bajos, lo que ayuda a analizar bloques de parafina más viejos (Cronin et al (2004)), y una reacción de RTPCR de un paso con cebadores específicos de los genes puede generar valores de Ct comparables a los generados en la reacción de dos pasos correspondiente.
Rendimiento de diagnóstico de un ensayo qRTPCR de CUP. Después se realizaron 12 reacciones de qRTPCR (10 Marcadores y dos genes domésticos) en un nuevo conjunto de 260 metástasis de FFPE. Veintiún muestras dieron valores de Ct altos para los genes domésticos por lo que sólo se usaron 238 en el análisis de mapa de calor. El análisis de valores de Ct normalizados en un mapa de calor reveló la alta especificidad de los Marcadores de mama y próstata, especificidad moderada de colon, pulmón y ovario, y especificidad algo más baja de los Marcadores de páncreas (Figura 12). Combinar los datos de qRTPCR normalizados con el refinamiento computacional mejora el rendimiento del panel de Marcadores.
Usando valores de expresión, normalizados a medios de la expresión de dos genes domésticos, se desarrolló un algoritmo para predecir el tejido de origen de la metástasis combinado los datos de qRTPRC normalizados con el algoritmo y se determinó la precisión del ensayo de qRTPCR realizando un test de validación cruzada dejando uno fuera (LOOCV). Para los seis tipos de tejido incluidos en el ensayo, se estimó separadamente tanto el número de designaciones falso-positivas, cuando se predijo una muestra erróneamente como otro tipo de tumor incluido en el ensayo (páncreas como colon, por ejemplo, como el número de veces que una muestra no fue predicha como de los incluidos en los tipos de tejido del ensayo (otros). Los resultados del LOOCV se presentan en la Tabla 20.
Tabla 20
Tejido de Origen
Predicción
Mama Colon Pulmón Ovario Páncreas Próstata Otro Total
Mama
22 0 2 1 1 0 0
Colon
1 27 3 2 4 0 4
Pulmón
1 2 45 2 3 0 5
Otro
1 1 3 1 4 0 16
Ovario
5 0 0 43 0 0 1
Páncreas
0 0 3 0 31 0 6
Próstata
0 0 0 0 0 20 0
Total
30 30 56 49 43 20 32 260
# Correctos
22 27 45 43 31 20 16 204
Precisión
72.3 90.0 87.8 87.8 72.1 100.0 50.0 78.5
El tejido de origen se predijo correctamente para 204 de las 260 muestras probadas con una precisión total del 78%. Una proporción significativa de las designaciones de falso positivo se debieron a la reactividad cruzada de los Marcadores en tejidos histológicamente similares. Por ejemplo, tres carcinomas metastásicos de células escamosas originados de faringe, laringe y esófago fueron previstos erróneamente como de pulmón debido a la
expresión de DSG3 en estos tejidos. La expresión positiva de CDH17 en carcinomas GI distintos de colon, incluyendo estómago y páncreas, causo la clasificación falsa de 4 de las 6 de estomago probadas y de 3 de las 43 metástasis de cáncer de páncreas probadas como de colon.
Además de un test LOOCV, los datos fueron divididos aleatoriamente en 3 pares separados de conjuntos de aprendizaje y prueba. Cada división contenía aproximadamente un 50% de las muestras para cada clase. A 50/50 divisiones en tres pares separados de conjuntos de aprendizaje y prueba, las precisiones de clasificación totales del ensayo fueron del 77%, 71% y 75%, confirmando la estabilidad del rendimiento del ensayo.
Por último, se probó otro conjunto independiente de 48 carcinomas metastásicos de FFPE que incluía carcinomas metastásicos de primario conocido, especímenes de CUP con un diagnóstico del tejido de origen suministrado por evaluación patológica incluyendo IHC, y especímenes de CUP que permanecieron CUP después de las pruebas IHC. La precisión del predicción del tejido de origen fue estimada separadamente para cada categoría de muestras. La Tabla 21 resume los resultados del ensayo.
Tabla 21
Probados
correctos Precisión
Mets conocidas
15 11 73.3
CUP Resueltos
22 17 77.3
CUP sin resolver
11
La predicción del tejido de origen fue, con solo unas pocas excepciones, consistente con el primario conocido o diagnóstico del tejido de origen evaluado por evaluación clínica/patológica incluyendo IHC. De manera similar al conjunto de aprendizaje, el ensayo no fue capaz de diferenciar carcinomas de células escamosas originados de fuentes diferentes y los predijo falsamente como de pulmón.
El ensayo también hizo diagnósticos de tejido de origen putativo para ocho de las once muestras que permanecieron como CUP después de la prueba de diagnóstico estándar. Uno de los casos de CUP fue especialmente interesante. Un paciente masculino con una historia de cáncer de próstata fue diagnosticado con carcinoma metastásico en el pulmón y la pleura. Las pruebas de PSA en suero e IHC con anticuerpos de PAS en tejido metastásico fueron negativas, por lo que el diagnóstico del patólogo fue CUP con una inclinación hacia tumores gastrointestinales. El ensayo predijo fuertemente (probabilidad posterior de 0,99) el tejido de origen como colon. Discusión: En este estudio, la realización de perfiles de expresión basados en micromatrices en tumores primarios se usó para identificar candidatos a Marcador para su uso con metástasis. El hecho de que los tumores primarios puedan ser usado para descubrir Marcadores de tumores de origen para metástasis es consistente con varios descubrimientos recientes. Por ejemplo, Weigelt y sus colaboradores han demostrado que los perfiles de expresión génica de tumores de mama primarios se mantienen en metástasis distantes. Weigelt et al. (2003). Backus y sus colaboradores identificaron Marcadores putativos para detectar metástasis de cáncer de mama usando un análisis de expresión génica de genoma amplio de la mama y otros tejidos y demostraron que la mamaglobina y CK19 detectaron metástasis clínicamente procesable en ganglios linfáticos centinelas de mama con un 90% de sensibilidad y un 94% de especificidad. Backus et al. (2005).
Durante el desarrollo del ensayo, la selección se enfocó en seis tipos de cáncer, incluyendo pulmón, páncreas y colon que están entre los más prevalentes en CUP (Ghosh et al. (2005); y Pavlidis et al. (2005)) y mama, ovario y próstata para los que el tratamiento podría ser más beneficioso para los pacientes. Ghosh et al. (2005). Sin embargo, los tipos de tejidos y Marcadores adicionales pueden ser añadidos al panel siempre que la precisión total del ensayo no se comprometa y, si es aplicable, las logísticas de las reacciones de RTPCR no se entorpezcan.
Los estudios basados en micromatrices con tejido primario confirmaron la especificidad y sensibilidad de los Marcadores conocidos. Como resultado, la mayoría de los Marcadores específicos de tejido tienen alta especificidad para los tejidos aquí estudiados. Un estudio reciente descubrió que, usando IHC, el PSCA se sobreexpresa en metástasis de cáncer de próstata. Lam et al. (2005). Dennis et al. (2002) también demostraron que el PSCA podría ser usado como un Marcador de tumor de origen para el páncreas y próstata. La fuerte expresión del PSCA en algunos tejidos de próstata a nivel de ARN estaba presente pero, debido a la inclusión de PSA en el ensayo, los cánceres de próstata y páncreas pueden ser ahora segregados. Un nuevo descubrimiento de este estudio fue el uso de F5 como un Marcador complementario (al PSCA) para tejido de origen pancreático. En tanto el conjunto de datos de micromatrices con tejido primario como el conjunto de datos de qRTPCR con metástasis de FFPE, se descubrió que el F5 complementa al PSCA.
Investigadores anteriores han generado ensayos de CUP usando IHC (Brown et al. (1997); DeYoung et al. (2000); y Dennis et al. (2005a)) o micromatrices. Su et al. (2001); Ramaswamy et al. (2001); y Bloom et al. (2004). Más recientemente, el SAGE ha sido acoplado a un panel de Marcadores de qRTPCR pequeño. Dennis et al.
(2002); y Buckhaults et al. (2003). Este estudio es el primero en combinar realización de perfiles de expresión basados en micromatrices con un panel pequeño de ensayos de qRTPCR. Los estudios de micromatrices con tejido primario identificaron algunos, pero no todos, de los mismos Marcadores de tejido de origen que los identificados previamente por estudios SAGE. Este descubrimiento no es sorprendente dados los estudios que han demostrado que existe una concordancia modesta entre los datos de realización de perfiles basados en micromatrices de ADN y SAGE y que la correlación mejora para los genes con niveles de expresión más altos. van Ruissen et al. (2005); y Kim et al. (2003). Por ejemplo, Dennis y sus colaboradores identificaron el PSA, MG, PSCA y HUMSPC mientras que Buckhaults y sus colaboradores (Buckhaults et al. (2003)) identificaron el PDEF.
La ejecución de un ensayo CUP es preferible por qRTPCR porque es una tecnología robusta y puede tener ventajas de rendimiento sobre el IHC. Al-Mulla et al. (2005); y Haas et al. (2005). Además, como se demuestra en la presente, el protocolo qRTPCR ha sido mejorado a través del uso de cebadores específicos de genes en una reacción de un paso. Esta es la primera demostración del uso de cebadores específicos de genes en una reacción de qRTPCR de un paso con tejido de FPPE. Otros investigadores han hecho o una qRTPCR de dos pasos (síntesis de ADNc en una reacción seguida por qPCR) o han usado hexámeros aleatorios o cebadores específicos de genes truncados. Abrahamsen et al. (2003); Specht et al. (2001); Godfrey et al. (2000); Cronin et al.(2004); y Mikhitarian et al. (2004).
En resumen, la precisión total del 78% del ensayo para seis tipos de tejido se compara favorablemente con otros estudios. Brown et al. (1997); DeYoung et al. (2000); Dennis et al. (2005a); Su et al. (2001); Ramaswamy et al. (2001); y Bloom et al. (2004).
Ejemplo 7
En este estudio se construyeron clasificadores usando carpetas de marcadores génicos eligiéndolos de MVO y usando este clasificador para predecir el tejido de origen y el estado del cáncer para cinco tipos de cáncer principales incluyendo mama, colon, pulmón, ovario y próstata. Se analizaron trescientos setenta y ocho canceres primarios, 23 lesiones epiteliales proliferativas benignas y 103 especímenes de tejido humano congelado rápidamente normales para sustraer la expresión génica enmascarada potencialmente por la co-expresión en células de fondo de leucocitos. Se desarrolló un método bioinformático basado en OMV nuevo para seleccionar las carpetas de marcadores génicos para tejido de origen y estado del cáncer. Los datos demostraron que un panel de 26 genes podría ser usado como un clasificador para predecir con precisión el tejido de origen y estado del cáncer entre los 5 tipos de cáncer. Por lo tanto se puede obtener un método de clasificación multi-cáncer determinando los perfiles de expresión génica de un número razonablemente pequeño de marcadores génicos. La Tabla 22 muestra los Marcadores identificados para los orígenes de tejido indicados. Para las descripciones génicas ver la Tabla 31.
Tabla 22
Tejido
SEQ ID NO: Nombre
Pulmón
59 SP-B
60
TTF1
61
DSG3
Páncreas
66 PSCA
67
F5
71
ITGB6
(continuada)
Tejido
SEQ ID NO: Nombre
72
TGM2
84
HNRPA0
Colon
85 HPT1
77
FABP1
78
CDX1
79
GUCY2C
Próstata
86 PSA
80
hKLK2
Mama
63 MGB1
81
PIP
64
PDEF
Ovario
82 HE4
83
PAX8
65
WT1
El conjunto de la muestra incluía un total de 299 muestras de carcinomas de colon, mama, páncreas, ovario, próstata, pulmón y otros metastásicos y cáncer primario de próstata. Se implementó el QC basado en evaluación histológica, el rendimiento de ARN y la expresión de beta-actina del gen de control. Otra categoría de muestras incluía metástasis originadas de carcinomas de estomago (5), riñón (6), colangio/vesícula biliar (4), hígado (2), cabeza y cuello (4), íleon (1) y un mesotelioma. La Tabla 23 resume los resultados.
35 Tabla 23
Tipo de tejido
Recogido QC Histologia QC Aislamiento ARN QC Punto de corte ACTB
Pulmón
41 37 36 25
Páncreas
6 3 57 49 41
Colon
4 5 42 42 31
Mama
40 35 35 34
Ovario
37 36 35 33
Próstata
2 7 27 25 19
Otros
4 6 34 29 23
Total
299 268 251 205
Probar las muestras anteriores resultó en la reducción del conjunto de Marcadores a los de la Tabla 24 con los resultados observados en la Tabla 25
Tabla 24
Tabla de Marcadores Finales
Pulmón
Proteína asociada a surfactante SP-B
factor de transcripción tiroideo 1
TTF1
desmogleína 3
DSG3
Páncreas
antígeno de células madre de próstata PSCA
(continuada)
Tabla de Marcadores Finales
factor de coagulación 5
F5
Colon
Transportador asociado a péptido intestinal HPT1
Próstata
prostate-specific antigen PSA
Mama
mamaglobina MGB
Factor de transcripción Ets
PDEF
Ovario
tumor de Wilms 1 WT1
Tabla 25
Cáncer
Muestras# Marcador Correctas % de Sens. Incorrectas % de Espec
Pulmón
25/180 SP-B 13/25 52 0/180 100
TTF
12/25 48 1/180 99
DSG3
5/25 20 0/180 100
Páncreas
41/164 PSCA 24/41 59 6/164 96
F5
6/41 15 4/164 98
Colon
31/174 HPT1 22/31 71 2/174 99
Mama
33/172 MGB 23/33 70 3/172 98
PDEF
16/3 48 1/172 99
Próstata
19/186 PSA 19/19 100 0/186 100
PDEF
19/19 100 2/186 99
Ovario
33/172 WT1 24/33 71 1/172 99
Total
205
Los resultados mostraron que de 205 tumores metastásicos embebidos en parafina; 166 muestras (81%) tenían resultados de ensayo conclusivos, Tabla 26.
Tabla 26
Candidato
Correctos Incorrectos Nº Precisión (%)
Pulmón
SP-B + TFF+DSG3 19 0 6 76
Páncreas
PSCA+F5 27 1 13 66
Colon
HPT1 24 2 5 78
Próstata
PSA 19 0 0 100
Mama
MGB + PDEF 23 3 7 70
Ovario
WT1 23 2 8 70
Otros
20 3 87
Total
155 11 39 76
De los resultados de falso positivo, muchos falsos se derivaron de tejidos histológicamente y embriológicamente similares, Tabla 27.
Tabla 27
ID de la muestra
Diagnóstico Previsto
OV_26
Ovario Mama
Br_24
Mama Colon
Br_37
Mama Colon
CRC_25
Colon Ovario
Pn_59
Páncreas Colon
Cont_27
Estomago páncreas
Cont_34
Estomago Colon
Cont_35
Estomago Colon
Cont_43
Conducto biliar Páncreas
Cont_44
Conducto biliar Páncreas
Cong_25
Hígado páncreas
25 Se consideraron los siguientes parámetros para el desarrollo del modelo:
Separar los Marcadores en conjuntos femeninos y masculinos y calcular la probabilidad de CUP de forma separada para pacientes masculinos y femeninos. El conjunto masculino incluía: SP_B, TTF1, DSG3, PSCA, F5, PSA, HPT1; el conjunto femenino incluía: SP_B, TTF1, DSG3, PSCA, F5, HPT1, MGB, PDEF, WT1. La expresión de fondo se excluyó de los resultados del ensayo: Pulmón: SP_B, TTF1, DSG3; Ovario: WT1; y Colon: HPT1.
El modelo CUP se ajusto a la prevalencia de CUP (5). pulmón 23, páncreas 16, colorrectal 9, mama 3, ovario 4, próstata 2, otros 43. La prevalencia de mama y ovario ajustada a 0% para pacientes masculinos, y la de 35 próstata ajustada a 0% para pacientes femeninos.
Se tomaron los siguientes pasos: colocar marcadores en escala similar; reducir el número de variables de 12 a 8 seleccionando el valor mínimo de cada conjunto específico de tejido; dejar fuera 1 muestra; construir el modelo de las muestras restantes; probar la muestra dejada fuera; repetir hasta que el 100% de las muestras estén probadas dejas fuera aleatoriamente ~50% de las muestras (~50% por tejido); construir el modelo de las muestras restantes; probar el ~50% de las muestras y repetir para 3 divisiones aleatorias diferentes.
La precisión de la clasificación se ajusto a la prevalencia de tipos de cáncer para producir los resultados resumidos en la Tabla 28 con los datos brutos mostrados en la Tabla 29. 45
Tabla 28
Mama
Colon Pulmón Otros Ovario Panc próstata Total Ajustado
Correcto
23 29 22 19 24 35 19 171
No Probado
3 2 2 2 3 0 12
Incorrecto
7 0 1 4 7 3 0 22
Prevalencia
0.03 0.09 0.23 0.43 0.04 0.16 0.02
Probado/total%
91 94 92 100 94 93 100 94 95
Correcto/total%
70 94 88 83 73 85 100 89 89
No Probado%
9 6 8 n/a 6 7 0 6 5
Correcto
23 25 19 20 20 24 19 150
No Probado%
7 6 5 10 15 0 43
Incorrecto
3 0 1 3 3 2 0 12
Prevalencia
0.03 0/09 0.23 0.43 0.04 0.16 0.02
Probado/total%
79 81 80 100 70 63 100 79 83
Correcto/total%
70 81 76 87 61 59 100 73 76
Correcto/probado %
88 100 95 87 87 92 100 93 91
No Probado%
21 19 20 n/a 30 37 0 21 17
55 5
Ejemplo 8
Estudio de la firma del gen prospectivo de cáncer metastásico de CUP con sitio primario desconocido para predecir el tejido de origen
El objetivo específico de este estudio era determinar la capacidad de la firma de 10 genes para predecir el tejido de origen de carcinoma metastásico en pacientes con carcinoma de primario desconocido (CUP).
Objetico primario: Confirmar la factibilidad de realizar un análisis génico de muestras de biopsia del núcleo en pacientes consecutivos con CUP.
Objetivo secundario: Correlacionar los resultados del ensayo de RT-PCR de la firma de 10 genes con el trabajo de diagnóstico hecho en el M.D. Anderson Cancer Center (MDACC). Tercer objetivo: Correlacionar la prevalencia de 6 tipos de cáncer previstos por ensayo con la prevalencia derivada de la bibliografía y la experiencia del MDACC.
El método descrito en la presente se usó para realizar un análisis de expresión génica de micromatrices de 700 carcinomas primarios congelados, y especímenes benignos y normales y candidatos a marcador génicos identificados, específicos para carcinomas de pulmón, páncreas, colon, mama, próstata y ovario. Los candidatos a marcador génico fueron probados por RT-PCR en 205 especímenes fijados en formalina, embebidos en parafina (FFPE) de carcinoma metastásico (Etapa III-IV) originados de pulmón, páncreas, colon, mama, ovario y próstata así como metástasis originadas de otros tipos de cáncer para el control de especificidad. Otros tipos de cáncer metastásico incluían carcinomas gástrico, de células renales, hepatocelular, colangio vesícula biliar y de cabeza y cuello. Los resultados permitieron seleccionar la firma de 10 genes que predijo el tejido de origen de carcinoma metastásico y dio una precisión total del 76%. El CV medio para mediciones repetidas en experimentos RT-PCR es del 1,5%, calculado en base a 4 puntos de datos replicados. La beta-actina (ACTB) se usó como gen doméstico y su expresión mediana fue similar en muestras metastásicas de origen diferente (CV=5,6%).
El objetivo específico para este estudio era validar la capacidad de la firma de 10 genes de predecir el tejido de origen de carcinoma metastásico en los pacientes CUP en comparación con el trabajo de diagnóstico exhaustivo.
Elegibilidad del Paciente
El paciente debe ser de al menos 18 años de edad con un estado de rendimiento ECOG de 0-2. Se aceptaron los pacientes con adenocarcinoma de diagnóstico o diagnóstico de carcinoma pobremente diferenciado. El grupo de pacientes con adenocarcinoma incluyo tumores, bien, moderadamente y pobremente diferenciados.
Los pacientes han cumplido los criterios para el CUP: sin primario detectado después de una evaluación completa que es definida como la historia completa y examen físico, examen de laboratorio detallado, estudios de imágenes y estudios invasivos de síntomas o dirigidos al sitio. Solo se permitieron pacientes no tratados en el estudio.
Si un paciente ha sido tratado con quimioterapia o radiación, la participación en el estudio se permite si hay tejido anterior (al tratamiento) disponible como bloques archivados dentro de un periodo temporal de 10 años.
Los pacientes proporcionaron consentimiento/autorización escrita para participar en este estudio.
Diseño del Estudio
A los pacientes con diagnóstico de CUP que han experimentado una biopsia de escisión o con aguja gruesa de la lesión metastásica más accesible se les permitió en el estudio. Los pacientes con una biopsia FNA sólo no fueron elegibles. Los primeros 60 pacientes presentados consecutivos que cumplieron con los criterios de inclusión y consintieron con el estudio fueron inscritos. Si se requiere biopsia repetida en el MDACC para propósitos de diagnóstico para su tratamiento, se obtuvo tejido adicional para el estudio si el paciente dio consentimiento. Todos los participantes fueron registrados en el protocolo en el institutional Protocol Data Management System (PDMS).
El trabajo de diagnóstico completo, incluyendo las evaluaciones clínicas y patológicas, se realizó en todos los pacientes inscritos de acuerdo con los estándares del MDACC. La parte de patología del trabajo de diagnóstico puede tener incluidos ensayos inmunohistoquímicos (IHC) con marcadores incluyendo CK-7, CK-20, TTF-1 y otros según se considere indicado por el patólogo. Esto es parte del trabajo rutinario de todos los pacientes que se presentan con CUP.
Recogida de la muestra de tejido
El estudio incluyo especímenes de carcinoma metastásico fijados en formalina, embebidos en parafina recogidos de pacientes con CUP.
Se usaron seis secciones de 10 µm para el aislamiento del ARN, especímenes de tejido más pequeños requerirán nueve secciones de 10 µm. El diagnóstico histopatológico y el contenido tumoral se confirmaron para cada muestra usada para el aislamiento del ARN en una sección adicional teñida con hematoxilina y eosina (HE). La muestra del tumor debería haber tenido un contenido tumoral mayor del 30% en la sección HE.
Los datos clínicos fueron suministrados de forma anónima a Veridex e incluyen la edad del paciente, el sexo, la histología del tumor mediante microscopía óptica, el grado tumoral (diferenciación), sitio de la metástasis, la fecha de obtención del espécimen, la descripción del trabajo de diagnóstico realizado para cada paciente individual.
Procesamiento del tejido y experimentos RT-PCR
Se extrajo el ARN total de cada muestra de tejido usando el protocolo descrito anteriormente. Sólo las muestras que produjeron más de 1 µm de ARN total de la cantidad estándar de tejido se usaron para pruebas de RT-PCR posteriores. Las muestras con menos rendimiento de ADN se consideraron degradadas y excluidas de experimentos posteriores. Se implemento el control de integridad del ARN en base a la expresión doméstica para excluir las muestras con ARN degradado, de acuerdo con el procedimiento Veridex estándar.
El ensayo RT-PCR que incluye el panel de 10 genes y 1-2 genes de control se usó para el análisis de las muestras de ARN. La transcripción inversa y el ensayo PCR se completaron usando los protocolos descritos anteriormente.
El valor de la expresión relativa para cada gen probado presentado como ∆Ct, que es igual al CT del gen objetivo sustraído por Ct de los genes de control, se calculó y usó para la predicción del tejido de origen.
Tamaño de la muestra e interpretación de datos
Se estudió un tamaño de la muestra limitado de 60 pacientes debido a la naturaleza exploratoria del estudio piloto. Hasta la fecha, se han probado 22 pacientes. Una de las muestras de pacientes no consiguió producir suficiente ARN para la prueba RT-PCR y 3 no consiguieron pasar el control de calidad evaluado por el RE-PCR con los genes de control. Se usaron un total de 18 pacientes para determinar la probabilidad de lesión metastásica del paciente.
El modelo estadístico se usó para determinar la probabilidad del tejido de origen del carcinoma metastásico de la siguientes siete categorías: pulmón, páncreas, colon, mama, próstata, ovario y sin prueba (otros). Para cada muestra, las probabilidades para cada categoría se calculan de un modelo de clasificación lineal. Los resultados del ensayo se resumen en la Tabla 30.
La probabilidad de una lesión metastásica del paciente (con primarios conocidos) proviniendo de un estos 6 sitios (colon, páncreas, pulmón, próstata, ovario, mama) es de alrededor del 76%. Este número está derivado de la bibliografía dada la incidencia de varios cánceres y potencial de esparcimiento y datos no publicados generados en el M.D. Anderson de registros tumorales. Para las muestras probadas, la prevalencia de los 6 sitios fue del 67% (12 de 18 muestras probadas), que es muy consistente con observaciones anteriores.
Tabla 30
Datos del paciente
Probabilidad posterior de ToO (%)
ID
M/F predicción Mama Colon Pulmón PulmónSCC Otro Ovario Páncreas próstata
1
M Otro 0.00 0.00 0.81 0.00 98.68 0.00 0.51 0.00
4
F Colon 0.00 99.70 0.00 0.00 0.09 0.20 0.01 0.00
5
M Pulmón 0.00 33.29 52.27 0.01 13.30 0.00 1.13 0.00
6
F Colon 0.00 99.91 0.00 0.00 0.09 0.00 0.00 0.00
2
M Colon 0.00 93.19 0.01 0.00 2.90 0.00 3.90 0.00
10
F Otro 0.02 2.04 0.03 0.03 61.43 1.12 35.34 0.00
16
F Colon 0.00 48.59 0.01 1.57 47.62 0.17 2.05 0.00
22
M PulmónSCC 0.00 8.85 0.01 71.69 11.84 0.00 7.62 0.00
23
M Colon 0.00 99.27 0.01 0.00 0.72 0.00 0.00 0.00
24
F Colon 0.00 90.59 0.00 0.00 2.36 0.00 7.04 0.00
26
F Pulmón 0.00 0.00 99.93 0.00 0.06 0.00 0.01 0.00
17
M Otro 0.00 0.07 0.02 0.09 94.06 0.00 5.77 0.00
19
F Otro 0.02 0.11 0.04 0.22 76.36 23.24 0.01 0.00
21
F Páncreas 0.00 6.97 0.00 0.00 2.37 8.43 82.23 0.00
27
F Otro 0.00 0.04 0.04 0.59 99.06 0.14 0.13 0.00
11
M Otro 0.00 0.23 0.07 0.09 99.52 0.00 0.09 0.00
32
F Ovario 0.00 0.01 0.00 0.00 7.23 92.63 0.13 0.00
34
M PulmónSCC 0.00 0.03 0.00 65.64 7.96 0.00 26.38 0.00
3
F Fallo ctr 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00
8
M Fallo ctr 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00
20
F Fallo ctr 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00
Aunque la invención anterior se ha descrito con cierto detalle a modo de ilustración y ejemplo para propósitos de claridad de comprensión, las descripciones y ejemplos no deben interpretarse como limitantes del 45 ámbito de la invención.
Tabla 31
Nombre
SEQ ID NOs Acceso Descripción
CDH17
62 NM_004063 Cadherina 17
CDX1
78 NM_001804 Factor de transcripción de caja homeopática 1
DSG3
61/3 NM_001944 Desmogleína 3
F5
67/6 NM_000130 Factor de coagulación V
FABP1
71 NM_001443 Proteína de Unión de Ácidos grasos 1, hígado
GUCY2C
79 NM_004963 Guanilato ciclasa 2C
HE4
82 NM_006103 Marcador de carcinoma de ovario Putativo
KLK2
80 BC005196 Calicreína 2, de próstata
HNRPA0
84 NM_006805 Ribonucleoproteína nuclear heterogénea A0
(continuada)
55 5
HPT1
85/4 U07969 Transportador asociado a péptidos intestinal
ITGB6
71 NM_000888 Integrina, beta 6
KLK3
68 NM_001648 Calicreína 3
MGB1
63/7 NM_002411 Mamaglobina 1
PAX8
83 BC001060 Gen de caja emparejado 8
PBGD
70 NM_000190 Hidroximetilbilano sintasa
PDEF
64/8 NM_012391 Factor de transcripción Ets que contiene el dominio
PIP
81 NM_002652 Proteína inducida por prolactina
PSA
86/9 U17040 Precursor del antígeno específico de la próstata
PSCA
66/5 NM_005672 Antígeno de células madre de próstata
SP-B
59/1 NM_198843 Proteína B asociada a surfactante pulmonar
TGM2
72 NM_004613 Transglutaminasa 2
TTF1
60/2 NM_003317 Similar al factor de transcripción tiroideo 1
WT1
65/10 NM_024426 Tumor de Wilms 1
β-actina
69 NM_001101
β-actina
KRT6F
87 L42612 Isoforma de queratina 6
p73H
88 AB010153 Proteína p53-relacionada
SFTPC
89 NM_003018 Proteína C asociada al pulmón, surfactante
KLK10
90 NM_002776 Calicreína 10
CLDN18
91 NM_016369 Claudina 18
TR10
92 BD280579 Receptor del factor de necrosis tumoral
B305D
93
B726
94
GABA-pi
95 BC109105 Receptor del ácido gamma-aminobutírico A, pi
StAR
96 NM_01007243 regulador agudo esteroidogénico
EMX2
97 NM_004098 homólogo de espiráculos vacío 2 (Drosophila)
NGEP
98 AY617079 Variante larga de NGEP
NPY
99 NM_000905 Neuropéptido Y
SERPINA1
100 NM_000295 inhibidor de peptidasa serpina, miembro 1 de clado A
KRT7
101 NM_005556 queratina 7
MMP11
102 NM_005940 metalopeptidasa de la matriz 11 (estromalisina 3)
MUC4
103 NM_018406 Mucina 4 asociada a la superficie celular
FLJ22041
104 AK025694
BAX
105 NM_138763 ∆ de la variante de transcripción de proteínas X asociada a BCL2
PITX1
106 NM_002653 Factor trans del homeodominio tipo emparejado 1
MGC:10264
107 BC005807 estearoil-CoA desaturasa (∆-9-desaturasa)
REFERENCIAS
Publicaciones de solicitudes de patentes y patentes US
5242974 5700637 20030194733 5350840 5786148 20030198970 5384261 6004755 20030215803 5405783 6136182 20030215835 5412087 6218114 20030219760 5424186 6218122 20030219767 5429807 6225051 20030232350 5436327 6232073 20030235820 5445934 6261766 20040005563 5472672 6271002 20040009154 5527681 6339148 20040009489 5529756 20010029020 20040018969 5532128 20020055627 20040029114 5545531 20020068288 20040076955 5554501 20020168647 20040126808 5556752 20030044859 20040146862 5561071 20030087818 20040219572 5571639 20030104448 20040219575 5593839 20030124128 20050037010 5599695 20030124579 20050059008 5624711 20030138793 20060094035
5658734 20030190656
Publicaciones de patentes y patentes extranjeras
WO1998040403
WO2001073032 WO2004030615
WO1998056953
WO2002046467 WO2004031412
WO2000006589
WO2002073204 WO2004063355
WO2000055320
WO2002101357 WO2004077060
WO2001031342
WO2004018999 WO2005005601
Artículos de revistas
Abrahamsen et al. (2003) Towards quantitative mRNA analysis in paraffin-embedded tissues using real-time reverse transcriptase-polymerase chain reaction J Mol Diag 5:34-41 Al-Mulla et al. (2005) BRCA1 gene expression in breast cancer: a correlative study between real-time RT-PCR and immunohistochemistry J Histochem Cytochem 53:621-629 Argani et al. (2001) Discovery of new Markers of cancer through serial analysis of gene expression: prostate stem cell antigen is overexpressed in pancreatic adenocarcinoma Cancer Res 61:4320-4324 Autiero et al. (2002) Intragenic amplification and formation of extrachromosomal small circular DNA molecules from the PIP gene on chromosome 7 in primary breast carcinomas Int J Cancer 99:370-377 Backus et al. (2005) Identification and characterization of optimal gene expression Markers for detection of breast cancer metastasis J Mol Diagn 7:327-336 Bentov et. al. (2003) The WT1 Wilms’ tumor suppressor gene: a novel target for insulin-like growth factor-I action Endocrinol 144:4276-4279 Bera et al. (2004) NGEP, a gene encoding a membrane protein detected only in prostate cancer and normal prostate Proc Natl Acad Sci USA 101:3059-3064 Bibikova et al (2004) Quantitative gene expression profiling in formalinfixed, paraffin-embedded tissues using universal bead arrays Am j Pathol 165:1799-1807 Bloom et al. (2004) Multi-platform, multi-site, microarray-based human tumor classification Am J Pathol 164:9-16 Borchers et al. (1997) Heart-type fatty acid binding protein -involvement in growth inhibition and differentiation Prostaglandins Leukot Essent Fatty Acids 57:77-84 Borgono et al. (2004) Human tissue kallikreins: physiologic roles and applications in cancer Mol Cancer Res 2:257-280 Brookes (1999) The essence of SNPs Gene 23:177-186 Brown et al. (1997) Immunohistochemical identification of tumor Markers in metastatic adenocarcinoma. A diagnostic adjunct in the determination of primary site Am J Clin Pathol 107:12-19 Buckhaults et al. (2003) Identifying tumor origin using a gene expression-based classification map Cancer Res 63:4144-4149 Chan et al. (1985) Human liver fatty acid binding protein cDNA and amino acid sequence. Functional and volutionary implications J Biol Chem 260:2629-2632 Chen et al. (1986) Human liver fatty acid binding protein gene is located on chromosome 2 Somat Cell Mol Genet 12:303-306 Cheung et al. (2003) Detection of the PAX8-PPAR gamma fusion oncogene in both follicular thyroid carcinomas and adenomas J Clin Endocrinol Metab 88:354-357 Clark et al. (1999)
The potential role for prolactin-inducible protein (PIP) as a Marker of human breast cancer micrometastasis Br J Cancer 81:1002-1008 Cronin et al. (2004) Measurement of gene expression in archival paraffin-embedded tissue Am J Pathol 164:35-42 Cunha et al. (2006) Tissue-specificity of prostate specific antigens: Comparative analysis of transcript levels in prostate and non-prostatic tissues Cancer Lett 236:229-238 Dennis et al. (2002) Identification from public data of molecular Markers of adenocarcinoma characteristic of the site of origin Can Res 62:5999-6005 Dennis et al. (2005a) Hunting the primary: novel strategies for defining the origin of tumors J Pathol 205:236-247 Dennis et al. (2005b) Markers of adenocarcinoma characteristic of the site of origin: development of a diagnostic algorithm Clin Can Res 11:3766-3772 DeYoung et al. (2000) Immunohistologic evaluation of metastatic carcinomas of unknown origin: an algorithmic approach Semin Diagn Pathol 17:184-193 Di Palma et al. (2003) The paired domain-containing factor Pax8 and the homeodomain-containing factor TTF-1 directly interact and synergistically activate transcription Biol Chem 278:3395-3402 Dwight et al. (2003) Involvement of the PAX8 peroxisome proliferator-activated receptor gamma rearrangement in follicular thyroid tumors J Clin Endocrinol Metab 88:4440-4445 Feldman et al. (2003) PDEF expression in human breast cancer is correlated with invasive potential and altered gene expression Cancer Res 63:4626-4631 Fleming et al. (2000) Mammaglobin, a breast-specific gene, and its utility as a Marker for breast cancer Ann N Y Acad Sci 923:78-89 Fukushima et al. (2004) Characterization of gene expression in mucinous cystic neoplasms of the pancreas using oligonucleotide microarrays Oncogene 23:9042-9051 Ghosh et al (2005) Management of patients with metastatic cancer of unknown primary Curr Probl Surg 42:12-66 Giordano et al. (2001) Organ-specific molecular classification of primary lung, colon, and ovarian adenocarcinomas using gene expression profiles Am J Pathol.159:1231-1238 Glasser et al (1988) cDNA, deduced polypeptide structure and chromosomal assignment of human pulmonary surfactant proteolipid, SPL(pVal) J Biol Chem 263:9-12 Godfrey et al. (2000) Quantitative mRNA expression analysis from formalin-fixed, paraffin-embedded tissues using 5’ nuclease quantitative reverse transcription-polymerase chain reaction J Mol Diag 2:84-91 Goldstein et al. (2002) WT1 immunoreactivity in uterine papillary serous carcinomas is different from ovarian serous carcinomas Am J Clin Pathol 117:541-545 Gradi et al. (1995) The human steroidogenic acute regulatory (StAR) gene is expressed in the urogenital system and encodes a mitochondrial polypeptide Biochim Biophys Acta 1258:228-233 Greco et al. (2004) Carcinoma of unknown primary site: sequential treatment with paclitaxel/carboplatin/etoposide and gemcitabine/irinotecan: A Minnie Pearl cancer research network phase II trial The Oncologist 9:644-652 Haas et al. (2005) Combined application of RT-PCR and immunohistochemistry on paraffin embedded sentinel lymph nodes of prostate cancer patients Pathol Res Pract 200:763-770 Hwang et al. (2004) Wilms tumor gene product: sensitive and contextually specific Marker of serous carcinomas of ovarian surface epithelial origin Appl Immunohistochem Mol Morphol 12:122-126 Ishikawa et al. (2005) Experimental trial for diagnosis of pancreatic ductal carcinoma based on gene expression profiles of pancreatic ductal cells Cancer Sci 96:387-393 Italiano et al. (2005) Epidermal growth factor receptor (EGFR) status in primary colorectal tumors correlates with EGFR expression in related metastatic sites: biological and clinical implications Ann Oncol 16:1503-1507 Jones et al. (2004) Comprehensive analysis of matrix metalloproteinase and tissue inhibitor expression in pancreatic cancer: increased expression of matrix metalloproteinase-7 predicts poor survival Clin Cancer Res 10:2832-2845 Jones et al. (2005) Thyroid transcription factor 1 expression in small cell carcinoma of the urinary bladder: an immunohistochemical profile of 44 cases Hum Pathol 36:718-723 Khoor et al. (1997) Expression of surfactant protein B precursor and surfactant protein B mRNA in adenocarcinoma of the lung Mod Pathol 10:62-67 Kim (2003) Comparison of oligonucleotide-microarray and serial analysis of gene expression (SAGE) in transcript profiling analysis of megakaryocytes derived from CD34+ cells Exp Mol Med 35:460-466 Kim et al. (2003) Steroidogenic acute regulatory protein expression in the normal human brain and intracranial tumors Brain Res 978:245-249 Lam et al. (2005) Prostate stem cell antigen is overexpressed in prostate cancer metastases Clin Can Res 11:25912596 Lembersky et al. (1996) Metastases of unknown primary site Med Clin North Am. 80:153-171 Lewis et al. (2001) Unlocking the archive-gene expression in paraffin-embedded tissue J Pathol 195:66-71 Lipshutz et al. (1999) High density synthetic oligonucleotide arrays Nature Genetics 21:S20-24 Lowe et al. (1985) Human liver fatty acid binding protein. Isolation of a full length cDNA and comparative sequence analyses of orthologous and paralogous proteins J Biol Chem 260:3413-3417 Ma et al. (2006) Molecular classification of human cancers using a 92-gene real-time quantitative polymerase chain reaction assay Arch Pathol Lab med 130:465-473 Magklara et al. (2002) Characterization of androgen receptor and nuclear receptor co-regulator expression in human breast cancer cell lines exhibiting differential regulation of kallikreins 2 and 3 Int J Cancer 100:507-514 Markowitz (1952) Portfolio Selection J Finance 7:77-91
Marques et al. (2002) Expression of PAX8-PPAR gamma 1 rearrangements in both follicular thyroid carcinomas and adenomas J Clin Endocrinol Metab 87:3947-3952 Masuda et al. (1999) Analysis of chemical modification of RNA from formalin-fixed samples and optimization of molecular biology applications for such samples Nucl Acids Res 27:4436-4443 McCarthy et al. (2003) Novel Markers of pancreatic adenocarcinoma in fine-needle aspiration: mesothelin and prostate stem cell antigen labeling increases accuracy in cytologically borderline cases Appl Immunohistochem Mol Morphol 11:238-243 Mikhitarian et al. (2004) Enhanced detection of RNA from paraffin-embedded tissue using a panel of truncated gene-specific primers for reverse transcription BioTechniques 36:1-4 Mintzer et al. (2004) Cancer of unknown primary: changing approaches, a multidisciplinary case presentation from the Joan Karnell Cancer Center of Pennsylvania Hospital The Oncologist 9:330-338 Moniaux et al. (2004) Multiple roles of mucins in pancreatic cancer, a lethal and challenging malignancy Br J Cancer 91:1633-1638 Murphy et al. (1987) Isolation and sequencing of a cDNA clone for a prolactin-inducible protein (PIP). Regulation of PIP gene expression in the human breast cancer cell line, T-47D J Biol Chem 262:15236-15241 Myal et al. (1991) The prolactin-inducible protein (PIPGCDFP-15) gene: cloning, structure and regulation J Mol Cell Endocrinol 80:165-175 Nakamura et al. (2002) Expression of thyroid transcription factor-1 in normal and neoplastic lung tissues Mod Pathol 15:1058-1067 Noonan et al. (2001) Characterization of the homeodomain gene EMX2: sequence conservation, expression analysis, and a search for mutations in endometrial cancers Genomics 76:37-44 Oettgen et al. (2000) PDEF, a novel prostate epithelium-specific Ets transcription factor, interacts with the androgen receptor and activates prostate-specific antigen gene expression J Biol Chem 275:1216-1225 Oji et al. (2003) Overexpression of the Wilms’ tumor gene WT1 in head and neck squamous cell carcinoma Cancer Sci 94:523-529 Pavlidis et al. (2003) Diagnostic and therapeutic management of cancer of an unknown primary Eur J Can 39: 9902005 Pilot-Mathias et al. (1989) Structure and organization of the gene encoding human pulmonary surfactant proteolipid SP-B DNA 8:75-86 Pilozzi et al. (2004) CDX1 expression is reduced in colorectal carcinoma and is associated with promoter hypermethylation J Pathol 204:289-295 Poleev et al. (1992) PAX8, a human paired box gene: isolation and expression in developing thyroid, kidney and Wilms’ tumors Development 116:611-623 Prasad et al. (2005) Gene expression profiles in pancreatic intraepithelial neoplasia reflect the effects of Hedgehog signaling on pancreatic ductal epithelial cells Cancer Res 65:1619-1626 Ramaswamy (2004) Translating cancer genomics into clinical oncology N Engl J Med 350:1814-1816 Ramaswamy et al. (2001) Multiclass cancer diagnosis using tumor gene expression signatures Proc Natl Acad Sci USA 98:15149-15154 Rauscher (1993) The WT1 Wilms tumor gene product: a developmentally regulated transcription factor in the kidney that functions as a tumor suppressor FASEB J 7:896-903 Reinholz et al. (2005) Evaluation of a panel of tumor Markers for molecular detection of circulating cancer cells in women with suspected breast cancer Clin Cancer Res 11:3722 Schlag et al. (1994) Cancer of unknown primary site Ann Chir Gynaecol 83:8-12 Senoo et al. (1998) A second p53-related protein, p73L, with high homology to p73 Biochem Biophys Res Comm 248:603-607 Specht et al. (2001) Quantitative gene expression analysis in microdissected archival formalin-fixed and paraffinembedded tumor tissue Amer J Pathol 158:419-429 Su et al. (2001) Molecular classification of human carcinomas by use of gene expression signatures Cancer Res 61:7388-7393 Takahashi et al. (1995) Cloning and characterization of multiple human genes and cDNAs encoding highly related type II keratin 6 isoforms J Biol Chem 270:18581-18592 Takamura et al. (2004) Reduced expression of liver-intestine cadherin is associated with progression and lymph node metastasis of human colorectal carcinoma Cancer Lett 212:253-259 Tothill et al. (2005) An expression-based site of origin diagnostic method designed for clinical application to cancer of unknown origin Can Res 65:4031-4040 van Ruissen et al. (2005) Evaluation of the similarity of gene expression data estimated with SAGE and Affymetrix GeneChips BMC Genomics 6:91 Varadhachary et al. (2004) Diagnostic strategies for unknown primary cancer Cancer 100:1776-1785 Venables et al. (2002) Modern Applied Statistics with S. Fourth edition. Springer Wallace et al. (2005) Accurate Molecular detection of non-small cell lung cancer metastases in mediastinal lymph nodes sampled by endoscopic ultrasound-guided needle aspiration Cest 127:430-437 Wan et al. (2003) Desmosomal proteins, including desmoglein 3, serve as novel negative Markers for epidermal stem cell-containing population of keratinocytes J Cell Sci 116:4239-4248 Watson et al. (1996) Mammaglobin, a mammary-specific member of the uteroglobin gene family, is overexpressed in human breast cancer Cancer Res 56:860-865 Watson et al. (1998) Structure and transcriptional regulation of the human mammaglobin gene, a breast cancer associated member of the uteroglobin gene family localized to chromosome 11q13 Oncogene 16:817-824
Weigelt et al. (2003) Gene expression profiles of primary breast tumors maintained in distant metastases Proc Natl Acad Sci USA 100:15901-15905 Zapata-Benavides et al. (2002) Downregulation of Wilms’ tumor 1 protein inhibits breast cancer proliferation Biochem Biophys Res Commun 295:784-790
5 LISTADO DE SECUENCIAS
<110> Veridex, LLC
<120> Métodos y Materiales para Identificar el origen de un Carcinoma de origen Primario Desconocido
<130> P054566EP
<150> US60/718,501 15 <151> 2005-09-19
<150> US60/725,680
<151> 2005-10-12
<160> 107
<170> PatentIn version 3.3
<210> 1 25 <211> 476
<212> ADN
<213> Homo sapiens
<400> 1
<210> 2
<211> 493
<212> ADN
<213> Homo sapiens
<400> 2
<210> 3
<211> 545
<212> ADN
<213> Homo sapiens
<400> 3
<210> 4 45 <211> 284
<212> ADN
<213> Homo sapiens
<400> 4
<210> 5
<211> 394
<212> ADN
<213> Homo sapiens
<220>
<221> misc_feature
<222> (58)..(58)
<223>n es a,c,g, o t
<220>
<221> misc_feature
<222> (95)..(95)
<223>n es a,c,g, o t
<220>
<221> misc_feature
<222> (99)..(99)
<223>n es a,c,g, o t
<220>
<221> misc_feature
<222> (119)..(119)
<223>n es a,c,g, o t
<220>
<221> misc_feature
<222> (123)..(123)
<223>n es a,c,g, o t
<220>
<221> misc_feature
<222> (130)..(130)
<223>n es a,c,g, o t
<220>
<221> misc_feature
<222> (151)..(151)
<223>n es a,c,g, o t
<220>
<221> misc_feature
<222> (155)..(155)
<223>n es a,c,g, o t
<220>
<221> misc_feature
<222> (161)..(161)
<223>n es a,c,g, o t
<220>
<221> misc_feature
<222> (212)..(212)
<223>n es a,c,g, o t
<400> 5
15 <210> 6
<211> 470
<212> ADN
<213> Homo sapiens
<220>
<221> misc_feature
<222> (61)..(61)
<223>n es a,c,g, o t
25 <220>
<221> misc_feature
<222> (82)..(82)
<223>n es a,c,g, o t
<400> 6
<210> 7
<211> 396
<212> ADN
<213> Homo sapiens
<400> 7
<210> 8 15 <211> 491
<212> ADN
<213> Homo sapiens
<400> 8
<210> 9
<211> 265
<212> ADN
<213> Homo sapiens
<400> 9
55 <210> 10
<211> 441
<212> ADN
<213> Homo sapiens
<400> 10
<210> 11
<211> 21
<212> ADN
<213> Homo sapiens
<400> 11 cacagccccg acctttgatg a 21
<210> 12 25 <211> 19
<212> ADN
<213> Homo sapiens
<400> 12 ggtcccagag cccgtctca 19
<210> 13
<211> 26
<212> ADN 35 <213> Homo sapiens
<400> 13 agctgtccag ctgcaaagga aaagcc 26
<210> 14
<211> 75
<212> ADN
<213> Homo sapiens
45 <400> 14
<210> 15
<211> 17
<212> ADN 55 <213> Homo sapiens
<400> 15 ccaacccaga cccgcgc 17
<210> 16
<211> 21
<212> ADN
<213> Homo sapiens
65 <400> 16
cgcccatgcc gctcatgttc a 21
<210> 17
<211> 21 5 <212> ADN
<213> Homo sapiens
<400> 17 cccgccatct cccgcttcat g 21
<210> 18
<211> 78
<212> ADN
<213> Homo sapiens 15
<400> 18
25
<210> 19 <211> 23 <212> ADN <213> Homo sapiens
<400> 19 gagagaagga gaagataact caa 23
35
<210> 20 <211> 22 <212> ADN <213> Homo sapiens <400> 20 actccagaga ttcggtaggt ga 22
<210> 21 <211> 26 <212> ADN <213> Homo sapiens
45
<400> 21 attgccaaga ttacttcaga ttacca 26
<210> 22 <211> 97 <212> ADN <213> Homo sapiens
<400> 22
55
<210> 23
<211> 21
<212> ADN
<213> Homo sapiens
<400> 23 tccctcggca gtggaagctt a 21
15 <210> 24
<211> 24
<212> ADN
<213> Homo sapiens
<400> 24 tcctcaaact ctgtgtgcct ggta 24
<210> 25
<211> 29 25 <212> ADN
<213> Homo sapiens
<400> 25 ccaaaatcaa tggtactcat gcccgactg 29
<210> 26
<211> 95
<212> ADN
<213> Homo sapiens 35
<400> 26
<210> 27
<211> 21 45 <212> ADN
<213> Homo sapiens
<400> 27 agttgctgat ggtcctcatg c 21
<210> 28
<211> 24
<212> ADN
<213> Homo sapiens 55
<400> 28 cacttgtgga ttgattgtct tgga 24
<210> 29
<211> 23
<212> ADN
<213> Homo sapiens
<400> 29 ccctctccca gcactgctac gca 23
<210> 30
<211> 107
<212> ADN
<213> Homo sapiens
<400> 30
<210> 31
<211> 20
<212> ADN
<213> Homo sapiens
<400> 31 25 cgcccacctg gacatctgga 20
<210> 32
<211> 23
<212> ADN
<213> Homo sapiens
<400> 32 cactggtcga ggcacagtag tga 23
35 <210> 33
<211> 25
<212> ADN
<213> Homo sapiens
<400> 33 gtcagcggcc tggatgaaag agcgg 25
<210> 34
<211> 86 45 <212> ADN
<213> Homo sapiens
<400> 34
55 <210> 35
<211> 23
<212> ADN
<213> Homo sapiens
<400> 35 gcggagccca atacagaata cac 23
<210> 36 5 <211> 19
<212> ADN
<213> Homo sapiens
<400> 36 cggggctact ccaggcaca 19
<210> 37
<211> 25
<212> ADN 15 <213> Homo sapiens
<400> 37 tcagaggcat tcaggatgtg cgacg 25
<210> 38
<211> 80
<212> ADN
<213> Homo sapiens
25 <400> 38
<210> 39
<211> 20
<212> ADN 35 <213> Homo sapiens
<400> 39 ctgttgatgg caggcttggc 20
<210> 40
<211> 20
<212> ADN
<213> Homo sapiens
45 <400> 40 ttgctcacct gggctttgca 20
<210> 41
<211> 21
<212> ADN
<213> Homo sapiens
<400> 41
gcagccaggc actgccctgc t 21 55
<210> 42
<211> 74
<212> ADN
<213> Homo sapiens
<400> 42
5
<210> 43 <211> 25 <212> ADN <213> Homo sapiens
<400> 43 tgaagaaata tcctgggatt attca 25
15
<210> 44 <211> 27 <212> ADN <213> Homo sapiens
<400> 44 tatgtggtat cttctggaat atcatca 27
25
<210> 45 <211> 27 <212> ADN <213> Homo sapiens <400> 45 acaaagggaa acagatattg aagactc 27
<210> 46 <211> 87 <212> ADN <213> Homo sapiens
35
<400> 46
<210> 47
<211> 19
<212> ADN
<213> Homo sapiens 45
<400> 47 cccccagtgg gtcctcaca 19
<210> 48
<211> 22
<212> ADN
<213> Homo sapiens
<400> 48 55 aggatgaaac aagctgtgcc ga 22
<210> 49
<211> 26
<212> ADN
<213> Homo sapiens
<400> 49 caggaacaaa agcgtgatct tgctgg 26
<210> 50
<211> 82
<212> ADN
<213> Homo sapiens
<400> 50
<210> 51
<211> 19
<212> ADN
<213> Homo sapiens
25 <400> 51 gccctgaggc actcttcca 19
<210> 52
<211> 22
<212> ADN
<213> Homo sapiens
<400> 52
cggatgtcca cgtcacactt ca 22 35
<210> 53
<211> 25
<212> ADN
<213> Homo sapiens
<400> 53 cttccttcct gggcatggag tcctg 25
<210> 54 45 <211> 100
<212> ADN
<213> Homo sapiens
<400> 54
<210> 55
<211> 22
<212> ADN
<213> Homo sapiens
<400> 55 ccacacacag cctactttcc aa 22
<210> 56
<211> 21
<212> ADN
<213> Homo sapiens
<400> 56 tacccacgcg aatcactctc a 21
<210> 57
<211> 27
<212> ADN
<213> Homo sapiens
<400> 57 aacggcaatg cggctgcaac ggcggaa 27
<210> 58
<211> 103
<212> ADN
<213> Homo sapiens
<400> 58
<210> 59
<211> 2724
<212> ADN
<213> Homo sapiens
<400> 59
<210> 60
<211> 2352
<212> ADN
<213> Homo sapiens
<400> 60
<210> 61
<211> 3336
<212> ADN
<213> Homo sapiens
<400> 61
<210> 62
<211> 3697
<212> ADN
<213> Homo sapiens
<400> 62
<210> 63
<211> 503
<212> ADN
<213> Homo sapiens
<400> 63
<210> 64
<211> 1894
<212> ADN
<213> Homo sapiens
<400> 64 <210> 65
<211> 3029
<212> ADN
<213> Homo sapiens
<400> 65
<210> 66
<211> 1064
<212> ADN
<213> Homo sapiens
<400> 66
<210> 67
<211> 6962
<212> ADN
<213> Homo sapiens
<400> 67
<210> 68
<211> 1464
<212> ADN
<213> Homo sapiens
<400> 68 <210> 69
<211> 1793
<212> ADN
<213> Homo sapiens
<400> 69 <210> 70
<211> 1526
<212> ADN
<213> Homo sapiens
<400> 70 <210> 71
<211> 2397
<212> ADN
<213> Homo sapiens
<400> 71
<210> 72
<211> 2118
<212> ADN
<213> Homo sapiens
<400> 72
<210> 73
<211> 2832
<212> ADN
<213> Homo sapiens
<400> 73
<210> 74
<211> 1607
<212> ADN
<213> Homo sapiens
<400> 74
<210> 75
<211> 1753
<212> ADN
<213> Homo sapiens
<400> 75 <210> 76
<211> 2255
<212> ADN
<213> Homo sapiens
<400> 76
<210> 77
<211> 462
<212> ADN
<213> Homo sapiens
<400> 77
<210> 78
<211> 2108
<212> ADN
<213> Homo sapiens
<400> 78
<210> 79
<211> 3745
<212> ADN
<213> Homo sapiens
<400> 79
<210> 80
<211> 901
<212> ADN
<213> Homo sapiens
<400> 80 <210> 81
<211> 618
<212> ADN
<213> Homo sapiens
<400> 81
<210> 82
<211> 594
<212> ADN
<213> Homo sapiens
<400> 82
<210> 83
<211> 1372
<212> ADN
<213> Homo sapiens
<400> 83 <210> 84
<211> 2983
<212> ADN
<213> Homo sapiens
<400> 84
<210> 85
<211> 3345
<212> ADN
<213> Homo sapiens
<400> 85
<210> 86
<211> 990
<212> ADN
<213> Homo sapiens
<400> 86 <210> 87
<211> 1805
<212> ADN
<213> Homo sapiens
<400> 87 <210> 88
<211> 2820
<212> ADN
<213> Homo sapiens
<400> 88
<210> 89
<211> 991
<212> ADN
<213> Homo sapiens
<400> 89 <210> 90
<211> 1580
<212> ADN
<213> Homo sapiens
<400> 90 <210> 91
<211> 3359
<212> ADN
<213> Homo sapiens
<400> 91
<210> 92
<211> 733
<212> ADN
<213> Homo sapiens
<400> 92
<210> 93
<211> 1076
<212> ADN
<213> Homo sapiens
<400> 93 <210> 94
<211> 3675
<212> ADN
<213> Homo sapiens
<400> 94
<210> 95
<211> 2658
<212> ADN
<213> Homo sapiens
<400> 95
<210> 96
<211> 2531
<212> ADN
<213> Homo sapiens
<400> 96
<210> 97
<211> 6164
<212> ADN
<213> Homo sapiens
<220>
<221> misc_feature
<222> (2851)..(2851)
<223>n is a,c,g, ort
<220>
<221> misc_feature
<222> (2856)..(2856)
<223>n es a,c,g, o t
<400> 97
<210> 98
<211> 551
<212> ADN
<213> Homo sapiens
<400> 98
<210> 99
<211> 1607
<212> ADN
<213> Homo sapiens
<400> 99 <210> 100
<211> 1753
<212> ADN
<213> Homo sapiens
<400> 100 <210> 101
<211> 2276
<212> ADN
<213> Homo sapiens
<400> 101
<210> 102
<211> 7381
<212> ADN
<213> Homo sapiens
<400> 102
<210> 103
<211> 2323
<212> ADN
<213> Homo sapiens
<400> 103
<210> 104
<211> 741
<212> ADN
<213> Homo sapiens
<400> 104 <210> 105
<211> 2373
<212> ADN
<213> Homo sapiens
<400> 105
<210> 106
<211> 1314
<212> ADN
<213> Homo sapiens
<400> 106 <210> 107
<211> 476
<212> ADN
<213> Homo sapiens
<400> 107

Claims (13)

  1. Reivindicaciones
    1. Un método de identificar el origen de una metástasis de origen desconocido que comprende los pasos de
    a.
    medir los Biomarcadores asociados con al menos seis carcinomas diferentes en una muestra que contiene células metastásicas en donde los Biomarcadores son niveles de expresión de al menos los genes Marcadores siguientes: SP-B, TTF1, DSG3, PSCA, F5, HPT1, PSA, MGB/MG, WT1 y PDEF;
    b.
    combinar los datos de los Biomarcadores en un algoritmo donde el algoritmo
    i. normaliza los Biomarcadores frente a la referencia; y
    ii. impone un punto de corte que optimiza la sensibilidad y especificidad de cada Biomarcador, pondera la prevalencia de los carcinomas y selecciona un tejido de origen;
    c.
    determinar el origen en base a la probabilidad más alta determinada por el algoritmo o determinar que el carcinoma no se deriva de un conjunto particular de carcinomas; y
    d.
    medir opcionalmente los Biomarcadores específicos para uno o más carcinomas diferentes adicionales, y repetir los pasos c) y d) para los Biomarcadores adicionales.
  2. 2. El método de acuerdo con la reivindicación 1 en donde los genes Marcadores comprenden además
    (a)
    KRT6F, p73H, y/o SFTPC; y/o
    (b)
    ITGB6, KLK10, CLDN18, TR10 y/o FKBP10; y/o
    (c)
    CDX1 y/o FABP1
  3. 3.
    El método de una de las reivindicaciones 1 ó 2 en donde la expresión génica se mide usando al menos una de las SEQ ID NOs: 11-58.
  4. 4.
    El método de la reivindicación 3 en donde los genes Marcadores comprenden además genes Marcadores específicos del género seleccionados de al menos uno de
    i. en el caso de un paciente masculino KLK2, NGEP o NPY; o
    ii. en el caso de un paciente femenino PIP, B305D, B726 o GABA-Pi; y/o PAX8, STAR o EMX2.
  5. 5.
    El método de la reivindicación 4 en donde, en el caso de un paciente masculino, los genes Marcadores comprenden además KLK2.
  6. 6.
    El método de la reivindicación 5 en donde, en el caso de un paciente masculino, los genes Marcadores comprenden además NGEP y/o NPY.
  7. 7.
    El método de la reivindicación 4 en donde, en el caso de un paciente femenino, los genes Marcadores comprenden además, PIP, B305D, B726 o GABA-Pi.
  8. 8.
    El método de la reivindicación 4 en donde, en el caso de un paciente femenino, los genes Marcadores comprenden además PAX8, STAR o EMX2.
  9. 9.
    El método de la reivindicación 8 en donde, en el caso de un paciente femenino, los genes Marcadores comprenden además PIP, B305D, B726 o GABA-Pi.
  10. 10.
    El método de acuerdo con una de las reivindicaciones 1-2, o 4-9 que comprende además medir la expresión de al menos un gen expresado consecutivamente en la muestra.
  11. 11.
    El método de la reivindicación 1 que comprende además obtener información clínica adicional incluyendo el sitio de metástasis para determinar el origen del carcinoma.
  12. 12.
    Un método de proporcionar un pronóstico o dirección de terapia determinando el origen de una metástasis de origen desconocido de acuerdo con la reivindicación 1 e identificar el pronóstico correspondiente para el mismo o el tratamiento apropiado para el mismo.
  13. 13.
    El uso de un kit para realizar el método de la reivindicación 1, en donde el kit comprende: ARN o ADNc que hibrida con los genes marcadores de la reivindicación 1, una micromatriz o un chip génico.
ES11163930.8T 2005-09-19 2006-09-19 Métodos y usos para identificar el origen de un carcinoma de origen primario desconocido Active ES2525545T3 (es)

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
US71850105P 2005-09-19 2005-09-19
US718501P 2005-09-19
US72568005P 2005-10-12 2005-10-12
US725680P 2005-10-12

Publications (1)

Publication Number Publication Date
ES2525545T3 true ES2525545T3 (es) 2014-12-26

Family

ID=37889439

Family Applications (2)

Application Number Title Priority Date Filing Date
ES06814892.3T Active ES2494843T3 (es) 2005-09-19 2006-09-19 Métodos y materiales para identificar el origen de un carcinoma de origen primario desconocido
ES11163930.8T Active ES2525545T3 (es) 2005-09-19 2006-09-19 Métodos y usos para identificar el origen de un carcinoma de origen primario desconocido

Family Applications Before (1)

Application Number Title Priority Date Filing Date
ES06814892.3T Active ES2494843T3 (es) 2005-09-19 2006-09-19 Métodos y materiales para identificar el origen de un carcinoma de origen primario desconocido

Country Status (9)

Country Link
US (2) US20080050726A1 (es)
EP (3) EP1934378A4 (es)
JP (2) JP2009508493A (es)
BR (2) BRPI0616090A2 (es)
CA (2) CA2623775A1 (es)
DK (2) DK1934615T3 (es)
ES (2) ES2494843T3 (es)
HK (1) HK1128524A1 (es)
WO (2) WO2007035690A2 (es)

Families Citing this family (33)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE10254601A1 (de) 2002-11-22 2004-06-03 Ganymed Pharmaceuticals Ag Differentiell in Tumoren exprimierte Genprodukte und deren Verwendung
DE102004024617A1 (de) 2004-05-18 2005-12-29 Ganymed Pharmaceuticals Ag Differentiell in Tumoren exprimierte Genprodukte und deren Verwendung
EP1790664A1 (en) 2005-11-24 2007-05-30 Ganymed Pharmaceuticals AG Monoclonal antibodies against claudin-18 for treatment of cancer
US8535677B2 (en) 2006-06-06 2013-09-17 Oxford Biotherapeutics, Ltd. Antibody drug conjugate treatment of colorectal cancer
CA2677118A1 (en) * 2007-02-01 2008-08-07 Veridex, Llc Methods and materials for identifying the origin of a carcinoma of unknown primary origin
ATE543913T1 (de) * 2007-06-01 2012-02-15 Agendia B V Prognostische genexpressionssignatur für patienten mit nichtkleinzelligem lungenkrebs
WO2009021019A1 (en) * 2007-08-06 2009-02-12 Health Research Inc. Methods for analysis of pdef and survivin as interconnected cancer biomarkers and targets for personalized medicine
WO2009046739A1 (en) 2007-10-09 2009-04-16 Curevac Gmbh Composition for treating prostate cancer (pca)
EP2195015B1 (en) * 2007-10-09 2017-04-12 CureVac AG COMPOSITION FOR TREATING PROSTATE CANCER (PCa)
MX2010008009A (es) * 2008-01-22 2010-08-10 Veridex Llc Deteccion de hipermetilacion de gstp1 en el cancer de prostata.
WO2010037408A1 (en) 2008-09-30 2010-04-08 Curevac Gmbh Composition comprising a complexed (m)rna and a naked mrna for providing or enhancing an immunostimulatory response in a mammal and uses thereof
US9207242B2 (en) * 2008-10-09 2015-12-08 The University Of Hong Kong Cadherin-17 as diagnostic marker and therapeutic target for liver cancer
KR100996143B1 (ko) 2008-10-31 2010-11-24 한국전기연구원 자계 고노출 직업군의 개인노출자계 추정방법
CA2749601C (en) 2009-01-14 2020-07-21 Stephen M. Hewitt Ratio based biomarkers and methods of use thereof
US9181339B2 (en) 2009-04-20 2015-11-10 Oxford Bio Therapeutics Ltd. Antibodies specific to cadherin-17
CN102439600B (zh) * 2009-05-20 2015-09-30 皇家飞利浦电子股份有限公司 基于分子标签的集合的生物标志物
WO2010144808A2 (en) 2009-06-12 2010-12-16 The United States Of America, As Represented By The Secretary, Department Of Health And Human Services Identification of dsg-3 as a biomarker for the detection of metastasis in lymph nodes
WO2011150974A1 (en) * 2010-06-03 2011-12-08 Porto Conte Ricerche S.R.L. Biomarkers for lung neuroendocrine tumors
WO2012178128A1 (en) * 2011-06-22 2012-12-27 Oncocyte Corporation Methods and compositions for the treatment and diagnosis of cancer
WO2013167153A1 (en) 2012-05-09 2013-11-14 Ganymed Pharmaceuticals Ag Antibodies useful in cancer diagnosis
WO2013174404A1 (en) 2012-05-23 2013-11-28 Ganymed Pharmaceuticals Ag Combination therapy involving antibodies against claudin 18.2 for treatment of cancer
CA2874407A1 (en) 2012-05-24 2013-11-28 Fundacio Institut D'investigacio Biomedica De Bellvitge (Idibell) Method for the identification of the origin of a cancer of unknown primary origin by methylation analysis
WO2014036444A1 (en) * 2012-08-30 2014-03-06 Abbott Laboratories Prame detection assays
RU2678127C2 (ru) 2012-11-13 2019-01-23 Бионтех Аг Агенты для лечения экспрессирующих клаудин раковых заболеваний
CN104937112B (zh) * 2013-01-22 2018-04-24 大塚制药株式会社 对WT1 mRNA的表达量进行定量的方法
WO2014127785A1 (en) 2013-02-20 2014-08-28 Ganymed Pharmaceuticals Ag Combination therapy involving antibodies against claudin 18.2 for treatment of cancer
CA2907124C (en) 2013-03-15 2021-07-06 Janssen Pharmaceutica Nv Assay for predictive biomarkers
WO2014146672A1 (en) 2013-03-18 2014-09-25 Ganymed Pharmaceuticals Ag Therapy involving antibodies against claudin 18.2 for treatment of cancer
EP3159695A3 (en) * 2013-06-20 2017-07-05 The Trustees of The University of Pennsylvania Methods for diagnosing pancreatic cancer
JP6443937B2 (ja) 2013-10-28 2018-12-26 株式会社サリバテック 膵癌用唾液バイオマーカー、及び、これを用いた膵癌患者を健常者から識別する方法
PL3062815T3 (pl) 2013-11-01 2019-07-31 Pfizer Inc. Wektory do ekspresji antygenów związanych z gruczołem krokowym
JP6410343B2 (ja) * 2014-07-01 2018-10-24 学校法人順天堂 脂肪組織由来幹細胞から表皮角化細胞への誘導
EP3931318A4 (en) * 2019-04-01 2022-12-07 The University of North Carolina at Chapel Hill TUMOR PURITY INDEPENDENT SUBTYPING (PURIST), SAMPLE TYPE INDEPENDENT SINGLE SAMPLE PLATFORM AND CLASSIFIER FOR TREATMENT DECISION MAKING IN PANCREATIC CANCER

Family Cites Families (72)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5700637A (en) * 1988-05-03 1997-12-23 Isis Innovation Limited Apparatus and method for analyzing polynucleotide sequences and method of generating oligonucleotide arrays
GB8822228D0 (en) 1988-09-21 1988-10-26 Southern E M Support-bound oligonucleotides
US5242974A (en) 1991-11-22 1993-09-07 Affymax Technologies N.V. Polymer reversal on solid surfaces
US5143854A (en) * 1989-06-07 1992-09-01 Affymax Technologies N.V. Large scale photolithographic solid phase synthesis of polypeptides and receptor binding screening thereof
US5527681A (en) * 1989-06-07 1996-06-18 Affymax Technologies N.V. Immobilized molecular synthesis of systematically substituted compounds
US5424186A (en) * 1989-06-07 1995-06-13 Affymax Technologies N.V. Very large scale immobilized polymer synthesis
DE3924454A1 (de) * 1989-07-24 1991-02-07 Cornelis P Prof Dr Hollenberg Die anwendung von dna und dna-technologie fuer die konstruktion von netzwerken zur verwendung in der chip-konstruktion und chip-produktion (dna chips)
WO1991007509A1 (en) 1989-11-13 1991-05-30 Massachusetts Institute Of Technology Localization and characterization of the wilms's tumor gene
US5804604A (en) * 1989-12-21 1998-09-08 Biogen, Inc. Tat-derived transport polypeptides and fusion proteins
US5962643A (en) * 1991-07-11 1999-10-05 The Regents Of The University Of California Integrin β subunit and uses thereof
IL103674A0 (en) 1991-11-19 1993-04-04 Houston Advanced Res Center Method and apparatus for molecule detection
US5384261A (en) 1991-11-22 1995-01-24 Affymax Technologies N.V. Very large scale immobilized polymer synthesis using mechanically directed flow paths
US5412087A (en) 1992-04-24 1995-05-02 Affymax Technologies N.V. Spatially-addressable immobilization of oligonucleotides and other biological polymers on surfaces
US5786148A (en) 1996-11-05 1998-07-28 Incyte Pharmaceuticals, Inc. Polynucleotides encoding a novel prostate-specific kallikrein
US5554501A (en) * 1992-10-29 1996-09-10 Beckman Instruments, Inc. Biopolymer synthesis using surface activated biaxially oriented polypropylene
US5472672A (en) 1993-10-22 1995-12-05 The Board Of Trustees Of The Leland Stanford Junior University Apparatus and method for polymer synthesis using arrays
US5429807A (en) 1993-10-28 1995-07-04 Beckman Instruments, Inc. Method and apparatus for creating biopolymer arrays on a solid support surface
US5571639A (en) * 1994-05-24 1996-11-05 Affymax Technologies N.V. Computer-aided engineering system for design of sequence arrays and lithographic masks
US5556752A (en) 1994-10-24 1996-09-17 Affymetrix, Inc. Surface-bound, unimolecular, double-stranded DNA
US5599695A (en) 1995-02-27 1997-02-04 Affymetrix, Inc. Printing molecular library arrays using deprotection agents solely in the vapor phase
US5624711A (en) 1995-04-27 1997-04-29 Affymax Technologies, N.V. Derivatization of solid supports and methods for oligomer synthesis
US5668267A (en) 1995-05-31 1997-09-16 Washington University Polynucleotides encoding mammaglobin, a mammary-specific breast cancer protein
US5545531A (en) * 1995-06-07 1996-08-13 Affymax Technologies N.V. Methods for making a device for concurrently processing multiple biological chip assays
US5658734A (en) * 1995-10-17 1997-08-19 International Business Machines Corporation Process for synthesizing chemical compounds
US5837507A (en) * 1995-11-13 1998-11-17 The Regents Of The University Of California Hox-induced enhancement of in vivo and in vitro proliferative capacity and gene therapeutic methods
US5642711A (en) * 1996-02-15 1997-07-01 Automated Waste Equipment Co., Inc. Apparatus for automatically controlling operation of the throttle assembly of a motor vehicle engine system during operation of power take-off equipment
US6225051B1 (en) 1996-04-16 2001-05-01 Haruo Sugiyama Method of detecting solid cancer cells and tissue atypia and method of testing tissues for use in bone marrow transplantation and peripheral blood stem cell transplantation
AU739407C (en) 1997-03-10 2002-08-08 Regents Of The University Of California, The PSCA: prostate stem cell antigen
AU7830598A (en) 1997-06-10 1998-12-30 Michael A. Levine Methods for thyroid cell detection
US6218114B1 (en) * 1998-03-27 2001-04-17 Academia Sinica Methods for detecting differentially expressed genes
US6004755A (en) * 1998-04-07 1999-12-21 Incyte Pharmaceuticals, Inc. Quantitative microarray hybridizaton assays
US6218122B1 (en) * 1998-06-19 2001-04-17 Rosetta Inpharmatics, Inc. Methods of monitoring disease states and therapies using gene expression profiles
US6262249B1 (en) * 1998-06-23 2001-07-17 Chiron Corporation Pancreatic cancer genes
US20010010934A1 (en) 1998-07-31 2001-08-02 Towia Aron Libermann Prostate derived ets factor
US6232073B1 (en) 1999-02-05 2001-05-15 Virginia Commonwealth University Nucleic acid marker for cancer
AU3395900A (en) 1999-03-12 2000-10-04 Human Genome Sciences, Inc. Human lung cancer associated gene sequences and polypeptides
US20030040617A9 (en) * 1999-03-12 2003-02-27 Rosen Craig A. Nucleic acids, proteins and antibodies
US6271002B1 (en) 1999-10-04 2001-08-07 Rosetta Inpharmatics, Inc. RNA amplification method
US20040146862A1 (en) 2000-03-15 2004-07-29 Eos Biotechnology, Inc. Methods of diagnosis of breast cancer, compositions and methods of screening for modulators of breast cancer
EP1311673A2 (en) 2000-03-27 2003-05-21 Corixa Corporation Compositions and methods for the therapy and diagnosis of prostate cancer
WO2002068677A2 (en) * 2001-02-27 2002-09-06 Eos Biotechnology, Inc. Novel methods of diagnosis of metastatic colorectal cancer, compositions and methods of screening for modulators of metastatic colorectal cancer
JP2004526154A (ja) 2001-03-12 2004-08-26 モノジェン インコーポレイテッド 細胞ベースの検出および病態の判別
EP1468110A4 (en) * 2001-06-10 2008-01-30 Irm Llc MOLECULAR SIGNATURES NORMALLY TO THE DEATH LEADING CARCINOME
US7189507B2 (en) * 2001-06-18 2007-03-13 Pdl Biopharma, Inc. Methods of diagnosis of ovarian cancer, compositions and methods of screening for modulators of ovarian cancer
FR2826168B1 (fr) 2001-06-19 2003-12-05 Eads Airbus Sa Procede de realisation d'une couche acoustiquement resistive renforcee, couche resistive ainsi obtenue et panneau utilisant une telle couche
US7705120B2 (en) 2001-06-21 2010-04-27 Millennium Pharmaceuticals, Inc. Compositions, kits, and methods for identification, assessment, prevention, and therapy of breast cancer
US20040076955A1 (en) * 2001-07-03 2004-04-22 Eos Biotechnology, Inc. Methods of diagnosis of bladder cancer, compositions and methods of screening for modulators of bladder cancer
AU2002343443A1 (en) * 2001-09-28 2003-04-14 Whitehead Institute For Biomedical Research Classification of lung carcinomas using gene expression analysis
US20030232350A1 (en) * 2001-11-13 2003-12-18 Eos Biotechnology, Inc. Methods of diagnosis of cancer, compositions and methods of screening for modulators of cancer
US20030215835A1 (en) 2002-01-15 2003-11-20 Zairen Sun Differentially-regulated prostate cancer genes
US7348142B2 (en) * 2002-03-29 2008-03-25 Veridex, Lcc Cancer diagnostic panel
DE10230276B4 (de) 2002-07-05 2005-05-19 Daimlerchrysler Ag AS-Druckgusslegierung und Verfahren zum Herstellen eines Aggregatteils aus einer derartigen AS-Druckgusslegierung
US20040021572A1 (en) * 2002-08-05 2004-02-05 Schoen Marc L. Electronic baggage tracking and identification
ATE519862T1 (de) 2002-08-20 2011-08-15 Millennium Pharm Inc Zusammensetzungen, kits und verfahren zur identifizierung, beurteilung, vorbeugung und therapie von gebärmutterhalskrebs
US7427603B2 (en) * 2002-09-26 2008-09-23 The Children's Medical Center Corporation Method of enhancing proliferation and/or hematopoietic differentiation of stem cells
US20050260639A1 (en) * 2002-09-30 2005-11-24 Oncotherapy Science, Inc. Method for diagnosing pancreatic cancer
CN1703524B (zh) 2002-09-30 2010-04-07 肿瘤疗法科学股份有限公司 与人胰腺癌相关的基因和多肽
CA2500687A1 (en) 2002-10-02 2004-04-15 Genentech, Inc. Compositions and methods for the diagnosis and treatment of tumor
US20040219572A1 (en) 2002-12-17 2004-11-04 Jie Chen Specific markers for pancreatic cancer
US20040219575A1 (en) 2002-12-26 2004-11-04 Toomas Neuman Methods and compositions for the diagnosis, prognosis, and treatment of cancer
US20050181375A1 (en) 2003-01-10 2005-08-18 Natasha Aziz Novel methods of diagnosis of metastatic cancer, compositions and methods of screening for modulators of metastatic cancer
AU2003900747A0 (en) * 2003-02-18 2003-03-06 Garvan Institute Of Medical Research Diagnosis and treatment of pancreatic cancer
DE602004006391D1 (de) 2003-02-26 2007-06-21 Delta Process Engineering Aps Zweifach angekratzter dünnschicht-wärmeaustauscher für viskoseflüssigkeit
US20060141471A1 (en) 2003-02-27 2006-06-29 Mount Sinai Hospital Assay for detection of renal cell carcinoma
US20060265138A1 (en) * 2003-03-14 2006-11-23 David Bowtell Expression profiling of tumours
US20050009067A1 (en) * 2003-05-19 2005-01-13 Craig Logsdon Expression profile of pancreatic cancer
KR20060031809A (ko) 2003-06-09 2006-04-13 더 리젠츠 오브 더 유니버시티 오브 미시간 암 치료 및 진단용 조성물 및 방법
US20050081341A1 (en) 2003-10-15 2005-04-21 Mcdougall William B.S. Woven touch fastener products
WO2006002433A2 (en) * 2004-06-24 2006-01-05 Veridex, Llc Methods and reagents for the detection of melanoma
US20060029987A1 (en) * 2004-08-06 2006-02-09 Applera Corporation Diagnosis of pancreatic cancer by using pancreatic targets
US9667980B2 (en) 2005-03-01 2017-05-30 Qualcomm Incorporated Content-adaptive background skipping for region-of-interest video coding
CA2677118A1 (en) * 2007-02-01 2008-08-07 Veridex, Llc Methods and materials for identifying the origin of a carcinoma of unknown primary origin

Also Published As

Publication number Publication date
JP2009508493A (ja) 2009-03-05
DK1934615T3 (da) 2014-07-14
WO2007035690A3 (en) 2007-06-14
WO2007035676A2 (en) 2007-03-29
EP2402758A2 (en) 2012-01-04
EP1934615B1 (en) 2014-06-04
BRPI0616211A2 (pt) 2011-06-14
JP5405110B2 (ja) 2014-02-05
EP1934615A2 (en) 2008-06-25
JP2009509502A (ja) 2009-03-12
US20080050726A1 (en) 2008-02-28
DK2402758T3 (da) 2014-11-03
EP1934378A4 (en) 2008-10-29
US20070065859A1 (en) 2007-03-22
EP2402758A3 (en) 2012-10-31
EP1934378A2 (en) 2008-06-25
EP1934615A4 (en) 2009-02-11
WO2007035676A3 (en) 2007-12-27
EP2402758B1 (en) 2014-09-10
BRPI0616090A2 (pt) 2011-06-07
WO2007035690A2 (en) 2007-03-29
CA2623425A1 (en) 2007-03-29
CA2623775A1 (en) 2007-03-29
HK1128524A1 (zh) 2009-10-30
ES2494843T3 (es) 2014-09-16

Similar Documents

Publication Publication Date Title
ES2525545T3 (es) Métodos y usos para identificar el origen de un carcinoma de origen primario desconocido
US20170073758A1 (en) Methods and materials for identifying the origin of a carcinoma of unknown primary origin
US11549148B2 (en) Neuroendocrine tumors
ES2304306B1 (es) Metodo de diagnostico y/o pronostico de cancer vesical.
CN109402252A (zh) 急性髓系白血病风险评估基因标志物及其应用
ES2893469T3 (es) Puntuaciones de riesgo basadas en la expresión de la variante 7 de la fosfodiesterasa 4D humana
CN108950003A (zh) 一种用于诊断乳腺癌的miRNA标志物及其miRNA的应用
JP7463357B2 (ja) Pde4d7及びdhx9発現に基づく術前のリスク層別化
EP3953492A1 (en) Method for determining rcc subtypes
Hamlat et al. Proposal of a scoring scale as a survival predictor in intracranial oligodendrogliomas
CN101365950B (zh) 用于鉴别原发起源不明癌的起源的方法和材料
MX2008003932A (es) Metodos y materiales para identificar el origen de un carcinoma de origen primario desconocido
WO2024089314A1 (es) Panel de secuenciación para biopsia líquida de pacientes con cáncer de mama
MX2008003933A (es) Metodos para diagnosticar el cancer pancreatico