ES2647612T3 - Biomarcadores de ácidos nucleicos en circulación asociados al cáncer de próstata - Google Patents

Biomarcadores de ácidos nucleicos en circulación asociados al cáncer de próstata Download PDF

Info

Publication number
ES2647612T3
ES2647612T3 ES11790345.0T ES11790345T ES2647612T3 ES 2647612 T3 ES2647612 T3 ES 2647612T3 ES 11790345 T ES11790345 T ES 11790345T ES 2647612 T3 ES2647612 T3 ES 2647612T3
Authority
ES
Spain
Prior art keywords
prostate cancer
free
presented
sequence
dna
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
ES11790345.0T
Other languages
English (en)
Inventor
Ekkehard Schütz
Julia Beck
Howard Urnovitz
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Chronix Biomedical Inc
Original Assignee
Chronix Biomedical Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Chronix Biomedical Inc filed Critical Chronix Biomedical Inc
Application granted granted Critical
Publication of ES2647612T3 publication Critical patent/ES2647612T3/es
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6883Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
    • C12Q1/6886Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material for cancer
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/158Expression markers

Landscapes

  • Chemical & Material Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Organic Chemistry (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Engineering & Computer Science (AREA)
  • Immunology (AREA)
  • Pathology (AREA)
  • Analytical Chemistry (AREA)
  • Zoology (AREA)
  • Genetics & Genomics (AREA)
  • Wood Science & Technology (AREA)
  • Physics & Mathematics (AREA)
  • Biotechnology (AREA)
  • Microbiology (AREA)
  • Molecular Biology (AREA)
  • Hospice & Palliative Care (AREA)
  • Biophysics (AREA)
  • Oncology (AREA)
  • Biochemistry (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

Un método para detectar un biomarcador que está asociado con cáncer de próstata en un paciente, método que comprende: obtener la secuencia de sustancialmente todo el ADN libre de células en circulación que tenga una longitud entre 50 y 400 nucleótidos consecutivos aislado de una muestra obtenida a partir de sangre, suero, o plasma de un paciente que ha sido diagnosticado con cáncer de próstata o se sospecha que tiene cáncer de próstata; comparar cada secuencia, exenta de elementos repetitivos, con las secuencias que se presentan en la Tabla B para determinar si una secuencia de un ADN exento de células en circulación se encuentra en una región cromosómica que se presenta en la Tabla 3; en el que la detección de una secuencia en los ácidos nucleicos en circulación que se atribuye sin ambigüedad a una región cromosómica que se presenta en la Tabla 3 es indicativa de un aumento de la probabilidad de cáncer de próstata o recurrencia de cáncer de próstata.

Description

Biomarcadores de ácidos nucleicos en circulación asociados al cáncer de próstata
5 Antecedentes la invención
Los métodos para detectar el cáncer de próstata, incluyendo los ensayos de PSA, son extremadamente poco fiables (véase, por ejemplo, Wever et al., J Natl Cancer Inst 2010; 102: 352-355, 2010; Schröder et al., N. Engl. J. Med 360: 1320-1328, 2009). Papadopoulou et al., (ANNALS OF THE NEW YORK ACADEMY OF SCIENCES, 2006, 1075: 235-243) describe el uso de ADN y ARN exento de células en plasma como un nuevo marcador molecular para cáncer de próstata y mama. Existe una necesidad de métodos de detección eficaces de cáncer de próstata. La presente invención se dirige a esa necesidad.
Breve sumario de la invención
15 La invención se basa, en parte, en el descubrimiento de biomarcadores de ácidos nucleicos en circulación (CNA) asociados al cáncer de próstata. Los métodos, kits y sistemas de la presente invención se definen en las reivindicaciones adjuntas 1 a 9. En algunas realizaciones, los biomarcadores de CNA son secuencias de ácidos nucleicos, en la presente invención secuencias de ADN, que están presentes en la sangre, por ejemplo, en una muestra de suero o plasma, de un paciente con cáncer de próstata, pero en raras ocasiones están presentes, si lo estuvieran, en la sangre, por ejemplo, una muestra de suero o plasma, obtenida de un individuo normal, es decir, en el contexto de la presente invención, un individuo que no tiene cáncer de próstata. En algunas realizaciones, los biomarcadores de CNA son secuencias de ácidos nucleicos, en la presente invención secuencias de ADN, es decir, fragmentos de ADN, que están presentes en la sangre, por ejemplo, en una muestra de suero o plasma, de un
25 individuo normal, pero en raras ocasiones están presentes, si lo estuvieran, en la sangre, por ejemplo, una muestra de suero o plasma, obtenida de un paciente con cáncer de próstata.
La invención proporciona un método para detectar un biomarcador que está asociado con cáncer de próstata en un paciente, método que comprende:
obtener la secuencia de sustancialmente todo el ADN libre de células en circulación que tenga una longitud entre 50 y 400 nucleótidos consecutivos aislado de una muestra obtenida a partir de sangre, suero, o plasma de un paciente que ha sido diagnosticado con cáncer de próstata o se sospecha que tiene cáncer de próstata; comparar cada secuencia, exenta de elementos repetitivos, con las secuencias que se presentan en la Tabla B
35 para determinar si una secuencia de un ADN exento de células en circulación se encuentra en una región cromosómica que se presenta en la Tabla 3; en el que la detección de una secuencia en los ácidos nucleicos en circulación que se atribuye sin ambigüedad a una región cromosómica que se presenta en la Tabla 3 es indicativa de un aumento de la probabilidad de cáncer de próstata o recurrencia de cáncer de próstata.
La invención también proporciona un kit que comprende una pluralidad de oligonucleótidos, en el que cada oligonucleótido tiene de aproximadamente 18 a 100 nucleótidos y tiene una secuencia de nucleótidos que se encuentra en una región cromosómica que se presenta en la Tabla 3; en el que dicha pluralidad comprende oligonucleótidos que corresponden a todas y cada una de las regiones cromosómicas que se presentan en la Tabla
45 3; y en el que dichos oligonucleótidos están exentos de elemento repetitivo;
opcionalmente en el que dichos oligonucleótidos están unidos a un sustrato sólido.
También se proporciona un método para diagnosticar o identificar sistemáticamente cáncer de próstata en un paciente, que comprende:
proporcionar una muestra de ADN exento de células en circulación aislado de una muestra obtenida a partir de sangre, suero, o plasma de dicho paciente; hibridar la muestra en una pluralidad de sondas para determinar si una de las moléculas de ADN exento de
55 células circulación se hibrida en una cualquiera de la pluralidad de sondas en condiciones rigurosas, en el que la pluralidad de sondas comprende un conjunto de sondas para todas las regiones cromosómicas que se presentan en la Tabla 3; y correlacionar la presencia de un ADN exento de células que se encuentra en una región cromosómica de la Tabla 3 con un aumento de la probabilidad de que dicho paciente tenga cáncer de próstata.
La invención también proporciona un sistema para analizar ADN exento de células en circulación, que comprende:
un analizador de muestras que determina la presencia o ausencia, o la cantidad de, un ADN exento de células en circulación que tiene una secuencia de nucleótidos de al menos 25 nucleótidos que se encuentra en cada región
65 cromosómica que se presenta en la Tabla 3; un sistema informático que recibe y analiza automáticamente los datos obtenidos en la etapa (1), y que
correlaciona la presencia, o un aumento de la cantidad, de dicho ADN exento de células en circulación con un diagnóstico de cáncer de próstata; que además comprende opcionalmente un módulo de presentación que presenta el resultado de la etapa de correlación.
5 En consecuencia, en un aspecto, la divulgación proporciona un método para analizar CNA en una muestra (sangre, suero, o plasma) de un paciente que comprende detectar la presencia de al menos ADN exento de células que tiene una secuencia de nucleótidos que se encuentra en una región cromosómica que se presenta en las Tablas 2-5 (o que tiene una secuencia de nucleótidos que es parte de una de las secuencias que se presentan en las Tablas A-D) en la muestra. En algunas realizaciones, la detección de la presencia, o la cantidad de, de al menos un biomarcador comprende detectar una molécula de ADN exento de células que tiene entre 50 y 400 nucleótidos consecutivos de una secuencia única que se encuentra en una región cromosómica como se presenta en las Tablas 2-5 (o de una secuencia única que se presenta en las Tablas A-D).
15 En una realización, se proporciona un método para analizar ADN libre en circulación en una muestra de un paciente, que comprende determinar, en una muestra que es sangre, suero, o plasma, la presencia o ausencia, o la cantidad de, al menos 2, 3, 4, 5, 7, 8, 9, 10, 15, 20, 30, 40, o al menos 50 moléculas de ADN exento de células cada una teniendo una secuencia que se encuentra en una región cromosómica diferente que se presenta en la Tabla 2, 3, 4,
o 5, y preferentemente las secuencias de las moléculas de ADN exento de células están exentas de elemento repetitivo. En realizaciones preferentes, las moléculas de ADN exento de células tienen secuencias que se encuentran en diferentes regiones cromosómicas en la misma tabla seleccionada entre las Tablas 2-5.
En otro aspecto, la presente divulgación proporciona un kit que incluye dos o más (por ejemplo, al menos 2, 3, 4, 5, 6, 7, 8, 9, 10, 12, 15, 20, 25, 30, 40, o al menos 50, pero menos de 115) conjuntos de oligonucleótidos. Cada
25 conjunto comprende uno o más oligonucleótidos con una secuencia de oligonucleótidos que se encuentra en una sola región cromosómica que se presenta en las Tablas 2-5. Preferentemente, diferentes conjuntos de oligonucleótidos corresponden a diferentes regiones cromosómicas en la misma tabla seleccionada entre las Tablas 2-5. Además, preferentemente los oligonucleótidos están exentos de elemento repetitivo. Opcionalmente, los oligonucleótidos están unidos a uno o más sustratos sólidos tales como microchips y perlas.
En otro aspecto, la presente divulgación proporciona un método para diagnosticar o identificar sistemáticamente cáncer de próstata en un paciente. El método incluye las etapas de: (a) determinar, en una muestra que es sangre, suero, o plasma de un paciente, la presencia o ausencia o la cantidad de, al menos 2, 3, 4, 5, 7, 8, 9, 10, 15, 20, 30, 40, o al menos 50 moléculas de ADN exento de células cada una teniendo una secuencia que se encuentra en una
35 región cromosómica diferente que se presenta en la Tabla 2, 3, o 4; y (b) correlacionar la presencia, o un aumento de la cantidad, de dicho primer y segundo ADN exento de células con un aumento de la probabilidad de que el paciente tenga cáncer de próstata. Preferentemente, las secuencias de las moléculas de ADN exento de células están exentas de elemento repetitivo. En realizaciones preferentes, las moléculas de ADN exento de células tienen secuencias que se encuentran en diferentes regiones cromosómicas en la misma tabla elegida entre las Tablas 2-4.
En un aspecto, la divulgación proporciona un método para identificar a un paciente que tiene un biomarcador de CNA asociado con cáncer de próstata, método que comprende detectar la presencia de al menos un biomarcador que se presenta en la Tabla 2, Tabla 3, o Tabla 4 en una muestra de CNA obtenida a partir de suero o plasma de un paciente. Un biomarcador se puede identificar usando cualquier número de métodos, incluyendo secuenciación de
45 CNA así como el uso de una sonda o conjunto de sondas para detectar la presencia del biomarcador.
En algunos aspectos, la divulgación proporciona un método para identificar a un paciente que tiene un biomarcador de CNA que está asociado con la ausencia de cáncer de próstata, método que comprende detectar la presencia de al menos un biomarcador que se presenta en la Tabla 5 obtenida a partir de suero o plasma del paciente. Un biomarcador se puede identificar usando cualquier número de métodos, incluyendo secuenciación de CNA así como el uso de una sonda o conjunto de sondas para detectar la presencia del biomarcador.
En un aspecto adicional, la divulgación proporciona un kit para identificar a un paciente que tiene un biomarcador de cáncer de próstata y/o que tiene un biomarcador asociado a un individuo normal que no tiene cáncer de próstata, en
55 la que el kit comprende al menos una sonda de polinucleótidos para un biomarcador que se presenta en la Tabla 2, 3, 4, o 5. Preferentemente, un kit de este tipo comprende sondas para múltiples biomarcadores, por ejemplo, al menos 2, 3, 4, 5, 10, 20, 30, 40, 50, o más, de los biomarcadores que se presentan en la Tablas 2-5. En algunas realizaciones, el kit también incluye un dispositivo electrónico o software informático para comprobar los patrones de hibridación del CNA en la muestra del paciente para un conjunto de datos de cáncer de próstata que comprende un listado de biomarcadores que están presentes en CNA de paciente con cáncer de próstata, pero no en muestras de CNA de individuos normales.
En algunas realizaciones, la presencia del al menos un biomarcador en CNA se determina mediante secuenciación. En algunas realizaciones, la presencia del al menos un biomarcador en CNA se determina usando una matriz. En
65 algunas realizaciones, la presencia del al menos un biomarcador en CNA se determina usando un ensayo que comprende una reacción de amplificación, tal como una reacción en cadena de polimerasa (PCR). En algunas
realizaciones, se usa una matriz de ácido nucleico que forma un conjunto de sondas que comprende sondas para dos o más regiones cromosómicas que se presentan en la Tablas 2-5. En algunas realizaciones, se usa una matriz de ácido nucleico que forma un conjunto de sondas que comprende 2, 3, 4, 5, 6, 7, 8, 9, 10 o más regiones cromosómicas, o todas las regiones cromosómicas, que se presentan en la Tabla 2. En algunas realizaciones, se
5 usa una matriz de ácido nucleico que forma un conjunto de sondas que comprende 2, 3, 4, 5, 6, 7, 8, 9, 10, o más regiones cromosómicas, o todas las regiones cromosómicas, que se presentan en la Tabla 3. En algunas realizaciones, se usa una matriz de ácido nucleico que forma un conjunto de sondas que comprende 2, 3, 4, 5, 6, 7, 8, 9, 10 o más regiones cromosómicas, o todas las regiones cromosómicas, que se presentan en la Tabla 4. En algunas realizaciones, se usa una matriz de ácido nucleico que forma un conjunto de sondas que comprende dos o más regiones cromosómicas, o todas las regiones cromosómicas, que se presentan en la Tabla 5.
En un aspecto adicional, la divulgación proporciona un método para detectar cáncer de próstata en un paciente que tiene, o se sospecha que tiene, cáncer de próstata, método que comprende poner en contacto el ADN de la muestra de suero o plasma con una sonda que se hibrida de forma selectiva a una secuencia presente en una región
15 cromosómica que se describe en el presente documento, por ejemplo, una secuencia que se presenta en la Tablas A-D en condiciones en las que la sonda se hibrida de forma selectiva a la secuencia; y detectar la presencia o ausencia de hibridación de la sonda, en el que la presencia de hibridación a una secuencia que se presenta en la Tabla A, B, o C es indicativa de cáncer de próstata.
Las Tablas de las Secuencias A, B, C, y D proporcionan ejemplos de secuencias que corresponden a las regiones cromosómicas que se presentan en la Tabla 2, Tabla 3, Tabla 4, y Tabla 5, respectivamente. La denominación (N)x en la Tablas A-D se refiere a secuencias de elementos repetitivos.
Breve descripción de las figuras
25 La Figura 1 proporciona un ejemplo de una curva de ROC usando las 42 regiones de clasificación más elevada de las regiones cromosómicas identificadas en las Tablas 4 y 5, de manera colectiva. La curva de ROC real -formada a partir de sumas de puntuación se proporciona en conjunto con los límites de confianza de un 95 %.
Descripción detallada de la invención
Como se usa en el presente documento, un "biomarcador" como se usa en el presente documento se refiere a una secuencia de ácidos nucleicos que se corresponde con una región cromosómica, en el que la presencia del ácido nucleico en CNA está asociada con el cáncer de próstata.
35 En la presente invención, una "región cromosómica" enumerada en una cualquiera de las Tablas 1 a 5 se refiere a la región del cromosoma que se corresponde con las posiciones del nucleótido indicado en las tablas. Las posiciones del nucleótido los cromosomas se enumeran de acuerdo con el genoma del Homo sapiens (ser humano), Construcción 37.1 a partir de junio de 2010 (Tablas 1-3) y el genoma del Homo sapiens (ser humano), construcción 36 a partir de marzo de 2006 (Tabla 4, 5). Como se entiende la técnica, en el genoma de los individuos existen polimorfismos de origen natural. Por lo tanto, cada región del cromosoma enumerada en las tablas incluye variantes alélicas así como la secuencia en particular en la base de datos, por ejemplo, las secuencias en las Tablas A-D corresponde a las regiones cromosómicas indicadas. Una variante alérgica por lo general tiene una identidad de al menos un 95 %, a menudo una identidad de al menos un 96 %, al menos un 97 %, al menos un 98 %, o al menos un
45 99 % con respecto a la secuencia de una región cromosómica indicada en las Tablas que está presente en una base de datos en particular, por ejemplo, el National Center for Biotechnology Information (Construcción del Homo sapiens
Build 37.1 en la página web http:// seguido por www.ncbi.nlm.nih.gov/mapview/.) El porcentaje de identidad se puede determinar usando algoritmos bien conocidos, incluyendo el algoritmo BLAST, por ejemplo, ajustado para los parámetros por defecto. Además, se entiende que las secuencias de nucleótidos de los cromosomas se pueden mejorar a medida que se descubren y se corrigen los errores en la base de datos actual. La expresión "región cromosómica" incluye cualquier variante o versión corregida de la misma región como se define en las Tablas 1-5. Dada la información proporcionada en las tablas en la presente divulgación, especialmente a la vista de las secuencias enumeradas en las Tablas A-D, una persona con experiencia en la materia podrá comprender las regiones cromosómicas usadas para la presente invención incluso después de descubrir nuevas variantes o corregir
55 los errores.
En el contexto de la presente invención, "detectar la presencia de una región cromosómica" en CNA, se refiere a detectar por qué secuencia de una región cromosómica mostrada en la Tabla 2, 3, 4, o 5, en la que la secuencia detectada se puede asignar de forma inequívoca a esa región cromosómica. Por lo tanto, este término se refiere a la detección de secuencias únicas de las regiones cromosómicas. En la técnica se conocen métodos para retirar las secuencias repetitivas del análisis e incluyen el uso de ADN de bloqueo, por ejemplo, cuando los ácidos nucleicos diana se identifican mediante hibridación. En algunas realizaciones, por lo general cuando se determina la presencia De un biomarcador de cáncer de próstata pedía que secuenciación del CNA de un paciente, se pueden usar programas y manipulaciones informáticos para retirar las secuencias repetitivas del análisis (véase, por ejemplo, la
65 sección de EJEMPLOS). Además, las secuencias que tienen múltiples alineaciones que se ajustan del mismo modo con respecto a la base de datos de referencia por lo general se omiten de los análisis adicionales.
La expresión "detectar un biomarcador" como se usa en el presente documento se refiere a la detección de una secuencia de una región cromosómica enumerada en la Tabla 2, Tabla 3, Tabla 4, o Tabla 5. Se considera que un biomarcador está presente si cualquier secuencia de ácidos nucleicos presente en el CNA se asigna de forma inequívoca a la región cromosómica.
5 La expresión "asignado de forma inequívoca" en el contexto de la presente invención se refiere a la determinación de que un ADN detectado en el CNA de un paciente es de una región cromosómica en particular. Por lo tanto, en los métodos de detección que buscan hibridación, la sonda se hibrida específicamente a esa región. En los métodos de detección que usan amplificación, el cebador(es) se hibrida específicamente a esa región. En los métodos de detección que usan secuenciación, la secuencia se asigna a esa región basándose en algoritmos para identidad bien conocidos, tales como el algoritmo BLAST que usa parámetros de rigurosidad elevada, tal como e < 0,0001. además como una secuencia de este tipo no tiene un hit adicional con el mismo ajuste en la base de datos usada.
La expresión "ácidos nucleicos en circulación" se refiere a ácidos nucleicos acelulares que están presentes en la 15 sangre.
La expresión "ADN exento de células en circulación" como se usa en el presente documento se refiere a moléculas de ADN libre de 25 nucleótidos o más largas que no están contenidas en ninguna célula intacta en la sangre humana, y que se pueden obtener a partir de suero humano o plasma.
El término "hibridación" se refiere a la formación de una estructura dúplex mediante dos ácidos nucleicos monocatenarios debido a emparejamiento de bases complementarias. La hibridación se puede producir entre hebras de ácido nucleico exactamente complementarias o entre hebras de ácido nucleico que contienen regiones menos menores de faltas de coincidencias. Como se usa en el presente documento, la expresión "sustancialmente 25 complementaria" se refiere a secuencias que son complementarias excepto para regiones secundarias de faltas de coincidencias. Por lo general, el número total de nucleótidos con falta de coincidencias con respecto a una región de hibridación no es de más de 3 nucleótidos para las secuencias de aproximadamente 15 nucleótidos de longitud. Las condiciones en las que solamente se hibridarán las hebras de ácido nucleico exactamente complementarias se denominan condiciones de hibridación "rigurosas" o "específicas de secuencia". Los dúplex estables de ácidos nucleicos sustancialmente complementarios se pueden conseguir en condiciones de hibridación menos rigurosas. Los expertos en la materia de la tecnología de ácidos nucleicos pueden determinar la estabilidad del dúplex de forma empírica considerando un número de variables que incluyen, por ejemplo, la longitud y la concentración de pares de bases de los oligonucleótidos, fuerza iónica, e incidencia de pares de bases con falta de coincidencias. Por ejemplo, El software informático para calcular la estabilidad del dúplex está disponible en el mercado en National Biosciences,
35 Inc. (Plymouth, Minn.); por ejemplo, versión 5 de OLIGO, o del Software de ADN (Ann Arbor, Michigan), por ejemplo, Visual OMP 6.
En la técnica son bien conocidas las condiciones de hibridación específicas de secuencia, rigurosas, en las que un oligonucleótido se hibridará solamente a la secuencia diana (véanse, por ejemplo, las referencias generales proporcionadas en la sección sobre polimorfismos de detección en secuencias de ácidos nucleicos). Las condiciones rigurosas dependen de la secuencia y serán diferentes en circunstancias diferentes. Por lo general, las condiciones rigurosas se seleccionan para que sean de 5 ºC más bajas con respecto a 5 ºC más altas que el punto de fusión térmico (Tm) para la secuencia específica a una fuerza iónica y pH definidos. La Tm es la temperatura (bajo fuerza iónica y pH definidos) a la que un 50 % de las hebras del dúplex se han disociado. La relajación de la rigurosidad las
45 condiciones de hibridación permitirá que se toleren faltas de coincidencias en las secuencias; el grado de faltas de coincidencias toleradas se puede controlar mediante el ajuste adecuado de las condiciones de hibridación.
El término "cebador" se refiere a un oligonucleótido que actúa como un punto de inicio en la síntesis de ADN en condiciones en las que la síntesis de un producto de extensión del cebador complementario con una hebra de ácido nucleico se induce, es decir, en presencia de cuatro trifosfatos de nucleósido diferentes y de un agente para polimerización (es decir, ADN polimerasa o transcriptasa inversa) en un tampón apropiado y a una temperatura adecuada. Un cebador es preferentemente un oligodesoxirribonucleótido monocatenario. El cebador incluye una "región de hibridación" exacta o sustancialmente complementaria con la secuencia diana, preferentemente con una longitud de aproximadamente 15 a aproximadamente 35 nucleótidos. Un oligonucleótido cebador puede consistir
55 totalmente en la región de hibridación o de contener características adicionales que permitan la detección, inmovilización, o manipulación del producto amplificado, pero que no alteran la capacidad del cebador para servir como un reactivo de partida para la síntesis de ADN. Por ejemplo, una cola de secuencia de ácidos nucleicos puede estar incluida en el extremo la posición 5’ del cebador que se hibrida a un oligonucleótido de captura.
El término "sonda" se refiere a un oligonucleótido que se hibrida de forma selectiva a un ácido nucleico diana en condiciones adecuadas. Una sonda para detección de las secuencias de biomarcador que se describen en el presente documento puede tener cualquier longitud, por ejemplo, una longitud de 15-500 pb. Por lo general, ensayos basados en sonda, las sondas de hibridación que tienen menos de 50 pb son precedentes.
65 La expresión "secuencia diana" o "región diana" se refiere una región de un ácido nucleico que se va a analizar y que comprende la secuencia de interés.
Como se usa el presente documento, los términos "ácido nucleico", "polinucleótido" y "oligonucleótido" se refieren a cebadores, sondas, y fragmentos de oligómero. Los términos no están limitados por la longitud y son genéricos para polímeros lineales de polidexosirribonucleótidos (que contienen 2-desoxi-D-ribosa), polirribonucleótidos (que contienen D-ribosa), y cualquier otro N-glicósido de una base purina o pirimidina, o bases purina o pirimidina
5 modificadas. Estos términos incluyen ADN bi-y mono-catenario, así como ARN bi-y mono-catenario. Los oligonucleótidos para su uso en la invención se pueden usar como cebadores y/o sondas.
Un ácido nucleico, polinucleótido u oligonucleótido puede comprender enlaces fosfodiéster o enlaces modificados que incluyen, pero no se limitan a, fosfotriéster, fosforamidato, siloxano, carbonato, carboximetiléster, acetamidato, carbamato, tioéter, fosforamidato unido por puente, fosfonato de metileno unido por puente, fosforotioato, metilfosfonato, fosforoditioato, enlaces fosforotioato o sulfona unidos por puente, y combinaciones de los enlaces de este tipo.
Un ácido nucleico, polinucleótido u oligonucleótido puede comprender las cinco bases de origen biológico (adenina,
15 guanina, timina, citosina y uracilo) y/o bases distintas de las cinco bases de origen biológico. Estas bases pueden servir para una serie de fines, por ejemplo, para estabilizar o desestabilizar la hibridación; para estimular o inhibir la degradación de sondas; o como puntos de unión para restos detectables o restos inactivadores. Por ejemplo, un polinucleótido la invención puede contener uno o más restos de base modificados, no convencionales, o derivatizados, incluyen, pero no se limitan a, N6-metil-adenina, N6-terc-butilbencil-adenina, imidazol, imidazoles sustituidos, 5-fluorouracilo, 5 bromouracilo, 5-clorouracilo, 5-yodouracilo, hipoxantina, xantina, 4-acetilcitosina, 5 (carboxihidroximetil)uracilo, 5 carboximetilaminometil-2-tiouridina, 5 carboximetilaminometiluracilo, dihidrouracilo, beta-D-galactosilqueosina, inosina, N6 isopenteniladenina, 1-metilguanina, 1-metilinosina, 2,2-dimetilguanina, 2metiladenina, 2-metilguanina, 3-metilcitosina, 5-metilcitosina, N6-metiladenina, 7-metilguanina, 5metilaminometiluracilo, 5-metoxiaminometil-2-tiouracilo, beta-D manosilqueosina, 5’-metoxicarboximetiluracilo, 5
25 metoxiuracilo, 2-metil-N6-isopenteniladenina, ácido uracil-5-oxiacético (v), wibutoxosina, pseudouracilo, queosina, 2 tiocitosina, 5-metil-2-tiouracilo, 2-tiouracilo, 4-tiouracilo, 5-metiluracilo, éster de metilo del ácido uracil-5-oxiacético, 3(3-amino-3-N-2-carboxipropil) uracilo, (acp3)w, 2,6-di-aminopurina, y 5-propinil pirimidina. Otros ejemplos de restos de base modificados, no convencionales, o derivatizados se pueden encontrar en los documentos de Patente de Estados Unidos N.os 6.001.611; 5.955.589; 5.844.106; 5.789.562; 5.750.343; 5.728.525; y 5.679.785. Además, un ácido nucleico, polinucleótido u oligonucleótido puede comprender uno o más restos de azúcar modificado que incluyen, pero no se limitan a, arabinosa, 2-fluoroarabinosa, xilulosa, y una hexosa.
La expresión "elemento repetitivo" como se usa en el presente documento se refiere a un tramo de secuencia de ADN de al menos 25 nucleótidos de longitud que está presente en el genoma humano en al menos 50 copias.
35 Los términos "matrices", "micromatrices" y "chips de ADN" se usan indistintamente en el presente documento para hacer referencia a una matriz de distintos polinucleótidos fijados a un sustrato, tal como vidrio, plástico, papel, nailon u otro tipo de membrana, filtro, chip, perla, o cualquier otro soporte sólido adecuado. Los polinucleótidos Se pueden sintetizar directamente en el sustrato, o sintetizar por separado del sustrato y a continuación se pueden fijar al sustrato. Las matrices se preparan usando métodos conocidos.
Introducción
La invención se basa, al menos en parte, en la identificación de secuencias de CNA de regiones cromosómicas en
45 particular que están presentes o en una cantidad creciente en la sangre de pacientes que tienen cáncer de próstata, pero que en raras ocasiones, si lo estuvieran, están presentes, o en una cantidad menor, en la sangre pacientes normales que no tienen cáncer de próstata. La invención también se basa, en parte, en la identificación de biomarcadores en el CNA en individuos normales, es decir, en el contexto de la presente invención, individuos no diagnosticados con cáncer de próstata, pero que en raras ocasiones, si lo estuvieran, están presentes en pacientes con cáncer de próstata. Por lo tanto, la invención proporciona métodos y dispositivos para analizar la presencia de secuencias de una región cromosómica que corresponde a las regiones cromosómicas que se presentan en la Tabla 2, Tabla, 3, Tabla 4, o Tabla 5.
En consecuencia, en un aspecto, la divulgación proporciona un método para analizar CNA en una muestra (sangre,
55 suero, o plasma) de un paciente que comprende detectar la presencia, o una cantidad, de al menos un ADN exento de células en circulación que tiene una secuencia de nucleótidos de al menos 25 nucleótidos que se encuentra en una región cromosómica que se presenta en la Tabla 2, 3, 4, o 5 (o que tiene una secuencia de nucleótidos que es una parte de una de las secuencias que se presentan en la Tabla A, B, C, o D). Preferentemente, el ADN exento de células en circulación está exento de elemento repetitivo. En una realización, el paciente es un individuo del que se sospecha o a que se diagnostica con cáncer, por ejemplo, cáncer de próstata.
En el presente documento con "que se encuentra en" se hace referencia a que la secuencia de nucleótidos de un ADN exento de células en circulación es sustancialmente idéntica (por ejemplo, idéntica en más de un 95 %) a una parte de la secuencia de nucleótidos de una región del cromosoma. En otras palabras, el ADN exento de células en
65 circulación se puede hibridar en condiciones rigurosas, o se puede obtener a partir de, la región cromosómica.
En una realización, se proporciona un método para analizar ADN exento de células en circulación en una muestra de un paciente, que comprende determinar, en una muestra que es sangre, suero, o plasma, la presencia o la cantidad de, una pluralidad de moléculas de ADN exento de células en circulación cada una con una secuencia con una longitud de al menos 25 nucleótidos que se encuentra en la misma una sola región cromosómica que se presenta en 5 la Tabla 2, Tabla 3, Tabla 4, o Tabla 5 (o cada una con una secuencia de nucleótidos con una longitud de al menos 25 nucleótidos consecutivos que es parte de la misma secuencia que se presenta o en la Tabla A, Tabla B, Tabla C,
o Tabla D). Puede haber dos o más o cualquier número de diferentes moléculas de ADN exento de células en circulación toda las cuales se obtienen a partir de la misma una región cromosómica que se presenta en la Tabla 2, 3, 4, o 5. En algunos aspectos de la divulgación, se detectan todas las moléculas de ADN exento de células en circulación y/o se determinan las cantidades de las mismas.
Preferentemente las secuencias de las moléculas de ADN exento de células en circulación están exentas de elementos repetitivos.
15 En una realización, se proporciona un método para analizar ADN exento de células en circulación en una muestra de un paciente, que comprende determinar, en una muestra que es sangre, suero, o plasma, la presencia o ausencia o la cantidad de, al menos 2, 3, 4, 5, 7, 8, 9, 10, 15, 20, 30, 40, o al menos 50 moléculas de ADN exento de células en circulación cada una con una secuencia de al menos 25 pares de bases que se encuentran en una región cromosómica diferente que se presenta en la Tabla 2, Tabla 3, Tabla 4, o Tabla 5 (o que tiene una secuencia de nucleótidos con una longitud de al menos 25, 40, 50, 60, 75 o 100 nucleótidos consecutivos que es parte de una de las secuencias que se presentan en la Tabla A, Tabla B, Tabla C, o Tabla D). Preferentemente las secuencias de las moléculas de ADN exento de células en circulación están exentas de elementos repetitivos. En realizaciones preferentes, las moléculas de ADN exento de células tienen secuencias que se encuentran en diferentes regiones cromosómicas en la misma tabla que se elige entre las Tablas 2-5. En una realización específica, se determina la
25 presencia o ausencia o las cantidades de, al menos 2, 3, 4, 5, 7, 8, 9, 10, 15, 20, o al menos 25, o de 30, 31, o 32, moléculas de ADN exento de células en circulación, encontrándose cada una de las secuencias en una región cromosómica diferente que se presenta en la Tabla 2 (o que tiene una secuencia de nucleótidos con una longitud de al menos 25, 40, 50, 60, 75 o 100 nucleótidos consecutivos que es parte de una de las secuencias que se presentan en la Tabla A). En otra realización específica, se determina la presencia o ausencia o las cantidades de, al menos 2, 3, 4, 5, 7, 8, 9, 10, o al menos 15, o de 20, 21, o 22, moléculas de ADN exento de células en circulación, encontrándose cada una de las secuencias en una región cromosómica diferente que se presenta en la Tabla 3 (o que tiene una secuencia de nucleótidos con una longitud de al menos 25, 40, 50, 60, 75 o 100 nucleótidos consecutivos que es parte de una de las secuencias que se presentan en la Tabla B). En una realización específica, se determina la presencia o ausencia o las cantidades de, al menos 2, 3, 4, 5, 7, 8, 9, 10, 15, 20, 25, 30, 35, 50, 45,
35 o 50, o de 52, moléculas de ADN exento de células en circulación, encontrándose cada una de las secuencias en una región cromosómica diferente que se presenta en la Tabla 4 (o que tiene una secuencia de nucleótidos con una longitud de al menos 25, 40, 50, 60, 75 o 100 nucleótidos consecutivos que es parte de una de las secuencias que se presentan en la Tabla C). Además en otra realización específica, se determina la presencia o ausencia o las cantidades de, en 1, 2, 3, o 4 moléculas de ADN exento de células en circulación, cada una teniendo una secuencia que se encuentra en una región cromosómica diferente que se presenta en la Tabla 5 (o que tiene una secuencia de nucleótidos con una longitud de al menos 25, 40, 50, 60, 75 o 100 nucleótidos consecutivos que es parte de una de las secuencias que se presentan en la Tabla D).
En una realización específica, el método para analizar ADN exento de células en circulación incluye las etapas de:
45 aislar, a partir de una muestra de sangre, suero, o plasma de un paciente, sustancialmente todas las moléculas de ADN exento de células en circulación que tengan una longitud de al menos 20, 25, 30, 40, 50, 75 o 100 nucleótidos consecutivos de longitud, o una longitud entre 50 y 400 nucleótidos, obtener la secuencia de cada una de las moléculas de ADN exento de células en circulación, y comparar la secuencia con una o más de las secuencias que se presentan en la Tablas A-D para determinar si la secuencia se encuentra en una región cromosómica que se presenta en la Tabla 2, 3, 4, o 5.
En otra realización específica, el método para analizar ADN exento de células en circulación incluye las etapas de: aislar, a partir de una muestra de sangre, suero, o plasma de un paciente, sustancialmente todas las moléculas de ADN exento de células en circulación que tengan una longitud de al menos 20, 25, 30, 40, 50, 75 o 100 nucleótidos
55 consecutivos de longitud, o una longitud entre 50 y 400 nucleótidos, y poner en contacto las moléculas de ADN exento de células en circulación con una pluralidad de oligonucleótidos (por ejemplo, en un chip o micromatriz de ADN) para determinar si una de las moléculas de ADN exento de células circulación se hibrida a una cualquiera de la pluralidad de sondas de oligonucleótidos en condiciones rigurosas. Cada una de las sondas de oligonucleótidos tiene una secuencia de nucleótidos idéntica a una parte de la secuencia de una región cromosómica elegida entre las Tablas 2-5 (o una secuencia que se presenta en la Tablas A-D). Por lo tanto, si una molécula de ADN en circulación se hibrida en condiciones rigurosas a una de las sondas de oligonucleótidos, esto indica que la molécula de ADN en circulación tiene una secuencia de nucleótidos que se encuentra en una región cromosómica que se presenta en la Tabla 2, Tabla 3, Tabla 4, o Tabla 5.
65 En las diversas realizaciones mencionadas anteriormente, las moléculas de ADN exento de células en circulación tienen preferentemente una longitud de al menos 25 nucleótidos consecutivos (preferentemente una longitud de al
menos 50, 70, 80, 100, 120 o 200 nucleótidos consecutivos). Más preferentemente, las moléculas de ADN exento de células en circulación tienen entre aproximadamente 50 y aproximadamente 300 o 400, preferentemente de aproximadamente 75 y aproximadamente 300 o 400, más preferentemente de aproximadamente 100 a aproximadamente 200 nucleótidos consecutivos de una secuencia única que se encuentra en una región
5 cromosómica , se presenta en la Tabla 2, Tabla 3, Tabla 4, o Tabla 5 (o de una única secuencia que se presenta en la Tabla A, Tabla B, Tabla C, o Tabla D).
En otro aspecto, la presente divulgación proporciona un método para diagnosticar o identificar sistemáticamente cáncer de próstata en un paciente. El método incluye las etapas de: (a) determinar, en una muestra que es sangre, suero, o plasma de un paciente, la presencia o ausencia o la cantidad de, al menos 1, 2, 3, 4, 5, 7, 8, 9, 10, 15, 20, 30, 40, o al menos 50 moléculas de ADN exento de células en circulación cada una con una secuencia con una longitud de al menos 25 nucleótidos que se encuentra en una región cromosómica diferente que se presenta en la Tabla 2, Tabla 3, o Tabla 4 (o que tiene una secuencia de nucleótidos con una longitud de al menos 25 nucleótidos consecutivos que es parte de una de las secuencias que se presentan en la Tabla A, Tabla B, o Tabla C); y (b)
15 correlacionar la presencia o un aumento de la cantidad de los ADN exentos de células en circulación con un aumento de la probabilidad de que el paciente tenga cáncer de próstata.
Como alternativa, el método de la divulgación incluye las etapas de: (a) determinar, en una muestra que es sangre, suero, o plasma de un paciente, la presencia o ausencia o la cantidad de 1, 2, 3, o 4 moléculas de ADN exento de células en circulación cada una con una secuencia con una longitud de al menos 25 nucleótidos que se encuentra en una región cromosómica diferente que se presenta en la Tabla 5 (o que tiene una secuencia de nucleótidos con una longitud de al menos 25 nucleótidos consecutivos que es parte de una de las secuencias que se presentan en la Tabla D); y (b) correlacionar la presencia o un aumento de la cantidad de los ADN exentos de células en circulación con una disminución de la probabilidad de que el paciente tenga cáncer de próstata.
25 Cuando las etapas de los métodos mencionados anteriormente se aplican a un paciente con diagnóstico de cáncer, el paciente se puede controlar para el estado de cáncer de próstata, o para determinar el efecto del tratamiento de un régimen de tratamiento en particular, o para detectar la recurrencia o recaída del cáncer.
En el método de diagnóstico/control de la presente divulgación, las secuencias de las moléculas de ADN exento de células en circulación están preferentemente exentas de elementos repetitivos. En realizaciones preferentes, las moléculas de ADN exento de células tienen secuencias que se encuentran en diferentes regiones cromosómicas en la misma tabla elegida entre las Tablas 2-5.
35 En una realización, se proporciona un método para diagnosticar cáncer de próstata en un individuo, que comprende
(a) determinar la presencia o ausencia o las cantidades de, al menos 2, 3, 4, 5, 7, 8, 9, 10, 15, 20, o al menos 25, o de 30, 31, o 32, moléculas de ADN exento de células en circulación encontrándose cada una de las secuencias en una región cromosómica diferente que se presenta en la Tabla 2 (o que tiene una secuencia de nucleótidos con una longitud de al menos 25 nucleótidos consecutivos que es una parte de una de las secuencias que se presentan en la Tabla A); y (b) correlacionar la presencia, o un aumento de la cantidad, de una o más de las moléculas de ADN exento de células en circulación con un aumento de la probabilidad de que el individuo tenga cáncer de próstata o una recurrencia de cáncer de próstata o un fracaso en el tratamiento para el cáncer de próstata.
En otra realización, se proporciona un método para diagnosticar cáncer de próstata en un individuo, que comprende
45 (a) determinar la presencia o ausencia o las cantidades de, al menos 2, 3, 4, 5, 7, 8, 9, 10, o al menos 15, o de 20, 21, o 22, moléculas de ADN exento de células en circulación encontrándose cada una de las secuencias en una región cromosómica diferente que se presenta en la Tabla 3 (o que tiene una secuencia de nucleótidos con una longitud de al menos 25 nucleótidos consecutivos que es una parte de una de las secuencias que se presentan en la Tabla B); y (b) correlacionar la presencia, o un aumento de la cantidad, de una o más de las moléculas de ADN exento de células en circulación con un aumento de la probabilidad de que el individuo tenga cáncer de próstata o una recurrencia de cáncer de próstata o un fracaso en el tratamiento para el cáncer de próstata.
En una realización, se proporciona un método para diagnosticar cáncer de próstata en un individuo, que comprende
(a) determinar la presencia o ausencia o las cantidades de, al menos 2, 3, 4, 5, 7, 8, 9, 10, 15, 20, 25, 30, 35, 40, 45,
55 o 50, o de 52, moléculas de ADN exento de células en circulación encontrándose cada una de las secuencias en una región cromosómica diferente que se presenta en la Tabla 4 (o que tiene una secuencia de nucleótidos con una longitud de al menos 25 nucleótidos consecutivos que es una parte de una de las secuencias que se presentan en la Tabla C); y (b) correlacionar la presencia, o un aumento de la cantidad, de una o más de las moléculas de ADN exento de células en circulación con un aumento de la probabilidad de que el individuo tenga cáncer de próstata o una recurrencia de cáncer de próstata o un fracaso en el tratamiento para el cáncer de próstata.
En una realización, se proporciona un método para diagnosticar/controlar el cáncer de próstata en un individuo, que comprende (a) determinar la presencia o ausencia o las cantidades de, 1, 2, 3, o 4 moléculas de ADN exento de células en circulación encontrándose cada una de las secuencias en una región cromosómica diferente que se 65 presenta en la Tabla 5 (o que tiene una secuencia de nucleótidos con una longitud de al menos 25 nucleótidos consecutivos que es una parte de una de las secuencias que se presentan en la Tabla D); y (b) correlacionar la
presencia, o un aumento de la cantidad, de una o más de las moléculas de ADN exento de células en circulación con un aumento de la probabilidad de que el individuo no tenga cáncer de próstata o una recurrencia de cáncer de próstata o un fracaso en el tratamiento para el cáncer de próstata.
5 Además en otra realización, el método para diagnosticar, controlar o identificar sistemáticamente el cáncer de próstata en un paciente, incluye determinar, en una muestra que es sangre, suero, o plasma del paciente, la presencia o ausencia o la cantidad total, de todos y cada uno de los ADN exentos de células en circulación cada uno teniendo una secuencia que se encuentra en la misma una sola región cromosómica que se presenta en la Tabla 2, Tabla 3, o Tabla 4; y correlacionar la presencia de uno de dichos ADN exentos de células en circulación o un aumento de la cantidad total de dichos ADN exentos de células en circulación, con un aumento de la probabilidad de que dicho paciente tenga cáncer de próstata, o recurrencia de cáncer de próstata. En otras palabras, puede haber cualquier número, y por lo general muchas, moléculas de ADN exento de células en circulación diferentes obtenidas a partir de una sola misma región cromosómica que se presenta en la Tabla 2, Tabla 3, o Tabla 4, y se detectan todas las moléculas de ADN exento de células en circulación diferentes mencionadas y/o se determina la
15 cantidad/de todas y cada una de ellas, y se realiza una correlación con el estado del cáncer de próstata.
En una realización específica, sustancialmente todas las moléculas de ADN exento de células en circulación que tengan una longitud de al menos 20, 25, 30, 40, 50, 75 o 100 nucleótidos consecutivos de longitud, o con una longitud entre 50 y 400 nucleótidos, se aíslan de una muestra de sangre, suero, o plasma de un paciente. La secuencia de cada una de las moléculas de ADN exento de células en circulación se determina, y se compara con una o más de las secuencias que se presentan en la Tablas A-D para determinar si la secuencia de un ADN exento de células en circulación se encuentra en una región cromosómica que se presenta en la Tabla 2, Tabla 3, o Tabla 4. Si fuera así, se realiza un diagnóstico de cáncer de próstata. En el caso de un paciente tratado con una terapia para el cáncer de próstata, la recurrencia se indica si se detecta un ADN exento de células en circulación se encuentra en
25 una región cromosómica que se presenta en la Tabla 2, Tabla 3, o Tabla 4. En realizaciones preferentes, un diagnóstico de fracaso en el tratamiento o recurrencia del cáncer de próstata o cáncer de próstata se indica si dos o más moléculas de ADN exento de células en circulación se encuentran en 2, 3, 4 o las regiones cromosómicas que se presentan en la Tablas 2-4, estando preferentemente todas las regiones cromosómicas de este tipo en la misma tabla.
En otra realización específica, sustancialmente todas las moléculas de ADN exento de células en circulación que tengan una longitud de al menos 20, 25, 30, 40, 50, 75 o 100 nucleótidos consecutivos de longitud, o una longitud entre 50 y 400 nucleótidos, se aíslan de una muestra de sangre, suero, o plasma de un paciente. Estas moléculas de ADN exento de células en circulación se hibridan a una micromatriz que se ha descrito anteriormente en el contexto 35 del kit de la invención para determinar si una de las moléculas de ADN exento de células circulación se hibrida a una de una pluralidad de sondas de oligonucleótidos en condiciones rigurosas. Cada una de las sondas de oligonucleótidos tiene una secuencia de nucleótidos idéntica a una parte de la secuencia de una región cromosómica elegida entre las Tablas 2-5 o una secuencia que se presenta en la Tablas A-D). Por lo tanto, si una molécula de ADN en circulación se indica en condiciones rigurosas a una de las sondas de oligonucleótidos, esto indica que la molécula de ADN en circulación tiene una secuencia de nucleótidos que se encuentra en una región cromosómica que se presenta en la Tabla 2, Tabla 3, o Tabla 4. Si fuera así, se realiza un diagnóstico de cáncer de próstata. En el caso de un paciente tratado con una terapia para el cáncer de próstata, la recurrencia se indica si se detecta un ADN exento de células en circulación se encuentra en una región cromosómica que se presenta en la Tabla 2, Tabla 3, o Tabla 4. En realizaciones preferentes, un diagnóstico de cáncer de próstata o fracaso del tratamiento para el cáncer
45 de próstata o recurrencia se indica si dos o más moléculas de ADN exento de células en circulación se encuentran en 2, 3, 4 o más regiones cromosómicas que se presentan en las Tablas 2-4, estando preferentemente todas las regiones cromosómicas de este tipo en la misma tabla, por ejemplo, Tabla 2, Tabla 3, o Tabla 4.
En las diversas realizaciones mencionadas anteriormente, preferentemente las moléculas de ADN exento de células en circulación tienen una longitud de al menos 25 nucleótidos consecutivos (preferentemente una longitud de al menos 50, 70, 80, 100, 120 o 200 nucleótidos consecutivos). Más preferentemente, las moléculas de ADN exento de células en circulación tienen entre aproximadamente 50 y aproximadamente 300 o 400, preferentemente de aproximadamente 75 a aproximadamente 300 o 400, más preferentemente de aproximadamente 100 a aproximadamente 200 nucleótidos consecutivos de una secuencia única que se encuentra en una región
55 cromosómica como se presenta en las Tablas 2-5 (o de una secuencia única que se presenta en las Tablas A-D).
Detección de ácidos nucleicos en circulación en la sangre
Para detectar la presencia de ácidos nucleicos en circulación en la sangre de pacientes que pueden tener, o de los que se sospecha que tienen, cáncer de próstata, se obtiene una muestra de sangre del paciente. A continuación el suero o plasma de la muestra de sangre se analiza para la presencia de un ADN exento de células en circulación o biomarcador como se describe en el presente documento. Los ácidos nucleicos se pueden aislar a partir de suero o plasma usando técnicas bien conocidas, véase, por ejemplo, la sección de ejemplos. En el contexto de la presente invención, las secuencias de ácidos nucleicos que se analizan son secuencias de ADN. Por lo tanto, en esta
65 sección, los métodos que se describen como "ácidos nucleicos" de evaluación se refieren a la evaluación del ADN.
Las técnicas de detección para evaluar ácidos nucleicos para la presencia de un biomarcador implican procedimientos bien conocidos en el campo de la genética molecular. Además, muchos de los métodos implican la amplificación de ácidos nucleicos. En la técnica se proporcionan amplias directrices para su realización. Las referencias a modo de ejemplo incluyen manuales tales como PCR Technology: Principles and Applications for DNA
5 Amplification (ed. H. A. Erlich, Freeman Press, NY, N.Y., 1992); PCR Protocols: A Guide to Methods and Applications (eds. Innis, et al., Academic Press, San Diego, Calif., 1990); Current Protocols in Molecular Biology, Ausubel, 1994-1999, incluyendo actualizaciones complementarias hasta abril de 2004; Sambrook y Russell, Molecular Cloning, A Laboratory Manual (3ª Ed, 2001).
Aunque los métodos pueden usar etapas de PCR, también se pueden usar otros protocolos de amplificación. Los métodos de amplificación adecuados incluyen reacción en cadena de ligasa (véase, por ejemplo, Wu y Wallace, Genomics 4: 560-569, 1988); ensayo de desplazamiento de hebra (véase, por ejemplo, Walker et al., Proc. Natl. Acad. Sci. USA 89: 392-396, 1992; documento de Patente de Estados Unidos N.º 5.455.166); y varios sistemas de amplificación basados en transcripción, incluyendo los métodos que se describen en los documentos de Patente de
15 Estados Unidos N.os 5.437.990; 5.409.818; y 5.399.491; el sistema de amplificación de la transcripción (TAS) (Kwoh et al., Proc. Natl. Acad. Sci. USA 86: 1173-1177, 1989); y replicación de secuencias auto-sostenida (3SR) (Guatelli et al., Proc. Natl. Acad. Sci. USA 87: 1874-1878, 1990; documento WO 92/08800). Como alternativa, se pueden usar métodos que amplifican la sonda hasta niveles detectables, tales como amplificación de Qβ-replicasa (Kramer y Lizardi, Nature 339: 401-402, 1989; Lomeli et al., Clin. Chem. 35: 1826-1831, 1989). Abramson y Myers proporcionan una revisión de métodos de amplificación conocidos se proporciona, por ejemplo, en Current Opinion in Biotechnology 4: 41-47, 1993.
En algunas realizaciones, la detección de un biomarcador en el CNA de un paciente se realiza usando cebadores y/o sondas de oligonucleótidos para detectar una secuencia diana, en la que la secuencia diana está presente en (por
25 ejemplo, comprende alguna parte asignada de modo inequívoco de) cualquiera de las regiones cromosómicas que se enumeran en la Tabla 2, Tabla 3, Tabla 4, o Tabla 5). Los oligonucleótidos se pueden preparar mediante cualquier método adecuado, normalmente mediante síntesis química, y también se pueden adquirir en fuentes comerciales. Los oligonucleótidos pueden incluir uniones de fosfodiéster modificado (por ejemplo, fosforotioato, metilfosfonatos, fosfoamidato, o boranofosfato) o se pueden usar uniones distintas a un derivado del ácido fosforoso en un oligonucleótido para evitar la escisión en un sitio seleccionado. Además, el uso de azúcares modificados con 2’-amino tiende a favorecer el desplazamiento con respecto a la digestión del oligonucleótido cuando se hibrida a un ácido nucleico certamen es el mol de para la síntesis de una nueva hebra de ácido nucleico.
En una realización, el biomarcador se identifica mediante hibridación en condiciones de hibridación específicas de
35 secuencia con una sonda que se dirige a una región cromosómica que se describe en el presente documento. La sonda usada para este análisis puede ser una sonda larga o conjuntos para sondas de oligonucleótidos cortos, por ejemplo, se pueden usar sondas con una longitud de aproximadamente 20 a aproximadamente 150 nucleótidos.
Los formatos de hibridación adecuados se conocen bien la técnica, e incluyen, pero no se limitan a, ensayos en fase de solución, fase sólida, formatos de matriz de oligonucleótidos, fase mixta, o hibridación in situ. En las hibridaciones en fase de solución (o liquida), tanto el ácido nucleico diana como la sonda o cebadores son libres de interactuar en la mezcla de reacción. También se han desarrollado técnicas tales como sistemas de PCR en tiempo real que permiten el análisis, por ejemplo, cuantificación, de productos amplificados durante una reacción de PCR. En este tipo de reacción, la hibridación con una sonda de oligonucleótidos específica se produce durante el programa de
45 amplificación para identificar la presencia de un ácido nucleico diana. La hibridación de sondas de oligonucleótido asegura la especificidad más elevada debido a la transición en dos estados termodinámicamente controlados. Los ejemplos para estos formatos de ensayo son sondas de hibridación por transferencia de energía de resonancia fluorescente, sondas moleculares, sondas moleculares Scorpion, y sondas de hibridación de exonucleasa (por ejemplo, revisado en Bustin, J. Mol. Endocrin. 25: 169-93, 2000).
Los formatos de ensayo adecuados incluyen formatos basados en matriz, descritos con mayor detalle a continuación en la sección de "Dispositivos", en los que la sonda por lo general inmovilizada. Como alternativa, la diana se puede inmovilizar.
55 En un formato en el que la diana está inmovilizada, el ADN diana amplificado se inmoviliza sobre un soporte sólido y el complejo diana se incuba con la sonda en condiciones de hibridación en adecuadas, la sonda no hibridada se retira mediante lavado en condiciones rigurosas adecuadas, del soporte sólido se controla para la presencia de la sonda unida. Los formatos en los que las sondas se inmovilizan sobre un soporte sólido, el ADN diana por lo general se etiqueta, normalmente durante la amplificación. La sonda inmovilizada se incuba con el ADN diana amplificado en condiciones de hibridación adecuadas, el ADN diana no hibridado se retira mediante lavado en condiciones rigurosas adecuadas, y el soporte sólido/sonda se controla para la presencia de ADN diana unido.
En realizaciones habituales, sobre un soporte sólido se inmovilizan múltiples sondas y las regiones cromosómicas diana en el CNA de un paciente se analizan usando las múltiples sondas de forma simultánea. En el documento WO
65 95/11995 se describen ejemplos del uso de múltiples sondas de manera simultánea.
En un método sin sonda alternativo, el ácido nucleico amplificado que corresponde a un ácido nucleico diana presente en una región cromosómica se realiza usando cebadores de ácido nucleico para la región cromosómica y se detecta controlando el aumento de la cantidad total de ADN bicatenario en la mezcla de reacción, se describe, Por ejemplo en el documento de Patente de Estados Unidos N.º 5.994.056; y en las Publicaciones de Patente
5 Europea N.os 487.218 y 512.334. La detección de ADN diana bicatenario depende de diversos colorantes de unión a ADN con aumento de fluorescencia, por ejemplo, Verde SYBR, que se presenta cuando se unen a ADN bicatenario.
Como observará cualquiera en la técnica, se pueden realizar métodos de amplificación específicos en reacción que usan múltiples cebadores para dirigirse a las regiones cromosómicas de modo que el biomarcador se pueda cubrir de forma adecuada.
Secuenciación de ADN
En realizaciones preferentes, la presencia de una secuencia de una región cromosómica que se presenta en la
15 Tabla 2, Tabla 3, Tabla 4 o Tabla 5 en el CNA de un paciente que se somete a evaluación se detecta mediante secuenciación directa. La secuenciación de este tipo, usando especialmente los sistemas de secuenciación Roche 454, Illumina, y Applied Biosystems mencionados a continuación o sistemas de secuenciación avanzada similares, puede incluir cuantificación (es decir, determinación del nivel) de ácidos nucleicos con una secuencia en particular. La cuantificación de este tipo se puede usar en las realizaciones de la invención que implican la determinación del nivel de un biomarcador (algunas realizaciones de las cuales implican la correlación de un nivel en particular con respecto a la presencia o ausencia de cáncer). Los métodos incluyen, por ejemplo, métodos basados en secuenciación de didesoxi aunque también se conocen otros métodos tales como la secuenciación de Maxam y Gilbert (véase, por ejemplo, Sambrook y Russell, mencionado anteriormente). En realizaciones habituales, el CNA de un paciente se secuencia usando un método de secuenciación a gran escala que proporciona la capacidad de
25 obtener información de secuencias a partir de muchas lecturas. Las plataformas de secuenciación de este tipo incluyen las comercializadas por Roche 454 Life Sciences (GS systems), Illumina (por ejemplo, HiSeq, MiSeq) y Applied Biosystems (por ejemplo, sistemas SOLiD).
La plataforma de secuenciación Roche 454 Life Sciences implica el uso de PCR de emulsión y fragmentos de ADN en inmovilización sobre perla. La incorporación de nucleótidos durante la síntesis se detecta midiendo la luz que se genera cuando se incorpora un nucleótido.
La tecnología Illumina implica la unión de ADN genómico fragmentado de forma aleatoria a una superficie ópticamente transparente, plana. Los fragmentos de ADN unidos se prolongan y se amplifican por puente para crear
35 una celda de flujo de secuenciación de densidad ultraelevada con grupos que contienen copias del mismo molde. Estos moldes se secuencian usando una tecnología de secuenciación por síntesis que usa terminadores reversibles con colorantes fluorescentes que se pueden retirar.
También se pueden usar métodos que usan secuenciación mediante hibridación. Los métodos de este tipo, por ejemplo, usados en la tecnología ABI SOLiD4+ usan una combinación de todos los posibles oligonucleótidos de una longitud fija, etiquetados de acuerdo con una posición secuenciada. Los oligonucleótidos se hibridan y se ligan; La liberación preferente mediante ADN ligasa para emparejamiento de secuencias da como resultado una señal informativa del oligonucleótido en esa posición.
45 La secuencia se puede determinar usando cualquier otro método de secuenciación de ADN que incluye, por ejemplo, métodos que usan tecnología de semiconductor para detectar nucleótidos que se incorporan en un cebador ampliado midiendo cambios en la corriente que se producen cuando se incorpora un nucleótido (véanse, por ejemplo, las Publicaciones de Solicitud de Patente de Estados Unidos N.os 20090127589 y 20100035252). Otras técnicas incluyen secuenciación de exonucleasa sin etiqueta directa en la que los nucleótidos escindidos del ácido nucleico se detectan pasando a través de un nanoporo (Oxford Nanopore) (Clark et al., Nature Nanotechnology 4: 265 -270, 2009); y tecnología de secuenciación de ADN en Tiempo Real de una Sola Molécula (SMRT™) (Pacific Biosciences), que es una técnica de secuenciación mediante síntesis.
Dispositivos y Kits
55 En un aspecto adicional, la divulgación proporciona dispositivos y kits de diagnóstico útiles para identificar uno o más biomarcadores asociados con el cáncer de próstata en el CNA de un paciente en el que el uno o más biomarcadores es una secuencia que corresponde a cualquiera de las regiones cromosómicas que se presentan en la Tabla 2, Tabla 3, Tabla 4, o Tabla 5. Como será evidente para los expertos en la materia, el kit de la presente divulgación es útil en el método discutido anteriormente para analizar el ADN exento de células en circulación en una muestra de un paciente y para diagnosticar, identificar sistemáticamente o controlar el cáncer de próstata como se ha descrito anteriormente.
Por lo tanto, en un aspecto, la presente divulgación proporciona el uso de al menos un oligonucleótido para
65 preparación de un kit de diagnóstico útil para diagnosticar, identificar sistemáticamente o controlar el cáncer de próstata. La secuencia de nucleótidos del oligonucleótido se encuentra en una región cromosómica que se presenta
en la Tabla 2, Tabla 3, Tabla 4, o Tabla 5 (o se empareja con una parte de una secuencia que se presenta en la Tabla A, Tabla B, Tabla C, o Tabla D).
Preferentemente, el kit de la presente vinculación incluye uno, dos o más (por ejemplo, al menos 1, 2, 3, 4, 5, 6, 7, 8,
5 9, 10, 12, 15, 20, 25, 30, 40 o al menos 50, pero preferentemente menos de 111, preferentemente de uno a aproximadamente 50, más preferentemente de 2 a aproximadamente 50, o de 3 a aproximadamente 50 conjuntos de oligonucleótidos. Cada conjunto comprende uno o más oligonucleótidos (por ejemplo, de aproximadamente uno A aproximadamente 10.000, preferentemente de 50, 100, 200 o 300 a aproximadamente 10.000). Todas las secuencias de nucleótidos de uno o más oligonucleótidos de este tipo en cada conjunto se encuentran en la misma una sola región cromosómica que se presenta en la Tabla 2, Tabla 3, Tabla 4, o Tabla 5 (o se emparejan con una parte de la misma una sola secuencia que se presenta en la Tabla A, Tabla B, Tabla C, o Tabla D). Cada oligonucleótido debería tener de aproximadamente 18 a 100 nucleótidos, o de 20 a aproximadamente 50 Nucleótidos, y debería ser capaz de hibridarse, en condiciones de hibridación rigurosas, a la región cromosómica en la que se encuentra la secuencia. Los oligonucleótidos son útiles como sondas para detectar moléculas de ADN
15 exento de células en circulación obtenidas a partir de las regiones cromosómicas. Preferentemente, cada conjunto incluye un número de oligonucleótido suficiente con secuencias de las que se forman mapas para una región cromosómica de modo que cualquier molécula de ADN exento de células en circulación obtenida a partir de la región cromosómica se puede detectar con el conjunto de oligonucleótidos. Por lo tanto, el número de oligonucleótidos necesarios en cada conjunto se determina mediante la longitud total de una única secuencia de nucleótidos de una región cromosómica en particular, como será evidente para los expertos en la materia. Las longitudes totales de este tipo se indican en las Tablas 2-5 y deberían ser evidentes a partir de las Tablas A-D.
Preferentemente, en el kit de la presente divulgación, diferentes conjuntos de oligonucleótidos corresponden a diferentes regiones cromosómicas dentro de la misma tabla. Preferentemente, los oligonucleótidos están exentos de
25 elemento repetitivo. Opcionalmente, los oligonucleótidos se unen a uno o más sustratos sólidos tales como are microchips y perlas. En realizaciones preferentes, el kit es una micromatriz con los oligonucleótidos mencionados anteriormente.
En una realización, el kit de la presente divulgación incluye una pluralidad de conjuntos de oligonucleótidos capaces de hibridarse a las regiones cromosómicas que se presentan en la Tabla 2, Tabla 3, Tabla 4, y en la Tabla 5, respectivamente. Es decir, el kit incluye sondas de oligonucleótidos que corresponden a todas y cada una de las regiones cromosómicas que se presentan en las Tablas 2, 3, 4, y 5 (o que se emparejan con todas y cada una de las secuencias que se presentan en las Tablas A, B, C, y que D) de modo que todos los ADN exentos de células en circulación obtenidos a partir de cualquier región cromosómica que se presenta en las Tablas 2-5 se pueden detectar
35 usando el kit.
También se contempla el uso de los oligonucleótidos incluidos en el kit descrito para la preparación del kit útil para diagnosticar, identificar sistemáticamente o controlar el cáncer de próstata. La preparación de un kit de este tipo debería ser evidente para un experto en la materia.
En algunas realizaciones, un dispositivo de diagnóstico comprende sondas para detectar al menos 2, 3, 4, 5, 6, 7, 8, 9, 10, 15, 20, 30, 40, 50, 60, 75, o 100, o las 110 regiones cromosómicas que se presentan en las Tablas 2-5. En algunos aspectos, la presente divulgación proporciona sondas unidas a un soporte sólido, tal como un portaobjetos o chip de matriz, por ejemplo, como se describe en DNA Microarrays: A Molecular Cloning Manual, 2003, Eds. Bowtell
45 y Sambrook, Cold Spring Harbor Laboratory Press. La construcción de los dispositivos de este tipo se conoce bien en la técnica, por ejemplo como se describe en los documentos de Patente de Estados Unidos y en las Publicaciones de Patente de Estados Unidos N.º 5.837.832; solicitud de PCT WO95/11995; documento de Patente de Estados Unidos N.º 5.807.522; documentos de Patente de Estados Unidos N.os 7.157.229, 7.083.975, 6.444.175, 6.375.903, 6.315.958, 6.295.153, y 5.143.854, documentos 2007/0037274, 2007/0140906, 2004/0126757, 2004/0110212, 2004/0110211, 2003/0143550, 2003/0003032, y 2002/0041420. Las matrices de ácido nucleico también se revisan en las siguientes referencias: Biotechnol Annu Rev 8: 85-101 (2002); Sosnowski et al., Psychiatr Genet 12 (4): 181-92 (diciembre de 2002); Heller, Annu Rev Biomed Eng 4: 129-53 (2002); Kolchinsky et al., Hum. Mutat 19 (4): 343-60 (abril de 2002); y McGail et al., Adv Biochem Eng Biotechnol 77: 21-42 (2002).
55 En una matriz se puede poner en práctica cualquier número de sondas. Un conjunto de sondas que se hibrida a segmentos diferentes, preferentemente únicos de una región cromosómica se pueden usar cuando el conjunto de sondas detecta cualquier parte de la región cromosómica. Como alternativa, una sola sonda para una región cromosómica se puede inmovilizar en una superficie sólida. La sonda de polinucleótidos se puede sintetizar en áreas designadas (o se puede sintetizar por separado y a continuación fijar en las áreas designadas) sobre un sustrato, por ejemplo, usando un proceso químico dirigido por luz. Los polinucleótido sintéticos habituales pueden tener una longitud de aproximadamente 15-200 nucleótidos.
El kit puede incluir múltiples reactivos de detección de biomarcadores, o uno o más reactivos de detección de biomarcadores en combinación con u otros tipos más de elementos o componentes (por ejemplo, otros tipos de 65 reactivos bioquímicos, contenedores, paquetes tales como paquetes destinados la venta comercial, sustratos a los que se unen reactivos de detección de biomarcador, componentes de hardware electrónicos, etc.). En consecuencia,
la presente divulgación proporciona adicionalmente kits y sistemas de detección de biomarcadores, que incluyen, pero no se limitan a, matrices/micromatrices de moléculas de ácido nucleico, y perlas que contienen una o más sondas u otros reactivos de detección para detectar uno o más biomarcadores de la presente divulgación. Los kits pueden incluir opcionalmente diversos componentes de hardware electrónicos; por ejemplo, matrices ("chips de
5 ADN") y sistemas microfluidos (sistemas de "lab sobre un chip") proporcionados por diversos fabricantes que por lo general comprenden componentes de hardware. Otros kits pueden no incluir componentes de hardware electrónicos, pero pueden estar formados, por ejemplo, por uno o más reactivos de detección de biomarcador (junto con, opcionalmente, otros reactivos bioquímicos) empaquetados en uno o más contenedores.
Los kits/sistemas de detección de biomarcador pueden contener, por ejemplo, una o más sondas, o conjuntos de sondas, que se hibridan a una molécula de ácido nucleico presente en una región cromosómica que se presenta en las Tablas 2-5.
Un kit de detección de biomarcador de la presente divulgación puede incluir componentes que se usan para preparar 15 CNA de una muestra de sangre de un paciente para la posterior amplificación y/o detección de un biomarcador.
Correlación de la presencia de biomarcadores con cáncer de próstata
La presente divulgación proporciona métodos y reactivos para detectar la presencia de un biomarcador en El CNA de un paciente que tiene cáncer de próstata o que se está evaluando para determinar si el paciente puede tener cáncer de próstata. En el contexto de la divulgación, "detección" o "identificación" o "identificar la presencia" o "detectar la presencia" de un biomarcador asociado con el cáncer de próstata en una muestra de CNA de un paciente se refiere a la determinación de cualquier nivel del biomarcador en el CNA del paciente en el que el nivel es superior a un valor de umbral que distingue entre muestras de CNA de cáncer de próstata y sin cáncer de próstata
25 para un ensayo dado.
En la presente divulgación, por ejemplo la presencia de una cualquiera de las regiones cromosómicas (es decir, biomarcadores) enumerados en las Tablas 2-4 es indicativa de cáncer de próstata. Como puede observar alguien con experiencia en la materia, los biomarcadores se pueden usar para analizar una muestra de un paciente en la que el biomarcador también se ha observado de manera no frecuente en un paciente normal para aumentar la sensibilidad de la detección. Por ejemplo, se ha observado que los biomarcadores indicados con fuente negrita en las Tablas 2 y 3 están presentes de manera no frecuente en el CNA obtenido a partir de individuos normales; sin embargo, dada la baja frecuencia de aparición en muestras normales con respecto a la frecuencia de aparición más elevada en el cáncer de próstata, la presencia del biomarcador en un paciente indica que el paciente tiene una
35 probabilidad de un 95 % o superior de tener cáncer de próstata. Por lo tanto, por ejemplo, las matrices usadas para detectar las regiones cromosómicas pueden incluir las que identifican las regiones cromosómicas en las Tablas 2 y 3 que se indican en fuente negrita.
Los biomarcadores que se presentan en las Tablas 2-4 están asociados con el cáncer de próstata, es decir, están sobrerrepresentados en los pacientes con cáncer de próstata en comparación con los individuos que no tienen diagnóstico de cáncer de próstata. Por lo tanto, la detección de uno o más de los biomarcadores que se presentan en las Tablas 2-4 es indicativa de cáncer de próstata, es decir con el paciente presenta un aumento de la probabilidad de tener cáncer de próstata en comparación con un paciente que no tiene el biomarcador. En algunas realizaciones, la detección de dos o más biomarcadores que se presentan en las Tablas 2-4 en el CNA de un
45 paciente es indicativa de una mayor probabilidad de cáncer de próstata. Como se entiende en la técnica, otros criterios, por ejemplo, criterios clínicos, etc., también se usan para diagnosticar el cáncer de próstata en el paciente. En consecuencia. Los pacientes que tienen un biomarcador asociado con el cáncer de próstata también se someten a otros procedimientos de diagnóstico.
En algunas realizaciones, uno o más biomarcadores que están subrepresentados en el cáncer de próstata Se pueden detectar en el CNA de un paciente. Por lo tanto, por ejemplo, un biomarcador enumerado en la Tabla 5 se puede detectar en una muestra de CNA de un paciente en la que la detección del biomarcadores indicativa de un diagnóstico normal, es decir, que el paciente no tiene cáncer de próstata.
55 "Sobrerrepresentado" o "aumento de la cantidad" se refiere a que el nivel de uno o más ADN exento de células en circulación tienen niveles más elevados que los niveles normales. Por lo general esto significa un aumento en el nivel en comparación con un valor índice. Por el contrario "subrepresentado" o "disminución de la cantidad" se refiera que el nivel de una o más moléculas de ADN exento de células en circulación en particular tiene niveles inferiores a los niveles normales. Por lo general esto significa una disminución en el nivel en comparación con un valor índice.
En realizaciones preferentes, el valor del ensayo que representa la cantidad de un ADN exento de células en circulación en particular se compara con uno o más valores de referencia (o valores índice), y opcionalmente se correlaciona con el cáncer de próstata o recurrencia del cáncer. Opcionalmente, un aumento de la probabilidad del
65 cáncer de próstata es indicativo si el valor del ensayo superior al del valor de referencia.
Los expertos la materia están familiarizados con diversas formas para obtener y usar valores Índice. Por ejemplo, el valor índice puede representar el número de copias o concentración de un ADN exento de células en particular de acuerdo con la presente divulgación en una muestra de sangre de un paciente de interés en estado sano, en cuyo caso un número de copias o concentración en una muestra del paciente en un momento o estado diferentes
5 significativamente más elevados (por ejemplo, 1,5 veces, 2 veces, 3 veces, 4 veces, 5 veces, 10 veces, 20 veces, 30 veces, 40 veces, 50 veces, 100 veces o más elevado) que este valor del índice podría indicar, por ejemplo, cáncer de próstata o aumento de la probabilidad de recurrencia del cáncer.
Como alternativa, el valor índice puede representar la concentración media o número de copias de un ADN exento de células en circulación en particular para un conjunto de individuos de una población de cáncer diversa o un subconjunto de la población. Por ejemplo, se puede determinar el número de copias o concentración media de un ADN exento de células en circulación en una muestra aleatoria de pacientes con cáncer de próstata. Por lo tanto, los pacientes que tienen un número de copias o concentración (valor el ensayo) comparable o más elevado que, este valor se identifican con la posibilidad de tener cáncer de próstata o recurrencia de cáncer de próstata que los que
15 tienen un valor de ensayo inferior a este valor.
A menudo número o cantidad de copias (por ejemplo, concentración) se considerará "aumentado" solamente si sediferencia de forma significativa del valor Índice, por ejemplo al menos una diferencia de 1,5 veces en el número de copias o concentración absoluto o relativo (por ejemplo, cómo se refleja mediante la señal de hibridación).
Un valor índice útil puede representar el número de copias o concentración de un ADN exento de células en circulación en particular o de una combinación (adición ponderada o recta) de dos o más ADN exento de células en circulación que corresponde a la misma región cromosómica o a diferentes regiones cromosómicas. Cuando dos o más biomarcadores o moléculas de ADN exento de células en circulación se usan en el método de
25 diagnóstico/control, la presencia o ausencia de, o la cantidad de, cada biomarcador o ADN exento de células en circulación se puede ponderar y combinar. Por lo tanto, se puede proporcionar un valor del ensayo mediante (a) ponderación del estado o cantidad determinados de cada molécula de ADN exento de células en circulación con un coeficiente definido previamente, y (b) combinación del estado o cantidad ponderados para proporcionar un valor del ensayo. La etapa de combinación puede ser cualquiera de adición recta o ponderación (es decir, igualmente ponderado) o mediante un coeficiente definido previamente diferente.
La información obtenida a partir del análisis del biomarcador se puede almacenar en una forma de lectura con ordenador. Un sistema informático de este tipo por lo general comprende subsistemas principales tales como un procesador central, una memoria del sistema (por lo general RAM), un controlador de entrada/salida (I/O), un
35 dispositivo externo tal como una pantalla de presentación a través de un adaptador de presentación, puertos de serie, un teclado, una unidad de disco fija a través de una interfaz de almacenamiento y una unidad de disco flexible operativa para recibir un disco flexible, y un dispositivo de CD-ROM (o DVD-ROM) operativo para recibir un CD-ROM. Se pueden conectar otros muchos dispositivos, tales como una interfaz de red conectada a través de un puerto de serie.
El sistema informático también se puede unir a una red, que comprende una pluralidad de dispositivos informáticos unidos a través de un enlace de datos, tal como un cable de Ethernet (coax o 10BaseT), línea telefónica, línea de ISDN, red inalámbrica, fibra óptica, u otro medio de transmisión de señales adecuado, mediante el cual al menos un dispositivo de red (por ejemplo, ordenador, matriz de discos, etc.) comprende un patrón de dominios magnéticos (por
45 ejemplo, disco magnético) y/o dominios de carga (por ejemplo, una matriz de celdas de DRAM) que forman un patrón de bits que codifican datos adquiridos a partir de un ensayo de la divulgación.
El sistema informático puede comprender un código para interpretar los resultados de un estudio que evalúa la presencia de uno o más de los biomarcadores. Por lo tanto, en una realización a modo de ejemplo, los resultados del análisis del biomarcador se proporcionan a un ordenador en el que un procesador central ejecuta un programa informático para determinar la probabilidad de que un paciente tenga cáncer de próstata.
La divulgación también proporciona el uso de un sistema informático, tal como el que se ha descrito anteriormente, que comprende: (1) un ordenador; (2) un patrón de bits almacenados que codifican los resultados del ensayo del
55 biomarcador con los métodos de la divulgación, que se pueden almacenar en el ordenador; (3) y, opcionalmente, (4) un programa para determinar la probabilidad de que un paciente tenga cáncer de próstata.
La divulgación proporciona adicionalmente métodos para generar un informe basándose en la detección de uno o más biomarcadores que se presentan en las Tablas 2-5.
Por lo tanto, la presente divulgación proporciona sistemas relacionados con los métodos de la divulgación mencionados anteriormente. En un aspecto la divulgación proporciona un sistema para analizar ADN exento de células en circulación, que comprende: (1) un analizador de muestras para ejecutar el método para analizar el ADN exento de células en circulación en la sangre, suero, o plasma de un paciente como se ha descrito en las diversas 65 realizaciones mencionadas anteriormente; (2) un sistema informático para recibir de forma automática y analizar datos obtenidos en la etapa (1) para proporcionar un valor del ensayo que representa el estado (presencia o
ausencia o cantidad, es decir, concentración o número de copias) de una o más moléculas de ADN exento de células en circulación con una secuencia de nucleótidos de al menos 25 nucleótidos que se encuentra en una región cromosómica que se presenta en la Tabla 2, Tabla 3, Tabla 4, o Tabla 5 (o que tiene una secuencia de nucleótidos que es una parte de una de las secuencias que se presentan en la Tabla A, Tabla B, Tabla C, o Tabla D), y 5 opcionalmente para comparar el valor del ensayo con uno o más valores de referencia asociado cada uno con un estado predeterminado de cáncer de próstata. En algunas realizaciones, el sistema comprende adicionalmente un módulo de presentación que presenta la comparación entre el valor del ensayo y el uno o más valores de referencia,
o que presenta un resultado de la etapa de comparación.
Por lo tanto, como será evidente para los expertos en la materia, el analizador de muestras puede ser, por ejemplo, una máquina de secuenciación (por ejemplo, Illumina HiSeq™, Ion Torrent PGM, secuenciador ABI SOLiD™, PacBio RS, Helicos Heliscope™, etc.), una máquina de PCR (por ejemplo, ABI 7900, Fluidigm BioMark™, etc.), un instrumento para micromatrices, etc.
15 En una realización, el analizador de muestras es un instrumento de secuenciación, por ejemplo, un instrumento de secuenciación de nueva generación tal como los sistemas GS de Roche, HiSeq y MiSeq de Illumina, y los sistemas de SOLiD Life Technologies. Las moléculas de ADN exento de células en circulación se aíslan de una muestra de sangre o suero o plasma de un paciente, y las secuencias de todas las moléculas de ADN exento de células en circulación se obtienen usando el analizador de muestras. El instrumento de secuenciación se usa para secuenciar las moléculas de ADN exento de células en circulación, y obtener las secuencias de estas moléculas. A continuación se usa un sistema informático para analizar de forma automática las secuencias para determinar la presencia o ausencia o cantidad de moléculas de ADN exento de células en circulación que tengan una secuencia de nucleótidos de al menos 25 nucleótidos que se encuentran en una región cromosómica que se presenta en la Tabla 2, Tabla 3, Tabla 4, o Tabla 5 (o que tengan una secuencia de nucleótidos que forme una parte de una de las
25 secuencias que se presentan en la Tabla A, Tabla B, Tabla C, o Tabla D) en la muestra. Por ejemplo, el sistema informático puede comparar la secuencia de cada molécula de ADN exento de células en circulación en la muestra con cada secuencia en las Tablas A, B, C, y D para determinar si existe un emparejamiento, es decir, si la secuencia de una molécula de ADN exento de células en circulación se encuentra en una secuencia en la Tabla A, Tabla B, Tabla C, o Tabla 2 o se encuentra en una región cromosómica que se presenta en la Tabla 2, Tabla 3, Tabla 4, o Tabla 5. El número de copias de una molécula de ADN exento de células en circulación en particular también se determina de forma automática con el sistema informático. Opcionalmente, el sistema informático correlaciona de forma automática el resultado del análisis de secuencias con un diagnóstico con respecto al cáncer de próstata. Por ejemplo, si se identifica que una, dos o más moléculas de ADN exento de células en circulación se obtienen a partir de una región cromosómica en la Tabla 2, Tabla 3, o Tabla 4 y preferentemente dos o más moléculas de ADN
35 exento de células en circulación consecuencias que se encuentran en diferentes regiones cromosómicas de una sola tabla elegida entre las Tablas 2-4, entonces el sistema informático correlaciona de forma automática este resultado del análisis con un diagnóstico de cáncer de próstata. Opcionalmente, el sistema informático comprende adicionalmente un módulo de presentación que presentan los resultados del análisis de secuencias y/o el resultado de la etapa de correlación. El módulo de presentación puede ser por ejemplo, una pantalla de presentación, tal como un monitor de ordenador, monitor de TV, o la pantalla táctil, una impresora, y altavoces de audio.
La función del análisis basada en sistema informático se puede poner en práctica en cualquier lenguaje y/o navegadores adecuados. Por ejemplo, se puede poner en práctica con el lenguaje C y usando preferentemente lenguajes de programación de alto nivel orientados a objetos tales como Visual Basic, SmallTalk, C++, y similares. 45 La aplicación se puede escribir para que se adapte a entornos tales como el entorno de Microsoft Windows™ incluyendo Windows™ 98, Windows™ 2000, Windows™ NT, y similares. Además, la aplicación también se puede escribir para el entorno de Macintosh™, SUN™, UNIX o LINUX. Además, las etapas funcionales también se deben poner en práctica usando un lenguaje de programación universal o independiente de plataforma. Los ejemplos de los lenguajes de programación de múltiples plataformas de este tipo incluyen, pero no se limitan a, lenguaje de marcado de hipertexto (HTML), JAVA™, JavaScript™, lenguaje de programación Flash, interfaz de portal común/lenguaje de consulta estructurado (CGI/SQL), lenguaje de informe de extracción práctico (PERL), AppleScript™ y otros lenguajes de script del sistema, lenguaje de programación/ lenguaje de consulta estructurado (PL/SQL), y similares. Se pueden usar navegadores habilitados para Java™ o JavaScript™ tales como HotJava™, Microsoft™ Explorer™, o Netscape™. Cuando se usan páginas web de contenido activo, estas pueden incluir applets de Java™ o controles
55 de ActiveX™ u otras tecnologías de contenido activo.
La función de análisis también se puede incorporar en productos de programas informáticos y usar en los sistemas descritos anteriormente u otros sistemas de base informática o Internet. Por consiguiente, otro aspecto de la presente divulgación se refiere a un producto de programa informático que comprende un medio que se puede usar con ordenador que tiene códigos de programa legibles por ordenador o instrucciones incorporadas en el mismo para permitir que un procesador lleve a cabo las funciones de análisis y correlación descritas anteriormente. Estas instrucciones del programa informático se pueden cargar en un ordenador u otro aparato programable para producir una máquina, de modo que las instrucciones que se ejecuten en el ordenador u otro aparato programable crean medios para poner en práctica las funciones o etapas descritas anteriormente. Estas instrucciones del programa 65 informático también se pueden almacenar en una memoria o medio legible por ordenador que pueda dirigir un ordenador u otro aparato programable para funcionar de una manera en particular, de modo que las instrucciones
almacenadas en la memoria legible por ordenador o medio produzcan un artículo de fabricación incluyendo los medios de instrucción que ponen en práctica el análisis. Las instrucciones del programa informático también se pueden cargar en un ordenador u otro aparato programable para hace que se realicen una serie de etapas de operación en el ordenador u otro aparato programable para producir un proceso puesto en práctica mediante
5 ordenador de un modo tal que las instrucciones que se ejecutan en el ordenador u otro aparato programable proporcione etapas para poner en práctica las funciones o etapas descritas anteriormente.
Los siguientes ejemplos se proporcionan a modo de ilustración solamente y no a modo de limitación. Los expertos en la materia reconocerán fácilmente una diversidad de parámetros no críticos que se podrían cambiar o modificar para producir resultados esencialmente similares.
Ejemplos
Ejemplo 1. Identificación de CNA asociado a cáncer de próstata 15
Secuenciación de CNA
Se usaron sueros de 197 pacientes con una biopsia demostrada de cáncer de próstata con una Puntuación de Gleasson de 3 a 10. Los datos se compararon con las muestras obtenidas a partir de 92 donantes de sangre aparentemente sanos de sexo masculino (normales).
Después de la extracción de ADN del suero o plasma, usando métodos convencionales basados en sílice, se realizó una amplificación de todo el genoma por duplicado. Los productos se combinaron y se usaron para análisis adicional.
Realizaciones de secuenciación larga
Las secuencias de cebador para 454 se añadieron al producto usando cebadores de fusión en no más de 20 ciclos de PCR. El producto resultante se trató de acuerdo con el manual del secuenciador para 454 y se usó para detección directa de secuencias.
Análisis informático
Las lecturas de secuencias se asignaron a la fuente de muestra leyendo la cadena de secuencia de identificador y 35 se cortaron todas las partes no fuente (por ejemplo, cebadores).
El origen del ADN en circulación se investigó mediante análisis de alineación local usando el programa BLAST usando parámetros altamente rigurosos (30). Los elementos repetitivos se detectaron y enmascararon mediante el uso de una instalación local del paquete de software Repeat-masker (31) usando la base rep (versión 12.09) que se obtuvo del Genetic I nformation Research Institute (32). Después de enmascarar los elementos repetitivos y la región de baja complejidad de secuencia, cada secuencia se sometió a análisis BLAST secuenciales consultando las bases de datos de genomas bacterianos, víricos y fúngicos y el genoma humano (construcción del genoma de referencia 37.1). Se obtuvieron genomas bacterianos, líricos, fúngicos y humanos del National Center for Biotechnology Information (NCBI, (ftp.ncbi.nih.gov)). Después de cada una de las búsquedas secuenciales de bases de datos, se
45 enmascararon todas las partes de una secuencia consultada que producían aciertos significativos (e <0,0001) y posteriormente se usaron secuencias enmascaradas para consultar la siguiente base de datos. Se hizo el recuento de los nucleótidos enmascarados y se restaron de los recuentos de nucleótidos totales dando como resultado las cantidades de nucleótidos no identificados.
Para cada fragmento de consulta y cada búsqueda en la base de datos, el hit BLAST de mayor puntuación con una longitud de más de un 50 % de la secuencia de consulta se registró en una base de datos SQL. El hit BLAST de mayor puntuación se definió como el hit más largo con el mayor porcentaje de identidad (máximo de longitud del hit x identidad). Para cada una de las secuencias, se registraron las posiciones de inicio y detención para consulta y base de datos.
-Análisis de asociación de enfermedad
Para investigar qué secuencias/etiquetas de secuencia están asociadas a la enfermedad, se usaron todas las alineaciones que se podrían colocar inequívocamente en la base de datos genómica humana (Construcción de Homo sapiens 37.1 http://www.ncbi.nlm.nih.gov/mapview/). Se clasificaron en la región 4060 de 750.000 intervalos de pares de bases y se seleccionaron para las diferencias entre los controles normales y los pacientes con cáncer sobre la base de una comparación grupal Usando el ensayo de la mediana no paramétrica. Para análisis adicionales se usaron quinientas regiones cromosómicas con los valores de p más bajos.
65 El modelado lineal de regresiones multivariadas se realizó en 347 rondas de muestras seleccionadas aleatoriamente de arranque, usando las 750k regiones seleccionadas anteriormente como parámetros independientes. Las 347
rondas de arranque proporcionaron 8,9 x 107 modelos. De estos, se seleccionaron las mejores 42 variables independientes (750k piezas, basadas en ΣAICωi) y se muestran en la Tabla 1.
Selección de grupos en las regiones seleccionadas previamente
5 En una segunda etapa, se realizó una búsqueda de grupos dentro de las 42 regiones y se encontraron grupos de muestras de cáncer que no contenían ninguna muestra normal. Se buscaron grupos adicionales solo donde se encontraron una o menos muestras normales en un grupo de al menos 10 muestras de cáncer. Las regiones del grupo se limitaron a las que tenían una distancia al siguiente hit normal de al menos 200 pb. Dados estos límites, se
10 encontraron 88 grupos, de los cuales 25 contenían un hit en el grupo normal. Una muestra se llama positiva si se encuentra al menos un hit en cualquiera de las regiones del grupo (véase la Tabla 2). Una selección de 30 grupos sin falsos positivos que cubrían 441 kpb fue suficiente para proporcionar una sensibilidad de un 94 % y una especificidad de un 100 %, que se puede aumentar a un 96 % cuando se incluían dos grupos más con un hit en uno normal, consiguiendo una especificidad de un 99 %.
Selección de grupos genómicos
También se realizó una búsqueda de grupos genómicos con respecto a todo el genoma no repetitivo. Se estableció que límite tenía más de 18 hits de pacientes independientes por grupo, mientras que se encontraron más de 600
20 grupos con no más de 1 hit en las muestras de los grupos normales. Una selección de 22 grupos que cubrían aproximadamente 475 kpb fue suficiente para proporcionar una tasa de positivos verdaderos de un 99,5 % a un nivel de negativos verdaderos de un 99 % (véase la Tabla 3). Excluyendo esas dos regiones que tenían un hit en el grupo de los pacientes con cáncer no de próstata, normales, la tasa de positivos verdaderos era de un 96 % y en consecuencia la especificidad era de un 100 %.
25 Ejemplo 2. Identificación biomarcadores adicionales que se sobre-o sub-representan en cáncer de próstata
En un análisis adicional para identificar biomarcadores, un subconjunto de 77 muestras de Cáncer de Próstata 77 y 70 Controles se secuencian en un Sistema SOLiD4+ de Life Technologies, que es un secuenciador de alto 30 rendimiento que por lo general puede desarrollar cientos de millones de secuencias de longitud es de aproximadamente 30 a aproximadamente 75 bases en paralelo. (otro ejemplo de una tecnología de secuenciación de este tipo es el Analizador de Genoma (Illumina)). En resumen, las muestras se prepararon como se ha descrito para la secuenciación de 454, en la que se usan adaptadores específicos para secuenciación con SOLiD. Para cada muestra se consiguieron aproximadamente 5 millones de lecturas de 40 pb y se alinearon con el genoma humano
35 (Construcción Hg18) usando el paquete de software "Bioscope" de Lifetechnologies con valores de rigurosidad por defecto. Para el análisis adicional se usaron todas las lecturas únicamente alineadas.
Para definir las regiones cromosómicas, con muestras de cualquier grupo de agrupamiento en comparación con el segundo grupo, todos los hits se clasifican en orden de su aparición en los cromosomas. Las regiones del
40 biomarcador se definieron inicialmente como las regiones en las que se hizo el recuento de al menos 15 hits que cubrían al menos 10 muestras de un grupo, pero no más de una muestra del otro grupo demostraba un hit.
En 1000 rondas de nueva toma de muestras aleatorias las muestras se dividieron en un conjunto de entrenamiento y validación de un 50 % de cada grupo. Para cada región, a una muestra en la región se le asignaba una puntuación 45 de 1 si el grupo era un grupo de cáncer de próstata (PrCa) y una puntuación de -1 para la región en la que se formaban grupos de muestras normales. Se encontró que AUC media para el conjunto de validación era 0,92 si se usan las sumas de puntuación de 42 regiones de grupos. Las regiones usadas en las 1000 rondas de nueva toma de muestras se clasificaron de acuerdo con el número de rondas en la que cualquier región participaba. Las Tablas 4 y 5 muestran las 56 regiones con la puntuación más elevada. La Tabla 4 resume los grupos identificados en este
50 análisis que estaban sobrerrepresentados en las muestras de suero de cáncer de próstata. La Tabla 5 resume los grupos identificados en este análisis que estaban subrrepresentados en las muestras de suero de cáncer de próstata; la curva ROC que usa las 42 regiones de clasificación más elevada se muestran en la Figura 1. El AUC por debajo de la curva ROC se calculó como 0,96 (0,886 – 0,996) con una precisión de un 92 % (86 % -97 %).
55 Tabla 1 Cromosoma Posición de Inicio-Posición Final Formación de Clasificación (AIC) Longitud del de la Región bandas de cit Cromosoma
Hs1 98250001-99000000 1p21.3 41 226,9 Mb
215250001-216000000 1q41 26
225000001-225750000 1q42.12/13 31
Hs2 49500001-50250000 2p16.3 13 238,4 Mb
61500001-62250000 2p15 6
Cromosoma Posición de Inicio-Posición Final Formación de Clasificación (AIC) Longitud del de la Región bandas de cit Cromosoma
98250001-99000000 2q11.2 14 132750001-133500000 2q21.2 1 162000001-162750000 2q24.2 37 180750001-181500000 2q31.3 5
Hs3 1500001-2250000 3p26.3 44 198 Mb 105000001-105750000 3q13.11 8 150000001-150750000 3q24-25.1 39
164250001-165000000 3q26.1 16 Hs4 6000001-6750000 4p16.1 45 188,1 Mb Hs5 1500001-2250000 5p15.33 20 177,7 Mb
40500001-41250000 5p13.1 28 81000001-81750000 5q14.1/2 30 159750001-160500000 5q33.3-34 15 167250001-168000000 5q34-35.1 9
Hs6 31500001-32250000 6p21.33/32 7 171 Mb
Hs7 3750001-4500000 7p22.2 38 156 Mb 124500001-125250000 7q31.33 12 156000001-156750000 7q36.3 34
Hs8 12000001-12750000 8p23.1-22 42 143 Mb 19500001-20250000 8p21.3 10 24750001-25500000 8p21.2 35
129000001-129750000 8q24.21 29 Hs9 750001-1500000 9p24.3 18 121,5 Mb 8250001-9000000 9p24.1 19
141000001-141213431 9qter 21 Hs10 134250001-135000000 10q26.3 48 131,7 Mb Hs11 87750001-88500000 11q14.2/3 49 135 Mb Hs12 31500001-32250000 12p11.21 11 130,5 Mb
84000001-84750000 12q21.31 40 Hs13 21000001-21750000 13q12.11 4 95,6 Mb 48000001-48750000 13q14.2 25 114750001-115169878 13q34-qter 46 Hs14 63000001-63750000 14q23.2 17 88,3 Mb 103500001-104250000 14q32.33 27
Hs15 34500001-35250000 15q14 36 82,2 Mb 45750001-46500000 15q21.1 33 57000001-57750000 15q22.1/2 43
Hs16 23250001-24000000 16p12.1 22 78,9 Mb 33750001-34500000 16p11.2/1 24 68250001-69000000 16q22.1 23
Hs17 18000001-18750000 17p11.2 32 78,2 Mb
Cromosoma
Posición de Inicio-Posición Final de la Región Formación de bandas de cit Clasificación (AIC) Longitud del Cromosoma
Hs19
53250001-54000000 19q13.32/33 50 56,1 Mb
57000001-57750000
19q13.33-41 2
Hs20
24750001-25500000 20p11.21 3 63 Mb
Hs21
21000001-21750000 21q21.1 47 48 Mb
Tabla 2
Cromosoma
Posición de Inicio Posición Final Longitud LongitudÚnica N.º de Ind. N.º de Línea en la Tabla 1
Hs9
1203203 1208552 5349 4100 10 28
Hs13
21589501 21597794 8293 4825 15 35
Hs9
141121140 141129705 8565 4477 11 30
Hs17
18509184 18526779 17595 9089 15 46
Hs14
63439924 63453744 13820 7671 10 38
Hs5
1792424 1811001 18577 14985 13 15
Hs9
8896121 8911530 15409 8912 10 29
Hs5
40665598 40693396 27798 22274 18 16
Hs13
48226162 48242250 16088 9178 10 36
Hs2
162242923 162262521 19598 11865 12 8
Hs12
31814898 31835553 20655 7945 12 33
Hs8
12276056 12297091 21035 14663 12 24
Hs5
167303952 167325309 21357 13170 12 19
Hs15
34692781 34717541 24760 17408 14 40
Hs15
45945913 45974928 29015 16061 15 41
Hs8
129491613 129511269 19656 12165 10 27
Hs14
63572445 63603375 30930 11049 15 38
Hs2
61907413 61956856 49443 19877 23 5
Hs2
181047163 181068902 21739 14079 10 9
Hs2
49920547 49991893 71346 35434 31 4
Hs3
105168575 105194180 25605 16362 11 11
Hs5
81091424 81128988 37564 17433 16 17
Hs16
68707139 68733885 26746 14395 11 45
Hs5
81651300 81683959 32659 20395 12 17
Hs5
1851815 1879589 27774 22549 10 15
Hs5
167930740 167967508 36768 16984 18 19
Hs12
31553223 31586248 33025 15905 11 33
Hs14
63337644 63376856 39212 19982 13 38
Hs15
35174423 35207743 33320 20692 11 40
Hs1
225305228 225352841 47613 16886 14 3
Hs12
31981016 32000913 19897 6010 14 33
Hs12
84147927 84232206 84279 40700 24 34
N.º de Grupos Sens Espec Longitud Longitud Única 30 93,9 % 100,0 % 801314 440810 31 94,9 % 98,9 % 821211 446820 32 95,9 % 98,9 % 905490 487520
Tabla 3
N.º Cromosoma Posición de Inicio Posición Final Longitud Longitud Única N.º de Ind.
1 Hs14 70096330 70127234 30904 20903 27 2 Hs6 39345271 39370386 25115 16483 21 3 Hs15 53064016 53089483 25467 21509 21 4 Hs12 116499466 116530409 30943 20444 24 5 Hs2 157539155 157566634 27479 22048 21 6 Hs14 80304012 80330694 26682 19106 20 7 Hs10 114581158 114608169 27011 18506 20 8 Hs1 101763313 101791825 28512 18018 21 9 Hs7 50308799 50337414 28615 19398 21 10 Hs1 149307024 149338559 31535 17715 24 11 Hs5 171222089 171253456 31367 14683 21 12 Hs6 51313581 51352528 38947 28500 26 13 Hs5 137264839 137297311 32472 20322 20 14 Hs5 66278164 66313008 34844 27403 21 15 Hs3 170530159 170567250 37091 19172 22 16 Hs10 120162288 120199466 37178 26822 23 17 Hs12 126284041 126322408 38367 17006 21 18 Hs9 24039045 24078308 39263 23866 21 19 Hs2 216752448 216796426 43978 23279 21 20 Hs15 61191103 61235085 43982 30792 20 21 Hs9 35794560 35821014 26454 22335 19 22 Hs4 158937672 158995447 57775 26461 21
N.º de Grupos Sens Espec Longitud Longitud Única 20 96,4 % 100,0 % 659752 425975 21 97,5 % 98,9 % 686206 448310 22 99,5 % 98,9 % 743981 474771
Tabla 4 Clasificación Cromosoma Posición Región Grupo
1 Hs12 30,6 Mb 30570547 -30570743 PrCa 2 Hs12 21,5 Mb 21486871 -21487052 PrCa 3 Hs4 86,2 Mb 86221239 -86221507 PrCa 4 Hs12 25,3 Mb 25327892 -25328036 PrCa 5 Hs10 113,1 Mb 113115517 -113115668 PrCa 6 Hs14 38,9 Mb 38862061 -38862327 PrCa 7 Hs16 25,3 Mb 25252221 -25252481 PrCa 8 Hs22 46,1 Mb 46118701 -46118844 PrCa 9 Hs3 157,7 Mb 157749009 -157749191 PrCa 10 Hs10 78 Mb 77959547 -77959711 PrCa 11 Hs11 44,6 Mb 44630448 -44630727 PrCa
Clasificación
Cromosoma Posición Región Grupo
12
Hs6 123,9 Mb 123900311 -123900449 PrCa
13
Hs22 30,4 Mb 30448964 -30449173 PrCa
14
Hs16 77,8 Mb 77757034 -77757233 PrCa
15
Hs2 114,8 Mb 114825678 -114825874 PrCa
16
Hs21 34,9 Mb 34883267 -34883616 PrCa
17
Hs4 20,7 Mb 20747267 -20747398 PrCa
18
Hs5 6 Mb 5955117 -5955276 PrCa
19
Hs5 25,8 Mb 25838138 -25838267 PrCa
21
Hs6 35,4 Mb 35436306 -35436437 PrCa
22
Hs8 145,3 Mb 145289592 -145289753 PrCa
23
Hs2 49,9 Mb 49901877 -49901945 PrCa
24
Hs15 83,7 Mb 83697580 -83697795 PrCa
26
Hs8 15,4 Mb 15424921 -15425143 PrCa
27
Hs4 15,1 Mb 15054643 -15054930 PrCa
28
Hs19 39,4 Mb 39368301 -39368596 PrCa
29
Hs7 49,7 Mb 49689619 -49689826 PrCa
30
Hs20 36,2 Mb 36231639 -36231810 PrCa
31
Hs9 4,1 Mb 4124816 -4125132 PrCa
32
Hs1 24,2 Mb 24210790 -24210949 PrCa
33
Hs3 24,3 Mb 24265368 -24265621 PrCa
34
Hs10 127,5 Mb 127536020 -127536197 PrCa
35
Hs10 133 Mb 132973900 -132974068 PrCa
36
Hs5 9,5 Mb 9484677 -9484862 PrCa
37
Hs1 214,7 Mb 214667412 -214667588 PrCa
38
Hs12 69,9 Mb 69877688 -69877868 PrCa
39
Hs3 29,4 Mb 29448099 -29448452 PrCa
40
Hs4 16,5 Mb 16544904 -16545167 PrCa
41
Hs8 64,7 Mb 64704166 -64704321 PrCa
42
Hs9 119,3 Mb 119339188 -119339363 PrCa
43
Hs7 19,8 Mb 19816439 -19816659 PrCa
44
Hs1 86,4 Mb 86350713 -86350904 PrCa
45
Hs2 62,4 Mb 62369682 -62369921 PrCa
46
Hs3 65,7 Mb 65747782 -65747986 PrCa
48
Hs9 109,8 Mb 109841019 -109841101 PrCa
49
Hs3 25,8 Mb 25806856 -25807015 PrCa
50
Hs8 33,6 Mb 33615921 -33616142 PrCa
51
Hs2 44,1 Mb 44129332 -44129600 PrCa
52
Hs19 36 Mb 35994062 -35994387 PrCa
53
Hs3 109 Mb 108989445 -108989612 PrCa
54
Hs19 35,5 Mb 35468803 -35469027 PrCa
56
Hs17 40,7 Mb 40658673 -40658927 PrCa
Tabla 5
20
Hs1 81,6 Mb 81624931 -81625149 normal
25
Hs6 42,2 Mb 42228631 -42228778 normal
47
Hs11 42,4 Mb 42370286 -42370710 normal
55
Hs8 24,6 Mb 24591709 -24591956 normal
TABLA A
Tabla B
Tabla C
Tabla D

Claims (9)

  1. REIVINDICACIONES
    1.
    Un método para detectar un biomarcador que está asociado con cáncer de próstata en un paciente, método que comprende:
    obtener la secuencia de sustancialmente todo el ADN libre de células en circulación que tenga una longitud entre 50 y 400 nucleótidos consecutivos aislado de una muestra obtenida a partir de sangre, suero, o plasma de un paciente que ha sido diagnosticado con cáncer de próstata o se sospecha que tiene cáncer de próstata; comparar cada secuencia, exenta de elementos repetitivos, con las secuencias que se presentan en la Tabla B para determinar si una secuencia de un ADN exento de células en circulación se encuentra en una región cromosómica que se presenta en la Tabla 3; en el que la detección de una secuencia en los ácidos nucleicos en circulación que se atribuye sin ambigüedad a una región cromosómica que se presenta en la Tabla 3 es indicativa de un aumento de la probabilidad de cáncer de próstata o recurrencia de cáncer de próstata.
  2. 2.
    El método de la reivindicación 1, que comprende adicionalmente:
    comparar las secuencias exentas de elementos repetitivos de los ácidos nucleicos en circulación con las secuencias que se presentan en la Tabla A, C, o D para determinar si una secuencia de un ADN exento de células en circulación se encuentra en una región cromosómica que se presenta en la Tabla 2, 4, o 5; en el que la detección de una secuencia en los ácidos nucleicos en circulación que se atribuye sin ambigüedad a una región cromosómica que se presenta en la Tabla 2 o 4 es indicativa de un aumento de la probabilidad de cáncer de próstata o recurrencia de cáncer de próstata; y la detección de una secuencia en los ácidos nucleicos en circulación que se atribuye sin ambigüedad a una región cromosómica que se presenta en la Tabla 5 es indicativa de la disminución de la probabilidad de cáncer de próstata o recurrencia de cáncer de próstata.
  3. 3.
    El método de la reivindicación 1, que comprende adicionalmente:
    comparar las secuencias exentas de elementos repetitivos de los ácidos nucleicos en circulación con las secuencias que se presentan en la Tabla A, C, y D para determinar si una secuencia de un ADN exento de células en circulación se encuentra en una región cromosómica que se presenta en la Tabla 2, 4, y 5; en el que la detección de una secuencia en los ácidos nucleicos en circulación que se atribuye sin ambigüedad a una región cromosómica que se presenta en la Tabla 2 o 4 es indicativa de un aumento de la probabilidad de cáncer de próstata o recurrencia de cáncer de próstata; y la detección de una secuencia en los ácidos nucleicos en circulación que se atribuye sin ambigüedad a una región cromosómica que se presenta en la Tabla 5 es indicativa de la disminución de la probabilidad de cáncer de próstata o recurrencia de cáncer de próstata.
  4. 4.
    Un kit que comprende una pluralidad de oligonucleótidos, en el que cada oligonucleótido tiene de aproximadamente 18 a 100 nucleótidos y tiene una secuencia de nucleótidos que se encuentra en una región cromosómica que se presenta en la Tabla 3; en el que dicha pluralidad comprende oligonucleótidos que corresponden a todas y cada una de las regiones cromosómicas que se presentan en la Tabla 3; y en el que dichos oligonucleótidos están exentos de elemento repetitivo; opcionalmente en el que dichos oligonucleótidos están unidos a un sustrato sólido.
  5. 5.
    Un método para diagnosticar o identificar sistemáticamente cáncer de próstata en un paciente, que comprende:
    proporcionar una muestra de ADN exento de células en circulación aislado de una muestra obtenida a partir de sangre, suero, o plasma de dicho paciente; hibridar la muestra en una pluralidad de sondas para determinar si una de las moléculas de ADN exento de células circulación se hibrida en una cualquiera de la pluralidad de sondas en condiciones rigurosas, en el que la pluralidad de sondas comprende un conjunto de sondas para todas las regiones cromosómicas que se presentan en la Tabla 3; y correlacionar la presencia de un ADN exento de células que se encuentra en una región cromosómica de la Tabla 3 con un aumento de la probabilidad de que dicho paciente tenga cáncer de próstata.
  6. 6.
    El método de la reivindicación 5, en el que la pluralidad de sondas comprende un conjunto de sondas para las regiones cromosómicas que se presentan en la Tabla 2, 4, o 5.
  7. 7.
    Un sistema para analizar ADN exento de células en circulación, que comprende:
    un analizador de muestras que determina la presencia o ausencia, o la cantidad de, un ADN exento de células en circulación que tiene una secuencia de nucleótidos de al menos 25 nucleótidos que se encuentra en cada región cromosómica que se presenta en la Tabla 3; un sistema informático que recibe y analiza automáticamente los datos obtenidos en la etapa (1), y que correlaciona la presencia, o un aumento de la cantidad, de dicho ADN exento de células en circulación con un diagnóstico de cáncer de próstata; que además comprende opcionalmente un módulo de presentación que presenta el resultado de la etapa de correlación.
  8. 8. El sistema de la reivindicación 7, en el que el analizador de muestras determina la presencia o ausencia, o la
    5 cantidad de, un ADN exento de células en circulación que tiene una secuencia de nucleótidos de al menos 25 nucleótidos que se encuentra en cada región cromosómica que se presenta en la Tabla 2 o en la Tabla 4.
  9. 9. El sistema de la reivindicación 7, en el que el analizador de muestras determina la presencia o ausencia, o la
    cantidad de, un ADN exento de células en circulación que tiene una secuencia de nucleótidos de al menos 25 10 nucleótidos que se encuentra en cada región cromosómica que se presenta en la Tabla 2 y en la Tabla 4.
ES11790345.0T 2010-06-04 2011-06-01 Biomarcadores de ácidos nucleicos en circulación asociados al cáncer de próstata Active ES2647612T3 (es)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US35170810P 2010-06-04 2010-06-04
US351708P 2010-06-04
PCT/US2011/038780 WO2011153254A2 (en) 2010-06-04 2011-06-01 Prostate cancer associated circulating nucleic acid biomarkers

Publications (1)

Publication Number Publication Date
ES2647612T3 true ES2647612T3 (es) 2017-12-22

Family

ID=45067269

Family Applications (1)

Application Number Title Priority Date Filing Date
ES11790345.0T Active ES2647612T3 (es) 2010-06-04 2011-06-01 Biomarcadores de ácidos nucleicos en circulación asociados al cáncer de próstata

Country Status (6)

Country Link
US (4) US20130143214A1 (es)
EP (1) EP2576837B1 (es)
CA (1) CA2801468C (es)
ES (1) ES2647612T3 (es)
PL (1) PL2576837T3 (es)
WO (1) WO2011153254A2 (es)

Families Citing this family (26)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11939634B2 (en) 2010-05-18 2024-03-26 Natera, Inc. Methods for simultaneous amplification of target loci
WO2012129363A2 (en) 2011-03-24 2012-09-27 President And Fellows Of Harvard College Single cell nucleic acid detection and analysis
US9892230B2 (en) 2012-03-08 2018-02-13 The Chinese University Of Hong Kong Size-based analysis of fetal or tumor DNA fraction in plasma
KR101890466B1 (ko) * 2012-07-24 2018-08-21 내테라, 인코포레이티드 고도의 다중 pcr 방법 및 조성물
US10993418B2 (en) 2012-08-13 2021-05-04 Life Genetics Lab, Llc Method for measuring tumor burden in patient derived xenograft (PDX) mice
US10988803B2 (en) 2014-12-29 2021-04-27 Life Genetics Lab, Llc Multiplexed assay for quantitating and assessing integrity of cell-free DNA in biological fluids for cancer diagnosis, prognosis and surveillance
US20160040229A1 (en) 2013-08-16 2016-02-11 Guardant Health, Inc. Systems and methods to detect rare mutations and copy number variation
US10876152B2 (en) 2012-09-04 2020-12-29 Guardant Health, Inc. Systems and methods to detect rare mutations and copy number variation
DE202013012824U1 (de) 2012-09-04 2020-03-10 Guardant Health, Inc. Systeme zum Erfassen von seltenen Mutationen und einer Kopienzahlvariation
US11913065B2 (en) 2012-09-04 2024-02-27 Guardent Health, Inc. Systems and methods to detect rare mutations and copy number variation
US10706957B2 (en) 2012-09-20 2020-07-07 The Chinese University Of Hong Kong Non-invasive determination of methylome of tumor from plasma
US9732390B2 (en) 2012-09-20 2017-08-15 The Chinese University Of Hong Kong Non-invasive determination of methylome of fetus or tumor from plasma
SG11201604923XA (en) 2013-12-28 2016-07-28 Guardant Health Inc Methods and systems for detecting genetic variants
EP3889272A1 (en) 2014-07-18 2021-10-06 The Chinese University of Hong Kong Methylation pattern analysis of tissues in dna mixture
US10364467B2 (en) 2015-01-13 2019-07-30 The Chinese University Of Hong Kong Using size and number aberrations in plasma DNA for detecting cancer
US11479812B2 (en) 2015-05-11 2022-10-25 Natera, Inc. Methods and compositions for determining ploidy
WO2017106768A1 (en) 2015-12-17 2017-06-22 Guardant Health, Inc. Methods to determine tumor gene copy number by analysis of cell-free dna
EP3548632A4 (en) 2016-11-30 2020-06-24 The Chinese University Of Hong Kong ANALYSIS OF CELLULAR DNA IN URINE AND OTHER SAMPLES
EP3762513A1 (en) * 2018-03-08 2021-01-13 St. Johns University Circulating serum cell-free dna biomarkers and methods
TWI822789B (zh) 2018-06-01 2023-11-21 美商格瑞爾有限責任公司 用於資料分類之卷積神經網路系統及方法
US11581062B2 (en) 2018-12-10 2023-02-14 Grail, Llc Systems and methods for classifying patients with respect to multiple cancer classes
CN110172461B (zh) * 2019-06-03 2023-05-09 上海长征医院 一种新型骨肉瘤肺转移模型的构建方法及其应用
US11475981B2 (en) 2020-02-18 2022-10-18 Tempus Labs, Inc. Methods and systems for dynamic variant thresholding in a liquid biopsy assay
US11211147B2 (en) 2020-02-18 2021-12-28 Tempus Labs, Inc. Estimation of circulating tumor fraction using off-target reads of targeted-panel sequencing
US11211144B2 (en) 2020-02-18 2021-12-28 Tempus Labs, Inc. Methods and systems for refining copy number variation in a liquid biopsy assay
BR102021018527A2 (pt) * 2021-09-17 2023-03-28 Fundação Oswaldo Cruz Aptâmero de ácido nucleico, composição, uso de um aptâmero, kit diagnóstico, método para detectar ou diagnosticar um tumor, e, método para tratamento de câncer

Family Cites Families (34)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO1989001050A1 (en) 1987-07-31 1989-02-09 The Board Of Trustees Of The Leland Stanford Junior University Selective amplification of target polynucleotide sequences
CA1340807C (en) 1988-02-24 1999-11-02 Lawrence T. Malek Nucleic acid amplification process
US5143854A (en) 1989-06-07 1992-09-01 Affymax Technologies N.V. Large scale photolithographic solid phase synthesis of polypeptides and receptor binding screening thereof
CA2020958C (en) 1989-07-11 2005-01-11 Daniel L. Kacian Nucleic acid sequence amplification methods
US5955589A (en) 1991-12-24 1999-09-21 Isis Pharmaceuticals Inc. Gapped 2' modified oligonucleotides
JP2985446B2 (ja) 1990-10-31 1999-11-29 東ソー株式会社 核酸の検出及び測定方法
IE913930A1 (en) 1990-11-13 1992-06-17 Siska Diagnostics Nucleic acid amplification by two-enzyme, self-sustained¹sequence replication
YU187991A (sh) 1990-12-11 1994-09-09 Hoechst Aktiengesellschaft 3-(2)-amino-ali tiol-modifikovani, s fluorescentnom bojom vezani nukleozidi, nukleotidi i oligonukleotidi, postupak za njihovo dobijanje i njihova upotreba
US5455166A (en) 1991-01-31 1995-10-03 Becton, Dickinson And Company Strand displacement amplification
US5994056A (en) 1991-05-02 1999-11-30 Roche Molecular Systems, Inc. Homogeneous methods for nucleic acid amplification and detection
US5652099A (en) 1992-02-12 1997-07-29 Conrad; Michael J. Probes comprising fluorescent nucleosides and uses thereof
US5837832A (en) 1993-06-25 1998-11-17 Affymetrix, Inc. Arrays of nucleic acid probes on biological chips
DE69433180T2 (de) 1993-10-26 2004-06-24 Affymetrix, Inc., Santa Clara Felder von nukleinsaeuresonden auf biologischen chips
US5446137B1 (en) 1993-12-09 1998-10-06 Behringwerke Ag Oligonucleotides containing 4'-substituted nucleotides
DE4415370A1 (de) 1994-05-02 1995-11-09 Hoechst Ag Modifizierte Oligonukleotide, deren Herstellung sowie deren Verwendung
US5807522A (en) 1994-06-17 1998-09-15 The Board Of Trustees Of The Leland Stanford Junior University Methods for fabricating microarrays of biological samples
DE4438918A1 (de) 1994-11-04 1996-05-09 Hoechst Ag Modifizierte Oligonukleotide, deren Herstellung sowie deren Verwendung
DK0866071T3 (da) 1997-03-20 2005-01-17 Hoffmann La Roche Modificerede primere
EP1066506B1 (en) 1998-02-23 2010-04-21 Wisconsin Alumni Research Foundation Method and apparatus for synthesis of arrays of dna probes
AU4333799A (en) 1998-06-04 1999-12-20 Board Of Regents, The University Of Texas System Digital optical chemistry micromirror imager
US6315958B1 (en) 1999-11-10 2001-11-13 Wisconsin Alumni Research Foundation Flow cell for synthesis of arrays of DNA probes and the like
US7157229B2 (en) 2002-01-31 2007-01-02 Nimblegen Systems, Inc. Prepatterned substrate for optical synthesis of DNA probes
US20040126757A1 (en) 2002-01-31 2004-07-01 Francesco Cerrina Method and apparatus for synthesis of arrays of DNA probes
US7422851B2 (en) 2002-01-31 2008-09-09 Nimblegen Systems, Inc. Correction for illumination non-uniformity during the synthesis of arrays of oligomers
US7083975B2 (en) 2002-02-01 2006-08-01 Roland Green Microarray synthesis instrument and method
AU2003270898A1 (en) 2002-09-27 2004-04-19 Nimblegen Systems, Inc. Microarray with hydrophobic barriers
US20040110212A1 (en) 2002-09-30 2004-06-10 Mccormick Mark Microarrays with visual alignment marks
DE10348407A1 (de) * 2003-10-17 2005-05-19 Widschwendter, Martin, Prof. Prognostische und diagnostische Marker für Zell-proliferative Erkrankungen von Brustgeweben
AU2006251937A1 (en) * 2005-05-27 2006-11-30 John Wayne Cancer Institute Use of free circulating DNA for diagnosis, prognosis, and treatment of cancer
GB2457851B (en) 2006-12-14 2011-01-05 Ion Torrent Systems Inc Methods and apparatus for measuring analytes using large scale fet arrays
JP2009002808A (ja) * 2007-06-21 2009-01-08 Hitachi Ltd Dna計測システム及びdna計測方法
WO2009051842A2 (en) * 2007-10-18 2009-04-23 The Johns Hopkins University Detection of cancer by measuring genomic copy number and strand length in cell-free dna
US20100035252A1 (en) 2008-08-08 2010-02-11 Ion Torrent Systems Incorporated Methods for sequencing individual nucleic acids under tension
WO2010053980A2 (en) * 2008-11-04 2010-05-14 The Johns Hopkins University Dna integrity assay (dia) for cancer diagnostics, using confocal fluorescence spectroscopy

Also Published As

Publication number Publication date
CA2801468C (en) 2018-09-04
US11414706B2 (en) 2022-08-16
EP2576837A4 (en) 2013-11-20
EP2576837B1 (en) 2017-09-06
WO2011153254A3 (en) 2012-10-18
US20180340233A1 (en) 2018-11-29
US20160002739A1 (en) 2016-01-07
CA2801468A1 (en) 2011-12-08
US20130143214A1 (en) 2013-06-06
US20230087365A1 (en) 2023-03-23
PL2576837T3 (pl) 2018-04-30
WO2011153254A2 (en) 2011-12-08
EP2576837A2 (en) 2013-04-10

Similar Documents

Publication Publication Date Title
ES2647612T3 (es) Biomarcadores de ácidos nucleicos en circulación asociados al cáncer de próstata
US11377695B2 (en) Breast cancer associated circulating nucleic acid biomarkers
US20190136314A1 (en) Colorectal cancer associated circulating nucleic acid biomarkers
US11214798B2 (en) Methods and compositions for rapid nucleic acid library preparation
US20190185928A1 (en) Prostate cancer associated circulating nucleic acid biomarkers
ES2703764T3 (es) Biomarcadores personalizados para el cáncer
EP2982986A1 (en) Method for manufacturing gastric cancer prognosis prediction model
JP2023109998A (ja) マイクロサテライト不安定性の検出
CN105705655A (zh) 用于对nras和braf核酸进行多重分析的组合物及方法
US20050255498A1 (en) APOC1 genetic markers associated with age of onset of Alzheimer&#39;s Disease
CN109923215A (zh) 序列变体的检测
US10770183B2 (en) Methods of assessing a risk of developing necrotizing meningoencephalitis
US20140302013A1 (en) Predicting and diagnosing patients with systemic lupus erythematosus
KR20160143008A (ko) 골다공증 골절 발생 예측용 바이오마커
JP2020167940A (ja) 乳癌の晩期再発リスクを評価する方法及びキット
Kerick Development of an HLA microarray and its application in Inflammatory Bowel Disease