ES2665273T5

ES2665273T5 - Determinación no invasiva de metiloma del feto o tumor de plasma

Info

Publication number: ES2665273T5
Application number: ES13838770T
Authority: ES
Inventors: Rossa Chiu; Kwan Chan; Yuk-Ming Lo; Miu Lun; Peiyong Jiang; Wai Chan
Original assignee: Chinese University of Hong Kong CUHK
Current assignee: Chinese University of Hong Kong CUHK
Priority date: 2012-09-20
Filing date: 2013-09-20
Publication date: 2023-10-02
Anticipated expiration: 2033-09-20
Also published as: BR112015006183B1; AU2013317708A1; CN117757932A; EP3536807A1; IL299444B1; KR20230145530A; SG10201705198UA; JP2018121644A; PL3354747T3; DK2898100T4; MX360034B; EP4056712B1; PT3536807T; KR20200085928A; HRP20240210T1; CN104781422A; IL268512B2; BR122021021825B1; HK1206797A1; BR112015006183A2

Description

DESCRIPCIÓN

Determinación no invasiva de metiloma del feto o tumor de plasma

Campo

La presente divulgación se refiere en general a una determinación de un patrón de metilación (metiloma) de ADN, y más particularmente a analizar una muestra biológica (por ejemplo, plasma) que incluye una mezcla de ADN de diferentes genomas (por ejemplo, del feto y de la madre, o de células tumorales y normales) para determinar el patrón de metilación (metiloma) del genoma minoritario. También se describen usos del metiloma determinado. Antecedentes

El desarrollo embrionario y fetal es un proceso complejo e implica una serie de acontecimientos genéticos y epigenéticos altamente orquestados. El desarrollo del cáncer también es un proceso complejo que implica típicamente múltiples etapas genéticas y epigenéticas. Las anomalías en el control epigenético de procesos del desarrollo están implicadas en la infertilidad, el aborto espontáneo, anomalías del crecimiento intrauterino y consecuencias postnatales. La metilación del ADN es uno de los mecanismos epigenéticos más frecuentemente estudiados. La metilación del ADN se produce principalmente en el contexto de la adición de un grupo de metilo al carbono 5' de restos de citosina entre dinucleótidos de CpG. La metilación de citosina añade una capa de control a la transcripción génica y la función del ADN. Por ejemplo, la hipermetilación de promotores génicos enriquecidos con dinucleótidos de CpG, denominados islas de CpG, se asocia típicamente con represión de la función génica.

A pesar del papel importante de los mecanismos epigenéticos en la mediación de procesos del desarrollo, los tejidos embrionarios y fetales humanos no son fácilmente accesibles para su análisis (los tumores pueden de forma similar no ser accesibles). Los estudios de los cambios dinámicos de dichos procesos epigenéticos en salud y enfermedad durante el periodo prenatal en seres humanos son prácticamente imposibles. Los tejidos extraembrionarios, particularmente la placenta, que pueden obtenerse como parte de procedimientos de diagnóstico prenatales o después del nacimiento, han proporcionado una de las principales vías para dichas investigaciones. Sin embargo, dicho tejidos requieren procedimientos invasivos.

El perfil de metilación de ADN de la placenta humana ha intrigado a los investigadores durante décadas. La placenta humana muestra una multitud de características fisiológicas peculiares que implican metilación de ADN. A nivel global, los tejidos placentarios están hipometilados en comparación con la mayoría de tejidos somáticos. Al nivel génico, el estado de metilación de loci genómicos seleccionados es una identificación específica de tejidos placentarios. Los perfiles de metilación tanto globales como específicos de locus muestran cambios dependientes de la edad gestacional. Los genes con impronta, concretamente genes para los que la expresión es dependiente del origen parental de los alelos, cumplen funciones clave en la placenta. La placenta se ha descrito como pseudomaligna y se ha observado hipermetilación de varios genes supresores de tumores.

Los estudios del perfil de metilación de ADN de tejidos placentarios han proporcionado información acerca de la patofisiología de enfermedades asociadas con el embarazo o relacionadas con el desarrollo tales como preeclampsia y restricción del crecimiento intrauterino. Los trastornos en la impronta genómica se asocian con trastornos del desarrollo, tales como síndrome de Prader-Willi y síndrome de Angelman. Se han observado perfiles alterados de impronta genómica y metilación de ADN global en tejidos placentarios y fetales en embarazos resultantes de técnicas de reproducción asistida (H Hiura et al., 2012 Hum Reprod; 27: 2541-2548). Varios factores ambientales tales como tabaquismo materno (KE Haworth et al., 2013 Epigenomics; 5: 37-49), factores dietéticos maternos (X Jiang y otros, 2012 FASEB J; 26: 3563-3574) y estado metabólico materno tal como diabetes (N Hajj et al., Diabetes. doi: 10.2337/db12-0289) se han asociado con aberraciones epigenéticas de la descendencia.

A pesar de décadas de intentos, no ha habido ningún medio práctico disponible para estudiar el metiloma fetal o tumoral y para supervisar los cambios dinámicos durante el embarazo o durante los procesos de enfermedad, tales como tumores malignos. Por lo tanto, es deseable proporcionar métodos para analizar todos o parte de un metiloma fetal y un metiloma tumoral de forma no invasiva.

El documento WO-2011/038507, que representa la técnica más cercana anterior, desvela un método para identificar regiones metiladas de forma diferencial (biomarcadores) comparando perfiles de individuos afectados con los de homólogos sanos. Un perfil se determina ligando adaptadores con ADN en circulación y sometiendo el ADN a enzimas de restricción sensibles a metilación. La enzima corta un fragmento de ADN en un sitio metilado o no metilado, dependiendo del tipo de enzima. Solamente los fragmentos de ADN que no se hayan cortado conservarán ambos adaptadores y por lo tanto pueden amplificarse. El ADN amplificado se somete después a una micromatriz, que detectará una señal correspondiente a varios fragmentos de ADN para cada uno de una pluralidad de sondas. Se calcula un valor normalizado para cada sonda usando una intensidad de fluorescencia de fragmentos de ADN que hibridan con la sonda de micromatriz, donde cada sonda corresponde a un locus diferente.

Sumario

De acuerdo con la presente invención, se proporciona un método para analizar una muestra biológica que incluye ADN sin células de un organismo, incluyendo la muestra biológica moléculas de ácido nucleico que se originan de células normales y potencialmente de células asociadas con cáncer, comprendiendo el método: analizar una pluralidad de moléculas de ADN sin células de la muestra biológica, en la que el análisis de una molécula de ADN incluye: determinar una localización de la molécula de ADN en un genoma del organismo; y determinar si la molécula de ADN está metilada en uno o más sitios; para cada uno de una pluralidad de sitios, determinar un número respectivo de moléculas de ADN que están metiladas en el sitio; calcular un primer nivel de metilación basándose en los números respectivos de moléculas de ADN metiladas en la pluralidad de sitios; comparar el primer nivel de metilación con un primer valor de punto corte; y determinar una primera clasificación de un nivel de cáncer basándose en la comparación.

Las realizaciones proporcionan sistemas, métodos y aparatos para determinar y usar perfiles de metilación de diversos tejidos y muestras. Se proporcionan ejemplos. Puede deducirse un perfil de metilación para tejido fetal/tumoral basándose en una comparación de metilación en plasma (u otra muestra con ADN sin células, por ejemplo, orina, saliva, lavados genitales) con un perfil de metilación de la madre/paciente. Un perfil de metilación puede determinarse para tejido fetal/tumoral usando alelos específicos de tejido para identificar ADN del feto/tumor cuando la muestra tiene una mezcla de ADN. Un perfil de metilación puede usarse para determinar variaciones del número de copias en el genoma de un feto/tumor. Se han identificado marcadores de metilación para un feto mediante diversas técnicas. El perfil de metilación puede determinarse determinando un parámetro de tamaño de una distribución de tamaños de fragmentos de ADN, en el que los valores de referencia para el parámetro de tamaño pueden usarse para determinar los niveles de metilación.

Adicionalmente, puede usarse un nivel de metilación para determinar un nivel de cáncer. En el contexto del cáncer, la medición de los cambios metilómicos en plasma puede permitir detectar el cáncer (por ejemplo para fines de exploración), para supervisar (por ejemplo para detectar la respuesta después de tratamiento antineoplásico y para detectar recaída de cáncer) y para pronóstico (por ejemplo para medir la carga de células cancerosas en el cuerpo o para fines de estadificación o para evaluar la probabilidad de muerte de enfermedad o progresión de enfermedad o procesos metastásicos).

Puede obtenerse un mejor entendimiento de la naturaleza y las ventajas de realizaciones de la presente invención con referencia a la siguiente descripción detallada y los dibujos adjuntos.

Breve descripción de los dibujos

La FIGURA 1A muestra una tabla 100 de resultados de secuenciación de sangre materna, placenta y plasma materno de acuerdo con realizaciones de la presente divulgación.

La FIGURA 1B muestra densidad de metilación en ventanas de 1 Mb de muestras secuenciadas de acuerdo con realizaciones de la presente descripción.

Las FIGURAS 2A-2C muestran representaciones de los valores beta contra los índices de metilación: (A) Células sanguíneas maternas, (B) Muestra de vellosidad coriónica, (C) Tejido placentario a término.

Las FIGURAS 3A y 3B muestran diagramas de barras del porcentaje de sitios de CpG metilados en plasma y células sanguíneas recogidas de un hombre adulto y una mujer adulta no embarazada: (A) Autosomas, (B) Cromosoma X.

Las FIGURAS 4A y 4B muestran representaciones de densidades de metilación de loci correspondientes en ADN de células sanguíneas y ADN de plasma: (A) Mujer adulta no embarazada, (B) Hombre adulto.

Las FIGURAS 5A y 5B muestran gráficos de barras del porcentaje de sitios de CpG metilados entre muestras recogidas del embarazo: (A) Autosomas, (B) Cromosoma X.

La FIGURA 6 muestra un gráfico de barras del nivel de metilación de diferentes clases repetidas del genoma humano para sangre materna, placenta y plasma materno.

LA FIGURA 7A muestra una representación de Circos 700 para muestras del primer trimestre. La FIGURA 7B muestra una representación de Circos 750 para muestras del tercer trimestre.

Las FIGURAS 8A-8D muestran representaciones de comparaciones de las densidades de metilación de ADN del tejido genómico frente a ADN del plasma materno para sitios de CpG que rodean a los polimorfismos de un único nucleótido informativos.

LA FIGURA 9 es un diagrama de flujo que ilustra un método 900 para determinar un primer perfil de metilación de una muestra biológica de un organismo de acuerdo con realizaciones de la presente descripción.

LA FIGURA 10 es un diagrama de flujo que ilustra un método 1000 de determinación de un primer perfil de metilación de una muestra biológica de un organismo de acuerdo con realizaciones de la presente descripción. Las FIGURAS 11A y 11B muestran gráficos del rendimiento del algoritmo de predicción usando datos de plasma materno y concentración de ADN fetal fraccional de acuerdo con realizaciones de la presente descripción.

LA FIGURA 12A es una tabla 1200 que muestra detalles de 15 loci genómicos seleccionados para predicción de metilación de acuerdo con realizaciones de la presente descripción. LA FIGURA 12B es un gráfico 1250 que muestra las categorías deducidas de los 15 loci genómicos seleccionados y sus niveles de metilación correspondientes en la placenta.

La FIGURA 13 es un diagrama de flujo de un método 1300 para detectar una anomalía cromosómica fetal de una muestra biológica de un sujeto mujer embarazada con al menos un feto

La FIGURA 14 es un diagrama de flujo de un método 1400 para identificar marcadores de metilación comparando un perfil de metilación placentario con un perfil de metilación materno de acuerdo con realizaciones de la presente descripción.

La FIGURA 15A es una tabla 1500 que muestra un rendimiento del algoritmo de identificación de DMR usando datos del primer trimestre con referencia a 33 marcadores de primer trimestre previamente indicados. La FIGURA 15b es una tabla 1550 que muestra un rendimiento del algoritmo de identificación de DMR usando datos del tercer trimestre y en comparación con la muestra de placenta obtenida en el parto.

La FIGURA 16 es una tabla 1600 que muestra los números de loci que se ha predicho que están hipermetilados o hipometilados basándose en el análisis directo de los datos de secuenciación por bisulfito de plasma materno. La FIGURA 17A es una representación 1700 que muestra la distribución de tamaños del plasma materno, plasma de control de mujer no embarazada, ADN placentario y de sangre periférica. La FIGURA 17B es una representación 1750 de la distribución de tamaño y el perfil de metilación del plasma materno, plasma de control de mujer adulta, tejido placentario y sangre de control de mujer adulta.

Las FIGURAS 18A y 18B son representaciones de densidades de metilación y tamaño de moléculas de ADN de plasma de acuerdo con realizaciones de la presente descripción.

La FIGURA 19A muestra una representación 1900 de densidades de metilación y los tamaños de lecturas secuenciadas para una mujer adulta no embarazada. La FIGURA 19B es una representación 1950 que muestra la distribución de tamaño y el perfil de metilación de moléculas de ADN específicas fetales y específicas maternas en plasma materno.

La FIGURA 20 es un diagrama de flujo de un método 2000 para estimar un nivel de metilación de ADN en una muestra biológica de un organismo de acuerdo con realizaciones de la presente descripción.

La FIGURA 21A es una tabla 2100 que muestra las densidades de metilación del plasma preoperatorio y las muestras tisulares de un paciente con carcinoma hepatocelular (CHC). La FIGURA 21B es una tabla 2150 que muestra el número de lecturas de secuencia y la profundidad de secuenciación conseguida por muestra.

La FIGURA 22 es una tabla 220 que muestra las densidades de metilación en los autosomas, que varían de 71,2 % a 72,5 %, en las muestras de plasma de los controles sanos.

Las FIGURAS 23A y 23B muestran densidad de metilación de la capa leucocítica, tejido tumoral, tejido hepático no tumoral, el plasma preoperatorio y plasma postoperatorio del enfermo de CHC.

La FIGURA 24A es una representación 2400 que muestra las densidades de metilación del plasma preoperatorio del enfermo de CHC. La FIGURA 24B es una representación 2450 que muestra las densidades de metilación del plasma postoperatorio del enfermo de CHC.

Las FIGURAS 25A y 25B muestran puntuaciones z de las densidades de metilación de ADN de plasma para las muestras de plasma preoperatorias (representación 2500) y postoperatorias (representación 2550) del enfermo de CHC usando los datos del metiloma de plasma de los cuatro sujetos de control sanos como referencia para el cromosoma 1.

La FIGURA 26A es una tabla 2600 que muestra datos para puntuaciones z para plasma preoperatorio y postoperatorio. La FIGURA 26B es una representación de Circos 2620 que muestra la puntuación z de las densidades de metilación de ADN de plasma para las muestras de plasma preoperatorias y postoperatorias del enfermo de CHC usando los cuatro sujetos de control sano como referencia para grupos de 1 Mb analizados de todos los autosomas. La FIGURA 26C es una tabla 2640 que muestra una distribución de las puntuaciones z de los grupos de 1 Mb para el genoma completo en las muestras de plasma tanto preoperatorias como postoperatorias del enfermo de CHC. La FIGURA 26D es una tabla 2660 que muestra los niveles de metilación del tejido tumoral y muestra de plasma preoperatoria solapante con algunas de las muestras de plasma de control cuando se usan los contextos de CHH y CHG.

La FIGURA 27A-H muestran representaciones de Circos de densidad de metilación de 8 pacientes con cáncer de acuerdo con realizaciones de la presente invención. La FIGURA 27I es la tabla 2780 que muestra el número de lecturas de secuencia y la profundidad de secuenciación conseguida por muestra. La FIGURA 27J es una tabla 2790 que muestra una distribución de las puntuaciones z de los grupos de 1 Mb para el genoma completo en plasma de pacientes con diferentes tumores malignos. CP = adenocarcinoma de pulmón; CNF = carcinoma nasofaríngeo; CCR = carcinoma colorrectal; NE = carcinoma neuroendocrino; SML = sarcoma de músculo liso. La FIGURA 28 es un diagrama de flujo del método 2800 para analizar una muestra biológica de un organismo para determinar una clasificación de un nivel de cáncer de acuerdo con realizaciones de la presente descripción. LA FIGURA 29A es una representación 2900 que muestra la distribución de las densidades de metilación en sujetos de referencia suponiendo que esta distribución siga una distribución normal. La FIGURA 29B es una representación 2950 que muestra la distribución de las densidades de metilación en sujetos con cáncer suponiendo que esta distribución sigue una distribución normal y el nivel de metilación medio está 2 desviaciones típicas por debajo del punto de corte.

LA FIGURA 30 es una representación 3000 que muestra la distribución de densidades de metilación del ADN de plasma de sujetos sanos y pacientes con cáncer.

LA FIGURA 31 es un gráfico 3100 que muestra la distribución de las diferencias en las densidades de metilación entre la media del ADN de plasma de sujetos sanos y el tejido tumoral del enfermo de CHC.

LA FIGURA 32A es una tabla 3200 que muestra el efecto de la reducción de la profundidad de secuenciación cuando la muestra de plasma contenía ADN tumoral 5 % o 2 %.

La FIGURA 32B es un gráfico 3250 que muestra las densidades de metilación de los elementos repetidos y regiones no repetidas en el plasma de los cuatro sujetos de control sanos, la capa leucocítica, el tejido de hígado normal, el tejido tumoral, el plasma preoperatorio y las muestras de plasma postoperatorias del enfermo de CHC. La FIGURA 33 muestra un diagrama de bloques de un sistema informático ejemplar 3300 que puede utilizarse con el sistema y métodos de acuerdo con realizaciones de la presente descripción.

La FIGURA 34A muestra una distribución de tamaños de a Dn de plasma en el paciente con lupus eritematoso sistémico (LES) SLE04. Las FIGURAS 34B y 34C muestran análisis de metilación para ADN de plasma de un paciente con LES SLE04 (FIGURA 34B) y un enfermo de CHC TBR36 (FIGURA 34C).

La FIGURA 35 es un diagrama de flujo de un método 3500 que determina una clasificación de un nivel de cáncer basándose en la hipermetilación de islas de CpG de acuerdo con realizaciones de la presente descripción.

La FIGURA 36 es un diagrama de flujo de un método 3600 para analizar una muestra biológica de un organismo usando una pluralidad de regiones cromosómicas de acuerdo con realizaciones de la presente invención.

La FIGURA 37A muestra análisis de ANC para tejidos tumorales, ADN de plasma no tratado con bisulfito (BS) y ADN de plasma tratado con bisulfito (de dentro a fuera) para el paciente TBR36. La FIGURA 37B es una representación de dispersión que muestra la relación entre las puntuaciones z para la detección de ANC usando plasma tratado con bisulfito y no tratado con bisulfito de los grupos de 1 Mb para el paciente TBR36.

La FIGURA 38A muestra análisis de ANC para tejidos tumorales, ADN de plasma no tratado con bisulfito (BS) y ADN de plasma tratado con bisulfito (de dentro a fuera) para el paciente TBR34. La FIGURA 38B es una representación de dispersión que muestra la relación entre las puntuaciones z para la detección de ANC usando plasma tratado con bisulfito y no tratado con bisulfito de los grupos de 1 Mb para el paciente TBR34.

La FIGURA 39A es una representación de Circos que muestra el análisis de ANC (anillo interno) y metilación (anillo externo) para el plasma tratado con bisulfito para un enfermo de CHC TBR240. La FIGURA 39B es una representación de Circos que muestra el análisis de ANC (anillo interno) y metilación (anillo externo) para el plasma tratado con bisulfito para un enfermo de CHC TBR164.

La FIGURA 40A muestra el análisis de ANC para el paciente TBR36 para la muestra pretratamiento y la muestra postratamiento.

La FIGURA 40B muestra el análisis de metilación para el paciente TBR36 para la muestra pretratamiento y la muestra postratamiento. La FIGURA 41A muestra el análisis de ANC para el paciente TBR34 para la muestra pretratamiento y la muestra postratamiento. La FIGURA 41B muestra el análisis de metilación para el paciente TBR34 para la muestra pretratamiento y la muestra postratamiento.

La FIGURA 42 muestra un diagrama de rendimiento de diagnóstico de análisis de hipometilación en todo el genoma con diferente número de lecturas secuenciadas.

La FIGURA 43 es un diagrama que muestra curvas de ROC para la detección de cáncer basándose en análisis de hipometilación de todo el genoma con diferentes tamaños de grupos (50 kb, 100 kb, 200 kb y 1 Mb).

La FIGURA 44A muestra un rendimiento de diagnóstico para probabilidad acumulada (PA) y porcentaje de grupos con aberraciones. La FIGURA 44B muestra rendimientos de diagnóstico para el análisis de plasma con respecto a hipometilación global, hipermetilación de islas de CpG y ANC.

La FIGURA 45 muestra una tabla con resultados para hipometilación global, hipermetilación de islas de CpG y ANC en pacientes con carcinoma hepatocelular.

La FIGURA 46 muestra una tabla con resultados para hipometilación global, hipermetilación de islas de CpG y ANC en pacientes que padecen cánceres distintos de carcinoma hepatocelular.

La FIGURA 47 muestra un análisis en serie de metilación en plasma para el caso TBR34.

La FIGURA 48A muestra representaciones de Circos que demuestran la ANC (anillo interno) y los cambios de metilación (anillo externo) en el ADN de plasma tratado con bisulfito para el enfermo de CHC TBR36. La FIGURA 48B es una representación de puntuaciones z de metilación para regiones con ganancia y pérdida cromosómica, y regiones sin cambio del número de copias para el enfermo de CHC TBR36.

La FIGURA 49A muestra representaciones de Circos que demuestran la ANC (anillo interno) y los cambios de metilación (anillo externo) en el ADN de plasma tratado con bisulfito para el enfermo de CHC TBR34. La FIGURA 49B es una representación de puntuaciones z de metilación para regiones con ganancia y pérdida cromosómica, y regiones sin cambio del número de copias para el enfermo de CHC TBR34.

Las FIGURAS 50A y 50B muestran resultados de hipometilación de plasma y análisis de ANC para los pacientes con LES SLE04 y SLE10.

Las FIGURAS 51A y 51B muestran análisis de Zmet para regiones con y sin ANC para el plasma de dos pacientes con CHC (TBR34 y TBR36). Las FIGURAS 51C y 51D muestran análisis de Zmet para regiones con y sin ANC para el plasma de dos pacientes con LES (SLE04 y SLE10).

La FIGURA 52A muestra análisis de agrupamiento jerárquico para muestras de plasma de pacientes con CHC, pacientes con cáncer distinto de CHC y sujetos de control sanos usando características de grupo A para ANC, metilación global y metilación de islas de CpG. La FIGURA 52B muestra agrupamiento jerárquico usando características del grupo B para ANC, metilación global y metilación de islas de CpG.

La FIGURA 53A muestra análisis de agrupamiento jerárquico para muestras de plasma de pacientes con CHC, pacientes con cáncer distinto de CHC y sujetos de control sanos usando los elementos de metilación de islas de CpG del grupo A. La FIGURA 53B muestra análisis de agrupamiento jerárquico para muestras de plasma de pacientes con CHC, pacientes con cáncer distinto de CHC y sujetos de control sanos usando las densidades de metilación globales del grupo A.

La FIGURA 54A muestra un análisis de agrupamiento jerárquico para muestras de plasma de pacientes con CHC, pacientes con cáncer distinto de CHC y sujetos de control sanos usando los ANC globales del grupo A. La FIGURA 54B muestra un análisis de agrupamiento jerárquico para muestras de plasma de pacientes con CHC, pacientes con cáncer distinto de CHC y sujetos de control sanos usando las densidades de metilación de islas de CpG del grupo B.

La FIGURA 55A muestra un análisis de agrupamiento jerárquico para muestras de plasma de pacientes con CHC, pacientes con cáncer distinto de CHC y sujetos de control sanos usando las densidades de metilación globales del grupo B. La FIGURA 55B muestra un análisis de agrupamiento jerárquico para muestras de plasma de pacientes con CHC, pacientes con cáncer distinto de CHC y sujetos de control sanos usando las densidades de metilación globales del grupo B.

La FIGURA 56 muestra la densidad de metilación media de grupos de 1 Mb (puntos rojos) entre 32 sujetos sanos.

Definiciones

Un “metiloma” proporciona una medida de una cantidad de metilación de ADN en una pluralidad de sitios o loci en un genoma. El metiloma puede corresponder a todo el genoma como una parte sustancial del genoma o partes relativamente pequeñas del genoma. Un “metiloma fetal” corresponde al metiloma de un feto de una mujer embarazada. El metiloma fetal puede determinarse usando una diversidad de tejidos fetales o fuentes de ADN fetal, incluyendo tejidos placentarios y ADN fetal sin células en plasma materno. Un “metiloma tumoral” corresponde al metiloma de un tumor de un organismo (por ejemplo, un ser humano). El metiloma tumoral puede determinarse usando tejido tumoral o ADN tumoral sin células en plasma materno. El metiloma fetal y el metiloma tumoral son ejemplos de un metiloma de interés. Otros ejemplos de metilomas de interés son los metilomas de órganos (por ejemplo metilomas de células cerebrales, huesos, los pulmones, el corazón, los músculos y los riñones, etc.) que pueden aportar ADN en un fluido corporal (por ejemplo, plasma, suero, sudor, saliva, orina, secreciones genitales, semen, líquido de heces, líquido diarreico, líquido cefalorraquídeo, secreciones del tracto gastrointestinal, secreciones pancreáticas, secreciones intestinales, esputo, lágrimas, líquidos de aspiración de mama y tiroides, etc.). Los órganos pueden ser órganos trasplantados.

Un “metiloma de plasma” es el metiloma determinado a partir del plasma o suero de un animal (por ejemplo, un ser humano). El metiloma de plasma es un ejemplo de un metiloma sin células ya que el plasma y el suero incluyen ADN sin células. El metiloma de plasma también es un ejemplo de un metiloma mixto ya que es una mezcla de metiloma fetal/materno o metiloma de tumor/paciente. El “metiloma placentario” puede determinarse a partir de una muestra de vellosidad coriónica (CVS) o una muestra tisular placentaria (por ejemplo, obtenida después del parto). El “metiloma celular” corresponde al metiloma determinado a partir de células (por ejemplo, células sanguíneas) del paciente. El metiloma de las células sanguíneas se denomina metiloma de células sanguíneas (o metiloma sanguíneo).

Un “sitio” corresponde a un único sitio, que puede ser una única posición de base o un grupo de posiciones de bases correlacionadas, por ejemplo, un sitio de CpG. Un “locus” puede corresponder a una región que incluye múltiples sitios. Un locus puede incluir solamente un sitio, lo que haría al locus equivalente a un sitio en ese contexto.

El “índice de metilación” para cada sitio genómico (por ejemplo, un sitio de CpG) se refiere a la proporción de lecturas de secuencia que muestran metilación en el sitio frente al número total de lecturas que abarcan ese sitio. La “densidad de metilación” de una región es el número de lecturas en sitios dentro de la región que muestran metilación dividida por el número total de lecturas que abarcan los sitios en la región. Los sitios pueden tener características específicas, por ejemplo, que son sitios de CpG. Por lo tanto, la “densidad de metilación de CpG” de una región es el número de lecturas que muestran metilación de CpG dividido por el número total de lecturas que abarcan sitios de CpG en la región (por ejemplo, un sitio de CpG particular, sitios de CpG dentro de una isla de CpG, o una región mayor). Por ejemplo, la densidad de metilación para cada grupo de 100 kb en el genoma humano puede determinarse a partir del número total de citosinas no convertidas después del tratamiento con bisulfito (que corresponde a citosina metilada) en sitios de CpG como una proporción de todos los sitios de CpG abarcados por lecturas de secuencia mapeadas a la región de 100 kb. Este análisis también puede realizarse para otros tamaños de grupos, por ejemplo 50 kb o 1 Mb, etc. Una región podría ser el genoma completo o un cromosoma o parte de un cromosoma (por ejemplo una rama cromosómica). El índice de metilación de un sitio de CpG es el mismo que la densidad de metilación para una región cuando la región incluye solamente ese sitio de CpG. La “proporción de citosinas metiladas” se refiere al número de sitios de citosina, “C”, que se ha mostrado que están metilados (por ejemplo no convertidos después de la conversión por bisulfito) frente al número total de restos de citosina analizados, es decir incluyendo citosinas fuera del contexto de CpG, en la región. El índice de metilación, la densidad de metilación y la proporción de citosinas metiladas son ejemplos de “niveles de metilación”.

Un “perfil de metilación” (también denominado estado de metilación) incluye información relacionada con la metilación de ADN para una región. La información relacionada con metilación de ADN puede incluir, pero sin limitación, un índice de metilación de un sitio de CpG, una densidad de metilación de sitios de CpG en una región, una distribución de sitios de CpG sobre una región contigua, un patrón o nivel de metilación para cada sito de CpG individual dentro de una región que contiene más de un sitio de CpG y metilación distinta de CpG. Un perfil de metilación de una parte sustancial del genoma puede considerarse equivalente al metiloma. La “metilación de ADN” en genomas de mamífero se refiere típicamente a la adición de un grupo metilo al carbono 5' de restos de citosina (es decir 5-metilcitosinas) entre dinucleótidos de CpG. Puede producirse metilación de ADN en citosinas en otros contextos, por ejemplo, CHG y CHH, donde H es adenina, citosina o timina. La metilación de citosina también puede estar en forma de 5-hidroximetilcitosina. También se ha indicado la mutilación distinta de citosina, tal como N6-metiladenina.

Un “tejido” corresponde a cualquier célula. Diferentes tipos de tejido pueden corresponder a diferentes tipos de células (por ejemplo, hígado, pulmón o sangre), pero también pueden corresponder a tejido de diferentes órganos (madre frente a feto) o a células sanas frente a células tumorales. Una “muestra biológica” se refiere a cualquier muestra que se tome de un sujeto (por ejemplo, un ser humano, tal como una mujer embarazada, una persona con cáncer o una persona que se sospecha que tiene cáncer, un receptor de trasplante de órgano o un sujeto que se sospecha que tiene un proceso de enfermedad que implica un órgano (por ejemplo, el corazón en infarto de miocardio, o el cerebro en ictus) y contiene una o más moléculas de ácido nucleico de interés. La muestra biológica puede ser un líquido corporal, tal como sangre, plasma, suero, orina, líquido vaginal, líquidos de lavado uterino o vaginal, líquido pleural, líquido ascítico, líquido cefalorraquídeo, saliva, sudor, lágrimas, esputo, líquido de lavado broncoalveolar, etc. También pueden usarse muestras de heces.

La expresión “nivel de cáncer” puede referirse a si existe cáncer, un estadio de un cáncer, un tamaño de tumor, si hay metástasis, la carga tumoral total del cuerpo y/u otra medida de una gravedad de un cáncer. El nivel de cáncer podría ser un número u otros caracteres. El nivel podría ser cero. El nivel de cáncer también incluye condiciones premalignas o precancerosas (estados) asociados con mutaciones o un número de mutaciones. El nivel de cáncer puede usarse de diversas maneras. Por ejemplo, la exploración puede comprobar si está presente cáncer en alguien de quien no se ha sabido previamente que tuviera cáncer. La evaluación puede investigar a alguien a quien se ha diagnosticado que tiene cáncer para supervisar el progreso del cáncer a lo largo del tiempo, estudiar la eficacia de las terapias o determinar el pronóstico. En una realización, el pronóstico puede expresarse como la probabilidad de que un paciente muera de cáncer, o la probabilidad de que el cáncer progrese después de una duración o un tiempo específico, o la probabilidad de que el cáncer se metastatice. La detección puede significar “explorar” o puede significar comprobar si alguien, con elementos que sugieren cáncer (por ejemplo síntomas u otros ensayos positivos), tiene cáncer.

Descripción detallada

Los mecanismos epigenéticos desempeñan un papel importante en el desarrollo embrionario y fetal. Sin embargo, los tejidos embrionarios y fetales humanos (incluyendo tejidos placentarios) no están fácilmente accesibles (Patente de Estados Unidos 6.927.028). Ciertas realizaciones han abordado este problema analizando una muestra que tiene moléculas de ADN fetal sin células en circulación materna. El metiloma fetal puede deducirse de diversas formas. Por ejemplo, el metiloma de plasma materno puede compararse con un metiloma celular (de células sanguíneas de la madre) y se muestra que la diferencia está correlacionada con el metiloma fetal. Como otro ejemplo, pueden usarse los alelos específicos fetales para determinar la metilación del metiloma fetal en loci específicos. Adicionalmente, el tamaño de un fragmento puede usarse como un indicador de un porcentaje de metilación, ya que se muestra una correlación entre el tamaño y el porcentaje de metilación.

En una realización, se usa secuenciación por bisulfito de todo el genoma para analizar el perfil de metilación (parte de o todo un metiloma) de ADN de plasma materno en resolución de un único nucleótido. Aprovechando las diferencias polimórficas entre la madre y el feto, el metiloma fetal podría ensamblarse a partir de muestras de sangre materna. En otra implementación, no se usaron diferencias polimórficas, pero puede usarse un diferencial entre el metiloma de plasma y el metiloma de células sanguíneas.

En otra realización, aprovechando variaciones de un único nucleótido y/o aberraciones del número de copias entre un genoma tumoral y un genoma no tumoral, y datos de secuenciación de plasma (u otra muestra), puede realizarse el perfil de metilación de un tumor en la muestra de un paciente que se sospecha o se sabe que tiene cáncer Una diferencia en un nivel de metilación en una muestra de plasma de un individuo de ensayo en comparación con el nivel de metilación en plasma de un control sano o un grupo de controles sanos puede permitir que se identifique que el individuo de ensayo alberga cáncer. Adicionalmente, el perfil de metilación puede actuar como una identificación que revela el tipo de cáncer, por ejemplo, de qué órgano, que la persona ha desarrollado y si se ha producido metástasis.

Debido a la naturaleza no invasiva de este enfoque, los inventores pudieron evaluar en serie los metilomas de plasma fetal y materno de muestras de sangre materna recogidas en el primer trimestre, tercer trimestre y después del parto. Se observaron cambios relacionados con la gestación. El enfoque también puede aplicarse a muestras obtenidas durante el segundo trimestre. El metiloma fetal deducido a partir del plasma materno durante el embarazo se asemejó al metiloma placentario. Los genes con impronta y regiones metiladas diferencialmente se identificaron a partir de los datos de plasma materno.

Se ha desarrollado por lo tanto un enfoque para estudiar el metiloma fetal de forma no invasiva, en serie y de forma exhaustiva, ofreciendo de este modo la posibilidad de identificar biomarcadores o ensayo directo de patologías relacionadas con el embarazo. También pueden usarse realizaciones para estudiar el metiloma tumoral de forma no invasiva, en serie y de forma exhaustiva, para explorar o detectar si un sujeto padece cáncer, para supervisar enfermedades malignas en un paciente de cáncer y para pronóstico. Pueden aplicarse realizaciones a cualquier tipo de cáncer, incluyendo, pero sin limitación, cáncer de pulmón, cáncer de mama, cáncer colorrectal, cáncer de próstata, cáncer nasofaríngeo, cáncer gástrico, cáncer testicular, cáncer de piel (por ejemplo melanoma), cáncer que afecta al sistema nervioso, cáncer de hueso, cáncer ovárico, cáncer de hígado (por ejemplo carcinoma hepatocelular), tumores malignos hematológicos, cáncer pancreático, endometriocarcinoma, cáncer de riñón, cáncer del cuello uterino, cáncer de vejiga, etc.

Se analiza en primer lugar una descripción de cómo determinar un metiloma o un perfil de metilación, y después se describen metilomas diferentes (tales como metilomas fetales, un metiloma tumoral, metilomas de la madre o un paciente, y un metiloma mixto, por ejemplo, de plasma). La determinación de un perfil de metilación fetal se describe después usando marcadores específicos fetales o comparando un perfil de metilación mixto con un perfil de metilación celular. Se determinan marcadores de metilación fetales comparando perfiles de metilación. Se analiza una relación entre el tamaño y la metilación. También se proporcionan usos de perfiles de metilación para detectar cáncer.

I. DETERMINACIÓN DE UN METILOMA

Se ha usado una multitud de enfoques para investigar el metiloma placentario, pero cada enfoque tiene sus limitaciones. Por ejemplo, el bisulfito sódico, un producto químico que modifica restos de citosina no metilados a uracilo y deja citosina metilada sin cambios, convierte las diferencias en metilación de citosina en una diferencia de secuencia genética para análisis adicional. El método de patrón oro de estudio de metilación de citosina se basa en el tratamiento de ADN tisular con bisulfito sódico seguido de secuenciación directa de clones individuales de moléculas de ADN convertidas con bisulfito. Después del análisis de múltiples clones de moléculas de ADN, puede obtenerse el patrón de metilación de citosina y perfil cuantitativo por cada sitio de CpG. Sin embargo, la secuenciación por bisulfito clonada es un procedimiento de bajo rendimiento y laborioso que no puede aplicarse fácilmente a una escala de todo el genoma.

Las enzimas de restricción sensibles a metilación que digieren típicamente ADN no metilado proporcionan un enfoque de bajo coste para estudiar la metilación del ADN. Sin embargo, los datos generados a partir de dichos estudios están limitados a loci con los motivos de reconocimiento de enzimas y los resultados no son cuantitativos. Puede usarse inmunoprecipitación de ADN unido con anticuerpos anticitosina metilada para investigar grandes segmentos del genoma pero tiende a desplazarse hacia loci con metilación densa debido a mayor fuerza de unión del anticuerpo con dichas regiones. Los enfoques basados en micromatrices dependen del diseño a priori de las sondas de consulta y eficacias de hibridación entre las sondas y el ADN diana.

Para consultar un metiloma de forma exhaustiva, algunas realizaciones usan secuenciación paralela masiva (SPM) para proporcionar información de todo el genoma y evaluación cuantitativa del nivel de metilación por nucleótido y por alelo. Recientemente, se ha hecho viable la conversión de bisulfito seguida de SPM de todo el genoma (R Lister et al., 2008 Cell; 133: 523-536).

Entre el número pequeño de estudios publicados (R Lister et al., 2009 Nature; 462: 315-322; L Laurent et al., 2010 Genome Res; 20: 320-331; Y Li et al, 2010 PLoS Biol; 8: e1000533; y M Kulis et al., 2012 Nat Genet; 44: 1236-1242) que han aplicado secuenciación de bisulfito de todo el genoma para la investigación de metilomas humanos, dos estudios se han centrado en células madre embrionarias y fibroblastos fetales (R Lister et al. Nature; 462: 315-322; L Laurent et al., 2010 Genome Res; 20: 320-331). Ambos estudios analizaron ADN derivado de línea celular.

A. Secuenciación de bisulfito de todo el genoma

Ciertas realizaciones pueden superar los retos anteriormente mencionados y permitir la consulta de un metiloma fetal de forma exhaustiva, no invasiva y en serie. En una realización, se usó secuenciación por bisulfito de todo el genoma para analizar moléculas de ADN fetal sin células que se encuentran en la circulación de mujeres embarazadas. A pesar de la baja abundancia y la naturaleza fragmentada de las moléculas de ADN de plasma, los inventores fueron capaces de ensamblar un metiloma fetal de alta resolución a partir de plasma materno y observar en serie los cambios con la progresión del embarazo. Dado el intenso interés en los ensayos prenatales no invasivos (EPNI), las realizaciones pueden proporcionar una nueva herramienta potente para el descubrimiento de biomarcadores fetales o actuar como una plataforma directa para conseguir EPNI de enfermedades asociadas con el embarazo. Se proporcionan ahora datos de la secuenciación por bisulfito de todo el genoma de diversas muestras, de los que puede obtenerse el metiloma fetal. En una realización, esta tecnología puede aplicarse para perfil de metilación en embarazos complicados con preeclampsia, o retardo del crecimiento intrauterino, o parto prematuro. Para dicho embarazos complicados, esta tecnología puede usarse en serie debido a su naturaleza no invasiva, para permitir la supervisión y/o el pronóstico y/o la respuesta al tratamiento.

La FIGURA 1A muestra una tabla 100 de resultados de secuenciación para sangre materna, placenta y plasma materno de acuerdo con realizaciones de la presente descripción. En una realización, se realizó secuenciación de genoma completo en bibliotecas de ADN convertidas por bisulfito, preparadas usando adaptadores de bibliotecas de ADN metilado (Illumina) (R Lister et al., 2008 Cell; 133: 523-536), de células sanguíneas de la muestra de sangre recogida en el primer trimestre, la CVS, el tejido placentario recogido a término, las muestras de plasma materno recogidas durante el primer y el tercer trimestres y el periodo posparto. También se analizaron muestras de ADN de células sanguíneas y plasma obtenidas de un hombre adulto y una mujer adulta no embarazada. Se generaron en este estudio un total de 9.500 millones de pares de lecturas de secuencia en bruto. La cobertura de secuenciación de cada muestra se muestra en la tabla 100.

Las lecturas de secuencia que eran mapeables de forma única en el genoma de referencia humano alcanzaron coberturas genómicas haploides promedio de 50 veces, 34 veces y 28 veces, respectivamente, para las muestras de plasma materno del primer trimestre, tercer trimestre y posparto. La cobertura de los sitios de CpG en el genoma varió del 81 % al 92 % para las muestras obtenidas del embarazo. Las lecturas de secuencia que abarcaron sitios de CpG sumaron coberturas haploides promedio de 33 veces por cadena, 23 veces por cadena y 19 veces por cadena, respectivamente, para las muestras de plasma materno del primer trimestre, tercer trimestre y posparto. Las eficacias de conversión por bisulfito para todas las muestras fueron >99,9 % (tabla 100).

En la tabla 100, la tasa ambigua (marcada “a”) se refiere a la proporción de lecturas mapeadas en ambas cadenas de Watson y Crick del genoma humano de referencia. La tasa de conversión lambda se refiere a la proporción de citosinas no metiladas en el control de ADN lambda interno que se convierten a los restos de “timina” por modificación con bisulfito. H es igual en general a A, C o T. “a” se refiere a lecturas que podían mapearse en un locus genómico específico pero no pueden asignarse a la cadena de Watson o Crick. “b” se refiere a lecturas emparejadas con coordenadas de inicio y final idénticas. Para “c”, se añadió ADN lambda a cada muestra antes de la conversión por bisulfito. La tasa de conversión lambda se refiere a la proporción de nucleótidos citosina que permanecen como citosina después de la conversión por bisulfito y se usa como un indicio de la tasa de conversión con bisulfito exitosa. “d” se refiere al número de nucleótidos de citosina presentes en el genoma humano de referencia y que permanecen como una secuencia de citosina después de conversión por bisulfito.

Durante la modificación por bisulfito, se convierten citosinas desmetiladas en uracilos y posteriormente timinas después de amplificaciones por PCR mientras que las citosinas metiladas permanecen intactas (M Frommer et al., 1992 Proc Natl Acad Sci. USA; 89: 1827-31). Después de la secuenciación y el alineamiento, el estado de metilación de un sitio de CpG individual podría de este modo inferirse a partir del recuento de lecturas de secuencias metiladas “M” (metiladas) y el recuento de lecturas de secuencias desmetiladas “U” (desmetiladas) en el resto de citosina en el contexto de CpG. Usando los datos de secuenciación por bisulfito, se construyeron los metilomas completos de sangre materna, placenta y plasma materno. La densidad de CpG metilado media (también denominada densidad de metilación MD) de loci específicos en el plasma materno puede calcularse usando la ecuación:

donde M es el recuento de lecturas metiladas y U es el recuento de lecturas no metiladas en los sitios de CpG dentro del locus genético. Si hay más de un sitio de CpG dentro de un locus, entonces M y U corresponden a los recuentos entre los sitios.

B. Diversas técnicas

La SPM del ADN de plasma convertido por bisulfito puede realizarse de una manera aleatoria o al azar. La profundidad de la secuenciación puede variarse de acuerdo con el tamaño de la región de interés.

En otra realización, la región o las regiones de interés en el ADN de plasma convertido por bisulfito puede capturarse en primer lugar usando un proceso basado en hibridación en fase de solución o en fase sólida, seguido de SPM. La secuenciación en paralelo masiva puede realizarse usando una plataforma de secuenciación por síntesis tal como la Illumina, una plataforma de secuenciación por ligamiento tal como la plataforma SOLiD de Life Technologies, un sistema de secuenciación basado en semiconductores tal como las plataformas Ion Torrent o Ion Proton de Life Technologies, o sistema de secuenciación de una única molécula tal como el sistema Helicos o el sistema de Pacific Biosciences o un sistema de secuenciación basado en nanoporos. La secuenciación basada en nanoporos incluye nanoporos que se construyen usando, por ejemplo, bicapas lipídicas y nanoporos de proteínas y nanoporos de estado sólido (tales como los que se basan en grafeno).

II. ANÁLISIS DE METILOMAS

Algunas realizaciones pueden determinar el perfil de metilación de ADN de plasma usando secuenciación por bisulfito de todo el genoma. El perfil de metilación de un feto puede determinarse por secuenciación de muestras de ADN de plasma materno, como se describe posteriormente. Por lo tanto, se accedió a las moléculas de ADN fetal (y metiloma fetal) de forma no invasiva durante el embarazo, y se supervisaron los cambios en serie a medida que progresó el embarazo. Debido a la exhaustividad de los datos de secuenciación, se pudieron estudiar los metilomas de plasma materno a una escala de todo el genoma a resolución de un único nucleótido.

Ya que se conocían las coordenadas genómicas de las lecturas secuenciadas, estos datos permitieron estudiar los niveles de mutilación generales del metiloma o cualquier región de interés en el genoma y realizar comparaciones entre diferentes elementos genéticos. Además, múltiples lecturas de secuencias abarcaron cada sitio o locus de CpG. Se proporciona ahora una descripción de algunas de las medidas usadas para medir el metiloma.

A. Metilación de moléculas de ADN de plasma

Las moléculas de ADN están presentes en plasma humano a concentraciones bajas y en forma fragmentada, típicamente en longitudes que se asemejan a unidades mononucleosómicas (YMD Lo et al. 2010 Sci Transl Med; 2: 61ra91; e YW Zheng et al. 2012 Clin Chem; 58: 549-558). A pesar de estas limitaciones, un proceso de secuenciación por bisulfito de todo el genoma fue capaz de analizar la metilación de las moléculas de ADN de plasma.

La secuenciación por bisulfito también puede diferenciar entre diferentes formas de metilación. En una realización, se pueden incluir etapas adicionales que puedan diferenciar 5-metilcitosina de 5-hidroximetilcitosina. Uno de dichos enfoques es la secuenciación por bisulfito oxidativa (oxBS-seq), que puede dilucidar la localización de 5-metilcitosina y 5-hidroximetilcitosina a una resolución de una única base (Mj Booth et al. 2012 Science; 336: 934-937; MJ Booth et al. 2013 Nature Protocols; 8: 1841-1851). En secuenciación por bisulfito, tanto 5-metilcitosina como 5-hidroximetilcitosina se leen como citosinas y por lo tanto no pueden diferenciarse. Por otro lado, en oxBS-seq, la oxidación específica de 5-hidroximetilcitosina a 5-formilcitosina por tratamiento con perrutenato de potasio (KRuO4), seguido de la conversión de la 5-formilcitosina de nueva formación a uracilo usando conversión por bisulfito permitiría diferenciar 5-hidroximetilcitosina de 5-metilcitosina. Por lo tanto, puede obtenerse una lectura de 5-metilcitosina a partir de un único ciclo de oxBS-seq y los niveles de 5-hidroximetilcitosina se deducen por comparación con los resultados de secuenciación por bisulfito. En otra realización, puede distinguirse 5-metilcitosina de 5-hidroximetilcitosina usando secuenciación por bisulfito asistida por Tet (TAB-seq) (M Yu et al., 2012 Nat Protoc; 7: 2159-2170). TAB-seq puede identificar 5-hidroximetilcitosina en resolución de una única base, así como determinar su abundancia en cada sitio de modificación. Este método implica protección mediada por pglucosiltransferasa de 5-hidroximetilcitosina (glucosilación) y oxidación mediada por Tet1 de ratón (mTet1) recombinante de 5-metilcitosina a 5-carboxilcitosina. Después del tratamiento por bisulfito posterior y la amplificación por PCR, tanto citosina como 5-carboxilcitosina (derivada de 5-metilcitosina) se convierten a timina (T), mientras que 5-hidroximetilcitosina se leerá como C.

La FIGURA 1B muestra la densidad de metilación en ventanas de 1 Mb de muestras secuenciadas según realizaciones de la presente descripción. La representación 150 es una representación de Circos que representa la densidad de metilación en el plasma materno y ADN genómico en ventanas de 1 Mb por todo el genoma. Desde fuera hacia dentro: los ideogramas de cromosomas pueden orientarse pter-qter en el sentido de las agujas del reloj (los centrómeros se muestran en rojo), sangre materna (rojo), placenta (amarillo), plasma materno (verde), lecturas compartidas en plasma materno (azul) y lecturas específicas fetales en plasma materno (morado). Los niveles de metilación de CpG generales (es decir, niveles de densidad) de células sanguíneas maternas, placenta y plasma materno pueden encontrarse en la tabla 100. El nivel de metilación de células sanguíneas maternas es en general mayor que el de la placenta en todo el genoma completo.

B. Comparación de secuenciación por bisulfito con otras técnicas

Se estudió el metiloma placentario usando secuenciación por bisulfito en paralelo masiva. Por referencia se estudió el metiloma placentario usando una plataforma de matriz de oligonucleótidos que abarcaba aproximadamente 480.000 sitios de CpG en el genoma humano (Illumina) (M Kulis et al. 2012 Nat Genet; 44: 1236-1242; y C Clark et al. 2012 PLoS One; 7: e50233). En una realización usando genotipado basado en beadchip y análisis de metilación, se realizó genotipado usando la matriz de genotipado Illumina HumanOmni2.5-8 de acuerdo con el protocolo del fabricante. Los genotipos se deciden usando el algoritmo GenCall del software Genome Studio (Illumina). Las tasas de decisión fueron de más del 99 %. Para el análisis de metilación basado en micromatrices, se trató ADN genómico (500-800 ng) con bisulfito sódico usando el kit de metilación de ADN Zymo EZ (Zymo Research, Orange, CA, EE.UU.) de acuerdo con las recomendaciones del fabricante para el Ensayo de Metilación Illumina Infinium.

El ensayo de metilación se realizó en 4 |jl de ADN genómico convertido por bisulfito a 50 ng/jl de acuerdo con el protocolo de Ensayo de Metilación Infinium HD. La beadchip hibridada se exploró en un instrumento iScan de Illumina. Se analizaron los datos de metilación de ADN por el software de Módulo de Metilación (v1.9.0) de GenomeStudio (v2011.1), con normalización con respecto a controles internos y resta de fondos. El índice de metilación para sitio de CpG individual estuvo representado por un valor beta (p), que se calculó usando la relación de intensidades de fluorescencia entre alelos metilados y desmetilados:

Para sitios de CpG que estaban representados en la matriz y se secuenciaron para cobertura de al menos 10 veces, se comparó el valor beta obtenido por la matriz con el índice de metilación como se determinó por secuenciación del mismo sitio. Los valores beta representaron la intensidad de sondas metiladas como una proporción de la intensidad combinada de las sondas metiladas y no metiladas que abarcan el mismo sitio de CpG. El índice de mutilación para cada sitio de CpG se refiere a la proporción de lecturas metiladas sobre el número total de lecturas que abarcan ese CpG.

Las FIGURAS. 2A-2C muestran representaciones de los valores beta determinados por la matriz de beadchip de 450K de Metilación Humana Infinium Illumina frente a los índices de metilación determinados por secuenciación por bisulfito de todo el genoma de sitios de CpG correspondientes que se consultaron para ambas plataformas: (A) Células sanguíneas maternas, (B) Muestra de la vellosidad coriónica, (C) Tejido placentario a término. Los datos de ambas plataformas fueron altamente concordantes y los coeficientes de correlación de Pearson fueron de 0,972, 0,939 y 0,954, y los valores de R2 fueron de 0,945, 0,882 y 0,910 para las células sanguíneas maternas, CVS y tejido placentario a término, respectivamente.

Se compararon además los datos de secuenciación de los inventores con los presentados por Chu et al, que investigaron los perfiles de metilación de 12 pares de CVS y muestras de ADN de células sanguíneas maternas usando una matriz de oligonucleótidos que abarcó aproximadamente 27.000 sitios de CpG (T Chu et al. 2011 PLoS One; 6: e14723). Los datos de correlación entre los resultados de secuenciación de la CVS y ADN de células sanguíneas maternas y cada uno de los 12 pares de muestras en el estudio previo proporcionó un coeficiente de Pearson promedio (0,967) y R2 (0,935) para sangre materna y un coeficiente de Pearson promedio (0,943) y R2 (0,888) para la CVS. Entre los sitios de CpG representados en ambas matrices, los datos de los inventores se correlacionaron en alta medida con los datos publicados. Las tasas de metilación distinta de CpG fueron de <1 % para las células sanguíneas maternas, CVS y tejidos placentarios (tabla 100). Estos resultados fueron coherentes con la creencia actual de que cantidades sustanciales de metilación distinta de CpG se restringieron principalmente a células pluripotenciales (R Lister et al., 2009 Nature; 462: 315-322; L Laurent et al., 2010 Genome Res; 20: 320 331).

C. Comparación de metilomas de plasma y sangre para personas no embarazadas

Las FIGURAS 3A y 3B muestran diagramas de barras del porcentaje de sitios de CpG metilados en plasma y células sanguíneas recogidos de un hombre adulto y una mujer adulta no embarazada: (A) Autosomas, (B) Cromosoma X. Los diagramas muestran una similitud entre los metilomas de plasma y sangre de un hombre y una mujer no embarazada. Las proporciones generales de sitios de CpG que estaban metilados en las muestras de plasma del hombre y de la mujer no embarazada fueron casi iguales al ADN de células sanguíneas correspondientes (tabla 100 y FIGURAS 2A y 2B).

A continuación, se estudió la correlación de los perfiles de metilación de las muestras de plasma y células sanguíneas de una manera específica de locus. Se determinó la densidad de metilación de cada grupo de 100 kb en el genoma humano determinando el número total de citosinas no convertidas en sitios de CpG como una proporción de todos los sitios de CpG abarcados por lecturas de secuencia mapeadas en la región de 100 kb. Las densidades de metilación fueron altamente concordantes entre la muestra de plasma y ADN de células sanguíneas correspondiente de las muestras del hombre así como de la mujer.

Las FIGURAS. 4A y 4B muestran representaciones de densidades de metilación de loci correspondientes en ADN de células sanguíneas y ADN de plasma: (A) Mujer adulta no embarazada, (B) Hombre adulto. El coeficiente de correlación de Pearson y el valor de R2 para las muestras de mujer no embarazada fueron respectivamente 0,963 y 0,927, y para las muestras del hombre fueron respectivamente 0,953 y 0,908. Estos datos son coherentes con hallazgos previos basados en la evaluación de genotipos de moléculas de ADN de plasma de receptores de trasplante de células madre hematopoyéticas alogénico que mostraron que las células hematopoyéticas son la fuente predominante de ADN en el plasma humano (YW Zheng et al. 2012 Clin Chem; 58: 549-558).

D. Niveles de metilación entre metilomas

A continuación se estudiaron los niveles de metilación de ADN de ADN de plasma materno, células sanguíneas maternas y tejido placentario para determinar los niveles de metilación. Los niveles se determinaron para regiones repetidas, regiones no repetidas, y generales.

Las FIGURAS 5A y 5B muestran diagramas de barras del porcentaje de sitios de CpG metilados entre muestras recogidas del embarazo: (A) Autosomas, (B) Cromosoma X. Las proporciones generales de CpG metilados fueron de 67,0 % y 68,2 % para las muestras de plasma materno del primer y tercer trimestre, respectivamente. A diferencia de los resultados obtenidos de las personas no embarazados, estas proporciones fueron menores que las de la muestra de células sanguíneas maternas del primer trimestre pero mayores que las de la CVS y muestras de tejido placentario a término (tabla 100). Debe observarse que el porcentaje de CpG metilados para la muestra de plasma materno posparto fue del 73,1 % lo que fue similar a los datos de células sanguíneas (tabla 100). Estas tendencias se observaron en CpG distribuidos por todos los autosomas así como en el cromosoma X y abarcaron tanto las regiones no repetidas como múltiples clases de elementos repetidos del genoma humano.

Se descubrió que los elementos tanto repetidos como no repetidos en la placenta estaban hipometilados en relación con células sanguíneas maternas. Los resultados fueron concordantes con los hallazgos en la bibliografía de que la placenta está hipometilada en relación con otros tejidos, incluyendo células sanguíneas periféricas.

Entre el 71 % y el 72 % de los sitios de CpG secuenciados estaban metilados en el ADN de células sanguíneas de la mujer embarazada, la mujer no embarazada y el hombre adulto (tabla 100 de la FIGURA 1). Estos datos son comparables con el informe del 68,4 % de sitios de CpG de células mononucleares sanguíneas presentado por Y Li et al. 2010 PLoS Biol; 8: e1000533. De forma coherente con los informes previos sobre la naturaleza hipometilada de tejidos placentarios, el 55 % y el 59 % de los sitios de CpG estaban metilados en la CVS y el tejido placentario a término, respectivamente (tabla 100).

La FIGURA 6 muestra un diagrama de barras del nivel de metilación de diferentes clases repetidas del genoma humano para sangre materna, placenta y plasma materno. Las clases repetidas son como se definen por el buscador de genoma de UCSC. Los datos mostrados son para las muestras del primer trimestre. A diferencia de datos anteriores que sugieren que la naturaleza hipometilada de tejidos placentarios se observó principalmente en ciertas clases repetidas en el genoma (B Novakovic et al., 2012 Placenta; 33: 959-970), aquí se muestra que la placenta estaba de hecho hipometilada en la mayoría de clases de elementos genómicos en referencia a células sanguíneas.

E. Similitud de metilomas

Las realizaciones pueden determinar los metilomas de tejidos placentarios, células sanguíneas y plasma usando la misma plataforma. Por lo tanto, fueron posibles comparaciones directas de los metilomas de esos tipos de muestras biológicas. El alto nivel de semejanza entre metilomas de las células sanguíneas y plasma para el hombre y la mujer no embarazada así como entre las células sanguíneas maternas y la muestra de plasma materno posparto afirmaron adicionalmente que las células hematopoyéticas eran las principales fuentes de ADN en plasma humano (YW Zheng et al. 2012 Clin Chem; 58: 549-558).

Las semejanzas son evidentes tanto con respecto a la proporción general de CpG metilados en el genoma así como de la alta correlación de densidades de metilación entre loci correspondientes en el ADN de células sanguíneas y ADN del plasma. No obstante, las proporciones generales de CpG metilados en las muestras de plasma materno del primer trimestre y tercer trimestre se redujeron en comparación con los datos de células sanguíneas maternas o la muestra de plasma materno posparto. Los niveles de metilación reducidos durante el embarazo se debieron a la naturaleza hipometilada de las moléculas de ADN fetal presentes en el plasma materno.

La inversión del perfil de metilación en la muestra de plasma materno posparto hasta hacerse más similar al de las células sanguíneas maternas sugiere que las moléculas de ADN fetal se habían retirado de la circulación materna. El cálculo de las concentraciones de ADN fetal basado en marcadores de SNP del feto mostraron de hecho que la concentración cambió de 33,9 % antes del parto a solamente 4,5 % en la muestra posparto.

F. Otras aplicaciones

Las realizaciones han ensamblado con éxito metilomas de ADN mediante el análisis de SPM de ADN de plasma. La capacidad de determinar el metiloma placentario o fetal a partir del plasma materno proporciona un método no invasivo para determinar, detectar y supervisar los perfiles de metilación aberrante asociados con afecciones asociadas al embarazo tales como preeclampsia, restricción del crecimiento intrauterino, parto prematuro y otros. Por ejemplo, la detección de una identificación de metilación aberrante específica de enfermedad permite la exploración, el diagnóstico y la supervisión de dichas afecciones asociadas a embarazo. La medición del nivel de metilación de plasma materno permite la exploración, el diagnóstico y la supervisión de dichas afecciones asociadas a embarazo. Además de las aplicaciones directas en la investigación de afecciones asociadas a embarazo, el enfoque podría aplicarse a otras áreas de la medicina en las que es interesante el análisis de ADN de plasma. Por ejemplo, los metilomas de cánceres pudieron determinarse a partir de ADN de plasma de pacientes con cáncer. El análisis metilómico de cáncer a partir del plasma, como se describe en el presente documento, es potencialmente una tecnología sinérgica con el análisis genómico del cáncer a partir del plasma (KCA Chan et al. 2013 Clin Chem; 59: 211-224 y RJ Leary y col., 2012 Sci Transl Med; 4: 162ra154).

Por ejemplo, la determinación de un nivel de metilación de una muestra de plasma podría usarse para explorar con respecto al cáncer. Cuando el nivel de metilación de la muestra de plasma muestra niveles aberrantes en comparación con controles sanos, puede sospecharse cáncer. Después puede realizarse confirmación y evaluación adicional del tipo de cáncer u origen tisular del cáncer determinando el perfil de plasma de metilación en diferentes loci genómicos o mediante análisis genómico del plasma para detectar aberraciones en el número de copias asociadas con tumor, translocaciones cromosómicas y variantes de un único nucleótido. De hecho, en una realización de la presente descripción, el perfil metilómico y genómico del cáncer de plasma puede llevarse a cabo de forma simultánea. Como alternativa, podrían usarse investigaciones radiológicas y de captura de imágenes (por ejemplo tomografía computarizada, imágenes por resonancia magnética, tomografía de emisión de positrones) o endoscopia (por ejemplo endoscopia gastrointestinal superior o colonoscopia) para investigar adicionalmente individuos que se sospecha que tienen cáncer basándose en el análisis del nivel de metilación en plasma.

Para exploración o detección de cáncer, la determinación de un nivel de metilación de una muestra de plasma (u otra biológica) puede usarse junto con otras modalidades para exploración o detección de cáncer tal como medición del antígeno específico de próstata (por ejemplo, para cáncer de próstata), antígeno carcinoembrionario (por ejemplo para carcinoma colorrectal, carcinoma gástrico, carcinoma pancreático, carcinoma de pulmón, carcinoma de mama, carcinoma de tiroides medular), fetoproteína alfa (por ejemplo para cáncer de hígado o tumores de células germinales), CA125 (por ejemplo para cáncer ovárico y de mama) y CA19-9 (por ejemplo para carcinoma pancreático).

Adicionalmente, otros tejidos pueden secuenciarse para obtener un metiloma celular. Por ejemplo, el tejido hepático puede analizarse para determinar un patrón de metilación específico para el hígado, que puede usarse para identificar patologías de hígado. Otros tejidos que pueden analizarse también incluyen células cerebrales, huesos, los pulmones, el corazón, los músculos y los riñones, etc. Los perfiles de metilación de diversos tejidos pueden cambiar de vez en cuando, por ejemplo como resultado del desarrollo, el envejecimiento, procesos de enfermedad (por ejemplo inflamación o cirrosis o procesos autoinmunitarios (tal como en lupus eritematoso sistémico)) o tratamiento (por ejemplo tratamiento con agentes desmetilantes tales como 5-azacitidina y 5-azadesoxicitidina). La naturaleza dinámica de la metilación de ADN hace a dicho análisis potencialmente muy valioso para supervisar los procesos fisiológicos y patológicos. Por ejemplo, si se detecta un cambio en el metiloma de plasma de un individuo en comparación con un valor de línea basal obtenido cuando estaban sanos, se podrían entonces detectar procesos de enfermedad en órganos que aportan ADN de plasma.

Además, los metilomas de órganos trasplantados podrían determinarse a partir de ADN de plasma de receptores de trasplante de órganos. El análisis metilómico de trasplante de plasma, como se describe en esta descripción, es potencialmente una tecnología sinérgica con el análisis genómico del trasplante de plasma (YW Zheng et al, 2012; YMD Lo et al., 1998 Lancet; 351: 1329-1330; y TM Snyder et al. 2011 Proc Natl Acad Sci USA; 108: 6229-6234). Como el ADN de plasma se considera en general un marcador de muerte celular, un aumento en el nivel en plasma de ADN liberado de un órgano trasplantado podría usarse como un marcador para muerte celular aumentada de ese órgano, tal como un episodio de rechazo u otros procesos patológicos que implican a ese órgano (por ejemplo infección o absceso). En el caso de que se instituya con éxito terapia antirrechazo, se espera que se reduzca el nivel de plasma de ADN liberado por el órgano trasplantado.

NI. DETERMINACIÓN DE METILOMA FETAL O TUMORAL USANDO SNP

Como se ha descrito anteriormente, el metiloma de plasma corresponde al metiloma de sangre de una persona normal no embarazada. Sin embargo, para una mujer embarazada, los metilomas difieren. Las moléculas de ADN fetal circulan en plasma materno entre un fondo mayoritario de ADN materno (YMD Lo et al., 1998 Am J Hum Genet; 62: 768-775). Por lo tanto, para una mujer embarazada, el metiloma de plasma es en gran parte un compuesto del metiloma placentario y el metiloma de sangre. En consecuencia, se puede extraer el metiloma placentario del plasma.

En una realización, se usan diferencias de polimorfismos de un único nucleótido (SNP) entre la madre y el feto para identificar las moléculas de ADN fetal en plasma materno. Un objetivo fue identificar loci de SNP en los que la madre es homocigótica, pero el feto es heterocigoto; el alelo específico fetal puede usarse para determinar qué fragmentos de ADN son del feto. Se analizó ADN genómico de las células sanguíneas maternas usando una matriz de genotipado de SNP, la Illumina HumanOmni2.5-8. Por otro lado, para loci de SNP en los que la madre es heterocigota y el feto es homocigoto, entonces el alelo de SNP que es específico para la madre puede usarse para determinar qué fragmentos de ADN de plasma son de la madre. El nivel de metilación de dichos fragmentos de ADN reflejaría el nivel de metilación de las regiones genómicas relacionadas en la madre.

A. Correlación de la metilación de lecturas específicas fetales y metiloma placentario

Se identificaron loci que tienen dos alelos diferentes, en los que la cantidad de un alelo (B) era significativamente menor que la del otro alelo (A), a partir de resultados de secuenciación de una muestra biológica. Las lecturas que abarcaban los alelos B se consideraron específicas fetales (lecturas específicas fetales). Se determina que la madre es homocigota para A y el feto heterocigoto para A/B, y por lo tanto las lecturas que abarcan el alelo A fueron compartidas por la madre y el feto (lecturas compartidas).

En un caso de embarazo analizado que se usó para ilustrar varios de los conceptos de esta descripción, se descubrió que la madre embarazada era homocigota en 1.945.516 loci en los autosomas. Se inspeccionaron las lecturas de secuenciación de ADN de plasma materno que abarcaban estos SNP. Se detectaron lecturas que portaban un alelo no materno en 107.750 loci y estos se consideraron loci informativos. En cada SNP informativo, el alelo que no era de la madre se denominó alelo específico fetal mientras que el otro se denominó alelo compartido. Puede determinarse una concentración de ADN fetal/tumoral fraccional (también denominada porcentaje de ADN fetal) en el plasma materno. En una realización, la concentración de ADN fetal fraccional en el plasma materno, f, se determina por la ecuación:

donde p es el número de lecturas secuenciadas con el alelo específico fetal y q es el número de lecturas secuenciadas con el alelo compartido entre la madre y el feto (YMD Lo et al., 2010 Sci Transl Med; 2: 61ra91). Se descubrió que las proporciones de ADN fetal en las muestras de plasma materno del primer trimestre, tercer trimestre y posparto eran del 14,4 %, 33,9 % y 4,5 %, respectivamente. Las proporciones de ADN fetal también se calcularon usando los números de lecturas que se alineaban con el cromosoma Y. Basándose en los datos del cromosoma Y, los resultados fueron de 14,2 %, 34,9 % y 3,7 %, respectivamente, en las muestras de plasma materno del primer trimestre, tercer trimestre y posparto.

Analizando por separado estas lecturas de secuencia específicas fetales o compartidas, las realizaciones demuestran que las moléculas de ADN fetal en circulación estaban mucho más hipometiladas que las moléculas de ADN de fondo. Las comparaciones de las densidades de metilación de loci correspondientes en las lecturas de plasma materno específicas fetales y los datos de tejido placentario tanto para el primer como para el tercer trimestre revelaron altos niveles de correlación. Estos datos proporcionaron pruebas del nivel de genoma de que la placenta es la fuente predominante de moléculas de ADN derivadas del feto en plasma materno y representaron un avance importante en comparación con pruebas previas basándose en información derivada de loci seleccionados. Se determinó la densidad de metilación de cada región de 1 Mb en el genoma usando las lecturas específicas fetales o compartidas que abarcaban sitios de CpG adyacentes a los SNP informativos. Los metilomas específicos fetales y no específicos fetales ensamblados a partir de lecturas de secuencias de plasma materno pueden presentarse, por ejemplo, en representaciones de Circos (M Krzywinski et al, 2009 Genome Res; 19: 1639-1645). Las densidades de metilación por cada grupo de 1 Mb también se determinaron para las células sanguíneas maternas y muestras de tejido placentario.

La FIGURA 7A muestra una representación de Circos 700 para muestras del primer trimestre. La FIGURA 7B muestra una representación de Circos 750 para muestras del tercer trimestre. Las representaciones 700 y 750 muestran densidad de metilación por cada grupo de 1 Mb. Se orientan ideogramas de cromosomas (anillo más externo) pter-qter en el sentido de las agujas del reloj (los centrómeros se muestran en rojo). La segunda pista más externa muestra el número de sitios de CpG en las regiones de 1 Mb correspondientes. La escala de las barras rojas mostradas es de hasta 20.000 sitios por cada grupo de 1 Mb. Las densidades de metilación de las regiones de 1 Mb correspondientes se muestran en las otras pistas basándose en el esquema de color mostrado en el centro.

Para las muestras del primer trimestre (FIGURA 7A), de dentro a fuera, las pistas son: muestra de vellosidad coriónica, lecturas específicas fetales en plasma materno, lecturas específicas maternas en plasma materno, lecturas fetales y no fetales combinadas en plasma materno y células sanguíneas maternas. Para las muestras del tercer trimestre (FIGURA 7B), las pistas son: tejido placentario a término, lecturas específicas fetales en plasma materno, lecturas específicas maternas en plasma materno, lecturas fetales y no fetales combinadas en plasma materno, plasma materno posparto y células sanguíneas maternas (de la muestra de sangre del primer trimestre). Puede apreciarse que para las muestras de plasma tanto del primer como del tercer trimestre, los metilomas fetales estaban más hipometilados que los de los metilomas no específicos fetales.

El perfil de metilación general de los metilomas fetales se asemejó más estrechamente al de las muestras del tejido placentario o CVS. Por el contrario, el perfil de metilación de ADN de las lecturas compartidas en el plasma, que era predominantemente ADN materno, se asemejó más estrechamente al de las células sanguíneas maternas. Se realizó después una comparación locus a locus sistemática de las densidades de metilación de las lecturas de ADN del plasma materno y los tejidos maternos o fetales. Se determinaron las densidades de metilación de sitios de CpG que estaban presentes en la misma lectura de secuencia que los SNP informativos y estuvieron abarcados por al menos 5 lecturas de secuencias de ADN de plasma materno.

Las FIGURAS 8A-8D muestran representaciones de comparaciones de las densidades de metilación de ADN de tejido genómico frente a ADN de plasma materno para sitios de CpG que rodean los polimorfismos de un único nucleótido informativos. La FIGURA 8A muestra densidades de metilación para lecturas específicas fetales en la muestra de plasma materno del primer trimestre en relación con densidades de metilación para lecturas en una muestra de CVS. Como puede verse, los valores específicos fetales se corresponden bien con los valores de CVS. La FIGURA 8B muestra densidades de metilación para lecturas específicas fetales en la muestra de plasma materno del tercer trimestre en relación con densidades de metilación para lecturas en un tejido placentario a término. De nuevo, los conjuntos de densidades se corresponden bien, lo que indica que el perfil de metilación fetal puede obtenerse analizando lecturas con alelos específicos fetales.

La FIGURA 8C muestra densidades de metilación para lecturas compartidas en la muestra de plasma materno del primer trimestre en relación con densidades de metilación para lecturas en células sanguíneas maternas. Dado que la mayoría de las lecturas compartidas son de la madre, los dos conjuntos de valores se corresponden bien. La FIGURA 8D muestra densidades de mutilación para lecturas compartidas en la muestra de plasma materno del tercer trimestre en relación con densidades de mutilación para lecturas en células sanguíneas maternas.

Para las lecturas específicas fetales en plasma materno, el coeficiente de correlación de Spearman entre el plasma materno del primer trimestre y la CVS fue de 0,705 (P <2,2 * e-16); y entre el plasma materno del tercer trimestre y el tejido placentario a término fue de 0,796 (P <2,2 * e-16) (FIGURAS 8A y 8B). Se realizó una comparación similar para las lecturas compartidas en plasma materno con los datos de células sanguíneas maternas. El coeficiente de correlación de Pearson fue de 0,653 (P <2,2 * e-16) para la muestra de plasma del primer trimestre y fue de 0,638 (P <2,2 * e-16) para la muestra de plasma del tercer trimestre (FIGURAS 8C y 8D).

B. Metiloma fetal

En una realización, para ensamblar el metiloma fetal a partir del plasma materno, se clasificó con respecto a lecturas de secuencias que abarcaban al menos un sitio de SNP fetal informativo y contenían al menos un sitio de CpG dentro de la misma lectura. Se incluyeron lecturas que mostraban los alelos específicos fetales en el ensamblaje del metiloma fetal. Se incluyeron lecturas que mostraban el alelo compartido, es decir alelo no específico fetal, en el ensamblaje del metiloma no específico fetal que estaba comprendido predominantemente por moléculas de ADN derivadas de la madre.

Las lecturas específicas fetales abarcaban 218.010 sitios de CpG en los autosomas para las muestras de plasma materno del primer trimestre. Las cifras correspondientes para las muestras de plasma materno del tercer trimestre y posparto fueron de 263.611 y 74.020, respectivamente. En promedio, las lecturas compartidas abarcaron los sitios de CpG un promedio de 33,3, 21,7 y 26,3 veces, respectivamente. Las lecturas específicas fetales abarcaron esos sitios de CpG 3,0, 4,4 y 1,8 veces, respectivamente, para las muestras de plasma materno del primer trimestre, tercer trimestre y posparto.

El ADN fetal representa una población menor en el plasma materno y por lo tanto la cobertura de esos sitios de CpG por lecturas específicas fetales fue proporcional al porcentaje de ADN fetal de la muestra. Para la muestra de plasma materno del primer trimestre, el porcentaje general de CpG metilado entre las lecturas fetales fue del 47,0 %, mientras que el de las lecturas compartidas fue del 68,1 %. Para la muestra de plasma materno del tercer trimestre, el porcentaje de CpG metilado de las lecturas fetales fue del 53,3 %, mientras que el de las lecturas compartidas fue del 68,8 %. Estos datos mostraron que las lecturas específicas fetales en el plasma materno estaban más hipometiladas que las lecturas compartidas en el plasma materno.

C. Método

Las técnicas descritas anteriormente también pueden usarse para determinar un perfil de metilación tumoral. Se describen ahora métodos para determinar los perfiles de metilación fetal y tumoral.

La FIGURA 9 es un diagrama de flujo que ilustra un método 900 para determinar un primer perfil de metilación de una muestra biológica de un organismo de acuerdo con realizaciones de la presente descripción. El Método 900 puede construir un mapa epigenético del feto a partir del perfil de metilación del plasma materno. La muestra biológica incluye ADN sin células que comprende una mezcla de ADN sin células que se origina de un primer tejido y de un segundo tejido. Como ejemplos, el primer tejido puede ser de un feto, un tumor o un órgano trasplantado. En el bloque 910, se analiza una pluralidad de moléculas de ADN de la muestra biológica. El análisis de una molécula de ADN puede incluir determinar una localización de la molécula de ADN en un genoma del organismo, determinar un genotipo de la molécula de ADN y determinar si la molécula de ADN está metilada en uno o más sitios.

En el bloque 920, se identifica una pluralidad de primeros loci en los que un primer genoma del primer tejido es heterocigoto para un primer alelo respectivo y un segundo alelo respectivo y un segundo genoma del segundo tejido es homocigoto para el primer alelo respectivo. Por ejemplo, las lecturas específicas fetales pueden identificarse en la pluralidad de primeros loci. Por otro lado, las lecturas específicas de tumor pueden identificarse en la pluralidad de primeros loci. Las lecturas específicas de tejido pueden identificarse a partir de lecturas de secuenciación en las que el porcentaje de lecturas de secuencia del segundo alelo queda dentro de un intervalo particular, por ejemplo, de aproximadamente 3 %-25 %, indicando de este modo una población minoritaria de fragmento de ADN de un genoma heterocigoto en el locus y una población mayoritaria de un genoma homocigoto en el locus.

En el bloque 930, se analizan moléculas de ADN localizadas en uno o más sitios de cada uno de los primeros locus. Se determina un número de moléculas de ADN que están metiladas en un sitio y corresponden al segundo alelo respectivo del locus. Puede haber más de un sitio por locus. Por ejemplo, un SNP podría indicar que un fragmento es específico fetal, y ese fragmento puede tener múltiples sitios cuyo estado de metilación se determina. Puede determinarse el número de lecturas en cada sitio que están metiladas, y puede determinarse el número total de lecturas metiladas para el locus.

El locus puede definirse por un número específico de sitios, un conjunto específico de sitios, o un tamaño particular para una región alrededor de una variación que comprende el alelo específico de tejido. Un locus puede tener solamente un sitio. Los sitios pueden tener propiedades específicas, por ejemplo, que sean sitios de CpG. La determinación de un número de lecturas que están desmetiladas es equivalente, y está abarcado dentro de la determinación del estado de metilación.

En el bloque 940, para cada uno de los primeros loci, se calcula una densidad de metilación basándose en los números de moléculas de ADN metiladas en los uno o más sitios del locus y correspondientes al segundo alelo respectivo del locus. Por ejemplo, puede determinarse una densidad de metilación para sitios de CpG correspondientes a un locus.

En el bloque 950, el primer perfil de metilación del primer tejido se crea a partir de las densidades de metilación para los primeros loci. El primer perfil de metilación puede corresponder a sitios particulares, por ejemplo, sitios de CpG. El perfil de metilación puede ser para todos los loci que tienen un alelo específico fetal, o solamente algunos de esos loci.

IV. USO DE LA DIFERENCIA DE METILOMAS DE PLASMA Y SANGRE

Anteriormente se ha mostrado que las lecturas específicas fetales del plasma se correlacionan con el metiloma placentario. Como el componente materno del metiloma de plasma materno es aportado principalmente por las células sanguíneas, la diferencia entre el metiloma de plasma y el metiloma de sangre puede usarse para determinar el metiloma placentario para todos los loci, y no solamente localizaciones de alelos específicos fetales. Una diferencia entre el metiloma de plasma y el metiloma de sangre también puede usarse para determinar un metiloma de un tumor.

A. Método

La FIGURA 10 es un diagrama de flujo que ilustra un método 1000 para determinar un primer perfil de metilación de una muestra biológica de un organismo de acuerdo con realizaciones de la presente descripción. La muestra biológica (por ejemplo, plasma) incluye ADN sin células que comprende una mezcla de ADN sin células que se origina de un primer tejido y de un segundo tejido. El primer perfil de metilación corresponde a un perfil de metilación del primer tejido (por ejemplo, tejido fetal o tejido tumoral). El método 1200 puede proporcionar una deducción de regiones metiladas diferencialmente de plasma materno.

En el bloque 1010, se recibe una muestra biológica. La muestra biológica podría recibirse simplemente en una máquina (por ejemplo, una máquina de secuenciación). La muestra biológica puede estar en una forma tomada del organismo o puede estar en una forma procesada, por ejemplo, la muestra puede ser plasma que se extrae de una muestra sanguínea.

En el bloque 1020, se obtiene un segundo perfil de metilación correspondiente a ADN del segundo tejido. El segundo perfil de metilación podría leerse de la memoria, ya que puede haberse determinado previamente. El segundo perfil de metilación puede determinarse a partir del segundo tejido, por ejemplo, una muestra diferente que contiene solamente o predominantemente células del segundo tejido. El segundo perfil de metilación puede corresponder a un perfil de metilación celular y obtenerse de ADN celular. Como otro ejemplo, el segundo perfil puede determinarse a partir de una muestra de plasma recogida antes del embarazo, o antes del desarrollo de cáncer debido a que el metiloma de plasma de una persona no embarazada sin cáncer es muy similar al metiloma de células sanguíneas.

El segundo perfil de metilación puede proporcionar una densidad de metilación en cada uno de una pluralidad de loci en un genoma del organismo. La densidad de metilación en un locus particular corresponde a una proporción de ADN del segundo tejido que está metilado. En una realización, la densidad de metilación es una densidad de metilación de CpG, en la que se usan sitios de CpG asociados con el locus para determinar la densidad de metilación. Si hay un sitio para un locus, entonces la densidad de metilación puede ser igual al índice de metilación. La densidad de metilación también corresponde a una densidad de desmetilación ya que los dos valores son complementarios.

En una realización, el segundo perfil de metilación se obtiene realizando secuenciación sensible a la metilación de ADN celular a partir de una muestra del organismo.

En otra realización, la segunda densidad de metilación del segundo tejido podría obtenerse previamente de muestras de control del sujeto o de otros sujetos. La densidad de metilación de otro sujeto puede actuar como un perfil de metilación de referencia que tiene densidades de metilación de referencia. Las densidades de metilación de referencia pueden determinarse a partir de múltiples muestras, en las que un nivel medio (u otro valor estadístico) de las diferentes densidades de metilación en un locus pueden usarse como la densidad de metilación de referencia en el locus.

En el bloque 1030, se determina un perfil de mutilación sin células a partir del ADN sin células de la mezcla. El perfil de metilación sin células proporciona una densidad de metilación en cada una de la pluralidad de loci. El perfil de metilación sin células puede determinarse recibiendo lecturas de secuencias de una secuenciación del ADN sin células, en el que la información de metilación se obtiene de las lecturas de secuencias. El perfil de metilación sin células puede determinarse de la misma manera que el metiloma celular.

En el bloque 1040, se determina un porcentaje del ADN sin células del primer tejido en la muestra biológica. En una realización, el primer tejido es tejido fetal, y el ADN correspondiente es ADN fetal. En otra realización, el primer tejido es tejido tumoral, y el ADN correspondiente es ADN tumoral. El porcentaje puede determinarse de diversas formas, por ejemplo, usando un alelo específico fetal o un alelo específico tumoral. También puede usarse el número de copia para determinar el porcentaje, por ejemplo, como se describe en la solicitud de patente de Estados Unidos 13/801.748 titulada “Mutational Analysis Of Plasma DNA For Cancer Detection” presentada el 13 de marzo de 2013.

En el bloque 1050, se identifica una pluralidad de loci para determinar el primer metiloma. Estos loci pueden corresponder a cada uno de los loci usados para determinar el perfil de metilación sin células y el segundo perfil de metilación. Por lo tanto, la pluralidad de loci puede corresponderse. Es posible que puedan usarse más loci para determinar el perfil de metilación sin células y el segundo perfil de metilación.

En algunas realizaciones, pueden identificarse loci que estaban hipermetilados o hipometilados en el segundo perfil de metilación, por ejemplo, usando células sanguíneas maternas. Para identificar los loci que estaban hipermetilados en las células sanguíneas maternas, se puede explorar desde un extremo de un cromosoma con respecto a un sitio de CpG con un índice de metilación >X % (por ejemplo, 80 %). Se puede después buscar el siguiente sitio de CpG dentro de la región cadena abajo (por ejemplo, a una distancia de 200 pb cadena abajo). Si el sitio de CpG inmediatamente cadena abajo también tenía un índice de metilación >X % (u otra cantidad específica), pueden agruparse el primer y el segundo sitio de CpG. El agrupamiento puede continuar hasta que no haya ningún otro sitio de CpG dentro de la siguiente región cadena abajo; o el sitio de CpG inmediatamente cadena abajo tenga un índice de metilación <X %. La región de los sitios de CpG agrupados pueden indicarse como hipermetilada en células sanguíneas maternas si la región contuviera al menos cinco sitios de CpG hipermetilados inmediatamente adyacentes. Puede realizarse un análisis similar para buscar loci que estaban hipometilados en células sanguíneas maternas para sitios de CpG con índices de metilación ≤20 %. Las densidades de metilación para el segundo perfil de metilación pueden calcularse para los loci seleccionados y usarse para deducir el primer perfil de metilación (por ejemplo, densidad de metilación del tejido placentario) de los loci correspondientes, por ejemplo, a partir de datos de secuenciación por bisulfito de plasma materno.

En el bloque 1060, el primer perfil de metilación del primer tejido se determina calculando un parámetro diferencial que incluye una diferencia entre la densidad de metilación del segundo perfil de metilación y la densidad de metilación del perfil de metilación sin células para cada uno de la pluralidad de loci. La diferencia se cambia de escala por el porcentaje.

En una realización, la primera densidad de metilación de un locus en el primer tejido (por ejemplo placentario) (D) se dedujo usando la ecuación:

donde mbc indica la densidad de metilación del segundo perfil de metilación en un locus (por ejemplo, un locus seleccionado como se determina en los datos de secuenciación por bisulfito de células sanguíneas maternas); mp indica la densidad de metilación del locus correspondiente en los datos de secuenciación por bisulfito de plasma materno; f representó el porcentaje de ADN sin células del primer tejido (por ejemplo, concentración de ADN fetal fraccional) y CN representa el número de copias en el locus (por ejemplo, un valor mayor para amplificaciones o un número menor para supresiones en relación con la normalidad). Si no hay ninguna amplificación o deleción en el primer tejido entonces Cⁿpuede ser uno. Para trisomía (o una duplicación de la región en un tumor o un feto), CN sería 1,5 (ya que el aumento es de 2 copias a 3 copias) y la monosomía sería 0,5. Puede aumentarse la amplificación mayor por incrementos de 0,5. En este ejemplo, D puede corresponder al parámetro diferencial.

En el bloque 1070, la primera densidad de metilación se transforma para obtener una primera densidad de metilación corregida del primer tejido. La transformación puede explicar diferencias fijas entre los parámetros diferenciales y el perfil de metilación real del primer tejido. Por ejemplo, los valores pueden diferir por una constante fija o por una pendiente. La transformación puede ser lineal o no lineal.

En una realización, se descubrió que la distribución de los valores deducidos, D, era menor que el nivel de metilación real del tejido placentario. Por ejemplo, los valores deducidos pueden transformarse de forma lineal usando datos de islas de CpG, que fueron segmentos genómicos que tuvieron una sobrerrepresentación de sitios de CpG. Las posiciones genómicas de islas de CpG usadas en este estudio se obtuvieron de la base de datos del Buscador de Genoma de UCSC (NCBI versión 36/hg18) (PA Fujita et al., 2011 Nucleic Acids Res; 39: D876-882).

Por ejemplo, puede definirse una isla de CpG como un segmento genómico con contenido de GC >50 %, longitud genómica >200 pb y la relación de número de CpG observado/esperado >0,6 (M Gardiner-Garden et al 1987 J Mol Biol; 196: 261-282).

En una implementación, para derivar la ecuación de transformación lineal, pueden incluirse islas de CpG con al menos 4 sitios de CpG y una profundidad de lectura promedio >5 por sitio de CpG en las muestras secuenciadas. Después de determinar las relaciones lineales entre las densidades de metilación de islas de CpG en la CVS o placenta a término y los valores deducidos, D, se usaron las siguientes ecuaciones para determinar los valores predichos:

Valores predichos del primer trimestre = D x 1,6 0,2

Valores predichos del tercer trimestre = D x 1,2 0,05

B. Ejemplo fetal

Como se ha mencionado anteriormente, el método 1000 puede usarse para deducir un paisaje de metilación de la placenta del plasma materno. El ADN en circulación en plasma se origina predominantemente de células hematopoyéticas. Aún hay una proporción desconocida de ADN sin células al que contribuyen otros órganos internos. Además, el ADN sin células derivado de placenta representa aproximadamente el 5-40 % del ADN total en plasma materno, con una media de aproximadamente 15 %. Por lo tanto, se puede suponer que el nivel de metilación en plasma materno es equivalente a una metilación de fondo existente más una contribución placentaria durante el embarazo, como se ha descrito anteriormente.

El nivel de metilación de plasma materno, MP, puede determinarse usando la siguiente ecuación:

MP = BKG x (1 - f) + PLN x f

donde BKG es el nivel de migración de ADN de fondo en plasma obtenido de células sanguíneas y órganos internos, PLN es el nivel de metilación de la placenta y f es la concentración de ADN fetal fraccional en plasma materno. En una realización, el nivel de metilación de la placenta puede deducirse teóricamente por:

Las ecuaciones (1) y (2) son equivalentes cuando CN es igual a uno, D es igual a PLN y BKG es igual a mbc. En otra realización, la concentración de ADN fetal fraccional puede suponerse o establecerse en un valor específico, por ejemplo, como parte de una suposición de que esté presente un f mínimo.

Se ha considerado que el nivel de metilación de sangre materna representa la metilación de fondo del plasma materno. Además de los loci que estuvieron hipermetilados o hipometilados en células sanguíneas maternas, se exploró adicionalmente el enfoque de deducción centrándose en regiones definidas con relevancia clínica, por ejemplo, islas de CpG en el genoma humano.

La densidad de metilación media de un total de 27.458 islas de CpG (NCBI Versión36/hg18) en los autosomas y crX se obtuvo de los datos de secuenciación del plasma materno y la placenta. Solamente se seleccionaron los que tenían >10 sitios de CpG abarcados y una profundidad de lectura promedio de >5 por cada sitio de CpG abarcado en todas las muestras analizadas, incluyendo la placenta, la sangre materna y el plasma materno. Como resultado, 26.698 islas de CpG (97,2 %) permanecieron como válidas y su nivel de metilación se dedujo usando los datos de metilación de plasma y la concentración de ADN fetal fraccional según la ecuación anterior.

Se ha observado que la distribución de valores de PLN deducidos fue menor que el nivel de metilación real de islas de CpG en el tejido placentario. Por lo tanto, en una realización, los valores de PLN deducidos, o simplemente valores deducidos (D), se usaron como una unidad arbitraria para estimar el nivel de metilación de islas de CpG en la placenta. Después de una transformación, los valores deducidos de forma lineal y su distribución se hicieron más similares al conjunto de datos real. Los valores deducidos transformados se denominaron valores predictivos de metilación (VPM) y posteriormente se usaron para predecir el nivel de metilación de loci genéticos en la placenta. En este ejemplo, las islas de CpG se clasificaron en 3 categorías basándose en sus densidades de metilación en la placenta: baja (>0,4), intermedia (>0,4-<0,8) y alta (>0,8). Usando la ecuación de deducción, se calculó el VPM del mismo conjunto de islas de CpG y después se usaron los valores para clasificarlos en 3 categorías con los mismos puntos de corte. Comparando los conjuntos de datos reales y los deducidos, se descubrió que el 75,1 % de las islas de CpG seleccionadas podrían coincidir correctamente con las mismas categorías en los datos de tejidos de acuerdo con su VPM. Aproximadamente el 22 % de las islas de CpG se asignaron a grupos con una diferencia de 1 nivel (alto frente a intermedio o intermedio frente a bajo) y menos del 3 % estarían clasificadas de forma completamente errónea (alto frente a bajo) (FIGURA 12A). Se dedujo que el rendimiento de clasificación general también se determinó: 86,1 %, 31,4 % y 68,8 % de islas de CpG con densidades de metilación ≤0,4, >0,4-<0,8 y >0,8 en la placenta era “Bajo”, “ Intermedio” y “Alto” correctamente (FIGURA 12B).

Las FIGURAS 11A y 11B muestran gráficos del rendimiento del algoritmo de predicción usando datos de plasma materno y la concentración de ADN fetal fraccional según las realizaciones de la presente descripción. La FIGURA 11A es un gráfico 1100 que muestra la precisión de la clasificación de islas de CpG usando la clasificación con corrección de VPM (la categoría deducida coincide exactamente con el conjunto de datos real); diferencia de 1 nivel (la categoría deducida es 1 nivel diferente del conjunto de datos real); y clasificación errónea (la categoría deducida es opuesta al conjunto de datos real). La FIGURA 11B es un gráfico 1150 que muestra la proporción de islas de CpG clasificadas en cada categoría deducida.

Siempre que la metilación de fondo materno sea baja en las regiones genómicas respectivas, la presencia de ADN derivado de placenta hipermetilado en la circulación aumentaría el nivel de metilación en plasma general hasta un grado dependiente de la concentración de ADN fetal fraccional. Podría observarse un cambio notable cuando el ADN fetal liberado esté completamente metilado. Por el contrario, cuando la metilación de fondo materno es alta, el grado de cambio en el nivel de metilación de plasma sería más significativo si se libera ADN fetal hipometilado. Por lo tanto, el esquema de deducción puede ser más práctico cuando el nivel de metilación se deduce para loci genéticos que se sabe que son distintos entre el fondo materno y la placenta, especialmente para los marcadores hipermetilados e hipometilados en la placenta.

La FIGURA 12A es una tabla 1200 que muestra detalles de 15 loci genómicos seleccionados para predicción de metilación según realizaciones de la presente descripción. Para confirmar técnicas, se seleccionaron 15 loci genómicos metilados diferencialmente que se habían estudiado previamente. Los niveles de metilación de regiones seleccionadas se dedujeron y se compararon con los 15 loci genéticos metilados diferencialmente previamente estudiados (RWK Chiu et al. 2007 Am J Pathol; 170: 941-950; S.S.C. Chim et al. 2008 Clin Chem; 54: 500-511; SSC Chim et al. 2005 Proc Natl Acad Sci USA; 102: 14753-14758; DWY Tsui et al. 2010 PLoS One; 5: e15069).

La FIGURA 12B es un gráfico 1250 que muestra las categorías deducidas de los 15 loci genómicos seleccionados y sus niveles de metilación correspondientes en la placenta. Las categorías de metilación deducidas son: baja, ≤0,4; Intermedia, >0,4-<0,8; Alta, >0,8. La Tabla 1200 y el gráfico 1300 muestran que sus niveles de metilación en la placenta podrían deducirse correctamente con varias excepciones: RASSF1A, CGI009, CGI137 y VAPA. De estos 4 marcadores, solamente CGI009 mostró una discrepancia notable con el conjunto de datos real. Los otros se clasificaron erróneamente de forma solamente marginal.

En la tabla 1200, “1” se refiere a los valores deducidos (D) que se calculan por la ecuación:

donde f es la concentración de ADN fetal fraccional. La etiqueta “2” se refiere a los valores predictivos de metilación (VPM) que se refieren a los valores deducidos linealmente transformados usando la ecuación: VPM = D x 1,6 0,25. La etiqueta “3” se refiere al punto de corte de clasificación para los valores deducidos: bajo, ≤0,4; Inter(medio), >0,4-<0,8; Alto, >0,8. La etiqueta “4” se refiere al punto de corte de clasificación para el conjunto de datos placentario real: bajo, ≤0,4; Inter(medio), >0,4-<0,8; Alto, >0,8. La etiqueta “5” indica que el estado placentario se refiere al estado de metilación de la placenta en relación con el de células sanguíneas maternas.

C. Cálculo de concentraciones fracciónales de ADN fetal

En una realización, el porcentaje de ADN fetal del primer tejido puede usar un cromosoma Y para un feto masculino. La proporción de secuencias de cromosoma Y (% de crY) en una muestra de plasma materno fue una combinación de las lecturas de cromosoma Y derivadas del feto masculino y el número de lecturas maternas (femeninas) que se alinearon incorrectamente con el cromosoma Y (RWK Chiu et al. 2011 BMJ; 342: c7401). Por lo tanto, la relación entre % de crY y la concentración de ADN fetal fraccional (f) en la muestra puede proporcionarse por:

donde %crYmasculino se refiere a una proporción de lecturas alineadas con el cromosoma Y en una muestra de plasma que contiene 100 % de ADN masculino; y %crYfemenino se refiere a la proporción de lecturas alineadas con el cromosoma Y en una muestra de plasma que contiene 100 % de ADN femenino.

El %crY puede determinarse a partir de lecturas que se alinearon con el cromosoma Y sin desapareamientos para una muestra de un embarazo femenino con un feto masculino, por ejemplo, donde las lecturas son de muestras convertidas por bisulfito. El valor de %crYmasculino puede obtenerse para la secuenciación por bisulfito de dos muestras de plasma de hombre adulto. El valor de %crYfemenino puede obtenerse a partir de la secuenciación por bisulfito de dos muestras de plasma de mujeres adultas no embarazadas.

En otras realizaciones, el porcentaje de ADN fetal puede determinarse a partir de alelos específicos fetales en un autosoma. Como otro ejemplo, pueden usarse marcadores epigenéticos para determinar el porcentaje de ADN fetal. T ambién pueden usarse otras formas de determinar el porcentaje de ADN fetal.

D. Método de uso de la mediación para determinar el número de copias

El genoma placentario está más hipometilado que el genoma materno. Como se ha analizado anteriormente la metilación del plasma de una mujer embarazada depende de la concentración fraccional de ADN fetal derivado de la placenta en el plasma materno. Por lo tanto, mediante el análisis de la densidad de metilación de una región cromosómica, es posible detectar la diferencia en la contribución de tejidos fetales al plasma materno. Por ejemplo, en una mujer embarazada que porta un feto trisómico (por ejemplo, que padece trisomía del 21 o trisomía del 18 o trisomía del 13), el feto aportaría una cantidad adicional del ADN del cromosoma trisómico al plasma materno en comparación con los cromosomas disómicos. En esta situación, la densidad de metilación en plasma para el cromosoma trisómico (o cualquier región cromosómica que tenga una amplificación) sería menor que las de los cromosomas disómicos. El grado de diferencia puede predecirse por cálculo matemático teniendo en cuenta la concentración de ADN fetal fraccional en la muestra de plasma. Cuanto mayor sea la concentración de ADN fetal fraccional en la muestra de plasma mayor será la diferencia de la densidad de metilación entre los cromosomas trisómicos y disómicos. Para regiones que tengan una deleción, la densidad de metilación sería mayor.

Un ejemplo de una deleción es el síndrome de Turner, cuando un feto femenino tendría solamente una copia del cromosoma X. En esa situación, para una mujer embarazada que porta un feto que padece síndrome de Turner, la densidad de metilación del cromosoma X en su ADN en plasma sería mayor que la situación de la misma mujer embarazada que porte un feto femenino que tenga el número normal de cromosoma X. En una realización de esta estrategia, se podría analizar en primer lugar plasma materno con respecto a la presencia o ausencia de secuencias del cromosoma Y (por ejemplo usando SPM o una técnica basada en PCR). Si están presentes secuencias del cromosoma Y, entonces el feto puede clasificarse como masculino y el siguiente análisis no sería necesario. Por otro lado, si están ausentes secuencias del cromosoma Y en el plasma materno, entonces el feto puede clasificarse como femenino. En esta situación, se puede analizar después la densidad de metilación del cromosoma X en el plasma materno. Una mayor densidad de metilación del cromosoma X que la normal indicaría que el feto tiene un alto riesgo de tener síndrome de Turner. Este enfoque también puede aplicarse para las otras aneuploidías cromosómicas sexuales. Por ejemplo, para un feto aquejado de XYY, la densidad de metilación para el cromosoma Y en plasma materno sería menor que la de un feto XY normal que tenga un nivel similar de ADN fetal en plasma materno. Como otro ejemplo, para un feto que padece síndrome de Klinefelter (XXY), están presentes secuencias del cromosoma Y en plasma materno, pero la densidad de metilación del cromosoma X en plasma materno será menor que la de un feto XY normal que tenga un nivel similar de ADN fetal en plasma materno.

A partir del análisis anterior, puede calcularse la densidad de metilación en plasma para un cromosoma disómico (MP^noaneu) como: MP^noaneu = BKG x (1 - f) + PLN x f, donde BKG es el nivel de metilación de ADN de fondo en plasma derivado de células sanguíneas y órganos internos, PLN es el nivel de metilación de la placenta y f es la concentración de ADN fetal fraccional en plasma materno.

La densidad de metilación en plasma para un cromosoma trisómico (MPAneu) puede calcularse como: MPAneu = BKG x (1 - f) + PLN x f x 1,5, donde el 1,5 corresponde al número de copias CN y la adición de uno o más cromosomas es un aumento del 50 %. La diferencia entre un cromosoma trisómico y uno disómico (MPDif) sería

MPcif = PLN x f x 0,5.

En una realización, una comparación de la densidad de metilación del cromosoma (o región cromosómica) potencialmente aneuploide con uno o más cromosomas adicionales supuestamente no aneuploides o la densidad de metilación general del genoma puede usarse para normalizar eficazmente la concentración de ADN fetal en la muestra de plasma. La comparación puede ser mediante un cálculo de un parámetro (por ejemplo, que implica una relación o una diferencia) entre las densidades de metilación de las dos regiones para obtener una densidad de metilación normalizada. La comparación puede eliminar una dependencia del nivel de metilación resultante (por ejemplo, determinado como un parámetro de las dos densidades de metilación).

Si la densidad de metilación del cromosoma potencialmente aneuploide no se normaliza con respecto a la densidad de metilación de uno o más cromosomas adicionales, u otros parámetros que reflejan la concentración fraccional de ADN fetal, la concentración fraccional sería un factor importante que afecta a la densidad de metilación en el plasma. Por ejemplo, la densidad de metilación en plasma del cromosoma 21 de una mujer embarazada que porta un feto con trisomía del 21 con una concentración de ADN fetal fraccional del 10 % sería igual que la de una mujer embarazada que porta un feto euploide y la concentración de ADN fetal fraccional es del 15 %, mientras que una densidad de metilación normalizada mostraría una diferencia.

En otra realización, la densidad de metilación del cromosoma potencialmente aneuploide puede normalizarse con respecto a la concentración de ADN fetal fraccional. Por ejemplo, la siguiente ecuación puede aplicarse para normalizar la densidad de metilación: MPNormaiizada = MPno normalzada + (BKG - PLN) x f, donde MPNormalizada es la densidad de mutilación normalizada con la concentración de ADN fetal fraccional en el plasma, MPno normalizada es la densidad de metilación medida, BKG es la densidad de metilación de fondo de células sanguíneas o tejidos maternos, PLN es la densidad de metilación en los tejidos placentarios, y f es la concentración de ADN fetal fraccional. Las densidades de metilación de BKG y PLN podrían basarse en valores de referencia previamente establecidos de células sanguíneas maternas y tejidos placentarios obtenidos de embarazos sanos. Pueden usarse métodos genéticos y epigenéticos diferentes para la determinación de la concentración de ADN fetal fraccional en la muestra de plasma, por ejemplo mediante la medición del porcentaje de lecturas de secuencias del cromosoma Y usando secuenciación paralela masiva.

En una implementación, la densidad de metilación normalizada para un cromosoma potencialmente aneuploide puede compararse con un grupo de referencia que consiste en una mujer embarazada que porta fetos euploides. Puede determinarse la media y DT de la densidad de metilación normalizada del grupo de referencia. Después puede expresarse la densidad de metilación normalizada del caso ensayado como una puntación z que indica el número de DT de la media del grupo de referencia por:

donde MPNormalizada es la densidad de metilación normalizada para el caso ensayado, media es la media de la densidad de metilación normalizada de los casos de referencia y DT es la desviación típica de la densidad de metilación normalizada de los casos de referencia. Un punto de corte, por ejemplo puntuación z <-3, puede usarse para clasificar si un cromosoma está hipometilado de forma significativa y, por lo tanto, para determinar el estado de aneuploidía de la muestra.

En otra realización, la MPDif puede usarse como la densidad de metilación normalizada. En dicha realización, puede deducirse PLN, por ejemplo, usando el método 1000. En algunas implementaciones, una densidad de metilación de referencia (que puede normalizarse usando f) puede determinarse a partir de un nivel de metilación de una región no aneuploide. Por ejemplo, la media podría determinarse a partir de una o más regiones cromosómicas de la misma muestra. El punto de corte podría cambiarse de escala por f, o ajustarse solo a un nivel suficiente siempre que exista una concentración mínima.

En consecuencia, una comparación de un nivel de metilación con respecto a una región con un punto de corte puede conseguirse de diversas formas. La comparación puede implicar una normalización (por ejemplo como se ha descrito anteriormente), que puede realizarse de forma equivalente en el nivel de metilación o el valor de punto de corte, dependiendo de cómo se definan los valores. Por lo tanto, si el nivel de metilación determinado de una región es estadísticamente diferente de un nivel de referencia (determinado a partir de la misma muestra u otras muestras) puede determinarse de diversas maneras.

El análisis anterior puede aplicarse a análisis de regiones cromosómicas, que pueden incluir un cromosoma completo o partes del cromosoma, incluyendo subregiones contiguas o separadas de un cromosoma. En una realización, el cromosoma potencialmente aneuploide puede dividirse en varios grupos. Los grupos pueden ser del mismo tamaño o de tamaños diferentes. La densidad de metilación de cada grupo puede normalizarse con respecto a la concentración fraccional de la muestra o la densidad de metilación de uno o más cromosomas supuestamente no aneuploides o la densidad de metilación general del genoma. La densidad de metilación normalizada de cada grupo puede después compararse con un grupo de referencia para determinar si está hipometilada de forma significativa. Después puede determinarse el porcentaje de grupos que están significativamente hipometilados. Un punto de corte, por ejemplo más de 5 %, 10 %, 15 %, 20 % o 30 % de los grupos que están significativamente hipometilados, puede usarse para clasificar el estado de aneuploidía del caso.

Cuando se ensaya con respecto a una amplificación o una deleción, se puede comparar la densidad de metilación con una densidad de metilación de referencia, que puede ser específica para una región particular que se ensaye. Cada región puede tener una densidad de metilación de referencia diferente ya que la metilación puede variar entre regiones, particularmente dependiendo del tamaño de las regiones (por ejemplo, regiones más pequeñas mostrarán más variación).

Como se ha mencionado anteriormente, pueden usarse una o más mujeres embarazadas que portan cada una un feto euploide para definir el intervalo normal de la densidad de metilación para una región de interés o una diferencia en la densidad de metilación entre dos regiones cromosómicas. También puede determinarse un intervalo normal para la PLN (por ejemplo, mediante medición directa o como se deduce por el método 1000). En otras realizaciones, puede usarse una relación entre dos densidades de metilación, por ejemplo, de un cromosoma potencialmente aneuploide y puede usarse un cromosoma no aneuploide para el análisis en lugar de su diferencia. Este enfoque de análisis de metilación puede combinarse con enfoque de recuento de lecturas de secuencias (RWK Chiu et al. 2008 Proc Natl Acad Sci USA; 105: 20458-20463) y enfoques que implican el análisis del tamaño de ADN de plasma (Patente de Estados Unidos 2011/0276277) para determinar o confirmar una aneuploidía. El enfoque de recuento de lecturas de secuencias que se usa en combinación con análisis de metilación puede realizarse usando secuenciación aleatoria (RWK Chiu et al. 2008 Proc Natl Acad Sci USA;105: 20458-20463; DW Bianchi DW et al.

2012 Obstet Gynecol 119: 890-901) o secuenciación dirigida (AB Sparks et al. 2012 Am J Obstet Gynecol 206: 319.e1-9; B Zimmermann et al. 2012 Prenat Diagn 32: 1233-1241; GJ Liao et al. 2012 PLoS One; 7:e38154).

El uso de BKG puede explicar variaciones en el fondo entre muestras. Por ejemplo, una mujer podría tener diferentes niveles de metilación de BKG que otra mujer, pero puede usarse una diferencia entre la BKG y la PLN entre muestras en dichas situaciones. El punto de corte para diferentes regiones cromosómicas puede ser diferente, por ejemplo, cuando una densidad de metilación de una región del genoma difiere con respecto a otra región del genoma.

Este enfoque puede generalizarse para detectar cualquier aberración cromosómica, incluyendo deleción y amplificación, en el genoma fetal. Además, la resolución de este análisis puede ajustarse al nivel deseado, por ejemplo, el genoma puede dividirse en grupos de 10 Mb, 5 Mb, 2 Mb, 1 Mb, 500 kb, 100 kb. Por lo tanto, esta tecnología también puede usarse para detectar duplicación subcromosómica o deleción subcromosómica. Esta tecnología permitiría por lo tanto obtener de forma no invasiva un cariotipo molecular fetal prenatal Cuando se usa de esta manera, esta tecnología puede usarse en combinación con los métodos de ensayo prenatales no invasivos que se basan en el recuento de moléculas (A Srinivasan et al. 2013 Am J Hum Genet; 92: 167-176; SCY Yu et al.

2013 PLoS One 8: e60968). En otras realizaciones, no es necesario que el tamaño de los grupos sea idéntico. Por ejemplo, el tamaño de los grupos puede ajustarse de modo que cada grupo contenga un número idéntico de dinucleótidos de CpG. En este caso, el tamaño físico de los grupos sería diferente.

La ecuación puede reescribirse para aplicar a diferentes tipos de aberraciones cromosómicas como MPüif = (BKG -PLN) x f x 0,5 x CN. Aquí CN representa el número de cambios de número de copias en la región afectada. CN es igual a 1 para la ganancia de 1 copia de un cromosoma, 2 para la ganancia de 2 copias de un cromosoma y -1 para la pérdida de uno de los dos cromosomas homólogos (por ejemplo para detectar síndrome de Turner fetal en el que un feto femenino ha perdido uno de los cromosomas X, lo que conduce a un cariotipo XO). No es necesario cambiar esta ecuación cuando se cambia el tamaño de los grupos. Sin embargo, la sensibilidad y especificidad pueden reducirse cuando se usa un tamaño de grupos menor debido a que estaría presente un menor número de dinucleótidos de CpG (u otras combinaciones de nucleótidos que muestren metilación diferencial entre ADN fetal y ADN materno) en grupos más pequeños, lo que conduce a una variación estocástica aumentada en la medición de densidades de metilación. En una realización, el número de lecturas requerido puede determinarse analizando el coeficiente de variación de la densidad de metilación y el nivel deseado de sensibilidad.

Para demostrar la viabilidad de este enfoque, se han analizado las muestras de plasma de 9 mujeres embarazadas. En cinco mujeres embarazadas, cada una portaba un feto euploide y las otras cuatro portaban cada una un feto con trisomía del 21 (T21). Tres de los cinco embarazos euploides se seleccionaron de forma aleatoria para formar un grupo de referencia. Los dos casos de embarazo euploide restantes (Eu1 y Eu2) y los cuatro casos de T21 (T21-1, T21-2, T21-3 y T21-4) se analizaron usando este enfoque para ensayar con respecto a un estado de T21 potencial. El ADN del plasma se convirtió por bisulfito y se secuenció usando la plataforma HiSeq2000 de Illumina. En una realización, se calculó la densidad de metilación de cromosomas individuales. Después se determinó la diferencia en la densidad de metilación entre el cromosoma 21 y la media de los otros 21 autosomas para obtener una densidad de metilación normalizada (Tabla 1). Se usó la media y DT del grupo de referencia para el cálculo de la puntuación z de los seis casos de ensayo.

Tabla 1: usando un punto de corte de <-3 para puntuación z para clasificar una muestra como T21, la clasificación de todos^ los casos eu loides T21 fue correcta.

En otra realización, el genoma se dividió en grupos de 1 Mb y se determinó la densidad de metilación para cada grupo de 1 Mb. La densidad de metilación de todos los grupos en el cromosoma potencialmente aneuploide puede normalizarse con la mediante de la densidad de metilación de todos los grupos localizados en los cromosomas supuestamente no aneuploides. En una implementación, para cada grupo, puede calcularse la diferencia en la densidad de metilación de la mediana de los grupos no aneuploides. La puntuación z puede calcularse para estos valores usando la media y los valores de DT del grupo de referencia. Puede determinarse el porcentaje de grupos que muestran hipometilación (Tabla 2) y compararse con un porcentaje de punto de corte.

Tabla 2: usando el 5 % como un punto de corte para los grupos con significativamente más hipometilación en el

^

Este enfoque basado en metilación de ADN para detectar aberraciones cromosómicas o subcromosómicas fetales puede usarse junto con los basados en el recuento de moléculas por secuenciación (RWK Chiu et al. 2008 Proc Natl Acad Sci USA; 105: 20458-20463) o PCR digital (YMD Lo et al. 2007 Proc Natl Acad Sci USA; 104: 13116-13121), o por la medición de las moléculas de ADN (Publicación de Patente de Estados Unidos 2011/0276277). Dicha combinación (por ejemplo metilación de ADN más recuento molecular o metilación de ADN más medición del tamaño o metilación de ADN más recuento molecular más medición del tamaño) tendría un efecto sinérgico que sería ventajoso en una situación clínica, por ejemplo mejorando la sensibilidad y/o especificidad. Por ejemplo, el número de moléculas de ADN que sería necesario analizar, por ejemplo por secuenciación, puede reducirse sin influir de forma adversa a la precisión de diagnóstico. Esta característica permitiría realizar dichos ensayos de forma más económica. Como otro ejemplo, para un número dado de moléculas de ADN analizadas, un enfoque combinado permitiría detectar aberraciones cromosómicas o subcromosómicas fetales a una concentración fraccional menor de ADN fetal.

La FIGURA 13 es un diagrama de flujo de un método 1300 para detectar una anomalía cromosómica a partir de una muestra biológica de un organismo. La muestra biológica incluye ADN sin células que comprende una mezcla de ADN sin células que se origina desde un primer tejido y desde un segundo tejido. El primer tejido puede ser de un feto o un tumor y el segundo tejido puede ser de una mujer embarazada o un paciente.

En el bloque 1310, se analiza una pluralidad de moléculas de ADN de la muestra biológica. El análisis de una molécula de ADN puede incluir determinar una localización de la molécula de ADN en un genoma del organismo y determinar si la molécula de ADN está metilada en uno o más sitios. El análisis puede realizarse recibiendo lecturas de secuencias de una secuenciación sensible a la metilación, y por lo tanto el análisis puede realizarse solamente en datos previamente obtenidos del ADN. En otras realizaciones, el análisis puede incluir la secuenciación real u otras etapas activas para obtener los datos.

La determinación de una localización puede incluir mapear las moléculas de ADN (por ejemplo, mediante lecturas de secuencias) en partes respectivas del genoma humano, por ejemplo, en regiones específicas. En una implementación, si una lectura no se mapea en una región de interés, entonces la lectura puede ignorarse.

En el bloque 1320, un número respectivo de moléculas de ADN que están metiladas en el sitio se determina para cada uno de una pluralidad de sitios. En una realización, los sitios son sitios de CpG, y pueden ser solamente ciertos sitios de CpG, como se selecciona usando uno o más criterios mencionados en el presente documento. El número de ADN que están metilados es equivalente a la determinación del número que no están metilados una vez que se ha realizado normalización usando un número total de moléculas de ADN analizadas en un sitio particular, por ejemplo, un número total de lecturas de secuencia.

En el bloque 1330, se calcula un primer nivel de metilación de una primera región cromosómica basándose en los números respectivos de moléculas de ADN metiladas en sitios dentro de la primera región cromosómica. La primera región cromosómica puede ser de cualquier tamaño, por ejemplo, tamaños mencionados anteriormente. El nivel de metilación puede representar un número total de moléculas de ADN alineadas con la primera región cromosómica, por ejemplo, como parte de un procedimiento de normalización.

La primera región cromosómica puede ser de cualquier tamaño (por ejemplo, un cromosoma completo) y puede estar compuesta de subregiones inconexas, es decir, subregiones que están separadas entre sí. Pueden determinarse los niveles de metilación de cada subregión y combinarse, por ejemplo, como un promedio o una mediana, para determinar un nivel de metilación para la primera región cromosómica.

En el bloque 1340, el primer nivel de metilación se compara con un valor de punto de corte. El valor de punto de corte puede ser un nivel de metilación de referencia o estar relacionado con un nivel de metilación de referencia (por ejemplo, una distancia específica de un nivel normal). El valor de punto de corte puede determinarse a partir de otras mujeres embarazadas que portan fetos sin una anomalía cromosómica para la primera región cromosómica, de muestras de individuos sin cáncer, o de loci del organismo que se sabe que no están asociados con una aneuploidía (es decir, regiones que son disómicas).

En una realización, puede definirse que el valor de punto de corte tiene una diferencia de un nivel de metilación de referencia de (BKG - PLN) x f x 0,5 x CN, donde BKG es el fondo de la mujer (o un promedio o una mediana de otros sujetos), f es la concentración fraccional de ADN sin células que se origina en el primer tejido y CN es un número de copias que se ensaya. CN es un ejemplo de un factor de escala correspondiente a un tipo de anomalía (deleción o duplicación). Puede usarse un punto de corte para un CN de 1 para ensayar todas las amplificaciones inicialmente, y después pueden usarse puntos de corte adicionales para determinar el grado de amplificación. El valor de punto de corte puede basarse en una concentración fraccional de ADN sin células que se origina del primer tejido para determinar el nivel esperado de metilación para un locus, por ejemplo, si no está presente ninguna aberración del número de copias.

En el bloque 1350, se determina una clasificación de una anomalía para la primera región cromosómica basándose en la comparación. Una diferencia estadísticamente significativa en los niveles puede indicar aumento del riesgo del feto de tener una anomalía cromosómica. En diversas realizaciones, la anomalía cromosómica puede ser trisomía del 21, trisomía del 18, trisomía del 13, síndrome de Turner o síndrome de Klinefelter. Otros ejemplos son una deleción subcromosómica, duplicación subcromosómica o síndrome de DiGeorge.

V. DETERMINACIÓN DE MARCADORES

Como se ha observado anteriormente, ciertas partes del genoma fetal están metiladas de forma diferente al genoma materno. Estas diferencias pueden ser comunes entre embarazos. Las regiones de diferente metilación pueden usarse para identificar fragmentos de ADN que son del feto.

A. Método para determinar DMR de tejido placentario y tejido materno

La placenta tiene identificaciones de metilación específicas de tejido. Se han desarrollado marcadores de metilación del ADN específicos fetales para detección en plasma materno y para aplicaciones de diagnóstico prenatal no invasivas basándose en loci que están metilados diferencialmente entre tejidos placentarios y células sanguíneas maternas (SSC Chim et al. 2008 Clin Chem; 54: 500-511; EA Papageorgiou et al 2009 Am J Pathol; 174: 1609-1618; y T Chu et al. 2011 PLoS One; 6: e14723). Se proporcionan realizaciones para aprovechar dichas regiones metiladas diferencialmente (DMR) en todo el genoma.

La FIGURA 14 es un diagrama de flujo de un método 1400 para identificar marcadores de metilación comparando un perfil de metilación placentario con un perfil de metilación materno (por ejemplo, determinado a partir de células sanguíneas) de acuerdo con realizaciones de la presente descripción. El método 1400 también puede usarse para determinar marcadores para un tumor comparando un perfil de metilación tumoral con un perfil de metilación correspondiente a tejido sano.

En el bloque 1410, se obtiene un metiloma placentario y un metiloma de sangre. El metiloma placentario puede determinarse a partir de una muestra placentaria, por ejemplo, CVS o una placenta a término. Debería entenderse que el metiloma posiblemente incluya densidades de metilación de solamente parte de un genoma.

En el bloque 1420, se identifica una región que incluye un número específico de sitios (por ejemplo, 5 sitios de CpG) y para la que se ha obtenido un número suficiente de lecturas. En una realización, la identificación comenzó desde un extremo de cada cromosoma para localizar la primera región de 500 pb que contenía al menos cinco sitios de CpG cualificados. Un sitio de CpG puede considerarse cualificado si el sitio está abarcado por al menos cinco lecturas de secuencia.

En el bloque 1430, se calcula un índice de metilación placentario y un índice de metilación sanguíneo para cada sitio. Por ejemplo, el índice de metilación se calculó individualmente para todos los sitios de CpG cualificados dentro de cada región de 500 pb.

En el bloque 1440, los índices de metilación se compararon entre las células sanguíneas maternas y la muestra placentaria para determinar si los conjuntos de índices eran diferentes entre sí. Por ejemplo, los índices de metilación se compararon entre las células sanguíneas maternas y la CVS o la placenta a término usando, por ejemplo, el ensayo de Mann-Whitney. Un P valor de, por ejemplo, ≤0,01 se consideró estadísticamente significativamente diferente, aunque pueden usarse otros valores, en los que un número menor reduciría las regiones de falso positivo.

En una realización, si el número de sitios de CpG cualificados era menor de cinco o el ensayo de Mann-Whitney no era significativo, la región de 500 pb se desplazó cadena abajo para 100 pb. La región continuó desplazándose cadena abajo hasta que el ensayo de Mann-Whitney se hizo significativo para una región de 500 pb. Después se consideraría la siguiente región de 500 pb. Si se descubriera que la siguiente región muestra significación estadística por ensayo de Mann-Whitney, se añadiría a la región actual siempre que la región contigua combinada no fuera mayor de 1.000 pb.

En el bloque 1450, pueden mezclarse regiones adyacentes que sean estadísticamente significativamente diferentes (por ejemplo, por el ensayo de Mann-Whitney). Obsérvese que la diferencia es entre los índices de metilación para las dos muestras. En una realización, si las regiones adyacentes están a una distancia específica (por ejemplo, 1.000 pb) entre sí y si mostraron un perfil de metilación similar entonces podrían mezclarse. En una implementación, la similitud del perfil de metilación entre regiones adyacentes puede definirse usando cualquiera de los siguientes: (1) mostrar la misma tendencia en el tejido placentario en referencia a las células sanguíneas maternas, por ejemplo ambas regiones estaban más metiladas en los tejidos placentarios que las células sanguíneas; (2) con diferencias en las densidades de metilación de menos del 10 % para las regiones adyacentes en el tejido placentario; y (3) con diferencias en las densidades de metilación de menos del 10 % para las regiones adyacentes en las células sanguíneas maternas.

En el bloque 1460, se calcularon las densidades de metilación del metiloma sanguíneo de ADN de células sanguíneas maternas y muestras placentarias (por ejemplo, CVS o tejido placentario a término) en las regiones. Las densidades de metilación pueden determinarse como se describe en el presente documento.

En el bloque 1470, se determinan DMR potenciales donde la densidad de mutilación placentaria total y una densidad de metilación sanguínea total para todos los sitios en la región son estadísticamente significativamente diferentes. En una realización, todos los sitios de CpG cualificados dentro de una región mezclada se someten a un ensayo de X2 El ensayo de x2 evaluó si el número de citosinas metiladas como una proporción de las citosinas metiladas y desmetiladas entre todos los sitios de CpG cualificados dentro de la región mezclada eran estadísticamente significativamente diferentes entre las células sanguíneas maternas y el tejido placentario. En una implementación, para el ensayo de x2 un P valor de ≤0,01 puede considerarse estadísticamente significativamente diferente. Los segmentos mezclados que mostraron significación por el ensayo de x2 se consideraron DMR potenciales.

En el bloque 1480, se identificaron loci en los que las densidades de metilación del ADN de células sanguíneas maternas estaban por encima de un punto de corte alto o por debajo de un punto de corte bajo. En una realización, se identificaron loci en los que las densidades de metilación del ADN de células sanguíneas maternas eran ≤20 % o >80 %. En otras realizaciones, pueden usarse líquidos corporales distintos de sangre materna, incluyendo, pero sin limitación, saliva, líquido de lavado uterino o del cuello uterino del tracto genital femenino, lágrimas, sudor, saliva y orina.

Una clave para el desarrollo exitoso de marcadores de metilación de ADN que son específicos fetales en plasma materno puede ser que el estado de metilación de las células sanguíneas maternas sea altamente metilado o tan desmetilado como sea posible. Esto puede reducir (por ejemplo, minimizar) la probabilidad de tener moléculas de ADN materno que interfieran con el análisis de las moléculas de ADN fetal derivadas de placenta que muestran un perfil de metilación opuesto. Por lo tanto, en una realización, las DMR candidatas se seleccionaron por filtración adicional. Los loci hipometilados candidatos eran los que mostraron densidad de metilación ≤20 % en las células sanguíneas maternas y con densidades de metilación al menos 20 % mayores en los tejidos placentarios. Los loci hipermetilados candidatos fueron los que mostraron densidades de metilación >80 % en las células sanguíneas maternas y con densidades de metilación al menos 20 % menores en los tejidos placentarios. Pueden usarse otros porcentajes.

En el bloque 1490, se identificaron después DMR entre el subconjunto de loci en los que las densidades de metilación placentarias son significativamente diferentes de las densidades de metilación sanguíneas comparando la diferencia con un umbral. En una realización, el umbral es del 20 %, de modo que las densidades de metilación difirieron en al menos 20 % de las densidades de metilación de las células sanguíneas maternas. En consecuencia, puede calcularse una diferencia entre las densidades de metilación placentarias y las densidades de metilación sanguíneas en cada locus identificado. La diferencia puede ser una simple resta. En otras realizaciones, pueden usarse factores de cambio de escala y otras funciones para determinar la diferencia (por ejemplo, la diferencia puede ser el resultado de una función aplicada a la simple resta).

En una implementación, usando este método, se identificaron 11.729 loci hipermetilados y 239.747 hipometilados a partir de la muestra placentaria del primer trimestre. Los 100 loci más hipermetilados se enumeran en la tabla S2A del apéndice. Los 100 loci más hipometilados se enumeran en la tabla S2B del apéndice. Las tablas S2A y S2B enumeran el cromosoma, la localización de partida y final, el tamaño de la región, la densidad de metilación en la sangre materna, la densidad de metilación en la muestra placentaria, los P valores (que son todos muy bajos) y la diferencia de metilación Las localizaciones corresponden al genoma de referencia hg18, que puede encontrarse en hgdownload.soe.ucsc.edu/goldenPath/hg18/chromosomes.

Se identificaron 11.920 loci hipermetilados y 204.768 hipometilados de la muestra placentaria del tercer trimestre. Los 100 loci más hipermetilados para el 3er trimestre se enumeran en la tabla S2C y los 100 loci más hipometilados se enumeran en la tabla S2D. Se usaron treinta y tres loci que se había indicado previamente que estaban metilados diferencialmente entre células sanguíneas maternas y tejidos placentarios de primer trimestre para validar la lista de los inventores de candidatos del primer trimestre. Se habían identificado 79 % de los 33 loci como DMR usando el algoritmo de los inventores.

La FIGURA 15A es una tabla 1500 que muestra una realización de algoritmo de identificación de DMR usando datos del primer trimestre con referencia a 33 marcadores del primer trimestre previamente indicados. En la tabla, “a” indica que los loci 1 a 15 se habían descrito previamente en (RWK Chiu et al. 2007 Am J Pathol; 170: 941-950 y SSC chim et al. 2008 Clin Chem; 54: 500-511); los loci 16 a 23 se habían descrito previamente en (KC Yuen, tesis 2007, La Universidad China de Hong Kong, Hong Kong); y los loci 24 a 33 se habían descrito previamente en (EA Papageorgiou et al. 2009 Am J Pathol; 174: 1609-1618). “b” indica que estos datos se obtuvieron de las publicaciones anteriores. “c” indica que se observaron densidades de metilación de células sanguíneas maternas y muestra de vellosidad coriónica y sus diferencias a partir de los datos de secuenciación generados en el estudio presente pero basándose en las coordenadas genómicas proporcionadas por los estudios originales. “d” indica que los datos de los loci se identificaron usando realizaciones del método 1400 en los datos de secuenciación por bisulfito sin tomar referencia de las publicaciones citadas anteriormente por Chiu et al (2007), Chim et al (2008), Yuen (2007) y Papageorgiou et al. (2009). La extensión de los loci incluyó las regiones genómicas previamente indicadas pero en general abarcó regiones mayores. “e” indica que una DMR candidata se clasificó como verdadero positivo (VP) o falso negativo (FN) basándose en el requisito de observar una diferencia >0,20 entre las densidades de mutilación de las coordenadas de genoma correspondientes de las DMR en células sanguíneas maternas y muestra de vellosidad coriónica.

La FIGURA 15B es una tabla 1550 que muestra una realización de algoritmo de identificación de DMR usando datos del tercer trimestre y en comparación con la muestra de placenta obtenida en el parto. “a” indica que se usó la misma lista de 33 loci que se describe en la FIGURA 17A. “b” indica que como los 33 loci se identificaron previamente a partir de muestras de embarazo tempranas, no podrían ser aplicables a los datos del tercer trimestre. Por lo tanto, se revisaron los datos de secuenciación por bisulfito generados en el presente estudio en el tejido placentario a término basándose en las coordenadas genómicas proporcionadas por los estudios originales. Se usó una diferencia de >0,20 en las densidades de metilación entre las células sanguíneas maternas y el tejido placentario a término para determinar si los loci eran de hecho verdaderas DMR en el tercer trimestre. “c” indica que los datos de los loci se identificaron usando el método 1400 en los datos de secuenciación por bisulfito sin tomar referencia de publicaciones previamente citadas en Chiu et al (2007), Chim et al (2008), Yuen (2007) y Papageorgiou et al. (2009). La extensión de los loci incluyó las regiones genómicas previamente indicadas pero en general abarcó regiones mayores. “d” indica que DMR candidatas que contenían loci que se clasificaron como metiladas diferencialmente en el tercer trimestre se clasificaron como verdaderos positivos (VP) o falsos negativos (FN) basándose en el requisito de observar una diferencia >0,20 entre las densidades de metilación de las coordenadas de genoma correspondientes de las DMR en células sanguíneas maternas y tejido placentario a término. Para loci que no se clasificaron como diferencialmente metilados en el tercer trimestre, su ausencia en la lista de DMR o la presencia de una DMR que contenía los loci pero que mostraba diferencia de metilación de <0,20 se consideró como DMR verdaderas negativas (VN).

B. DMR de datos de secuenciación de plasma materno

Debería poderse identificar DMR de tejido placentario directamente a partir de los datos de secuenciación por bisulfito de ADN de plasma materno siempre que se conociera también la concentración de ADN fetal fraccional de la muestra. Es posible debido a que la placenta es la fuente predominante de ADN fetal en el plasma materno (SSC Chim et al. 2005 Proc Natl Acad Sci USA 102, 14753-14758) y los inventores han mostrado en este estudio que el estado de metilación de ADN específico fetal en plasma materno se correlacionaba con el metiloma placentario. Por lo tanto, pueden implantarse aspectos del método 1400 usando un metiloma de plasma para determinar un metiloma placentario deducido en lugar de usar una muestra placentaria. Por lo tanto, el método 1000 y el método 1400 pueden combinarse para determinar las DMR. El método 1000 puede usarse para determinar los valores predichos para el perfil de metilación placentario y usarlos en el método 1400. Para este análisis, el ejemplo también se centra en loci que estaban ≤20 % o >80 % metilados en las células sanguíneas maternas.

En una implementación, para deducir loci que estaban hipermetilados en los tejidos placentarios con respecto a células sanguíneas maternas, se clasificó con respecto a loci que mostraban ≤20 % de metilación en células sanguíneas maternas, y >60 % de metilación según el valor predicho con una diferencia de al menos 50 % entre la densidad de metilación de células sanguíneas y el valor predicho. Para deducir loci que están hipometilados en los tejidos placentarios con respecto a células sanguíneas maternas, se clasificó con respecto a loci que mostraban >80 % de metilación en células sanguíneas maternas y ≤40 % de metilación de acuerdo con el valor predicho con una diferencia de al menos 50 % entre la densidad de metilación de células sanguíneas y el valor predicho.

La FIGURA 16 es una tabla 1600 que muestra los números de loci que se ha predicho que están hipermetilados o hipometilados basándose en el análisis directo de los datos de secuenciación por bisulfito de plasma materno. “N/A” significa no aplicable. “a” indica que la búsqueda de loci hipermetilados partió de la lista de loci que mostraban densidades de metilación <20 % en las células sanguíneas maternas. “b” indica que la búsqueda de loci hipometilados partió de la lista de loci que mostraban densidades de metilación >80 % en las células sanguíneas maternas. “c” indica que se usaron datos de secuenciación por bisulfito de la muestra de vellosidad coriónica para verificar los datos de plasma materno del primer trimestre, y se usó el tejido placentario a término para verificar los datos de plasma materno del tercer trimestre.

Como se muestra en la tabla 1600, una mayoría de los loci deducidos de forma no invasiva mostraron el patrón de metilación esperado en los tejidos y solaparon con las DMR obtenidas de los datos de tejido y presentadas en la sección anterior. El apéndice enumera ^dM^ridentificadas del plasma. La Tabla S3A enumera los 100 loci superiores que se ha deducido que están hipermetilados a partir de los datos de secuenciación por bisulfito de plasma materno del primer trimestre. La Tabla S3B enumera los 100 loci superiores que se ha deducido que están hipometilados de los datos de secuenciación por bisulfito de plasma materno del primer trimestre. La Tabla S3C enumera los 100 loci superiores que se ha deducido que están hipermetilados de los datos de secuenciación por bisulfito de plasma materno del tercer trimestre. La Tabla S3D enumera los 100 loci superiores que se ha deducido que están hipometilados de los datos de secuenciación por bisulfito del plasma materno del tercer trimestre.

C. Variación gestacional en metilomas placentarios y fetales

La proporción general de CpG metilados en la CVS fue del 55 % mientras que fue del 59 % para la placenta a término (tabla 100 de la FIGURA 1). Pudieron identificarse más DMR hipometiladas a partir de CVS que la placenta a término mientras que el número de DMR hipermetiladas fue similar para los dos tejidos. Por lo tanto, fue evidente que la CVS estaba más hipometilada que la placenta a término. Esta tendencia gestacional también resultó evidente en los datos de plasma materno. La proporción de CpG metilados entre las lecturas específicas fetales fue del 47,0 % en el plasma materno del primer trimestre, pero fue del 53,3 % en el plasma materno del tercer trimestre. Los números de loci hipermetilados validados fueron similares en las muestras de plasma materno del primer (1.457 loci) y tercer trimestre (1.279 loci) pero hubo sustancialmente más loci hipometilados en las muestras del primer (21.812 loci) que del tercer trimestre (12.677 loci) (tabla 1600 de la FIGURA 16).

D. Uso de marcadores

Los marcadores metilados diferencialmente, o DMR, son útiles en varios aspectos. La presencia de dichos marcadores en plasma materno indica y confirma la presencia de ADN fetal o placentario. Esta confirmación puede usarse como un control de calidad para ensayos prenatales no invasivos. Las DMR pueden actuar como marcadores de ADN fetal genéricos en plasma materno y tienen ventajas sobre marcadores que se basan en diferencias genotípicas entre la madre y el feto, tales como marcadores basados en polimorfismo o los basados en el cromosoma Y. Las DMR son marcadores fetales genéricos que son útiles para todos los embarazos. Los marcadores basados en polimorfismo solamente son aplicables al subconjunto de embarazos cuando el feto ha heredado el marcador de su padre y cuando la madre no posee este marcador en su genoma. Además, se podría medir la concentración de ADN fetal en una muestra de plasma materno cuantificando las moléculas de ADN que se originan de esas DMR. Conociendo el perfil de DMR esperado para embarazos normales, podrían detectarse complicaciones asociadas con el embarazo, particularmente las que implican cambios del tejido placentario, observando una desviación en el perfil de DMR de plasma materno o el perfil de metilación con respecto al esperado para embarazos normales. Las complicaciones asociadas con el embarazo que implican cambios de tejido placentario incluyen pero sin limitación, aneuploidías cromosómicas fetales. Los ejemplos incluyen la trisomía del 21, preeclampsia, retardo del crecimiento intrauterino y parto prematuro.

E. Kits que usan marcadores

Las realizaciones pueden proporcionar composiciones y kits para practicar los métodos descritos en el presente documento y otros métodos aplicables. Los kits pueden usarse para llevar a cabo ensayos para analizar el ADN fetal, por ejemplo, ADN fetal sin células en plasma materno. En una realización, un kit puede incluir al menos un oligonucleótido útil para hibridación específica con uno o más loci identificados en el presente documento. Un kit también puede incluir al menos un oligonucleótido útil para hibridación específica con uno o más loci de referencia. En una realización, se miden marcadores hipermetilados placentarios. El locus de ensayo puede ser el ADN metilado en plasma materno y el locus de referencia puede ser el ADN metilado en plasma materno. Un kit similar puede componerse para analizar ADN tumoral en plasma.

En algunos casos, los kits pueden incluir al menos dos cebadores oligonucleotídicos que pueden usarse en la amplificación de al menos una sección de un locus diana (por ejemplo, un locus en el apéndice) y un locus de referencia. En lugar de o además de los cebadores, un kit puede incluir sondas marcadas para detectar un fragmento de ADN correspondiente a un locus diana y un locus de referencia. En diversas realizaciones, uno o más oligonucleótidos del kit corresponden a un locus en las tablas del apéndice. Típicamente, los kits también proporcionan manuales de instrucciones para guiar a los usuarios en el análisis de muestras de ensayo y evaluación del estado de la fisiología o la patología en un sujeto de ensayo.

En diversas realizaciones, se proporciona un kit para analizar ADN fetal en una muestra biológica que contiene una mezcla de ADN fetal y ADN de una mujer embarazada con un feto. El kit puede comprender uno o más oligonucleótidos para hibridar específicamente con al menos una sección de una región genómica enumerada en las tablas S2A, S2B, S2C, S2D, S3A, S3B, S3C y S3D. Por lo tanto, puede usarse cualquier número de oligonucleótidos de entre todas las tablas o solamente de una tabla. Los oligonucleótidos pueden actuar como cebadores y pueden organizarse como pares de cebadores, en los que un par corresponde a una región particular de las tablas.

VI. RELACIÓN DEL TAMAÑO Y LA DENSIDAD DE METILACIÓN

Se sabe que existen moléculas de ADN en plasma en circulación en forma de moléculas cortas, siendo la mayoría de moléculas de aproximadamente 160 pb de longitud (YMD Lo et al. 2010 Sci Transl Med; 2: 61ra91, YW Zheng et al. 2012 Clin Chem; 58: 549-558). Resulta interesante que los datos de los inventores han revelado una relación entre el estado de metilación y el tamaño de las moléculas de ADN de plasma. Por lo tanto, la longitud de los fragmentos de ADN de plasma está ligada al nivel de metilación del ADN. Los perfiles de tamaño característicos de moléculas de ADN en plasma sugieren que la mayoría están asociados con mononucleosomas, posiblemente derivados de degradación enzimática durante la apoptosis

El ADN en circulación está fragmentado en la naturaleza. En particular, el ADN fetal en circulación es más corto que el ADN derivado de la madre en muestras de plasma materno (KCA Chan et al. 2004 Clin Chem; 50: 88-92). Ya que el alineamiento de extremos emparejados permite el análisis del tamaño de ADN tratado por bisulfito, se podría evaluar directamente si existe alguna correlación entre el tamaño de las moléculas de ADN de plasma y sus niveles de metilación respectivos. Se ha explorado esto en el plasma materno así como una muestra de plasma de control de mujer adulta no embarazada.

Se usó secuenciación de extremos emparejados (que incluye secuenciación de una molécula completa) para ambos extremos de cada molécula de ADN para analizar cada muestra en este estudio. Alineando el par de secuencias finales de cada molécula de ADN con el genoma humano de referencia y observando las coordenadas del genoma de los extremos de las lecturas secuenciadas, se pueden determinar las longitudes de las moléculas de ADN secuenciadas. Las moléculas de ADN de plasma se fragmentan de forma natural en moléculas pequeñas y las bibliotecas de secuenciación para ADN de plasma se preparan típicamente sin ninguna etapa de fragmentación. Por lo tanto, las longitudes deducidas por la secuenciación representaron los tamaños de las moléculas de ADN de plasma originales.

En un estudio previo, se han determinado los perfiles de tamaño de las moléculas de ADN fetal y materno en plasma materno (YMD Lo et al. 2010 Sci Transl Med; 2: 61ra91). Se ha mostrado que las moléculas de ADN de plasma tenían tamaños que se asemejaban a mononucleosomas y las moléculas de ADN fetal eran más cortas que las maternas. En este estudio, se ha determinado la relación del estado de metilación de moléculas de ADN de plasma con sus tamaños.

A. Resultados

La FIGURA 17A es una representación 1700 que muestra la distribución de tamaños de ADN de plasma materno, plasma de control de mujer no embarazada, placentario y de sangre periférica. Para la muestra materna y el plasma de control de mujer no embarazada, las dos muestras de plasma tratadas por bisulfito presentaron la misma distribución de tamaños característica que se ha indicado previamente (YMD Lo et al. 2010 Sci Transl Med; 2: 61ra91) con las secuencias totales más abundantes de 166-167 pb de longitud y una periodicidad de 10 pb de moléculas de ADN más cortas de 143 pb.

La FIG. 17B es una representación 1750 de la distribución de tamaños y perfil de metilación de plasma materno, plasma de control de mujer adulta, tejido placentario y sangre de control de mujer adulta. Para moléculas de ADN del mismo tamaño y que contienen al menos un sitio de CpG, se calculó su densidad de metilación media. Después se representó la relación entre los tamaños de las moléculas de ADN y sus densidades de metilación. Específicamente, la densidad de metilación media se determinó para cada longitud de fragmento que variaba de 50 pb hasta 180 pb para lecturas secuenciadas que abarcaban al menos 1 sitio de CpG. Resulta interesante que la densidad de metilación aumentó con el tamaño del ADN de plasma y alcanzó un máximo a aproximadamente 166 167 pb. Este patrón, sin embargo, no se observó en las muestras de ADN de placenta y sangre de control que se fragmentaron usando un sistema de ultrasonidos.

La FIGURA 18 muestra representaciones de densidades de metilación y tamaño de moléculas de ADN de plasma. La FIGURA 18A es una representación 1800 para el plasma materno del primer trimestre. La FIGURA 18B es una representación 1850 para el plasma materno del tercer trimestre. Los datos para todas las lecturas secuenciadas que abarcaban al menos un sitio de CpG se representan por la curva azul 1805. Los datos para lecturas que también contenían un alelo de SNP específico fetal se representan por la curva roja 1810. Los datos para lecturas que también contenían un alelo de SNP específico materno se representan por la curva verde 1815.

Se consideró que las lecturas que contenían un alelo de SNP específico fetal habían derivado de moléculas de ADN fetal. Se consideró que las lecturas que contenían un alelo de SNP específico materno habían derivado de moléculas de ADN materno. En general, las moléculas de ADN con densidades de metilación altas tenían un tamaño mayor. Esta tendencia estaba presente en moléculas de ADN tanto fetales como maternas tanto en el primer como en el tercer trimestre. Los tamaños generales de las moléculas de ADN fetal fueron más cortos que los maternos como se ha indicado previamente.

La FIGURA 19A muestra una representación 1900 de densidades de metilación y los tamaños de lecturas secuenciadas para una mujer no embarazada adulta. La muestra de ADN de plasma de la mujer no embrazada adulta también mostró la misma relación entre los tamaños y el estado de metilación de las moléculas de ADN. Por otro lado, las muestras de ADN genómico se fragmentaron por una etapa de ultrasonidos antes del análisis de SPM. Como se muestra en la representación 1900, los datos de las muestras de células sanguíneas y tejido placentario no revelaron la misma tendencia. Ya que la fragmentación de las células es artificial, se esperaría que no hubiera relación de tamaño y densidad. Ya que las moléculas de ADN fragmentadas de forma natural en el plasma sí muestran una dependencia del tamaño, se puede suponer que las densidades de metilación menores hacen más probable que las moléculas se rompan en fragmentos más pequeños.

La FIGURA 19B es una representación 1950 que muestra la distribución de tamaños y el perfil de metilación de moléculas de ADN específicas fetales y específicas maternas en plasma materno. Las moléculas de ADN de plasma específicas fetales y específicas maternas también mostraron la misma correlación entre el tamaño de los fragmentos y el nivel de metilación. La longitud de los fragmentos de ADN sin células tanto derivado de placenta como en circulación materno aumentó con el nivel de mutilación. Además, la distribución de su estado de mutilación no solapó entre sí, lo que sugiere que el fenómeno existe independientemente de la longitud del fragmento original de las fuentes de moléculas de ADN en circulación.

B. Método

En consecuencia, puede usarse una distribución de tamaños para estimar un porcentaje de metilación total de una muestra de plasma. Esta medición de metilación puede después seguirse durante el embarazo, durante la supervisión del cáncer o durante el tratamiento por medición en serie de las distribuciones de tamaños del ADN de plasma de acuerdo con la relación mostrada en las FIGURAS 18A y 18B. La medición de metilación también puede usarse para buscar la liberación aumentada o reducida de ADN de un órgano o un tejido de interés. Por ejemplo, se pueden buscar específicamente identificaciones de metilación de ADN específicas para un órgano específico (por ejemplo el hígado) y medir las concentraciones de estas identificaciones en plasma. Ya que se libera a Dn al plasma cuando las células mueren, un aumento en los niveles podría significar un aumento en la muerte celular o daño en ese órgano o tejido particular. Una reducción en el nivel de un órgano particular puede significar que el tratamiento para contrarrestar el daño o procesos patológicos en ese órgano está bajo control.

La FIGURA 20 es un diagrama de flujo de un método 2000 para estimar un nivel de metilación de ADN en una muestra biológica de un organismo de acuerdo con realizaciones de la presente descripción. El nivel de metilación puede estimarse para una región particular de un genoma o el genoma completo. Si se desea una región específica, entonces pueden usarse fragmentos de ADN solamente de esa región específica.

En el bloque 2010, se miden las cantidades de fragmentos de ADN correspondientes a diversos tamaños. Para cada tamaño de una pluralidad de tamaños, se puede medir una cantidad de una pluralidad de fragmentos de ADN de la muestra biológica correspondiente al tamaño. Por ejemplo, se puede medir el número de fragmentos de ADN que tienen una longitud de 140 bases. Las cantidades pueden guardarse como un histograma. En una realización, se mide un tamaño de cada uno de la pluralidad de ácidos nucleicos de la muestra biológica, lo que puede realizarse individualmente (por ejemplo, mediante secuenciación de moléculas individuales de una molécula completa o solamente los extremos de la molécula) o en grupos (por ejemplo mediante electroforesis). Los tamaños pueden corresponder a un intervalo. Por lo tanto, una cantidad puede ser para fragmentos de ADN que tienen un tamaño dentro de un intervalo particular. Cuando se realiza secuenciación de extremos emparejados, los fragmentos de ADN (como se determinan por las lecturas de secuencias emparejadas) que se mapean (se alinea) en una región particular pueden usarse para determinar el nivel de metilación de la región.

En el bloque 2020, se calcula un primer valor de un primer parámetro basándose en las cantidades de fragmentos de ADN en múltiples tamaños. En un aspecto, el primer parámetro proporciona una medida estadística de un perfil de tamaños (por ejemplo, un histograma) de fragmentos de ADN en la muestra biológica. El parámetro puede denominarse parámetro de tamaños ya que se determina a partir de los tamaños de la pluralidad de fragmentos de ADN.

El primer parámetro puede ser de diversas formas. Un parámetro es el porcentaje de fragmento de ADN de un tamaño particular o un intervalo de tamaños en relación con todos los fragmentos de ADN o en relación con fragmentos de ADN de otro tamaño o intervalo. Dicho parámetro es un número de fragmentos de ADN en un tamaño particular dividido por el número total de fragmentos, que puede obtenerse a partir de un histograma (cualquier estructura de datos que proporciona recuentos absolutos o relativos de fragmentos a tamaños particulares). Como otro ejemplo, un parámetro podría ser un número de fragmentos en un tamaño particular o dentro de un intervalo particular dividido por un número de fragmentos de otro tamaño o intervalo. La división puede actuar como una normalización para representar un número diferente de fragmentos de ADN que se analizan para diferentes muestras. Puede realizarse una normalización analizando un mismo número de fragmentos de ADN para cada muestra, lo que proporciona de forma eficaz un mismo resultado que la división por un número total de fragmentos analizados. Pueden encontrarse ejemplos adicionales de parámetros y acerca de análisis de tamaños en la Solicitud de Patente de Estados Unidos 13/789.553.

En el bloque 2030, el primer valor de tamaño se compara con un valor de tamaño de referencia. El valor de tamaño de referencia puede calcularse a partir de fragmentos de ADN de una muestra de referencia. Para determinar los valores de tamaños de referencia, el perfil de metilación puede calcularse y cuantificarse para una muestra de referencia, así como un valor del primer parámetro de tamaño. Por lo tanto, cuando el primer valor de tamaño se compara con el valor de tamaño de referencia, puede determinarse un nivel de metilación.

En el bloque 2040, el nivel de metilación se estima basándose en la comparación. En una realización, se puede determinar si el primer valor del primer parámetro está por encima o por debajo del valor de tamaño de referencia, y de este modo determinar si el nivel de metilación de la presente muestra está por encima o por debajo del nivel de metilación del valor de tamaño de referencia. En otra realización, la comparación se consigue introduciendo el primer valor en una función de calibración. La función de calibración puede comparar eficazmente el primer valor con valores de calibración (un conjunto de valores de tamaño de referencia) identificando el punto en una curva correspondiente al primer valor. El nivel de metilación estimado se proporciona después como el valor de salida de la función de calibración.

En consecuencia, se puede calibrar un parámetro de tamaño con un nivel de mutilación. Por ejemplo, puede medirse un nivel de metilación y asociarse con un parámetro de tamaño particular para esa muestra. Después puntos de datos de diversas muestras pueden ajustarse a una función de calibración. En una implementación, pueden usarse diferentes funciones de calibración para diferentes subconjuntos de ADN. Por lo tanto, puede haber alguna forma de calibración basada en el conocimiento previo acerca de la relación entre la metilación y el tamaño para un subconjunto particular de ADN. Por ejemplo, la calibración para ADN fetal y materno podría ser diferente.

Como se ha mostrado anteriormente, la placenta está más hipometilada en comparación con la sangre materna, y por lo tanto el ADN fetal es más pequeño debido a la menor metilación. En consecuencia, puede usarse un tamaño promedio de los fragmentos de una muestra (u otro valor estadístico) para estimar la densidad de metilación. Como los tamaños de los fragmentos pueden medirse usando secuenciación de extremos emparejados, en lugar de la secuenciación sensible a la metilación potencialmente técnicamente más compleja, este enfoque sería potencialmente rentable si se usara clínicamente. Este enfoque puede usarse para supervisar los cambios de metilación asociados con el progreso de embarazo o con trastornos asociados con el embarazo tales como preeclampsia, parto prematuro y trastornos fetales (tales como los provocados por anomalías cromosómicas o genéticas o retardo del crecimiento intrauterino).

En otra realización, este enfoque puede usarse para detectar y supervisar cáncer. Por ejemplo, con el tratamiento exitoso del cáncer, el perfil de metilación en plasma u otro fluido corporal como se mide usando este enfoque basado en el tamaño cambiaría hacia el de individuos sanos sin cáncer. Por el contrario, en el caso de que el cáncer esté progresando, entonces el perfil de metilación en plasma u otro fluido corporal sería distinto del de individuos sanos sin cáncer.

En resumen, las moléculas hipometiladas fueron más cortas que las hipermetiladas en plasma. Se observó la misma tendencia en las moléculas de ADN tanto fetales como maternas. Ya que se sabe que la metilación de ADN influye en el empaquetamiento de nucleosomas, los datos de los inventores sugieren que quizás las moléculas de ^aDⁿhipometiladas estén empaquetadas de forma menos densa con histonas y por lo tanto sean más susceptibles a la degradación enzimática. Por otro lado, los datos presentados en las FIGURAS 18A y 18B también han mostrado que a pesar de que el ADN fetal está mucho más hipometilado que las lecturas maternas, la distribución por tamaños del ^aDⁿfetal y materno no lo separa entre sí completamente. En la FIGURA 19B, se puede ver que incluso para la misma categoría de tamaño, el nivel de metilación de lecturas específicas fetales y maternas difieren entre sí. Esta observación sugiere que el estado hipometilado del ADN fetal no es el único factor que explicaba su bajo tamaño relativo en referencia al ADN materno.

VII. ESTADO DE IMPRONTA DE LOCI GÉNICOS

Pueden detectarse moléculas de ADN derivadas de fetos que comparten el mismo genotipo pero con diferentes identificaciones epigenéticas a la madre en el plasma materno (LLM Poon et al. 2002 Clin Chem; 48: 35-41). Para demostrar que el enfoque de secuenciación es sensible para captar moléculas de ADN derivadas de fetos en plasma materno, se aplicó la misma estrategia para detectar los alelos fetales con impronta en muestra de plasma materno. Se identificaron dos regiones con impronta genómica: H19 (cr11: 1.977.419-1.977.821, NCBI versión 36/hg18) y MEST (cr7: 129.917.976-129.920.347, NCBI versión 36/hg18). Ambas contienen SNP informativos para diferenciación entre las secuencias maternas y fetales. Para H19, un gen expresado por vía materna, la madre era homocigota (A/A) y el feto era heterocigoto (A/C) para el SNP rs2071094 (cr11: 1.977.740) en la región. Uno de los alelos maternos A estaba completamente metilado y el otro estaba desmetilado. En la placenta, sin embargo, el alelo A estaba desmetilado mientras que el alelo C heredado por vía paterna estaba completamente metilado. Se detectaron dos lecturas metiladas con el genotipo C, correspondientes a los alelos paternos con impronta derivados de la placenta, en plasma materno.

MEST, también conocido como PEG1, es un gen expresado por vía paterna. Tanto la madre como el feto eran heterocigotos (A/G) para el SNP rs2301335 (cr7: 129.920.062) dentro del locus con impronta. El alelo G estaba metilado mientras que el alelo A estaba desmetilado en sangre materna. El patrón de metilación se invirtió en la placenta estando el alelo materno A metilado y el alelo paterno G desmetilado. Tres alelos G desmetilados, que derivaban por vía paterna, eran detectables en plasma materno. Por el contrario, VAV1, un locus génico sin impronta en el cromosoma 19 (cr19: 6.723.621-6.724.121), no presentó ningún patrón de metilación alélico en el tejido así como en las muestras de ADN de plasma.

Por lo tanto, el estado de metilación puede usarse para determinar que los fragmentos de ADN son del feto. Por ejemplo, no puede usarse solamente la detección del alelo A en el plasma materno como un marcador fetal cuando la madre es heterocigota GA. Pero si se distingue el estado de metilación de las moléculas A en plasma, las moléculas A metiladas son específicas fetales mientras que las moléculas A desmetiladas son específicas maternas, o viceversa.

A continuación los inventores se centraron en loci que se había indicado que demostraban impronta genómica en tejidos placentarios Basándose en la lista de loci presentados por Woodfine et al. (2011 Epigenetics Chromatin; 4: 1), se clasificaron adicionalmente los que contenían SNP dentro de la región de control de la impronta. Cuatro loci cumplieron los criterios y fueron H19, KCNQ10T1, MEST y NESP.

Con respecto a las lecturas de la muestra de células sanguíneas maternas para H19 y KCNQ10T1, las lecturas maternas fueron homocigotas para el SNP y hubo proporciones aproximadamente iguales de lecturas metiladas y desmetiladas. La CVS y la muestra de tejido placentario a término revelaron que el feto era heterocigoto para ambos loci y cada alelo se metiló o desmetiló de forma exclusiva, es decir que mostraban metilación monoalélica. En las muestras de plasma materno, las moléculas de ADN fetal heredadas por vía paterna se detectaron para ambos loci. Para H19, las moléculas heredadas por vía paterna se representaron por las lecturas secuenciadas que contenían el alelo específico fetal y se metilaron. Para KCNQ10T1, las moléculas heredadas por vía paterna se representaron por las lecturas secuenciadas que contenían el alelo específico fetal y estaban desmetiladas.

Por otro lado, la madre era heterocigota tanto para MEST como para NESP. Para MEST, tanto la madre como el feto eran heterocigotos GA para el SNP. Sin embargo, como resulta evidente a partir de los datos para la cadena de Watson para las células sanguíneas maternas y el tejido placentario, el estado de metilación para los CpG adyacentes al SNP era opuesto en la madre y el feto. El alelo A estaba desmetilado en el ADN de la madre pero estaba metilado en el ADN del feto. Para MEST, el alelo materno estaba metilado. Por lo tanto, se podría apuntar a que el feto había heredado el alelo A de su madre (metilado en la CVS) y la madre había heredado el alelo A de su padre (desmetilado en las células sanguíneas maternas). Resulta interesante que en las muestras de plasma materno, los cuatro grupos de moléculas podrían distinguirse fácilmente, incluyendo cada uno de los dos alelos de la madre y cada uno de los dos alelos del feto. Por lo tanto, combinando la información genotípica con el estado de metilación en los loci con impronta, se podrían distinguir fácilmente las moléculas de ADN fetal heredadas por vía materna de las moléculas de ADN maternas de fondo (LLM Poon et al. 2002 Clin Chem; 48: 35-41).

Este enfoque podría usarse para detectar disomía uniparental. Por ejemplo, si se sabe que el padre de este feto es homocigoto para el alelo G, la ausencia de detección del alelo G desmetilado en plasma materno significa la falta de contribución del alelo paterno. Además, en dicha circunstancia, cuando tanto el alelo G metilado como el alelo A metilado se detectaron en el plasma de este embarazo, se sugeriría que el feto tiene heterodisomía de la madre, es decir, que hereda dos alelos diferentes de la madre sin ninguna herencia del padre Como alternativa, si tanto el alelo A metilado (alelo fetal heredado de la madre) como el alelo A desmetilado (alelo materno heredado del abuelo materno) se detectaron en plasma materno sin el alelo G desmetilado (alelo paterno que debería haberse heredado por el feto), se sugeriría que el feto tiene isodisomía de la madre, es decir que hereda dos alelos idénticos de la madre sin ninguna herencia del padre.

Para NESP, la madre era una heterocigota GA en el SNP mientras que el feto era homocigoto para el alelo G. El alelo paterno estaba metilado para NESP. En las muestras de plasma materno, los alelos G fetales heredados por vía paterna que estaban metilados podrían distinguirse fácilmente de los alelos G maternos de fondo que estaban desmetilados.

VIII. CÁNCER/DONANTES

Algunas realizaciones pueden usarse para la detección, exploración, supervisión (por ejemplo con respecto a recaída, remisión o respuesta (por ejemplo presencia o ausencia) al tratamiento), estadificación, clasificación (por ejemplo para ayudar a elegir la modalidad de tratamiento más apropiada) y pronóstico del cáncer usando análisis de metilación de ADN de plasma/suero en circulación.

Se sabe que el ADN de cáncer demuestra metilación de ADN aberrante (JG Herman et al. 2003 N Engl J Med; 349: 2042-2054). Por ejemplo, los promotores de islas de CpG de genes, por ejemplo genes supresores de tumores, están hipermetilados mientras que los sitios de CpG en el cuerpo del gen están hipometilados en comparación con células no cancerosas. Siempre que el perfil de metilación de las células cancerosas pueda reflejarse por el perfil de metilación de las moléculas de ADN de plasma derivadas de tumores usando métodos descritos en el presente documento, se espera que el perfil de metilación general en plasma sea diferente entre individuos con cáncer en comparación con los individuos sanos sin cáncer o en comparación con aquellos cuyo cáncer se ha curado. Los tipos de diferencias en el perfil de metilación podrían ser con respecto a diferencias cuantitativas en las densidades de metilación del genoma y/o densidades de metilación de segmentos de los genomas. Por ejemplo, debido a la naturaleza hipometilada general del ADN de tejidos cancerosos (Gama-Sosa MA et al. 1983 Nucleic Acids Res; 11: 6883-6894), se observaría reducción en las densidades de metilación en el metiloma de plasma o segmentos del genoma en plasma de pacientes con cáncer

Los cambios cualitativos en el perfil de metilación también deberían reflejarse entre los datos del metiloma de plasma. Por ejemplo, las moléculas de ADN de plasma que se originan de genes que están hipermetilados solamente en células cancerosas mostrarían hipermetilación en plasma de un enfermo de cáncer en comparación con moléculas de ADN de plasma que se originan de los mismos genes pero en una muestra de un control sano. Debido a que se produce metilación aberrante en la mayoría de los cánceres, los métodos descritos en el presente documento podrían aplicarse a la detección de todas las formas de tumores malignos con metilación aberrante, por ejemplo, tumores malignos en, pero sin limitación, el pulmón, la mama, el colon y el recto, la próstata, la nasofaringe, el estómago, los testículos, la piel, el sistema nervioso, el hueso, el ovario, el hígado, tejidos hematológicos, el páncreas, el útero, el riñón, la vejiga, tejidos linfoides, etc. Los tumores malignos pueden ser de una diversidad de subtipos histológicos, por ejemplo, carcinomas, adenocarcinomas, sarcomas, fibroadenocarcinoma, neuroendocrinos e indiferenciados, etc.

Por otro lado, se espera que las moléculas de ADN derivadas de tumores puedan distinguirse de las moléculas de ADN no derivadas de tumores de fondo debido a que el perfil de tamaños en general cortos del ADN derivado de tumores se acentúa para moléculas de ADN que se originan de loci con hipometilación aberrante asociada a tumores lo que tendría un efecto adicional en el tamaño de la molécula de ADN. Además, las moléculas de ADN de plasma derivadas de tumores pueden distinguirse de las moléculas de ADN de plasma no derivadas de tumores de fondo usando múltiples elementos característicos que se asocian con ADN tumoral, incluyendo pero sin limitación variantes de un único nucleótido, ganancias y pérdidas del número de copias, translocaciones, inversiones, hipermetilación o hipometilación aberrante y perfiles de tamaños. Como todos estos cambios podrían producirse de forma independiente, el uso combinado de estos elementos puede proporcionar una ventaja aditiva para la detección sensible y específica de ADN de cáncer en plasma.

A. Tamaño y cáncer

El tamaño de moléculas de ADN derivadas de tumores en plasma también se asemeja a los tamaños de unidades mononucleosómicas y son más cortas que las moléculas de ADN no derivadas de tumores de fondo, que coexisten en el plasma de enfermos de cáncer. Se ha mostrado que los parámetros de tamaño están correlacionados con el cáncer, como se describe en la Solicitud de Patente de Estados Unidos 13/789.553.

Ya que el ADN tanto derivado del feto como derivado de la madre en plasma ha mostrado una relación entre el tamaño y el estado de metilación de la molécula, se espera que las moléculas de ADN derivadas de tumores muestren la misma tendencia. Por ejemplo, las moléculas hipometiladas serían más cortas que las moléculas hipermetiladas en el plasma de enfermos de cáncer o en sujetos que se han explorado con respecto a cáncer. B. Densidades de metilación de diferentes tejidos en un paciente de cáncer

En este ejemplo, se analizó el plasma y las muestras tisulares de un enfermo de carcinoma hepatocelular (CHC). Se recogieron muestras de sangre del enfermo de CHC antes de la resección quirúrgica del tumor y una semana después. Se recogieron el plasma y la capa leucocítica después de centrifugación de las muestras sanguíneas. Se recogieron el tumor resecado y el tejido de hígado no tumoral adyacente. Las muestras de ADN extraídas del plasma y muestras tisulares se analizaron usando secuenciación paralela masiva con y sin tratamiento por bisulfito previo. El ADN de plasma de cuatro individuos sanos sin cáncer se analizó también como controles. El tratamiento por bisulfito de una muestra de ADN convertiría los restos de citosina no metilados en uracilo. En la reacción en cadena de la polimerasa cadena abajo y la secuenciación, estos restos de uracilo se comportarían como timidina. Por otro lado, el tratamiento por bisulfito no convertiría los restos de citosina metilados en uracilo. Después de secuenciar de forma paralela masiva, las lecturas de secuenciación se analizaron mediante el Methy-Pipe (P Jiang, et al. Methy-Pipe: An integrated bioinformatics data analysis pipeline for whole genome methylome analysis, artículo presentado en los Talleres de la Conferencia Internacional sobre Bioinformática y Biomedicina de IEEE, Hong Kong, del 18 al 21 de diciembre de 2010), para determinar el estado de metilación de los restos de citosina en todas las posiciones de dinucleótidos CG, es decir sitios de CpG.

La FIGURA. 21A es una tabla 2100 que muestra las densidades de metilación del plasma preoperatorio y las muestras tisulares de un enfermo de CHC. La densidad de metilación de CpG para las regiones de interés (por ejemplo sitios de CpG, regiones promotoras o repetidas etc.) se refiere a la proporción de lecturas que muestran metilación de CpG sobre el número total de lecturas que abarcan dinucleótidos de CpG genómicos. Las densidades de metilación de la capa leucocítica y el tejido hepático no tumoral son similares. La densidad de metilación general del tejido tumoral, basándose en datos de todos los autosomas, fue 25 % menor que la de la capa leucocítica y el tejido hepático no tumoral. La hipometilación fue uniforme entre cada cromosoma individual. La densidad de metilación del plasma estuvo entre los valores de los tejidos no malignos y los tejidos de cáncer. Esta observación es coherente con el hecho de que los tejidos tanto de cáncer como no de cáncer contribuirían al ADN en circulación de un enfermo de cáncer. Se ha mostrado que el sistema hematopoyético es la fuente principal del ADN en circulación en individuos sin una afección maligna activa (YYN Lui, et al., 2002 Clin Chem; 48: 421-7). También se han analizado por lo tanto muestras de plasma obtenidas de cuatro controles sanos. El número de lecturas de secuencias y la profundidad de secuenciación conseguida por muestra se muestran en la tabla 2150 de la FIGURA 21B.

La FIGURA 22 es una tabla 220 que muestra que las densidades de metilación en los autosomas variaron de 71,2 % a 72,5 % en las muestras de plasma de los controles sanos. Estos datos mostraron el nivel esperado de metilación de ADN en muestras de plasma obtenidas de individuos sin una fuente de ADN tumoral. En un enfermo de cáncer, el tejido tumoral también liberaría ADN a la circulación (KCA Chan et al. 2013 Clin Chem; 59: 211-224); RJ Leary et al. 2012 Sci Transl Med; 4: 162ra154). Debido a la naturaleza hipometilada del tumor de CHC, la presencia de ADN tanto derivado de tumor como no derivado de tumor en el plasma preoperatorio del paciente dio como resultado una reducción de la densidad de metilación en comparación con los niveles en plasma de controles sanos. De hecho, la densidad de metilación de la muestra de plasma preoperatoria estuvo entre las densidades de metilación del tejido tumoral y el plasma de los controles sanos. La razón es que el nivel de metilación del ADN de plasma de pacientes con cáncer estaría influido por el grado de metilación aberrante, hipometilación en este caso, del tejido tumoral y la concentración fraccional del ADN derivado de tumor en la circulación. Una densidad de metilación menor del tejido tumoral y una mayor concentración fraccional de ADN derivado de tumor en la circulación conduciría a una menor densidad de metilación del ADN de plasma en un enfermo de cáncer. Se ha indicado que la mayoría de los tumores muestran hipometilación global (JG Herman et al. 2003 N Engl J Med; 349: 2042-2054; MA Gama-Sosa et al. 1983 Nucleic Acids Res; 11: 6883-6894). Por lo tanto, las observaciones actuales vistas en las muestras de CHC también serían aplicables a otros tipos de tumores.

En una realización, la densidad de metilación del ADN de plasma puede usarse para determinar la concentración fraccional de ADN derivado de tumor en una muestra de plasma/suero cuando se conoce el nivel de metilación del tejido tumoral. El nivel de metilación, por ejemplo densidad de metilación, del tejido tumoral puede obtenerse si la muestra tumoral está disponible o si está disponible una biopsia del tumor. En otra realización, la información con respecto al nivel de metilación del tejido tumoral puede obtenerse de una investigación del nivel de metilación en un grupo de tumores de un tipo similar y esta información (por ejemplo un nivel medio o una mediana del nivel) se aplica al paciente para analizar usando la tecnología descrita en esta descripción. El nivel de metilación del tejido tumoral puede determinarse por el análisis del tejido tumoral del paciente o inferirse a partir del análisis de los tejidos tumorales de otros pacientes con el mismo tipo de cáncer o uno similar.

La relación entre el nivel de metilación de plasma, P, con la concentración de ADN tumoral fraccional, f y el nivel de metilación de tejido tumoral, TUM, puede describirse como: P=BKG x(1-f)+TUM x f donde BKG es el nivel de metilación de ADN de fondo en plasma derivado de células sanguíneas y otros órganos internos. Por ejemplo, se ha mostrado que la densidad de metilación general de todos los autosomas era del 42,9 % en el tejido de biopsia tumoral obtenido de este enfermo de CHC, es decir el valor de TUM para este caso. La densidad de metilación media de las muestras de plasma de los cuatro controles sanos fue del 71,6 %, es decir el valor de BKG de este caso. La densidad de metilación de plasma para el plasma preoperatorio fue del 59,7 %. Usando estos valores, se estima que f es 41,5 %.

En otra realización, el nivel de metilación del tejido tumoral puede estimarse de forma no invasiva basándose en los datos de metiloma de plasma cuando se conoce la concentración fraccional del ADN derivado de tumor en la muestra de plasma. La concentración fraccional del ADN derivado de tumor en la muestra de plasma puede determinarse por otros análisis genéticos, por ejemplo el análisis de todo el genoma de pérdida alélica (GAAL) y el análisis de mutaciones de un único nucleótido como se ha descrito previamente (Solicitud de Patente de Estados Unidos 13/308.473; KCA Chan et al. 2013 Clin Chem; 59: 211-24). El cálculo se basa en la misma relación descrita anteriormente excepto que en esta realización se conoce el valor de f y el valor de TUM es el desconocido. La deducción puede realizarse para el genoma completo o para partes del genoma, de forma similar a los datos observados para el contexto de determinar el nivel de metilación de tejido placentario a partir de datos del plasma materno.

En otra realización, se puede usar la variación entre grupos o perfil en las densidades de metilación para diferenciar sujetos con cáncer y los que no tienen cáncer. La resolución del análisis de metilación puede aumentarse adicionalmente dividiendo el genoma en grupos de un tamaño particular, por ejemplo, 1 Mb. En dicha realización, la densidad de metilación de cada grupo de 1 Mb se calculó para las muestras recogidas, por ejemplo, la capa leucocítica, el tejido de CHC resecado, el tejido hepático no tumoral adyacente al tumor y el plasma recogido antes y después de la resección tumoral. En otra realización, no es necesario que los tamaños de los grupos se mantengan constantes. En una implementación, el número de sitios de CpG se mantiene constante dentro de cada grupo mientras que el tamaño del grupo en sí mismo puede variar.

Las FIGURAS 23A y 23B muestran densidad de metilación de la capa leucocítica, el tejido tumoral, el tejido hepático no tumoral, el plasma preoperatorio y plasma postoperatorio del enfermo de CHC. La FIGURA 23A es una representación 2300 de resultados para el cromosoma 1. La FIGURA 23B es una representación 2350 de resultados para el cromosoma 2.

Para la mayoría de las ventanas de 1 Mb, las densidades de metilación para la capa leucocítica y el tejido hepático no tumoral adyacente al tumor fueron similares mientras que las de los tejidos tumorales eran menores. Las densidades de metilación del plasma preoperatorio quedan entre las del tumor y los tejidos no malignos. Las densidades de metilación de las regiones genómicas consultadas en los tejidos tumorales podrían deducirse usando los datos de metilación del plasma preoperatorio y la concentración de ADN tumoral fraccional. El método es el mismo que se ha descrito anteriormente usando los valores de densidad de metilación de todos los autosomas. La deducción de la metilación tumoral descrita también puede realizarse usando estos datos de metilación de mayor resolución del ADN de plasma. También pueden usarse otros tamaños de grupos, tales como 300 kb, 500 kb, 2 Mb, 3 Mb, 5 Mb o más de 5 Mb. En una realización, no es necesario mantener constantes los tamaños de los grupos. En una implementación, el número de sitios de CpG se mantiene constante dentro de cada grupo mientras que el tamaño del grupo en sí mismo puede variar.

C. Comparación de la densidad de metilación en plasma entre el enfermo de cáncer e individuos sanos

Como se muestra en 2100, las densidades de metilación del ADN de plasma preoperatorio fueron menores que las de tejidos no malignos en el enfermo de cáncer. Esto probablemente se deba a la presencia de ADN del tejido tumoral que estaba hipometilado. Esta densidad de metilación de ADN de plasma inferior puede usarse potencialmente como un biomarcador para la detección y supervisión de cáncer. Para supervisión de cáncer, si un cáncer está progresando, entonces habrá una cantidad aumentada de ADN derivado de cáncer en plasma con el tiempo. En este ejemplo, una cantidad aumentada de ADN derivado de cáncer en circulación en plasma conducirá a una reducción adicional en la densidad de metilación de ADN de plasma en todo el genoma.

Por el contrario, si un cáncer responde al tratamiento, entonces la cantidad de ADN derivado de cáncer en plasma se reducirá con el tiempo. En este ejemplo, una reducción de la cantidad de ADN derivado de cáncer en plasma conducirá a un aumento en la densidad de metilación de ADN de plasma. Por ejemplo, si un enfermo de cáncer de pulmón con mutación del receptor del factor de crecimiento epidérmico se ha tratado con una terapia dirigida, por ejemplo inhibición de tirosina quinasa, entonces un aumento en la densidad de metilación de ADN de plasma significaría una respuesta. Posteriormente, la aparición de un clon tumoral resistente a la inhibición de tirosina quinasa se asociaría con una reducción en la densidad de metilación de ADN de plasma lo que indicaría una recaída.

Pueden realizarse mediciones de densidad de metilación en plasma en serie y puede calcularse la tasa de cambio de dichas mediciones y usarse para predecir o correlacionar con la progresión clínica o remisión o pronóstico. Para loci genómicos seleccionados que están hipermetilados en tejidos de cáncer pero hipometilados en tejidos normales, por ejemplo las regiones promotoras de varios genes supresores de tumores, la relación entre la progresión de cáncer y la respuesta favorable al tratamiento será opuesta a los patrones descritos anteriormente.

Para demostrar la viabilidad de este enfoque, se compararon las densidades de metilación de ADN de muestras de plasma recogidas del enfermo de cáncer antes y después de la retirada quirúrgica del tumor con ADN de plasma obtenido de cuatro sujetos de control sanos.

La Tabla 2200 muestra las densidades de metilación de ADN de cada autosoma y los valores combinados de todos los autosomas de las muestras de plasma preoperatorias y postoperatorias del enfermo de cáncer y los de los cuatro sujetos de control sanos. Para todos los cromosomas, las densidades de metilación de la muestra de ADN de plasma preoperatoria fueron menores que las de la muestra postoperatoria y las muestras de plasma de los cuatro sujetos sanos. La diferencia en las densidades de metilación de ADN de plasma entre las muestras preoperatorias y postoperatorias proporcionó pruebas de apoyo de que las densidades de metilación menores en la muestra de plasma preoperatoria se debían a la presencia de ADN del tumor de CHC.

La inversión de las densidades de metilación de ADN en la muestra de plasma postoperatoria hasta niveles similares a las muestras de plasma de los controles sanos ha sugerido que mucho del ADN derivado de tumor ha desaparecido debido a la retirada quirúrgica de la fuente, es decir el tumor. Estos datos sugieren que la densidad de metilación del plasma preoperatorio como se determina usando datos disponibles de regiones genómicas grandes, tales como todos los autosomas o cromosomas individuales, fue de un nivel de metilación menor que el de los controles sanos para permitir la identificación, es decir el diagnóstico o la exploración, de que el caso de ensayo tenga cáncer.

Los datos del plasma preoperatorio también mostraron un nivel de metilación mucho menor que el del plasma postoperatorio lo que indica que el nivel de metilación del plasma también podría usarse para supervisar la carga tumoral, por lo tanto, para pronosticar y supervisar el progreso del cáncer en el paciente Los valores de referencia pueden determinarse a partir del plasma de controles sanos o personas que están en riesgo de cáncer pero que actualmente no tienen cáncer. Las personas en riesgo de CHC incluyen las que tienen hepatitis B crónica o infección por hepatitis C, las que tienen hemocromatosis y las que tienen cirrosis hepática.

Pueden usarse valores de densidad de metilación de plasma más allá de, por ejemplo menores que, un punto de corte definido basado en los valores de referencia para evaluar si el plasma de una persona no embarazada tiene ADN tumoral o no. Para detectar la presencia de ADN tumoral en circulación hipometilado, el punto de corte puede definirse tan bajo como el 5° o 1° percentiles de los valores de la población de control, o basarse en un número de desviaciones típicas, por ejemplo, 2 o 3 desviaciones típicas (D^t), por debajo de los valores de densidad de metilación medios de los controles, o basarse en la determinación de un múltiplo de la mediana (MoM). Para ADN tumoral hipermetilado, el punto de corte puede definirse más alto que el percentil 95 o 99 de los valores de la población de control, o basarse en un número de desviaciones típicas, por ejemplo, 2 o 3 DT, por encima de los valores de densidad de metilación medios de los controles, o basarse en la determinación de un múltiplo de la mediana (MoM). En una realización, la población de control coincide en edad con el sujeto de ensayo. No es necesario que la coincidencia de edad sea exacta y puede realizarse en bandas de edad (por ejemplo de 30 a 40 años, para un sujeto de ensayo de 35 años).

A continuación se compararon las densidades de mutilación de grupos de 1 Mb entre las muestras de plasma del enfermo de cáncer y los cuatro sujetos de control. Para fines de ilustración, se muestran los resultados del cromosoma 1.

La FIGURA 24A es una representación 2400 que muestra las densidades de metilación del plasma preoperatorio del enfermo de CHC. La FIGURA 24B es una representación 2450 que muestra las densidades de metilación del plasma postoperatorio del enfermo de CHC. Los puntos azules representan los resultados de los sujetos de control, los puntos rojos representan los resultados de la muestra de plasma del enfermo de CHC.

Como se muestra en la FIGURA 24A, las densidades de metilación del plasma preoperatorio del enfermo de CHC fueron menores que las de los sujetos de control para la mayoría de los grupos. Se observaron patrones similares para otros cromosomas. Como se muestra en la FIGURA 24B, las densidades de metilación del plasma postoperatorio del enfermo de CHC fueron similares a las de los sujetos de control para la mayoría de los grupos. Se observaron patrones similares para otros cromosomas.

Para evaluar si un sujeto ensayado tiene cáncer, el resultado del sujeto ensayado se compararía con los valores de un grupo de referencia. En una realización, el grupo de referencia puede comprender varios sujetos sanos. En otra realización, el grupo de referencia puede comprender sujetos con afecciones no malignas, por ejemplo, infección por hepatitis B crónica o cirrosis. La diferencia en las densidades de metilación entre el sujeto ensayado y el grupo de referencia puede después cuantificarse.

En una realización, puede obtenerse un intervalo de referencia a partir de los valores del grupo de control. Después pueden usarse desviaciones en el resultado del sujeto de ensayo de los límites superior o inferior del grupo de referencia para determinar si el sujeto tiene un tumor. Esta cantidad se vería afectada por la concentración fraccional de ADN derivado de tumor en el plasma y la diferencia en el nivel de metilación entre tejidos malignos y no malignos. Una concentración fraccional mayor de ADN derivado de tumor en plasma conduciría a mayores diferencias de densidad de metilación entre la muestra de plasma de ensayo y los controles. Un mayor grado de diferencia en el nivel de metilación de los tejidos malignos y no malignos también se asocia con diferencias de densidad de metilación mayores entre la muestra de plasma de ensayo y los controles. En otra realización más, se eligen grupos de referencia diferentes para sujetos de ensayo de diferentes intervalos de edad.

En otra realización, se calcularon la media y la DT de las densidades de metilación de los cuatro sujetos de control para cada grupo de 1 Mb. Después para grupos correspondientes, se calculó la diferencia entre las densidades de metilación del enfermo de CHC y el valor medio de los sujetos de control. En una realización, esta diferencia se dividió después por la DT del grupo correspondiente para determinar la puntuación z. En otras palabras, la puntuación z representa la diferencia en las densidades de metilación entre las muestras de plasma de ensayo y de control expresadas como un número de DT desde la media de los sujetos de control. Una puntuación z >3 de un grupo indica que el ADN de plasma del enfermo de CHC está más hipermetilado que los sujetos de control en más de 3 DT en ese grupo mientras que una puntuación z de <-3 en un grupo indica que el ADN de plasma del enfermo de CHC está más hipometilado que los sujetos de control en más de 3 Dt en ese grupo.

Las FIGURAS 25A y 25B muestran puntuaciones z de las densidades de metilación de ADN de plasma para las muestras de plasma preoperatorias (representación 2500) y postoperatorias (representación 2550) del enfermo de CHC usando los datos del metiloma de plasma de los cuatro sujetos de control sanos como referencia para el cromosoma 1. Cada punto representa el resultado de un grupo de 1 Mb. Los puntos negros representan los grupos con puntuación z entre -3 y 3. Los puntos rojos representan grupos con puntuación z <-3.

La FIGURA. 26A es una tabla 2600 que muestra datos para puntuaciones z para plasma preoperatorio y postoperatorio. La mayoría de los grupos en el cromosoma 1 (80,9 %) en la muestra de plasma preoperatoria tuvo una puntuación z de <-3 lo que indica que el ADN de plasma preoperatorio del enfermo de CHC estaba significativamente más hipometilado que el de los sujetos de control. Por el contrario, el número de puntos rojos se redujo sustancialmente en la muestra de plasma postoperatoria (8,3 % de los grupos en el cromosoma 1) lo que sugiere que la mayoría del ADN tumoral se había retirado de la circulación debido a resección quirúrgica de la fuente de ADN tumoral en circulación.

La FIGURA 26B es una representación de Circos 2620 que muestra la puntuación z de las densidades de metilación de ADN de plasma para las muestras de plasma preoperatorias y postoperatorias del enfermo de CHC usando los cuatro sujetos de control sanos como referencia para grupos de 1 Mb analizados de todos los autosomas. El anillo más externo muestra los ideogramas de los autosomas humanos. El anillo medio muestra los datos para la muestra de plasma preoperatoria. El anillo más interno muestra los datos para la muestra de plasma postoperatoria. Cada punto representa el resultado de un grupo de 1 Mb. Los puntos negros representan los grupos con puntuaciones z entre -3 y 3. Los puntos rojos representan grupos con puntuaciones z <-3. Los puntos verdes representan grupos con puntuaciones z >3.

La FIGURA 26C es una tabla 2640 que muestra una distribución de las puntuaciones z de los grupos de 1 Mb para el genoma completo en las muestras de plasma tanto preoperatorias como postoperatorias del enfermo de CHC. Los resultados indican que el ADN de plasma preoperatorio del enfermo de CHC estaba más hipometilado que el de los controles para la mayoría de las regiones (85,2 % de los grupos de 1 Mb) en el genoma completo. Por el contrario, la mayoría de las regiones (93,5 % de los grupos de 1 Mb) en la muestra de plasma postoperatoria no mostraron hipermetilación o hipometilación significativas en comparación con los controles. Estos datos indican que mucho del ^aDⁿtumoral, principalmente hipometilado en la naturaleza para este CHC, ya no estaba presente en la muestra de plasma postoperatoria.

En una realización, el número, porcentaje o proporción de grupos con puntuaciones z <-3 pueden usarse para indicar si está presente un cáncer. Por ejemplo, como se muestra en la tabla 2640, 2330 de los 2734 grupos analizados (85,2 %) mostraron puntuaciones z <-3 en el plasma preoperatorio mientras que solamente 171 de los 2734 grupos analizados (6,3 %) mostraron puntuaciones z <-3 en el plasma postoperatorio. Los datos indicaron que la carga de ADN tumoral en el plasma preoperatorio era mucho mayor que en el plasma postoperatorio.

Los valores de puntos de corte del número de grupos pueden determinarse usando métodos estadísticos. Por ejemplo, se esperaría que aproximadamente 0,15 % de los grupos tuvieran una puntuación z de <-3 basándose en una distribución normal. Por lo tanto, el punto de corte del número de grupos puede ser 0,15 % del número total de grupos que se analicen. En otras palabras, si una muestra de plasma de una mujer no embarazada muestra más del 0,15 % de los grupos con puntuaciones z <-3, hay una fuente de ADN hipometilado en el plasma, concretamente cáncer. Por ejemplo, 0,15 % de los 2734 grupos de 1 Mb que se han analizado en este ejemplo es aproximadamente 4 grupos. Usando este valor como punto de corte, las muestras de plasma tanto preoperatorias como postoperatorias contenían ADN derivado de tumor hipometilado, aunque la cantidad es mucho mayor en la muestra de plasma preoperatoria que en la muestra de plasma postoperatoria. Para los cuatro sujetos de control sanos, ninguno de los grupos mostró hipermetilación o hipometilación significativa. Pueden usarse otros valores de punto de corte (por ejemplo 1,1 %) y pueden variar dependiendo del requisito del ensayo que se use. Como otros ejemplos, el porcentaje de punto de corte puede variar basándose en la distribución estadística, así como la sensibilidad deseada y una especificidad aceptable.

En otra realización, el número de punto de corte puede determinarse por análisis de curva de característica operadora receptora (ROC) analizando varios enfermos de cáncer e individuos sin cáncer. Para validar adicionalmente la especificidad de este enfoque, se analizó una muestra de plasma de un paciente que buscaba consulta médica para una afección no maligna (C06). 1,1 % de los grupos tuvieron una puntuación z de <-3. En una realización, pueden usarse diferentes umbrales para clasificar diferentes niveles de estado de enfermedad. Puede usarse un umbral de menor porcentaje para diferenciar el estado sano de las afecciones benignas y un umbral de mayor porcentaje para diferenciar afecciones benignas de tumores malignos.

El rendimiento de diagnóstico para análisis de hipometilación de plasma usando secuenciación paralela masiva parece ser superior al obtenido usando amplificación basada en reacción en cadena de la polimerasa (PCR) de clases específicas de elementos repetitivos, por ejemplo elemento nuclear intercalado largo 1 (LINE-1) (P Tangkijvanich et al. 2007 Clin Chim Acta; 379: 127-133). Una posible explicación de esta observación es que aunque la hipometilación es dominante en el genoma tumoral, tiene algún grado de heterogeneidad de una región genómica a la siguiente.

De hecho, se ha observado que las densidades de metilación de plasma medias de los sujetos de referencia variaron a lo largo del genoma (FIGURA 56). Cada punto rojo en la FIGURA 56 muestra la densidad de metilación media de un grupo de 1 Mb entre 32 sujetos sanos. La representación muestra todos los grupos de 1 Mb analizados en todo el genoma. El número dentro de cada caja representa el número de cromosoma. Se observó que las densidades de metilación medias variaban entre grupos.

Un ensayo sencillo basado en PCR no podría abarcar dicha heterogeneidad de región a región en su algoritmo de diagnóstico. Dicha heterogeneidad ampliaría el intervalo de densidades de metilación observadas entre los individuos sanos. Sería necesaria entonces una mayor magnitud de reducción en la densidad de metilación para que se considerara que una muestra mostraba hipometilación. Esto daría como resultado una reducción de la sensibilidad del ensayo.

Por el contrario, un enfoque basado en secuenciación paralela masiva divide el genoma en grupos de 1 Mb (o grupos de otros tamaños) y mide las densidades de metilación para dichos grupos individualmente. Este enfoque reduce la influencia de las variaciones en las densidades de metilación de línea basal entre diferentes regiones genómicas ya que cada región se compara entre una muestra de ensayo y los controles. De hecho, dentro del mismo grupo, la variación entre individuos a través de los 32 controles sanos fue relativamente pequeña. El 95 % de los grupos tuvieron un coeficiente de variación (CV) a través de los 32 controles sanos de ≤1,8 %. Aun así, para potenciar adicionalmente la sensibilidad para la detección de hipometilación asociada al cáncer, la comparación puede realizarse a través de múltiples regiones genómicas. La sensibilidad se potenciaría ensayando múltiples regiones genómicas debido a que protegería contra el efecto de la variación biológica cuando resulte que la muestra de cáncer no demuestra hipometilación para una región particular cuando se ensaya solamente una región.

El enfoque de comparar las densidades de mutilación de regiones genómicas equivalentes entre controles y muestras de ensayo (por ejemplo, ensayando cada región genómica por separado, y después posiblemente combinando dichos resultados) y realizar esta comparación para múltiples regiones genómicas tiene una relación de señal con respecto a ruido mayor para la detección de hipometilación asociada con cáncer. Este enfoque de secuenciación paralela masiva se muestra como ilustración. Se predeciría que otras metodologías que podrían determinar las densidades de metilación de múltiples regiones genómicas y permitir la comparación de densidades de metilación de regiones correspondientes entre controles y muestras de ensayo conseguirían un efecto similar. Por ejemplo, podrían diseñarse sondas de hibridación o sondas de inversión molecular que podrían dirigirse a las moléculas de ADN de plasma que se originan de regiones genómicas específicas, así como determinar un nivel de metilación de la región para conseguir el efecto deseado.

En otra realización más, la suma de las puntuaciones z para todos los grupos puede usarse para determinar si el cáncer está presente o usarse para la supervisión de los cambios en serie del nivel de metilación de ADN de plasma. Debido a la naturaleza hipometilada general del ADN tumoral, la suma de puntuaciones z sería menor en plasma recogido de un individuo con cáncer que de controles sanos. La suma de puntuaciones z para la muestra de plasma pre y postoperatoria del enfermo de CHC serían -49843,8 y -3132,13, respectivamente.

En otras realizaciones, la mayoría de los restos de citosina no están en el contexto de dinucleótidos de CpG, la proporción de citosina metilada entre restos totales de citosina totales sería relativamente pequeña en comparación con los niveles de metilación estimados en el contexto de dinucleótidos de CpG. Se determinó el nivel de metilación de las muestras tisulares y de plasma obtenidas del enfermo de CHC, así como las cuatro muestras de plasma obtenidas de los controles sanos. Los niveles de metilación se midieron en el contexto de CpG, cualquier citosina, en los contextos de CHG y CHH usando los datos de secuenciación paralela masiva de todo el genoma. H se refiere a restos de adenina, timina o citosina.

La FIGURA 26D es una tabla 2660 que muestra los niveles de metilación del tejido tumoral y muestra de plasma preoperatoria que solapa con algunas de las muestras de plasma de control cuando se usan los contextos de CHH y CHG. Los niveles de metilación del tejido tumoral y la muestra de plasma preoperatoria fueron uniformemente menores en comparación con la capa leucocítica, el tejido hepático no tumoral, la muestra de plasma postoperatoria y las muestras de plasma de control sano en ambos entre las citosinas de CpG y no especificadas. Sin embargo, los datos basados en los CpG metilados, es decir, densidades de metilación, mostraron un intervalo dinámico más amplio que los datos basados en las citosinas metiladas.

En otra realización más, puede determinarse el nivel de 5-hidroximetilcitosina en ADN de plasma. A este respecto, se ha descubierto que una reducción en el nivel de 5-hidroximetilcitosina es un elemento epigenético de ciertos cánceres, por ejemplo melanoma (CG Lian, et al., 2012 Cell; 150: 1135-1146).

Además de CHC, también se ha investigado si este enfoque podría aplicarse a otros tipos de cánceres. Se han analizado las muestras de plasma de 2 pacientes con adenocarcinoma del pulmón (CL1 y CL2), 2 pacientes con carcinoma nasofaríngeo (NPC1 y NPC2), 2 pacientes con cáncer colorrectal (CRC1 y CRC2), 1 paciente con tumor neuroendocrino metastásico (NE1) y 1 paciente con sarcoma de músculo liso metastásico (SMS1). El ADN de plasma de estos sujetos se convirtió por bisulfito y se secuenció usando la plataforma Illumina HiSeq2000 para 50 pb en un extremo. Los cuatro sujetos de control sanos mencionados anteriormente se usaron como grupo de referencia para el análisis de estos 8 pacientes. Se usaron 50 pb de las lecturas de secuencias en un extremo. El genoma completo se dividió en grupos de 1 Mb. La media y DT de la densidad de metilación se calcularon para cada grupo usando los datos del grupo de referencia. Después se expresaron los resultados de los 8 enfermos de cáncer como puntuaciones z, que representan el número de DT de la media del grupo de referencia. Un valor positivo indica que la densidad de metilación del caso de ensayo es menor que la media del grupo de referencia, y viceversa. El número de lecturas de secuencias y la profundidad de secuenciación conseguida por muestra se muestran en la tabla 2780 de la FIGURA 27I.

Las FIGURAS 27A-H muestran representaciones de Circos de densidad de metilación de 8 enfermos de cáncer de acuerdo con realizaciones de la presente invención. Cada punto representa el resultado de un grupo de 1 Mb. Los puntos negros representan los grupos con puntuaciones z entre -3 y 3. Los puntos rojos representan grupos con puntuaciones z <-3. Los puntos verdes representan grupos con puntuaciones z >3. El intervalo entre dos líneas consecutivas representa una diferencia de puntuación z de 20.

Se observó hipometilación significativa en múltiples regiones a través de los genomas para pacientes con la mayoría de tipos de cánceres, incluyendo cáncer de pulmón, carcinoma nasofaríngeo, cáncer colorrectal y tumor neuroendocrino metastásico. Resulta interesante que, además de la hipometilación, se observó hipermetilación significativa en múltiples regiones a través del genoma en el caso de sarcoma de músculo liso metastásico. El origen embrionario del sarcoma de músculo liso es el mesodermo mientras que el origen embrionario de los otros tipos de cánceres en los 7 pacientes restantes es el ectodermo. Por lo tanto, es posible que el patrón de metilación de ADN del sarcoma pueda ser diferente de el del carcinoma.

Como puede verse a partir de este caso, el patrón de metilación de ADN de plasma puede ser útil para diferenciar diferentes tipos de cáncer, lo que en este ejemplo es una diferenciación de carcinoma y sarcoma. Estos datos también sugieren que el enfoque podría usarse para detectar hipermetilación aberrante asociada con el tumor maligno. Para estos 8 casos, solamente estuvieron disponibles muestras de plasma y no se hubo analizado ningún tejido tumoral. Esto mostró que incluso sin el perfil de metilación anterior o los niveles de metilación del tejido tumoral, puede detectarse fácilmente ADN derivado de tumor en plasma usando los métodos descritos.

La FIGURA 27J es una tabla 2790 que es una tabla que muestra una distribución de los puntuaciones z de los grupos de 1 Mb para el genoma completo en plasma de pacientes con diferentes tumores malignos. Los porcentajes de grupos con puntuación z <-3, -3 a 3 y >3 se muestran para cada caso. Más del 5 % de los grupos tuvieron una puntuación z de <-3 para todos los casos. Por lo tanto, si se usa un punto de corte de 5 % de los grupos que están hipometilados de forma significativa para clasificar una muestra que es positiva para el cáncer, entonces todos estos casos se clasificarían como positivos para cáncer. Los resultados de los inventores muestran que la hipometilación probablemente sea un fenómeno general para diferentes tipos de cánceres y el análisis de metiloma de plasma sería útil para detectar diferentes tipos de cánceres.

D. Método

La FIGURA 28 es un diagrama de flujo del método 2800 para analizar una muestra biológica de un organismo para determinar una clasificación de un nivel de cáncer de acuerdo con realizaciones de la presente invención. La muestra biológica incluye ADN que se origina de células normales y puede incluir potencialmente ADN de células asociadas con cáncer. Al menos parte del ADN puede estar sin células en la muestra biológica.

En el bloque 2810, se analiza una pluralidad de moléculas de ADN de la muestra biológica. El análisis de una molécula de ADN puede incluir determinar una ubicación de la molécula de ADN en un genoma del organismo y determinar si la molécula de ADN está metilada en uno o más sitios. El análisis puede realizarse recibiendo lecturas de secuencias de una secuenciación sensible a metilación, y por lo tanto el análisis puede realizarse solamente en datos previamente obtenidos del ADN. En otras realizaciones, el análisis puede incluir la secuenciación real u otras etapas activas para obtener los datos.

En el bloque 2820, se determina un número respectivo de moléculas de ADN que están metiladas en el sitio para cada uno de una pluralidad de sitios. En una realización, los sitios son sitios de CpG, y pueden ser solamente ciertos sitios de CpG, como se selecciona usando uno o más criterios mencionados en el presente documento. El número de moléculas de ADN que están metiladas es equivalente a la determinación del número que están desmetiladas una vez que se ha realizado normalización usando un número total de moléculas de ADN analizadas en un sitio particular, por ejemplo, un número total de lecturas de secuencias. Por ejemplo, un aumento en la densidad de metilación de CpG de una región es equivalente a una reducción en la densidad de CpG desmetilados de la misma región.

En el bloque 2830, se calcula un primer nivel de metilación basado en los números respectivos de moléculas de ADN metiladas en la pluralidad de sitios. El primer nivel de metilación puede corresponder a una densidad de metilación que se determina basándose en el número de moléculas de ADN correspondientes a la pluralidad de sitios. Los sitios pueden corresponder a una pluralidad de loci o solamente un locus.

En el bloque 2840, el primer nivel de metilación se compara con un primer valor de punto de corte. El primer valor de punto de corte puede ser un nivel de metilación de referencia o estar relacionado con un nivel de metilación de referencia (por ejemplo, una distancia específica de un nivel normal). El nivel de metilación de referencia puede determinarse a partir de muestras de individuos sin cáncer o de loci o el organismo que se sabe que no están asociados con un cáncer del organismo. El primer valor de punto de corte puede establecerse a partir de un nivel de metilación de referencia determinado a partir de una muestra biológica previa del organismo obtenido antes de ensayarse la muestra biológica.

En una realización, el primer valor de punto de corte es una distancia específica (por ejemplo, un número específico de desviaciones típicas) de un nivel de metilación de referencia establecido a partir de una muestra biológica obtenida de un organismo sano. La comparación puede realizarse determinando una diferencia entre el primer nivel de metilación y un nivel de metilación de referencia, y comparando después la diferencia con un umbral correspondiente al primer valor de punto de corte (por ejemplo, para determinar si el nivel de metilación es estadísticamente diferente al nivel de metilación de referencia).

En el bloque 2850, se determina una clasificación de un nivel de cáncer basándose en la comparación. Los ejemplos de un nivel de cáncer incluyen si el sujeto tiene cáncer o una afección premaligna, o una mayor probabilidad de desarrollar cáncer. En una realización, el primer valor de punto de corte puede determinarse a partir de una muestra previamente obtenida del sujeto (por ejemplo, un nivel de metilación de referencia puede determinarse a partir de la muestra previa).

En algunas realizaciones, el primer nivel de metilación puede corresponder a un número de regiones cuyos niveles de metilación superan un valor umbral. Por ejemplo, puede identificarse una pluralidad de regiones de un genoma del organismo. Las regiones pueden identificarse usando criterios mencionados en el presente documento, por ejemplo, de ciertas longitudes o cierto número de sitios. Pueden identificarse uno o más sitios (por ejemplo, sitios de CpG) dentro de cada una de las regiones. Puede calcularse un nivel de mutilación regional para cada región. El primer nivel de metilación es para una primera región. Cada uno de los niveles de metilación regional se compara con un valor de punto de corte regional respectivo, que puede ser el mismo o variar entre regiones. El valor de punto de corte regional para la primera región es el primer valor de punto de corte. Los valores de punto de corte regional respectivos pueden ser una cantidad específica (por ejemplo, 0,5) de un nivel de metilación de referencia, contando de este modo solamente regiones que tengan una diferencia significativa con respecto a una referencia, lo que puede determinarse a partir de sujetos sin cáncer.

Puede determinarse un primer número de regiones cuyo nivel de metilación regional supera el valor de punto de corte regional respectivo, y compararse con un valor umbral para determinar la clasificación. En una implementación, el valor umbral es un porcentaje. La comparación del primer número con un valor umbral puede incluir dividir el primer número de regiones por un segundo número de regiones (por ejemplo, todas las regiones) antes de comparar con el valor umbral, por ejemplo, como parte de un proceso de normalización.

Como se ha descrito anteriormente, puede usarse una concentración fraccional de ADN tumoral en la muestra biológica para calcular el primer valor de punto de corte. Puede estimarse simplemente que la concentración fraccional es mayor que un valor mínimo, mientras que puede marcarse una muestra con una concentración fraccional menor que el valor mínimo, por ejemplo, como no adecuada para su análisis. El valor mínimo puede determinarse basándose en una diferencia esperada en los niveles de metilación para un tumor en relación con un nivel de metilación de referencia. Por ejemplo, si una diferencia es de 0,5 (por ejemplo, como se usa como un valor de punto corte), entonces se requeriría que una cierta concentración tumoral fuera suficientemente alta para ver esta diferencia.

Pueden aplicarse técnicas específicas del método 1300 para el método 2800. En el método 1300, las variaciones del número de copias pueden determinarse para un tumor (por ejemplo, cuando la primera región cromosómica de un tumor pueda ensayarse con respecto a tener un cambio del número de copias relativo a una segunda región cromosómica del tumor). Por lo tanto, el método 1300 puede suponer que existe un tumor. En el método 2800, puede ensayarse una muestra con respecto a si hay un indicio de la existencia de ningún tumor en absoluto, independientemente de cualquier característica del número de copias. Algunas técnicas de los dos métodos pueden ser similares. Sin embargo, los valores de punto de corte y parámetros de metilación (por ejemplo, niveles de metilación normalizados) para el método 2800 pueden detectar una diferencia estadística a partir de un nivel de metilación de referencia para ADN no de cáncer en oposición a una diferencia de un nivel de metilación de referencia para una mezcla de ADN de cáncer y ADN no de cáncer teniendo algunas regiones posiblemente variaciones del número de copias. Por lo tanto, los valores de referencia para el método 2800 pueden determinarse a partir de muestras sin cáncer, tales como de organismos sin cáncer o de tejido no canceroso del mismo paciente (por ejemplo, plasma tomado previamente o de muestras adquiridas de forma contemporánea que se sabe que no tienen cáncer, lo que puede determinarse a partir de ADN celular).

E. Predicción de la concentración fraccional mínima de ADN tumoral para detectar usando análisis de metilación de ADN de plasma

Un modo de medir la sensibilidad del enfoque para detectar cáncer usando el nivel de metilación de ADN de plasma está relacionado con la concentración de ADN derivado de tumor fraccional mínima que se requiere para revelar un cambio en el nivel de metilación de ADN de plasma en comparación con los de controles. La sensibilidad del ensayo también depende del alcance de la diferencia en la metilación de ADN entre el tejido tumoral y los niveles de metilación de ADN de plasma de línea basal en controles sanos o ADN de células sanguíneas. Las células sanguíneas son la fuente predominante de ADN en el plasma de individuos sanos. Cuanto mayor sea la diferencia, más fácilmente se podrá diferenciar los enfermos de cáncer de los individuos sin cáncer y esto se reflejaría como un límite de detección menor de derivado tumoral en plasma y una mayor sensibilidad clínica en la detección de los enfermos de cáncer. Además, las variaciones en la metilación de ADN de plasma en los sujetos sanos o en sujetos con diferentes edades (G Hannum et al., 2013 Mol Cell; 49: 359-367) también afectarían a la sensibilidad de detección de los cambios de metilación asociados con la presencia de un cáncer Una menor variación en la metilación de ADN de plasma en los sujetos sanos facilitaría la detección del cambio causado por la presencia de una cantidad pequeña de ADN derivado de cáncer.

La FIGURA 29A es una representación 2900 que muestra la distribución de las densidades de metilación en sujetos de referencia suponiendo que esta distribución sigue una distribución normal. Este análisis se basa en que cada muestra de plasma solamente proporciona un valor de densidad de metilación, por ejemplo, la densidad de metilación de todos los autosomas o de un cromosoma particular. Ilustra cómo la especificidad del análisis se vería afectada. En una realización, un punto de corte de 3 DT por debajo de la media de la densidad de metilación de ADN de los sujetos de referencia se usa para determinar si una muestra de ensayo está significativamente más hipometilada que muestras de los sujetos de referencia. Cuando se usa este punto de corte, se espera que aproximadamente 0,15 % de los sujetos sin cáncer tengan resultados falsos positivos de clasificación como enfermos de cáncer dando como resultado una especificidad del 99,85 %.

La FIGURA 29B es una representación 2950 que muestra las distribuciones de densidades de metilación en sujetos de referencia y enfermos de cáncer. El valor de punto corte está 3 DT por debajo de la media de las densidades de mutilación de los sujetos de referencia. Si la media de las densidades de mutilación de los enfermos de cáncer está 2 DT por debajo del punto de corte (es decir 5 DT por debajo de la media de los sujetos de referencia), se esperaría que el 97,5 % de los sujetos con cáncer tuvieran una densidad de metilación por debajo del valor de punto de corte. En otras palabras, la sensibilidad esperada sería del 97,5 % si se proporciona un valor de densidad de metilación para cada sujeto, por ejemplo cuando se analiza la densidad de metilación total del genoma completo, de todos los autosomas o de un cromosoma particular. La diferencia entre las densidades de metilación medias de las dos poblaciones se ve afectada por dos factores, concretamente el grado de diferencia en el nivel de metilación entre tejidos cancerosos y no cancerosos y la concentración fraccional de ADN derivado de tumor en la muestra de plasma. Cuanto mayores sean los valores de estos dos parámetros, mayor será la diferencia en el valor de las densidades de metilación de estas dos poblaciones. Además, cuanto menor sea la DT de las distribuciones de densidades de metilación de las dos poblaciones, menor será el solapamiento de las distribuciones de las densidades de metilación de las dos poblaciones.

Aquí se usa un ejemplo hipotético para ilustrar este concepto. Supongamos que la densidad de metilación del tejido tumoral es de aproximadamente 0,45 y que la del ADN de plasma de los sujetos sanos es de aproximadamente 0,7. Estos valores supuestos son similares a los obtenidos del enfermo de CHC de los inventores donde la densidad de metilación general de los autosomas es del 42,9 % y la densidad de metilación media de los autosomas para las muestras de plasma de controles sanos fue del 71,6 %. Suponiendo que el CV de la medición de la densidad de metilación de ADN de plasma para el genoma completo es del 1 %, el valor de punto de corte sería de 0,7 x (100 % -3 x 1 %) = 0,679. Para conseguir una sensibilidad del 97,5 %, es necesario que la densidad de metilación media del ADN de plasma para los enfermos de cáncer sea de aproximadamente 0,679 - 0,7 x (2 x 1 %) = 0,665. Si f representa la concentración fraccional de ADN derivado de tumor en la muestra de plasma, entonces f puede calcularse como (0,7 - 0,45) x f = 0,7 - 0,665. Por lo tanto, f es aproximadamente 14 %. A partir de este cálculo, se ha estimado que la concentración fraccional mínima que puede detectarse en el plasma es del 14 % para conseguir una sensibilidad de diagnóstico del 97,5 % si la densidad de metilación total del genoma completo se usa como el parámetro de diagnóstico.

A continuación se realizó este análisis sobre los datos obtenidos del enfermo de CHC. Para esta ilustración, solamente se preparó una medición de densidad de metilación basada en el valor estimado a partir de todos los autosomas para cada muestra. La densidad de metilación media fue del 71,6 % entre las muestras de plasma obtenidas de los sujetos sanos. La DT de las densidades de metilación de estas cuatro muestras fue del 0,631 %. Por lo tanto, sería necesario que el valor de punto de corte para la densidad de metilación de plasma fuera de 71,6 % - 3 x 0,631 % = 69,7 % para alcanzar una puntuación z <-3 y una especificidad de 99,85 %. Para conseguir una sensibilidad del 97,5 %, sería necesario que la densidad de metilación de plasma media de los pacientes con cáncer estuviera 2 DT por debajo del punto de corte, es decir, 68,4 %. Ya que la densidad de metilación del tejido tumoral fue del 42,9 % y usando la fórmula: P=BKG x (1-f) TUM x f, sería necesario que f fuera al menos 11,1 %.

En otra realización, las densidades de metilación de diferentes regiones genómicas pueden analizarse por separado, por ejemplo, como se muestra en las FIGURAS 25A o 26B. En otras palabras, se realizaron múltiples mediciones del nivel de metilación para cada muestra. Como se muestra posteriormente, podría detectarse hipometilación significativa a una concentración de ADN tumoral fraccional mucho menor en plasma y por lo tanto se potenciaría el rendimiento de diagnóstico del análisis de metilación de ADN de plasma para detección de cáncer. Puede contarse el número de regiones genómicas que muestran una desviación significativa en las densidades de metilación con respecto a la población de referencia. Después puede compararse el número de regiones genómicas con un valor de punto de corte para determinar si hay una hipometilación significativa general de ADN de plasma a través de la población de regiones genómicas investigadas, por ejemplo, los grupos de 1 Mb del genoma completo. El valor de punto de corte puede establecerse por el análisis de un grupo de sujetos de referencia sin un cáncer o derivarse matemáticamente, por ejemplo, de acuerdo con la función de distribución normal.

La FIGURA 30 es una representación 3000 que muestra la distribución de densidades de metilación del ADN de plasma de sujetos sanos y enfermos de cáncer. La densidad de metilación de cada grupo de 1 Mb se compara con los valores correspondientes del grupo de referencia. Se determinó el porcentaje de grupos que mostraban hipometilación significativa (3 DT por debajo de la media del grupo de referencia). Se usó un punto de corte de 10 % que está significativamente hipometilado para determinar si está presente ADN derivado de tumor en la muestra de plasma. Pueden usarse también otros valores de punto de corte tales como 5 %, 15 %, 20 %, 25 %, 30 %, 35 %, 40 %, 45 %, 50 %, 60 %, 70 %, 80 % o 90 % según la sensibilidad y especificidad deseada del ensayo.

Por ejemplo, para clasificar que una muestra contiene ADN derivado de tumor, se puede usar 10 % de los grupos de 1 Mb que muestran hipometilación significativa (puntuación z <-3) como un punto de corte. Si hay más del 10 % de los grupos que están significativamente más hipometilados que el grupo de referencia, entonces la muestra se clasifica como positiva para el ensayo de cáncer. Para cada grupo de 1 Mb, se usa un punto de corte de 3 DT por debajo de la densidad de metilación media del grupo de referencia para definir una muestra como significativamente más hipometilada. Para cada uno de los grupos de 1 Mb, si la densidad de metilación de ADN de plasma media de los enfermos de cáncer está 1,72 DT por debajo de las densidades de metilación de ADN de plasma medias de los sujetos de referencia, entonces hay una probabilidad del 10 % de que el valor de densidad de metilación de cualquier grupo particular de un enfermo de cáncer sea menor que el punto de corte (es decir puntuación z <-3) y proporciona un resultado positivo. Por lo tanto, si se observan todos los grupos de 1 Mb para el genoma completo, entonces se esperaría que aproximadamente el 10 % de los grupos mostraran resultados positivos de tener densidades de metilación significativamente menores (es decir puntuaciones z <-3). Suponiendo que la densidad de metilación general del ADN de plasma de los sujetos sanos es de aproximadamente 0,7 y el coeficiente de variación (CV) de la medición de la densidad de metilación de ADN de plasma para cada grupo de 1 Mb es del 1 %, sería necesario que la densidad de metilación media del ADN de plasma de los enfermos de cáncer fuera de 0,7 x (100 % - 1,72 x 1 %) = 0,68796. f puede ser la concentración fraccional de ADN derivado de tumor en plasma para conseguir esta densidad de metilación de ADN de plasma media. Suponiendo que la densidad de metilación del tejido tumoral es 0,45, entonces f puede calcularse usando la ecuación

donde MPref representa la densidad de metilación media de ADN de plasma en los individuos de referencia; Mtumor

representa la densidad de metilación del tejido tumoral en el enfermo de cáncer;

representa la densidad de metilación media de ADN de plasma en los enfermos de cáncer.

Usando esta ecuación, (0,7-0,45) x f = 0,7 - 0,68796, por lo tanto, la concentración fraccional mínima que puede detectarse usando este enfoque se deduciría como 4,8 %. La sensibilidad puede potenciarse adicionalmente reduciendo el porcentaje de punto de corte de grupos que están significativamente más hipometilados, por ejemplo, del 10 % al 5 %.

Como se ha mostrado en el ejemplo anterior, la sensibilidad de este método se determina por el grado de diferencia en el nivel de metilación entre tejidos cancerosos y no cancerosos, por ejemplo, células sanguíneas. En una realización, solamente se seleccionan las regiones cromosómicas que muestran una gran diferencia en las densidades de metilación entre el ADN de plasma de los sujetos sin cáncer y el tejido tumoral. En una realización, solamente se seleccionan regiones con una diferencia en la densidad de metilación de >0,5. En otras realizaciones se puede usar una diferencia de 0,4, 0,6, 0,7, 0,8 o 0,9 para seleccionar las regiones adecuadas. En otras realizaciones más, el tamaño físico de las regiones genómicas no es fijo. En su lugar, las regiones genómicas se definen, por ejemplo, basándose en una profundidad de lectura fija o un número fijo de sitios de CpG. Los niveles de metilación en una multitud de estas regiones genómicas se evalúan para cada muestra.

La FIGURA 31 es un gráfico 3100 que muestra la distribución de las diferencias en las densidades de metilación entre la media del ADN de plasma de sujetos sanos y el tejido tumoral del enfermo de CHC. Un valor positivo significa que la densidad de metilación es mayor en el ADN de plasma de los sujetos sanos y un valor negativo significa que la densidad de metilación es mayor en el tejido tumoral.

En una realización, pueden seleccionarse los grupos con la mayor diferencia entre la densidad de metilación de los tejidos cancerosos y no cancerosos, por ejemplo, los que tengan una diferencia de >0,5, independientemente de si el tumor está hipometilado o hipermetilado para estos grupos El límite de detección de concentración fraccional de ADN derivado de tumor en plasma puede reducirse centrándose en estos grupos debido a las mayores diferencias entre las distribuciones de los niveles de metilación de ADN de plasma entre sujetos con cáncer y sin cáncer dada la misma concentración fraccional de ADN derivado de tumor en el plasma. Por ejemplo, si solamente se usan grupos con diferencias >0,5 y se adopta un punto de corte de 10 % de los grupos que están significativamente más hipometilados para determinar si un individuo sometido a ensayo tiene cáncer, la concentración fraccional mínima (f) de ADN derivado de tumor detectado puede calcularse usando la siguiente ecuación: ( MPmf -Mt umor) x f= MPref-

MPc¿"*r , donde MPmf representa la densidad de metilación media de ADN de plasma en los individuos de referencia;

Mtumor representa la densidad de metilación del tejido tumoral en el enfermo de cáncer; y

Cuando la diferencia en la densidad de metilación entre el plasma de los sujetos de referencia y los tejidos tumorales es de al menos 0,5, entonces, se tiene 0,5 x f = 0,7 - 0,68796 y f = 2,4 %. Por lo tanto, centrándose en los grupos con una mayor diferencia en la densidad de metilación entre tejidos cancerosos y no cancerosos, el límite inferior de ADN derivado de tumor fraccional puede reducirse del 4,8 % al 2,4 %. La información con respecto a qué grupos mostrarían mayores grados de diferencias de metilación entre tejidos cancerosos y no cancerosos, por ejemplo, células sanguíneas, podría determinarse a partir de tejidos tumorales del mismo órgano o el mismo tipo histológico obtenido de otros individuos.

En otra realización, puede obtenerse un parámetro de la densidad de metilación del ADN de plasma de todos los grupos y teniendo en cuenta la diferencia en las densidades de metilación entre tejidos cancerosos y no cancerosos. Puede darse un mayor peso a grupos con mayor diferencia. En una realización, la diferencia en la densidad de mutilación entre tejido canceroso y no canceroso de cada grupo puede usarse directamente como el peso del grupo particular en el cálculo del parámetro final.

En otra realización más, diferentes tipos de cáncer pueden tener diferentes patrones de mutilación en el tejido tumoral. Puede obtenerse un perfil de peso específico de cáncer del grado de metilación del tipo específico de cáncer.

En otra realización más, la relación entre grupos de la densidad de metilación puede determinarse en sujetos con y sin cáncer. En la Figura 8, se puede observar que en un número pequeño de grupos, los tejidos tumorales estaban más metilados que el ADN de plasma de los sujetos de referencia. Por lo tanto, pueden seleccionarse los grupos con los valores de diferencia más extremos, por ejemplo diferencia >0,5 y diferencia <0. La relación de la densidad de metilación de estos grupos puede usarse después para indicar si el individuo sometido a ensayo tiene cáncer. En otras realizaciones, la diferencia y el cociente de la densidad de metilación de diferentes grupos pueden usarse como parámetros para indicar la relación entre grupos.

Se evaluó adicionalmente la sensibilidad de detección del enfoque para detectar o evaluar el tumor usando las densidades de metilación de múltiples regiones genómicas como se ilustra por los datos obtenidos del enfermo de CHC. En primer lugar, se mezclaron lecturas del plasma preoperatorio con las obtenidas de las muestras de plasma de los controles sanos para simular muestras de plasma que contenían una concentración de ADN tumoral fraccional que variaba de 20 % a 0,5 %. Después se puntuó el porcentaje de grupos de 1 Mb (de 2.734 grupos en el genoma completo) con densidades de metilación equivalentes a puntuaciones z <-3. Cuando la concentración de ADN tumoral fraccional en plasma fue del 20 %, 80,0 % de los grupos mostraron hipometilación significativa. Los datos correspondientes para concentración de ADN tumoral fraccional en plasma de 10 %, 5 %, 2 %, 1 % y 0,5 % fueron de 67,6 %, 49,7 %, 18,9 %, 3,8 % y 0,77 % de los grupos que mostraron hipometilación, respectivamente. Ya que el límite teórico del número de grupos que muestran puntuaciones z <-3 en las muestras de control es de 0,15 %, los datos de los inventores muestran que hubo aún más grupos (0,77 %) más allá del límite de punto de corte teórico incluso cuando la concentración fraccional tumoral fue de solamente 0,5 %.

La FIGURA 32A es una tabla 3200 que muestra el efecto de reducir la profundidad de secuenciación cuando la muestra de plasma contenía 5 % o 2 % de ADN tumoral. Aún pudo detectarse una alta proporción de grupos (>0,15 %) que mostraban hipometilación significativa cuando la profundidad de secuenciación media fue de solamente 0,022 veces el genoma haploide.

La FIGURA 32B es un gráfico 3250 que muestra las densidades de metilación de los elementos repetidos y regiones no repetidas en el plasma de los cuatro sujetos de control sanos, la capa leucocítica, el tejido hepático normal, el tejido tumoral, las muestras de plasma preoperatorio y de plasma postoperatorio del enfermo de CHC. Se puede observar que los elementos repetidos estaban más metilados (mayor densidad de metilación) que las regiones no repetidas en tejidos tanto cancerosos como no cancerosos. Sin embargo, la diferencia en la metilación entre elementos repetidos y regiones no repetidas fue mayor en los tejidos no cancerosos y el ADN de plasma de los sujetos sanos cuando se compararon con los tejidos tumorales.

Como resultado, el ADN de plasma del enfermo de cáncer tuvo una mayor reducción en la densidad de metilación en los elementos repetidos que en las regiones no repetidas. La diferencia en la densidad de metilación de ADN de plasma entre la media de los cuatro controles sanos y el enfermo de CHC fue de 0,163 y 0,088 para los elementos repetidos y las regiones no repetidas, respectivamente. Los datos en las muestras de plasma preoperatorias y postoperatorias también mostraron que el intervalo dinámico en el cambio en la densidad de metilación fue mayor en las regiones repetidas que en las no repetidas. En una realización, la densidad de metilación de ADN de plasma de los elementos repetidos puede usarse para determinar si un paciente está aquejado de cáncer o para supervisión de la progresión de enfermedad.

Como se ha analizado anteriormente, la variación en las densidades de metilación en el plasma de los sujetos de referencia también afectaría a la precisión de la diferenciación de enfermos de cáncer de individuos sin cáncer. Cuanto más ajustada sea la distribución de densidades de metilación (es decir menor desviación típica), con mayor precisión se podrán diferenciar los sujetos con cáncer de los sujetos sin cáncer. En otra realización, el coeficiente de variación (CV) de las densidades de metilación de los grupos de 1 Mb puede usarse como un criterio para seleccionar los grupos con baja variabilidad de densidades de metilación de ADN de plasma en el grupo de referencia. Por ejemplo, solamente se seleccionan grupos con CV <1 %. Otros valores, por ejemplo 0,5 %, 0,75 %, 1,25 % y 1,5 % también pueden usarse como criterios para seleccionar los grupos con baja variabilidad en la densidad de metilación. En otra realización más, los criterios de selección pueden incluir tanto el CV del grupo como la diferencia en la densidad de metilación entre tejidos cancerosos y no cancerosos.

La densidad de metilación también puede usarse para estimar la concentración fraccional de ADN derivado de tumor en una muestra de plasma cuando se conoce la densidad de metilación del tejido tumoral. Esta información puede obtenerse por el análisis del tumor del paciente o de la investigación de los tumores de varios pacientes que tienen el mismo tipo de cáncer. Como se ha analizado anteriormente, la densidad de metilación de plasma (P) puede expresarse usando la siguiente ecuación: P = BKG x (1 - f) + TUM x f donde BKG es la densidad de metilación de fondo de las células sanguíneas y otros órganos, TUM es la densidad de mutilación en el tejido tumoral, y f es la concentración fraccional de ADN derivado de tumor en la muestra de plasma. Esto puede reescribirse como:

Los valores de BKG pueden determinarse analizando la muestra de plasma del paciente en un punto temporal en el que no está presente el cáncer o de la investigación de un grupo de referencia de individuos sin cáncer. Por lo tanto, después de medir la densidad de metilación del plasma, puede determinarse f.

F. Combinación con otros métodos

Pueden usarse enfoques de análisis de metilación descritos en el presente documento en combinación con otros métodos que se basan en los cambios genéticos de ADN derivado de tumor en plasma. Los ejemplos de dichos métodos incluyen el análisis con respecto a aberraciones cromosómicas asociadas con cáncer (KCA Chan et al., 2013 Clin Chem; 59: 211-224; RJ Leary et al., 2012 Sci Transl Med; 4: 162ra154) y variaciones de un único nucleótido asociadas con cáncer en plasma (KCA Chan et al., 2013 Clin Chem; 59: 211-224). Existen ventajas para el enfoque de análisis de metilación frente a los enfoques genéticos.

Como se muestra en la FIGURA 21A, la hipometilación del ADN tumoral es un fenómeno global que implica regiones distribuidas por casi todo el genoma completo. Por lo tanto, los fragmentos de ADN de todas las regiones cromosómicas serían informativos con respecto a la contribución potencial del ADN hipometilado derivado de tumor al ADN del plasma/suero en el paciente. Por el contrario, las aberraciones cromosómicas (bien amplificación o bien deleción de una región cromosómica) solamente están presentes en algunas regiones cromosómicas y los fragmentos de ADN de las regiones sin una aberración cromosómica en el tejido tumoral no serían informativos en el análisis (KCA Chan et al. 2013 Clin Chem; 59: 211-224). De forma similar solamente se observan algunas miles de alteraciones de nucleótidos individuales en cada genoma de cáncer (KCA Chan et al., 2013 Clin Chem; 59: 211 224). Los fragmentos de ADN que no solapan con estos cambios de nucleótidos individuales no serían informativos en la determinación de si está presente ^aDⁿderivado de tumor en el plasma. Por lo tanto, este enfoque de análisis de metilación es potencialmente más rentable que los enfoques genéticos para detectar cambios asociados con cáncer en la circulación.

En una realización, la rentabilidad del análisis de metilación de ADN de plasma puede potenciarse adicionalmente enriqueciendo con respecto a fragmentos de ADN de las regiones más informativas, por ejemplo regiones con mayor diferencia de metilación diferencial entre tejidos cancerosos y no cancerosos. Los ejemplos de los métodos para enriquecer estas regiones incluyen el uso de sondas de hibridación (por ejemplo sistema Nimblegen SeqCap y sistema de enriquecimiento de diana Agilent SureSelect), amplificación por PCR e hibridación en fase sólida.

G. Análisis específico de tejidos/donantes

Las células derivadas de tumor invaden y metastatizan en órganos adyacentes o distantes. Los tejidos invadidos o focos metastásicos aportan ADN al plasma como resultado de la muerte celular. Analizando el perfil de metilación de ADN en el plasma de enfermos de cáncer y detectando la presencia de identificaciones de metilación específicas de tejido, se podrían detectar los tipos de tejidos que están implicados en el proceso de enfermedad. Este enfoque proporciona una exploración anatómica no invasiva de los tejidos implicados en el proceso canceroso para ayudar en la identificación de los órganos implicados como los sitios primarios y metastásicos. La supervisión de las concentraciones relativas de las identificaciones de metilación de los órganos implicados en plasma también permitiría evaluar la carga tumoral de esos órganos y determinar si el proceso de cáncer en ese órgano está deteriorándose o mejorando o se ha curado. Por ejemplo, si un gen X está específicamente metilado en el hígado, entonces se esperaría que la implicación metastásica del hígado por un cáncer (por ejemplo cáncer colorrectal) aumentara la concentración de secuencias metiladas del gen X en el plasma. Habría también otra secuencia o grupos de secuencias con características de metilación similares al gen X. Se podría después combinar los resultados de dichas secuencias. Son aplicables consideraciones similares a otros tejidos, por ejemplo el cerebro, huesos, pulmones y riñones, etc.

Por otro lado, se sabe que el ADN de diferentes órganos muestra diferentes identificaciones de metilación específicas de tejido (BW Futscher et al., 2002 Nat Genet; 31: 175-179; SSC Chim et al., 2008 Clin Chem; 54: 500 511). Por lo tanto, puede usarse el perfil de metilación en plasma para dilucidar la contribución de tejidos de diversos órganos al plasma. La dilucidación de dicha contribución puede usarse para evaluar el daño orgánico, ya que se cree que se libera ADN de plasma cuando mueren las células. Por ejemplo, la patología hepática tal como hepatitis (por ejemplo por virus, procesos autoinmunitarios, etc.) o hepatoxicidad (por ejemplo sobredosis de fármacos (tal como paracetamol) o toxinas (tal como alcohol) provocada por fármacos está asociada con el daño a células hepáticas y se esperaría que estuviera asociada con un aumento del nivel de ADN derivado del hígado en el plasma. Por ejemplo, si un gen X está específicamente metilado en el hígado, entonces se esperaría que la patología hepática aumentara la concentración de secuencias metiladas del gen X en el plasma. Por el contrario, si un gen Y está específicamente hipometilado en el hígado, entonces se esperaría que la patología hepática redujera la concentración de secuencias metiladas del gen Y en el plasma. En otra realización más, el gen X o Y puede reemplazarse por cualquier secuencia genómica que pueda no ser un gen y que muestre metilación diferencial en diferentes tejidos dentro del cuerpo.

Las técnicas descritas en el presente documento también podrían aplicarse a la evaluación de ADN derivado de donante en el plasma de receptores de trasplante de órganos (YMD Lo et al., 1998 Lancet; 351: 1329-1330). Se han usado diferencias polimórficas entre el donante y el receptor para distinguir el ADN derivado de donante del ADN derivado de receptor en el plasma (YW Zheng et al., 2012 Clin Chem; 58: 549-558). Los inventores proponen que las identificaciones de metilación específicas de tejido del órgano trasplantado también podrían usarse como un método para detectar el ADN del donante en el plasma del receptor.

Supervisando la concentración del ADN del donante, se podría evaluar de forma no invasiva el estado del órgano trasplantado. Por ejemplo, el rechazo de trasplante se asocia con una mayor tasa de muerte celular y por lo tanto la concentración del ADN del donante en el plasma del receptor (o suero), como se refleja por la identificación de metilación del órgano trasplantado, aumentaría en comparación con el momento en que el paciente está en una condición estable o cuando se compara con otros receptores de trasplante estables o controles sanos sin trasplante. De forma similar a lo que se ha descrito para el cáncer, el ADN derivado del donante podría identificarse en el plasma de receptores de trasplante detectando todos o algunos de los elementos característicos, incluyendo diferencias polimórficas, ADN de tamaño más corto para los órganos sólidos trasplantados (YW Zheng et al. al. 2012 Clin Chem; 58: 549-558) y perfil de metilación específico de tejido.

H. Normalización de la metilación basándose en el tamaño

Como se ha descrito anteriormente y en Lun et al. (FMF Lun et al. Clin. Chem. 2013; doi:10.1373/clinchem.2013.212274), la densidad de metilación (por ejemplo, de ADN de plasma) se correlaciona con el tamaño de los fragmentos de ADN. La distribución de las densidades de metilación para fragmentos de ADN de plasma más cortos fue significativamente menor que la de fragmentos más largos. Los inventores proponen que algunas afecciones no cancerosas (por ejemplo, lupus eritematoso sistémico (LES)) con patrones de fragmentación anómalos de ADN de plasma pueden mostrar una hipometilación aparente de ADN de plasma debido a la presencia de fragmentos de ADN de plasma cortos más abundantes, que están menos metilados. En otras palabras, la distribución de tamaños de ADN de plasma puede ser un factor de confusión para la densidad de metilación para el ADN de plasma.

La FIGURA 34A muestra una distribución de tamaños de ADN de plasma en el enfermo de LES SLE04. Las distribuciones de tamaños de nueve sujetos de control sanos se muestran como líneas grises discontinuas y las de SLE04 se muestran como una línea negra continua. Los fragmentos de ADN de plasma cortos fueron más abundantes en SLE04 que en los nueve sujetos de control sanos. Como los fragmentos de ADN más cortos están en general menos metilados, este patrón de distribución de tamaños puede confundir el análisis de metilación de ADN de plasma y conducir a una hipometilación más evidente.

En algunas realizaciones, un nivel de metilación medido puede normalizarse para reducir el efecto de confusión de la distribución de tamaños en análisis de metilación de ADN de plasma. Por ejemplo, puede medirse un tamaño de moléculas de ADN en la pluralidad de sitios. En diversas implementaciones, la medición puede proporcionar un tamaño específico (por ejemplo, longitud) a una molécula de ADN o determinar sencillamente que el tamaño queda dentro de un intervalo específico, lo que también puede corresponder a un tamaño. El nivel de metilación normalizado puede después compararse con un valor de punto de corte. Existen varias formas de realizar la normalización para reducir el efecto de confusión de la distribución de tamaños en análisis de metilación de ADN de plasma.

En una realización, puede realizarse fraccionamiento por tamaños del ADN (por ejemplo, ADN de plasma). El fraccionamiento por tamaños puede asegurar que se usen fragmentos de ADN de un tamaño similar para determinar el nivel de metilación de una manera coherente con el valor de punto de corte. Como parte del fraccionamiento por tamaños, pueden seleccionarse fragmentos de ADN que tengan un primer tamaño (por ejemplo, un primer intervalo de longitudes), donde el primer valor de punto de corte corresponde al primer tamaño. La normalización puede conseguirse calculando el nivel de metilación usando solamente los fragmentos de ADN seleccionados.

Puede conseguirse el fraccionamiento por tamaños de diversas maneras, por ejemplo, por separación física de moléculas de ADN de diferentes tamaños (por ejemplo mediante electroforesis o tecnologías basadas en microfluídica, o tecnologías basadas en centrifugación) o mediante análisis por ordenador. Para análisis por ordenador, en una realización, se puede realizar secuenciación paralela masiva de extremos emparejados de las moléculas de ADN de plasma. Se puede deducir después el tamaño de las moléculas secuenciadas por comparación con la localización de cada uno de dos extremos de una molécula de ADN de plasma con un genoma humano de referencia. Después, se puede realizar análisis posterior por la selección de moléculas de ADN secuenciadas que coinciden con uno o más criterios de selección por tamaño (por ejemplo, estando los criterios del tamaño dentro de un intervalo específico). Por lo tanto, en una realización, la densidad de metilación puede analizarse con respecto a fragmentos con un tamaño similar (por ejemplo, dentro de un intervalo específico). El valor de punto de corte (por ejemplo, en el bloque 2840 del método 2800) puede determinarse basándose en fragmentos dentro del mismo intervalo de tamaños. Por ejemplo, los niveles de metilación pueden determinarse a partir de muestras que se sabe que tienen cáncer o no tienen cáncer, y los valores de punto de corte pueden determinarse a partir de estos niveles de metilación.

En otra realización, puede determinarse una relación funcional entre la densidad de metilación y el tamaño del ADN en circulación. La relación funcional puede definirse por puntos de datos o coeficientes de una función. La relación funcional puede proporcionar valores de cambio de escala correspondientes a tamaños respectivos (por ejemplo, tamaños más cortos pueden tener aumentos correspondientes a la metilación). En diversas implementaciones, el valor de cambio de escala puede estar entre 0 y 1 o ser mayor de 1.

La normalización puede realizarse basándose en un tamaño promedio. Por ejemplo, puede calcularse un tamaño promedio correspondiente a moléculas de ADN usadas para calcular el primer nivel de metilación, y el primer nivel de metilación puede multiplicarse por el valor de cambio de escala correspondiente (es decir, correspondiente al tamaño promedio). Como otro ejemplo, la densidad de metilación de cada molécula de ADN puede normalizarse de acuerdo con el tamaño de la molécula de ADN y la relación entre el tamaño de ADN y la metilación.

En otra implementación, la normalización puede realizarse por molécula. Por ejemplo, puede obtenerse un tamaño respectivo de una molécula de ADN en un sitio particular (por ejemplo, como se ha descrito anteriormente), y puede identificarse un valor de cambio de escala correspondiente al tamaño respectivo a partir de la relación funcional. Para un cálculo no normalizado, cada molécula se contaría igualmente en la determinación de un índice de metilación en el sitio. Para el cálculo normalizado, la contribución de una molécula al índice de metilación puede ponderarse por el factor de cambio de escala que corresponde al tamaño de la molécula.

Las FIGURAS 34B y 34C muestran análisis de metilación para ADN de plasma de un enfermo de LES SLE04 (FIGURA 34B) y un enfermo de CHC TBR36 (FIGURA 34C). Los círculos externos muestran los resultados de Zmet para ADN de plasma sin fraccionamiento por tamaños por ordenador. Los círculos internos muestran los resultados de Zmet para ADN de plasma de 130 pb o mayor. Para el enfermo de LES SLE04, el 84 % de los grupos mostraron hipometilación sin fraccionamiento por tamaños por ordenador. El porcentaje de los grupos que muestran hipometilación se redujo al 15 % cuando solamente se analizaron fragmentos de 130 pb o mayores. Para el enfermo de CHC TBR36, el 98,5 % y el 98,6 % de los grupos mostraron hipometilación para el ADN de plasma con y sin fraccionamiento por tamaños por ordenador, respectivamente. Estos resultados sugieren que el fraccionamiento por tamaños por ordenador puede reducir eficazmente los resultados de hipometilación falsos positivos relacionados con la fragmentación aumentada de ADN de plasma, por ejemplo, en pacientes con LES o en otras afecciones inflamatorias.

En una realización, los resultados para los análisis con y sin fraccionamiento por tamaños pueden compararse para indicar si hay algún efecto de confusión del tamaño en los resultados de metilación. Por lo tanto, además de o en lugar de la normalización, puede usarse el cálculo de un nivel de metilación en un tamaño particular para determinar si hay probabilidad de un falso positivo cuando el porcentaje de grupos por encima de un valor de punto de corte difiera con y sin fraccionamiento por tamaños, o si solamente difiere un nivel de metilación particular. Por ejemplo, la presencia de una diferencia significativa entre los resultados para muestras con y sin fraccionamiento por tamaños puede usarse para indicar la posibilidad de un resultado falso positivo debido a un patrón de fraccionamiento anómalo. El umbral para determinar si la diferencia es significativa puede establecerse mediante el análisis de una cohorte de enfermos de cáncer y una cohorte de sujetos de control sin cáncer.

I. Análisis para hipermetilación de islas de CpG en todo el genoma en plasma

Además de la hipometilación general, también se observa habitualmente hipermetilación de islas de CpG en cánceres (SB Baylin et al. 2011 Nat Rev Cancer; 11: 726-734; PA Jones et al. 2007, Cell; 128: 683-692; M Esteller et al. 2007 Nat Rev Genet 2007; 8: 286-298; M Ehrlich et al. 2002 Oncogene 2002; 21: 5400-5413). En esta sección, se describe el uso de análisis de todo el genoma con respecto a hipermetilación de islas de CpG para la detección y la supervisión de cánceres.

La FIGURA 35 es un diagrama de flujo de un método 3500 que determina una clasificación de un nivel de cáncer basándose en la hipermetilación de islas de CpG de acuerdo con realizaciones de la presente invención. La pluralidad de sitios del método 2800 puede incluir sitios de CpG, en los que los sitios de CpG se organizan en una pluralidad de islas de CpG, incluyendo cada isla de CpG uno o más sitios de CpG. Los niveles de metilación para cada isla de CpG pueden usarse para determinar la clasificación del nivel de cáncer.

En el bloque 3510, se identifican islas de CpG para analizar. En este análisis, como ejemplo, se determinó en primer lugar un conjunto de islas de CpG para analizar, que se caracterizan con densidades de metilación relativamente bajas en el plasma de los sujetos de referencia sanos. En un aspecto, la variación de las densidades de metilación en el grupo de referencia puede ser relativamente pequeña para permitir la detección de hipermetilación asociada con cáncer más fácilmente. En una realización, las islas de CpG tienen una densidad de metilación media menor que un primer porcentaje en un grupo de referencia, y un coeficiente de variación para la densidad de metilación en el grupo de referencia es menor que un segundo porcentaje.

Como ejemplo, para fines de ilustración, se usan los siguientes criterios para identificación de las islas de CpG útiles:

i. La densidad de metilación media para la isla de CpG en el grupo de referencia (por ejemplo sujetos sanos) <5 %

ii. El coeficiente de variación para el análisis de densidad de metilación en plasma para el grupo de referencia (por ejemplo sujetos sanos) <30 %.

Estos parámetros pueden ajustarse para una aplicación específica. A partir del conjunto de datos de los inventores, 454 islas de CpG en el genoma cumplieron estos criterios.

En el bloque 3520, la densidad de metilación se calcula para cada isla de CpG. Las densidades de metilación pueden determinarse como se describe en el presente documento.

En el bloque 3530, se determina si cada una de las islas de CpG está hipermetilada. Por ejemplo, para el análisis con respecto a hipermetilación de las islas de CpG de un caso ensayado, la densidad de metilación de cada isla de CpG se comparó con datos correspondientes de un grupo de referencia. La densidad de metilación (un ejemplo de un nivel de metilación) puede compararse con uno o más valores de punto de corte para determinar si una isla particular está hipermetilada.

En una realización, un primer valor de punto de corte puede corresponder a una media de densidades de metilación para el grupo de referencia más un porcentaje específico. Otro valor de punto de corte puede corresponder a la media de densidades de metilación para el grupo de referencia más un número específico de desviaciones típicas. En una implementación, se calculó una puntuación z (Zmet) y se comparó con valores de punto de corte. Como ejemplo, una isla de CpG en un sujeto de ensayo (por ejemplo un sujeto que se explora con respecto a cáncer) se consideró significativamente hipermetilada si cumplía los siguientes criterios:

i. Su densidad de metilación fue mayor que la media del grupo de referencia en 2 %, y

ii. Zmet >3

Estos parámetros también pueden ajustarse para una aplicación específica.

En el bloque 3540, las densidades de metilación (por ejemplo, como puntuaciones z) de las islas de CpG hipermetiladas se usan para determinar una puntuación acumulada. Por ejemplo, después de la identificación de todas las islas de CpG hipermetiladas de forma significativa, puede calcularse una puntuación que implica una suma de puntuaciones z o funciones de puntuaciones z de todas las islas de CpG hipermetiladas. Un ejemplo de una puntuación es una puntuación de probabilidad acumulada (PA), como se describe en otra sección. La puntuación de probabilidad acumulada usa Zmet para determinar la probabilidad de tener dicha observación al azar según una distribución de probabilidades (por ejemplo, distribución de probabilidades de t de Student con 3 grados de libertad). En el bloque 3550, la puntuación acumulada se compara con un umbral acumulado para determinar una clasificación de un nivel de cáncer. Por ejemplo, si la hipermetilación total de las islas de CpG identificadas es suficientemente grande, entonces puede identificarse que el organismo tiene cáncer. En una realización, el umbral acumulado corresponde a una mayor puntuación acumulada del grupo de referencia.

IX. METILACIÓN Y ANC

Como se ha mencionado anteriormente, los enfoques de análisis de metilación descritos en el presente documento pueden usarse en combinación con otros métodos que se basan en los cambios genéticos de ADN derivado de tumor en plasma. Los ejemplos de dichos métodos incluyen el análisis con respecto a aberraciones cromosómicas asociadas a cáncer (^kC^aChan et al. 2013 Clin Chem; 59: 211-224; RJ Leary et al. 2012 Sci Transl Med; 4: 162ra154). Se describen aspectos de aberraciones del número de copias (ANC) en la Solicitud de Patente de Estados Unidos n.° 13/308.473.

A. ANC

Pueden detectarse aberraciones del número de copias contando fragmentos de ADN que se alinean con una parte particular del genoma, normalizando el recuento y comparando el recuento con un valor de punto de corte. En diversas realizaciones, la normalización puede realizarse por un recuento de fragmentos de ADN alineados con otro haplotipo de la misma parte del genoma (dosificación de haplotipo relativa (DOHR)) o por un recuento de fragmentos de ADN alineados con otra parte del genoma.

El método de DOHR se basa en el uso de loci heterocigotos. También pueden usarse realizaciones descritas en esta sección para loci que son homocigotos comparando dos regiones y no dos haplotipos de la misma región, y por lo tanto no son específicos de haplotipo. En un método de dosificación de región cromosómica relativa, el número de fragmentos de una región cromosómica (por ejemplo, como se determina contando las lecturas de secuencia alineadas con esa región) se compara con un valor esperado (que puede ser de una región de cromosoma de referencia o de la misma región en otra muestra que se sabe que está sana). De esta manera, se contaría un fragmento para una región cromosómica independientemente del haplotipo de procedencia del marcador secuenciado. Por lo tanto, aún podrían usarse lecturas de secuencias que no contengan ningún locus heterocigoto. Para realizar la comparación, una realización puede normalizar el recuento de marcadores antes de la comparación. Cada región se define por al menos dos loci (que están separados entre sí), y fragmentos en estos loci pueden usarse para obtener un valor colectivo alrededor de la región.

Un valor normalizado para las lecturas secuenciadas (marcadores) para una región particular puede calcularse dividiendo el número de lecturas secuenciadas que se alinean con esa región por el número total de lecturas secuenciadas alineables con el genoma completo. El recuento de marcadores normalizado permite comparar resultados de una muestra con los resultados de otra muestra. Por ejemplo, el valor normalizado puede ser la proporción (por ejemplo, porcentaje o fracción) de lecturas secuenciadas que se espera que sean de la región particular, como se ha indicado anteriormente. En otras realizaciones, son posibles otros métodos de normalización. Por ejemplo, se puede normalizar dividiendo el número de recuentos de una región por el número de recuentos de una región de referencia (en el caso anterior, la región de referencia es simplemente el genoma completo). Este recuento de marcadores normalizado puede después compararse frente a un valor umbral, que puede determinarse a partir de una o más muestras de referencia que no muestran cáncer.

El recuento de marcadores normalizado del caso ensayado se compararía después con el recuento de marcadores normalizado de uno o más sujetos de referencia, por ejemplo los que no tienen cáncer En una realización, la comparación se realiza calculando la puntuación z del caso para la región cromosómica particular. La puntuación z puede calcularse usando la siguiente ecuación: puntuación z = (recuento de marcadores normalizado del caso -media)/DT, donde “media” es el recuento de marcadores normalizado medio que se alinea con la región cromosómica particular para las muestras de referencia; y DT es la desviación típica del número de recuentos de marcadores normalizados que se alinea con la región particular para las muestras de referencia. Por lo tanto, la puntuación z es el número de desviaciones típicas por las que el recuento de marcadores normalizado de una región cromosómica para el caso ensayado se aleja del recuento de marcadores normalizado medio para la misma región cromosómica del o los sujetos de referencia.

En la situación en la que el organismo sometido a ensayo tiene cáncer, las regiones cromosómicas que se amplifican en los tejidos tumorales estarían sobrerrepresentadas en el ADN del plasma. Esto daría como resultado un valor positivo de la puntuación z. Por otro lado, las regiones cromosómicas que están suprimidas en los tejidos tumorales estarían infrarrepresentadas en el ADN de plasma. Esto daría como resultado un valor negativo de la puntuación z. La magnitud de la puntuación z se determina por varios factores.

Un factor es la concentración fraccional de ADN derivado de tumor en la muestra biológica (por ejemplo plasma). Cuanto mayor sea la concentración fraccional de ADN derivado de tumor en la muestra (por ejemplo plasma), mayor será la diferencia entre el recuento de marcadores normalizado del caso ensayado y los casos de referencia. Por lo tanto, se produciría una mayor magnitud de la puntuación z.

Otro factor es la variación del recuento de marcadores normalizado en el o los casos de referencia. Con el mismo grado de la sobrerrepresentación de la región cromosómica en la muestra biológica (por ejemplo plasma) del caso ensayado, una variación más pequeña (es decir una desviación típica más pequeña) del recuento de marcadores normalizado en el grupo de referencia daría como resultado una puntuación z mayor. De forma similar, con el mismo grado de infrarrepresentación de la región cromosómica en la muestra biológica (por ejemplo plasma) del caso ensayado, una desviación típica más pequeña del recuento de marcadores normalizado en el grupo de referencia daría como resultado un puntuación z más negativa.

Otro factor es la magnitud de aberración cromosómica en los tejidos tumorales. La magnitud de aberración cromosómica se refiere a los cambios del número de copias para la región cromosómica particular (bien ganancia o bien pérdida). Cuanto mayores sean los cambios de números de copias en los tejidos tumorales, mayor será el grado de sobre o infrarrepresentación de la región cromosómica particular en el a Dn de plasma. Por ejemplo, la pérdida de ambas copias del cromosoma daría como resultado mayor infrarrepresentación de la región cromosómica en el ADN de plasma que la pérdida de una de las dos copias del cromosoma y, por lo tanto, daría como resultado una puntuación z más negativa. Típicamente, hay múltiples aberraciones cromosómicas en los cánceres. Las aberraciones cromosómicas en cada cáncer pueden variar adicionalmente por su naturaleza (es decir amplificación o deleción), su grado (ganancia o pérdida de una única copia o múltiples copias) y su alcance (tamaño de la aberración con respecto a longitud cromosómica).

La precisión de la medición del recuento de marcadores normalizado se ve afectada por el número de moléculas analizadas. Se espera que sea necesario analizar 15.000, 60.000 y 240.000 moléculas para detectar aberraciones cromosómicas con un cambio de una copia (bien ganancia o bien pérdida) cuando la concentración fraccional sea de aproximadamente 12,5 %, 6,3 % y 3,2 % respectivamente. Se describen detalles adicionales del recuento de marcadores para detección de cáncer para diferentes regiones cromosómicas en la Publicación de Patente de Estados Unidos n.° 2009/0029377 titulada “Diagnosing Fetal Chromosomal Aneuploidy Using Massively Parallel Genomic Sequencing” de Lo et al.

Las realizaciones también pueden usar análisis de tamaños, en lugar del método de recuento de marcadores. También puede usarse análisis de tamaños, en lugar de un recuento de marcadores normalizado. El análisis de tamaños puede usar diversos parámetros, como se ha mencionado en el presente documento, y en la Solicitud de Patente de Estados Unidos n.° 12/940.992. Por ejemplo, pueden usarse los valores Q o F anteriores. Dichos valores de tamaños no necesitan una normalización por recuentos de otras regiones ya que esos valores no cambian de escala con el número de lecturas. Pueden usarse técnicas de los métodos específicos de haplotipo, tales como el método de DOHR descrito anteriormente y en más detalle en la Solicitud de Patente de Estados Unidos n.° 13/308.473, para los métodos no específicos también. Por ejemplo, pueden usarse técnicas que impliquen la profundidad y el refinamiento de una región. En algunas realizaciones, puede tenerse en cuenta un desplazamiento a GC para una región particular cuando se comparen dos regiones. Ya que el método de DOHR usa la misma región, no es necesaria dicha corrección.

Aunque ciertos cánceres pueden presentarse típicamente aberraciones en regiones cromosómicas particulares, dichos cánceres no presentan siempre exclusivamente aberraciones en dichas regiones. Por ejemplo, regiones cromosómicas adicionales podrían mostrar aberraciones, y la localización de dichas regiones adicionales podría ser desconocida. Además, cuando se exploren pacientes para identificar estadios tempranos de cáncer, se puede querer identificar una amplia serie de cánceres, que podrían mostrar aberraciones presentes por todo el genoma. Para abordar estas situaciones, las realizaciones pueden analizar una pluralidad de regiones de una manera sistemática para determinar qué regiones muestran aberraciones. Puede usarse el número de aberraciones y su localización (por ejemplo si son contiguas), por ejemplo, para confirmar aberraciones, determinar un estadio del cáncer, proporcionar un diagnóstico de cáncer (por ejemplo si el número es mayor que un valor umbral), y proporcionar un pronóstico basado en el número y la localización de diversas regiones que muestran una aberración.

En consecuencia, las realizaciones pueden identificar si un organismo tiene cáncer basándose en el número de regiones que muestran una aberración. Por lo tanto, se puede ensayar una pluralidad de regiones (por ejemplo, 3.000) para identificar un número de regiones que muestren una aberración. Las regiones pueden abarcar el genoma completo o solamente partes del genoma, por ejemplo, región no repetida.

La FIGURA 36 es un diagrama de flujo de un método 3600 para analizar una muestra biológica de un organismo usando una pluralidad de regiones cromosómicas de acuerdo con realizaciones de la presente descripción. La muestra biológica incluye moléculas de ácido nucleico (también denominadas fragmentos).

En el bloque 3610, se identifican una pluralidad de regiones (por ejemplo, regiones no solapantes) del genoma del organismo. Cada región cromosómica incluye una pluralidad de loci. Una región puede ser de 1 Mb de tamaño, o algún otro tamaño igual. Para la situación de una región que sea de 1 Mb de tamaño, el genoma completo puede entonces incluir aproximadamente 3.000 regiones, cada una de un tamaño y una localización predeterminados. Dichas regiones predeterminadas pueden variar para acomodar una longitud de un cromosoma particular o un número específico de regiones para usar, y cualquier otro criterio mencionado en el presente documento. Si algunas regiones tienen diferentes longitudes, dichas longitudes pueden usarse para normalizar los resultados, por ejemplo como se describe en el presente documento. Las regiones pueden seleccionarse específicamente basándose en ciertos criterios del organismo específico y/o basándose en el conocimiento del cáncer que se ensaya. Las regiones también pueden seleccionarse de forma arbitraria.

En el bloque 3620, una localización de la molécula de ácido nucleico en un genoma de referencia del organismo se identifica para cada una de una pluralidad de moléculas de ácido nucleico. La localización puede determinarse de cualquiera de las maneras mencionadas en el presente documento, por ejemplo, secuenciando los fragmentos para obtener marcadores secuenciados y alinear los marcadores secuenciados con el genoma de referencia. También puede determinarse un haplotipo particular de una molécula para los métodos específicos de haplotipo.

Los bloques 3630-3650 se realizan para cada una de las regiones cromosómicas. En el bloque 3630, se identifica un grupo respectivo de moléculas de ácido nucleico como perteneciente a la región cromosómica basándose en las localizaciones identificadas. El grupo respectivo puede incluir al menos una molécula de ácido nucleico localizada en cada uno de la pluralidad de loci de la región cromosómica. En una realización, el grupo puede ser fragmentos que se alinean con un haplotipo particular de una región cromosómica, por ejemplo, como en el método de DOHR anterior. En otra realización, el grupo puede ser de cualquier fragmento que se alinee con la región cromosómica.

En el bloque 3640, un sistema informático calcula un valor respectivo del grupo respectivo de moléculas de ácido nucleico. El valor respectivo define una propiedad de las moléculas de ácido nucleico del grupo respectivo. El valor respectivo puede ser cualquiera de los valores mencionados en el presente documento. Por ejemplo, el valor puede ser el número de fragmentos en el grupo o un valor estadístico de una distribución por tamaños de los fragmentos en el grupo. El valor respectivo también puede ser un valor normalizado, por ejemplo, un recuento de marcadores de la región dividido por el número total de recuentos de marcadores para la muestra o el número de recuentos de marcadores para una región de referencia. El valor respectivo también puede ser una diferencia o relación de otro valor (por ejemplo, en DOHR), proporcionando de ese modo la propiedad de una diferencia para la región.

En el bloque 3650, el valor respectivo se compara con un valor de referencia para determinar una clasificación de si la primera región cromosómica muestra una deleción o una amplificación. Este valor de referencia puede ser cualquier valor umbral o de referencia descrito en el presente documento. Por ejemplo, el valor de referencia podría ser un valor umbral determinado para muestras normales. Para DOHR, el valor respectivo podría ser la diferencia o relación de recuentos de marcadores para los dos haplotipos, y el valor de referencia puede ser un umbral para determinar que existe una desviación estadísticamente significativa. Como otro ejemplo, el valor de referencia podría ser el recuento de marcadores o el valor de los tamaños para otro haplotipo o región, y la comparación puede incluir tomar una diferencia o una relación (o una función de estas) y después determinar si la diferencia o la relación es mayor que un valor umbral.

El valor de referencia puede variar basándose en los resultados de otras regiones. Por ejemplo, si las regiones adyacentes también muestran una desviación (aunque pequeña en comparación con un umbral, por ejemplo, un puntuación z de 3), entonces puede usarse un umbral inferior. Por ejemplo, si tres regiones consecutivas están todas por encima de un primer umbral, entonces el cáncer puede ser más probable. Por lo tanto, este primer umbral puede ser menor que otro umbral que es necesario para identificar el cáncer de regiones no consecutivas. La existencia de tres regiones (o más de tres) que tengan una desviación incluso pequeña puede tener una probabilidad suficientemente baja de un efecto al azar para que se pueda conservar la sensibilidad y especificidad.

En el bloque 3660, se determina una cantidad de regiones genómicas clasificadas como presentadoras de una deleción o amplificación. Las regiones cromosómicas que se cuentan pueden tener restricciones. Por ejemplo, pueden contarse solamente regiones que sean contiguas con al menos otra región (o pueden requerirse regiones contiguas que sean de un cierto tamaño, por ejemplo, 4 o más regiones). Para realizaciones en las que las regiones no son iguales, el número también puede representar las longitudes respectivas (por ejemplo, el número podría ser una longitud total de las regiones aberrantes).

En el bloque 3670, la cantidad se compara con una cantidad de valor umbral para determinar una clasificación de la muestra. Como ejemplos, la clasificación puede ser si el organismo tiene cáncer, un estadio del cáncer y un pronóstico del cáncer. En una realización, se cuentan todas las regiones aberrantes y se usa un único valor umbral independientemente de donde aparezcan las regiones. En otra realización, un valor umbral puede variar basándose en las localizaciones y el tamaño de las regiones que se cuentan. Por ejemplo, la cantidad de regiones en un cromosoma o una rama de un cromosoma particular puede compararse con un umbral para ese cromosoma (o rama) particular. Pueden usarse múltiples umbrales. Por ejemplo, la cantidad de regiones aberrantes en un cromosoma (o rama) particular puede ser mayor que un primer valor umbral, y la cantidad total de regiones aberrantes en el genoma debe ser mayor que un segundo valor umbral. El valor umbral puede ser un porcentaje de las regiones que se ha determinado que muestran una deleción o una amplificación.

Este valor umbral para la cantidad de regiones también puede depender de lo fuerte que sea el desequilibrio para las regiones contadas. Por ejemplo, la cantidad de regiones que se usan como el umbral para determinar una clasificación de cáncer puede depender de la especificidad y sensibilidad (umbral aberrante) usadas para detectar una aberración en cada región. Por ejemplo, si el umbral aberrante es bajo (por ejemplo puntuación z de 2), entonces la cantidad umbral puede seleccionarse para que sea alta (por ejemplo 150). Sin embargo, si el umbral aberrante es alto (por ejemplo, una puntuación z de 3), entonces la cantidad umbral puede ser menor (por ejemplo, 50). La cantidad de regiones que muestran una aberración también puede ser un valor ponderado, por ejemplo, una región que muestra un alto desequilibrio puede ponderarse más alta que una región que solamente muestra un desequilibrio pequeño (es decir, hay más clasificaciones aparte de solamente positivo o negativo para la aberración). Como ejemplo, puede usarse una suma de puntuaciones z, usando de ese modo los valores ponderados.

En consecuencia, la cantidad (que puede incluir el número y/o el tamaño) de regiones cromosómicas que muestran sobre o infrarrepresentación significativa de un recuento de marcadores normalizado (u otro valor respectivo para la propiedad del grupo) puede usarse para reflejar la gravedad de la enfermedad La cantidad de regiones cromosómicas con un recuento de marcadores normalizado aberrante puede determinarse por dos factores, concretamente el número (o tamaño) de aberraciones cromosómicas en los tejidos tumorales y la concentración fraccional de ADN derivado de tumor en la muestra biológica (por ejemplo plasma). Cánceres más avanzados tienden a mostrar más (y mayores) aberraciones cromosómicas. Por lo tanto, más aberraciones cromosómicas asociadas con cáncer serían potencialmente detectables en la muestra (por ejemplo plasma). En pacientes con cáncer más avanzado, la mayor carga tumoral conduciría a una mayor concentración fraccional de ADN derivado de tumor en el plasma. Como resultado, las aberraciones cromosómicas asociadas a tumor serían más fácilmente detectables en la muestra de plasma.

Un posible enfoque para mejorar la sensibilidad sin sacrificar la especificidad es tener en cuenta el resultado del segmento cromosómico adyacente. En una realización, el punto de corte para la puntuación z sigue siendo >2 y <-2. Sin embargo, una región cromosómica se clasificaría como potencialmente aberrante solamente cuando dos segmentos consecutivos muestren el mismo tipo de aberraciones, por ejemplo ambos segmentos tengan una puntuación z de >2. En otras realizaciones, las puntuaciones z de segmentos adyacentes pueden sumarse entre sí usando un valor de punto de corte más alto. Por ejemplo, las puntuaciones z de tres segmentos consecutivos pueden sumarse y puede usarse un valor de punto de corte de 5. Este concepto puede extenderse a más de tres segmentos consecutivos.

La combinación de cantidad y umbrales aberrantes también puede depender del fin del análisis, y cualquier conocimiento previo del organismo (o falta del mismo). Por ejemplo, si se explora una población sana normal con respecto a cáncer, entonces se usaría típicamente alta especificidad, potencialmente tanto en la cantidad de regiones (es decir alto umbral para el número de regiones) como en un umbral aberrante para cuando se identifica una región como poseedora de una aberración. Sin embargo, en un paciente con mayor riesgo (por ejemplo un paciente que se queje de un bulto o tenga un historial familiar, fumador, portador de papilomavirus humano crónico (VPH), portador del virus de la hepatitis o portador de otro virus), entonces los umbrales podrían ser menores para tener más sensibilidad (menos falsos negativos).

En una realización, si se usa una resolución de 1 Mb y un límite de detección menor de 6,3 % de ADN derivado de tumor para detectar una aberración cromosómica, sería necesario que el número de moléculas en cada segmento de 1 Mb fuera de 60.000. Esto se traduciría en aproximadamente 180 millones (60.000 lecturas/Mb x 3.000 Mb) de lecturas alineables para el genoma completo.

Un tamaño de segmento menor proporcionaría una mayor resolución para detectar aberraciones cromosómicas menores. Sin embargo, esto aumentaría la cantidad requerida del número de moléculas para analizar en total. Un tamaño de segmento mayor reduciría el número de moléculas requerido para el análisis a costa de resolución. Por lo tanto, solamente pueden detectarse aberraciones mayores. En una implementación, podrían usarse regiones mayores, los segmentos que muestran una aberración podrían subdividirse y estas subregiones analizarse para obtener una mejor resolución (por ejemplo como se ha descrito anteriormente). Si se tiene una estimación de un tamaño de la deleción o amplificación para detectar (o concentración mínima para detectar), puede determinarse el número de moléculas para analizar.

B. ANC basada en la secuenciación de ADN de plasma tratado por bisulfito

Puede observarse con frecuencia hipometilación en todo el genoma y ANC en tejidos tumorales. Aquí, se demuestra que la información de ANC y cambios de metilación asociados con cáncer puede obtenerse simultáneamente de la secuenciación por bisulfito de ADN de plasma. Como los dos tipos de análisis pueden llevarse a cabo en el mismo conjunto de datos, prácticamente no hay ningún coste adicional para el análisis de ANC. Otras realizaciones pueden usar diferentes procedimientos para obtener la información de metilación y la información genética. En otras realizaciones, se puede realizar un análisis similar para hipermetilación asociada con cáncer junto con el análisis de ANC.

La FIGURA 37A muestra análisis de ANC para tejidos tumorales, ADN de plasma no tratado por bisulfito (BS) y ADN de plasma tratado por bisulfito (de dentro a fuera) para el paciente TBR36. La FIGURA 37A muestra análisis de ANC para tejidos tumorales, ADN de plasma no tratado por bisulfito (BS) y ADN de plasma tratado por bisulfito (de dentro a fuera) para el paciente TBR36. El anillo más externo muestra el ideograma del cromosoma. Cada punto representa el resultado de una región de 1 Mb. Los puntos verdes, rojos y grises representan regiones con ganancia de número de copias, pérdida de número de copias y sin cambio en el número de copias, respectivamente. Para el análisis de plasma, se muestran las puntuaciones z. Una diferencia de 5 está presente entre dos líneas concéntricas. Para análisis de tejido tumoral, se muestra el número de copias. Una diferencia de una copia está presente entre dos líneas concéntricas. La FIGURA 38A muestra análisis de ANC para tejidos tumorales, ADN de plasma no tratado por bisulfito (BS) y ADN de plasma tratado por bisulfito (de dentro a fuera) para el paciente TBR34. Los patrones de ANC detectados en las muestras de plasma tratadas por bisulfito y no tratadas por bisulfito fueron concordantes. Los patrones de ANC detectados en los tejidos tumorales, plasma no tratado por bisulfito y plasma tratado por bisulfito fueron concordantes. Para evaluar adicionalmente la concordancia entre los resultados del plasma tratado por bisulfito y no tratado por bisulfito, se construye una representación de dispersión. La FIGURA 37B es una representación de dispersión que muestra la relación entre las puntuaciones z para la detección de ANC usando plasma tratado por bisulfito y no tratado por bisulfito de los grupos de 1 Mb para el paciente TBR36. Se observó una correlación positiva entre las puntuaciones z de los dos análisis (r = 0,89, p <0,001, correlación de Pearson). La FIGURA 38B es una representación de dispersión que muestra la relación entre las puntuaciones z para la detección de ANC usando plasma tratado por bisulfito y no tratado por bisulfito de los grupos de 1 Mb para el paciente TBR34. Se observó una correlación positiva entre las puntuaciones z de los dos análisis (r = 0,81, p <0,001, correlación de Pearson).

C. Análisis sinérgico de ANC asociado a cáncer y cambios de metilación

Como se ha descrito anteriormente, el análisis con respecto a ANC puede implicar el recuento del número de lecturas de secuencia en cada región de 1 Mb mientras que el análisis con respecto a densidad de metilación puede implicar la detección de la proporción de restos de citosina en dinucleótidos de CpG que están metilados. La combinación de estos dos análisis puede proporcionar información sinérgica para la detección de cáncer. Por ejemplo, la clasificación de mutilación y la clasificación de ANC pueden usarse para determinar una tercera clasificación de un nivel de cáncer.

En una realización, la presencia de ANC o cambio de metilación asociado a cáncer puede usarse para indicar la presencia potencial de un cáncer. En dicha realización, la sensibilidad de detección de cáncer puede aumentarse cuando están presentes ANC o cambios de metilación en el plasma de un sujeto ensayado. En otra realización, la presencia de ambos cambios puede usarse para indicar la presencia de un cáncer. En dicha realización, la especificidad del ensayo puede mejorarse debido a que uno de los dos tipos de cambios puede detectarse potencialmente en algunos sujetos sin cáncer. Por lo tanto, la tercera clasificación puede ser positiva para cáncer solamente cuando tanto la primera clasificación como la segunda clasificación indican cáncer.

Se reclutaron 26 enfermos de CHC y 22 sujetos sanos. Se recogió una muestra de sangre de cada sujeto y el ADN de plasma se secuenció después del tratamiento por bisulfito. Para los enfermos de CHC, las muestras de sangre se recogieron en el momento del diagnóstico. La presencia de cantidades significativas de ANC se definió, por ejemplo, por tener >5 % de los grupos que muestran una puntuación z de <-3 o >3. Se definió la presencia de cantidades significativas de hipometilación asociada a cáncer como el hecho de que >3 % de los grupos muestran una puntuación z <-3. Como ejemplos, la cantidad de regiones (grupos) puede expresarse como un recuento sin procesar de grupos, un porcentaje y una longitud de los grupos.

La Tabla 3 muestra la detección de cantidades significativas de ANC y cambios de metilación en el plasma de 26 enfermos de CHC usando secuenciación paralela masiva en ADN de plasma tratado por bisulfito.

Tabla 3

Las tasas de detección del cambio de metilación asociado a cáncer y ANC fueron del 69 % y 50 %, respectivamente. La tasa de detección (es decir sensibilidad de diagnóstico) mejoró hasta el 73 % si la presencia de uno de los criterios se usó para indicar la potencial presencia de un cáncer.

Se muestran los resultados de dos pacientes que muestran la presencia de ANC (FIGURA 39A) o cambios de metilación (FIGURA 39B). La FIGURA 39A es una representación de Circos que muestra el ANC (anillo interno) y análisis de metilación (anillo externo) para el plasma tratado por bisulfito para un enfermo de CHC TBR240. Para el análisis de ANC, los puntos verdes, rojos y grises representan regiones con ganancia cromosómica, pérdida cromosómica y sin cambio en el número de copias, respectivamente. Para el análisis de metilación, los puntos verdes, rojos y grises representan regiones con hipermetilación, hipometilación y metilación normal, respectivamente. En este paciente, se detectó ANC asociada a cáncer en el plasma mientras que el análisis de metilación no reveló cantidades significativas de hipometilación asociada a cáncer. La FIGURA 39B es una representación de Circos que muestra el análisis de ANC (anillo interno) y metilación (anillo externo) para el plasma tratado por bisulfito para un enfermo de CHC TBR164. En este paciente, se detectó hipometilación asociada a cáncer en el plasma. Sin embargo, no se observaron cantidades significativas de ANC. Los resultados de dos pacientes que muestran la presencia tanto de ANC como de cambios de metilación se muestran en las FIGURAS 48A (TBR36) y 49A (TBR34).

La Tabla 4 muestra la detección de cantidades significativas de ANC y cambios de metilación en el plasma de 22 sujetos de control usando secuenciación paralela masiva en ADN de plasma tratado por bisulfito. Se usó un enfoque de bootstrap (es decir dejando uno fuera) para la evaluación de cada uno de los sujetos de control. Por lo tanto, cuando se evaluó a un sujeto particular, los otros 21 sujetos se usaron para el cálculo de la media y DT del grupo de control.

Tabla 4

La especificidad de la detección de cantidades significativas de cambio de metilación y ANC fueron del 86 % y 91 %, respectivamente. La especificidad mejoró hasta 95 % si se requirió la presencia de ambos criterios para indicar la presencia potencial de un cáncer.

En una realización, las muestras positivas para ANC y/o hipometilación se consideran positivas para cáncer, y las muestras cuando ambas son indetectables se consideran negativas. El uso de la lógica “o” proporciona mayor sensibilidad. En otra realización, solamente se consideran positivas para cáncer muestras que sean positivas tanto para ANC como para hipometilación, proporcionando de este modo mayor especificidad. En otra realización más, se pueden usar tres niveles de clasificación. Los sujetos se clasifican en i. ambos normales; ii. uno anómalo; iii. ambos anómalos.

Pueden usarse diferentes estrategias de seguimiento para estas tres clasificaciones. Por ejemplo, los sujetos para (iii) pueden someterse al protocolo de seguimiento más intensivo, por ejemplo que implica captura de imágenes de cuerpo completo; los sujetos para (ii) pueden someterse a un protocolo de seguimiento menos intensivo, por ejemplo secuenciación de ADN de plasma repetida después de un intervalo de tiempo corto relativo de varias semanas; y los sujetos para (i) pueden someterse al protocolo de seguimiento menos intensivo tal como volver a ensayar después de varios años. En otras realizaciones, la metilación y las mediciones de ANC pueden usarse junto con otros parámetros clínicos (por ejemplo resultados de captura de imágenes o bioquímica de suero) para refinar adicionalmente la clasificación.

D. Valor pronóstico del análisis de ADN de plasma después de tratamiento con intención de curar

La presencia de ANC asociada a cáncer y/o cambios de metilación en plasma indicaría la presencia de ADN derivado de tumor en la circulación del enfermo de cáncer. Se esperaría una reducción o eliminación de estos cambios asociados a cáncer después del tratamiento (por ejemplo, cirugía). Por otro lado, la persistencia de estos cambios en el plasma después del tratamiento podría indicar la eliminación incompleta de todas las células tumorales del cuerpo y puede ser un pronosticador útil para reaparición de enfermedad.

Se recogieron muestras de sangre de los dos enfermos de CHC TBR34 y TBR36 una semana después de la resección quirúrgica con intención de curar de los tumores. Se realizaron análisis de ANC y metilación en las muestras de plasma postratamiento tratadas por bisulfito.

La FIGURA 40A muestra análisis de ANC en ADN de plasma tratado por bisulfito recogido antes (anillo interno) y después (anillo externo) de la resección quirúrgica del tumor para el enfermo de CHC TBR36. Cada punto representa el resultado de una región de 1 Mb. Los puntos verdes, rojos y grises representan regiones con ganancia del número de copias, pérdida del número de copias y sin cambio del número de copias, respectivamente. La mayoría de la ANC observada antes del tratamiento desapareció después de resección tumoral. La proporción de grupos que muestran una puntuación z de <-3 o >3 se redujo del 25 % al 6,6 %.

La FIGURA 40B muestra análisis de metilación en ADN de plasma tratado por bisulfito recogido antes (anillo interno) y después (anillo externo) de la resección quirúrgica del tumor para el enfermo de CHC TBR36. Los puntos verdes, rojos y grises representan regiones con hipermetilación, hipometilación y metilación normal, respectivamente. Hubo una reducción notable en la proporción de grupos que mostraban hipometilación significativa del 90 % al 7,9 % y el grado de hipometilación también mostró una reducción notable. Este paciente tuvo una remisión clínica completa a los 22 meses después de la resección tumoral.

La FIGURA 41A muestra análisis de ANC en ADN de plasma tratado por bisulfito recogido antes (anillo interno) y después (anillo externo) de resección quirúrgica de tumor para el enfermo de CHC TBR34. Aunque hay una reducción tanto en el número de grupos que muestran ANC como en la magnitud de ANC en los grupos afectados después de la resección quirúrgica del tumor, podría observarse ANC residual en la muestra de plasma postoperatoria. El círculo rojo destaca la región en la que las ANC residuales eran más evidentes. La proporción de grupos que muestran una puntuación z de <-3 o >3 se redujo del 57 % al 12 %.

La FIGURA 41B muestra análisis de metilación en ADN de plasma tratado por bisulfito recogido antes (anillo interno) y después (anillo externo) de resección quirúrgica de tumor para el enfermo de CHC TBR34. La magnitud de la hipometilación se redujo después de la resección tumoral habiéndose reducido la puntuación z media para los grupos hipometilados de -7,9 a -4,0. Sin embargo, la proporción de grupos que tenían una puntuación z <-3 mostró un cambio opuesto, con un aumento del 41 % al 85 %. Esta observación indica potencialmente la presencia de células cancerosas residuales después del tratamiento. Clínicamente, se detectaron múltiples focos de nódulos tumorales en el hígado no resecado restante a los 3 meses después de la resección tumoral. Se observaron metástasis de pulmón desde el cuarto mes después de la cirugía. El paciente murió por reaparición local y enfermedad metastásica 8 meses después de la operación.

Las observaciones en estos dos pacientes (TBR34 y TBR36) sugieren que la presencia de cambios asociados a cáncer residual de ANC e hipometilación puede usarse para supervisar y pronosticar a enfermos de cáncer después de tratamientos con intención de curar. Los datos también mostraron que el grado de cambio en la cantidad de ANC en plasma detectada puede usarse de forma sinérgica con evaluación del grado de cambio en el alcance de la metilación de ADN de plasma para pronóstico y supervisión de la eficacia del tratamiento.

En consecuencia, en algunas realizaciones, se obtiene una muestra biológica antes del tratamiento y se obtiene una segunda muestra biológica después del tratamiento (por ejemplo, cirugía). Se obtienen primeros valores para la primera muestra, tales como las puntuaciones z de regiones (por ejemplo, niveles de metilación regional y valores normalizados para ANC) y el número de regiones que mostraban hipometilación y ANC (por ejemplo, amplificación o deleción). Pueden obtenerse segundos valores para la segunda muestra. En otra realización, pueden obtenerse una tercera muestra, o incluso muestras adicionales, después del tratamiento. El número de regiones que muestran hipometilación y ANC (por ejemplo, amplificación o deleción) puede obtenerse de la tercera muestra o incluso muestras adicionales.

Como se ha descrito anteriormente para las FIGURAS 40A y 41A, el primer número de regiones que muestran hipometilación para la primera muestra puede compararse con la segunda cantidad de regiones que muestran hipometilación para la segunda muestra. Como se ha descrito anteriormente para las FIGURAS 40B y 41B, la primera cantidad de regiones que muestran hipometilación para la primera muestra puede compararse con la segunda cantidad de regiones que muestran hipometilación para la segunda muestra. La comparación de la primera cantidad con la segunda cantidad y el primer número con el segundo número puede usarse para determinar un pronóstico del tratamiento. En diversas realizaciones, solamente una de las comparaciones puede ser determinante de pronóstico o pueden usarse ambas comparaciones. En realizaciones en las que se obtienen la tercera o incluso muestras adicionales, una o más de estas muestras pueden usarse para determinar un pronóstico del tratamiento, por si solas, o junto con la segunda muestra.

En una implementación, se predice que el pronóstico será peor cuando una primera diferencia entre la primera cantidad y la segunda cantidad esté por debajo de un primer umbral de diferencia. En otra implementación, se predice que el pronóstico será peor cuando una segunda diferencia entre el primer número y el segundo número esté por debajo de un segundo umbral de diferencia. El umbral podría ser igual o diferente. En una realización, el primer umbral de diferencia y el segundo umbral de diferencia son cero. Por lo tanto, para el ejemplo anterior, la diferencia entre los valores para metilación indicaría un pronóstico peor para el paciente TBR34.

Un pronóstico puede ser mejor si la primera diferencia y/o la segunda diferencia están por encima de un mismo umbral o umbrales respectivos. La clasificación del pronóstico puede depender de cuánto más arriba o más abajo del umbral estén las diferencias. Podrían usarse múltiples umbrales para proporcionar diversas clasificaciones. Diferencias mayores pueden predecir mejores resultados y diferencias menores (e incluso valores negativos) pueden predecir resultados peores.

En algunas realizaciones, los puntos de tiempo en los que se toman las diversas muestras también se indican. Con dichos parámetros temporales, se podría determinar la cinética o la tasa de cambio de la cantidad. En una realización, una reducción rápida en la hipometilación asociada a tumor en plasma y/o una reducción rápida en la ANC asociada a tumor en plasma serán predictivas de buen pronóstico. Por el contrario, una hipometilación asociada a tumor estática o un aumento rápido en la hipometilación asociada a tumor en plasma y/o una ANC asociada a tumor estática o un aumento rápido en la ANC asociada a tumor serán predictivos de mal pronóstico. Las mediciones de metilación y ANC pueden usarse junto con otros parámetros clínicos (por ejemplo resultados de captura de imágenes o bioquímica de suero o marcadores de proteínas) para predicción del resultado clínico.

Las realizaciones pueden usar otras muestras además de plasma. Por ejemplo, pueden medirse aberraciones de metilación asociadas a tumor (por ejemplo hipometilación) y/o ANC asociadas a tumor a partir de células tumorales que circulan en la sangre de enfermos de cáncer, de ADN sin células o células tumorales en la orina, heces, saliva, esputo, líquido biliar, líquido pancreático, hisopos del cuello uterino, secreciones del tracto reproductor (por ejemplo del vaginal), líquido ascítico, líquido pleural, semen, sudor y lágrimas.

En diversas realizaciones, pueden detectarse aberraciones de metilación asociadas a tumor (por ejemplo hipometilación) y/o ANC asociadas a tumor de la sangre o el plasma de pacientes con cáncer de mama, cáncer de pulmón, cáncer colorrectal, cáncer pancreático, cáncer ovárico, carcinoma nasofaríngeo, cáncer de cuello uterino, melanoma, tumores cerebrales, etc. De hecho, como las alteraciones de metilación y genéticas tales como ANC son fenómenos universales en el cáncer, los enfoques descritos pueden usarse para todos los tipos de cáncer. Las mediciones de metilación y ANC pueden usarse junto con otros parámetros clínicos (por ejemplo resultados de captura de imágenes) para la predicción del resultado clínico. También pueden usarse realizaciones para la exploración y supervisión de pacientes con lesiones preneoplásicas, por ejemplo adenomas.

En consecuencia, en una realización, la muestra biológica se toma antes del tratamiento, y las mediciones de ANC y metilación se repiten después del tratamiento. Las mediciones pueden producir una primera cantidad posterior de regiones que se ha determinado que muestran una deleción o una amplificación y pueden producir una segunda cantidad posterior de regiones que se ha determinado que tienen un nivel de metilación regional que supera el valor de punto de corte regional respectivo. La primera cantidad puede compararse con la primera cantidad posterior, y la segunda cantidad puede compararse con la segunda cantidad posterior para determinar un pronóstico del organismo.

La comparación para determinar el pronóstico del organismo puede incluir determinar una primera diferencia entre la primera cantidad y la primera cantidad posterior, y la primera diferencia puede compararse con uno o más primeros umbrales de diferencia para determinar un pronóstico. La comparación para determinar el pronóstico del organismo también puede incluir determinar una segunda diferencia entre la segunda cantidad y la segunda cantidad posterior, y la segunda diferencia puede compararse con uno o más segundos umbrales de diferencia. Los umbrales pueden ser cero u otro número.

Puede predecirse que el pronóstico sea peor cuando la primera diferencia esté por debajo de un primer umbral de diferencia que cuando la primera diferencia esté por encima del primer umbral de diferencia. Puede predecirse que el pronóstico sea peor cuando la segunda diferencia esté por debajo de un segundo umbral de diferencia que cuando la segunda diferencia esté por encima del segundo umbral de diferencia. Los ejemplos de tratamientos incluyen inmunoterapia, cirugía, radioterapia, quimioterapia, terapia basada en anticuerpos, terapia génica, terapia epigenética o terapia dirigida.

E. Rendimiento

Se describe ahora el rendimiento de diagnóstico para diferentes números de lecturas de secuencias y de tamaño de grupos para análisis de ANC y de metilación.

1. Número de lecturas de secuencias

De acuerdo con una realización, se analizó el ADN de plasma de 32 sujetos de control sanos, 26 pacientes que padecen carcinoma hepatocelular y 20 pacientes que padecen otros tipos de cánceres, incluyendo carcinoma nasofaríngeo, cáncer de mama, cáncer de pulmón, cáncer neuroendocrino y sarcoma del músculo liso. Veintidós de los 32 sujetos sanos se seleccionaron aleatoriamente como el grupo de referencia. Se usaron la media y la desviación típica (DT) de estos 22 individuos de referencia para determinar el intervalo normal de densidad de metilación y representación genómica. Se usó ADN extraído de la muestra de plasma de cada individuo para construcción de bibliotecas de secuenciación usando el kit de secuenciación de extremos emparejados Illumina. Las bibliotecas de secuenciación se sometieron después a tratamiento por bisulfito que convirtió restos de citosina desmetilados en uracilo. La biblioteca de secuenciación convertida por bisulfito para cada muestra de plasma se secuenció usando un carril de un secuenciador HiSeq2000 Illumina.

Después de determinar las bases, se retiraron secuencias adaptadoras y bases de baja calidad (es decir puntuación de calidad <5) de los extremos de los fragmentos. Las lecturas recortadas en formato FASTQ se procesaron después por un proceso de análisis de datos de metilación denominado Methy-Pipe (P Jiang et al. 2010, Conferencia Internacional sobre Bioinformática y Biomedicina de IEEE, doi:10.1109/BIB-MW.2010.5703866). Para alinear las lecturas de secuenciación convertidas por bisulfito, se realizó en primer lugar conversión por ordenador de todos los restos de citosina a timinas en las cadenas de Watson y Crick por separado usando el genoma humano de referencia (NCBI versión 36/hg19). Después, se realizó conversión por ordenador de cada citosina a timina en todas las lecturas procesadas y se mantuvo la información posicional de cada resto convertido. Se usó SOAP2 para alinear las lecturas convertidas con los dos genomas humanos de referencia preconvertidos (R Li et al. 2009 Bioinformatics 25: 1966-1967), con un máximo de dos desapareamientos permitidos para cada lectura alineada. Solamente se usaron lecturas mapeables en una única localización genómica para análisis cadena abajo. Se retiraron lecturas ambiguas mapeadas en las cadenas tanto de Watson como de Crick y lecturas duplicadas (clonales). Se usaron restos de citosina en el contexto del dinucleótido de CpG para análisis de metilación cadena abajo. Después del alineamiento, las citosinas originalmente presentes en las lecturas secuenciadas se recuperaron basándose en la información posicional mantenida durante la conversión por ordenador. Las citosinas recuperadas entre los dinucleótidos de CpG se puntuaron como metiladas. Las timinas entre los dinucleótidos de CpG se puntuaron como desmetiladas.

Para análisis de metilación, el genoma se dividió en grupos del mismo tamaño. El tamaño de los grupos ensayados incluye 50 kb, 100 kb, 200 kb y 1 Mb. La densidad de metilación para cada grupo se calculó como el número de citosinas metiladas en el contexto del dinucleótido de CpG dividido por el número total de citosinas en posiciones de CpG. En otras realizaciones, el tamaño del grupo puede no ser igual a lo largo del genoma. En una realización, cada grupo entre dichos grupos de tamaños desiguales se compara entre múltiples sujetos.

Para determinar si la densidad de metilación de plasma de un caso ensayado era normal, se comparó la densidad de metilación con los resultados del grupo de referencia. Se seleccionaron aleatoriamente veintidós de los 32 sujetos sanos como el grupo de referencia para el cálculo de la puntuación z de metilación (Zmet).

donde DMensayo fue la densidad de metilación del caso ensayado para un grupo de 1 M; ■ fue \a densidad de metilación media del grupo de referencia para el grupo correspondiente; y DM^dt fue la DT de la densidad de mutilación del grupo de referencia para el grupo correspondiente.

Para análisis de ANC, se determinó el número de lecturas secuenciadas que se mapeaban en cada grupo de 1 Mb (KCA Chan et al. 2013 Clin Chem 59: 211-24). Se determinó la densidad de lectura secuenciada para cada grupo después de corrección con respecto a desviación de GC usando regresión de suavizado de representación de dispersión ponderado localmente como se ha descrito previamente (EZ Chen et al. 2011 PLoS One 6: e21791). Para análisis de plasma, la densidad de lecturas secuenciadas del caso ensayado se comparó con el grupo de referencia para calcular la puntuación z de ANC (Z^anc).

donde DLensayo fue la densidad de lecturas secuenciadas del caso ensayado para un grupo de 1 Mb particular;

fue la densidad de lecturas secuenciadas media del grupo de referencia para el grupo correspondiente; y DLdt fue la DT de la densidad de lecturas secuenciadas del grupo de referencia para el grupo correspondiente. Se definió que un grupo mostraba ANC si la Z^anc del grupo era <-3 o>3.

Se obtuvo una media de 93 millones de lecturas alineadas (intervalo: 39 millones a 142 millones) por caso. Para evaluar el efecto de la reducción del número de lecturas secuenciadas en el rendimiento de diagnóstico, se seleccionaron aleatoriamente 10 millones de lecturas alineadas de cada caso. Se usó el mismo conjunto de individuos de referencia para establecer el intervalo de referencia de cada grupo de 1 Mb para el conjunto de datos con lecturas secuenciadas reducidas. El porcentaje de grupos que muestran hipometilación significativa, es decir, Zmet <-3 y el porcentaje de grupos con ^aN^c, es decir, Z^anc <-3 o >3, se determinaron para cada caso. Se usaron curvas de características operadoras receptoras (ROC) para ilustrar el rendimiento de diagnóstico de análisis de hipometilación y ANC de todo el genoma para los conjuntos de datos con todas las lecturas secuenciadas de 1 carril y 10 millones de lecturas por caso. En el análisis de ROC, los 32 sujetos sanos se usaron para el análisis.

La FIGURA 42 muestra un diagrama de rendimiento de diagnóstico de análisis de hipometilación de todo el genoma con diferente número de lecturas secuenciadas. Para análisis de hipometilación, las áreas bajo la curva para las curvas de ROC no fueron significativamente diferentes entre los dos conjuntos de datos que analizaron todas las lecturas secuenciadas de un carril y 10 millones de lecturas por caso (P = 0,761). Para análisis de ANC, el rendimiento de diagnóstico se deterioró con una reducción significativa en las áreas bajo la curva cuando el número de lecturas secuenciadas se redujo del uso de los datos de un carril a 10 millones (P <0,001).

2. Efecto del uso de diferente tamaño de grupos

Además de dividir el genoma en grupos de 1 Mb, también se exploró si pueden usarse tamaños de grupos más pequeños. Teóricamente, el uso de grupos más pequeños puede reducir potencialmente la variabilidad en la densidad de metilación dentro de un grupo. Esto se debe a que la densidad de metilación entre diferentes regiones genómicas puede variar ampliamente. Cuando un grupo es mayor, la probabilidad de incluir regiones con diferentes densidades de metilación aumentaría y, por lo tanto, conduciría a un aumento general de la variabilidad en la densidad de metilación de los grupos.

Aunque el uso de un tamaño de grupo menor puede reducir potencialmente la variabilidad de la densidad de metilación relacionada con la diferencia interregional, esto por otro lado reduciría el número de lecturas secuenciadas mapeadas en un grupo en particular. La reducción de lecturas que se mapean en grupos individuales aumentaría la variabilidad debido a la variación del número de muestras. El tamaño de grupo óptimo que puede dar lugar a menor variabilidad general en la densidad de metilación puede determinarse experimentalmente para los requisitos de una aplicación de diagnóstico particular, por ejemplo el número total de lecturas secuenciadas por muestra y el tipo de secuenciador de ADN usado.

La FIGURA 43 es un diagrama que muestra curvas de ROC para la detección de cáncer basándose en análisis de hipometilación de todo el genoma con diferentes tamaños de grupos (50 kb, 100 kb, 200 kb y 1 Mb). Los P valores mostrados son para comparación de área bajo la curva con un tamaño de grupo de 1 Mb. Puede verse una tendencia a la mejora cuando el tamaño del grupo se redujo de 1 Mb a 200 kb.

F. Puntuación de probabilidad acumulada

La cantidad de regiones para metilación y ANC puede tener diversos valores. Los ejemplos anteriores han descrito varias regiones que superan un valor de punto de corte o un porcentaje de dichas regiones que han mostrado hipometilación o ANC significativas como un parámetro para clasificar si una muestra estaba asociada con cáncer. Dichos enfoques no tienen en cuenta la magnitud de la aberración para grupos individuales. Por ejemplo, un grupo con una Zmet de -3,5 sería igual que un grupo con una Zmet de -30 ya que ambos se clasificarían como poseedores de hipometilación significativa. Sin embargo, el grado de cambios de hipometilación en el plasma, es decir, la magnitud del valor de Zmet, se ve afectado por la cantidad de ADN asociado a cáncer en la muestra y, por lo tanto, puede complementar la información del porcentaje de grupos que muestran aberraciones para reflejar la carga tumoral. Una mayor concentración fraccional de ADN tumoral en la muestra de plasma conduciría a una menor densidad de metilación y esto se traduciría a un valor de Zmet menor.

1. Puntuación de probabilidad acumulada como un parámetro de diagnóstico

Para hacer uso de la información de la magnitud de las aberraciones, se desarrolló un enfoque denominado puntuación de probabilidad acumulada (PA). Basándose en la función de probabilidad de distribución normal, cada valor de Zmet se tradujo a una probabilidad de tener dicha observación al azar.

La puntuación de PA se calculó como:

donde Probi es la probabilidad para la Zmet del grupo (i) de acuerdo con la distribución de t de Student con 3 grados de libertad, y log es la función logarítmica natural. En otra realización, puede usarse un logaritmo con base 10 (u otro número). En otras realizaciones, pueden aplicarse otras distribuciones, por ejemplo, pero sin limitación, distribución normal y distribución gamma, para transformar la puntuación z en PA.

Una puntuación de PA mayor indica una menor probabilidad de tener dicha densidad de metilación desviada en una población normal al azar. Por lo tanto, una puntuación de PA alta indicaría una mayor probabilidad de tener ADN hipometilado de forma anómala en la muestra, por ejemplo la presencia de ADN asociado a cáncer.

En comparación con el porcentaje de grupos que muestran aberración, la medición de puntuación de PA tiene un mayor intervalo dinámico. Aunque las cargas tumorales entre diferentes pacientes pueden variar ampliamente, el mayor intervalo de valores de PA sería útil para reflejar las cargas tumorales de pacientes con cargas tumorales relativamente altas y relativamente bajas. Además, el uso de puntuaciones de PA puede ser potencialmente más sensible para detectar los cambios en la concentración de ADN asociado a tumor en plasma. Esto es ventajoso para la supervisión de respuesta al tratamiento y pronóstico. Por lo tanto, una reducción en las puntaciones de PA durante el tratamiento es indicativa de una buena respuesta al tratamiento. Una falta de reducción o incluso aumento en las puntuaciones de PA durante el tratamiento indicaría escasa respuesta o falta de respuesta. Para pronóstico, una alta puntuación de PA es indicativa de alta carga tumoral y sugiere un mal pronóstico (por ejemplo mayor probabilidad de muerte o progresión tumoral).

La FIGURA 44A muestra un rendimiento de diagnóstico para probabilidad acumulada (PA) y porcentaje de grupos con aberraciones. No hubo ninguna diferencia significativa entre las áreas bajo la curva para los dos tipos de algoritmo de diagnóstico (P = 0,791).

La FIGURA 44B muestra rendimientos de diagnóstico para el análisis de plasma con respecto a hipometilación global, hipermetilación de islas de CpG y ANC. Con un carril de secuenciación por muestra (200 kb de tamaño de grupo para análisis de hipometilación y 1 Mb de tamaño de grupo para ANC, e islas de CpG definidas de acuerdo con la base de datos alojada por la Universidad de California, Santa Cruz (UCSC)), las áreas bajo la curva para los tres tipos de análisis estuvieron por encima de 0,90.

En los análisis posteriores, se usó la mayor puntuación de PA en los sujetos de control como el punto de corte para cada uno de los tres tipos de análisis. La selección de estos puntos de corte proporcionó una especificidad de diagnóstico del 100 %. Las sensibilidades de diagnóstico para análisis de hipometilación general, hipermetilación de islas de CpG y ANC fueron del 78 %, 89 % y 52 %, respectivamente. En 43 de los 46 enfermos de cáncer, se detectó al menos uno de los tres tipos de aberraciones, dando lugar por lo tanto a una sensibilidad del 93,4 % y una especificidad del 100 %. Los resultados de los inventores indican que los tres tipos de análisis pueden usarse de forma sinérgica para la detección de cáncer.

La FIGURA 45 muestra una tabla con resultados para hipometilación global, hipermetilación de islas de CpG y ANC en enfermos de carcinoma hepatocelular. Los valores de punto de corte de puntuación de PA para los tres tipos de análisis fueron de 960, 2,9 y 211, respectivamente. Los resultados de puntuaciones de PA positivos estuvieron en negrita y subrayados.

La FIGURA 46 muestra una tabla con resultados para hipometilación global, hipermetilación de islas de CpG y ANC en pacientes que padecen cánceres distintos de carcinoma hepatocelular. Los valores de punto de corte de puntuación de PA para los tres tipos de análisis fueron de 960, 2,9 y 211, respectivamente. Los resultados de puntuación de PA positivos estuvieron en negrita y subrayados.

2. Aplicación de puntuación de PA para supervisión de cáncer

Se recogieron muestras en serie de un enfermo de CHC TBR34 antes y después del tratamiento. Las muestras se analizaron con respecto a hipometilación global.

La FIGURA 47 muestra un análisis en serie para metilación de plasma para el caso TBR34. El anillo más interno muestra la densidad de metilación de la capa leucocítica (negra) y tejidos tumorales (púrpura). Para las muestras de plasma, la Zmet se muestra para cada grupo de 1 Mb. La diferencia entre dos líneas representa una diferencia de Zmet de 5. Los puntos rojos y grises representan grupos con hipometilación y sin cambios en la densidad de metilación en comparación con el grupo de referencia. A partir del segundo anillo interno hacia fuera están las muestras de plasma tomadas antes del tratamiento, a los 3 días y a los 2 meses después de la resección tumoral, respectivamente. Antes del tratamiento, pudo observarse un mayor grado de hipometilación en el plasma y más del 18,5 % de los grupos tuvieron una Zmet de <-10. A los 3 días después de la resección tumoral, se pudo observar que el grado de metilación se redujo en el plasma con ninguno de los grupos con Zmet de <-10.

Tabla 5

La Tabla 5 muestra que aunque la magnitud de los cambios de hipometilación se redujo a los 3 días después de la resección quirúrgica del tumor, el porcentaje de grupos que mostraban aberración mostró un aumento paradójico. Por otro lado, la puntuación de PA reveló con más precisión la reducción en el grado de hipometilación en plasma y puede reflejar mejor los cambios en la carga tumoral.

A los 2 meses después de OT, aún hubo un porcentaje significativo de grupos que mostraban cambios de hipometilación. La puntuación de PA también permaneció estática a aproximadamente 15.000. Se diagnosticó posteriormente que este paciente tenía depósitos tumorales multifocales (previamente desconocidos en el momento de la cirugía) en el hígado no resecado restante a los 3 meses y se observó que tenía múltiples metástasis pulmonares a los 4 meses después de la operación. El paciente murió por enfermedad metastásica a los 8 meses después de la operación. Estos resultados sugirieron que la puntuación de PA podía ser más potente que el porcentaje de grupos con aberración para reflejar la carga tumoral.

En general, la PA puede ser útil para aplicaciones que requieran medir la cantidad de ADN tumoral en plasma. Los ejemplos de dichas aplicaciones incluyen: pronóstico y supervisión de enfermos de cáncer (por ejemplo para observar respuesta a tratamiento, o para observar progresión tumoral).

La puntuación z sumatoria es una suma directa de las puntuaciones z, es decir, sin convertir a una probabilidad. En este ejemplo, la puntuación z sumatoria muestra el mismo comportamiento que la puntuación de PA. En otros casos, PA puede ser más sensible que la puntuación z sumatoria para supervisar la enfermedad residual debido al mayor intervalo dinámico para la puntuación de PA.

X. Influencia de ANC en la metilación

El uso de ANC y metilación para determinar clasificaciones respectivas con respecto a un nivel de cáncer, donde las clasificaciones se combinan para proporcionar una tercera clasificación, se ha descrito anteriormente. Además de dicha combinación, ANC puede usarse para cambiar los valores de punto de corte para el análisis de metilación e identificar falsos positivos comparando los niveles de metilación para grupos de regiones que tengan diferentes características de ANC. Por ejemplo, el nivel de metilación para superabundancia (por ejemplo, Zanc >3) puede compararse con el nivel de metilación para abundancia normal (por ejemplo, -3 <Z_ANC<3). En primer lugar, se describe la influencia de ANC en los niveles de metilación.

A. Alteración en la densidad de metilación en regiones con ganancias y pérdidas cromosómicas

Como los tejidos tumorales generalmente muestran una hipometilación general, la presencia de ADN derivado de tumor en el plasma de enfermos de cáncer conduciría a la reducción en la densidad de metilación en comparación con sujetos sin cáncer. El grado de hipometilación en el plasma de enfermos de cáncer es teóricamente proporcional a la concentración fraccional de ADN derivado de tumor en la muestra de plasma.

Para regiones que muestran una ganancia cromosómica en los tejidos tumorales, se liberaría una dosificación adicional de ADN tumoral de los segmentos de ADN amplificados al plasma. Esta contribución aumentada de ADN tumoral al plasma teóricamente conduciría a un mayor grado de hipometilación en el ADN de plasma para la región afectada. Un factor adicional es que se esperaría que regiones genómicas que mostraban amplificación confirieran ventaja de crecimiento a las células tumorales, y por lo tanto se esperaría que se expresaran. Dichas regiones están en general hipometiladas.

Por el contrario, para regiones que muestran pérdida cromosómica en el tejido tumoral, la contribución reducida de ADN tumoral al plasma conduciría a un menor grado de hipometilación en comparación con regiones sin cambio del número de copias. Un factor adicional es que las regiones genómicas que se suprimen en células tumorales podrían contener genes supresores tumorales y podría ser ventajoso para células tumorales que dichas regiones estuvieran silenciadas. Por lo tanto, se espera que dichas regiones tengan una mayor probabilidad de estar hipermetiladas. Aquí, se usan los resultados de dos enfermos de CHC (TBR34 y TBR36) para ilustrar este efecto. Las FIGURAS 48A (TBR36) y 49A (TBR34) tienen círculos que destacan regiones con ganancias o pérdidas cromosómicas y el análisis de metilación correspondiente. Las FIGURAS 48B y 49B muestran representaciones de puntuaciones z de metilación para pérdidas, normales y ganancias para los pacientes TBR36 y TBR34, respectivamente.

La FIGURA 48A muestra representaciones de Circos que demuestran los cambios de ANC (anillo interno) y metilación (anillo externo) en el ADN de plasma tratado por bisulfito para el enfermo de CHC TBR36. Los círculos rojos destacan las regiones con ganancias o pérdidas cromosómicas. Las regiones que mostraban ganancias cromosómicas estaban más hipometiladas que regiones sin cambios del número de copias. Las regiones que mostraban pérdidas cromosómicas estaban menos hipometiladas que regiones sin cambios del número de copias. La FIGURA 48B es una representación de puntuaciones z de metilación para regiones con ganancias y pérdidas cromosómicas, y regiones sin cambio del número de copias para el enfermo de CHC TBR36. En comparación con regiones sin cambios de copias, las regiones con ganancias cromosómicas tuvieron más puntuaciones z negativas (más hipometilación) y regiones con pérdidas cromosómicas tuvieron menos puntuaciones z negativas (menos hipometiladas).

La FIGURA 49A muestra representaciones de Circos que demuestran los cambios de ANC (anillo interno) y metilación (anillo externo) en el ADN de plasma tratado por bisulfito para el enfermo de CHC TBR34. La FIGURA 49B es una representación de las puntuaciones z de metilación para regiones con ganancias y pérdidas cromosómicas, y regiones sin cambio del número de copias para el enfermo de CHC TBR34. La diferencia en las densidades de metilación entre regiones con ganancias y pérdidas cromosómicas fue mayor en el paciente TBR36 que en el paciente TBR34 debido a que la concentración fraccional de ADN derivado del tumor en el paciente anterior era mayor.

En este ejemplo, las regiones usadas para determinar ANC son las mismas que las regiones usadas para determinar la metilación. En una realización, los valores de punto de corte regionales respectivos dependen de si la región respectiva muestra una deleción o una amplificación. En una implementación, un valor de punto de corte regional respectivo (por ejemplo, el punto de corte de puntuación z usado para determinar la hipometilación) tiene una mayor magnitud cuando la región respectiva muestra una amplificación que cuando no se muestra amplificación (por ejemplo, la magnitud podría ser mayor de 3, y puede usarse un punto de corte de menos de -3). Por lo tanto, para ensayar la hipometilación, un valor de punto de corte regional respectivo puede tener un mayor valor negativo cuando la región respectiva muestra una amplificación que cuando no se muestra amplificación. Se espera que dicha implementación mejore la especificidad del ensayo para detectar cáncer.

En otra implementación, un valor de punto de corte regional respectivo tiene una menor magnitud (por ejemplo, menos de 3) que cuando la región respectiva muestra una deleción que cuando no se muestra deleción. Por lo tanto, para ensayar la hipometilación, un valor de punto de corte regional respectivo puede tener un valor menos negativo que cuando la región respectiva muestra una deleción que cuando no se muestra deleción. Se espera que dicha implementación mejore la sensibilidad del ensayo para detectar cáncer. El ajuste de los valores de punto de corte en las implementaciones anteriores puede cambiarse dependiendo de la sensibilidad y especificidad deseadas para un escenario de diagnóstico particular. En otras realizaciones, las mediciones de metilación y ANC pueden usarse junto con otros parámetros clínicos (por ejemplo resultados de captura de imágenes o bioquímica de suero) para predicción del cáncer.

B. Uso de ANC para seleccionar regiones

Como se ha descrito anteriormente, se ha mostrado que la densidad de metilación de plasma se alteraría en regiones que tengan aberraciones del número de copias en los tejidos tumorales. En regiones con ganancia del número de copias en el tejido tumoral, un aumento de la contribución de ADN tumoral hipometilado al plasma conduciría a un mayor grado de hipometilación de ADN de plasma en comparación con regiones sin una aberración del número de copias. Por el contrario, en regiones con pérdida de número de copias en el tejido tumoral, la contribución reducida de ADN derivado de cáncer hipometilado al plasma conduciría a un menor grado de hipometilación de ADN de plasma. Esta relación entre la densidad de metilación de ADN de plasma y la representación relativa puede usarse potencialmente para diferenciar resultados de hipometilación asociados con la presencia de ADN asociado a cáncer y otras causas no cancerosas (por ejemplo, LES) de hipometilación en ADN de plasma.

Para ilustrar este enfoque, se analizaron las muestras de plasma de dos enfermos de carcinoma hepatocelular (CHC) y dos pacientes con LES sin cáncer. Estos dos enfermos de LES (SLE04 y SLE10) mostraron la presencia aparente de hipometilación y ANC en plasma. Para el paciente SLE04, 84 % de los grupos mostraron hipometilación y 11,2 % de los grupos mostraron ANC. Para el paciente SLE10, 10,3 % de los grupos mostraron hipometilación y 5,7 % de los grupos mostraron ANC.

Las FIGURAS 50A y 50B muestran resultados de análisis de hipometilación y ANC de plasma para enfermos de LES SLE04 y SLE10. El círculo externo muestra las puntuaciones z de metilación (Zmet) a una resolución de 1 Mb. Los grupos con metilación Zmet <-3 estaban en rojo y los de Zmet >-3 estaban en gris. El círculo interno muestra las puntuaciones z de ANC (Z_ANC). Los puntos verdes, rojos y grises representan grupos con Z_ANC>3, <3 y entre -3 y 3, respectivamente. En estos dos enfermos de LES, se observaron cambios de hipometilación y ANC en plasma.

Para determinar si los cambios en metilación y ANC eran coherentes con la presencia de ADN derivado de cáncer en plasma, se comparó la Zmet para regiones con Z_ANC>3, <-3 y entre -3 y 3. Para cambios de metilación y ANC a los que contribuyó ADN derivado de cáncer en plasma, se esperaría que regiones con Z_ANC<-3 estuvieran menos hipometiladas y tuvieran menos Zmet negativa. Por el contrario, se esperaría que regiones con Zanc >3 estuvieran más hipometiladas y tuvieran más Zmet negativa. Para fines de ilustración, se aplicó un ensayo de suma de rangos unilaterales para comparar la Zmet para regiones con ANC (es decir regiones con Zanc <-3 o >3) con regiones sin ANC (es decir regiones con Z_ANCentre -3 y 3). En otras realizaciones, pueden usarse otros ensayos estadísticos, por ejemplo, pero sin limitación, ensayo de t de Student, ensayo de análisis de varianza (ANOVA) y ensayo de Kruskal-Wallis.

Las FIGURAS 51A y 51B muestran análisis de Zmet para regiones con y sin ANC para el plasma de dos enfermos de CHC (TBR34 y TBR36). Las regiones con Z_ANC<-3 y >3 representan regiones con infra y sobrerrepresentación en plasma, respectivamente. Tanto en TBR34 como en TBR36, las regiones que estaban infrarrepresentadas en plasma (es decir regiones con Zanc <-3) tuvieron Zmet significativamente mayor (P valor <10'5, ensayo de sumas de rangos unilaterales) que regiones con representación normal en plasma (es decir regiones con Zanc entre -3 y 3). Una representación normal corresponde a la esperada para un genoma euploide. Para regiones con sobrerrepresentación en plasma (es decir regiones con Zanc >3), tuvieron Zmet significativamente menor que regiones con representación normal en plasma (P valor <10'5, ensayo de sumas de rangos unilateral). Todos estos cambios fueron coherentes con la presencia de ADN tumoral hipometilado en las muestras de plasma.

Las FIGURAS 51C y 51D muestran análisis de Zmet para regiones con y sin ANC para el plasma de dos enfermos de LES (SLE04 y SLE10). Las regiones con Z_ANC<-3 y >3 representan regiones con infra y sobrerrepresentación en plasma, respectivamente. Para SLE04, las regiones que estaban infrarrepresentadas en plasma (es decir regiones con Z_ANC<-3) no tuvieron Zmet significativamente mayor (P valor = 0,99, ensayo de sumas de rangos unilateral) que regiones con representación normal en plasma (es decir regiones con Zanc entre -3 y 3) y regiones con sobrerrepresentación en plasma (es decir regiones con Zanc >3) no tuvieron Zmet significativamente menor que regiones con representación normal en plasma (P valor = 0,68, ensayo de suma de rangos unilateral). Estos resultados fueron diferentes de los cambios esperados debido a la presencia de ADN hipometilado derivado de tumor en plasma. De forma similar, para SLE10, las regiones con Z_ANC<-3 no tuvieron Zmet significativamente mayor que regiones con Zanc entre -3 y 3 (P valor = 0,99, ensayo de suma de rangos unilateral).

Una razón para no tener el patrón asociado a cáncer típico entre Zmet y Z_ANCen los enfermos de LES es que, en los enfermos de LES, la ANC no está presente en un tipo celular específico que también muestra hipometilación. En su lugar, la presencia aparente observada de ANC e hipometilación se debe a la distribución de tamaños alterada de ADN en circulación en enfermos de LES. La distribución de tamaños alterada podría alterar potencialmente las densidades de lectura secuenciadas para diferentes regiones genómicas lo que conduce a ANC aparentes ya que las referencias se obtuvieron de sujetos sanos. Como se ha descrito en las secciones anteriores, existe una correlación entre el tamaño de un fragmento de ADN en circulación y su densidad de metilación. Por lo tanto, la distribución de tamaños alterada también puede conducir a una metilación aberrante.

Aunque las regiones con Zanc >3 tuvieron niveles de metilación ligeramente menores que regiones con Zanc entre -3 y 3, el p valor para la comparación fue mucho mayor que los observados en dos enfermos de cáncer. En una realización, el p valor puede usarse como un parámetro para determinar la probabilidad de que un caso ensayado tenga cáncer. En otra realización, la diferencia en Zmet entre regiones con representación normal y aberrante puede usarse como un parámetro para indicar la probabilidad de la presencia de cáncer. En una realización, puede usarse un grupo de enfermos de cáncer para establecer la correlación entre Zmet y Zanc y para determinar los umbrales para diferentes parámetros para indicar que los cambios son coherentes con la presencia de ADN hipometilado derivado de cáncer en la muestra de plasma ensayada.

En consecuencia, en una realización, puede realizarse un análisis de ANC para determinar un primer conjunto de regiones que muestran todas: una deleción, una amplificación o representación normal. Por ejemplo, el primer conjunto de regiones pueden mostrar todas una deleción, o muestran todas una amplificación o muestran todas una representación normal (por ejemplo, tienen una primera cantidad normal de regiones, tal como una Zmet normal). Puede determinarse un nivel de metilación para este primer conjunto de regiones (por ejemplo, el primer nivel de metilación del método 2800 puede corresponder al primer conjunto de regiones).

El análisis de ANC puede determinar un segundo conjunto de regiones que muestran todas una segunda de: una deleción, una amplificación o representación normal. El segundo conjunto de regiones se mostraría de forma diferente al primer conjunto. Por ejemplo, si el primer conjunto de regiones fuera normal, entonces el segundo conjunto de regiones puede mostrar una deleción o una amplificación. Puede calcularse un segundo nivel de metilación basándose en los números respectivos de moléculas de ADN metiladas en sitios en el segundo conjunto de regiones.

Después puede calcularse un parámetro entre el primer nivel de metilación y la segunda metilación. Por ejemplo, puede calcularse una diferencia o relación y compararse con un valor de punto de corte. La diferencia o relación también puede someterse a una distribución de probabilidad (por ejemplo, como parte de un ensayo estadístico) para determinar la probabilidad de obtener el valor, y esta probabilidad puede compararse con un valor de punto de corte para determinar un nivel de cáncer basándose en niveles de metilación. Dicho punto de corte puede seleccionarse para diferenciar muestras que tengan cáncer y las que no tengan cáncer (por ejemplo, LES).

En una realización, puede determinarse un nivel de metilación para el primer conjunto de región o una mezcla de regiones (es decir, mezcla de regiones que muestran amplificación, deleción y normales). Este nivel de metilación puede después compararse con un primer punto de corte como parte de un primer estadio de análisis. Si se supera el punto de corte, lo que indica de este modo una posibilidad de cáncer, entonces el análisis anterior puede realizarse para determinar si la indicación fue un falso positivo. La clasificación final para el nivel de cáncer puede por lo tanto incluir la comparación del parámetro para los dos niveles de metilación con un segundo punto de corte. El primer nivel de metilación puede ser un valor estadístico (por ejemplo, promedio o mediana) de los niveles de metilación regionales calculados para cada región del primer conjunto de regiones. El segundo nivel de metilación también puede ser un valor estadístico de niveles de metilación regionales calculados para cada región del segundo conjunto de regiones. Como ejemplos, los valores estadísticos pueden determinarse usando de suma de rangos unilateral, ensayo de t de Student, ensayo de análisis de varianza (ANOVA) o ensayo de Kruskal-Wallis.

XI. CLASIFICACIÓN DEL TIPO DE CÁNCER

Además de determinar si un organismo tiene cáncer o no, las realizaciones pueden identificar un tipo de cáncer asociado con la muestra. La identificación del tipo de cáncer puede usar patrones de hipometilación global, hipermetilación de islas de CpG y/o ANC. Los patrones pueden implicar el agrupamiento de pacientes con un diagnóstico conocido usando niveles de metilación regional medidos, valores de a Nc respectivos para regiones y nivel de metilación para las islas de CpG. Los resultados posteriores muestran que organismos con un tipo similar de cáncer tienen valores similares para las regiones e islas de CpG, así como los pacientes sin cáncer que tienen valores similares. En el agrupamiento, cada uno de los valores para una región o isla puede ser una dimensión separada en el proceso de agrupamiento.

Se ha sabido que el mismo tipo de cánceres compartirían cambios genéticos y epigenéticos similares (E Gebhart et al., 2004 Cytogenet Genome Res; 104: 352-358; PA Jones et al., 2007 Cell; 128: 683-692). A continuación, se describe cómo los patrones de ANC y cambio de metilación detectados en el plasma son útiles para inferir el origen o tipo del cáncer. Las muestras de ADN de plasma de los enfermos de CHC, no enfermos de CHC y sujetos de control sanos se clasificaron usando, por ejemplo, análisis de agrupamiento jerárquico. El análisis se realizó usando, por ejemplo, la función heatmap.2 en el paquete de script R (cran.r-project.org/web/packages/gplots/gplots.pdf). Para ilustrar el potencial de este enfoque, se usaron dos conjuntos de criterios (grupo A y grupo B) como ejemplos para identificar elementos útiles para la clasificación de las muestras de plasma (véase Tabla 6). En otras realizaciones, pueden usarse otros criterios para identificar los elementos. Los elementos usados incluyeron ANC global a una resolución de 1 Mb, densidad de metilación global a una resolución de 1 Mb y metilación de islas de CpG.

Tabla 6

continuación

En los primeros dos ejemplos, se usaron todos los elementos de ANC, mutilación global a una resolución de 1 Mb y mutilación de islas de CpG para la clasificación. En otras realizaciones, pueden usarse otros criterios, por ejemplo, pero sin limitación, la precisión de medición del elemento en el plasma del grupo de referencia.

La FIGURA 52A muestra análisis de ag ^{o l} pamiento jerárquico para muestras de plasma de enfermos de CHC, enfermos de cáncer distinto de CHC y sujetos de control sano usando los 1.130 elementos del grupo A incluyendo 355 ANC, 584 elementos de metilación global a una resolución de 1 Mb y el estado de metilación de 110 islas de CpG. La barra de color de la parte superior representa los grupos de muestras: verde, azul y rojo representan los sujetos sanos, enfermos de CHC y enfermos de cáncer distinto de CHC, respectivamente. En general, los tres grupos de sujetos tienden a agruparse entre sí. El eje vertical representa los elementos de clasificación. Se agruparon entre sí elementos con patrones similares entre diferentes sujetos. Estos resultados sugieren que los patrones de cambios de metilación de islas de CpG, cambios de metilación de todo el genoma a una resolución de 1 Mb y ANC en plasma pueden usarse potencialmente para determinar el origen del cáncer en pacientes con primarios desconocidos.

La FIGURA 52B muestra análisis de agrupamiento jerárquico para muestras de plasma de enfermos de CHC, enfermos de cáncer distinto de CHC y sujetos de control sanos usando los 2.780 elementos del grupo B incluyendo 759 ANC, 1.911 de metilación global a una resolución de 1 Mb y el estado de metilación de 191 islas de CpG. La barra de color de la parte superior representa los grupos de muestras: verde, azul y rojo representan los sujetos sanos, enfermos de CHC y enfermos de cáncer distinto de CHC, respectivamente. En general, los tres grupos de sujetos tendieron a agruparse entre sí. El eje vertical representa los elementos de clasificación. Se agruparon entre sí elementos con patrones similares entre diferentes sujetos. Estos resultados sugieren que los patrones de diferentes conjuntos de cambios de metilación de islas de CpG, cambios de metilación de todo el genoma a una resolución de 1 Mb y ANC en plasma pueden usarse para determinar el origen del cáncer en pacientes con primarios desconocidos. La selección de los elementos de clasificación puede ajustarse para aplicaciones específicas. Además, puede darse peso a la predicción del tipo de cáncer según las probabilidades anteriores de los sujetos para diferentes tipos de cánceres. Por ejemplo, los pacientes con hepatitis vírica crónica son propensos al desarrollo de carcinoma hepatocelular y los fumadores crónicos son propensos al desarrollo de cáncer de pulmón. Por lo tanto, puede calcularse una probabilidad ponderada del tipo de cáncer usando, por ejemplo pero sin limitación, regresión logística, múltiple o de agrupamiento.

En otras realizaciones, puede usarse un único tipo de elementos para el análisis de clasificación. Por ejemplo, en los ejemplos siguientes, solamente se usaron la metilación global a una resolución de 1 Mb, la hipermetilación de islas de CpG o las ANC a una resolución de 1 Mb para el análisis de agrupamiento jerárquico. La potencia de diferenciación puede ser diferente cuando se usan diferentes elementos. El refinamiento adicional de los elementos de clasificación puede mejorar potencialmente las precisiones de clasificación.

La FIGURA 53A muestra análisis de agrupamiento jerárquico para muestras de plasma de enfermos de CHC, enfermos de cáncer distinto de CHC y sujetos de control sanos usando los elementos de metilación de islas de CpG del grupo A. En general, los enfermos de cáncer se agruparon entre sí y los sujetos sin cáncer estuvieron en otro grupo. Sin embargo, los enfermos de CHC y sin CHC estuvieron menos separados en comparación con el uso de los tres tipos de elementos.

La FIGURA 53B muestra el análisis de agrupamiento jerárquico para muestras de plasma de enfermos de CHC, enfermos de cáncer distinto de CHC y sujetos de control sanos usando las densidades de metilación globales del grupo A a una resolución de 1 Mb como elementos de clasificación. Se observó agrupamiento preferente de enfermos de CHC y sin CHC.

La FIGURA 54A muestra un análisis de agrupamiento jerárquico para muestras de plasma de enfermos de CHC, enfermos de cáncer distinto de CHC y sujetos de control sanos usando las ANC globales del grupo A a una resolución de 1 Mb como elementos de clasificación. Se vio agrupamiento preferente de enfermos de CHC y sin CHC.

La FIGURA 54B muestra un análisis de agrupamiento jerárquico para muestras de plasma de enfermos de CHC, enfermos de cáncer distinto de CHC y sujetos de control sanos usando las densidades de metilación de islas de CpG del grupo B como elementos de clasificación. Pudo observarse agrupamiento preferente de enfermos de CHC y de cáncer distinto de CHC.

La FIGURA 55A muestra un análisis de agrupamiento jerárquico para muestras de plasma de enfermos de CHC, enfermos de cáncer distinto de CHC y sujetos de control sanos usando las densidades de metilación globales del grupo B a una resolución de 1 Mb como elementos de clasificación. Se pudo observar agrupamiento preferente de enfermos de CHC y cáncer distinto de CHC.

La FIGURA 55B muestra un análisis de agrupamiento jerárquico para muestras de plasma de enfermos de CHC, enfermos de cáncer distinto de CHC y sujetos de control sanos usando las ANC globales del grupo B a una resolución de 1 Mb como elementos de clasificación. Se pudo observar agrupamiento preferente de enfermos de CHC y de cáncer distinto de CHC.

Estos resultados de agrupamiento jerárquico para muestras de plasma sugieren que la combinación de diferentes elementos puede usarse potencialmente para la identificación de los tipos de cáncer primarios. El refinamiento adicional de los criterios de selección puede mejorar adicionalmente de forma potencial la precisión de la clasificación.

En consecuencia, en una realización, cuando una clasificación de metilación indica que existe cáncer para el organismo, puede identificarse un tipo de cáncer asociado con el organismo comparando un nivel de metilación (por ejemplo, primera metilación del método 2800 o cualquier nivel de metilación regional) con un valor correspondiente determinado a partir de otros organismos (es decir, otros organismos del mismo tipo, tales como seres humanos). El valor correspondiente podría ser para una misma región o conjunto de sitios para el que se calculó el nivel de metilación. Se identifican al menos dos de los otros organismos como poseedores de diferentes tipos de cáncer. Por ejemplo, los valores correspondientes pueden organizarse en grupos, donde se asocian dos grupos con diferentes cánceres.

Además, cuando se usan ANC y metilación juntas para obtener una tercera clasificación del nivel de cáncer, pueden compararse los elementos de ANC y metilación con valores correspondientes de otros organismos. Por ejemplo, la primera cantidad de regiones (por ejemplo, de la FIGURA 36) que muestran una deleción o amplificación puede compararse con valores correspondientes determinados a partir de los otros organismos para identificar el tipo de cáncer asociado con el organismo.

En algunas realizaciones, los elementos de metilación son los niveles de metilación regionales de una pluralidad de regiones del genoma. Pueden usarse regiones que se ha determinado que tienen un nivel de metilación regional que supera el valor de punto de corte regional respectivo, por ejemplo, pueden compararse niveles de metilación regionales del organismo con niveles de metilación regionales de otros organismos para las mismas regiones del genoma. La comparación puede permitir diferenciar tipos de cáncer, o solamente proporcionar un filtro adicional para confirmar el cáncer (por ejemplo, para identificar falsos positivos). Por lo tanto, se puede determinar si el organismo tiene el primer tipo de cáncer, ausencia de cáncer o el segundo tipo de cáncer basándose en la comparación.

Los otros organismos (junto con el que se ensaya) pueden agruparse usando los niveles de metilación regionales. Por lo tanto, puede usarse una comparación de los niveles de metilación regionales para determinar a qué grupo pertenece el organismo. El agrupamiento también puede usar valores normalizados de ANC para regiones que se ha determinado que muestra una deleción o una amplificación, como se ha descrito anteriormente. Además, el agrupamiento puede usar las densidades de metilación respectivas de islas de CpG hipermetiladas.

Para ilustrar el principio de este método, se ha mostrado un ejemplo del uso de regresión logística para la clasificación de dos muestras desconocidas. El fin de esta clasificación fue determinar si estas dos muestras eran CHC o cánceres distintos de CHC. Se compiló un conjunto de entrenamiento de muestras que incluían 23 muestras de plasma recogidas de enfermos de CHC y 18 muestras de enfermos que padecen cáncer distinto de CHC. Por lo tanto, hubo un total de 41 casos en el conjunto de entrenamiento. En este ejemplo, se seleccionaron 13 elementos, incluyendo cinco elementos en la metilación de islas de CpG (X1-X5), seis elementos en la metilación de regiones de 1 Mb (X6-X11) y 2 elementos en la ANC de regiones de 1 Mb (X12-X13). Los elementos de metilación de CpG se seleccionaron basándose en el criterio de que al menos 15 casos en el conjunto de entrenamiento tengan una puntuación z de >3 o <-3. Los elementos de metilación de 1 Mb se seleccionaron basándose en el criterio de que al menos 39 casos en el conjunto de entrenamiento tengan una puntuación z de >3 o <-3. Los elementos de ANC se seleccionaron basándose en el criterio de que al menos 20 casos tengan una puntuación z de >3 o <-3. Se realizó regresión logística en las muestras de este conjunto de entrenamiento para determinar el coeficiente de regresión para cada uno de los elementos (X1-X13). Los elementos con coeficientes de regresión de las magnitudes mayores (independientemente de si está en un sentido positivo o negativo) ofrecen mejor diferenciación entre muestras de CHC y distintas de CHC. Las puntuaciones z de cada caso para los elementos respectivos se usaron como los valores de aporte de las variables independientes. Después se analizaron dos muestras de plasma, una de un enfermo de CHC (TRB36) y una de un paciente que padece cáncer de pulmón (TBR177) con respecto a los 13 elementos.

En este análisis de clasificación de tipo de cáncer, se supuso que estas dos muestras se recogían de pacientes que padecían cánceres de origen desconocido. Para cada muestra, las puntuaciones z para el elemento respectivo se pusieron en la ecuación de regresión logística para determinar el algoritmo natural de la relación de probabilidad (ln(relación de probabilidad)) donde la relación de probabilidad representaba la relación de probabilidades de tener CHC y no tener CHC (CHC/no CHC).

La Tabla 7 muestra los coeficientes de regresión para los 13 elementos de la ecuación de regresión logística. También se muestran las puntuaciones z para los elementos respectivos de los dos casos ensayados (TBR36 y TBR177). El ln(relación de probabilidad) de CHC para TBR36 y TBR177 fue de 37,03 y -4,37, respectivamente. A partir de estas relaciones de probabilidad, se calculó la probabilidad de recoger muestras de plasma de enfermos de CHC como >99,9 % y 1 %, respectivamente. Brevemente, TBR36 tuvo una mayor probabilidad de ser una muestra de un enfermo de c Hc , mientras que TBR177 tuvo una menor probabilidad de ser una muestra de un enfermo de CHC.

Tabla 7

En otras realizaciones, puede usarse regresión de agrupamiento jerárquico, análisis de árboles de clasificación y otros modelos de regresión para determinar el origen primario probable del cáncer.

XII. MATERIALES Y MÉTODOS

A. Preparación de bibliotecas de ADN tratado por bisulfito y secuenciación

Se fragmentó ADN genómico (5 |jg) al que se añadió ADN lambda desmetilado 0,5 % (p/p) (Promega) por un sistema Covaris S220 (Covaris) hasta aproximadamente 200 pb de longitud. Se prepararon bibliotecas de ADN usando el Kit de Preparación de Muestras de Secuenciación de Extremos Emparejados (Illumina) según las instrucciones del fabricante, excepto que se ligaron adaptadores metilados (Illumina) a los fragmentos de ADN. Después de dos ciclos de purificación usando perlas magnéticas AMPure XP (Beckman Coulter), los productos de ligamiento se dividieron en 2 partes, una de las cuales se sometió a 2 ciclos de modificación por bisulfito con un kit de Bisulfito EpiTect (Qiagen). Las citosinas desmetiladas en sitios de CpG en los insertos se convirtieron en uracilos mientras que las citosinas metiladas permanecieron sin cambios. Las moléculas de ADN ligadas a adaptadores, bien tratadas o bien no tratadas con bisulfito sódico, se enriquecieron por 10 ciclos de PCR usando la siguiente receta: 2,5 U de ADN polimerasa de inicio en caliente PfuTurboCx (Agilent Technologies), tampón de reacción PfuTurboCx 1X, dNTP 25 |^j M, 1 |jl de Cebador de PCR PE 1,0 y 1 j l de Cebador de PCR PE 2.0 (Illumina) en una reacción de 50 jl. El perfil de termociclación fue: 95 °C durante 2 min, 98 °C durante 30 s, después 10 ciclos de 98 °C durante 15 s, 60 °C durante 30 s y 72 °C durante 4 min, con una etapa final de 72 °C durante 10 min (R Lister, et al. 2009 Nature; 462: 315-322). Los productos de PCR se purificaron usando perlas magnéticas AMPure XP.

Se añadió ADN de plasma extraído de 3,2-4 ml de muestras de plasma materno con ADN lambda fragmentado (25 μg por ml de plasma) y se sometió a construcción de bibliotecas como se ha descrito anteriormente (RWK Chiu et al. 2011 BMJ; 342: c7401). Después de ligar con los adaptadores metilados, los productos de ligamiento se dividieron en 2 mitades y una parte se sometió a 2 ciclos de modificación por bisulfito. Los productos de ligamiento tratados o no tratados por bisulfito se enriquecieron después por 10 ciclos de PCR como se ha descrito anteriormente.

Las bibliotecas de ADN tratado o no tratado por bisulfito se secuenciaron para 75 pb en un formato de extremos emparejados en instrumentos HiSeq2000 (Illumina). Se generaron grupos de ADN con un Kit de Generación de Grupos de Extremos Emparejados v3 en un instrumento cBot (Illumina). Se realizó análisis de imágenes en tiempo real y determinación de bases usando el Software de Control HiSeq (HCS) v1.4 y Software de Análisis en Tiempo Real (RTA) v1.13 (Illumina), por los que la matriz automática y los cálculos de fase se basaron en el control de PhiX v3 añadido secuenciado con las bibliotecas de ADN.

B. Alineamiento de secuencias e identificación de citosinas metiladas

Después de la determinación de las bases, se retiraron las secuencias adaptadoras y bases de baja calidad (es decir puntuación de calidad <20) en los extremos de los fragmentos. Las lecturas recortadas en formato FASTQ se procesaron después por un proceso de análisis de datos de metilación denominado Methy-Pipe (P Jiang, et al. Methy-Pipe: An integrated bioinformatics data analysis pipeline for whole genome methylome analysis, artículo presentado en los Talleres de la Conferencia Internacional sobre Bioinformática y Biomedicina de IEEE, Hong Kong, del 18 al 21 de diciembre de 2010). Para alinear las lecturas de secuenciación convertidas por bisulfito, se realizó en primer lugar conversión por ordenador de todos los restos de citosina en timinas, en las cadenas de Watson y Crick por separado, usando el genoma humano de referencia (NCBI versión 36/hg18). Después se realizó conversión por ordenador de cada citosina en timina en todas las lecturas procesadas y se mantuvo la información posicional de cada resto convertido. Se usó SOAP2 (R Li, et al. 2009 Bioinformatics; 25: 1966-1967) para alinear las lecturas convertidas con los dos genomas humanos de referencia preconvertidos, con un máximo de dos desapareamientos permitidos para cada extremo alineado. Solamente se seleccionaron lecturas mapeables en una única localización genómica. Las lecturas ambiguas que se mapearon en las cadenas tanto de Watson como de Crick y lecturas duplicadas (clonales) que tenían en las mismas posiciones genómicas de inicio y fin se retiraron. Se conservaron lecturas secuenciadas con tamaño de inserto ≤600 pb para los análisis de metilación y tamaño.

Los restos de citosina en el contexto del dinucleótido de CpG fueron las dianas principales para los estudios de metilación de ADN cadena abajo. Después del alineamiento, las citosinas presentes originalmente en las lecturas secuenciadas se recuperaron basándose en la información posicional mantenida durante la conversión por ordenador. Las citosinas recuperadas entre los dinucleótidos de CpG se puntuaron como metiladas. Las timinas entre los dinucleótidos de CpG se puntuaron como desmetiladas. El ADN lambda desmetilado incluido durante la preparación de bibliotecas actuó como un control interno para estimar la eficacia de la modificación por bisulfito sódico. Todas las citosinas en el ADN lambda deberían haberse convertido en timinas si la eficacia de conversión por bisulfito fuera del 100 %.

XIII. SUMARIO

Con el uso de las realizaciones descritas en el presente documento, se podría explorar, detectar, supervisar o pronosticar el cáncer de forma no invasiva usando por ejemplo el plasma de un sujeto. También se podrían llevar a cabo exploración prenatal, diagnóstico, investigación o supervisión de un feto deduciendo el perfil de metilación de ADN fetal del plasma materno. Para ilustrar la potencia del enfoque, se ha mostrado que información que convencionalmente se ha obtenido mediante el estudio de tejidos placentarios podría evaluarse directamente a partir de plasma materno. Por ejemplo, el estado de impronta de loci génicos, identificación de loci con metilación diferencial entre el ADN fetal y materno y la variación gestacional en el perfil de metilación de loci génicos se consiguieron mediante el análisis directo de ADN de plasma materno. La principal ventaja del enfoque de los inventores es que el metiloma fetal podría evaluarse exhaustivamente durante el embarazo sin alteración del embarazo o la necesidad de tomar muestras de tejidos fetales de forma invasiva. Dada la asociación conocida entre el estado de metilación de ADN alterado y las muchas afecciones asociadas al embarazo, el enfoque descrito en este estudio puede actuar como una herramienta importante para investigar la patofisiología y la identificación de biomarcadores de esas afecciones. Centrándose en los loci con impronta, se ha mostrado que los perfiles de metilación fetales tanto transmitidos por vía paterna como transmitidos por vía materna podrían evaluarse a partir del plasma materno. Este enfoque puede ser potencialmente útil para la investigación de enfermedades con impronta. Las realizaciones también pueden aplicarse directamente para la evaluación prenatal de enfermedades asociadas al embarazo o fetales.

Se ha demostrado que la secuenciación por bisulfito de todo el genoma puede aplicarse para investigar el perfil de metilación de ADN de tejidos placentarios. Hay aproximadamente 28 M sitios de CpG en el genoma humano (C Clark et al., 2012 PLoS One; 7: e50233). Los datos de secuenciación por bisulfito de la CVS y muestra de tejido placentario a término abarcaron más del 80 % de los CpG. Esto representa una cobertura sustancialmente más amplia que la que puede conseguirse usando otras plataformas de alto rendimiento. Por ejemplo, la matriz de beadchip de 27K de Metilación Humana Illumina Infinium que se usó en un estudio previo en tejidos placentarios (T Chu et al., 2011 PLoS One; 6: e14723) solamente abarcó 0,1 % de los CpG en el genoma. La matriz de beadchip de 450K de Metilación Humana Illumina Infinium que estuvo disponible más recientemente solamente abarcó 1,7 % de los CpG (C Clark et al., 2012 PLoS One; 7: e50233). Debido a que el enfoque de SPM está libre de restricciones relacionadas con el diseño de sondas, la eficacia de hibridación o la fuerza de captura del anticuerpo, podrían evaluarse CpG dentro de o más allá de las islas de CpG y en la mayoría de contextos de secuencia.

XIV. SISTEMA INFORMÁTICO

Cualquiera de los sistemas informáticos mencionados en el presente documento puede utilizar cualquier número adecuado de subsistemas. Se muestran ejemplos de dichos subsistemas en la FIGURA 33 en el aparato informático 3300. En algunas realizaciones, un sistema informático incluye un único aparato informático, en el que los subsistemas pueden ser los componentes del aparato informático. En otras realizaciones, un sistema informático puede incluir múltiples aparatos informáticos, siendo cada uno un subsistema, con componentes internos.

Los subsistemas mostrados en la FIGURA 33 están interconectados mediante un bus de sistema 3375. Se muestran subsistemas adicionales tales como una impresora 3374, teclado 3378, dispositivo o dispositivos de almacenamiento 3379, monitor 3376, que está acoplado a un adaptador de presentación 3382, y otros. Pueden conectarse periféricos y dispositivos de entrada/salida (I/O), que se acoplan al controlador de I/O 3371, al sistema informático por cualquiera de varios medios conocidos en la técnica, tales como puerto en serie 3377. Por ejemplo, el puerto en serie 3377 o la interfaz externa 3381 (por ejemplo Ethernet, Wi-Fi, etc.) pueden usarse para conectar el sistema informático 3300 a una red de área amplia tal como Internet, un dispositivo de entrada de tipo ratón o un escáner. La interconexión mediante bus de sistema 3375 permite que el procesador central 3373 se comunique con cada subsistema y controle la ejecución de instrucciones de la memoria del sistema 3372 o el dispositivo o los dispositivos de almacenamiento 3379 (por ejemplo, un disco fijo), así como el intercambio de información entre subsistemas. La memoria del sistema 3372 y/o el dispositivo o los dispositivos de almacenamiento 3379 pueden incorporar un medio leíble por ordenador. Cualquiera de los valores mencionados en el presente documento puede extraerse en un componente a otro componente y puede presentarse al usuario.

Un sistema informático puede incluir una pluralidad de los mismos componentes o subsistemas, por ejemplo, conectados entre sí por la interfaz externa 3381 o por una interfaz interna. En algunas realizaciones, los sistemas informáticos, subsistemas o aparatos pueden comunicarse a través de una red. En dichos casos, un ordenador puede considerarse un cliente y otro ordenador un servidor, en los que cada uno puede ser parte de un mismo sistema informático. Un cliente y un servidor pueden incluir cada uno múltiples sistemas, subsistemas o componentes.

Debería entenderse que cualquiera de las realizaciones de la presente invención puede implementarse en forma de lógica de control usando hardware (por ejemplo un circuito integrado específico de aplicación o matriz de puertas programable in situ) y/o usando software informático con un procesador programable en general de una manera modular o integrada. Como se usa en el presente documento, un procesador incluye un procesador multinúcleo en la misma microplaca integrada, o múltiples unidades de procesamiento en una única placa de circuito o en red. Basándose en la divulgación y enseñanzas proporcionadas en el presente documento, un experto habitual en la materia conocerá y apreciará otros modos y/o métodos para implementar realizaciones de la presente invención usando hardware y una combinación de hardware y software.

Cualquiera de los componentes de software o funciones descritos en la presente solicitud puede implementarse como código de software para ejecutar por un procesador usando cualquier lenguaje informático adecuado tal como, por ejemplo, Java, C++ o Perl usando, por ejemplo, técnicas convencionales u orientadas a objetos. El código de software puede almacenarse como una serie de instrucciones o comandos en un medio leíble por ordenador para almacenamiento y/o transmisión, los medios adecuados incluyen memoria de acceso aleatorio (RAM), una memoria de solo lectura (ROM), un medio magnético tal como un disco duro o un disquete, o un medio óptico tal como un disco compacto (CD) o DVD (disco versátil digital), memoria flash y similares. El medio leíble por ordenador puede ser cualquier combinación de dichos dispositivos de almacenamiento o transmisión.

Dichos programas también pueden codificarse y transmitirse usando señales transportadoras adaptadas para transmisión mediante redes alámbricas, ópticas y/o inalámbricas que se adaptan a una diversidad de protocolos, incluyendo Internet. Como tal, un medio leíble por ordenador de acuerdo con una realización de la presente invención puede crearse usando una señal de datos codificada con dichos programas. Los medios leíbles por ordenador codificados con el código de programa pueden empaquetarse con un dispositivo compatible o proporcionarse por separado de otros dispositivos (por ejemplo, mediante descarga por Internet). Cualquiera de dichos medios leíbles por ordenador puede residir en o dentro de un único producto de programa informático (por ejemplo un disco duro, un CD o un sistema informático completo) y puede estar presente en o dentro de diferentes productos de programas informáticos dentro de un sistema o una red. Un sistema informático puede incluir un monitor, una impresora u otro sistema de representación adecuado para proporcionar cualquiera de los resultados mencionados en el presente documento a un usuario.

Cualquiera de los métodos descritos en el presente documento puede realizarse total o parcialmente con un sistema informático que incluya uno o más procesadores, que pueden configurarse para realizar las etapas. Por lo tanto, las realizaciones pueden dirigirse a sistemas informáticos configurados para realizar las etapas de cualquiera de los métodos descritos en el presente documento, potencialmente con diferentes componentes que realizan una etapa respectiva o un grupo respectivo de etapas. Aunque se presentan como etapas numeradas, las etapas de métodos del presente documento pueden realizarse en el mismo momento o en un orden diferente. Adicionalmente, partes de estas etapas pueden usarse con partes de otras etapas de otros métodos. Además, toda o partes de una etapa pueden ser opcionales. Adicionalmente, cualquiera de las etapas de cualquiera de los métodos puede realizarse con módulos, circuitos u otros medios para realizar estas etapas.

Los detalles específicos de realizaciones particulares pueden combinarse de cualquier manera adecuada sin alejarse del alcance de realizaciones de la invención. Sin embargo, otras realizaciones de la invención pueden dirigirse a realizaciones específicas relacionadas con cada aspecto individual o combinaciones específicas de estos aspectos individuales.

La descripción anterior de realizaciones ejemplares de la invención se ha presentado para los fines de ilustración y descripción. No se pretende que sean exhaustivas o que limiten la invención a la forma precisa descrita, y muchas modificaciones y variaciones son posibles a la luz de la enseñanza anterior. Las realizaciones se han elegido y descrito para explicar mejor los principios de la invención y sus aplicaciones prácticas para permitir de este modo que otros expertos en la materia utilicen mejor la invención en diversas realizaciones y con diversas modificaciones según sean adecuadas para el uso particular contemplado.

Se pretende que una cita de “un” o “el” signifique “uno o más” a no ser que se indique específicamente lo contrario.

Tabla S2A. Lista de las 100 regiones más hipermetiladas identificadas de la muestra de vellosidad coriónica del primer trimestre y células sanguíneas maternas

(continuación)

(continuación)

Tabla S2B. Lista de las 100 regiones más hipometiladas identificadas de muestra de vellosidad coriónica del primer trimestre y células sanguíneas maternas

(continuación)

(continuación)

Tabla S2C. Lista de las 100 regiones más hipermetiladas identificadas de tejido placentario de tercer trimestre y células sanguíneas maternas

(continuación)

(continuación)

Tabla S2D. Lista de las 100 regiones más hipometiladas identificadas de tejido placentario de tercer trimestre y células sanguíneas maternas

(continuación)

(continuación)

Tabla S3A. Lista de los 100 loci superiores que se ha deducido que están hipermetilados a partir de los datos de secuenciación por bisulfito de plasma materno de primer trimestre.

(continuación)

(continuación)

Tabla S3B. Lista de los 100 loci superiores que se ha deducido que están hipometilados a partir de los datos de secuenciación por bisulfito de plasma materno de primer trimestre.

(continuación)

(continuación)

, , ,

Tabla S3C. Lista de los 100 loci superiores que se ha deducido que están hipermetilados a partir de los datos de secuenciación por bisulfito de plasma materno del tercer trimestre.

C Cé í f

(continuación)

(continuación)

Tabla S3D. Lista de los 100 loci superiores que se ha deducido que están hipometilados a partir de los datos maternos.

(continuación)

(continuación)

Claims

REIVINDICACIONES

1. Un método para analizar una muestra biológica de un organismo, incluyendo la muestra biológica ADN sin células que se origina de células normales y potencialmente de células asociadas con cáncer, comprendiendo el método: analizar una pluralidad de moléculas de ADN sin células de la muestra biológica, donde el análisis de una molécula de ADN incluye:

determinar una localización de la molécula de ADN en un genoma del organismo; y

determinar si la molécula de ADN está metilada en uno o más sitios en donde la determinación incluye realizar secuenciación en paralelo masiva sensible a la metilación de ADN convertido por bisulfito;

para cada uno de una pluralidad de sitios, determinar un número respectivo de moléculas de ADN que están metiladas en el sitio;

calcular un primer nivel de metilación basándose en los números respectivos de moléculas de ADN metiladas en la pluralidad de sitios;

comparar el primer nivel de metilación con un primer valor de punto de corte; y

determinar una primera clasificación de un nivel de cáncer basándose en la comparación.

2. El método de la reivindicación 1, que comprende además:

para cada una de una primera pluralidad de regiones del genoma:

determinar que un número respectivo de moléculas de ADN son de la región;

calcular un valor normalizado respectivo a partir del número respectivo; y

comparar el valor normalizado respectivo con un valor de referencia para determinar si la región respectiva muestra una deleción o una amplificación;

determinar una primera cantidad de regiones que se ha determinado que muestran una deleción o una amplificación;

comparar la primera cantidad con un primer valor umbral para determinar una segunda clasificación de un nivel de cáncer; y

usar la primera clasificación y la segunda clasificación para determinar una tercera clasificación de un nivel de cáncer.

3. El método de la reivindicación 1 o 2, donde el cálculo del primer nivel de metilación incluye:

identificar una segunda pluralidad de regiones del genoma;

identificar uno o más sitios dentro de cada una de las regiones; y

calcular un nivel de metilación regional para cada región, donde el primer nivel de metilación es para una primera región, comprendiendo el método además:

comparar cada uno de los niveles de metilación regionales con un valor de punto de corte regional respectivo, incluyendo comparar el primer nivel de metilación con el primer valor de punto de corte;

determinar una segunda cantidad de regiones que se ha determinado que tienen un nivel de metilación regional que supera el valor de punto de corte regional respectivo; y

comparar la segunda cantidad de regiones con un segundo valor umbral para determinar la primera clasificación.

4. El método de la reivindicación 3, donde las regiones que se ha determinado que tienen un nivel de metilación regional que supera el valor de punto de corte regional respectivo corresponden a un primer conjunto de regiones, comprendiendo el método además:

comparar los niveles de metilación regionales del primer conjunto de regiones con los niveles de metilación regionales correspondientes de otros organismos para el primer conjunto de regiones; teniendo los otros organismos al menos dos de: un primer tipo de cáncer, ausencia de cáncer y un segundo tipo de cáncer; y determinar si el organismo tiene el primer tipo de cáncer, ausencia de cáncer o el segundo tipo de cáncer basándose en la comparación.

5. El método de la reivindicación 4, que comprende además:

agrupar los otros organismos basándose en los niveles de metilación regionales del primer conjunto de regiones, donde dos de los grupos corresponden a dos cualesquiera de: el primer tipo de cáncer, ausencia de cáncer y el segundo tipo de cáncer, donde la comparación de los niveles de metilación regionales determina a qué grupo pertenece el organismo.

6. El método de la reivindicación 5, donde el agolpamiento de los otros organismos se basa además en valores normalizados respectivos de un segundo conjunto de regiones para los otros organismos, el segundo conjunto de regiones corresponde a regiones que se ha determinado que muestran una deleción o una amplificación, donde el valor normalizado respectivo para una región se determina a partir de un número respectivo de moléculas de ADN de la región, comprendiendo el método además:

para cada una del segundo conjunto de regiones:

determinar un número respectivo de moléculas de ADN que son de la región; y

calcular un valor normalizado respectivo a partir del número respectivo; y

comparar los valores normalizados respectivos del segundo conjunto de regiones para el organismo con los valores normalizados respectivos de los otros organismos como parte de la determinación de a qué grupo pertenece el organismo.

7. El método de la reivindicación 6, donde el agrupamiento de los otros organismos se basa además en densidades de metilación respectivas de islas de CpG hipermetiladas, comprendiendo el método además:

para cada una de las islas de CpG hipermetiladas, determinar una densidad de metilación respectiva; y comparar las densidades de metilación respectivas de las islas de CpG hipermetiladas para el organismo con las densidades de metilación de los otros organismos como parte de la determinación de a qué grupo pertenece el organismo.

8. El método de la reivindicación 3, que comprende además:

para cada una de la segunda pluralidad de regiones:

calcular una diferencia respectiva entre el nivel de metilación regional y el valor de punto de corte regional respectivo; y

calcular una probabilidad respectiva correspondiente a la diferencia respectiva;

donde la determinación de la segunda cantidad de regiones incluye calcular una puntuación acumulada que incluye las probabilidades respectivas.

9. El método de la reivindicación 3, que comprende además:

para cada una de la primera pluralidad de regiones:

calcular una diferencia respectiva entre el valor normalizado respectivo y el valor de referencia; y calcular una probabilidad respectiva correspondiente a la diferencia respectiva;

donde la determinación de la primera cantidad de regiones incluye calcular una primera suma que incluye las probabilidades respectivas.

10. El método de la reivindicación 3, donde la muestra biológica se toma antes del tratamiento, comprendiendo el método además:

repetir el método de la reivindicación 3 para otra muestra biológica tomada después del tratamiento para obtener: una primera cantidad posterior de regiones que se ha determinado que muestran una deleción o una amplificación; y

una segunda cantidad posterior de regiones que se ha determinado que tienen un nivel de metilación regional que supera el valor de punto de corte regional respectivo; y

comparar la primera cantidad con la primera cantidad posterior y la segunda cantidad con la segunda cantidad posterior para determinar un pronóstico del organismo, y

donde la comparación de la primera cantidad con la primera cantidad posterior y la segunda cantidad con la segunda cantidad posterior para determinar el pronóstico del organismo incluye:

determinar una primera diferencia entre la primera cantidad y la primera cantidad posterior;

comparar la primera diferencia con uno o más primeros umbrales de diferencia;

determinar una segunda diferencia entre la segunda cantidad y la segunda cantidad posterior; y comparar la segunda diferencia con uno o más segundos umbrales de diferencia.

11. El método de la reivindicación 1, donde la comparación del primer nivel de metilación con el primer valor de punto de corte incluye:

determinar una diferencia entre el primer nivel de mutilación y un nivel de mutilación de referencia; y comparar la diferencia con un umbral correspondiente al primer valor de punto de corte.

12. El método de la reivindicación 1, que comprende además:

determinar si una concentración fraccional de ADN tumoral en la muestra biológica es mayor que un valor mínimo; y

si la concentración fraccional no es mayor que el valor mínimo, marcar la muestra biológica, donde el valor mínimo se determina basándose en una diferencia esperada en los niveles de metilación para un tumor en relación con un nivel de metilación de referencia.

13. El método de la reivindicación 1, que comprende además:

medir un tamaño de moléculas de ADN en la pluralidad de sitios; y

antes de comparar el primer nivel de metilación con el primer valor de punto de corte, normalizar el primer nivel de metilación basándose en los tamaños medidos de las moléculas de ADN.

14. El método de la reivindicación 1, donde la pluralidad de sitios incluye sitios de CpG, donde los sitios de CpG se organizan en una pluralidad de islas de CpG, incluyendo cada isla de CpG uno o más sitios de CpG, donde el primer nivel de metilación corresponde a una primera isla de CpG, que comprende además:

para cada una de las islas de CpG, determinar si la isla de CpG está hipermetilada en relación con un grupo de referencia de muestras de otros organismos comparando un nivel de metilación de la isla de CpG con un valor de punto de corte respectivo;

para cada una de las islas de CpG hipermetiladas, determinar una densidad de metilación respectiva; calcular una puntuación acumulada de las densidades de metilación respectivas; y

comparar la puntuación acumulada con un valor de punto de corte acumulado para determinar la primera clasificación.

15. El método de la reivindicación 1, que comprende además:

para cada una de una primera pluralidad de regiones del genoma:

determinar un número respectivo de moléculas de ADN que son de la región;

calcular un valor normalizado respectivo a partir del número respectivo; y

determinar un primer conjunto de regiones que se ha determinado que muestran todas una de: una deleción, una amplificación o representación normal, donde el primer nivel de metilación corresponde al primer conjunto de regiones;

determinar un segundo conjunto de regiones que se ha determinado que muestran todas una segunda de: una deleción, una amplificación o representación normal; y

calcular un segundo nivel de metilación basándose en los números respectivos de moléculas de ADN metiladas en sitios en el segundo conjunto de regiones,

donde la comparación del primer nivel de metilación con el primer valor de punto de corte incluye:

calcular un parámetro entre el primer nivel de metilación y la segunda metilación; y

comparar el parámetro con el primer valor de punto de corte.

16. Un programa informático que comprende una pluralidad de instrucciones con capacidad de ejecución por un sistema informático, que cuando se ejecutan de este modo controlan el sistema informático para realizar el método de una cualquiera de las reivindicaciones precedentes.