ES2712798T3 - Detección de neoplasias - Google Patents

Detección de neoplasias Download PDF

Info

Publication number
ES2712798T3
ES2712798T3 ES14776150T ES14776150T ES2712798T3 ES 2712798 T3 ES2712798 T3 ES 2712798T3 ES 14776150 T ES14776150 T ES 14776150T ES 14776150 T ES14776150 T ES 14776150T ES 2712798 T3 ES2712798 T3 ES 2712798T3
Authority
ES
Spain
Prior art keywords
methylation
marker
dna
markers
sample
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
ES14776150T
Other languages
English (en)
Inventor
David A Ahlquist
John B Kisiel
William R Taylor
Tracy C Yab
Douglas W Mahoney
Graham Lidgard
Hatim Allawi
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Exact Sciences Development Co LLC
Original Assignee
Exact Sciences Development Co LLC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Exact Sciences Development Co LLC filed Critical Exact Sciences Development Co LLC
Application granted granted Critical
Publication of ES2712798T3 publication Critical patent/ES2712798T3/es
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6883Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
    • C12Q1/6886Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material for cancer
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/112Disease subtyping, staging or classification
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/154Methylation markers

Landscapes

  • Chemical & Material Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Organic Chemistry (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Engineering & Computer Science (AREA)
  • Immunology (AREA)
  • Pathology (AREA)
  • Analytical Chemistry (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Genetics & Genomics (AREA)
  • Hospice & Palliative Care (AREA)
  • Biochemistry (AREA)
  • Microbiology (AREA)
  • Molecular Biology (AREA)
  • Biophysics (AREA)
  • Physics & Mathematics (AREA)
  • Oncology (AREA)
  • Biotechnology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Nitrogen And Oxygen Or Sulfur-Condensed Heterocyclic Ring Systems (AREA)
  • Magnetic Resonance Imaging Apparatus (AREA)

Abstract

procedimiento para cribar una neoplasia en una muestra obtenida de un sujeto, comprendiendo el procedimiento: 1) analizar el estado de metilación de un marcador en una muestra obtenida de un sujeto; y 2) identificar el sujeto que tiene una neoplasia cuando el estado de metilación del marcador es diferente de un estado de metilación del marcador analizado en un sujeto que no tiene una neoplasia, en el que una región cromosómica que tiene una anotación CLEC11A comprende el marcador, en el que el marcador comprende una base en una región metilada de manera diferencial (DMR) seleccionada entre DMR 29 o 30 de la Tabla 1, o DMR 64 de la Tabla 10, en el que la neoplasia es una neoplasia gastrointestinal, una neoplasia del páncreas, una neoplasia colorrectal, una neoplasia del estómago, o una neoplasia del esófago.

Description

DESCRIPCION
Deteccion de neoplasias
Campo de la invencion
Se proporciona en el presente documento una tecnologfa relacionada con la deteccion de neoplasias y, en particular, pero no exclusivamente, a procedimientos, composiciones, y usos relacionados para detectar neoplasias malignas y premalignas tales como el cancer pancreatico y el cancer colorrectal.
Antecedentes
En su conjunto, los canceres gastrointestinales representan mas mortalidad por cancer que cualquier otro sistema organico. Aunque en la actualidad existe un cribado de canceres colorrectales, la mortalidad anual en Estados Unidos producida por canceres del tracto gastrointestinal superior supera las 90.000, en comparacion con las aproximadamente 50.000 para el cancer colorrectal. Asombrosamente, 43.000 hombres y mujeres se diagnostican cada ano con cancer pancreatico (PanC), lo que producira casi 37.000 muertes anuales (Jemal y col. (2010) "Cancer statistics" CA Cancer J Clin 60: 277-300). Como resultado, PanC es la cuarta causa de muerte por cancer principal (id). Los pacientes que presentan sfntomas habitualmente ya se encuentran en un estado avanzado de la enfermedad y solamente un 15 % cumplen los criterios de una cirugfa potencialmente curativa (Ghaneh y col. (2007) "Biology and management of pancreatic cancer" Gut 56: 1134-52). A pesar de la cirugfa, el 85 % morira por enfermedad recurrente (Sohn y col. (2000) "Resected adenocarcinoma of the pancreas-616 patients: results, outcomes, and prognostic indicators" J Gastrointest Surg 4: 567-79). La mortalidad por PanC supera el 95 % y la supervivencia a 5 anos es menos del 25 % para en los pacientes que se han sometido a cirugfa curativa (Cleary y col (2004) "Prognostic factors in resected pancreatic adenocarcinoma: analysis of actual 5-year survivors" J Am Coll Surg 198: 722-31; Yeo y col (1995) "Pancreaticoduodenectomy for cancer of the head of the pancreas. 201 patients" Ann Surg 221: 721-33).
Entre los pacientes con predisposicion sindromica a PanC o antecedentes familiares fuertes, las estrategias de cribado agresivas e invasivas usando exploraciones por tomograffa computerizada o ultrasonidos con endoscopia has mostrado un rendimiento del 10 % para neoplasias (Canto y col. (2006) "Screening for early pancreatic neoplasia in high-risk individuals: a prospective controlled study" Clin Gastroenterol Hepatol 4: 766-81). Esta estrategia de cribado no es practica para la poblacion en general, donde la mayorfa del PanC se produce sin una predisposicion conocida (Klein y col. (2001) "Familial pancreatic cancer" Cancer J 7: 266-73).
La casi uniforme letalidad del PanC ha generado mucho interes en la comprension de la biologfa del tumor pancreatico. Se han identificado lesiones precursoras, incluidas la neoplasia intraepitelial pancreatica (PanIN, grados I-III) y la neoplasia mucinosa papilar intraductal (IPMN) (Fernandez-del Castillo y col. (2010) "Intraductal papillary mucinous neoplasms of the pancreas" Gastroenterology 139: 708-13, 713.e1-2; Haugk (2010) "Pancreatic intraepithelial neoplasia - can we detect early pancreatic cancer?" Histopathology 57: 503-14). El estudio de las lesiones tanto precursoras como malignas ha identificado numerosas caracterfsticas moleculares en niveles geneticos, epigeneticos, y proteomicos que se podrfan aprovechar para la terapia o usarse como biomarcadores para la deteccion precoz y el cribado (Kaiser (2008) "Cancer genetics. A detailed genetic portrait of the deadliest human cancers" Science 321: 1280-1; Omura y col. (2009) "Epigenetics and epigenetic alterations in pancreatic cancer" Int J Clin Exp Pathol 2: 310-26; Tonack y col. (2009) "Pancreatic cancer: proteomic approaches to a challenging disease" Pancreatology 9: 567-76). Recientes estudios de cartografiado de lesiones tumorales y metastasicas han mostrado que puede haber un perfodo latencia significativo entre el desarrollo del PanC maligno y el desarrollo de la enfermedad metastasica, lo que sugiere la existencia de una amplia ventana de oportunidad para la deteccion y el tratamiento curativo de lesiones presintomaticas en la etapa inicial (Yachida y col. (2010) "Distant metastasis occurs late during the genetic evolution of pancreatic cancer" Nature 467: 1114-7).
PanC emite (por ejemplo, exfolia) las celulas y el ADN a los efluentes locales y finalmente a las heces. Por ejemplo, se puede identificar (por ejemplo, secuenciarse) un ADN que contiene un gen KRAS mutante a partir del jugo pancreatico de pacientes con cancer pancreatico, PanIN, e IPMN (Yamaguchi y col. (2005) "Pancreatic juice cytology in IPMN of the pancreas" Pancreatology 5: 416-21). Anteriormente, se han usado ensayos de alta sensibilidad para detectar ADN mutante en heces emparejadas de pacientes con cancer de pancreas de los que se sabfa que sus tumores extirpados contenfan las mismas secuencias (Zou y col (2009) "T2036 PanDetection of Gastrointestinal Neoplasms By Stool DNA Testing: Establishment of Feasibility" Gastroenterology 136: A-625). Una limitacion en el numero de marcadores esta relacionada con el procedimiento no desvelado de su deteccion en ensayos convencionales; de forma tfpica, cada sitio de mutacion para multiples genes se puede estudiar por separado para conseguir alta sensibilidad.
El ADN metilado se ha estudiado como una clase potencial de biomarcadores en los tejidos de la mayorfa de los tumores. En muchos casos, las ADN metiltransferasas anaden un grupo metilo al ADN en los sitios de islas citosinafosfato-guanina (CpG) en forma de un control epigenetico o expresion genica. En un mecanismo atractivo en biologfa, se cree que los eventos de metilacion adquirida en regiones promotoras de los genes supresores tumorales silencian la expresion, contribuyendo de esta forma a la oncogenesis. La metilacion del a Dn puede ser una herramienta diagnostica mas estable quimica y biologicamente que la expresion de ARN o de protefnas (Laird (2010) "Principles and challenges of genome-wide DNA methylation analysis" Nat Rev Genet 11: 191-203). Ademas, en otros canceres, como el cancer de colon esporadico, los marcadores de la metilacion ofrecen una especificidad excelente y son muchos mas informativos y sensibles que las mutaciones individuales en el ADN (Zou y col (2007) "Highly methylated genes in colorectal neoplasia: implications for screening" Cancer Epidemiol Biomarkers Prev 16: 2686-96).
El analisis de las islas CpG ha proporcionado hallazgos importantes cuando se aplican a modelos animales, y lfneas de celulas humanas. Por ejemplo, Zhang y colaboradores han descubierto que amplicones de diferentes partes de la misma isla CpG pueden tener diferentes niveles de metilacion (Zhang y col. (2009) "DNA methylation analysis of chromosome 21 gene promoters at single base pair and single allele resolution" PLoS Genet 5: e1000438). Ademas, los niveles de metilacion estaban distribuidos bimodalmente entre secuencias fuertemente metiladas y no metiladas, respaldando ademas el patron binario de la actividad de la ADN metiltransferasa analogo a un interruptor (Zhang y col. (2009) "DNA methylation analysis of chromosome 21 gene promoters at single base pair and single allele resolution" PLoS Genet 5: e1000438). El analisis de tejidos murino in vivo y de lfneas de celulas in vitro ha demostrado que solo aproximadamente un 0,3 % de los promotores con alta densidad de CpG (HCP, definido por tener >7 % de secuencia CpG dentro de una region de 300 pares de bases) esta metilado, mientras que zonas con baja densidad de CpG (LCP, definido por tener <5 % de secuencias CpG en una region de 300 pares de bases) mostraban tendencia a estar frecuentemente metiladas con un patron dinamico especffico de tejido (Meissner y col. (2008) "Genome-scale DNA methylation maps of pluripotent and differentiated cells" Nature 454: 766-70). Los HCP incluyen promotores para genes constitutivos ubicuos y genes con el desarrollo fuertemente regulado. Entre los sitios HCP metilados >50 % se encuentran varios marcadores establecidos tales como Wnt 2, NDRG2, SFRP2, y BMP3 (Meissner y col. (2008) "Genome-scale DNA methylation maps of pluripotent and differentiated cells" Nature 454: 766-70).
Para el cancer pancreatico, lesiones PanIN, y IPMN, se ha estudiado la metilacion de marcadores a nivel tisular (Omura y col. (2008) "Genome-wide profiling of methylated promoters in pancreatic adenocarcinoma" Cancer Biol Ther 7: 1146-56; Sato y col. (2008) "CpG island methylation profile of pancreatic intraepithelial neoplasia" Mod Pathol 21: 238-44; Hong y col. (2008) "Multiple genes are hypermethylated in intraductal papillary mucinous neoplasms of the pancreas" Mod Pathol 21: 1499-507). Por ejemplo, los marcadores MDFI, ZNF415, CNTNAP2, y ELOVL4 estaban fuertemente metilados en el 96 %, 86 %, 82 %, y 68 % de los canceres estudiados mientras que, comparativamente, colo el 9 %, 6 %, 3 %, y 7 % de los pancreas de control (no cancerosos(, respectivamente, estaban fuertemente metilados en los mismos cuatro loci (Omura y col. (2008) "Genomewide profiling of methylated promoters in pancreatic adenocarcinoma" Cancer Biol Ther 7: 1146-56). Se ha descubierto que la medicion del estado de metilacion tanto de MDFI como de CNTNAP2 proporciona un indicador del cancer pancreatico que tiene al mismo tiempo una elevada sensibilidad (>90 %) y una elevada especificidad (>85 %) (Omura y col. (2008) "Genome­ wide profiling of methylated promoters in pancreatic adenocarcinoma" Cancer Biol Ther 7: 1146-56).
Ademas, Sato y colaboradores han descubierto ocho genes que se expresan de forma diferentes en lfneas celulares de cancer pancreatico antes y despues del tratamiento con un inhibidor de la metiltransferasa (Sato y col. (2003) "Discovery of novel targets for aberrant methylation in pancreatic carcinoma using high-throughput microarrays" Cancer Res 63: 3735-42). Posteriormente, estos marcadores se evaluaron mediante PCR especffica de metilacion (MSP) del ADN de lesiones de Pan-IN. Los resultados mostraron que SARP-2 (protefna 1 relacionada con Frizzled secretada, SFRP1) tenia un 83 % de sensibilidad y podrfa discriminar entre Pan-IN 2 y Pan-IN 3 de grado superior (Sato y col. (2008) "CpG island methylation profile of pancreatic intraepithelial neoplasia" Mod Pathol 21: 238-44). La discriminacion de un precursor de alto grado o cancer en etapa inicial de una lesion de grado menor es importante cuando se considera la morbilidad de la pancreaticoduodenectomfa o la pancreatectomfa distal, las principales terapias quirurgicas del PanC. Cuando estudiaron los precursores IPMN tanto del conducto principal como de la rama lateral, Hong y colaboradores mostraron una elevada sensibilidad y especificidad para SFRP1, asf como, especialmente en combinacion con UCHL1 (Hong y col. (2008) "Multiple genes are hypermethylated in intraductal papillary mucinous neoplasms of the pancreas" Mod Pathol 21: 1499-507). El inhibidor de la ruta del factor tisular 2 (TFPI2) tiene un papel supresor tumoral bien establecido en neoplasias malignas del GU y el GI, incluidos los canceres de prostata, de cuello de utero, colorrectal, gastrico, esofagico y pancreatico (Ma y col. (2011) "MicroRNA-616 induces androgen-independent growth of prostate cancer cells by suppressing expression of tissue factor pathway inhibitor TFPI-2" Cancer Res 71: 583-92; Lim y col. (2010) "Cervical dysplasia: assessing methylation status (Methylight) of CCNA1, DAPK1, HS3ST2, PAX1 and t Fp I2 to improve diagnostic accuracy" Gynecol Oncol 119: 225­ 31; Hibi y col. (2010) "Methylation of TFPI2 gene is frequently detected in advanced well-differentiated colorectal cancer" Anticancer Res 30: 1205-7; Glockner y col. (2009) "Methylation of TFPI2 in stool DNA: a potential novel biomarker for the detection of colorectal cancer" Cancer Res 69: 4691-9; Hibi y col. (2010) "Methylation of the TFPI2 gene is frequently detected in advanced gastric carcinoma" Anticancer Res 30: 4131-3; Tsunoda y col. (2009) "Methylation of c Ld N6, FBN2, RBP1, RBP4, TFPI2, and TMEFF2 in esophageal squamous cell carcinoma" Oncol Rep 21: 1067-73; Tang y col. (2010) "Prognostic significance of tissue factor pathway inhibitor-2 in pancreatic carcinoma and its effect on tumor invasion and metastasis" Med Oncol 27: 867-75; Brune y col. (2008) "Genetic and epigenetic alterations of familial pancreatic cancers" Cancer Epidemiol Biomarkers Prev 17: 3536-4). Tambien se ha comprobado que este marcador se envfa a la luz GI y tenia una sensibilidad del 73 % cuando se analizo en jugo pancreatico de sujetos con canceres y normales (Matsubayashi y col. (2006) "DNA methylation alterations in the pancreatic juice of patients with suspected pancreatic disease" Cancer Res 66: 1208-17).
TFPI2 esta comprendida entre un elevado numero de potenciales mutaciones y marcadores de la metilacion estudiados en muestras de tejidos y de heces en candidatos de neoplasia colorrectal. En un analisis de un conjunto de ensayos de formacion sobre heces de archivo procedentes de casi 700 sujetos, un panel de multimarcadores de metilacion, que incluye TFPI2, BMP3, NDRG4, y vimentina, demostro tener una sensibilidad del 85 % para CRC y una sensibilidad del 64 % en adenomas colorrectales avanzados, ambos con una especificidad del 90 % (Ahlquist D y col. (2010) "Next Generation Stool DNA Testing for Detection of Colorectal Neoplasia - Early Marker Evaluation", presentado en Colorectal Cancer: Biology to Therapy, American Association for Cancer Research).
Una investigacion anterior ha sometido a ensayo los marcadores de la metilacion del cancer colorrectal para la deteccion de PanC. En particular, un estudio control de casos comparo el ADN procedente de casos de tumor PanC con el ADN procedente del epitelio colonico usando marcadores dirigidos a MSP anteriormente notificados en PanC (por ejemplo, MDFI, SFRP2, UCHL1, CNTNAP2, y TFPI2) y marcadores adicionales discriminantes de neoplasias colonicas (por ejemplo, BMP3, EYA4, vimentina, y NDRG4). Un modelo de regresion multimarcador mostro que EYA4, UCHL1, y MDFI fueron muy discriminantes, con un area bajo la curva de las caracterfsticas operativas del receptor de 0,85. Como marcador individual, se ha descubierto que BMP3 tiene un area bajo la curva de las caracterfsticas operativas del receptor de 0,90. Estos cuatro marcadores y un KRAS mutante se analizaron posteriormente en un conjunto mas grande de muestras de heces procedentes de sujetos con PanC en una comparacion enmascarada con heces correspondientes de individuos con un resultado de colonoscopia normal. Individualmente, BMP3 y KRAS fueron muy especfficos pero poco sensibles; en combinacion, la sensibilidad mejoro al 65 % manteniendo un 88 % de especificidad (Kisiel, y col. (2011) "Stool DNA screening for colorectal cancer: opportunities to improve value with next generation tests" J Clin Gastroenterol 45: 301-8. Estos resultados sugieren que las diferencias en la metilacion de UCHL1, EYA4, y MDFI en el pancreas estan ocluidos por la metilacion colonica del fondo en una comparacion basada en heces. Por tanto, se necesita en el cribado del cancer un panel marcador para PanC que sea muy informativo y presente una elevada especificidad del PanC a nivel tisular cuando se busca en muestras tomadas de un sujeto (por ejemplo, una muestra de heces).
Sumario
En consecuencia, se proporciona en el presente documento tecnologfa para marcadores de cancer pancreatico y otros marcadores de cribado del cancer gastrointestinal que proporcionan una alta relacion senal-ruido y un bajo nivel de fondo cuando se detecta en muestras tomadas de un sujeto (por ejemplo muestra de heces). Los marcadores se identificaron en un estudio de control de caso comparando el estado de metilacion de marcadores de ADN procedentes de sujetos con PanC en estadio I y II con el estado de metilacion de los mismos marcadores de ADN procedentes de sujetos de control (por ejemplo, tejido normal tal como colon normal y/o pancreas no neoplasico (veanse, los Ejemplos 1 y 11).
Los marcadores y/o paneles de marcadores (Por ejemplo, una region cromosomica que tiene una anotacion seleccionada entre ABCB1, ADCY1, BHLHE23 (LOC63930), c13orf18, CACNA1C, chr12 133, CLEC11A, ELMO1, EOMES, CLEC 11, SHH, GJC1, IHIF1, IKZF1, KCNK12, KCNN2, PCBP3, PRKCB, RSPO3, SCARF2, SLC38A3, ST8SIA1, TWIST1, VWC2, WT1, y ZNF71) se identificaron en un estudio de control de caso comparando el estado de metilacion de marcadores de ADN (por ejemplo, procedentes de sujetos con PanC en estadio I y II con el estado de metilacion de los mismos marcadores de ADN procedentes de sujetos de control (por ejemplo, tejido normal tal como colon normal y/o pancreas no neoplasico (veanse, los Ejemplos 2 y 8).
Los marcadores y/o paneles de marcadores (Por ejemplo, una region cromosomica que tiene una anotacion seleccionada entre NDRG4, SFRP1, BMP3, HPP1, y/o APC) se identificaron en estudios de control del caso comparando el estado de metilacion de marcadores del ADN procedentes de tejido esofagico de sujetos con esofago de Barrett con el estado de metilacion de los mismos marcadores de ADN procedentes de sujetos del control (veanse los Ejemplo 4 y 10).
Los marcadores y/o paneles de marcadores (Por ejemplo, una region cromosomica que tiene una anotacion seleccionada entre ADCY1, PRKCB, KCNK12, C13ORF18, IKZF1, TWIST 1, ELMO, 55957, CD1D, CLEC11A, KCNN2, BMP3, y/o NDRG4) se identificaron en estudios de control del caso comparando el estado de metilacion de marcadores del ADN procedentes de una muestra de jugo pancreatico de sujetos con cancer de pancreas con el estado de metilacion de los mismos marcadores de ADN procedentes de sujetos del control (veanse los Ejemplo 5 y 6).
Se identifico un marcador (por ejemplo, una region cromosomica que tiene una anotacion CD1D) en un estudio de control del caso por comparacion del estado de metilacion de un marcador de ADN (por ejemplo, CD1D) procedente de una muestra de heces de sujetos con cancer de pancreas con el estado de metilacion del mismo marcador de ADN procedentes de sujetos del control que no tienen cancer de pancreas (vease, el Ejemplo 7).
Se identifico un marcador (por ejemplo, miR-1290) en un estudio de control del caso comparando la cantidad cuantificada de un marcador de ADN (por ejemplo, miR-1290) de una muestra de heces de sujetos con cancer de pancreas con la cantidad cuantificada del mismo marcador de ADN procedentes de sujetos de control que no tienen cancer de pancreas (vease, Ejemplo 9).
Un analisis estadfstico adicional de los resultados demostro que la tecnologfa descrita en el presente documento basada en estos marcadores predice de una forma espedfica y sensible un sitio tumoral.
Como se describe en el presente documento, la tecnologfa proporciona numerosos marcadores de ADN metilados y subconjuntos de los mismos (por ejemplo, conjuntos de 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12 o mas marcadores) con elevada discriminacion para las neoplasias gastrointestinales tanto en su conjuntos como y/o en sitios tumorales adicionales. Los experimentos aplicaron un filtro de seleccion a los marcadores candidatos para identificar marcadores que proporcionan una alta relacion senal-ruido y un bajo nivel de fondo para proporcionar una elevada especificidad, por ejemplo, cuando se analizan medios distantes (por ejemplo, heces, sangre, orina, tejido metastasico, etc.) con los fines de cribado o diagnostico del cancer. Ademas, se realizaron experimentos para demostrar que los marcadores del ADN metilado identificado predicen el sitio del tumor. Por tanto, la tecnologfa proporciona marcadores espedficos, combinaciones de marcadores, y algoritmos para predecir el sitio del tumor.
En algunas realizaciones, la tecnologfa esta relacionado con la evaluacion de la presencia y del estado de metilacion de uno o mas de los marcadores identificados en el presente documento en una muestra biologica. Estos marcadores comprenden una o mas regiones diferencialmente metiladas (DMR) como se analiza en el presente documento, por ejemplo, como se proporciona en la Tabla 1 y/o la Tabla 10. El estado de la metilacion se evalua en las realizaciones de la tecnologfa. Por tanto, la tecnologfa proporcionada en el presente documento no esta restringida al procedimiento por el cual se mide el estado de la metilacion de un gen. Por ejemplo, en algunas realizaciones, el estado de metilacion se mide por un procedimiento de cribado genomico. Por ejemplo, un procedimiento implica la exploracion genomica con hitos de restriccion (Kawai y col. (1994) Mol. Cell. Biol. 14: 7421­ 7427) y otro ejemplo implica la PCR cebada arbitrariamente sensible a metilacion PCR (Gonzalgo y col. (1997) Cancer Res. 57: 594-599). En algunas realizaciones, los cambios en los patrones de metilacion en sitios CpG espedficos se controlan mediante la digestion del ADN genomico con enzimas de restriccion sensibles a la metilacion seguido de analisis Southern de las regiones de interes (procedimiento de digestion-Southern). En algunas realizaciones, en analisis de los cambios en los patrones de metilacion implica un procedimiento basado en PCR que implica digestion de ADN genomico con enzimas de restriccion sensibles a la metilacion antes de la amplificacion mediante PCR (Singer-Sam y col. (1990) Nucl. Acids Res. 18: 687). Ademas, Se han notificado otras tecnicas que utilizan el tratamiento del a Dn con bisulfito como punto de partida del analisis de metilacion. Esto incluye pCr espedfica de metilacion (MSP) (Herman y col. (1992) Proc. Natl. Acad. Sci. USA 93: 9821-9826) y digestion con enzimas de restriccion de los productos de la PCR amplificados procedentes del ADN convertido con bisulfito (Sadri y Hornsby (1996) Nucl. Acids Res. 24: 5058-5059; y Xiong y Laird (1997) Nucl. Acids Res. 25: 2532­ 2534). Se han desarrollado tecnicas de la PCR para la deteccion de mutaciones genicas (Kuppuswamy y col. (1991) Proc. Natl. Acad. Sci. USA 88: 1143-1147) y la cuantificacion de la expresion espedfica de alelo (Szabo y Mann (1995) Genes Dev. 9: 3097-3108; y Singer-Sam y col. (1992) PCR Methods Appl. 1: 160-163). Dichas tecnicas utilizan cebadores internos, que se hibridan con un molde generado por PCR y que terminan inmediatamente en 5' respecto del unico nucleotido a analizar. Los procedimientos que utilizan un "ensayo cuantitativo Ms-SNuPE" como se describe en la patente de EE.UU. N.° 7.037.650, se utilizan en algunas realizaciones.
Tras evaluar el estado de metilacion, el estado de metilacion se expresa frecuentemente como la fraccion o porcentaje de las hebras individuales del ADN que estan metiladas en un sitio en particular (por ejemplo, en un unico nucleotido, en una region o locus en particular, en una secuencia de interes mas larga, por ejemplo, hasta ~100 pb, 200 pb, 500 pb, subsecuencia de 1000 pb de un ADN o mas largo) con respecto a la poblacion total de ADN en la muestra que comprende dicho sitio en particular. Tradicionalmente, la cantidad de acido nucleico no metilado se determina mediante la PCR usando calibradores. Despues, una cantidad conocida de ADN se trata con bisulfito, y la secuencia espedfica de metilacion resultante se determina bien mediante PCR en tiempo real u otra amplificacion exponencial, por ejemplo, un ensayo QuARTS (por ejemplo, como se proporciona en la patente de Estados Unidos n.° 8.361.720; y en la solicitud de patente de Estados Unidos publicada con numeros WO 2012/0122088 y WO 2012/0122106).
Por ejemplo, en algunas realizaciones, los procedimientos comprenden generar una curva patron para la diana sin metilar usando patrones externos. La curva patron se construye a partir de al menos dos puntos y se refiere al valor Ct en tiempo real para el ADN sin metilar respecto a patrones cuantitativos conocidos. Despues, se construye una segunda curva patron para la diana metilada a partir de al menos dos puntos y patrones externos. Esta segunda curva patron se refiere al Ct del ADN metilado respecto a patrones cuantitativos conocidos. A continuacion, se determinan los valores de Ct de la muestra para las poblaciones metilada y sin metilar, y se calculan los equivalentes genomicos del ADN a partir de las curvas patron producidas durante las dos primeras etapas. El porcentaje de metilacion en el sitio de interes se calcula a partir de la cantidad de ADN metilados con respecto a la cantidad total de ADN en la poblacion, por ejemplo, (numero de ADN metilados) / (el numero de ADN metilados numero de ADN sin metilar) x 100.
En el presente documento se proporcionan tambien composiciones y kits para llevar a la practica los procedimientos. Por ejemplo, en algunas realizaciones, los reactivos (por ejemplo, cebadores, sondas) espedficos de uno o mas marcadores se proporcionar en solitario o en conjuntos (por ejemplo, conjuntos de pares de cebadores para amplificar una pluralidad de marcadores). Tambien se pueden proporcionar reactivos adicionales para realizar un ensayo de deteccion (por ejemplo, enzimas, tampones, controles positivos y negativos para realizar QuARTS, PCR, secuenciacion, bisulfito, y otros ensayos). En algunas realizaciones, los kits contienen uno o mas reactivos necesarios, suficientes, o utiles, para realizar el procedimiento. Tambien se proporcionan mezclas de reacciones que contienen los reactivos. Se proporcionan ademas conjuntos de reactivos de mezcla maestra que contiene una pluralidad de reactivos que se pueden anadir entre si y/o a una muestra de ensayo para completar una mezcla de reaccion.
En algunas realizaciones, la tecnologfa descrita en el presente documento esta asociada con una maquina programable disenada para realizar una secuencia de operaciones aritmeticas o logicas como se proporciona en los procedimientos descritos en el presente documento. Por ejemplo, algunas realizaciones de la tecnologfa estan asociadas (por ejemplo, implementadas) con un programa informatico y/o un equipo informatico. En un aspecto, la tecnologfa se refiere a un ordenador que comprende una forma de memoria, un elemento para realizar operaciones aritmeticas y logicas, y un elemento de procesamiento (por ejemplo, un microprocesador) para ejecutar una serie de instrucciones (por ejemplo, un procedimiento como se proporciona en el presente documento) para leer, manipular, y almacenar datos. En algunas realizaciones, un microprocesador forma parte de un sistema para determinar un estado de metilacion (por ejemplo, de uno o mas DMR, por ejemplo, DMR 1-107 como se proporciona en la Tabla 1, por ejemplo, DMR 1-449 en la Tabla 10); que compara estados de metilacion (por ejemplo, de uno o mas DMR, por ejemplo, DMR 1-107 como se proporciona en la Tabla 1, por ejemplo, DMR 1-449 en la Tabla 10); generando curvas patron; determina un valor de Ct; calcula una fraccion, frecuencia, o porcentaje de metilacion (por ejemplo, de uno o mas DMR, por ejemplo, DMR 1-107 como se proporciona en la Tabla 1, por ejemplo, DMR 1-449 en la Tabla 10); identificar una isla CpG; determinar una especificidad y/o una sensibilidad para un ensayo o marcador; calcular una curva ROB, y una ABC asociada; analisis de secuencias; todo ellos como se describe en el presente documento, o es conocido en la tecnica.
En algunas realizaciones, un microprocesador u ordenador utiliza los datos del estado de metilacion en un algoritmo para predecir un sitio de un cancer.
En algunas realizaciones, un programa o componente informatico recibe los resultados de multiples ensayos y determina un valor unico como el resultado a notificar al usuario que indica un riesgo de cancer en funcion de los resultados de los multiples ensayos (por ejemplo, determinacion del estado de metilacion de multiples DMR, por ejemplo, como se proporciona en la Tabla 1, por ejemplo, como se proporciona en la Tabla 10). Las realizaciones relacionadas calculan un factor de riesgo basado en una combinacion matematica (por ejemplo, una combinacion ponderada, una combinacion lineal ) de los resultados de multiples ensayos, por ejemplo, determinacion de los estados de metilacion de multiples marcadores (tales como multiples DMR, por ejemplo, como se proporciona en la Tabla 1, por ejemplo, como se proporciona en la Tabla 10). En algunas realizaciones, el estado de metilacion un DMR define una dimension una dimension y puede haber valores en un espacio multidimensional y la coordenada definido por los estados de metilacion de los multiples DMR es un resultado, por ejemplo, a notificar al usuario, por ejemplo, relacionado con el riesgo de cancer.
Algunas realizaciones comprenden un medio de almacenamiento y componentes de memoria. Los componentes de memoria (por ejemplo, memoria volatil y/o no volatil) es de utilidad para almacenar instrucciones (por ejemplo, una realizacion de un procedimiento tal como se proporciona en el presente documento) y/o datos (por ejemplo, un resultado de trabajo tales como mediciones de la metilacion, secuencias, y descripciones estadfsticas asociadas con los anteriores). Algunas realizaciones se refieren a sistemas que tambien comprenden uno o mas de una CPU, una tarjeta grafica, y una interfaz de usuario (por ejemplo, que comprende un dispositivo de salida tal como una pantalla y un dispositivo de entrada tal como un teclado).
Las maquinas programables asociadas con la tecnologfa comprenden tecnologfas existentes convencionales y tecnologfas en desarrollo o que aun no se ha desarrollado (por ejemplo, un ordenador cuantico, un ordenador qufmico, un ordenador de ADN, un ordenador optico, un ordenador basado en espintronica, etc.).
En algunas realizaciones, la tecnologfa comprende un medio de transmision cableado (por ejemplo, cable metalico, fibra optica) o inalambrico para transmitir los datos. Por ejemplo, algunas realizaciones se refieren a la transmision de datos a traves de una red (por ejemplo, una red de area local (LAN), una red de area amplia (WAN), una red adhoc, la Internet, etc.). En algunas realizaciones, las maquinas programables estan presentes en una de esas redes como iguales y, en algunas realizaciones, las maquinas programables tienen una relacion cliente/servidor.
En algunas realizaciones, los datos se almacenan en un medio de almacenamiento legible por ordenador tal como un disco duro, memoria flash, medios opticos, un disco flexible, etc.
En algunas realizaciones, la tecnologfa proporcionada en el presente documento esta asociada con una pluralidad de dispositivos programables que operan de forma coordenada para llevar a cabo un procedimiento como se describe en el presente documento. Por ejemplo, en algunas realizaciones, una pluralidad de ordenadores (por ejemplo, conectados a una red) puede funcionar en paralelo para recopilar y procesar los datos, por ejemplo, en una implementacion de clusteres de calculo o redes de computacion o cualquier otra arquitectura informatica distribuida que se basa en ordenadores completos (con CPU incorporadas, almacenamiento, fuentes de alimentacion, interfaces de red, etc.) conectados a una red (privada, publica, o la Internet) mediante una interfaz de red convencional, como Ethernet, fibra optica, o mediante tecnologfa de redes inalambricas.
Por ejemplo, algunas realizaciones proporcionan un ordenador que incluye un medio legible por el ordenador. La realizacion incluye una memoria de acceso aleatorio (RAM) acoplada a un procesador. El procesador ejecuta instrucciones del programa ejecutable por ordenador almacenadas en la memoria. Dichos procesadores pueden incluir un microprocesador, un ASIC, una maquina de estado, u otro procesador, y puede ser cualquiera de un numero de procesadores de calculo, tales como procesadores de Intel Corporation de Santa Clara, California y Motorola Corporation de Schaumburg, Illinois. Dichos procesadores incluyen, o pueden estar en comunicacion con, medios, por ejemplo, medios legibles por ordenador, que almacenan las instrucciones que, cuando el procesador las ejecuta, hacen que el procesador lleve a cabo las etapas descritas en el presente documento.
Las realizaciones de medios legibles por ordenador incluyen, aunque no de forma limitativa, un dispositivo electronico, optico, magnetico, u otro dispositivo de almacenamiento o transmision que puede proporcionar a un procesador instrucciones legibles por ordenador. Otros ejemplos de medios adecuados incluyen, aunque no de forma limitativa, un disco flexible, CD-ROM, DVD, disco magnetico, chip de memoria, ROM, RAM, un ASIC, un procesador configurado, todos los medios opticos, todas las cintas magneticas u otros medios magneticos, o cualquier otro medio desde el que el procesador de un ordenador puede leer las instrucciones. Asimismo, otras diversas formas de medios legibles por ordenador pueden transmitir o transportar instrucciones a un ordenador, incluido un enrutador, red privada o publica, u otro dispositivo o canal de transmision, tanto cableado como inalambrico. Las instrucciones pueden comprender codigo escrito en cualquier lenguaje de programacion para ordenadores adecuado, incluidos, por ejemplo, C, C++, C#, Visual Basic, Java, Python, Perl, y JavaScript.
En algunas realizaciones, los ordenadores estan conectados a una red. Lo ordenadores tambien puede incluir numerosos dispositivos externos o internos tales como un raton, un CD-ROM, DVD, un teclado, una pantalla, u otros dispositivos de entrada y salida. Los ejemplos de ordenadores son ordenadores personales, asistentes digitales, asistentes digitales personales, telefonos celulares, telefonos moviles, telefonos inteligentes, paginadores, tabletas digitales manuales, ordenadores portatiles, aplicaciones de Internet, y otros dispositivos basados en procesadores. En general, los ordenadores relacionados con aspectos de la tecnologfa proporcionada en el presente documento pueden ser cualquier tipo de plataforma de tipo informatico que funcione con cualquier sistema operativo, tal como Microsoft Windows, Linux, UNIX, Mac OS X, etc., capaz de soportar uno o mas programas que comprenden la tecnologfa proporcionada en el presente documento. Algunas realizaciones comprenden un ordenador personal que ejecuta otros programas de aplicacion (por ejemplo, aplicaciones). Las aplicaciones pueden estar contenidas en la memoria y pueden incluir, por ejemplo, una aplicacion de procesamiento de palabras, una aplicacion de hoja de calculo, una aplicacion de correo electronico, una aplicacion de mensajerfa instantanea, una aplicacion de presentaciones, una aplicacion de navegador de Internet, una aplicacion de calendario/agente, y cualquier otra aplicacion capaz de ser ejecutada mediante un dispositivo cliente.
Todos estos componentes, ordenadores y sistemas descritos en el presente documento como asociados con la tecnologfa pueden ser logicos o virtuales.
En consecuencia, se proporciona en el presente documento una tecnologfa relacionada con un procedimiento para el cribado de neoplasias en una muestra obtenida de un sujeto, comprendiendo el procedimiento: analizar el estado de metilacion de un marcador en una muestra obtenida de un sujeto; e identificar el sujeto que tiene una neoplasia cuando el estado de metilacion del marcador es diferente de un estado de metilacion del marcador analizado en un sujeto que no tiene una neoplasia, en el que el marcador comprende una base en una region metilado de manera diferencial (DMR) seleccionada entre un grupo que consiste de DMR 1-107 como se proporciona en la Tabla 1, y/o DMR 1-449 en la Tabla 10. En algunas realizaciones, el procedimiento comprende ademas localizar el sitio de la neoplasia en el sujeto, en el que el estado de metilacion del marcador indica el sitio de la neoplasia en el sujeto. La tecnologfa se refiere a identificar y discriminar canceres gastrointestinales, por ejemplo, en algunas realizaciones, la neoplasia es una neoplasia gastrointestinal. En algunas realizaciones, la neoplasia esta presente en la region gastrointestinal superior del paciente y, en algunas realizaciones, la neoplasia esta presente en la region gastrointestinal inferior del paciente. En realizaciones particulares, la neoplasia es una neoplasia del pancreas, una neoplasia colorrectal, una neoplasia del conducto biliar, o un adenoma. La tecnologfa tambien abarca determinar el estado o el estadio de un cancer, por ejemplo, en algunas realizaciones, la neoplasia es precancerosa. Algunas realizaciones proporcionan procedimientos que comprenden analizar una pluralidad de marcadores, por ejemplo, que comprende analizar de 2 a 11 marcadores.
La tecnologfa no esta limitada a la evaluacion del estado de metilacion. En algunas realizaciones, la evaluacion del estado de metilacion del marcador de la muestra comprende determinar el estado de metilacion de una base. En algunas realizaciones, analizar el estado de metilacion del marcador en la muestra comprende determinar la extension de la metilacion de una pluralidad de bases. Ademas, en algunas realizaciones, el estado de metilacion del marcador comprende una metilacion del marcador aumentada con respecto a un estado de metilacion normal del marcador. En algunas realizaciones, el estado de metilacion del marcador comprende una metilacion del marcador mas baja con respecto a un estado de metilacion del marcador normal. En algunas realizaciones, el estado de metilacion del marcador comprende un patron de metilacion diferente del marcador con respecto a un estado de metilacion del marcador normal.
Ademas, en algunas realizaciones, el marcador es una region de 100 o menos bases, el marcador es una region de 500 o menos bases, el marcador es una region de 1000 o menos bases, el marcador es una region de 5000 o menos bases, o, en algunas realizaciones, el marcador es una base. En algunas realizaciones, el marcador es un promotor CpG de alta densidad.
La tecnologfa no esta limitada por el tipo de muestra. Por ejemplo, en algunas realizaciones, la muestra es una muestra de heces, una muestra de tejido, una muestra de jugo pancreatico, una muestra de fluido de un quiste pancreatico, una muestra de sangre (por ejemplo, plasma, suero, sangre completa), una excrecion, o una muestra de orina.
Ademas, la tecnologfa no esta limitada por el procedimiento utilizado para determinar el estado de metilacion. En algunas realizaciones, el ensayo comprende usar la reaccion en cadena de la polimerasa especffica de metilacion, secuenciacion de acidos nucleicos, espectrometrfa de masas, nucleasa especffica de metilacion, separacion por masas, o captura de la diana. En algunas realizaciones, el analisis comprende el uso de un oligonucleotido especffico de la metilacion. En algunas realizaciones, la tecnologfa utiliza masivamente la secuenciacion en paralelo (por ejemplo, secuenciacion avanzada) para determinar el estado de metilacion, por ejemplo, secuenciacion por sfntesis, secuenciacion en tiempo real (por ejemplo, de una sola molecula), secuenciacion con emulsion en perla, secuenciacion en nanoporos, etc.
La tecnologfa proporciona reactivos para detectar un DMR, por ejemplo, en algunas realizaciones se proporciona un conjunto de oligonucleotidos que comprende las secuencias proporcionadas en la SEQ ID NO: 1-202. En algunas realizaciones se proporciona un oligonucleotido que comprende una secuencia complementarios a una region cromosomica que tiene una base de una a DMR, por ejemplo, un oligonucleotido sensible al estado de metilacion del DMR.
La tecnologfa proporciona varios paneles de marcadores, por ejemplo, en algunas realizaciones, el marcador comprende una region cromosomica que tiene una anotacion que es ABCB1, ADCY1, BHLHE23 (LOC63930), c13orf18, CACNA1C, chr12.133, CLEC11A, ELMO1, EOMES, GJC1, IHIF1, IKZF1, KCNK12, KCNN2, NDRG4, PCBP3, PRKCB, RSPO3, SCARF2, SLC38A3, ST8SIA1, TWIST 1, VWC2, WT1, o ZNF71, y que comprende el marcador (vease, Tablas 1 y 9). Ademas, las realizaciones proporcionan un procedimiento para analizar las DMR de la Tabla 1 que es DMR N.° 11, 14, 15, 65, 21, 22, 23, 5, 29, 30, 38, 39, 41, 50, 51, 55, 57, 60, 61, 8, 75, 81, 82, 84, 87, 93, 94, 98, 99, 103, 104, o 107, y/o una DMR correspondiente a Chr16:58497395-58497458. Algunas realizaciones proporcionan la determinacion del estado de metilacion de un marcador, en el que una region cromosomica que tiene una anotacion que es CLEC11A, C13ORF18, KCNN2, ABCB1, SLC38A3, CD1D, IKZF1, ADCY1, CHR12133, RSPO3, MBP3, PRKCB, NDRG4, ELMO, o TWIST 1 comprende el marcador. En algunas realizaciones, los procedimientos comprenden el estado de metilacion de dos marcadores, por ejemplo, un par de marcadores proporcionados en una fila de la Tabla 5.
Se proporcionan realizaciones en kit, por ejemplo, un kit que comprende un reactivo de bisulfito; y un acido nucleico del control que comprende una secuencia derivada de una DMR seleccionada de un grupo que consiste en DMR 1­ 107 (de la Tabla 1) y/o una DMR seleccionada de un grupo que consiste en DMR 1-449 (de la Tabla 10) y que tiene un estado de metilacion asociado con un sujeto que no tiene un cancer. En algunas realizaciones, los kits comprenden un reactivo de bisulfito y un oligonucleotido como se describe en el presente documento. En algunas realizaciones, los kits comprenden un reactivo de bisulfito; y un acido nucleico del control que comprende una secuencia derivada de una DMR seleccionada de un grupo que consiste en DMR 1-107 (de la Tabla 1) y/o una DMR 1-449 (de la Tabla 10) y que tiene un estado de metilacion asociado con un sujeto que tiene un cancer. Algunas realizaciones de kit comprenden un sistema de recogida de muestra para obtener una muestra de un sujeto (por ejemplo, una muestra de heces); reactivos para aislar un acido nucleico de la muestra; un reactivo de bisulfito; y un oligonucleotido como se describe en el presente documento.
La tecnologfa esta relacionada con realizaciones de composiciones (por ejemplo, mezclas de reaccion). En algunas realizaciones se proporciona una composicion que comprende un acido nucleico que comprende una DMR y un reactivo de bisulfito. Algunas realizaciones proporcionan una composicion que comprende un acido nucleico que comprende una DMR y un oligonucleotido como se describe en el presente documento. Algunas realizaciones proporcionan una composicion que comprende un acido nucleico que comprende una DMR y una enzima de restriccion sensible a la metilacion. Algunas realizaciones proporcionan una composicion que comprende un acido nucleico que comprende una DMR y una polimerasa.
Se proporcionan realizaciones adicionales relacionadas con el procedimiento para cribar una neoplasia en una muestra obtenida de un sujeto, por ejemplo, un procedimiento que comprende determinar un estado de metilacion de un marcador en la muestra que comprende una base en una DMR que es una o mas de DMR 1-107 (de la Tabla 1) y/o una o mas de DMR 1-449 (de la Tabla 10); que compara el estado de metilacion del marcador de la muestra del sujeto a un estado de metilacion del marcador de una muestra de control normal de un sujeto que no tiene un cancer; y determinar un intervalo de confianza y/o un valor de p de la diferencia en el estado de metilacion de la muestra del sujeto y la muestra normal del control. En algunas realizaciones, el intervalo de confianza es 90 %, 95 %, 97,5 %, 98 %, 99 %, 99,5 %, 99.9 % o 99.99 % y el valor de p es 0,1, 0,05, 0,025, 0,02, 0,01, 0,005, 0,001, o 0,0001. Algunas realizaciones de procedimientos proporcionan etapas para hacer reaccionar un acido nucleico que comprende una DMR con un reactivo de bisulfito para producir un acido nucleico que ha reaccionado con bisulfito; secuenciar el acido nucleico que ha reaccionado con bisulfito para proporcionar una secuencia de nucleotidos del acido nucleico que ha reaccionado con bisulfito; comparar la secuencia de nucleotidos del acido nucleico que ha reaccionado con bisulfito con una secuencia de nucleotidos de un acido nucleico que comprende la DMR de un sujeto que no tiene un cancer para identificar diferencias entre las dos secuencias; e identificar el sujeto que tiene una neoplasia cuando hay diferencias presentes.
Los sistemas para cribar una neoplasia en una muestra obtenida de un sujeto se proporcionan mediante la tecnologfa. Las realizaciones ilustrativas de sistemas incluyen, por ejemplo, una sistema para cribar una neoplasia en una muestra obtenida de un sujeto, comprendiendo el sistema un analisis de componentes configurado para determinar el estado de metilacion de una muestra, un componente de programa informatico configurado para comparar el estado de metilacion de la muestra con el estado de metilacion de una muestra del control o una muestra de referencia registrado en una base de datos, y un componente de alerta configurado para alertar al usuario de un el estado de metilacion asociado con cancer. En algunas realizaciones, se determina una alerta mediante un componente de programa informatico que recibe los resultados de multiples ensayos (por ejemplo, determinacion de los estados de metilacion de multiples marcadores, por ejemplo, DMR, por ejemplo, como se proporciona en la Tabla 1, por ejemplo, como se proporciona en la Tabla 10) y calcular un valor o resultado a notificar basandose en los multiples resultados. Algunas realizaciones proporcionan una base de datos de parametros ponderados asociados con cada una de las DMR proporcionadas en el presente documento para su uso en el calculo de un valor o resultado y/o una alerta a notificar a un usuario (por ejemplo, tal como un medico, enfermera, especialista medico, etc.). En algunas realizaciones, todos los resultados de multiples ensayos se notifican y, en algunas realizaciones, uno o mas resultados se utilizan para proporcionar una puntuacion, valor, o resultado, basandose en un valor compuesto de uno o mas resultados a partir de multiples ensayos que es indicativo de un riesgo de cancer en un sujeto.
En algunas realizaciones de sistemas, una muestra comprende un acido nucleico que comprende una DMR. En algunas realizaciones, el sistema comprende ademas un componente para asilar un acido nucleico, un componente para recoger una muestra tal como un componente para recoger una muestra de heces. En algunas realizaciones, el sistema comprende secuencias de acidos nucleicos que comprenden una DMR. En algunas realizaciones, la base de datos comprende secuencias de acidos nucleicos procedentes de sujetos que no tienen un cancer. Tambien se proporcionan acidos nucleicos, por ejemplo, un conjunto de acidos nucleicos, teniendo cada acido nucleico una secuencia que comprende una DMR. En algunas realizaciones, el conjunto de acidos nucleicos en los que cada acido nucleico tiene una secuencia de un sujeto que no tiene un cancer. Las realizaciones relacionadas con el sistema comprenden un conjunto de acidos nucleicos como se ha descrito y una base de datos de secuencias de acidos nucleicos asociados con el conjunto de acidos nucleicos. Algunas realizaciones comprenden ademas un reactivo de bisulfito. Y, algunas realizaciones comprenden demas un secuenciador de acidos nucleicos.
Otras realizaciones seran evidentes para las personas expertas en la tecnica relevante basandose en las ensenanzas contenidas en el presente documento.
Breve descripcion de los dibujos
Estas y otras caracterfsticas, aspectos y ventajas de la presente tecnologfa se entenderan mejor con respecto a los siguientes dibujos:
La Figura 1 es una representacion grafica que muestra la importancia de los marcadores en un conjunto de marcadores de metilacion segun se determina por la disminucion media en la precision de la prediccion del sitio. La Figura 2 muestra los niveles de marcador de BMP3 y NDRG4 en cepillados (cardias esofago completo) en casos de Barrett y controles como se describe en el Ejemplo 8.
La Figura 3 muestra una ABC de miR-1290 en heces como se describe en el Ejemplo 9.
Se entiende que las figuras no estan necesariamente dibujadas a escala, ni tampoco los objetos de las figuras estan dibujadas a escala respecto a otras. Las figuras son representaciones graficas que se proporcionan para aportar claridad y comprension a las diversas realizaciones de aparatos, sistemas, composiciones y procedimientos desvelados en el presente documento. Cuando sea posible, se usan los mismos numeros de referencia en todos los dibujos para referirse a las mismas partes o a partes analogas. Ademas, se debera apreciar que los dibujos no estan previstos para limitar el ambito de las presentes ensenanzas en cualquier forma.
Descripcion detallada
Se proporciona en el presente documento una tecnologfa relacionada con la deteccion de neoplasias y, en particular, pero no exclusivamente, a procedimientos, composiciones, y usos relacionados para detectar neoplasias malignas y premalignas tales como el cancer pancreatico y el cancer colorrectal. Respecto a la tecnologfa descrita en el presente documento, los encabezados de seccion utilizados tienen fines organizativos solamente, y no deben considerarse como limitantes de la materia sujeto de cualquier forma.
En esta descripcion detallada de las diferentes realizaciones, con fines de explicacion, se definen numerosos detalles especfficos para proporcionar una comprension completa de las realizaciones desveladas. Un experto en la materia apreciara, sin embargo, que estas diversas realizaciones se pueden llevar a la practica con o sin estos detalles espedficos. En otros casos, las estructuras y los dispositivos se muestran en forma de diagrama de bloques. Ademas, un experto en la materia puede apreciar facilmente que las secuencias espedficas en las que los procedimientos se presentan y se realizan son ilustrativas, y se contempla que las secuencias se pueden variar y seguir estando incluidas en el espmtu y el ambito de las diferentes realizaciones desveladas en el presente documento.
A menos que se defina de otra manera, todos los terminos tecnicos y cientfficos utilizados en el presente documento tienen el mismo significado que el que entiende una persona experta en la tecnica a la que pertenecen las distintas realizaciones descritas en el presente documento. Cuando las definiciones de los terminos en las referencias parezcan diferir de las definiciones proporcionadas en las presentes ensenanzas, la definicion proporcionada en las presentes ensenanzas tendran preeminencia.
Definiciones
Para facilitar la comprension de la presente tecnologfa, se definen a continuacion varios terminos y expresiones. Se proporcionan definiciones adicionales a lo largo de la descripcion detallada.
A lo largo de la memoria descriptiva y las reivindicaciones, los siguientes terminos tienen los significados exphcitamente asociados en el presente documento, salvo que el contexto indique claramente otra cosa. La expresion "en una realizacion" como se utiliza en el presente documento no se refiere necesariamente a la misma realizacion, aunque podna. Ademas, la expresion "en otra realizacion" tal como se usa en el presente documento, no se refiere necesariamente a una realizacion diferente, aunque podna. Por lo tanto, como se describe a continuacion, varias realizaciones de la invencion se pueden combinar facilmente, sin apartarse del ambito o el espmtu de la invencion.
Ademas, como se usa en el presente documento, el termino "o" es un operador "o" inclusivo y es equivalente al termino "y/o" salvo que el contexto indique claramente otra cosa. El termino "basado en" no es exclusivo y permite que este basado en factores adicionales no descritos, salvo que el contexto indique claramente otra cosa. Ademas, a lo largo de la memoria descriptiva, el significado de "un", "uno/a" y "el/la" incluye las referencias plurales. El significado de "en" incluye "en" y "sobre".
Como se usa en el presente documento, un "acido nucleico" o "molecula de acido nucleico" se refiere de forma general a cualquier acido ribonucleico o acido desoxirribonucleico, que puede ser ARN o ADN no modificado o modificado. "Acidos nucleicos" incluyen, sin limitacion, acidos nucleicos monocatenarios y bicatenarios. Como se usa en el presente documento, el termino "acido nucleico" tambien incluye el ADN como se ha descrito anteriormente que contiene una o mas bases modificadas. Por lo tanto, el ADN con una cadena principal modificada por motivos de estabilidad o por otras razones es un "acido nucleico". El termino "acido nucleico" como se usa en el presente documento abarca dichas formas de acidos nucleicos modificadas qmmica, enzimatica, o metabolicamente, asf como las formas qmmicas de ADN caractensticas de virus y celulas, que incluyen, por ejemplo, celulas simples y complejas.
Los terminos "oligonucleotido" o "polinucleotido" o "nucleotido" o "acido nucleico" se refieren a una molecula que tiene dos o mas desoxirribonucleotidos o ribonucleotidos, preferentemente mas de tres, y normalmente mas de diez. El tamano exacto dependera de muchos factores, que a su vez dependen de la funcion o uso final del oligonucleotido. El oligonucleotido se puede generar de cualquier forma, incluidas smtesis qmmica, replicacion del ADN, transcripcion inversa, o una combinacion de los mismos. Los desoxirribonucleotidos tfpicos del ADN son timina, adenina, citosina y guanina. Los ribonucleotidos tfpicos para el ARN son uracilo, adenina, citosina y guanina. Como se usa en el presente documento, los terminos "locus" o "region" de un acido nucleico se refieren a una subregion de un acido nucleico, por ejemplo, un gen o un cromosoma, un unico nucleotido, una isla CpG, etc.
Los terminos "complementario" y "complementariedad" se refieren a nucleotidos (por ejemplo, 1 nucleotido) o polinucleotidos (por ejemplo, una secuencia de nucleotidos) relacionados por las reglas de emparejamiento de bases. Por ejemplo, la secuencia 5'-A-G-T-3' es complementaria de la secuencia 3'-T-C-A-5'. La complementariedad puede ser "parcial", en la que solamente parte de las bases de los acidos nucleicos estan emparejadas segun las reglas de emparejamiento de bases. O, puede existir una complementariedad "completa" o "total" entre los acidos nucleicos. El grado de complementariedad entre las cadenas de acido nucleico altera la eficacia y la resistencia de la hibridacion entre las cadenas de acidos nucleicos. Esto es de especial importancia en las reacciones de amplificacion y en los procedimientos de deteccion que dependen de la union entre acidos nucleicos.
El termino "gen" se refiere a una secuencia de acido nucleico (por ejemplo, ADN o ARN) que comprende las secuencias de codificacion necesarias para la produccion de un ARN o de un polipeptido o de sus precursores. Un polipeptido funcional se puede codificar mediante una secuencia de codificacion: de longitud completa o mediante cualquier parte de la secuencia de codificacion, siempre que la actividad o las propiedades funcionales deseadas (por ejemplo, actividad enzimatica, union al ligando, transduccion de la senal, etc.) del polipeptido se retenga. El termino "porcion" cuando se usa en referencia a un gen, se refiere a fragmentos de dicho gen. Los fragmentos pueden variar en tamano desde unos pocos nucleotidos a toda la secuencia genica menos un nucleotido. Por lo tanto, "un nucleotido que comprende al menos una porcion el gen" puede comprender fragmentos del gen o el gen completo.
El termino "gen" tambien abarca las regiones de codificacion de un gen estructural e incluye secuencias situadas adyacentes a la region de codificacion en ambos extremos 5' y 3', por ejemplo, en una distancia de aproximadamente 1 kb de cada extremo, de manera que el gen corresponde a la longitud del ARNm de longitud completa (por ejemplo, que comprende secuencias de codificacion, regulacion, estructurales, y otras secuencias). Las secuencias situadas en 5' de la region de codificacion y presentes en el ARNm se denominan como secuencias 5' no traducidas o secuencias no traducidas. Las secuencias situadas en 3' o despues de la region de codificacion y presentes en el ARNm se denominan secuencias 3' no traducidas o secuencias no traducidas en 3'. El termino "gen" abarca tanto ADNc como las formas genomicas de un gen. En algunos microorganismos (por ejemplo, eucariotas), una forma genomica o clon de un gen contiene la region de codificacion interrumpida por secuencias no codificantes denominadas "intrones" o "regiones intervinientes" o "secuencias intervinientes". Los intrones son segmentos de un gen que se transcriben en ARN nuclear (hnARN); los intrones pueden contener elementos reguladores tales como potenciadores. Los intrones se eliminan o "retiran por corte y empalme" del transcrito nuclear o primario; por tanto, los intrones estan ausentes en el transcrito de ARN mensajero (ARNm). El ARNm actua durante la traduccion para especificar la secuencia o el orden de los aminoacidos en el polipeptido nascente.
Ademas de contener intrones, las formas genomicas de un gen tambien pueden incluir secuencias situadas en ambos extremos 5' y 3' de las secuencias que estan presentes en el transcrito de ARN. Estas secuencias se denominan como secuencias o regiones "flanqueantes" (estas secuencias flanqueantes estan situadas en 5' o 3' respecto a las secuencias no traducidas presentes en el transcrito de ARN). La region flanqueante en 5' puede contener secuencias reguladoras tales como promotores y potenciadores que controlan o alteran la transcripcion del gen. La region flanqueante 3' puede contener las secuencias que dirigir la terminacion o la transcripcion, la escision posterior a la transcripcion, y la poliadenilacion.
El termino "natural" cuando se aplica en referencia a un gen se refiere a un gen que tiene las caracterfsticas de un gen o aislado de su fuente de origen natural. El termino "natural" cuando se aplica en referencia a un producto genico se refiere a un producto genico que tiene las caracterfsticas de un producto genico aislado de su fuente de origen natural. La expresion "origen natural" cuando se aplica a un objeto se refiere al hecho de que un objeto se puede encontrar en la naturaleza. Por ejemplo, un polipeptido o secuencia de polinucleotidos que esta presente en un organismo (incluidos los virus) que se puede aislar de una fuente en la naturaleza y que no haya sido intencionadamente modificado por la mano de una persona en el laboratorio es de origen natural. Un gen natural es frecuentemente el gen o alelo observado con mayor frecuencia en una poblacion y, por tanto, es el que recibe la designacion arbitraria de forma "normal" o "natural" del gen. En cambio, el termino "modificado" o "mutante" cuando se hace referencia a un gen o a un producto genico se refiere, respectivamente, a un gen o producto genico que presenta modificaciones en la secuencia y/o en las propiedades funcionales (por ejemplo, alteracion en sus caracterfsticas) cuando se compara con el gen o producto genico natural. Se resalta que los mutantes de origen natural se pueden aislar; estos se identifican por el hecho de que tienen caracterfsticas alteradas cuando se comparan con el gen o producto genico silvestre.
El termino "alelo" se refiere a la variacion de un gen; las variaciones incluyen, aunque no de forma limitativa, variantes y mutantes, loci polimorficos, y loci polimorficos de nucleotidos unicos, cambios de marco, y mutaciones de corte y empalme. Un alelo se puede producir de forma natural en una poblacion o podrfa aparecer durante la vida de cualquier individuo en particular de la poblacion.
Por lo tanto, los terminos "variante" y "mutante" cuando se utilizan en referencia a una secuencia de nucleotidos hacen referencia a una secuencia de nucleotidos que se diferencia de otra, habitualmente relacionada, secuencia de nucleotidos acidos. Una "variacion" es una diferencia entre dos secuencia de nucleotidos diferentes; de forma tfpica, una secuencia es una secuencia de referencia.
"Amplificacion" es un caso especial de replicacion de acido nucleico que implica especificidad de molde. Esto contrasta con la replicacion no especffica de molde (por ejemplo, replicacion que es dependiente de molde pero no dependiente de un molde especffico). La especificidad de molde se distingue en este punto de fidelidad de replicacion (por ejemplo, sfntesis de la secuencia polinucleotfdica correcta) y de especificidad de nucleotidos (ribonucleotido o desoxinucleotido). La especificidad de molde se describe frecuentemente en terminos de especificidad de "diana". Las secuencias diana son "dianas" en el sentido que deberan clasificarse de otro acido nucleico. Las tecnicas de amplificacion se han disenado fundamentalmente para esta clasificacion.
La amplificacion de acidos nucleicos se refiere de forma general a la produccion de multiples copias de un polinucleotido, o de una porcion del polinucleotido, partiendo de forma tfpica de una pequena cantidad del polinucleotido (por ejemplo, una unica molecula de polinucleotido, 10 a 100 copias de una molecula de polinucleotido, que puede ser o no exactamente el mismo), donde los productos de la amplificacion, o amplicones, se pueden detectar de forma general. La amplificacion de los polinucleotidos abarca una variedad de procedimientos qufmicos y enzimaticos. La generacion de multiples copias de ADN a partir de una o unas pocas copias de una molecula de ADN diana o molde durante una reaccion en cadena de la polimerasa (PCR) o una reaccion en cadena de la ligasa (LCR; vease, por ejemplo, la patente de Estados Unidos n.° 5.494.810) son formas de amplificacion. Los tipos adicionales de amplificacion incluyen, aunque no de forma limitativa, PCR especffica de alelo (vease, por ejemplo, la patente de Estados Unidos n.° 5.639.611), la PCR con ensamblaje (vease, por ejemplo, la patente de Estados Unidos n.° 5.965.408), amplificacion dependiente de helicasa (vease, por ejemplo, la patente de los Estados Unidos n.° 7.662.594), PCR de inicio caliente (veanse, por ejemplo, las patentes de Estados Unidos con numeros 5.773.258 y 5.338.671), PCR especffica de intersecuencia, PCR inversa (veanse, por ejemplo, Triglia, y col. (1988) Nucleic Acids Res., 16:8186), PCR mediada por ligadura (vease, por ejemplo, Guilfoyle, R. y col., Nucleic Acids Research, 25:1854-1858 (1997); la patente de Estados Unidos n.° 5.508.169), PCR especffica de metilacion (vease, por ejemplo, Herman, y col., (1996) PNAS 93(13) 9821-9826), PCR con minicebador, amplificacion de sonda multiplexada dependiente de la ligadura (vease, por ejemplo, Schouten, y col., (2002) Nucleic Acids Research 30(12): e57), pCr multiplexada (vease, por ejemplo, Chamberlain, y col., (1988) Nucleic Acids Research 16(23) 11141-11156; Ballabio, y col., (1990) Human Genetics 84(6) 571-573; Hayden, y col., (2008) BMC Genetics 9:80), PCR anidada, PCR con extension por solapamiento (vease, por ejemplo, Higuchi, y col., (1988) Nucleic Acids Research 16(15) 7351-7367), PCR en tiempo real (veanse, por ejemplo, Higuchi, y col., (1992) Biotechnology 10:413-417; Higuchi, y col., (1993) Biotechnology 11:1026-1030), PCR con transcripcion inversa (vease, por ejemplo, Bustin, S.A. (2000) J. Molecular Endocrinology 25:169-193), PCR en fase solida, PCR entrelazada termica asimetrica, y la PCR Touchdown (vease, por ejemplo, Don, y col., Nucleic Acids Research (1991) 19(14) 4008; Roux, K. (1994) Biotechniques 16(5) 812-814; Hecker, y col., (1996) Biotechniques 20(3) 478-485). La amplificacion de los polinucleotidos tambien se puede llevar a cabo usando PCR digital (veanse, por ejemplo, Kalinina, y col., Nucleic Acids Research. 25; 1999-2004, (1997); Vogelstein y Kinzler, Proc Natl Acad Sci USA. 96; 9236-41, (1999); publicacion de patente internacional n.° WO05023091A2; publicacion de solicitud de patente de EE.UU. n.° 20070202525).
La expresion "reaccion en cadena de la polimerasa" ("PCR") se refiere al procedimiento de K.B. Mullis, patentes de Estados Unidos de N.° 4.683.195, 4.683.202 y 4.965.188, que describen un procedimiento para aumentar la concentracion de un segmento de una secuencia diana en una mezcla de ADN genomico sin clonacion ni purificacion. Este procedimiento para amplificar la secuencia diana consiste en introducir un importante exceso de dos oligonucleotidos cebadores en la mezcla de ADN que contiene la secuencia diana deseada, seguido por una secuencia precisa de ciclacion termica en presencia de una ADN polimerasa. Los dos cebadores son complementarios de sus respectivas hebras de la secuencia diana bicatenaria. Para realizar la amplificacion, la mezcla se desnaturaliza, y los cebadores se hibridan con sus secuencias complementarias dentro de la molecula diana. Tras la hibridacion, los cebadores se extienden con una polimerasa para formar un nuevo par de hebras complementarias. Las etapas de desnaturalizacion, hibridacion de cebadores, y extension con polimerasa se pueden repetir varias veces (es decir, la desnaturalizacion, la hibridacion y la extension constituyen un "ciclo"; puede haber numerosos "ciclos") para obtener una elevada concentracion de un segmento amplificado de la secuencia diana deseada. La longitud del segmento amplificado de la secuencia diana deseada se determina mediante las posiciones relativas de los cebadores entre sf y, por tanto, su longitud es un parametro controlable. En virtud de los aspectos repetitivos del procedimiento, el procedimiento se denomina como la "reaccion en cadena de la polimerasa ("PCR"). Puesto que los segmentos amplificados deseados de la secuencia diana se convierten en las secuencias predominantes (en terminos de concentracion) de la mezcla, se dice que estan "amplificadas mediante PCR" y son "productos de PCR" o "amplicones".
La especificidad de molde se consigue en la mayorfa de las tecnicas de amplificacion mediante la seleccion de la enzima. Las enzimas de amplificacion son enzimas que, en las condiciones que se usan, procesaran solamente secuencias de acido nucleico especfficas en una mezcla heterogenea de acido nucleico. Por ejemplo, en el caso de la Q-beta replicasa, el ARN de -MDV-1 es el molde especffico de la replicasa (Kacian y col., Proc. Natl. Acad. Sci. USA, 69:3038 [1972]). Otro acido nucleico no se replicara con esta enzima de amplificacion. De manera similar, en el caso de la ADN polimerasa T7, esta enzima de amplificacion tiene una especificidad rigurosa por sus promotores (Chamberlin y col, Nature, 228:227 [1970]). En el caso de la ADN polimerasa T4, la enzima no ligara los dos oligonucleotidos o polinucleotidos, donde haya un emparejamiento incorrecto entre el sustrato oligonucleotido o polinucleotido y el molde en la union de ligadura (Wu y Wallace (1989) Genomics 4:560). Finalmente, las ADN polimerasas termoestables dependientes del molde (por ejemplo, las ADN polimerasas Taq y Pfu), debido a su capacidad de actuar a elevada temperatura, parece que presentan elevada especificidad por las secuencias unidades y de esta forma definidas por los cebadores; la temperatura elevada da como resultado condiciones termodinamicas que favorecen la hibridacion del cebador con las secuencias diana y la no hibridacion con secuencias no diana (H. A. Erlich (ed.), PCR Technology, Stockton Press [1989]).
Como se usa en el presente documento, la expresion "ensayo de deteccion de acidos nucleicos" se refiere a cualquier procedimiento para determinar la composicion de nucleotidos de un acido nucleico de interes. El ensayo de deteccion de acidos nucleicos incluye, aunque no de forma limitativa, procedimientos de secuenciacion de ADN, procedimientos de hibridacion de sondas, ensayos de escision especfficos de la estructura (por ejemplo, el ensayo INVADER, Hologic, Inc.) y se describen, por ejemplo, en las patentes de Estados Unidos N.° 5.846.717, 5.985.557, 5.994.069, 6.001.567, 6.090.543 y 6.872.816; Lyamichev y col., Nat. Biotech., 17:292 (1999), Hall y col., PNAS, EE.UU., 97:8272 (2000), y en el documento US 2009/0253142); procedimientos de escision por emparejamiento enzimatico incorrecto (por ejemplo, Variagenics, patentes de Estados Unidos n.° 6.110.684, 5.958.692 y 5.851.770); reaccion en cadena de la polimerasa; procedimientos de hibridacion con ramificacion (por ejemplo, Chiron, patentes de Estados Unidos N.° 5.849.481, 5.710.264, 5.124.246 y 5.624.802); replicacion con cfrculo rodante (por ejemplo, patentes de Estados Unidos N.° 6.210.884, 6.183.960 y 6.235.502); NASBA (por ejemplo, patente de Estados Unidos N.° 5.409.818); tecnologfa de baliza molecular (por ejemplo, patente de Estados Unidos N.° 6.150.097); tecnologfa E-sensor (Motorola, patentes de Estados Unidos N.° 6.248.229, 6.221.583, 6.013.170 y 6.063.573); tecnologfa de sonda dclica (por ejemplo, patentes de Estados Unidos N.° 5.403.711, 5.011.769, y 5.660.988); procedimientos de amplificacion de la senal Dade Behring (por ejemplo, patentes de Estados Unidos N.° 6.121.001, 6.110.677, 5.914.230, 5.882.867 y 5.792.614); reaccion en cadena de la ligasa (por ejemplo, Barnay Proc. Natl. Acad. Sci USA 88, 189-93 (1991)); y procedimientos de hibridacion en sandwich (por ejemplo, patente de Estados Unidos N.° 5.288.609).
La expresion "acido nucleico amplificable" se refiere a un acido nucleico que se puede amplificar por cualquier procedimiento de amplificacion. Se contempla que "acido nucleico amplificable" comprendera habitualmente "molde de muestra".
La expresion "molde de ADN" se refiere a un acido nucleico procedente de una muestra que se ha analizado para determinar la presencia de una "diana" (definida a continuacion). En cambio, "molde de fondo" se usa en referencia a un acido nucleico diferente al molde de muestra que puede estar presente o no en una muestra. Lo mas habitual es que el molde de fondo sea involuntario. Puede ser el resultado del arrastre o se puede deber a la presencia de acidos nucleicos contaminantes que se deben purificar de la muestra. Por ejemplo, los acidos nucleicos procedentes de organismos diferentes a los que se deben detectar pueden estar presente como fondo en una muestra de ensayo.
El termino “cebador” se refiere a un oligonucleotido, tanto de origen natural como purificado mediante una reaccion de digestion o producido sinteticamente, que es capaz de actuar como un punto de inicio de la smtesis cuando se coloca en condiciones en las que se induce la smtesis de un producto de extension del cebador que es complementario de una hebra de acido nucleico, (por ejemplo, en presencia de nucleotidos y de un agente inductor tal como una ADN polimerasa y a una temperatura y pH adecuados). Preferentemente, el cebador es monocatenario para obtener la mayor eficacia de amplificacion, aunque de forma alternativa, puede ser bicatenario. Si es bicatenario, el cebador se trata en primer lugar para separar su hebras antes de usarse para preparar productos de extension. Preferentemente, el cebador es un oligodesoxirribonucleotido. El cebador debe ser suficientemente largo para cebar la smtesis de los productos de extension en presencia del agente inductor. Las longitudes exactas de los cebadores dependeran de muchos factores, entre los que se incluyen la temperatura, origen del cebador y el uso del procedimiento.
El termino "sonda" se refiere a un oligonucleotido (por ejemplo, una secuencia de nucleotidos), tanto de origen natural como purificado mediante una reaccion de digestion o producido sinteticamente, de forma recombinante, o mediante amplificacion por PCR, que se puede hibridar con otro oligonucleotido de interes. Una sonda puede ser monocatenaria o bicatenaria. Las sondas son utiles en la deteccion, identificacion y aislamiento de secuencias genicas espedficas (por ejemplo, una "sonda de captura"). Se contempla que cualquier sonda utilizada en la presente invencion puede, en algunas realizaciones, estar marcada con cualquier "molecula indicadora" de forma que se pueda detectar en cualquier sistema de deteccion, incluidos, aunque no de forma limitativa, enzimas (por ejemplo, ELISA, asf como un ensayo histoqmmico basado en enzimas), sistemas fluorescentes, radioactivos y luminiscentes. No se pretende que la presente invencion este limitada a ningun sistema o marca de deteccion concretos.
Como se usa en el presente documento, "metilacion" se refiere a la metilacion de citosina en las posiciones C5 o N4 de citosina, la posicion N6 de adenina, y otros tipos de metilacion de acido nucleico. El ADN amplificado in vitro no suele estar metilado porque los procedimientos de amplificacion de ADN in vitro tfpicos no retienen el patron de metilacion del molde de amplificacion. Sin embargo, "ADN no metilado" o "ADN metilado" tambien se puede referir a un ADN amplificado cuyo molde original estaba no metilado o metilado, respectivamente.
En consecuencia, tal como se usa en el presente documento, un "nucleotido metilado" o una "base nucleotfdica metilada" se refiere a la presencia de un resto metilo en una base nucleotfdica, donde el resto metilo no esta presente en una base nucleotidica tfpica reconocida. Por ejemplo, la citosina no contiene un resto metilo en su anillo de pirimidina, pero el la 5-metilcitosina contiene un resto metilo en la posicion 5 de su anillo de pirimidina. Por lo tanto, la citosina no es un nucleotido metilado y la 5-metilcitosina es un nucleotido metilado. En otro ejemplo, timina contiene un resto metilo en la posicion 5 de su anillo de pirimidina; sin embargo, a efectos del presente documento, la timina no se considera un nucleotido metilado cuando esta presente en el ADN ya que la timina es una base nucleotfdica tfpica del ADN.
Como se usa en el presente documento, una "molecula de acido nucleico metilada" se refiere a una molecula de acido nucleico que contiene uno o mas nucleotidos metilados.
Como se usa en el presente documento, un "estado de metilacion", "perfil de metilacion", y "estado de metilacion" de una molecula de acido nucleico se refiere a la presencia o ausencia de una o mas bases nucleotfdicas metiladas en la molecula de acido nucleico. Por ejemplo, una molecula de acido nucleico que contiene una citosina metilada se considera metilado (por ejemplo, el estado de metilacion de la molecula de acido nucleico es metilado). Una molecula de acido nucleico que no contiene ningun nucleotido metilado se considera no metilada.
El estado de metilacion de una secuencia de acido nucleico concreta (por ejemplo, un gen marcador o region de ADN como se describe en el presente documento) puede indicar el estado de metilacion de cada base en la secuencia o puede indicar el estado de metilacion de un subconjunto de las bases (por ejemplo, de una o mas citosinas) dentro de la secuencia, o puede indicar informacion relativa a la densidad de metilacion regional dentro de la secuencia, proporcionando o no informacion precisa sobre las ubicaciones de la secuencia donde se produce la metilacion.
El estado de metilacion de un locus nucleotfdico en una molecula de acido nucleico se refiere a la presencia o ausencia de un nucleotido metilado en un locus concreto de la molecula de acido nucleico. Por ejemplo, el estado de metilacion de una citosina en el 7° nucleotido de una molecula de acido nucleico es metilado cuando el nucleotido presente en el 7° nucleotido de la molecula de acido nucleico es 5-metilcitosina. De manera similar, el estado de metilacion de una citosina en el 7° nucleotido de una molecula de acido nucleico es no metilado cuando el nucleotido presente en el 7° nucleotido de la molecula de acido nucleico es citosina (y no 5-metilcitosina).
El estado de metilacion opcionalmente puede representarse o indicarse mediante un "valor de metilacion" (por ejemplo, que representa una frecuencia, fraccion, relacion, porcentaje de metilacion, etc.). Se puede generar un valor de metilacion, por ejemplo, cuantificando la cantidad de acido nucleico intacto presente despues de la digestion con restriccion con una enzima de restriccion dependiente de la metilacion o comparando los perfiles de amplificacion despues de la reaccion con bisulfito o mediante la comparacion entre secuencias de acidos nucleicos tratadas y no tratadas con bisulfito. En consecuencia, un valor, por ejemplo, un valor de metilacion, representa el estado de metilacion y por tanto se puede usar como indicador cuantitativo del estado de metilacion en multiples copias de un locus. Esto es de especial interes cuando es deseable comparar el estado de metilacion de una secuencia de una muestra con un valor umbral o de referencia.
Como se usa en el presente documento, "frecuencia de metilacion" o "porcentaje de metilacion (%)" se refiere al numero de casos en los que una molecula o locus estan metilados con respecto al numero de casos en los que la molecula o el locus estan sin metilar.
Por tanto, el estado de metilacion describe el estado de metilacion de un acido nucleico (por ejemplo, una secuencia genomica). Ademas, el estado de metilacion se refiere a las caracterfsticas de un segmento de acido nucleico en un locus genomico concreto relevante para la metilacion. Dichas caracterfsticas incluyen, aunque no de forma limitativa, si cualquiera de los restos de citosina (C) dentro de esta secuencia de ADN esta metilado, la situacion del uno o varios restos de C metilados, la frecuencia o porcentaje de C metilada en la totalidad de una region concreta de un acido nucleico, y las diferencias alelicas en la metilacion debidas a, por ejemplo, diferencias en el origen de los alelos. Las expresiones "estatuto de metilacion", "perfil de metilacion ", y "estado de metilacion" tambien se refieren a la concentracion relativa, concentracion absoluta o patron de C metilada o C no metilada en la totalidad de cualquier region concreta de un acido nucleico en una muestra biologica. Por ejemplo, si el uno o varios restos de citosina (C) dentro de una secuencia de acido nucleico estan metilados, esto se puede denominar como "hipermetilado" o tener "aumento en la metilacion", mientras que si el uno o varios restos de citosina (C) dentro de una secuencia de ADN no estan metilados, esto se puede denominar como "hipometilado" o tener "disminucion en la metilacion". Analogamente, si el uno o varios restos de citosina (C) dentro de una secuencia de acido nucleico estan metilados en comparacion con otra secuencia de acido nucleico (por ejemplo, de una region diferente o de un individuo diferente, etc.) dicha secuencia se considera hipermetilada o que tiene un aumento en la metilacion en comparacion con la otra secuencia de acido nucleico. Como alternativa, si el uno o varios restos de citosina (C) dentro de una secuencia de acido nucleico no estan metilados en comparacion con otra secuencia de acido nucleico (por ejemplo, de una region diferente o de un individuo diferente, etc.) dicha secuencia se considera hipometilada o que tiene menor metilacion en comparacion con la otra secuencia de acido nucleico. Ademas, la expresion "patron de metilacion" tal como se usa en el presente documento se refiere al conjunto de sitios de nucleotidos metilados y no metilados en una region de acido nucleico. Dos acidos nucleicos pueden tener una frecuencia de metilacion o porcentaje de metilacion igual o similar pero diferentes patrones de metilacion cuando el numero de nucleotidos metilados y no metilados son iguales o similares en toda la region pero las ubicaciones de los nucleotidos metilados y no metilados es diferentes. Se dice que las secuencias estan "metiladas de forma diferencial" o que tienen una "diferencia en la metilacion" o que tienen un "estado de metilacion diferente" cuando difieren en la extension (por ejemplo, unto tiene una metilacion aumentada o disminuida respecto al otro), frecuencia, o patron de metilacion. La expresion "metilacion diferencial" se refiere a una diferencia en el nivel o patron de metilacion del acido nucleico en la muestra positiva para el cancer en comparacion con el nivel o patron de metilacion del acido nucleico en la muestra negativa para el cancer. Tambien se puede referir a la diferencia en niveles o patrones entre pacientes que tienen recidiva de cancer despues de la cirugfa en comparacion con pacientes que no presentan recidiva. La metilacion diferencial y los niveles especfficos de patrones de metilacion del ADN son biomarcadores de pronostico y predictivos, por ejemplo, una vez se ha definido el corte correcto o las caracterfsticas predictivas.
La frecuencia del estado de metilacion se puede usar para describir una poblacion de individuos o una muestra de un unico individuo. Por ejemplo, un locus nucleotfdico que tiene una frecuencia del estado de metilacion del 50 % esta metilado en el 50 % de los casos y no metilado en el 50 % de los casos. Dicha frecuencia se puede usar, por ejemplo, para describir el grado en el que un locus nucleotfdico o una region de acido nucleico estan metilados en una poblacion de individuos o en una coleccion de acidos nucleicos. Por lo tanto, cuando la metilacion en una primera poblacion o combinacion de moleculas de acido nucleico es diferente de la metilacion en una segunda poblacion o combinacion de moleculas de acido nucleico, la frecuencia del estado de metilacion de la primera poblacion o combinacion sera diferente de la frecuencia del estado de metilacion de la segunda poblacion o combinacion. Dicha frecuencia se puede usar, tambien, por ejemplo, para describir el grado en el que un locus nucleotfdico o una region de acido nucleico estan metilados en un unico individuo. Por ejemplo, dicha frecuencia se puede usar para describir el grado en el que un grupo de celulas de una muestra de tejido estan metiladas o no metiladas en un locus nucleotfdico o region de acido nucleico.
Tal como se usa en el presente documento, un "locus nucleotfdico" se refiere a la ubicacion de un nucleotido en una molecula de acido nucleico. Un locus nucleotfdico de un nucleotido metilado se refiere a la situacion de un nucleotido metilado en una molecula de acido nucleico.
Normalmente, la metilacion del ADN humano se produce en una secuencia de dinucleotido que incluye una guanina y citosina adyacentes, donde la citosina esta situada en 5' de la guanina (tambien denominado secuencias de dinucleotido CpG). La mayorfa de las citosinas en los dinucleotidos CpG estan metiladas en el genoma humano, sin embargo, algunas permanecen sin metilar en regiones genomicas ricas en dinucleotido CpG, conocidas como islas CpG (vease, por ejemplo, Antequera y col. (1990) Cell 62: 503-514).
Como se usa en el presente documento, una "isla CpG" se refiere a una region rica en G:G del ADN genomico que contiene un numero mayor de dinucleotidos CpG con respecto al ADN genomico total. Una isla CpG puede tener al menos 100, 200, o mas pares de bases de longitud, donde el contenido G:C de la region es al menos un 50 % y la relacion entre la frecuencia de CpG observada y la frecuencia esperada es 0,6; en algunos casos, una isla CpG puede tener al menos 500 bases de longitud, donde el contenido G:C de la region es al menos un 55 %) y la relacion entre la frecuencia de CpG observada y la frecuencia esperada es 0,65. La frecuencia de CpG observada respecto de la frecuencia esperada se puede calcular de acuerdo con el procedimiento proporcionado en Gardiner-Garden y col (1987) J. Mol. Biol. 196: 261-281. Por ejemplo, la frecuencia de CpG observada respecto de la frecuencia esperada se puede calcular segun la formula R = (A x B) / (C x D), donde R es el cociente de la frecuencia de CpG observada respecto de la frecuencia esperada, A es el numero de dinucleotidos CpG en la secuencia analizada, B es el numero de nucleotidos en la secuencia analizada, C es el numero total de nucleotidos C en la secuencia analizada, y D es el numero total de nucleotidos G en la secuencia analizada. El estado de metilacion se determina de forma tfpica en las islas CpG, por ejemplo, en las regiones promotoras. Se apreciara que aunque otras secuencias del genoma humano sean propensas a la metilacion del ADN, tales como CpA y CpT (veanse Ramsahoye (2000) Proc. Natl. Acad. Sci. USA 97: 5237-5242; Salmon y Kaye (1970) Biochim. Biophys. Acta. 204: 340-351; Grafstrom (1985) Nucleic Acids Res. 13: 2827-2842; Nyce (1986) Nucleic Acids Res. 14: 4353-4367; Woodcock (1987) Biochem. Biophys. Res. Commun. 145: 888-894).
Como se usa en el presente documento, un reactivo que modifica un nucleotido de la moleculas de acido nucleico en funcion del estado de metilacion de la molecula de acido nucleico, o un reactivo especffico de metilacion, se refiere a un compuesto o composicion o a otro agente que pueda cambiar la secuencia de acido nucleico de una molecula de acido nucleico de forma que refleje el estado de metilacion de la molecula de acido nucleico. Los procedimientos para tratar una molecula de acido nucleico con dicho reactivo pueden incluir la puesta en contacto de la molecula de acido nucleico con el reactivo, acoplado con etapas adicionales, si se desea, para realizar el cambio deseado de secuencia de nucleotidos. Dicho cambio en la secuencia de nucleotidos de una molecula de acido nucleico puede dar como resultado una molecula de acido nucleico en la que cada nucleotido metilado se modifique a un nucleotido diferente. Dicho cambio en la secuencia de nucleotidos puede dar como resultado una molecula de acido nucleico en la que cada nucleotido no metilado se modifique a un nucleotido diferente. Dicho cambio en la secuencia de nucleotidos puede dar como resultado una molecula de acido nucleico en la que cada nucleotido seleccionado que esta sin metilar (por ejemplo, cada citosina sin metilar) se modifique a un nucleotido diferente. El uso de dicho reactivo para cambiar la secuencia de nucleotidos del acido nucleico puede dar como resultado una molecula de acido nucleico en la que es un nucleotido que sea un nucleotido metilado (por ejemplo, cada citosina metilada ) se modifique a un nucleotido diferente. Como se usa en el presente documento, el uso de un reactivo que modifica un nucleotido seleccionado se refiere a un reactivo que modifica un nucleotido de los cuatro nucleotidos que aparecen de forma tfpica en una molecula de acido nucleico (C, G, T, y A para el ADN y C, G, U, y A para el ARN), de tal forma que el reactivo modifica el un nucleotido sin modificar los otros tres nucleotidos. En una realizacion ilustrativa, dicho reactivo modifica un nucleotido sin metilar seleccionado para producir un nucleotido diferente. En otra realizacion ilustrativa, dicho reactivo puede desaminar los nucleotidos de citosina sin metilar. Un reactivo ilustrativo es bisulfito.
Como se usa en el presente documento, la expresion "reactivo de bisulfito" se refiere a un reactivo que comprende, en algunas realizaciones, bisulfito, disulfito, hidrogenosulfito, o combinaciones de los mismos, para distinguir entre citidinas metiladas y no metiladas, por ejemplo, en secuencias de dinucleotidos CpG.
La expresion "ensayo de metilacion" se refiere a cualquier ensayo para determinar el estado de metilacion de una o mas secuencias de dinucleotidos CpG dentro de una secuencia de un acido nucleico.
La expresion "MS AP-PCR" (reaccion en cadena de la polimerasa con cebado arbitrario dependiente de la metilacion) se refiere a la tecnologfa reconocida en la tecnica que permite una exploracion global del genoma usando cebadores ricos en CG para centrarse en las regiones que contienen con mayor probabilidad dinucleotidos CpG, y descrita por Gonzalgo y col. (1997) Cancer Research 57: 594-599.
El termino "MethyLight™" se refiere a la tecnica de la PCR en tiempo real basada en fluorescencia reconocida en la tecnica descrita por Eads y col. (1999) Cancer Res. 59: 2302-2306.
El termino "HeavyMethyl™" se refiere a un ensayo en el que sondas de bloqueo especfficas de la metilacion (tambien denominadas en el presente documento como bloqueantes) cubren la posiciones CpG comprendidas, o cubiertas mediante, los cebadores de amplificacion permiten la amplificacion selectiva especffica de metilacion de una muestra de acido nucleico.
La expresion ensayo "HeavyMethyl™ MethyLight™" se refiere al ensayo HeavyMethyl™ MethyLight™, que es una variacion del ensayo MethyLight™, en el que el ensayo MethyLight™ se combina con sondas de bloqueo especfficas de metilacion que cubren las posiciones CpG comprendidas entre los cebadores de amplificacion.
El termino "Ms-SNuPE" (extension del cebador de nucleotido unico sensible a la metilacion) se refiere al ensayo reconocido en la tecnica descrito por Gonzalgo & Jones (1997) Nucleic Acids Res. 25: 2529-2531.
El termino "MSP" (PCR especffica de metilacion) se refiere al ensayo de metilacion reconocido en la tecnica descrito por Herman y col. (1996) Proc. Natl. Acad. Sci. USA 93: 9821-9826, y en la patente de Estados Unidos N.° 5.786.146.
El termino "COBRA" (analisis de restriccion combinado con bisulfito) se refiere al ensayo de metilacion reconocido en la tecnica descrito por Xiong & Laird (1997) Nucleic Acids Res. 25: 2532-2534.
El termino "MCA" (amplificacion de islas CpG metiladas) se refiere al ensayo de metilacion descrito en Toyota y col. (1999) Cancer Res. 59: 2307-12, y en el documento WO 00/26401A1.
Como se usa en el presente documento, un "nucleotido seleccionado" se refiere a un nucleotido de los cuatro nucleotidos que aparecen de forma tfpica en una molecula de acido nucleico (C, G, T, y A para el ADN y C, G, U, y A para el ARN), y puede incluir derivados metilados de los nucleotidos habituales (por ejemplo, cuando C es el nucleotido seleccionado, tanto C metilada como C no metilada se incluyen en el significado de un nucleotido seleccionado), mientras que un nucleotido seleccionado metilado se refiere especfficamente a un nucleotido metilado que aparece de forma tfpica y nucleotidos seleccionados no metilados se refiere especfficamente a un nucleotido no metilado que aparece de forma tfpica.
Las expresiones "enzima de restriccion especffica de metilacion" o "enzima de restriccion sensible a la metilacion" se refiere a una enzima que digiere selectivamente un acido nucleico dependiendo del estado de metilacion de su sitio de reconocimiento. En el caso de una enzima de restriccion que corta especfficamente si el sitio de reconocimiento no esta metilado o esta semimetilado, el corte no se producira o se producira con una eficacia significativamente reducida si el sitio de reconocimiento esta metilado. En el caso de una enzima de restriccion que corta especfficamente si el sitio de reconocimiento esta metilado, el corte no se producira o se producira con una eficacia significativamente reducida si el sitio de reconocimiento no esta metilado. Son preferidas las enzimas de restriccion especfficas de metilacion, cuyo sitio de reconocimiento contiene un dinucleotido CG (por ejemplo, una secuencia de reconocimiento tal como CGCg o CCCGGG). En algunas realizaciones se prefieren ademas enzimas de restriccion que no cortan si la citosina de este dinucleotido esta metilada en el atomo de carbono C5.
Como se usa en el presente documento, un "nucleotido diferente" se refiere a un nucleotido que es qufmicamente diferente de un nucleotido seleccionado, de forma tfpica, de tal forma que el nucleotido diferente tiene propiedades de emparejamiento de bases segun Watson-Crick que difieren del nucleotido seleccionado, por lo cual, el nucleotido que aparece de forma tfpica que es complementario del nucleotido seleccionado no es el mismo que nucleotido que aparece de forma tfpica que es complementario de nucleotido diferente. Por ejemplo, cuando C es el nucleotido seleccionado, U o T pueden ser el nucleotido diferente, lo que se ilustra por la complementariedad de C con G y la complementariedad de U o T con A. Tal como se usa en el presente documento, un nucleotido que es complementario del nucleotido seleccionado o que es complementario de los nucleotidos diferentes se refiere a un nucleotido que se empareja por bases, en condiciones de rigurosidad elevada, con el nucleotido seleccionado o el nucleotido diferente con mayor afinidad que el emparejamiento de bases con el nucleotido complementario con tres de los cuatro nucleotidos que se producen de forma natural. Un ejemplo de complementariedad es el emparejamiento de bases segun Watson-Crick del ADN (por ejemplo, A-T y C-G) y del ARN (por ejemplo, A-U y C-G). Por lo tanto, por ejemplo, los pares de bases G, en condiciones de rigurosidad elevada, con mayor afinidad por C que por el emparejamiento de bases con G, A, o T y, por lo tanto, cuando C es el nucleotido seleccionado, G es un nucleotido complementario del nucleotido seleccionado.
Como se usa en el presente documento, la "sensibilidad" de un marcador dado se refiere al porcentaje de muestras que notifican un valor de metilacion del ADN por encima de un valor de umbral que distingue entre muestras neoplasicas y no neoplasicas. En algunas realizaciones, se define un positivo como la neoplasia confirmada por histologfa que notifica un valor de metilacion del ADN por encima de un valor de umbral (por ejemplo, el intervalo asociado con la enfermedad), y se define un falso negativo como una neoplasia confirmada por histologfa que notifica un valor de metilacion del ADN por debajo del valor de umbral (por ejemplo, el intervalo asociado con ausencia de enfermedad). El valor de la sensibilidad, por lo tanto, refleja la probabilidad de que una medicion de la metilacion del ADN para un marcador dado obtenido de una muestra conocida de la enfermedad este en el intervalo de las mediciones asociadas con la enfermedad. Como se define en el presente documento, la relevancia clfnica del valor de sensibilidad calculado representa una estimacion de la probabilidad de que un determinado marcador detecte la presencia de una dolencia clfnica cuando se aplica a un sujeto con dicha dolencia.
Como se usa en el presente documento, la "especificidad" de un marcador dado se refiere al porcentaje de muestras no neoplasicas que notifican un valor de metilacion del ADN por debajo de un valor de umbral que distingue entre muestras neoplasicas y no neoplasicas. En algunas realizaciones, se define un negativo como la muestra no neoplasica confirmada por histologfa que notifica un valor de metilacion del ADN por debajo e un valor de umbral (por ejemplo, el intervalo asociado con ausencia de enfermedad) y se define un falso positivo como una muestra no neoplasica confirmada por histologfa que notifica un valor de metilacion del ADN por encima del valor de umbral (por ejemplo, el intervalo asociado con la enfermedad). El valor de la especificidad, por lo tanto, refleja la probabilidad de que una medicion de la metilacion del ADN para un marcador dado obtenido de una muestra no neoplasica conocida este en el intervalo de las mediciones asociadas con la ausencia de enfermedad. Como se define en el presente documento, la relevancia clfnica del valor de especificidad calculado representa una estimacion de la probabilidad de que un determinado marcador detecte la ausencia de una dolencia clfnica cuando se aplica a un paciente sin dicha dolencia.
El termino "ABC" tal como se usa en el presente documento es la abreviatura de "area bajo la curva". Especialmente, se refiere al area bajo una curva de caracterfsticas operativas del receptor (COR). La curva COR es una representacion grafica del fndice de positivos verdaderos frente al fndice de positivos falsos para los diferentes puntos de corte posibles de una prueba diagnostica. Muestra la compensacion entre la sensibilidad y especificidad, dependiendo del punto de corte seleccionado (cualquier aumento de sensibilidad ira acompanado de una disminucion de especificidad). El area bajo una curva COR (ABC) es una medida de la precision de una prueba diagnostica (cuanto mayor es el area, mejor; el optimo es 1; una prueba aleatoria tendrfa una curva COR representada en la diagonal con un area de 0,5; como referencia: J. P. Egan. (1975) Signal Detection Theory and rOc Analysis, Academic Press, Nueva York).
Como se usa en el presente documento, el termino "neoplasia" se refiere a "una masa de tejido anomala, cuyo crecimiento supera y esta descoordinado con el resto de tejidos normales". Vease, por ejemplo, Willis RA, "The Spread of Tumors in the Human Body", Londres, Butterworth & Co, 1952.
Como se usa en el presente documento, el termino "adenoma" se refiere a un tumor benigno de origen glandular. Aunque estos crecimientos son benignos, con el tiempo, pueden evolucionar a malignos.
El termino "precanceroso" o "preneoplasico" y equivalentes de los mismos se refieren a cualquier trastorno proliferativo celular que experimenta una transformacion maligna.
Un "sitio" de una neoplasia, adenoma, cancer, etc. es el tejido, organo, tipo de celula, zona anatomica, parte del cuerpo, etc. del cuerpo de un sujeto donde la neoplasia, adenoma, cancer, etc. se encuentra.
Como se usa en el presente documento, la aplicacion de una prueba "diagnostica" incluye la deteccion o identificacion de una patologfa o dolencia en un sujeto, determinar la probabilidad que un sujeto contraiga dicha enfermedad o dolencia, determinar la probabilidad de que un sujeto con una enfermedad o dolencia responda a la terapia, determinar el pronostico de un sujeto con una enfermedad o dolencia (o su probabilidad de progresion o regresion), y determinar el efecto de un tratamiento en un sujeto con una enfermedad o dolencia. Por ejemplo, se puede usar un diagnosti
probabilidad de que dicho sujeto responda favorablemente a un compuesto (por ejemplo, un producto farmaceutico, por ejemplo, un farmaco) u otro tratamiento.
El termino "marcador", como se usa en el presente documento, se refiere a una sustancia (por ejemplo, un acido nucleico, o una region de un acido nucleico) que es capaz de diagnosticar un cancer por distinguir celulas cancerosas de celulas normales, por ejemplo, segun su estado de metilacion.
El termino "aislado",cuando se usa en referencia a un acido nucleico, como en "un oligonucleotido aislado" se refiere a una secuencia de acido nucleico identificada y separada de al menos un acido nucleico contaminante con el que habitualmente esta asociada en su fuente natural. El acido nucleico aislado esta presente en una forma o escenario que es diferente del que se encuentra en la naturaleza. En cambio, acidos nucleicos no aislados, tales como ADN y ARN, se encuentran en el estado que existen en la naturaleza. Los ejemplos de acidos nucleicos no aislados incluyen: una secuencia de ADN dada (por ejemplo, un gen) que aparece en el cromosoma de la celula hospedadora cerca de genes vecinos; secuencias de a Rn , tales como una secuencia especffica de ARNm que codifica una protefna especffica, que se encuentra en la celula como mezcla con otros muchos ARNm que codifican una multitud de protefnas. Sin embargo, el acido nucleico aislado que codifica una protefna en particular incluye, a modo de ejemplo, dichos acidos nucleicos en celulas que normalmente expresan la protefna, donde el acido nucleico esta en una ubicacion cromosomica diferente de la de las celulas naturales, o bien esta flanqueada por una secuencia de acido nucleico diferente de la que se encuentra en la naturaleza. El acido nucleico u oligonucleotido aislado puede estar presente de forma monocatenaria o bicatenaria. Cuando un acido nucleico u oligonucleotido aislado se va a utilizar para expresar una protema, el oligonucleotido contendra como mmimo la hebra de sentido directo o codificante (es decir, el oligonucleotido puede ser monocatenario), pero puede contener ambas hebras de sentido directo y de sentido contrario (es decir, el oligonucleotido puede ser bicatenario). Un acido nucleico aislado puede, tras aislarse de su entorno natural o tfpico, puede combinarse con otros acidos nucleicos o moleculas. Por ejemplo, un acido nucleico aislado puede estar presente en una celula hospedadora en la que se haya introducido, por ejemplo, para la expresion heterologa.
El termino "purificado" se refiere a moleculas, tanto de acido nucleico como secuencias de acidos nucleicos que se extraen de su entorno natural, aisladas o separadas. Una "secuencia de acido nucleico aislada" puede ser, por tanto, una secuencia de acido nucleico purificada. Las moleculas "practicamente purificadas" estan exentas en al menos un 60 %, preferentemente exentas en al menos un 75 %, y mas preferentemente exentas en al menos un 90 % de otros componentes con los que estan asociadas. Como se usa en el presente documento, los terminos "purificado" o "purificar tambien se refieren a la eliminacion de los contaminantes de una muestra. La eliminacion de las protemas contaminantes da como resultado un aumento en el porcentaje de polipeptido o acido nucleico de interes en la muestra. En otro ejemplo, los polipeptidos recombinantes se expresan en celulas hospedadoras vegetales, bacterianas, de levadura, o de mairnfero, y los polipeptidos se purifican por eliminacion de las protemas de la celula hospedadora; por tanto, el porcentaje de polipeptidos recombinantes aumenta de esta forma en la muestra.
La expresion "composicion que comprende" una secuencia polinucleotidica o polipeptfdica dada se refiere ampliamente a cualquier composicion que comprende la secuencia polinucleotfdica o polipeptfdica dada. La composicion puede comprender una solucion acuosa que contiene sales (por ejemplo, NaCl), detergentes (por ejemplo, SDS), y otros componentes (por ejemplo, solucion de Denhardt, leche en polvo, ADN de esperma de salmon, etc.).
El termino "muestra", se usa en su sentido mas amplio. En un sentido, puede referirse a una celula o tejido animal. En otro sentido, se entiende que muestra incluye un especimen o cultivo obtenido de cualquier origen, asf como muestras biologicas y ambientales. Las muestras biologicas se pueden obtener de plantas o animales (incluidos los seres humanos) y abarcan fluidos, solidos, tejidos y gases. Las muestras ambientales incluyen material ambiental tal como material de la superficie, suelo, agua, y muestras industriales. Estos ejemplos no deben tomarse como una limitacion de los tipos de muestra aplicables en la presente invencion.
Como se usa en el presente documento, una "muestra remota", como se utiliza en algunos contextos, se refiere a una muestra recogida indirectamente de un sitio que no es la celula, tejido, u organo fuente de la muestra. Por ejemplo, cuando el material de la muestra originario del pancreas se evalua en una muestra de heces (por ejemplo, no de una muestra tomada directamente del pancreas), la muestra es una muestra remota.
Como se usa en el presente documento, los terminos "paciente" o "sujeto" se refieren a organismos que seran objeto de varios ensayos proporcionados por la tecnologfa. El termino "sujeto" incluye animales, preferentemente mai^eras, incluidos los seres humanos. En una realizacion preferida, el sujeto es un primate. En una realizacion incluso mas preferida, el sujeto es un ser humano.
Como se usa en el presente documento, el termino "kit" se refiere a cualquier sistema de administracion para administrar materiales. En el contexto de ensayos de reaccion, dichos sistemas de administracion incluyen sistemas que permiten el almacenamiento, transporte o administracion de los reactivos de reaccion (por ejemplo, oligonucleotidos, enzimas, etc. en los recipientes adecuados) y/o materiales de soporte (por ejemplo, tampones, instrucciones por escrito para realizar el ensayo, etc.) de un sitio a otro. Por ejemplo, los kits incluyen uno o mas recipientes (por ejemplo, cajas) que contienen los reactivos de reaccion y/o materiales de soporte mas importantes. Como se usa en el presente documento, el termino "kit fragmentado" se refiere a sistemas de administracion que comprenden dos o mas recipientes separados, donde cada uno contiene una subparte de la totalidad de los componentes del kit. Los recipientes se pueden suministrar al recipiente previsto juntos o por separado. Por ejemplo, un primer recipiente puede contener una enzima para su uso en un ensayo, mientras que un segundo recipiente contiene oligonucleotidos. La expresion "kit fragmentado" pretende abarcar kits que contienen reactivos espedficos de analito (ASR, por sus siglas en ingles) regulados de conformidad al artmulo 520(e) de la ley federal estadounidense de alimentos, farmacos y productos cosmeticos [Federal Food, Drug, and Cosmetic Act, pero no esta limitada a estos. De hecho, cualquier sistema de administracion que comprenda dos o mas recipientes separados, donde cada uno contiene una subparte de la totalidad de los componentes del kit, esta incluida en la expresion "kit fragmentado". En cambio, un "kit combinado" se refiere a un sistema de administracion que contiene todos los componentes de un ensayo de reaccion en un solo recipiente (por ejemplo, en una sola caja que aloja cada uno de los componentes deseados). El termino "kit" incluye tanto kits fragmentados como kits combinados.
Realizaciones de la tecnologfa
Se proporciona en el presente documento tecnologfa para marcadores de cancer pancreatico y otros marcadores de cribado del cancer gastrointestinal que proporcionan una alta relacion senal-ruido y un bajo nivel de fondo cuando se detecta en muestras tomadas de un sujeto (por ejemplo muestra de heces). Los marcadores se identificaron en un estudio de control de caso comparando el estado de metilacion de marcadores de ADN procedentes de sujetos con PanC en estadio I y II con el estado de metilacion de los mismos marcadores de ADN procedentes de sujetos de control (por ejemplo, tejido normal tal como colon normal y/o pancreas no neoplasico (veanse, los Ejemplos 1 y 11).
Los marcadores y/o paneles de marcadores (Por ejemplo, una region cromosomica que tiene una anotacion seleccionada entre ABCB1, ADCY1, BHLHE23 (LOC63930), c13orf18, CACNA1C, chr12 133, CLEC11A, ELMO1, EOMES, CLEC 11, SHH, GJC1, IHIF1, IKZF1, KCNK12, KCNN2, PCBP3, PRKCB, RSPO3, SCARF2, SLC38A3, ST8SIA1, TWIST1, VWC2, WT1, y ZNF71) se identificaron en un estudio de control de caso comparando el estado de metilacion de marcadores de ADN (por ejemplo, procedentes de sujetos con PanC en estadio I y II con el estado de metilacion de los mismos marcadores de a Dn procedentes de sujetos de control (por ejemplo, tejido normal tal como colon normal y/o pancreas no neoplasico (veanse, los Ejemplos 2 y 8).
Los marcadores y/o paneles de marcadores (Por ejemplo, una region cromosomica que tiene una anotacion seleccionada entre NDRG4, SFRP1, BMP3, HPP1, y/o APC) se identificaron en estudios de control del caso comparando el estado de metilacion de marcadores del ADN procedentes de tejido esofagico de sujetos con esofago de Barrett con el estado de metilacion de los mismos marcadores de ADN procedentes de sujetos del control (veanse los Ejemplo 4 y 10).
Los marcadores y/o paneles de marcadores (Por ejemplo, una region cromosomica que tiene una anotacion seleccionada entre ADCY1, PRKCB, KCNK12, C13ORF18, IKZF1, TWIST 1, ELMO, 55957, CD1D, CLEC11A, KCNN2, BMP3, y/o NDRG4) se identificaron en estudios de control del caso comparando el estado de metilacion de marcadores del ADN procedentes de una muestra de jugo pancreatico de sujetos con cancer de pancreas con el estado de metilacion de los mismos marcadores de ADN procedentes de sujetos del control (veanse los Ejemplo 5 y 6).
Se identifico un marcador (por ejemplo, una region cromosomica que tiene una anotacion CD1D) en un estudio de control del caso por comparacion del estado de metilacion de un marcador de ADN (por ejemplo, CD1D) procedente de una muestra de heces de sujetos con cancer de pancreas con el estado de metilacion del mismo marcador de ADN procedentes de sujetos del control que no tienen cancer de pancreas (vease, el Ejemplo 7).
Se identifico un marcador (por ejemplo, miR-1290) en un estudio de control del caso comparando la cantidad cuantificada de un marcador de ADN (por ejemplo, miR-1290) de una muestra de heces de sujetos con cancer de pancreas con la cantidad cuantificada del mismo marcador de ADN procedentes de sujetos de control que no tienen cancer de pancreas (vease, Ejemplo 9).
Ademas, la tecnologfa proporciona varios paneles de marcadores, por ejemplo, en algunas realizaciones, el marcador comprende una region cromosomica que tiene una anotacion que es ABCB1, ADCY1, BHLHE23 (LOC63930), c13orf18, CACNA1C, chr12.133, CLEC11A, ELMO1, EOMES, GJC1, IHIF1, IKZF1, KCNK12, KCNN2, NDRG4, PCBP3, PRKCB, RSPO3, SCARF2, SLC38A3, ST8SIA1, TWIST1, VWC2, WT1, o ZNF71, y que comprende el marcador (vease, Tablas 1 y 9). Ademas, las realizaciones proporcionan un procedimiento para analizar las DMR de la Tabla 1 que es la DMR N.° 11, 14, 15, 65, 21,22, 23, 5, 29, 30, 38, 39, 41, 50, 51, 55, 57, 60, 61, 8, 75, 81, 82, 84, 87, 93, 94, 98, 99, 103, 104, o 107, y/o una DMR correspondiente a Chr16:58497395-58497458. Algunas realizaciones proporcionan la determinacion del estado de metilacion de un marcador, en el que una region cromosomica que tiene una anotacion que es CLEC11A, C13ORF18, KCNN2, ABCB1, SLC38A3, CD1D, IKZF1, ADCY1, CHR12133, RSPO3, MBP3, PRKCB, NDRG4, ELMO, o TWIST 1 comprende el marcador. En algunas realizaciones, los procedimientos comprenden el estado de metilacion de dos marcadores, por ejemplo, un par de marcadores proporcionados en una fila de la Tabla 5.
Aunque la divulgacion del presente documento se refiere a determinadas realizaciones ilustradas, se debe entender que dichas realizaciones se presentan a modo de ejemplo y no como limitacion.
En aspectos particulares, la presente tecnologfa proporciona composiciones y procedimientos para identificar, determinar, y/o clasificar un cancer tal como un cancer gastrointestinal superior (por ejemplo, cancer del esofago, pancreas, estomago) o cancer gastrointestinal inferior (por ejemplo, adenoma, cancer colorrectal). En aspectos relacionados, la tecnologfa proporciona composiciones y procedimientos para identificar, predecir, y/o detectar, el sitio de un cancer. Los procedimientos comprenden determinar el estado de metilacion de al menos un marcador de la metilacion en una muestra biologica aislada de un sujeto, en los que un cambio en el estado de metilacion del marcador es indicativo de la presencia, clase, o sitio de un cancer. Las realizaciones particulares se refieren a marcadores que comprenden una region diferencialmente metilada (DMR, por ejemplo, DMR 1-107, vease la Tabla 1, por ejemplo, DMR 1-449, vease la Tabla 10) que se utilizan para el diagnostico (por ejemplo, cribado) de trastornos celulares proliferativos neoplasicos (por ejemplo, cancer), incluida la deteccion precoz durante las etapas precancerosas y en la prediccion el sitio de una neoplasia (por ejemplo, discriminando entre tipos de cancer, por ejemplo, canceres gastrointestinales superiores y canceres gastrointestinales inferiores). Ademas, los marcadores se utilizan para la diferenciacion entre neoplasias y trastornos proliferativos benignos. En aspectos particulares, la presente tecnologfa desvela un procedimiento en el que un trastorno celular proliferativo neoplasico se distingue de un trastorno celular proliferativo benigno.
Los marcadores de la presente tecnologfa son especialmente eficaces para detectar o distinguir entre los trastornos proliferativos colorrectales y pancreaticos, proporcionando de esta manera medios mejorados para la deteccion precoz, clasificacion y tratamiento de dichos trastornos.
Ademas de las realizaciones en las que el analisis de metilacion de al menos un marcador, se analiza una region de un marcador, o una base de un marcador que comprende una DMR (por ejemplo, DMR 1-107 de la Tabla 1) (por ejemplo, DMR 1-449 de la Tabla 10) proporcionada en el presente documento y relacionada en la Tabla 1 o 10, la tecnologfa proporciona tambien paneles de marcadores que comprenden al menos un marcador, region de un marcador, o base de un marcador que comprende una DMR con utilidad en la deteccion de canceres, especialmente el cancer colorrectal, cancer pancreatico, y otros canceres del tracto gastrointestinal superior e inferior.
Algunas realizaciones de la tecnologfa se basan en el analisis del estado de metilacion de CpG en al menos un marcador, region de un marcador, o base de un marcador que comprende una DMR.
En algunas realizaciones, la presente tecnologfa proporciona el uso de la tecnica del bisulfito junto con uno o mas ensayos de metilacion para determinar el estado de metilacion de secuencias de dinucleotidos CpG dentro de al menos un marcador que comprenden una DMR (por ejemplo, como se proporciona en la Tabla 1 (por ejemplo, DMR 1-107)) (por ejemplo, como se proporciona en la Tabla 10 (por ejemplo, DMR 1-449)). Los dinucleotidos CpG genomicos pueden estar metilados o no metilados (conocido de manera alternativa como sobremetilados o con defecto de metilacion, respectivamente). Sin embargo, los procedimientos de la presente invencion son adecuados para el analisis de muestras biologicas de naturaleza heterogenea, por ejemplo, una baja concentracion de celulas tumorales, o materiales biologicos derivados de las mismas, dentro de un fondo de una muestra remota (por ejemplo, sangre, efluente de organo, o heces). En consecuencia, cuando se analiza el estado de metilacion de una posicion CpG dentro de dicha muestra, se puede usar un ensayo cuantitativo para determinar el nivel (por ejemplo, porcentaje, fraccion, relacion, proporcion, o grado) de metilacion en una posicion CpG concreta.
De acuerdo con la presente tecnologfa, la determinacion del estado de metilacion de las secuencias del dinucleotido CpG en marcadores que comprenden una DMR tiene utilidad tanto en el diagnostico como en la caracterizacion de canceres tales como el cancer gastrointestinal superior (por ejemplo, cancer de esofago, pancreas, estomago) o cancer gastrointestinal inferior (por ejemplo, adenoma, cancer colorrectal).
Combinaciones de marcadores
En algunas realizaciones, la tecnologfa se refiere a la evaluacion del estado de metilacion de combinaciones de marcadores que comprenden una DMR de la Tabla 1 (por ejemplo, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 27, 29, 30) o la Tabla 10 (por ejemplo, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 27, 29, 30), o mas marcadores que comprenden una DMR. En algunas realizaciones, la evaluacion del estado de metilacion de mas de un marcador aumenta la especificidad y/o sensibilidad de un cribado o diagnostico para identificar una neoplasia en un sujeto, por ejemplo, un cancer gastrointestinal superior (por ejemplo, esofago, pancreas, estomago) o un cancer gastrointestinal inferior (por ejemplo, adenoma, colorrectal). En algunas realizaciones, un marcador o combinacion de marcadores discrimina entre tipos y/o ubicaciones de una neoplasia. Por ejemplo, combinaciones de marcadores discriminan neoplasia esofagica, neoplasia del estomago, neoplasia pancreatica, neoplasia colorrectal, y adenomas entre sf, de otras neoplasias, y/o entre tejido normal (por ejemplo, no canceroso, no precanceroso) tissue.
Se predicen varios canceres mediante varias combinaciones de marcadores, por ejemplo, segun se identifican por tecnicas estadfsticas relacionadas con la especificidad y la sensibilidad de la prediccion. La tecnologfa proporciona procedimientos para identificar combinaciones predictivas y para validad combinaciones predictivas para algunos canceres.
En algunas realizaciones, combinaciones de marcadores (por ejemplo, que comprenden una DMR) predicen el sitio de una neoplasia. Por ejemplo, durante el desarrollo de la tecnologfa descrita en el presente documento, se realizaron analisis estadfsticos para validar los resultados de sensibilidad y especificidad de combinaciones de marcadores. Por ejemplo, las parejas de marcadores predijeron con precision el sitio del tumor en >90 % de las muestras, las 17 principales parejas de marcadores predijeron con precision el sitio del tumor en >80 % de las muestras, y las 49 principales parejas de marcadores predijeron con precision el sitio del tumor en el 70 % de las muestras.
Procedimientos para evaluar el estado de metilacion
El procedimiento usado con mas frecuencia para analizar un acido nucleico para determinar la presencia de 5-metilcitosina se basa en el procedimiento del bisulfito descrito por Frommer, y col. para la deteccion de 5-metilcitosinas en el ADN (Frommer y col. (1992) Proc. Natl. Acad. Sci. USA 89: 1827-31) o variaciones del mismo. El procedimiento del bisulfito para cartografiar 5-metilcitosinas se basa en la observacion de que citosina, pero no 5-metilcitosina, reacciones con el ion hidrogenosulfito (tambien denominado como bisulfito). La reaccion se realiza habitualmente de acuerdo con las siguientes etapas: en primer lugar, la citosina reacciona con hidrogenosulfito par formar una citosina sulfonada. A continuacion, la desaminacion espontanea del intermedio de reaccion sulfonado da como resultado un uracilo sulfonado. Finalmente, el uracilo sulfonado se desulfona en condiciones alcalinas para formar uracilo. La deteccion es posible porque el uracilo forma pares de bases con adenina (de ahf que comporte como la timina), mientras que la 5-metilcitosina se empareja con la guanina (de ahf que comporte como citosina). Esto hace posible la discriminacion entre las citosinas metiladas y las citosinas no metiladas, por ejemplo, secuencia genomica con bisulfito (Grigg G, & Clark S, Bioessays (1994) 16: 431-36; Grigg G, DNA Seq. (1996) 6: 189-98) o PCR especffica de metilacion PCR (MSP) como se desvela, por ejemplo, en la Patente de los Estados Unidos n.° 5.786.146.
Algunas tecnologfas convencionales estan relacionadas con procedimientos que comprenden encerrar el ADN a analizar en una matriz de agarosa, evitando de esta forma la difusion y la renaturalizacion del ADN (el bisulfito solamente reacciona con ADN monocatenario), y sustituir las etapas de precipitacion y purificacion por una dialisis rapida (Olek A, y col. (1996) "A modified and improved method for bisulfite based cytosine methylation analysis" Nucleic Acids Res. 24: 5064-6). Es por tanto posible analizar celulas individuales para determinar su estado de metilacion, ilustrado la utilidad y la sensibilidad del procedimiento. Una descripcion general de procedimientos convencionales para detectar 5-metilcitosina se proporciona en Rein, T., y col. (1998) Nucleic Acids Res. 26: 2255.
La tecnica del bisulfito implica, de forma tfpica, una amplificacion de fragmentos cortos especfficos de un acido nucleico conocido despues de un tratamiento con bisulfito, a continuacion analizar el producto por secuenciacion (Olek & Walter (1997) Nat. Genet. 17: 275-6) o una reacciones de extension del cebador (Gonzalgo & Jones (1997) Nucleic Acids Res. 25: 2529-31; documento WO 95/00669; patente de Estados Unidos N.° 6.251.594) para analizar las posiciones de citosina individuales. Algunos procedimientos utilizan digestion enzimatica (Xiong & Laird (1997) Nucleic Acids Res. 25: 2532-4). La deteccion mediante hibridacion tambien se ha descrito en la tecnica (Olek y col., WO 99/28498). Ademas, el uso de la tecnica del bisulfito para la deteccion de la metilacion con respecto a los genes individuales se ha descrito (Grigg & Clark (1994) Bioessays 16: 431-6,; Zeschnigk y col. (1997) Hum Mol Genet. 6: 387-95; Feil y col. (1994) Nucleic Acids Res. 22: 695; Martin y col. (1995) Gene 157: 261-4; documento WO 9746705; documento WO 9515373).
Se conocen en la tecnica. varios procedimientos de ensayos de metilacion, que pueden usarse junto con el tratamiento con bisulfito de acuerdo con la presente tecnologfa. Estos ensayos permiten la determinacion del estado de metilacion de uno o una pluralidad de dinucleotidos CpG (por ejemplo, CpG islas CpG) dentro de una secuencia de acidos nucleicos. Dichos ensayos implican, entre otras tecnicas, secuenciacion de un acido nucleico tratado con bisulfito, PCR (para ampliacion especffica de secuencia), analisis de transferencia Southern, y el uso de enzimas de restriccion sensibles a la metilacion.
Por ejemplo, la secuenciacion genomica se ha simplificado mediante el analisis de los patrones de metilacion y las distribuciones de 5-metilcitosina mediante el uso del tratamiento con bisulfito (Frommer y col. (1992) Proc. Natl. Acad. Sci. USA 89: 1827-1831). Ademas, la digestion de los productos de la PCR con enzimas de restriccion amplificados a partir del ADN convertido con bisulfito es de utilidad para evaluar el estado de la metilacion, por ejemplo, como se describe en Sadri & Hornsby (1997) Nucl. Acids Res. 24: 5058-5059 o como se realiza en el procedimiento conocido como COBRA (analisis combinado con restriccion de bisulfito) (Xiong & Laird (1997) Nucleic Acids Res. 25: 2532-2534).
El analisis COBRA™ es un ensayo de metilacion cuantitativo util para determinar los niveles de metilacion del ADN en loci especfficos en pequenas cantidades de ADN genomico (Xiong & Laird, Nucleic Acids Res. 25:2532-2534, 1997). En resumen, la digestion con enzimas de restriccion se utiliza para revelar las diferentes en la secuencia dependientes de metilacion en productos de la PCR de ADN tratado con bisulfito. Las diferencias en la secuencia dependientes de metilacion se introducen por vez primera en el ADN genomico mediante tratamiento con bisulfito convencional de acuerdo con el procedimiento descrito por Frommer y col. (Proc. Natl. Acad. Sci. USA 89:1827­ 1831, 1992). La amplificacion mediante la PCR del ADN transformado con bisulfito se realiza a continuacion usando cebadores especfficos de las islas CpG de interes, seguido por la digestion con endonucleasa de restriccion, electroforesis en gel, y deteccion usando sondas de hibridacion especfficas marcadas. Los niveles de metilacion en la muestra de ADN original se representan por las cantidades relativas de producto de la PCR digerido y sin digerir de una forma linealmente cuantitativa para una amplia gama de niveles de metilacion del ADN. Ademas, esta tecnica se puede aplicar con fiabilidad al ADN obtenido de muestras de tejidos microdesecadas incluidas en parafina.
Los reactivos tfpicos (por ejemplo, los que se encontrarfan en un kit tfpico basado en COBRA™) para el analisis COBRA™ pueden incluir, aunque no de forma limitativa: cebadores de la PCR para loci especfficos (por ejemplo, genes especfficos, marcadores, DMR, regiones de genes, regiones de marcadores, secuencia de ADN tratada con bisulfito, isla CpG, etc.); enzimas de restriccion y el tampon adecuado; oligonucleotido para hibridacion del gen; oligonucleotido para hibridacion del control; kit de marcado con quinasa para la sonda de oligonucleotido; y nucleotidos marcados. Ademas, los reactivos para la conversion con bisulfito pueden incluir: tampon de desnaturalizacion de ADN; tampon de sulfonacion; reactivos o kits de recuperacion del ADN (por ejemplo, precipitacion, ultrafiltracion, columna de afinidad); tampon de desulfonacion; y componentes de recuperacion del ADN.
Preferentemente, los ensayos como "MethyLight™" (una tecnica de la PCR en tiempo real basada en fluorescencia) (Eads y col., Cancer Res. 59:2302-2306, 1999), reacciones Ms-SNuPE™ (extension del cebador de nucleotido unico sensible a la metilacion) (Gonzalgo & Jones, Nucleic Acids Res. 25:2529-2531, 1997), PCR especffica de metilacion ("MSP"; Herman y col., Proc. Natl. Acad. Sci. USA 93:9821-9826, 1996; patente de Estados Unidos N.° 5.786.146) y amplificacion de isla CpG metilada ("MCA"; Toyota y col., Cancer Res. 59:2307-12, 1999) se usan en solitario o combinados con uno o mas de estos procedimientos.
La tecnica del ensayo "HeavyMethyl™" es un procedimiento cuantitativo para evaluar las diferencias en la metilacion basandose en la amplificacion especffica de la metilacion del ADN tratado con bisulfito. Las sondas de bloqueo especfficas de la metilacion ("bloqueante") que cubren las posiciones CpG comprendidas entre, cubiertas entre, los cebadores de amplificacion permiten la amplificacion selectiva especffica de metilacion de una muestra de acido nucleico.
La expresion ensayo "HeavyMethyl™ MethyLight™" se refiere al ensayo HeavyMethyl™ MethyLight™, que es una variacion del ensayo MethyLight™, en el que el ensayo MethyLight™ se combina con sondas de bloqueo especfficas de metilacion que cubren las posiciones CpG comprendidas entre los cebadores de amplificacion. El ensayo HeavyMethyl™ tambien se puede usar junto con cebadores de amplificacion especfficos de la metilacion.
Los reactivos tfpicos (por ejemplo, como se encontrarfa en un kit de basado en MethyLight™ tfpico) para el analisis HeavyMethyl™ puede incluir, aunque no de forma limitativa: cebadores de la PCR para loci especfficos (por ejemplo, genes especfficos, marcadores, DMR, regiones de genes, regiones de marcadores, secuencia de ADN tratada con bisulfito, isla CpG,, o secuencia de ADN tratada con bisulfito o isla CpG, etc.); oligonucleotidos bloqueantes; tampones y desoxinucleotidos optimizados para la PCR; y polimerasa Taq.
MSP (PCR especffica de metilacion) permite evaluar el estado de metilacion de practicamente cualquier grupo de sitios CpG dentro de una isla CpG, independiente del uso de enzimas de restriccion sensibles a la metilacion (Herman y col. Proc. Natl. Acad. Sci. USA 93:9821-9826, 1996; patente de Estados Unidos n.° 5.786.146). En resumen, el ADN se modifica con bisulfito de sodio, que convierte las citosinas no metiladas, pero no citosinas metiladas, en uracilo, y posteriormente los productos se amplifican con cebadores especfficos de ADN metilado en comparacion con no metilado. MSP solo necesita pequenas cantidades de ADN, es sensible al 0,1 % de alelos metilados de un locus de isla CpG dado, y se puede realizar sobre ADN extrafdo de muestras incluidas en parafina. Los reactivos tfpicos (por ejemplo, como se encontrarfa en un kit basado en MSP tfpico) para el analisis MSP puede incluir, aunque no de forma limitativa: cebadores de la PCR para loci especfficos metilados y no metilados (por ejemplo, genes especfficos, marcadores, DMR, regiones de genes, regiones de marcadores, secuencia de ADN tratada con bisulfito, isla CpG, etc.); tampones y desoxinucleotidos optimizados para la PCR, y sondas especfficas. El ensayo MethyLight™ es un ensayo de metilacion cuantitativo de alto rendimiento que utiliza PCR en tiempo real basada en fluorescencia (por ejemplo, TaqMan®) que no requiere manipulaciones adicionales despues de la etapa de la PCR (Eads y col., Cancer Res. 59:2302-2306, 1999). En resumen, el procedimiento MethyLight™ se inicia con una muestra mixta de ADN genomico que se convierte, en una reaccion con bisulfito de sodio, en una combinacion mixta de diferencias de secuencia dependientes de la metilacion de acuerdo con procedimientos convencionales (el procedimiento del bisulfito convierte los restos de citosina no metilados en uracilo). A continuacion se realiza la PCR basada en fluorescencia de forma "sesgada", por ejemplo, con cebadores de la PCR que solapan dinucleotidos CpG conocidos. La discriminacion de secuencia se produce tanto durante el procedimiento de amplificacion como durante el procedimiento de deteccion de fluorescencia.
El ensayo MethyLight™ se utiliza como prueba cuantitativa para determinar los patrones de metilacion en un acido nucleico, por ejemplo, una muestra de ADN genomico, en la que la discriminacion de secuencia se produce durante la hibridacion de la sonda. En una version cuantitativa, la reaccion de la PCR proporciona una amplificacion especffica de la metilacion en presencia de una sonda fluorescente que se superpone a un sitio de metilacion concreto posible. Se proporciona un control no sesgado de la cantidad de ADN inicial mediante una reaccion en la que ninguno de los cebadores, ni la sonda, solapa con ninguno de los dinucleotidos CpG. Como alternativa, se consigue una prueba cualitativa de la metilacion genomica sondeando la combinacion de la PCR sesgada bien con oligonucleotidos del control que no cubren sitios de metilacion conocidos (por ejemplo, una version fluorescente de las tecnicas HeavyMethyl™ y MSP) o con oligonucleotidos que cubren sitios de metilacion potenciales.
El procedimiento MethyLight™ se utiliza con cualquier sonda adecuada (por ejemplo, una sonda "TaqMan®", una sonda Lightcycler®, etc. Por ejemplo, en algunas aplicaciones, el ADN bicatenario se trata con bisulfito de sodio y se somete a uno de dos grupos de reacciones de PCR utilizando sondas TaqMan®, por ejemplo, con cebadores MSP y/o oligonucleotidos bloqueantes HeavyMethyl y una sonda TaqMan®. La sonda TaqMan® esta doblemente marcada con moleculas fluorescentes "indicadoras" y moleculas "inactivadoras", y esta disenado para ser especffica de un contenido relativamente elevado en la region GC, por lo que se hibrida a una temperatura a una temperatura aproximadamente 10 °C mayor en el ciclo de la PCR que los cebadores directos e inversos. Esto permite que la sonda TaqMan® permanezca completamente hibridada durante la etapa de hibridacion/extension de la PCR. Puesto que la polimerasa Taq sintetiza enzimaticamente una nueva hebra durante la PCR, eventualmente alcanzara la sonda TaqMan® hibridada. La actividad de la polimerasa Taq 5' a 3' endonucleasa posteriormente desplazara la sonda TaqMan® digiriendola para liberar la molecula indicadora fluorescente para deteccion cuantitativa de su senal ahora no inactivada usando una sistema de deteccion de fluorescencia en tiempo real.
Los reactivos tfpicos (por ejemplo, como se encontrarfa en un kit basado en MethyLight™ tfpico) para el analisis MethyLight™ pueden incluir, aunque no de forma limitativa: cebadores de la PCR para loci especfficos (por ejemplo, genes especfficos, marcadores, DMR, regiones de genes, regiones de marcadores, secuencia de ADN tratada con bisulfito, isla CpG, etc.); sondas TaqMan® o Lightcycler®; tampones y desoxinucleotidos optimizados para la PCR; y polimerasa Taq.
El ensayo QM™ (metilacion cuantitativa) es una prueba cuantitativa alternativa para determinar patrones de metilacion en muestras de ADN genomico, en la que la discriminacion de secuencia se produce durante la hibridacion de la sonda. En esta version cuantitativa, la reaccion de la PCR proporciona una amplificacion no sesgada en presencia de una sonda fluorescente que se superpone a un sitio de metilacion concreto posible. Se proporciona un control no sesgado de la cantidad de ADN inicial mediante una reaccion en la que ninguno de los cebadores, ni la sonda, solapa con ninguno de los dinucleotidos CpG. Como alternativa, se consigue una prueba cualitativa de la metilacion genomica sondeando la combinacion de la PCR sesgada bien con oligonucleotidos del control que no cubren sitios de metilacion conocidos (una version fluorescente de las tecnicas HeavyMethyl™ y MSP) o con oligonucleotidos que cubren sitios de metilacion potenciales.
El procedimiento QM™ se puede usar con cualquier sonda adecuada, por ejemplo, sondas "TaqMan®", sondas Lightcycler®, en el procedimiento de amplificacion. Por ejemplo, el ADN genomico bicatenario se trata con bisulfito de sodio y se somete a uno cebadores no sesgados y a la sonda TaqMan®. La sonda TaqMan® esta doblemente marcada con moleculas fluorescentes "indicadoras" y moleculas "inactivadoras", y esta disenado para ser especffica de un contenido relativamente elevado en la region GC, por lo que se hibrida a una temperatura a una temperatura aproximadamente 10 °C mayor en el ciclo de la PCR que los cebadores directos e inversos. Esto permite que la sonda TaqMan® permanezca completamente hibridada durante la etapa de hibridacion/extension de la PCR. Puesto que la polimerasa Taq sintetiza enzimaticamente una nueva hebra durante la PCR, eventualmente alcanzara la sonda TaqMan® hibridada. La actividad de la polimerasa Taq 5' a 3' endonucleasa posteriormente desplazara la sonda TaqMan® digiriendola para liberar la molecula indicadora fluorescente para deteccion cuantitativa de su senal ahora no inactivada usando una sistema de deteccion de fluorescencia en tiempo real. Los reactivos tfpicos (por ejemplo, como se encontrarfa en un kit basado en QM™ tfpico) para el analisis QM™ pueden incluir, aunque no de forma limitativa: cebadores de la PCR para loci especfficos (por ejemplo, genes especfficos, marcadores, DMR, regiones de genes, regiones de marcadores, secuencia de ADN tratada con bisulfito, isla CpG, etc.); sondas TaqMan® o Lightcycler®; tampones y desoxinucleotidos optimizados para la PCR; y polimerasa Taq.
La tecnica Ms-SNuPE™ es un procedimiento cuantitativo para evaluar las diferencias en la metilacion en sitios CpG especfficos basandose en el tratamiento del ADN con bisulfito, seguido por extension del cebador de nucleotido unico (Gonzalgo & Jones, Nucleic Acids Res. 25:2529-2531,1997). En resumen, el ADN genomico se hace reaccionar con bisulfito de sodio para convertir la citosina no metilada en uracilo, dejando inalterada la 5-metilcitosina. La amplificacion de la secuencia diana deseada se realiza a continuacion usando cebadores de la PCR especfficos del ADN transformado con bisulfito, y el producto de reaccion resultante se afsla y se utiliza como molde para el analisis de metilacion en el sitio CpG de interes. Se pueden analizar pequenas cantidades de ADN (por ejemplo, secciones microseccionadas de patologfa) y esto evita el uso de enzimas de restriccion para determinar el estado de metilacion en sitios CpG.
Los reactivos tfpicos (por ejemplo, como se encontrarfa en un kit basado en Ms-SNuPE™ tfpico) para el analisis Ms-SNuPE™ pueden incluir, aunque no de forma limitativa: cebadores de la PCR para loci especfficos (por ejemplo, genes especfficos, marcadores, DMR, regiones de genes, regiones de marcadores, secuencia de ADN tratada con bisulfito, isla CpG, etc.); tampones y desoxinucleotidos optimizados para la PCR; kit de extraccion en gel; cebadores del control positivos; cebadores Ms-SNuPE™ de loci especfficos; tampon de reaccion (para la reaccion Ms-SNuPE); y nucleotidos marcados. Ademas, los reactivos para la conversion con bisulfito pueden incluir: tampon de desnaturalizacion de ADN; tampon de sulfonacion; reactivos o kits de recuperacion del ADN (por ejemplo, precipitacion, ultrafiltracion, columna de afinidad); tampon de desulfonacion; y componentes de recuperacion del ADN.
La secuenciacion con representacion reducida de bisulfito (RRBS) comienza con el tratamiento del acido nucleico con bisulfito para convertir todas la citosinas no metiladas en uracilo, seguido por digestion con enzima de restriccion (por ejemplo, mediante una enzima que reconoce un sitio que incluye una secuencia CG tal como MspI) y secuenciacion completa de fragmentos tras el acoplamiento con un ligando adaptador. La seleccion de la enzima de restriccion enriquece los fragmentos de las regiones densas en CpG, reduciendo el numero de secuencias redundantes que pueden cartografiar multiples posiciones del gen durante el analisis. Por tanto, RRBS reduce la complejidad de la muestra de la muestra de acido nucleico seleccionando un subconjunto (por ejemplo, mediante seleccion por tamano usando electroforesis en gel preparativa) de fragmentos de restriccion para secuenciacion. En oposicion a la secuenciacion del genoma completo con bisulfito, cada fragmento producido por la digestion con enzima de restriccion contiene informacion sobre la metilacion del ADN para al menos un dinucleotido CpG. Por tanto, RRBS enriquece la muestra en promotores, islas CpG, y otras las caracterfsticas genomicas con una alta frecuencia de sitios de corte de la enzima de restriccion en estas regiones y, de esta forma, proporciona un ensayo para evaluar el estado de metilacion de uno o mas loci genomicos.
Un protocolo tfpico para RRBS comprende las etapas de digerir una muestra de acido nucleico con una enzima de restriccion tal como Mspl, rellenar con salientes y colas A, ligar adaptadores, conversion con bisulfito, y PCR. Vease, por ejemplo, y col. (2005) "Genome-scale DNA methylation mapping of clinical samples at single-nucleotide resolution" Nat Methods 7: 133-6; Meissner y col. (2005) "Reduced representation bisulfite sequencing for comparative high-resolution DNA methylation analysis" Nucleic Acids Res. 33: 5868-77.
En algunas realizaciones, se utiliza un ensayo cuantitativo para la amplificacion de la diana y la serial en tiempo real especffica de alelo (QuARTS) para evaluar el estado de metilacion. Se producen secuencialmente tres reacciones en cada ensayo QuARTS, incluidas amplificacion (reaccion 1) y escision de la sonda de la diana (reaccion 2) en la reaccion primaria; y escision FRET y generacion de la senal fluorescente (reaccion 3) en la reaccion secundaria. Cuando el acido nucleico diana se amplifica con cebadores especfficos, una sonda de deteccion especffica con una secuencia de aleta se une de forma suelta al amplicon. La presencia del oligonucleotido invasivo especffico en el sitio de union a la diana produce la escision para liberar la secuencia de aleta cortando entre la sonda de deteccion y la secuencia de aleta. La secuencia de aleta es complementaria a una porcion no de horquilla del correspondiente casete FRET. En consecuencia, la secuencia de aleta funciona como un oligonucleotido invasivo del casete FRET y realiza una escision entre el fluoroforo del casete FRET y un inactivador, que produce una senal de fluorescencia. La reaccion de escision puede cortar multiples sondas por diana y liberar, por tanto, multiples fluoroforos por aleta, proporciona una amplificacion de senal exponencial. QuARTS puede detectar multiples dianas en un unico pocillo de reaccion usando casetes FRET con diferentes colorantes. Vease, por ejemplo, en Zou y col. (2010) "Sensitive quantification of methylated markers with a novel methylation specific technology" Clin Chem 56: A199; solicitud de patente de Estados Unidos con numeros de serie 12/946.737, 12/946.745, 12/946.752, y 61/548.639.
La expresion "reactivo de bisulfito" se refiere a un reactivo que comprende bisulfito, disulfito, hidrogenosulfito, o combinaciones de los mismos, utiles como se desvela en el presente documento para distinguir entre secuencias de dinucleotido CpG metiladas y no metiladas. Los procedimientos de dicho tratamiento se conocen en la tecnica (por ejemplo, documento PCT/EP2004/011715). Se prefiere que el tratamiento con bisulfito se realice en presencia de disolventes desnaturalizantes tales como, aunque no de forma limitativa, n-alquilenglicol o dietilenglicol dimetil eter (DME), o en presencia de dioxano o derivados de dioxano. En algunas realizaciones, los disolventes desnaturalizantes se utilizan en concentraciones comprendidas entre 1 % y el 35 % (v/v). En algunas realizaciones, la reaccion con bisulfito se lleva a cabo en presencia de secuestrantes tales como, aunque no de forma limitativa, derivados de cromano, por ejemplo, 6-hidroxi-2,5,7,8,-tetrametilcromano acido 2-carboxflico o trihidroxibenzona acido y derivados de los mismos, por ejemplo, acido galico (vease: documento PCT/EP2004/011715). La conversion con bisulfito se lleva a cabo preferentemente a una temperatura de reaccion comprendida entre 30 °C y 70 °C, por lo cual, la temperatura se aumenta a mas de 85 °C durante cortos periodos de tiempo durante la reaccion (vease: documento PCT/EP2004/011715). El ADN tratado con bisulfito preferentemente se purifica antes de la cuantificacion. Esto se puede llevar a cabo mediante cualquier medio conocido en la tecnica, tales como, aunque no de forma limitativa, ultrafiltracion, por ejemplo, mediante columnas Microcon™ (fabricadas por Millipore™). La purificacion se lleva a cabo de acuerdo con un protocolo del fabricante modificado (vease, por ejemplo, documento PCT/EP2004/011715).
En algunas realizaciones, los fragmentos del ADN tratado se amplifican usando conjuntos de oligonucleotidos cebadores de acuerdo con la presente invencion (por ejemplo, vease la Tabla 2) y una enzima de amplificacion. La amplificacion de varios segmentos de ADN se puede llevar a cabo simultaneamente en un mismo recipiente de reaccion. Normalmente, la amplificacion se lleva a cabo usando una reaccion en cadena de la polimerasa (PCR). Los amplicones tienen de forma tfpica de 100 a 2000 pares de bases de longitud.
En otra realizacion del procedimiento, el estado de metilacion de las posiciones CpG dentro o cerca de un marcador que comprenden una DMR (por ejemplo, DMR 1-107 como se proporciona en la Tabla 1) (por ejemplo, DMR 1-449 como se proporciona en la Tabla 10) se puede detectar mediante el uso de oligonucleotidos cebadores especfficos de la metilacion. Esta tecnica (MSP) se ha descrito en la patente de Estados Unidos n.° 6.265.171 de Herman. El uso de cebadores especfficos del estado de la metilacion para la amplificacion del ADN tratado con bisulfito permite la diferenciacion entre los acidos nucleicos metilados y no metilados. Los pares de cebadores MSP contienen al menos un cebador que se hibrida con un dinucleotido CpG tratado con bisulfito. Por lo tanto, la secuencia de dichos cebadores comprende al menos un dinucleotido CpG. Los cebadores MSP especfficos del ADN no metilado contienen una "T" en la posicion de la posicion de C en el CpG.
Los fragmentos obtenidos mediante la amplificacion pueden llevar una marca detectable directa o indirectamente. En algunas realizaciones, las marcas son marcadores fluorescentes, radionucleidos, o fragmentos de moleculas que se pueden desprender que tienen una masa tfpica que se puede detectar en un espectrometro de masas. Cuando dichas marcas son marcas de masa, algunas realizaciones proporcionan que los amplicones marcados tengan una sola carga neta, positiva o negativa, lo que permite una mejor capacidad de deteccion en el espectrometro de masas. La deteccion se puede llevar a cabo y visualizarse mediante, por ejemplo, espectrometrfa de masas mediante desorcion/ionizacion laser asistida por matriz (MALDI) o mediante el uso de espectrometrfa de masas con electropulverizacion (IEN).
Los procedimientos para aislar ADN adecuados para su uso en estas tecnologfas de ensayo son conocidos en la tecnica. En particular, algunas realizaciones comprenden aislamiento de los acidos nucleicos como se describe en la solicitud de patente de Estados Unidos con numero de serie 13/470,251 ("Isolation of Nucleic Acids").
Procedimientos
En algunas realizaciones de la tecnologfa, se proporcionan procedimientos que comprenden las siguientes etapas: 1) poner en contacto un acido nucleico (por ejemplo, ADN genomico, por ejemplo, aislado de fluidos corporales tales como una muestra de heces o tejido pancreatico) obtenido del sujeto con al menos un reactivo o una serie de reactivos que distinguen entre dinucleotidos CpG metilados y no metilados dentro de un marcador que comprende una DMR (por ejemplo, DMR 1-107, por ejemplo, como se proporciona en la Tabla 1) (por ejemplo, DMR 1-449, por ejemplo, como se proporciona en la Tabla 10) y
2) detectar una neoplasia o trastorno proliferativo (por ejemplo, conseguido con una sensibilidad mayor o igual al 80 %, y una especificidad mayor o igual al 80 %).
En algunas realizaciones de la tecnologfa, se proporcionan procedimientos que comprenden las siguientes etapas: 1) poner en contacto un acido nucleico (por ejemplo, ADN genomico, por ejemplo, aislado de fluidos corporales tales como una muestra de heces o tejido pancreatico) obtenido del sujeto con al menos un reactivo o una serie de reactivos que distinguen entre dinucleotidos CpG metilados y no metilados dentro de al menos un marcador seleccionado entre una region cromosomica que tiene una anotacion seleccionada entre el grupo que consiste de ABCB1, ADCY1, BHLHE23 (LOC63930), c13orf18, CACNA1C, chr12 133, CLEC11A, ELMO1, EOMES, CLEC 11, SHH, GJC1, IHIF1, IKZF1, KCNK12, KCNN2, PCBP3, PRKCB, RSPO3, SCARF2, SLC38A3, ST8SIA1, TWIST 1, VWC2, WT1, y ZNF71, y
2) detectar cancer pancreatico (por ejemplo, conseguido con una sensibilidad mayor o igual al 80 %, y una especificidad mayor o igual al 80 %).
En algunas realizaciones de la tecnologfa, se proporcionan procedimientos que comprenden las siguientes etapas: 1) poner en contacto un acido nucleico (por ejemplo, ADN genomico, por ejemplo, aislado de fluidos corporales tales como una muestra de heces o tejido esofagico) obtenido del sujeto con al menos un reactivo o una serie de reactivos que distinguen entre dinucleotidos CpG metilados y no metilados dentro de al menos un marcador seleccionado entre una region cromosomica que tiene una anotacion seleccionada entre el grupo que consiste de NDRG4, SFRP1, BMP3, HPP1, y APC, y
2) detectar un esofago de Barrett (por ejemplo, conseguido con una sensibilidad mayor o igual al 80 %, y una especificidad mayor o igual al 80 %).
En algunas realizaciones de la tecnologfa, se proporcionan procedimientos que comprenden las siguientes etapas: 1) poner en contacto un acido nucleico (por ejemplo, ADN genomico, por ejemplo, aislado de fluidos corporales tales como una muestra de heces o tejido pancreatico) obtenido del sujeto con al menos un reactivo o una serie de reactivos que distinguen entre dinucleotidos CpG metilados y no metilados dentro de al menos un marcador seleccionado entre una region cromosomica que tiene una anotacion seleccionada entre el grupo que consiste de ADCY1, PRKCB, KCNK12, C13ORF18, IKZF1, TWIST 1, ELMO, 55957, CD1D, CLEC11A, KCNN2, BMP3, y NDRG4, y
2) detectar cancer pancreatico (por ejemplo, conseguido con una sensibilidad mayor o igual al 80 %, y una especificidad mayor o igual al 80 %).
En algunas realizaciones de la tecnologfa, se proporcionan procedimientos que comprenden las siguientes etapas: 1) poner en contacto un acido nucleico (por ejemplo, ADN genomico, por ejemplo, aislado de una muestra de heces) obtenido del sujeto con al menos un reactivo o una serie de reactivos que distinguen entre dinucleotidos CpG metilados y no metilados dentro de una region cromosomica que tiene una CD1D, y
2) detectar cancer pancreatico (por ejemplo, conseguido con una sensibilidad mayor o igual al 80 %, y una especificidad mayor o igual al 80 %).
Preferentemente, la sensibilidad es de aproximadamente 70 % a aproximadamente 100 % en peso o de aproximadamente 80 % a aproximadamente 90 % en peso o de aproximadamente 80 % a aproximadamente 85 %. Preferentemente, la especificidad es de aproximadamente 70 % a aproximadamente 100 % en peso o de aproximadamente 80 % a aproximadamente 90 % en peso o de aproximadamente 80 % a aproximadamente 85 %. El ADN genomico se puede aislar por cualquier medio, incluido el uso de kits comercialmente disponibles. En resumen, cuando el a Dn de interes esta encapsulado mediante una membrana celular, la muestra biologica debe romperse y lisarse por medios enzimaticos, qufmicos o mecanicos. La solucion de ADN se puede limpiar a continuacion de protefnas y otros contaminantes, por ejemplo, mediante digestion con proteinasa K. A continuacion, el ADN genomico se recupera de la solucion. Esto se puede llevar a cabo por una serie de procedimientos entre los que se incluyen salado, Extraccion con disolventes organicos, o union del ADN a un soporte en fase solida. La seleccion del procedimiento estara afectad por varios factores que incluyen el tiempo, coste, y cantidad de ADN necesaria. Todos los tipos de muestras clfnicas que comprenden material neoplasico o preneoplasico son adecuados para su uso en el presente procedimiento, por ejemplo, lfneas de celulas, portas histologicos, biopsias, tejido incluido en parafina, fluidos corporales, heces, efluente colonico, orina, plasma sangufneo, suero sangufneo, sangre completa, celulas sangufneas aisladas, celulas aisladas de la sangre, y combinaciones de los mismos.
La tecnologfa no esta limitada en los procedimientos utilizados para preparar las muestras y proporcionar un acido nucleico para su analisis. Por ejemplo, en algunas realizaciones, un Ad N se afsla de una muestra de heces o de la sangre o del plasma usando captura genica directa, por ejemplo, como se detalla en la solicitud de patente de EE.UU. con numero de serie 61/485386 o por un procedimiento relacionado.
La muestra de ADN genomico se trata a continuacion con al menos un reactivo, o serie de reactivos, que distinguen entre dinucleotidos CpG metilados y no metilados dentro de al menos un marcador que comprende una DMR (por ejemplo, DMR 1-107, por ejemplo, como se proporciona en la Tabla 1) (por ejemplo, DMR 1-449, por ejemplo, como se proporciona en la Tabla 10).
En algunas realizaciones, el reactivo convierte las bases de citosina que no estan metiladas en la posicion 5' en uracilo, timina, u otra base, que sea diferente a la citosina en terminos de comportamiento de hibridacion. Sin embargo, en algunas realizaciones, el reactivo puede ser una enzima de restriccion sensible a la metilacion.
En algunas realizaciones, la muestra de ADN genomico se trata de tal forma que las bases de citosina que no estan metiladas en la posicion 5' se convierten en uracilo, timina, u otra base, que sea diferente a la citosina en terminos de comportamiento de hibridacion. En algunas realizaciones, este tratamiento se lleva a cabo con bisulfato (hidrogenosulfito, disulfito) seguido por hidrolisis alcalina.
El acido nucleico tratado se analiza a continuacion para determinar el estado de metilacion de las secuencias del gen diana (al menos un gen, secuencia genomica, o nucleotido de un marcador que comprende una DMR, por ejemplo, al menos una DMR seleccionada entre DMR 1-107, por ejemplo, como se proporciona en la Tabla 1) (al menos un gen, secuencia genomica, o nucleotido de un marcador que comprende una DMR, por ejemplo, al menos una DMR seleccionada entre DMR 1-449, por ejemplo, como se proporciona en la Tabla 10). El procedimiento de analisis puede seleccionarse entre los conocidos en la tecnica, incluidos los relacionados en el presente documento, por ejemplo, QuARTS y MSP como se describe en el presente documento.
Una metilacion anomala, mas especfficamente la hipermetilacion de un marcador que comprende una DMR (por ejemplo, DMR 1-107, por ejemplo, como se proporciona en la Tabla 1) (por ejemplo, DMR 1-449, por ejemplo, como se proporciona en la Tabla 10) esta asociada con un cancer y, en algunas realizaciones, preduce el sitio del tumor.
La tecnologfa se refiere al analisis de cualquier muestra asociada a un cancer del sistema gastrointestinal. Por ejemplo, en algunas realizaciones, la muestra comprende un tejido y/o fluido biologico obtenida de un paciente. En algunas realizaciones, la muestra comprende una secrecion. En algunas realizaciones, la muestra comprende sangre, suero, plasma, secreciones gastricas, jugo pancreatico, una muestra de biopsia gastrointestinal, celulas microdisecadas de una biopsia gastrointestinal, celulas gastrointestinales enviadas al interior de la luz gastrointestinal, y/o celulas gastrointestinales recuperadas de las heces. En algunas realizaciones, el sujeto es un ser humano. Estas muestras pueden tener su origen en el tracto gastrointestinal superior, el tracto gastrointestinal inferior, o comprender celulas, tejidos y/o secreciones tanto del tracto gastrointestinal superior como del tracto gastrointestinal inferior. La muestra puede incluir celulas, secreciones, o tejidos del hfgado, conductos biliares, pancreas, estomago, colon, recto, esofago, intestino delgado, apendice, duodeno, polipos, vesfcula biliar, ano, y/o peritoneo. En algunas realizaciones, la muestra comprende fluido celular, ascitis, orina, heces, fluido pancreatico, fluido obtenido durante la endoscopia, sangre, moco, o saliva. En algunas realizaciones, la muestra es una muestra de sangre.
Dichas muestras se pueden obtener por cualquier numero de procedimientos conocidos en la materia, tal como sera evidente para el experto en la materia. Por ejemplo, las muestras de orina y fecales son facilmente accesibles, mientras que las muestras de sangre, ascites, suero o fluido pancreatico se pueden obtener por via parenteral usando una aguja y jeringa, por ejemplo. Las muestras exentas o sustancialmente exentas de celulas se pueden obtener sometiendo la muestra a diferentes tecnicas conocidas del experto en la materia y que incluyen, aunque no de forma limitativa, centrifugacion y filtracion. Aunque por lo general se prefiere no usar tecnicas invasivas para obtener la muestra, puede seguir siendo preferible obtener muestras tales como homogenados de tejido, secciones de tejido y especfmenes de biopsias.
En algunas realizaciones, la tecnologfa se refiere a un procedimiento para tratar un paciente, (por ejemplo, un paciente con cancer gastrointestinal, con un cancer gastrointestinal en las primeras etapas, o que puede desarrollar cancer gastrointestinal), comprendiendo el procedimiento determinar el estado de metilacion de una o mas DMR como se proporciona en el presente documento y administrar un tratamiento al paciente en funcion de los resultados de la determinacion del estado de metilacion. El tratamiento puede ser la administracion de un compuesto farmaceutico, una vacuna, realizar una intervencion quirurgica, realizar una adquisicion de imagen del paciente, realizar otra prueba. Preferentemente, dicho uso es en un procedimiento de cribado clfnico, un procedimiento de evaluacion del pronostico, un procedimiento para seguimiento de los resultados de una terapia, un procedimiento para identificar los pacientes con mas probabilidad de responder a un determinado tratamiento terapeutico, un procedimiento para obtener imagenes de un paciente o sujeto, y un procedimiento para el cribado y desarrollo de farmacos.
En algunas realizaciones de la tecnologfa, se proporciona un procedimiento para diagnosticar un cancer gastrointestinal en un sujeto. Los terminos "diagnosticar" y "diagnostico" tal como se usa en el presente documento se refieren a procedimientos mediante los que el experto en la tecnica puede estimar e incluso determinar si un paciente padece o no una enfermedad o dolencia dada o puede desarrollar una enfermedad o dolencia dada en el futuro. El experto en la materia frecuentemente realiza un diagnostico sobre la base de uno o mas indicadores diagnosticos, tales como, por ejemplo, un biomarcador (por ejemplo, una DMR como se desvela en el presente documento), cuyo estado de metilacion es indicativo de la presencia, gravedad, o ausencia de la dolencia.
Junto con el diagnostico, el pronostico clfnico del cancer se relaciona con determinar la agresividad del cancer y la probabilidad de recidiva del tumor para planificar la terapia mas eficaz. Si se puede hacer un pronostico mas preciso o incluso se puede evaluar el riesgo potencial de desarrollar cancer, se puede seleccionar la terapia adecuada y, en el algunos casos, una terapia menos severa para el paciente. La valoracion (por ejemplo, la determinacion del estado de metilacion) de los biomarcadores del cancer es de utilidad para separar sujetos con buen pronostico y/o bajo riesgo de desarrollar cancer que no necesitan terapia o bien una terapia limitada de aquellos con mayor probabilidad de desarrollar cancer o de tener recidiva de un cancer que se beneficiarfan de un tratamiento mas intensivo.
Por tanto, "realizar un diagnostico", o "diagnosticar", como se usa en el presente documento, es inclusivo ademas de realizar una determinacion del riesgo de desarrollar cancer o determinar un pronostico, que puede proporcionar la prediccion de un resultado clfnico (con o sin tratamiento medico), seleccionar un tratamiento adecuado (o si un tratamiento serfa eficaz), o realizar un seguimiento de un tratamiento actual y potencialmente cambiar el tratamiento, en funcion de la medicion de los biomarcadores de diagnostico (por ejemplo, DMR) desvelados en el presente documento. Ademas, en algunas realizaciones de la presente materia sujeto, se puede realizar una determinacion de multiples biomarcadores con el tiempo para facilitar el diagnostico y/o el pronostico. Se puede usar un cambio temporal en el biomarcador para predecir un resultado clfnico, seguir la evolucion del cancer gastrointestinal y/o seguir la eficacia de las terapias adecuadas dirigidas contra el cancer. En una realizacion de ese tipo, por ejemplo, se podrfa esperar ver un cambio en el estado de metilacion de uno o mas biomarcadores (por ejemplo, d Mr ) desvelados en el presente documento (y potencialmente en uno o mas biomarcadores adicionales, en caso de realizar seguimiento) en una muestra biologica a lo largo del tiempo durante el curso de una terapia eficaz.
La materia sujeto actualmente desvelada proporciona ademas, en algunas realizaciones, un procedimiento para determinar si iniciar o continuar la profilaxia o el tratamiento del cancer en un sujeto. En algunas realizaciones, el procedimiento comprende proporcionar una serie de muestras biologicas durante un periodo de tiempo procedentes del sujeto; analizar la serie de muestras biologicas para determinar el estado de metilacion de al menos un biomarcador desvelado en el presente documento para cada una de las muestras biologicas; y comparar cualquier cambio mensurable en los estados de metilacion de uno o mas de los biomarcadores en cada una de las muestras biologicas. Los posibles cambios en los estados de metilacion de los marcadores a lo largo del periodo de tiempo se pueden usar para predecir el riesgo de desarrollar cancer, predecir el resultado clfnico, determinar si iniciar o continuar la profilaxia o la terapia contra el cancer, y si una terapia actual es eficaz para tratar el cancer. Por ejemplo, se puede seleccionar un primer punto antes de iniciar el tratamiento y se puede seleccionar un segundo punto en algun momento despues de iniciar el tratamiento. Los estados de metilacion se pueden medir en cada una de las muestras tomadas de diferentes puntos temporales y anotar las diferencias cuantitativas y/o cualitativas observadas. Un cambio en los estados de metilacion de los niveles de biomarcadores de las diferentes muestras se puede correlacionar con el riesgo de cancer gastrointestinal, pronostico, determinacion de la eficacia del tratamiento, y/o evolucion del cancer en el sujeto.
En realizaciones preferidas, los procedimientos y composiciones de la invencion son para el tratamiento o diagnostico de la enfermedad en una etapa inicial, por ejemplo, antes de que se presenten los sfntomas de la enfermedad. En algunas realizaciones, os procedimientos y composiciones de la invencion son para el tratamiento o diagnostico de la enfermedad en una etapa clfnica.
Como se ha indicado, en algunas realizaciones, se pueden realizar multiples determinaciones de uno o varios biomarcadores de diagnostico o pronostico, y se puede usar un cambio temporal en el marcador para determinar el diagnostico o pronostico. Por ejemplo, un marcador diagnostico se puede determinar en un momento inicial, y de nuevo en un segundo momento. En dichas realizaciones, un aumento en el valor del marcador del primer al segundo momento puede ser diagnostico de un tipo particular o de la gravedad de un cancer, o un pronostico dado. Analogamente, una disminucion en el valor del marcador del primer al segundo momento puede ser diagnostico de un tipo particular o de la gravedad del cancer, o un pronostico dado. Ademas, el grado de cambio en uno o mas marcadores se puede relacionar con la gravedad del cancer y futuros acontecimientos adversos. El experto en la materia entendera que, aunque en algunas realizaciones se pueden hacer mediciones comparativas del misma biomarcador en multiples puntos temporales, tambien se puede medir un biomarcador dado en un punto temporal, y un segunda biomarcador en un segundo punto temporal, y una comparacion entre ambos marcadores puede proporcionar informacion para el diagnostico.
Como se usa en el presente documento, la expresion "determinacion del pronostico" se refiere a los procedimientos en los que el experto en la tecnica puede predecir la evolucion o el resultado de una dolencia en un sujeto. El termino "pronostico" no se refiere a la capacidad de predecir la evolucion o el resultado de una dolencia con el 100 % de precision, o incluso que una evolucion o resultado dado sea predeciblemente mas o menos probable que ocurra en funcion del estado de metilacion de un biomarcador (por ejemplo, una DMR). En cambio, el experto en la materia entendera que el termino "pronostico" se refiere a una mayor probabilidad de que se produzca una determinada evolucion o resultado; es decir, que es mas probable que se produzca una evolucion o resultado en un sujeto que presenta una dolencia dada, en comparacion con otros individuos que no padecen la dolencia. Por ejemplo, en individuos que no presentan la dolencia (por ejemplo, que tienen un estado de metilacion normal de una o mas DMR), al posibilidad de un resultado dado (por ejemplo, padecer un cancer gastrointestinal) puede ser muy baja.
En algunas realizaciones, un analisis estadfstico asocia un indicador de pronostico con una predisposicion a un resultado adverso. Por ejemplo, en algunas realizaciones, un estado de metilacion diferente al que aparece en una muestra de control normal obtenida de un paciente que no tiene cancer puede senalar que es mas probable que un sujeto padezca un cancer que los sujetos con un nivel que es mas similar al el estado de metilacion de la muestra del control, como se determina por el nivel de significacion estadfstica. Ademas, un cambio en el estado de metilacion desde el valor inicial (por ejemplo, "normal") puede ser reflejo del pronostico de un sujeto, y el grado de cambio en el estado de metilacion se puede relacionar con la gravedad de los acontecimientos adversos. La significacion estadfstica frecuentemente se determina por comparacion de dos o mas poblaciones y determinando un intervalo de confianza y/o un valor p. Vease, por ejemplo, Dowdy y Wearden, Statistics for Research, John Wiley & Sons, Nueva York, 1983. Los intervalos de confianza ilustrativos de la presente materia sujeto son 90 %, 95 %, 97,5 %, 98 %, 99 %, 99,5 %, 99,9 % y 99,99 %, mientras que los valores de p ilustrativos son 0,1, 0,05, 0,025, 0,02, 0,01, 0,005, 0,001, y 0,0001.
En otras realizaciones, puede establecerse un grado de cambio umbral en el estado de metilacion de un marcador de pronostico o diagnostico descrito en el presente documento (por ejemplo, una DMR), y el grado de cambio en el estado de metilacion del biomarcador en la muestra biologica es facil de comparar con el grado de cambio umbral en el estado de metilacion. Un umbral de cambio preferido en el estado de metilacion de los biomarcadores proporcionados en el presente documento es de aproximadamente un 5 %, aproximadamente un 10 %, aproximadamente un 15 %, aproximadamente un 20 %, aproximadamente un 25 %, aproximadamente un 30 %, aproximadamente un 50 %, aproximadamente un 75 %, aproximadamente un 100 %, y aproximadamente un 150 %. En otras realizaciones mas, se puede establecer un "nomograma", en el que el estado de metilacion" de un indicador de pronostico o diagnostico (biomarcador o combinacion de biomarcadores) se relaciona directamente con una disposicion asociada hacia un determinado resultado. El experto en la materia esta familiarizado con el uso de estos nomogramas para relacionar dos valores numericos con la comprension de que la incertidumbre de esta medicion es la misma que la incertidumbre en la concentracion del marcador porque se hace referencia a mediciones individuales de la muestra, no medias de poblacion.
En algunas realizaciones, una muestra del control se analiza simultaneamente con la muestra biologica, de forma que los resultados obtenidos de la muestra biologica se pueden comparar con los resultados obtenidos en la muestras del control. Ademas, se contempla que se puedan proporcionar curvas patron, con las que se pueden comparar los resultados de la muestra biologica. Dichas curvas patron presentan los estados de metilacion de un biomarcador en funcion de unidades de ensayo, por ejemplo, Intensidad de la senal de fluorescencia, si se usa un marca fluorescente. Cuando se usan muestras tomadas de multiples donantes, las curvas pueden proporcionarse para controlar los estados de metilacion del uno o mas biomarcadores en tejido normal, asf como para niveles "de riesgo" de uno o mas biomarcadores del tejido tomado de donantes o metaplasia o de donantes con un cancer gastrointestinal. En algunas realizaciones del procedimiento, se identifica que un sujeto tiene metaplasia tras identificar un estado de metilacion anomalo en una o mas DMR proporcionadas en el presente documento en una muestra biologica procedente de un sujeto. En otras realizaciones del procedimiento, la deteccion de un estado de metilacion anomalo de uno o mas de dichos biomarcadores en una muestra biologica procedente del sujeto da como resultado que el sujeto se identifica por tener cancer.
El analisis de los marcadores se puede llevar a cabo de forma separada o simultanea con marcadores adicionales dentro de una muestra de ensayo. Por ejemplo, varios marcadores se pueden combinar en una prueba para el procesamiento eficaz de una multiplicidad de muestras y para proporcionar potencialmente mayor eficacia diagnostica y/o pronostica. Ademas, el experto en la tecnica reconocera el valor de someter a ensayo multiples muestras (por ejemplo, en sucesivos puntos temporales) procedentes del mismo sujeto. Dicho analisis de muestras en serie puede permitir la identificacion de los cambios en los estados de metilacion del marcador con el tiempo. Los cambios en el estado de metilacion, asf como la ausencia de cambio en el estado de metilacion, puede proporcionar informacion util acerca del estado de la enfermedad que incluye, aunque no de forma limitativa, identificar el tiempo transcurrido aproximado desde el inicio del evento, la presencia y cantidad de tejido salvable, las adecuacion de una terapias farmacologica, la eficacia de diferentes terapias, y la identificacion del resultado del sujeto, incluido el riesgo de futuros eventos.
El analisis de los biomarcadores se puede llevarse a cabo en una gran variedad de formatos ffsicos. Por ejemplo, el uso de placas de microtitulacion o se puede usar automatizacion para facilitar el procesamiento de grandes cantidades de muestras de ensayo. Como alternativa, se podrfan desarrollar formatos de una sola muestra para facilitar el tratamiento y diagnostico inmediato de una forma rapida, por ejemplo, durante el transporte en ambulancia o en unidades de atencion de emergencia.
En algunas realizaciones, se diagnostica al sujeto que tiene un cancer gastrointestinal si, cuando se compara con un estado de metilacion del control, existe una diferencia mensurable en el estado de metilacion de al menos un biomarcador de la muestra. Por el contrario, cuando no se identifica ningun cambio en el estado de metilacion de la muestra biologica, se puede identificar que el sujeto no tiene cancer gastrointestinal, ni esta en riesgo de cancer, o que tiene un riesgo de cancer bajo. En este sentido, los sujetos que tienen cancer o riesgo del mismo se pueden diferenciar de sujetos que tienen bajo a sustancialmente nada de cancer o riesgo del mismo. Dichos sujetos que tienen riesgo de desarrollar un cancer gastrointestinal se pueden llevar a un calendario de cribado mas intensivo y/o regular, incluida la vigilancia endoscopica. Por otro lado, los sujetos que tienen de bajo a practicamente ningun riesgo pueden evitar someterse a una endoscopia, hasta el momento en que un futuro cribado, por ejemplo, por ejemplo, un cribado realizado de acuerdo con la presente tecnologfa, indique que ha aparecido un riesgo de cancer gastrointestinal en estos sujetos.
Tal como se ha mencionado anteriormente, dependiendo de la realizacion del procedimiento de la presente tecnologfa, la deteccion del cambio en el estado de metilacion del uno o mas biomarcadores puede ser una determinacion cualitativa o puede ser una determinacion cuantitativa. Por tanto, la etapa de diagnosticar un sujeto que tiene, o esta en riesgo de desarrollar, un cancer gastrointestinal indica que se han realizado determinadas mediciones umbral, por ejemplo, el estado de metilacion del uno o mas biomarcadores de la muestra biologica varfa desde un estado de metilacion del control predeterminado. En algunas realizaciones del procedimiento, el estado de metilacion del control es cualquier estado de metilacion detectable en el biomarcador. En otras realizaciones del procedimiento donde una muestra del control se analiza en paralelo con la muestra biologica, el estado de metilacion predeterminado es el estado de metilacion en la muestra del control. En otras realizaciones del procedimiento, el estado de metilacion predeterminado se basa en y/o esta identificado por una curva patron. En otras realizaciones del procedimiento, el estado de metilacion predeterminado es un estado especffico o un intervalo de estado. Por tanto, el estado de metilacion predeterminado se puede seleccionar, entre los lfmites aceptables que seran evidentes para los expertos en la materia, basandose en parte en la realizacion del procedimiento que se lleva a la practica y la especificidad deseada, etc.
Adicionalmente con respecto a los procedimientos de diagnostico, un sujeto preferido es un sujeto vertebrado. Un vertebrado preferido es de sangre caliente; un vertebrado de sangre caliente preferido es un mamffero. Un mamffero preferido es mas preferentemente un ser humano. Como se usa en el presente documento, el termino "sujeto" incluye sujetos tanto humanos como animales. Por lo tanto, se proporcionan en el presente documento usos terapeuticos veterinarios. Por tanto, la presente tecnologfa proporciona el diagnostico de mamfferos tales como seres humanos, asf como aquellos mamfferos de importancia porque estan en peligro de extincion, tales como los tigres de Siberia; de importancia economica, como los animales criados en granjas para consumo humano; y/o animales de importancia social para los seres humanos, como los animales que se tienen como mascotas o en los zoologicos. Los ejemplos de dichos animales incluyen, aunque no de forma limitativa: carnivores como gatos y perros; sufnidos, incluidos cerdos, lechones y jabalfes; rumiantes y/o ungulados tales como ganado vacuno, bueyes, ovejas, jirafas, ciervos, cabras, bisontes, y camellos; y caballos. Por lo tanto, tambien se proporciona el diagnostico y el tratamiento de los animales de granja, incluidos, aunque no de forma limitativa, sufnidos domesticados, rumiantes, ungulados, caballos (incluidos los caballos de carreras), y similares. La materia sujeto actualmente desvelada incluye ademas un sistema para diagnosticar un cancer gastrointestinal en un sujeto. El sistema se puede proporcionar, por ejemplo, en forma de un kit comercial que se puede utilizar para cribar un riesgo de cancer gastrointestinal o diagnosticar un cancer gastrointestinal en un sujeto del que se ha tomado una muestra biologica. Un sistema ilustrativo proporcionado de acuerdo con la presente tecnologfa incluye evaluar el estado de metilacion de una DMR como se proporciona en la Tabla 1.
Ejemplos
Ejemplo 1 - Identificacion de marcadores usando RRBS
En su conjunto, los canceres gastrointestinales representan mas muertes que los de cualquier otro sistema organico, y la incidencia agregada del cancer gastrointestinal superior y el del cancer colorrectal (CCR) son comparables. Para maximizar la eficacia del cribado y el diagnostico, se necesitan marcadores moleculares del cancer gastrointestinal que sean especfficos del sitio cuando se analizan en medios distantes como la sangre o heces. Aunque ampliamente informativos, los marcadores de acidos nucleicos metilados de forma anomala son bastante habituales en los canceres gastrointestinales superiores y en el CRC.
Durante el desarrollo de la tecnologfa proporcionada en el presente documento, se recogieron datos de un estudio de control del caso para demostrar que una estrategia de busqueda en todo el genoma identifica novedosos marcadores candidatos e informativos. Los experimentos preliminares demostraron que el analisis de heces para un marcador genico metilado (BMP3) detecta PanC. Despues, se ha comprobado que un ensayo combinado de BMP3 metilado y KRAS mutante KRAS aumento la deteccion sobre cualquiera de los marcadores en solitario. Sin embargo, los marcadores discriminantes en tejidos demostraron ser malos marcadores en heces debido a un elevado fondo de metilacion, por ejemplo, como se detecto en los especfmenes del control.
Poblacion del estudio, adquisicion de especfmenes, y muestras
La poblacion diana eran pacientes con cancer de pancreas tratados en la clfnica Mayo. La poblacion accesible incluye los que se han sometido a una pancreatectomfa distal, una pancreaticoduodenectomfa, o una colectomfa con un especimen de reseccion archivado, y un diagnostico patologico confirmado. El ADN del epitelio colonico se habfa extrafdo previamente de especfmenes microdisecados en el laboratorio de Biospecimens Accessioning Processing (BAP) usando un protocolo de fenol-cloroformo. El personal de Pancreas SPORE uso los datos de las variables emparejadas de estas muestras para seleccionar las muestras de registro de tejidos. Estas fueron revisadas por un patologo experto para confirmar el caso y controlar el estado y excluir casos de neoplasias producidas a partir de IPMN, que puede tener una biologfa subyacente distinta. El personal de SPORE dispuso la microdiseccion en el laboratorio BAP y la extraccion del ADN en los casos pancreaticos y muestras del control y proporciono 500 ng de ADN al personal del laboratorio que estaba enmascarado para el caso y el estado del control. Las muestras de acido nucleico de archivo incluyeron 18 adenocarcinomas pancreatico, 18 pancreas normales y 18 epitelios colonicos emparejados por sexo, edad, y estado de tabaquismo.
Los tipos de muestras fueron:
1) tejidos de PanC del registro de Pancreas SPORE en la clfnica Mayo limitado a AJCC estado I y II;
2) pancreas de control sin PanC;
3) epitelio colonico del control archivado sin PanC; y
4) neoplasia colonico del que el ADN se habfa extrafdo y almacenado en el laboratorio BAP.
Los casos y los controles se emparejaron por sexo, edad (en incrementos de 5 anos), y estado de tabaquismo (actual o anterior frente a nunca).
Variables principales
La variable principal fue el porcentaje de metilacion de cada amplicon de 101 pares de bases individual de las regiones HCP. El porcentaje de metilacion en las muestras de casos se comparo con las muestras del control despues de RRBS.
Procedimientos
Se prepararon bibliotecas segun procedimientos descritos previamente (vease, por ejemplo, Gu y col (2011) "Preparation of reduced representation bisulfite sequencing libraries for genome-scale DNA methylation profiling" Nature Protocols 6: 468-81) mediante la fragmentacion de ADN genomico (300 ng) por digestion con 10 unidades de MspI, una enzima de restriccion especffica de metilacion que reconoce los motivos que contienen CpG. Este tratamiento enriquece las muestras en su contenido de CpG y elimina zonas redundantes del genoma. Se repararon los extremos de los fragmentos digeridos y se agregaron colas A con 5 unidades de fragmento de Klenow (3'-5' exo) y se ligo durante la noche a adaptadores Illumina que contienen una de cuatro secuencias de codigo de barras para enlazar cada fragmento a su ID de muestra. Se llevo a cabo la seleccion por tamano de los fragmentos de 160-340 pb (que tiene inserciones de 40-220 pb) usando perlas /tampon SPRI (AMPure XP, Beckman Coulter). Los cortes de tampon fueron 0,7x a 1,1 x del volumen de muestra de perlas/tampon. Las muestras se eluyeron en un volumen de 22 pl (tampon EB, Qiagen). Se utilizo la PCR para controlar la eficacia de enlazado y la calidad de fragmentos en una pequena alfcuota de la muestra. A continuacion, las muestras se sometieron a dos rondas de conversion con bisulfito usando un protocolo EpiTect modificado (Qiagen). qPCR y PCR convencional (Pfu Turbo Cx hotstart, Agilent), seguido por evaluacion con Bioanalyzer 2100 (Agilent) sobre alfcuotas de muestra convertidas, determinaron el numero optimo de ciclos de la pCr antes de la amplificacion de la biblioteca final. La PCR final se llevo a cabo en un volumen de 50 pl (5 pl de 10x tampon PCR; 1,25 pl de cada dNTP a 10 mM; 5 pl de un primer coctel a aproximadamente 5 pM, 15 pl de molde (muestra), 1 pl de PfuTurbo Cx hotstart, y 22,75 pl de agua. El ciclado termico comenzo con incubaciones iniciales a 95 °C durante 5 minuto y a 98 °C durante 30 segundos seguido de 16 ciclos de 98 °C durante 10 segundos, 65 °C durante 30 segundos, y a 72 °C durante 30 segundos. Tras la ciclacion, las muestras se incubaron a 72 °C durante 5 minutos y se mantuvieron a 4 °C hasta la posterior elaboracion y analisis. Las muestras se combinaron en cantidades equimolares en bibliotecas tetramultiplexadas segun un esquema de aleatorizacion y se sometieron a ensayo con el bioanalizador para una comprobacion de la etapa final. Las muestras tambien se analizaron con qPCR usando patrones phiX y cebadores especfficos del adaptador.
Para la secuenciacion, las muestras se cargaron en hileras de celdas de flujo de acuerdo con una asignacion aleatorizada de hileras, donde hileras adicionales estan reservadas para los controles internos del ensayo. La secuenciacion se realizo mediante el NGS Core en la Medical Genome Facility de Mayo con el Illumina HiSeq 2000. Las lecturas fueron unidireccionales para 101 ciclos. Cada hilera de celda de flujo genero 100-120 millones de lecturas, suficiente para una mediana de cobertura de 30x a 50x de profundidad de secuenciacion (basandose en el numero de lecturas por CpG) para las secuencias alineadas. Se uso el programa informatico convencional Illumina para analizar las lecturas junto con RRBSMAP (Xi, y col. (2012) "RRBSMAP: a fast, accurate and user-friendly alignment tool for reduced representation bisulfite sequencing" Bioinformatics 28: 430-432) y un codigo informatico propio (SAAP-RRBS) desarrollado por el personal de Mayo Biomedical and Statistics (Sun y col. (2012) "SAAP-RRBS: streamlined analysis and annotation pipeline for reduced representation bisulfite sequencing" Bioinformatics 28: 2180-1). El analisis bioinformatico consintio en 1) evaluacion y limpieza de la lectura de la secuencia, 2) alineamiento con el genoma de referenda, 3) extraccion del estado de metilacion, y 4) notificacion y anotacion de CpG.
Consideraciones estadfsticas
La comparacion primaria evaluo las diferencias en la metilacion entre los casos y los controles pancreaticos para cada CpG y/o ventana de CpG apilada. La comparacion secundaria evaluo las diferencias en la metilacion entre los casos y los controles del colon. Se estudio la metilacion diferencial de los marcadores mediante:
1. Evaluacion de las distribuciones del porcentaje de metilacion para cada marcador, y descartar los marcadores que estaban metilados en mas del 1 % en el 10 % de los controles;
2. Ensayar la distribucion de la metilacion de los marcadores restantes entre casos y controles mediante la prueba de suma de rangos de Wilcoxon y ordenando los marcadores por los valores p; y
3. Usar los valores Q para estimar tasas de descubrimiento falsas (FDR) (Benjamini y col. (1995) "Multiple Testing" Journal of the Royal Statistical Society. Serie B (Metodologica) 57: 289-300; Storey y col. (2003) "Statistical significance for genomewide studies" Proc Natl Acad Sci U S A 100: 9440-5). Durante el descubrimiento, es aceptable una FDR de hasta el 25 %.
Analisis de datos
Se desarrollo un codigo de analisis de datos en el paquete informatico de analisis de software R ("R: A Language and Environment for Statistical Computing" (2012), R Foundation for Statistical Computing). El flujo de trabajo comprendfa las siguientes etapas:
1. Lectura de los 6.101.049 sitios CpG
2. Identificar para analisis adicional solo aquellos sitios CpG donde la profundidad de cobertura total del grupo es de 200 lecturas o mas. Este corte se baso en una evaluacion de potencia para detectar una diferencia entre el 20 % y el 30 % en la metilacion entre dos grupos cualesquiera debido a que cualquier cosa menor de ese intervalo tiene pocas posibilidades de significacion. La profundidad de cobertura del grupo mide el numero de lecturas para todos los sujetos de un grupo (por ejemplo, si hay 18 sujetos por cada grupo y cada sujeto tiene 12 lecturas, entonces la profundidad de cobertura del grupo es 12 x 18 = 216).
3. Estimar la asociacion del subtipo de enfermedad con el % de metilacion usando regresion de Poisson aumentada por varianza; se determinaron los sitios CpG mas discriminantes por comparacion del ajuste del modelo x2 al percentil 95° de todos los modelos ajustados. Excluir todos los sitios CpG donde la varianza del porcentaje de metilacion a traves de los grupos sea 0 porque estos sitios son sitios CpG no informativos.
Aplicar los filtros 2 y 3 dejo un total de 1.217.523 sitios CpG.
4. Realizar la regresion logfstica sobre el % de metilacion (basandose en el recuento real) usando los grupos definidos como Colon normal, Pancreas normal y Pancreas canceroso. Aunque la variabilidad en el % de metilacion entre sujetos es mayor que el permitido por la hipotesis binomica, se uso un modelo de regresion logfstica superdisperso para tener en cuenta el aumento de la varianza. Este parametro de dispersion se estimo usando la Chi cuadrada de Pearson del ajuste.
5. De estos ajustes del modelo, calcular una estadfstica F global para la comparacion del grupo basandose en el cambio de la desviacion entre modelos con y sin cada grupo como regresor. Esta desviacion se escalo segun la dispersion estimada del parametro.
6. Crear islas CpG en cada cromosoma en funcion de la distancia entre las ubicaciones de sitios CpG. De forma aproximada, cuando la distancia entre dos ubicaciones CpG supera 100 pb, cada ubicacion se define como una isla independiente. Algunas islas fueron singletes y se excluyeron.
7. A partir de la definicion de isla anterior, se calculo una estadfstica F promedio. Cuando la estadfstica F supera el 95 % (es decir, 5 % superior) de todos los sitios CpG para el cromosoma concreto, se genera una cifra de resumen.
El analisis adicional comparo los siguientes filtros de seleccion:
1. corte del valor de p ANOVA < 0,01
2. Relaciones del % de metilacion PanC respecto al pancreas normal y el colon normal > 10
3. % metilacion de normales < 2 %
4. Numero de CpG contiguos que cumplen los criterios > 3
Se evaluo la ventana de metilacion para incluir CpG contiguos adicionales que presentaban una metilacion significativa. Despues, Los candidatos se clasificaron por el nombre del gen y las regiones anotadas y por la ubicacion cromosomica de las regiones no anotadas.
Resultados
Se cartografiaron aproximadamente 6 millones de CpG con una cobertura 10x. Mas de 500 islas CpG cumplieron los criterios de significacion par la metilacion diferencial. Despues de aplicar los criterios de filtro anteriores, se identificaron 107 regiones metiladas de forma diferencial (DMR) (Tabla 1).
Tabla 1: DMR
Figure imgf000032_0001
(continuacion)
Figure imgf000033_0001
(continuacion)
Figure imgf000034_0001
En la Tabla 1, las bases se numeraron segun el conjunto del genoma humano, de febrero de 2009, GRCh37/hg19 (vease, por ejemplo, Rosenbloom y col. (2012) "ENCODE whole-genome data in the UCSC Genome Browser: actualizacion 2oi2" Nucleic Acids Research 40: D912-D917). Los marcadores con nombres BHLHE23 y LOC63930 se refieren al mismo marcador.
En estos candidatos, las firmas de metilacion van de 3 CpG a 52 CpG. Algunos marcadores presentan metilacion en ambas hebras; otros estan semimetilados. Como las hebras no son complementarias despues de la conversion con bisulfito, las regiones directa e inversa se contabilizaron por separado. Aunque la Tabla 1 indica la hebra en la que se encontro el marcador, la tecnologfa no se limita a detectar la metilacion solamente en la hebra indicada. La tecnologfa abarca la medicion de la metilacion en cualquiera de las hebras directa o inversa y/o en ambas hebras directa e inversa; y/o detectar un cambios en el estado de metilacion en cualquiera de las hebras directa o inversa y/o en ambas hebras directa e inversa.
Los niveles de metilacion de los canceres pancreaticos superan en raras ocasiones el 25 % en los CpG filtrados, lo que sugiere que los tejidos con cancer pueden tener elevados niveles de celulas y/o estroma normal contaminante. Para estudiar esto, cada uno de los canceres se secuencio para determinar las mutaciones KRAS para verificar las frecuencias alelicas de las muestras positivas. Para el 50 % que tenia un cambio de base KRAS heterocigotico, la frecuencia del alelo mutante era al menos 4 veces menor que el correspondiente alelo natural, lo que respalda la contaminacion por celulas y/o estroma normales.
Se descubrio que 7 de los 107 marcadores estaban en regiones no anotadas y se encuentran en regiones sin elementos de codificacion proteica. Un marcador es adyacente a una secuencia reguladora ARNnc (AK055957). De los restantes 99 marcadores candidatos, aproximadamente 30 se habian descrito como asociados con cancer, algunos de los cuales se clasifican como supresores tumorales. Unos pocos ejemplos:
ADCY1 Regulado defectivamente en osteosarcoma
ELMO1 Fomenta la invasion del glioma
HOXA2 Hipermetilado en colangioca
RSPO3 Regulador de la senalizacion Wnt
SUSD5 Media la metastasis osea en cancer de pulmon
KCNK12 Hipermetilado en cancer de colon
CLEC11A g F citoblastico en leucemia
USP3 Necesario para la progresion a fase S
Los otros 69 marcadores candidatos tenfan anteriormente una baja asociacion con el cancer (por ejemplo, mutaciones y/o alteraciones en el numero de copias observado en cribados de todo el genoma) o no tenfan asociaciones con cancer previamente identificadas.
Ejemplo 2 - Validacion de marcadores
Para validar las DMR como marcadores del cancer, se realizaron dos estudios de validacion basados en la PCR sobre conjuntos de muestras expandidos. El primer estudio uso muestras de grupos de paciente analogos a los usados en el Ejemplo 1 (por ejemplo, PanC, pancreas normal, colon normal) y se anadieron muestras que comprenden ADN derivado de la capa leucocitaria de pacientes normales sin antecedentes de ningun cancer. El segundo estudio utilizo una seleccion pan-canceres gastrointestinales (pan-GI).
Para el primer estudio de validacion, se analizo una combinacion de las muestras anteriormente sometidas a RRBS y nuevas muestras depositadas para comprobar la precision tecnica y confirmar la reproducibilidad biologica, respectivamente. Se disenaron cebadores de PCR especfficos de la metilacion (MSP) para cada una de las regiones de los marcadores, excluyendo solamente las hebras complementarias en casos de metilacion no especffica de la hebra. Un programa informatico (Methprimer) ayudo al diseno semimanual de los cebadores MSP realizado por personal experimentado; los ensayos se analizaron y se optimizaron mediante qPCR con colorantes SYBR Green sobre diluciones de controles de ADN genomico metilado y no metilado de forma universal. Las secuencias de los cebadores MSP, cada uno de los cuales incluye 2-4 CpG, se disenaron para proporcionar un medio rapido para evaluar la metilacion de las muestras y se sesgaron para maximizar la eficacia de amplificacion. Las secuencias de los cebadores y los parametros ffsicos se proporcionan en la Tabla 2a y la Tabla 2b:
Tabla 2a: Cebadores MSP
Figure imgf000035_0001
(c o n tin u a c io n )
Figure imgf000036_0001
(c o n tin u a c io n )
Figure imgf000037_0001
(c o n tin u a c io n )
Figure imgf000038_0001
(c o n tin u a c io n )
Figure imgf000039_0001
(c o n tin u a c io n )
Figure imgf000040_0001
En la Tabla 2a, Ta es la temperatura de hibridacion optimizada, y Tm es la temperatura de fusion en °C en NaCI 50 mM. Los cebadores celf2f y celf2r; LOC63930 (bhlhe23)f y LOC63930 (bhlhe23)r; PRKCBf y PRKCBr; y TOX2f y TOX2r se usaron en una reaccion en dos etapas.
Especfmenes
Muestras de ADN archivadas de pacientes de la clfnica Mayo se usaron en ambas validaciones. Los casos y los controles se enmascararon y se emparejaron por edad y sexo. El primer conjunto de muestra incluyo ADN de 38 adenocarcinomas pancreaticos y controles (20 epitelios colonicos normales, 15 pancreas normales, y 10 capas leucocitarias normales). El segundo conjunto de muestras incluyo ADN de 38 neoplasias colorrectales 20 adenocarcinomas colorrectales y 18 adenomas > 1 cm), 19 adenocarcinomas esofagico, 10 canceres gastricos (estomago) y 10 colangiocarcinomas.
procedimientos
El ADN archivado se repurifico usando perlas SPRI (AMPure XP-Beckman Coulter) y se cuantificaron mediante absorbancia. 1-2 pg de muestra de ADN se trataron a continuacion con bisulfito de sodio y se purificaron usando el protocolo EpiTect (Qiagen). El material eluido se (10-20 ng) amplifico en un Roche 480 LightCycler usando bloques de 384 pocillos. Cada placa acepto 4 marcadores (y patrones y controles), Usando un total de 23 placas. Los 88 ensayos MSP tuvieron perfiles de amplificacion optima diferentes y se agruparon en consecuencia. En la Tabla 2 se proporcionan las temperaturas de hibridacion especffica. Las reacciones de 20 pl se efectuaron usando una mezcla maestra LightCycler 480 SYBR I (Roche) y 0,5 pmoles del cebador durante 50 ciclos y se analizaron, generalmente, por el procedimiento de la segunda derivada incluido con el programa informatico LightCycler. Los datos sin procesar, expresados como numero de copia genomica, se normalizaron respecto a la cantidad de ADN inicial, y se tabularon. El analisis del tejido comprendio realizar una PCA (suplementada mediante validacion cruzada k veces), regresion neta elastica, y construccion de graficos de cajas de los marcadores netos elasticos no cero. De esta forma, los marcadores fueron clasificadas en conjunto. De estos candidatos, debido a la importancia de minimizar la metilacion del fondo de celulas normales para los ensayos basados en heces y en sangre, la clasificacion pondero hacia aquellos marcadores que mostraban un valor mayor de veces de cambio diferencial entre casos y controles.
Resultados
Entre los 107 marcadores de ADN metilados con una discriminacion demostrada para canceres GI, se realizo la validacion de 88, de los que se identificaron subconjuntos para la presentacion de un resumen de datos mas detallado.
Deteccion de cancer pancreatico
Un subconjunto de marcadores de la metilacion fue especialmente discriminante para el cancer pancreatico: ABCB1, ADCY1, BHLHE23 (LOC63930), c13orf18, CACNA1C, chr12 133, CLEC11A, ELMO1, EOMES, GJC1, IHIF1, IKZF1, KCNK12, KCNN2, PCBP3, PRKCB, RSPO3, SCARF2, SLC38A3, ST8SIA1, TWIST 1, VWC2, WT1 y ZNF71 (vease la Tabla 1). Los valores de ABC individuales (PanC versus pancreas o colon normales) para estos marcadores fueron superiores a 0,87, lo que indica una sensibilidad y especificidad clfnicas superiores.
Inicialmente, los dos mejores marcadores independiente parecfan ser CLEC11A y c13orf18, que tenfan una sensibilidad del 95 % y del 82 % para el cancer pancreatico, respectivamente, para una especificidad del 95 %. Experimentos adicionales disenaron cebadores adicionales para dirigirse a los CpG mas especffico dentro de las DMR especificadas de marcadores seleccionados. Estos cebadores adicionales mejoraron adicionalmente la discriminacion. Por ejemplo, el diseno de nuevos MSP para el marcador PRKCB (sensibilidad inicial del 68 %) aumento de forma importante la discriminacion para el cancer pancreatico y consiguio una sensibilidad del 100 % a un 100 % de especificidad. Ademas, la mediana de la relacion senal-ruido para la metilacion de este marcador, que compara el tejido canceroso con el normal, fue mayor de 8000. Esto proporciona una metrica fundamental para la deteccion de marcadores de cancer en muestras con altos niveles de heterogeneidad celular normal. Disponer de los perfiles de metilacion basales de las DMR procedentes de los datos filtrados por RRBS permite la construccion de ensayos de deteccion muy sensibles y especfficos. Estos resultados obtenidos con los disenos de los MSP mejorados demostraron que se puede obtener especificaciones de comportamiento similares a las otras 106 DMR con mejoras adicionales en el diseno, validacion, y formatos de ensayo.
Tabla 2b: Cebadores MSP
Figure imgf000041_0001
contrario)f
(continuacion)
S
Figure imgf000042_0001
En la Tabla 2b, Ta es la temperatura de hibridacion optimizada, y Tm es la temperatura de fusion en °C en NaCI 50 mM.
Deteccion de otras neoplasias gastrointestinales
A continuacion, los marcadores se evaluaron en el 2° conjunto de muestras, que inclufa otros canceres y precanveres GI, como se ha indicado anteriormente. Los procedimientos, incluidas las condiciones de reaccion, y la plataforma, fueron identicos a la primera validacion descrita anteriormente. Los datos se normalizaron respecto a la cantidad de ADN inicial, lo que permite que los numeros de copia se comparen entre las dos validaciones. El analisis consistio en PCA y validacion cruzada k veces, como anteriormente.
Algunas secuencias de metilacion que se identificaron mostraron grados de discriminacion muy elevados, incluso como marcadores independientes. Por ejemplo, IKZF1 tuvo un 95 % de sensibilidad para adenoma y 80 % de sensibilidad para CRC, con practicamente nada de metilacion del fondo en muestras normales. La relaciones S/N fueron mayores de 10.000 - un grado de discriminacion muy pocas veces visto con cualquier clase de marcadores. El ensayo chr12.133, especffico de un tramo completamente desconocido y descrito de ADN metilado, tambien fue adecuado para detectar todos los canceres igualmente bien. Varios marcadores (cd1d, chr12.133, clec11a, elmo1, vwc2, zuf71) consiguieron individualmente una discriminacion perfecta para el cancer gastrico, como lo hizo twist1 para el cancer colorrectal (Tabla 6).
Prediccion del sitio del tumor
Los datos recopilados durante el desarrollo de las realizaciones de la tecnologfa demostraron que los estados de metilacion de marcadores de ADN concretos predicen de forma precisa el sitio de la neoplasia. En este analisis, se uso un modelo de regresion con particiones recursivas en un analisis de arbol de decisiones basado en combinaciones de marcadores que se comportan de manera complementaria para generar una clasificacion del sitio solida.
En particular, se realizaron analisis estadfsticos para validar los resultados de sensibilidad y especificidad de combinaciones de marcadores. Por ejemplo, usando un modelo de "bosque aleatorio" (vease, por ejemplo, Breiman (2001) "Random Forests" Machine Learning 45: 5-32), se construyeron modelos de arbol usando regresion de arboles con particiones recursivas, por ejemplo, tal como se implementa en el paquete rPart en el programa informatico estadfstico R. La regresion de arboles con particiones recursivas es una tecnica de regresion que intenta minimizar una funcion de perdida y de esta forma maximiza el contenido de informacion en problemas de clasificacion. El arbol se construye mediante el siguiente procedimiento: en primer lugar, se encuentra la variable individual que mejor divide los datos en dos grupos. Los datos se separan, y a continuacion este procedimiento se aplica por separado a cada subgrupo, y asf de forma recursiva, hasta que cada uno de los subgrupos alcanza un tamano mfnimo o hasta que no se pueden hacer mejoras. La segunda etapa del procedimiento consiste en utilizar validacion cruzada para reducir todo el arbol. Una estimacion del riesgo por validacion cruzada se calcula a partir de un conjunto de subarboles anidados, y se produce un modelo final a partir del subarbol con menor estimacion del riesgo. Vease, por ejemplo, Therneau (2012) "An Introduction to Recursive Partitioning Using RPART Routines", available at The Comprehensive R Archive Network; Breiman y col. (1983) "Classification and Regression Trees" Wadsworth, Belmont, CA; Clark y col. (1992) "Tree-based models" in J.M. Chambers y T.J. Hastie, eds., Statistical Models in S, capftulo 9. Wadsworth y Brooks/Cole, Pacific Grove, CA; Therneau (1983) "A short introduction to recursive partitioning" Orion Technical Report 21, Universidad de Stanford, Departamento de estadfstica; Therneau y col. (1997) "An introduction to recursive partitioning using the rpart routines" Divsion of Biostatistics 61, Clfnica Mayo.
Como se usa en este analisis, la clasificacion es Lesion GI superior vs. Lesion Gil inferior vs. Muestras normales. En cada nodo de la regresion, todas las variables se consideran para la entrada, pero solamente la variable de mayor disminucion en el riesgo del resultado previsto se introduce. Se anaden nodos posteriores al arbol hasta que no se produce ningun cambio en el riesgo. Para evitar sobreajustes, se uso la regresion de bosque aleatorio. En este enfoque, se generaron 500 arboles de prediccion usando analisis con sustitucion de muestras y seleccion aleatoria de variables. Para determinar la importancia de la variable i-esima, la i-esima variable se deja de lado, y se comparan las correspondientes tasas de error para el ajuste completo (incluidos todos los datos) vs. el ajuste reducido (todos los datos salvo la i-esima variable) usando las 500 predicciones.
Se construyo un bosque de 500 arboles para estudiar la potencia predictiva de los marcadores candidatos para discriminar entre el tejido normal, las lesiones gastrointestinales superiores y las lesiones gastrointestinales inferiores. Este procedimiento se realiza con un grado de solidez muy alto. En primer lugar, para cada creacion de arbol, se toma una muestra del analisis con sustitucion de la base de datos para crear un conjunto de entrenamiento, y todas las observaciones no seleccionadas se utilizan como conjunto de validacion. En cada rama del arbol, se usa un subconjunto aleatorio de marcadores, que se evalua para determinar el mejor marcador para uso en ese determinado nivel del arbol. En consecuencia, todos los marcadores tienen la misma oportunidad de seleccionarse. La tecnica proporciona una validacion y evaluacion rigurosa de la importancia relativa de cada marcador. Cada uno de los 500 arboles puede "votar" acerca de la clase a la que pertenece una muestra en concreto, siendo el ganador el que obtiene mayorfa de votos. La tasa de clasificacion incorrecta estimada se estima para todas las muestras no utilizadas en un arbol concreto.
Para analizar la importancia relativa de un marcador dado, el conjunto de validacion se vuelve a usar. Aquf, una vez que un arbol se ha ajustado, los datos de validacion se hacen descender por el arbol, y se anota el fndice de clasificacion correcto. Despues, los valores de los marcadores se permutan aleatoriamente para el m-esimo marcador, se hace descender por el arbol, y se vuelve a anotar la clasificacion correcta. Si un marcador tiene mucha importancia, los datos reales proporcionan una mejor clasificacion que los datos permutados aleatoriamente. La clasificacion incorrecta de los datos permutados se conoce como la disminucion media en la precision. Si un marcador no es importante, los datos reales proporcionaran una clasificacion similar a los datos aleatoriamente permutados. La Figura 1 es una representacion grafica de la importancia de los marcadores segun se determina por la disminucion media en la precision. Las lfneas verticales se encuentran al 2,5 % y al 5 %. Estos datos indican que, por ejemplo, para cleclla, la disminucion media en la precision estimada es de aproximadamente un 12 %, lo que indica que, cuando se permutan aleatoriamente los resultados de este marcador, la precision global de la prediccion disminuye en un 12 %. La Figura 1 lista los marcadores en orden de importancia.
La tasa de clasificacion incorrecta global estimada para los 500 arboles del bosque fue 0,0989. Los resultados del procedimiento de votacion en los 500 arboles del bosque se resumem en la Tabla 3, y se expande por subtipo en la Tabla 4. En las tablas, el tipo de muestra de tejido se relaciona en la primera columna (por ejemplo, no canceroso ("Normal"), cancer gastrointestinal superior ("Superior"), o cancer gastrointestinal inferior ("Inferior") en la Tabla 3; adenoma ("Ad"), colon normal ("Colo Normal"), cancer colorrectal ("CCR"), cancer esofagico ("Eso C"), cancer pancreatico ("Pan C"), pancreas normal ("Pan Normal"), y cancer de estomago ("Estomago C") en la Tabla 4). Se proporciona una clasificacion cuantitativa de las muestras mediante el analisis como una numero en las columnas 1, 2, o 3, para su clasificacion como cancer gastrointestinal superior (columna 1), cancer gastrointestinal inferior (columna 2), o tejido normal (columna 3), respectivamente. Los numeros proporcionan una medicion que indica la tasa de exito del clasificador (por ejemplo, el numero de veces que el clasificador clasifica el tipo de muestra en la primera columna como el tipo que se indica en la primera fila).
Tabla 3
Figure imgf000044_0001
Tabla 4
Figure imgf000044_0002
Un analisis adicional demostro que una combinacion de dos marcadores predijo con precision el sitio del tumor en >90 % de las muestras, las 17 principales combinaciones de marcadores predijeron con precision el sitio del tumor en >80 % de las muestras, y las 49 principales combinaciones de marcadores predijeron con precision el sitio del tumor en el 70 % de las muestras. Esta observacion de que multiples combinaciones de marcadores de la metilacion del ADN predicen con precision el sitio del tumor demuestra la solidez de la tecnologfa.
Usando los dos marcadores principales en el arbol de decision con particiones recursivas, todos los tejidos normales se clasificaron correctamente como normales, todos los canceres gastricos se clasificaron correctamente como GI superior, casi todos los canceres esofagicos y pancreaticos se clasificaron correctamente como GI superior, y casi todos los canceres colorrectales y precanceres (adenomas) se clasificaron correctamente como GI inferior. Durante el desarrollo de las realizaciones de la tecnologfa proporcionada en el presente documento, los analisis estadfsticos se centraron en un conjunto de marcadores especffico que consiste en clec11a, c13orf18, kcnn2, abcb1, slc38a3, cdlc, ikzf1, adcy1, chr12133, rspo3 y twist1. En particular, los analisis estadfsticos anteriormente descritos estaban dirigidos a identificar conjuntos de marcadores (por ejemplo, con dos o mas marcadores) que proporciona una mayor potencia para identificar el cancer y/o discriminar entre canceres. La Tabla 5 resume la precision para cada conjunto de marcadores emparejados, concretamente protefnas clec11a, c13orf18, kcnn2, abcb1, slc38a3, cdlc, ikzf1, adcy1, chr12133, rspo3 y twist1. De acuerdo con este analisis, el par de marcadores compuesto por cleclla y twist1 es el mas informativo, pero otras diversas combinaciones tienen precisiones similares.
Tabla 5 - Precision para la prediccion del sitio usando varias combinaciones de marcadores
Figure imgf000044_0003
,
(continuacion)
Figure imgf000045_0001
(continuacion)
Figure imgf000046_0001
Ejemplo 3 - Analisis de la ABC de los marcadores individuales
El analisis estadfstico incluyo el analisis de los componentes principales para identificar combinaciones lineales no correlacionadas de los marcadores cuya varianza explica el mayor porcentaje de variabilidad observado en los datos originales. El analisis determino la ponderacion relativa de cada marcador para discriminar entre grupos de tratamiento. Como resultado de este analisis, los valores de la ABC en el punto final se determinaron para un subconjunto de los marcadores que mida la potencia de cada marcador para discriminar un cancer especffico (esofagico, estomago, pancreatico, colorrectal, y adenoma) de 1) los otros tipos de cancer y de 2) muestras normales (por ejemplo, que no comprenden tejido canceroso o no son de un paciente que tiene cancer o que puede desarrollar cancer). En la Tabla 6 se proporcionan estos datos.
Tabla 6 - Valores de la ABC para un subconjunto de los marcadores
Figure imgf000046_0002
(continuacion)
Figure imgf000047_0001
Ejemplo 4 - Esofago de Barrett y cancer esofagico
El desarrollo de cancer esofagico esta estrechamente ligado a la metaplasia epitelial de Barrett y el adenocarcinoma pancreatico surge de metaplasias discretas en las celulas de la mucosa. Vease, por ejemplo, Biankin y col (2003) "Molecular pathogenesis of precursor lesions of pancreatic ductal adenocarcinoma" Pathology 35:14-24; Cameron y col (1995) "Adenocarcinoma of the esophagogastric junction and Barrett's esophagus" Gastroenterology 109: 1541­ 1546.
Para disminuir de forma significativa la creciente incidencia de adenocarcinoma esofagico, se necesitan procedimientos eficaces para seleccionar la poblacion para el precursor crftico del esofago de Barrett (EB). Se han propuesto herramientas mfnimamente invasivas o no invasivas para el cribado del EB, pero se han visto dificultados por la falta de marcadores optimamente sensibles y de marcadores especfficos. Los marcadores de cribado deseados discriminan el EB de la mucosa esofagogastrica normal. Algunos genes con metilacion anomala estan asociados como marcadores candidatos para el Be (vease, por ejemplo, Gastroenterology 2011; 140: S-222).
En consecuencia, durante el desarrollo de las realizaciones de la tecnologfa, se realizaron experimentos para evaluar los marcadores del ADN metilado seleccionados para discriminar el EB del esofago escamoso (SE) adyacente y cardias gastrico (GC) y del SE y GC en controles sanos.
Se reclutaron pacientes con y sin EB conocido antes de una endoscopia superior rutinaria. Los casos de EB tenfan >1 cm de longitud de la mucosa columnar perimetral, con metaplasia intestinal confirmada histologicamente; los controles no tenfan BE como se determino endoscopicamente. Se obtuvieron biopsias en los casos de EB, GC (1 cm bajo la lfnea Z), y SE (>2 cm por encima de EB), y en los controles de GC (como para EB) y SE (5 cm por encima de la lfnea Z), y se congelaron de forma rapida. Las muestras de biopsia se procesaron en lote, y se sometieron a ensayo de forma enmascarada. Despues de la extraccion del ADN y el tratamiento con bisulfito, la metilacion de los genes diana se analizo mediante la PCR especffica de metilacion para los marcadores APC, HPP1, SFRP1, y ensayo QuARTS para los marcadores BMP3 y NDRG4. p-actina se cuantifico como un marcador del control para el ADN humano total.
Entre 25 casos de BE y 22 controles, las medianas de edad fueron 67 (intervalo 39-83) y 50 (intervalo 20-78), respectivamente, y los varones representaron el 72% y el 46 % de los sujetos en los grupos de EB y del control, respectivamente. La mediana de la longitud del EB fue de 6 cm (intervalo 2-14 cm). Salvo para APC, la mediana de los niveles de los marcadores metilados fue significativa y sustancialmente (por ejemplo, 200-1100 veces) mayor en el EB que en el SE y GC adyacentes, o respecto a los SE y GC normales. Las sensibilidades del EB para varias especificidades se muestran para cada marcador (Tabla 7). Los marcadores metilados fueron significativamente superiores en el GC adyacente al EB que en el GC de los controles normales. El APC metilado fue mayor en el EB que en SE, pero no distingue el EB del GC. A diferencia de los marcadores metilados, las distribuciones de p-actina fueron similares para todos los grupos de tejidos. Los niveles de los marcadores aumentaron con la longitud del EB para NDRG4, s Fr P1, BMP3, y h Pp 1 (p = 0,01, 0,01, 0,02, y 0.04, respectivamente). Los factores que no afectan significativamente los niveles de marcadores incluyen la edad, el sexo, la inflamacion, y la presencia de displasia (ninguna (8), grado bajo (6), grado alto (11)).
Por tanto, estos datos se muestran que los marcadores de ADN metilado seleccionado discriminan fuertemente el EB de GC y SE, y proporcionan aplicaciones de cribado utiles.
Tabla 7
Figure imgf000048_0001
Ejemplo 5 - Los marcadores de ADN metilados en el jugo pancreatico discriminan el cancer pancreatico de la pancreatitis cronica y controles normales
El analisis del jugo pancreatico se ha explorado como un enfoque mfnimamente invasivo para la deteccion precoz del cancer pancreatico (PC). Sin embargo, la citologfa y muchos marcadores moleculares en el jugo pancreatico han demostrado no ser sensibles o no han logrado distinguir entre PC de la pancreatitis cronica (vease, por ejemplo, J Clin Oncol 2005; 23: 4524). Se realizaron experimentos para comprobar que el ensayo de genes con metilacion anomala puede representar un enfoque mas preciso para deteccion del PC que el jugo pancreatico (vease, por ejemplo, Cancer Res 2006; 66: 1208). En particular, los datos recogidos par evaluar los marcadores de ADN metilados se analizaron en el jugo pancreatico para discriminar casos de pacientes con PC de los controles con pancreatitis cronica (CP) o un pancreas normal (NP).
Un panel de 110 pacientes (66 PC, 22 CP, 22 controles NP) se sometieron a recogida del jugo pancreatico estimulada con secretina durante una prueba endoscopica con ultrasonidos. Los diagnosticos fueron histologicamente confirmados para PC y se basaron en radiograffas para CP y NP. El jugo se congelo rapidamente y se almaceno a -80 °C. Se realizaron ensayos de forma enmascaradas sobre las muestras descongeladas por lotes. Loa marcadores de ADN metilado candidatos se seleccionaron mediante secuenciacion del metiloma completo en un estudio de tejidos independiente. Una vez que el ADN se extrajo del jugo pancreatico y se trato con bisulfito, se determino la metilacion genica mediante la PCR especffica de metilacion para CD1D, CLEC11A, y KCNN2, o por QuARTS para BMP3 y NDRG4. Se estudiaron las mutaciones KRAS (7 total) mediante QuARTS (la presencia de cualquier mutacion KRAS se considero como un positivo). Lp -actina, un marcador del ADN humano, tambien se analizo mediante QuARTS, para proporcionar un control de la cantidad de ADN.
Respectivamente para PC, CP, y NP, la mediana de la edad fue 67 (intervalo 43-90), 64 (intervalo 44-86), y 60 (intervalo 35-78); los hombres representaron 56, 68, y 21 % de estos grupos, respectivamente. Todos los marcadores discriminaron PC de NP pero en cantidad variable. La ABC fue 0,91 (95 % IC, 0,85-0,97), 0,85 (0,77­ 0,94), 0,85 (0,76-0,94), 0,78 (0,67-0,89), y 0,75 (0,64-0,87) para CD1D, NDRG4, CLEC11A, KCNN2 y BMP3 metilado, respectivamente, y 0,75 (0,64-0,86) para KRAS mutante. La discriminacion para PC mediante CD1D fue significativamente superior que mediante KrAS (p=0,01), KCNN2 (p=0,02), o BMP3 (p<0,01). Se muestran las tasas de positividad para PC y CP para cada marcador al 95 y 100 % de los corte de especificidad normales (Tabla 8); la tasa de positividad en Cp (positivos falsos) fue menor para CD1D y mayor para KRAS. Los niveles de marcadores no se vieron significativamente afectados por el sitio de PC (cabeza, cuerpo, cola) o etapa (N0 vs. N1). Lo niveles de p-actina fueron similares entre los grupos de pacientes.
Estos datos muestran que los marcadores de ADN metilado discriminan PC de CP y NP cuando se someten a ensayo para el jugo pancreatico, por ejemplo, jugo pancreatico estimulado por secretina. En particular, el CD1D metilado fue significativamente mas sensible para PC y mostro sustancialmente menos positivos falsos con CP de lo que lo hizo KRAS mutante.
Tabla 8
Figure imgf000049_0001
Ejemplo 6 - Paneles de marcadores de ADN sensibles para la deteccion del cancer pancreatico mediante analisis en jugo pancreatico
El analisis del jugo pancreatico representa un enfoque mfnimamente invasivo para la deteccion de cancer pancreatico (PC) y del precancer. Se ha descubierto que los marcadores de ADN metilado especfficos en el jugo pancreatico discriminan entre PC y la pancreatitis cronica (CP) y el pancreas normal (Gastroenterology 2013;144:S-90), pero nuevos marcadores y combinaciones de marcadores siguen por descubrir.
Se han realizado experimentos para evaluar el valor de los marcadores del ADN metilado recientemente descubiertos y de los KRAS mutantes analizados en solitario y combinados en el jugo pancreatico para discriminar entre PC y la pancreatitis cronica (CP) y los controles de referencia (CON).
167 pacientes (85 PC, 30 CP, 23 con neoplasia mucinosa intraductal premaligna (IPMN), 29 CON) que se habfan sometido a recogida de jugo pancreatico estimulada por secretina durante EUS fueron objeto de estudio. Los diagnosticos se basaron histologicamente para PC, radiograficamente para PC, e histologica o radiograficamente para IPMN. La especificidad se baso en c On , que inclufa pacientes con factores de riesgo para PC, valor elevado de enzimas pancreaticas, o sfntomas GI pero pancreas radiograficamente normales. Las muestras de jugo archivadas a -80 °C se analizaron por lotes de forma enmascarada. Sobre el ADN extrafdo de 200 pl de jugo pancreatico, se determino la metilacion de los genes despues del tratamiento con bisulfito mediante amplificacion de la diana y la senal en tiempo real especffica de alelo cuantitativa (QuARTS) para analizar ADCY1, CD1D, BMP3, PRKCB, KCNK12, C130RF18, IKZF1, CLEC11A, TWIST1, NDRG4, ELMO, y 55957. Las mutaciones de KRAS mutante (7 total) y /3-actina (un marcador del ADN humano total) tambien se analizaron mediante QuARTS. Para los datos cuantitativos, se siguio un algoritmo para conseguir la discriminacion optima mediante un panel que combina todos los marcadores.
Respectivamente para PC, CP, IPMN, y CON: la mediana de edad fue 67 (IQR 60-77), 66 (55-77), 66 (60-76) y 70 (62-77); los hombres comprendian 52, 53, 49, y 72 %. Para los cortes de especificidad respectivos del 90 % y 95 %: el panel de marcadores combinado consiguio las sensibilidades mas altas para PC (88 % y 77 %); ADCY1, el marcador individual mas sensible, detecto 84 % y 71 %. Otros marcadores individuales detectaron PC pero en cantidad variable (tabla). La discriminacion por area bajo la curva COR fue mayor segun el panel que para cualquier otro marcador individual (p<0,05), salvo ADCY1 (tabla). Para el 90 % de especificidad, el panel detecto el 44 % de todos los IPMN y el 75 % (3/4) del subconjunto con un elevado grado de displasia. Las tasas de positividad fueron sustancialmente menores para CP que para PC para todos los marcadores que se muestran en la Tabla 7 (p<0,0001). Para el 100 % de especificidad, el panel fue positivo para el 58 % de PC, 17 % de IPMN, y 13 % de CP. En consecuencia, estos resultados demuestran que un panel de novedosos marcadores de ADN metilado y KRAS mutante analizado en el jugo pancreatico consiguio alta sensibilidad para PC.
Tabla 7: Tasas de positividad para marcadores en jugo pancreatico de pacientes con cancer pancreatico (PC), neoplasia mucinosa papilar intraductal (IPMN), y pancreatitis cronica pancreatitis (CP).
Figure imgf000050_0001
Ejemplo 7: Deteccion del cancer pancreatico con una muestra de heces usando el marcador CD1D.
Muestras de heces de 45 individuos con cancer pancreatico, y 45 individuos que no tenfan cancer pancreatico se recogieron y se analizaron para determinar la presencia del marcador CD1D. El cancer pancreatico se detecto correctamente usando el marcador CD1D en heces.
Ejemplo 8: Novedosos marcadores de la metilacion del ADN asociados con el cancer pancreatico en etapa inicial.
Introduccion al estudio:
En estudios de tejido de control del caso independientes, se realizaron experimentos para identificar novedosos y fuertemente discriminantes marcadores de la metilacion para PanC usando RRBS durante la fase de descubrimiento y PCR especffica de metilacion (MSP) para la fase de validacion.
Poblacion del estudio:
Tras su autorizacion por el Comite de revision institucional de la Clfnica Mayo, se identificaron muestras de tejidos a partir de registros de cancer existentes. La poblacion accesible incluyo los que se han sometido a una pancreatectomfa distal, pancreaticoduodenoctomfa, colectomfa o biopsia de colon con un especimen congelado archivado. Todos los tejidos se revisaron por un patologo gastrointestinal experto para confirmar la clasificacion correcta. Las muestras del caso PanC incluyeron tejidos con adenocarcinoma pancreatico ductal limitado a la enfermedad en la etapa inicial (AJCC estadio I y II) (Edge SBB, D.R.; Compton, C.C.; Fritz, A.G.; Greene, F.L.; Trotti, A. (Eds.), editor. AJCC Cancer Staging Manual. 7a ed: Springer, Nueva York; 2010). Se excluyeron las neoplasias derivadas de lesiones IPMN. Se estudiaron dos grupos del control. El primero, denominado "pancreas normal", incluyo los margenes de reseccion histologica normal de bajo riesgo (cistadenoma seroso) o neoplasias pancreaticas focales (tumores neuroendocrinos). El segundo grupo del control incluyo tejidos epiteliales colonicos procedentes de pacientes con una confirmacion de no padecer PanC o neoplasia colonica. Los casos y ambos controles se emparejaron por sexo, edad (en incrementos de 5 anos) y estado de tabaquismo (actual o anterior frente a nunca). En un laboratorio centralizado, los tejidos de los casos y del control se microdesecaron, y el ADN se extrajo usando una tecnica fenol-cloroformo, proporcionando al menos 500 ng de ADN. La identificacion de los casos, el emparejamiento y la extraccion de ADN se realizaron por personal independiente para mantener el enmascaramiento del personal de laboratorio por caso y estado del control.
Secuenciacion con representacion reducida de bisulfito:
La preparacion de la biblioteca (Gu H, Bock C, Mikkelsen TS, Jager N, Smith ZD, Tomazou E, y col. Genome-scale DNA methylation mapping of clinical samples at single-nucleotide resolution. Nat Methods. 2010;7:133-6): El ADN genomico (300 ng) se fragmento por digestion con 10 unidades de MspI, una enzima de restriccion especffica de metilacion que reconoce los motivos que contienen CpG. Esto enriquece las muestras en su contenido de CpG y elimina zonas redundantes del genoma. Se repararon los extremos de los fragmentos digeridos y se agregaron colas A con 5 unidades de fragmento de Klenow (3'-5' exo-) y, se ligo durante la noche a adaptadores de TruSeq (Illumina, San Diego CA) que contenfan de una a cuatro secuencias de codigo de barras para enlazar cada fragmento a su ID de muestra). Se llevo a cabo la seleccion por tamano de los fragmentos de 160-340 pb (inserciones de 40-220 pb) usando perlas/tampon Agencourt AMPure XP SPRI (Beckman Coulter, Brea CA). Los cortes de tampon fueron 0,7x a 1,1x volumenes de muestra de perlas/tampon. El volumen fue de 22 ul (tampon EB - Qiagen, Germantown MD) Se utilizo la PCR para controlar la eficacia de enlazado y la calidad de fragmentos en una pequena alfcuota de la muestra. A continuacion, las muestras se sometieron a conversion con bisulfito usando un protocolo EpiTect modificado (Qiagen). qPCR y PCR convencional (Pfu Turbo Cx hotstart, Agilent, Santa Clara CA) seguido por evaluacion con Bioanalyzer 2100 (Agilent) sobre alfcuotas de muestra convertidas determinaron el numero optimo de ciclos de la PCR antes de la amplificacion de la biblioteca final. Condiciones de la PCR final: 50 ul rxn: tampon 10X 5 ul, 1,25 ul de 10 mM de cada dNTP, 5 ul de coctel de cebadores (~ 5 uM), 15 ul de molde (muestra), 1 ul de PfuTurbo Cx hotstart, 22,75 agua. 95 °C < -5 min; 98 °C-30 s; 16 ciclos de 98° C-10 s, 65° C-30 s, 72° C-30 s; 72° C < -5 min; 4° C. Las muestras se combinaron (cantidades equimolares) en bibliotecas tetramultiplexadas segun el esquema de aleatorizacion y se sometieron a ensayo con el bioanalizador para una comprobacion de la etapa final, y con qPCR usando patrones phiX y cebadores especfficos de adaptadores.
Secuenciacion y bioinformatica:
Las muestras se cargaron en hileras de celdas de flujo de acuerdo con una asignacion aleatorizada de hileras, donde hileras adicionales estan reservadas para los controles internos del ensayo. La secuenciacion se realizo mediante el Next Generation Sequencing Core en la Medical Genome Facility de Mayo con el Illumina HiSeq 2000. Las lecturas fueron unidireccionales para 101 ciclos. Cada hilera de celda de flujo genero 100-120 millones de lecturas, suficiente para una mediana de cobertura de 30-50 veces de profundidad de secuenciacion (el numero de lecturas por CpG) para las secuencias alineadas. Se uso el programa informatico convencional Standard Illumina para la asignacion de bases y generacion de la lectura de secuencia en formato fastq. Como se ha descrito anteriormente (Sun Z, Baheti S, Middha S, Kanwar R, Zhang Y, Li X, y col. SAAP-RRBS: streamlined analysis and annotation pipeline for reduced representation bisulfite sequencing. Bioinformatics. 2012;28:2180-1), SAAP-RRBS, un codigo informatico para el analisis y anotacion directos para una secuenciacion con representacion reducida de bisulfito, se uso para en el alineamiento de secuencias y la extraccion de la metilacion.
Estudios de validacion mediante PCR especffica de metilacion:
Vision general: Se realizaron dos estudios de validacion basados en la PCR sobre conjuntos de muestras expandidos para confirmar la precision y la reproducibilidad de los candidatos diferencialmente metilados observados. El primero, un estudio de validacion interna, se realizo sobre muestras no emparejadas no enmascaradas usando replicas biologicas y tecnicas de PanC y colon normal, y replicas tecnicas de pancreas normal. Esta etapa se llevo a cabo con el fin de asegurarse de que los sitios de metilacion diferencial identificados mediante la filtracion de datos RRBS, donde el % de metilacion era la unidad del analisis, se reflejarfa en la MSP, donde la unidad de analisis es el numero absoluto de copias genomicas de la secuencia diana, corregida por la concentracion del ADN inicial para cada muestra. El segundo, experimento de validacion externa, utilizo MSP para estudiar los candidatos principales en muestras aleatoriamente asignadas, emparejadas, enmascaradas independientes de PanC, pancreas benigno, y colon normal.
Diseno de cebadores: Se disenaron para cada marcador cebadores para dirigirse a las secuencias metiladas modificadas con bisulfito para cada gen diana (IDT, Coralville IA) y una region sin sitios citosina-fofato-guanina en el gen de la p-actina, como referencia del tratamiento con bisulfito y ADN inicial. El diseno se realizo bien con el programa informatico Methprimer (University of California, San Francisco CA) o por procedimientos semimanuales (por H.Z y W.R.T). A continuacion, los ensayos se analizaron y se optimizaron mediante qPCR con colorantes SYBR Green (Life Technologies, Grand Island NY) sobre diluciones de controles de ADN genomico metilado y no metilado de forma universal.
PCR especffica de metilacion: las reacciones MSP se llevaron a cabo sobre ADN extrafdo de tejido como se ha descrito anteriormente (Kisiel JB, Yab TC, Taylor WR, Chari ST, Petersen GM, Mahoney DW, y col. Stool DNA testing for the detection of pancreatic cancer: assessment of methylation marker candidates. Cancer. 2012;118:2623-31). En resumen, el ADN se trato con bisulfito usando el kit EZ d Na Methylation (Zymo Research, Orange, CA) y se eluyo en tampon. Un pl de ADN tratado con bisulfito se uso como molde para la cuantificacion de metilacion con una PCR en tiempo real basada en fluorescencia, realizada con mezcla maestra SYBR Green (Roche, Mannheim Alemania). Las reacciones se realizaron en un Roche 480 LightCyclers (Indianapolis, IN), donde ADN metilado universal CpGenome tratado con bisulfito con bisulfito (Millipore, Billerica, MA) se uso como control positivo, y se diluyo en serie para crear curvas patron para todas las placas. Las secuencias de oligonucleotidos y las temperaturas de hibridacion estan disponibles bajo peticion.
Analisis estadistico
RRBS: La comparacion primaria de interes fue la diferencia de metilacion entre los casos y los controles pancreaticos en cada CpG cartografiado. Las islas CpG se definen mediante una relacion entre la CpG esperada y la observada que supera 0,6 (Gardiner-Garden M, Frommer M. CpG islands in vertebrate genomes. Journal of molecular biology 1987;196:261-82). Sin embargo, para este modelo, se crearon unidades apiladas de "regiones diferencialmente metiladas (DMR)" segun analisis de CpG basandose en la distancia entre ubicaciones de sitios CpG para cada cromosoma. Como la distancia entre cualquier CpG dado supera la ubicacion posterior o anterior en mas de 100 pb, se creo un nuevo identificador para islas. Las islas con un unico CpG se excluyeron. El resultado secundario fue la misma comparacion entre casos y controles de colon. Los sitios CpG individuales se consideraron par el analisis diferencial solamente si la profundidad total de la cobertura por grupo de enfermedad 200 lecturas (aproximadamente igual a una promedio de 10 lecturas por sujeto) y la varianza en el % de metilacion fue mayor que cero (los sitios CpG no informativos con varianza 0 fueron excluidos). Los criterios para la lectura de la profundidad se basaron en la deseada potencia estadfstica para detectar una diferencia del 10 % en la tasa de metilacion entre dos grupos cualesquiera en los que el tamano de la muestra de individuos para cada grupo era 18.
La significacion estadfstica se determino mediante regresion logfstica del porcentaje de metilacion por DMR (usando los recuentos actuales) definiendose los grupos como PanC, pancreas normal y colon normal. Para tener en cuenta las profundidades de lectura variables para los sujetos individuales, se uso un modelo de regresion logfstica superdisperso, donde el parametro de dispersion se estimo usando la Chi cuadrada de Pearson estadfstica de los residuos del modelo ajustado. Para evaluar la metilacion especffica de la hebra, las regiones directa e inversa se analizaron por separado. Las DMR se ordenaron a continuacion segun su nivel de significacion y se consideraron una region marcadora viable si la tasa de metilacion en los controles era % pero >10 % en PanC. Cada DMR significativa se considero un marcador candidato.
Para el estudio de validacion interna, el resultado primario fue el area bajo la curva de caracterfsticas del operador (ABC) para cada marcador. Esta se calculo usando regresion logfstica (JMP version 9.0.1, SAS Institute, Cary NC) para modelar la intensidad el numero de copias corregido para la concentracion para cada marcador con PanC en comparacion con el pancreas normal y colon normal. Los marcadores con los valores de ABC mas altos y la relacion mas estrecha para la mediana del numero de copias entre casos y controles se seleccionaron para el estudio de validacion externa. El resultado primario del estudio de validacion externa fue el ABC para cada marcador representado graficamente contra la intensidad de la senal de cada marcador, medido segun el log de la relacion de la mediana corregida para el numero de copias en comparacion con los controles. Con dieciocho casos, hubo >80 % de potencia para detectar un area bajo la curva de 0,85 o mayor para la hipotesis nula de 0,5 con un nivel de significacion bilateral de 0,05. El criterio de valoracion secundario fue el ABC de combinaciones de dos marcadores, medidos mediante regresion logfstica, en los que ambos marcadores fueron necesarios para asociarse independientemente con los casos PanC.
Descubrimiento de marcadores RRBS
Extractos de ADN emparejados, enmascarados, asignados aleatoriamente de 18 tumores de cancer pancreatico, 18 tejidos pancreaticos benignos del control y 18 tejidos epiteliales de colon normal, se secuenciaron por RRBS. La mediana de edad fue 61 (intervalo 52- 65), 61 % eran mujeres, y el 44 % eran fumadores actuales o anteriores. Se capturaron un total de 6.101.049 sitios de CpG en cualquiera de las muestras con al menos 10X de cobertura. Tras seleccionar solamente sitios CpG donde la cobertura de grupos y los criterios de varianza se cumplfan, un total de 1.217.523 sitios CpG se consideraron adicionalmente para el analisis. Aproximadamente 500 DMR cumplieron los criterios de significacion par la metilacion diferencial. Entre estos, los inventores identificaron 107 regiones candidatas con suficientes firmas de metilacion para un diseno de cebadores MSP. Las firmas de metilacion van de 3 CpG vecinos a 52 CpG. Los niveles de metilacion de los canceres pancreaticos superan en raras ocasiones el 25 % en los CpG filtrados, lo que refleja niveles elevados de celulas estromales contaminantes. Esto se confirmo despues de secuenciar cada uno de los canceres para mutaciones KRAS para comprobar las frecuencias alelicas de las muestras positivas; para el 50 % de los especfmenes PanC que tenfan un cambio de base KRAS heterocigotico, la frecuencia del alelo mutante era al menos 4 veces menor que el correspondiente alelo natural.
Validacion interna
Basandose en el numero de CpG vecinos en cada firma de metilacion del gen candidato, se disenaron cebadores para 87 de los 107 marcadores candidatos. A continuacion se uso MSP para analizar los candidatos en la muestra de ADN procedentes de 20 lesiones PanC adicionales no enmascaradas, 10 muestras de epitelio colonico normal adicionales (replicas biologicas) asf como, muestras de ADN restantes de las 18 lesiones de PanC secuenciadas, 15 de los tejidos pancreaticos benignos secuenciados y 10 de las muestras de colon normal secuenciadas (replicas tecnicas). Con el diseno de cebadores de primer paso, 74 de los 87 marcadores se amplificaron correctamente. Con el rediseno, los restantes 13 cebadores se amplificaron correctamente y se analizaron en 12 muestras de PanC sin enmascarar y 10 muestras de colon normales. La [3-actina se amplifico en todas las muestras. Con cualquiera del los MSP de primer paso o segundo paso, 31 de 87 marcadores candidatos tuvieron un valor de ABC > 0,85. Basandose en la magnitud de las diferencias en la mediana del numero de copias genomicas entre los casos y los controles para cada marcador candidato, 23 se seleccionaron para la validacion externa en muestras independientes. Estos fueron ABCB1, ADCY1, BMP3, C13ORF18, CACNA1C, CD1D, CHR12:133484978-133485738 (CHR12 133), CLEC11A, ELMO1, FOXP2, GRIN2D, IKZF1, KCNK12, KCNN2, NDRG4, PRKCB, RSPO3, SCARF2, SHH, SLC38A3, TWIST1, VWC3 y WT1.
Validacion externa
ADN emparejado, enmascarado, asignado aleatoriamente procedente de 18 muestras PanC, 18 muestras pancreaticas benignas y 36 muestras de epitelio de colon normal se analizaron mediante MSP para los 23 principales candidatos. La mediana de edad de este subconjunto fue 60 (intervalo 54-64). La mayorfa (55 %) de las muestras eran de hombres y el 61 % eran fumadores o ex-fumadores. La [3-actina se amplifico en todas las muestras. 9 de 23 candidatos mostraron una excelente asociacion con PanC. Los valores individuales de ABC para CACNA1C, CHR12.133, WT1, GRIN2D, ELMO1, TWIST1, C13ORF18, KCNN2, y CLEC11A fueron 0,95, 0,95, 0,94, 0,94, 0,93, 0,92, 0,91, 0,90 y 0,90, respectivamente. Se observo buena asociacion con otros 9 candidatos; los valores de ABC para PRKCB, CD1D, SLC38A3, ABCB1, KCNK12, VWC2, RSPO3, SHH y ADCY1 fueron 0,89, 0,88, 0,86, 0,86, 0,86, 0,85, 0,85, 0,85 y 0,84 respectivamente.
El log de la relacion entre la mediana de los valores de los casos y del control para cada marcador se represento graficamente contra el ABC. Ocho marcadores, SHH, KCNK12, PRKCB, CLEC11, C13ORF18, TWIST1, ELMO1 y CHR12.133 tuvieron cada uno un valor de ABC mayor de 0,85, y mostraron un numero de copias genomicas mayor 1,5 log (>30 veces) para los casos que para los controles. KCNK12, PRKCB, ELMO1 y CHR12.133 mostraron una diferencia mayor de 2 log (> 100-veces).
Analisis de la complementariedad
Entre las 231 posibles combinaciones de 2 marcadores, ambos marcadores fueron muy significativos en 30 (13 %) modelos emparejados de asociacion con PanC. De estos, 18 (8 %) mostraron mejora en el ABC. Notablemente, entre varios marcadores complementarios, C13ORF18 mejoro la precision de CACNA1C, WT1, GRIND2D, SLC38A3 y SCARF2 con valores del ABC de 0,99, 0,99, 0,97, 0,96, y 0,95, respectivamente, para cada combinacion. Considerando el ABC de SHH como marcador individual era 0,85, mejoro el rendimiento de otros 6 marcadores cuando se emparejo. El ABC de CACNA1C, WT1, SLC38A3, ABCB1, VWC2 y RSPO3 mejoro a 0,96, 0,95, 0,92, 0,98, 0,88 y 0,95, respectivamente cuando se combino en modelos con SHH. De las 18 combinaciones de marcadores mas solidas, se pudieron analizar 9 combinaciones de forma emparejada procedentes del conjunto de datos de validacion interna. De estas, 7 pares (78 %) siguieron siendo muy significativo en ambos conjuntos de datos.
Ejemplo 9: Marcadores de ADN metilado muy discriminantes para la deteccion del esofago de Barret Para disminuir la creciente incidencia de adenocarcinoma esofagico, se necesitan procedimientos eficaces para seleccionar la poblacion para el precursor crftico del esofago de Barrett (EB). Se han propuesto herramientas mfnimamente invasivas o no invasivas pero se han visto dificultadas por la falta de marcadores optimamente sensibles y de marcadores especfficos. Se llevaron a cabo experimentos y se identificaron BMP3 y NDRG4 metilados de forma anomala como marcadores candidatos discriminantes para el EB.
Un objetivo de dichos experimentos era evaluar de forma prospectiva la precision de BMP3 y NDRG4 metilados para identificar EB usando biopsias endoscopicas (Fase 1) y cepillados del esofago y el cardias completos para simular los dispositivos de muestreo no endoscopico (Fase 2).
Se alistaron los casos con EB y los controles sin EB antes de la endoscopia. Los casos de EB tenfan >1 cm de la mucosa columnar perimetral, con metaplasia intestinal confirmada; los controles no tenfan EB endoscopicamente. En la Fase 1, se obtuvieron biopsias en los casos de EB, cardias gastrico ((CG); 1 cm por debajo de la lfnea Z) y epitelio escamoso ((SE); >2 cm por encima de EB) y en controles de CG (como para EB) y SE (5 cm por encima de la lfnea Z); a continuacion se congelaron rapidamente. Las muestras de biopsia se procesaron en lote, y se sometieron a ensayo de forma enmascarada. En la Fase 2, se obtuvieron los especfmenes utilizando un cepillo citologico endoscopico de alta capacidad (Hobbs Medical, Stafford Springs CT); el cardias, el EB (en casos), y la longitud completa del esofago se cepillaron para simular un dispositivo de muestreo del tipo de una esponja tragada.
Despues de la extraccion del ADN y el tratamiento con bisulfito, se evaluo la metilacion en los genes diana mediante amplificacion de la senal y la diana en tiempo real cuantitativa especffica de alelo. L> -actina tambien se cuantifico como un marcador para el ADN humano total.
Se estudiaron prospectivamente 100 sujetos. Fase 1: Entre 40 casos de BE y 40 controles: la mediana de edad fue de 65 (cuartiles 55-77) y 54 (37-69) y los hombres comprendieron 78 % y 48 %, respectivamente. La mediana de la longitud del EB fue de 6 cm (intervalo 3-10). La mediana de los niveles de los marcadores metilados fue sustancialmente superior (34-600 veces) en el EB que en el SE y GC adyacentes, o que en SE y GC normales. A diferencia de los marcadores metilados, las distribuciones de p-actina fueron similares para todos los grupos de tejidos. Ambos niveles de marcadores aumentaron con la longitud de EB y la edad, p<0,001 mientras que solo NDRG4 aumento significativamente con la presencia de displasia (ninguno (19), grado bajo (9), grado alto (11); p = 0,003). Los factores que no afectan significativamente los niveles de marcadores incluyen el sexo y la inflamacion. Fase 2: Entre 10 casos de BE y 10 controles, la mediana de edad fue de 64 (59-70) y 66 (49, 71) y los hombres comprendieron el 80 y el 30 % respectivamente. La mediana de la longitud del EB fue de 2 cm (intervalo 1-4). La discriminacion de EB por los marcadores fue extraordinaria con la ABC de 1,0 para NDRG4 y 0,99 para BMP3; los niveles fueron >100 veces mayores en los casos respecto de los controles (Figura 2).
Estos experimentos demuestran que marcadores de ADN metilados seleccionados discriminan mucho EB de CG y SE normales, en especfmenes de biopsia y cepillados. La Tabla 9 muestra las asociaciones entre la funcion y la biologfa del cancer de los marcadores de a Dn metilados seleccionados.
Tabla 8: Niveles de marcadores (numeros de copias de marcadores ajustados para la beta actina) para las biopsias de BMP3 y NDRG4 en casos de BE (cardias, de Barrett, escamoso) y los controles (cardias, escamoso).
Figure imgf000054_0001
Tabla 9. Asociaciones entre la funcion y la biologfa del cancer de los principales marcadores candidatos
Figure imgf000054_0002
Figure imgf000055_0001
Figure imgf000055_0002
(continuacion)
Figure imgf000056_0001
(continuacion)
Figure imgf000057_0001
(continuacion)
Figure imgf000058_0001
Lee WK, Chakraborty PK, Thevenod F. Pituitary homeobox 2 (PITX2) protects renal cancer cell lines against doxorubicin toxicity by transcriptional activation of the multidrug transporter ABCB1. International journal of cancer Journal international du cancer. 2013;133:556-67.
Vincent A, Omura N, Hong SM, Jaffe A, Eshleman J, Goggins M. Genome-wide analysis of promoter methylation associated with gene expression profile in pancreatic adenocarcinoma. Clinical cancer research: an official journal of the American Association for Cancer Research. 2011;17:4341-54.
Yang N, Eijsink JJ, Lendvai A, Volders HH, Klip H, Buikema HJ, y col. Methylation markers for CCNA1 and C13ORF18 are strongly associated with high-grade cervical intraepithelial neoplasia and cervical cancer in cervical scrapings. Cancer epidemiology, biomarkers & prevention: a publication of the American Association for Cancer Research, cosponsored by the American Society of Preventive Oncology. 2009;18:3000-7.
Liu D, Song L, Brawley VS, Robison N, Wei J, Gao X, y col. Medulloblastoma expresses CDld and can be targeted for immunotherapy with NKT cells. Clin Immunol. 2013;149:55-64.
Li H, Yang L, Fu H, Yan J, Wang Y, Guo H, y col. Association between Galphai2 and ELMO1/Dock180 connects chemokine signalling with Rac activation and metastasis. Nat Commun. 2013;4:1706.
Stumm L, Burkhardt L, Steurer S, Simon R, Adam M, Becker A, y col. Strong expression of the neuronal transcription factor FOXP2 is linked to an increased risk of early PSA recurrence in ERG fusion-negative cancers. Journal of clinical pathology. 2013;66:563-8.
Campbell AJ, Lyne L, Brown PJ, Launchbury RJ, Bignone P, Chi J, y col. Aberrant expression of the neuronal transcription factor FOXP2 in neoplastic plasma cells. British journal of haematology. 2010;149:221-30.
Jiao X, Wood LD, Lindman M, Jones S, Buckhaults P, Polyak K, y col. Somatic mutations in the Notch, NF-KB, PIK3CA, and Hedgehog pathways in human breast cancers. Genes, chromosomes & cancer. 2012;51:480-9. Asai D, Imamura T, Suenobu S, Saito A, Hasegawa D, Deguchi T, y col. IKZF1 deletion is associated with a poor outcome in pediatric B-cell precursor acute lymphoblastic leukemia in Japan. Cancer Med. 2013;2:412-9.
Kober P, Bujko M, Oledzki J, Tysarowski A, Siedlecki JA. Methyl-CpG binding column-based identification of nine genes hypermethylated in colorectal cancer. Molecular carcinogenesis. 2011;50:846-56.
Camoes MJ, Paulo P, Ribeiro FR, Barros-Silva JD, Almeida M, Costa VL, y col. Potential downstream target genes of aberrant ETS transcription factors are differentially affected in Ewing's sarcoma and prostate carcinoma. PLoS ONE. 2012;7:e49819.
Kisiel JB, Yab TC, Taylor WR, Chari ST, Petersen GM, Mahoney DW, y col. Stool DNA testing for the detection of pancreatic cancer: assessment of methylation marker candidates. Cancer. 2012;118:2623-31.
Ahlquist DA, Zou H, Domanico M, Mahoney DW, Yab TC, Taylor WR, y col. Next-Generation Stool DNA Test Accurately Detects Colorectal Cancer and Large Adenomas. Gastroenterology. 2012;142:248-56.
Surdez D, Benetkiewicz M, Perrin V, Han ZY, Pierron G, Ballet S, y col. Targeting the EWSR1-FLI1 oncogeneinduced protein kinase PKC-beta abolishes ewing sarcoma growth. Cancer research. 2012;72:4494-503.
Seshagiri S, Stawiski EW, Durinck S, Modrusan Z, Storm EE, Conboy CB, y col. Recurrent R-spondin fusions in colon cancer. Nature. 2012;488:660-4.
Zhao J, Liang Q, Cheung KF, Kang W, Lung RW, Tong JH, y col. Genome-wide identification of Epstein-Barr virus-driven promoter methylation profiles of human genes in gastric cancer cells. Cancer. 2013;119:304-12. Gurung B, Feng Z, Iwamoto DV, Thiel A, Jin G, Fan CM, y col. Menin epigenetically represses Hedgehog signaling in MEN1 tumor syndrome. Cancer research. 2013;73:2650-8.
Person RJ, Tokar EJ, Xu Y, Orihuela R, Ngalame NN, Waalkes MP. Chronic cadmium exposure in vitro induces cancer cell characteristics in human lung cells. Toxicol Appl Pharmacol. 2013.
Shin SH, Lee K, Kim BH, Cho NY, Jang JY, Kim YT, y col. Bile-based detection of extrahepatic cholangiocarcinoma with quantitative DNA methylation markers and its high sensitivity. The Journal of molecular diagnostics: JMD. 2012;14:256-63.
Jacobs DI, Mao Y, Fu A, Kelly WK, Zhu Y. Dysregulated methylation at imprinted genes in prostate tumor tissue detected by methylation microarray. BMC Urol. 2013;13:37.
Ejemplo 10: Un panel de marcadores de microARN y ADN basado en heces para la deteccion del cancer pancreatico
Dada la extraordinaria letalidad del cancer pancreatico (PC), se necesitan procedimientos no invasivos practicos para la deteccion por cribado presintomatico. Los microARN (miARN) tienen la expresion alterada en el PC.
Se llevaron a cabo experimentos que tenfan como objetivo explorar la factibilidad del miR-1290 en heces para la deteccion del PC.
Se analizaron muestras de heces del archivo de 58 casos de PC y 64 controles sanos emparejados por la edad, genero, y antecedentes de tabaquismo. Se llevo a cabo la deteccion del miARN siguiendo la estrategia de la reaccion en cadena de la polimerasa mediante transcripcion inversa cuantitativa de tallo-bucle (qRT-PCR). La cuantificacion del miARN se baso en la medicion de las copias absolutas por nanogramo del ARN extrafdo. Los marcadores de ADN (BMP3metilado, KRAS mutante y f3-actina) se capturaron en forma hfbrida y se amplificaron como se ha descrito (Cancer 2012, 118:2623). Se uso un modelo de regresion logfstica por etapas, limitado a 5 variables, para desarrollar un panel de marcadores optimizado basado en miR-1290, marcadores de ADN, y edad. Las areas ajustadas a la edad bajo la curva COR (ABC) para cada uno de los modelos se compararon utilizando los procedimientos de DeLong y col. Se evaluo la asociacion de miR-1290 con factores clfnicos utilizando la prueba de la suma de rangos de Wilcoxon.
Las distribuciones de miR-1290 fueron significativamente mayores en heces procedentes de casos de PC que de los controles (P = 0,0002). Los niveles de miR-1290 en heces no se vieron afectados por la edad, el sexo, el sitio del tumor o la etapa del tumor. La ABC de miR-1290 en heces fue de 0,74 (95 % del IC: 0,65 - 0,82, Figura 3) para la deteccion de Pc en comparacion con una ABC de 0,81 (0,73 - 0,89) mediante el panel de marcadores de ADN en heces. La adicion de miR-1290 a los marcadores de ADN se ha demostrado creciente (P = 0,0007) con una ABC de 0,87 (0,81 - 0,94). Anadir el miR-1290 al panel de ADN aumento la sensibilidad de la prueba a traves del intervalo completo de especificidades incluyendo la region crftica de 90-100 %. La sensibilidad al PC del panel de marcadores combinado fue del 64 % (50 % - 76 %) al 95 % (87 % - 99 %) de especificidad, y del 79 % (67 % - 89 %) al 85 % (74 % - 92 %) de especificidad.
Estos experimentos identificaron el miR-1290 en heces como un marcador para el PC.
Ejemplo 11 - Identificacion de marcadores usando RRBS
Durante el desarrollo de la tecnologfa proporcionada en el presente documento, se recogieron datos de un estudio de control del caso para demostrar que una estrategia de busqueda en todo el genoma identifica marcadores novedosos e informativos.
Poblacion del estudio, adquisicion de especfmenes, y muestras
La poblacion diana eran pacientes con cancer de pancreas tratados en la clfnica Mayo. La poblacion accesible incluye los que se han sometido a una pancreatectomfa distal, una pancreaticoduodenectomfa, o una colectomfa con un especimen de reseccion archivado, y un diagnostico patologico confirmado. El ADN del epitelio colonico se habfa extrafdo previamente de especfmenes microdisecados en el laboratorio de Biospecimens Accessioning Processing (BAP) usando un protocolo de fenol-cloroformo. El personal de Pancreas SPORE uso los datos de las variables emparejadas de estas muestras para seleccionar las muestras de registro de tejidos. Estas fueron revisadas por un patologo experto para confirmar el caso y controlar el estado y excluir casos de neoplasias producidas a partir de IPMN, que puede tener una biologfa subyacente distinta. El personal de SPORE dispuso la microdiseccion en el laboratorio BAP y la extraccion del ADN en los casos pancreaticos y muestras del control y proporciono 500 ng de ADN al personal del laboratorio que estaba enmascarado para el caso y el estado del control. Las muestras de acido nucleico de archivo incluyeron 18 adenocarcinomas pancreatico, 18 pancreas normales y 18 epitelios colonicos emparejados por sexo, edad, y estado de tabaquismo.
Los tipos de muestras fueron:
1) tejidos de PanC del registro de Pancreas SPORE en la clfnica Mayo limitado a AJCC estado I y II;
2) pancreas de control sin PanC;
3) epitelio colonico del control archivado sin PanC; y
4) neoplasia colonico del que el ADN se habfa extrafdo y almacenado en el laboratorio BAP.
Los casos y los controles se emparejaron por sexo, edad (en incrementos de 5 anos), y estado de tabaquismo (actual o anterior frente a nunca).
procedimientos
Se prepararon bibliotecas segun procedimientos descritos previamente (vease, por ejemplo, Gu y col (2011) "Preparation of reduced representation bisulfite sequencing libraries for genome-scale DNA methylation profiling" Nature Protocols 6: 468-81) mediante la fragmentacion de ADN genomico (300 ng) por digestion con 10 unidades de MspI, una enzima de restriccion especffica de metilacion que reconoce los motivos que contienen CpG. Este tratamiento enriquece las muestras en su contenido de CpG y elimina zonas redundantes del genoma. Se repararon los extremos de los fragmentos digeridos y se agregaron colas A con 5 unidades de fragmento de Klenow (3'-5' exo) y se ligo durante la noche a adaptadores Illumina que contienen una de cuatro secuencias de codigo de barras para enlazar cada fragmento a su ID de muestra. Se llevo a cabo la seleccion por tamano de los fragmentos de 160-340 pb (que tiene inserciones de 40-220 pb) usando perlas /tampon SPRI (AMPure XP, Beckman Coulter). Los cortes de tampon fueron 0,7x a 1,1 x del volumen de muestra de perlas/tampon. Las muestras se eluyeron en un volumen de 22 pi (tampon EB, Qiagen). Se utilizo la PCR para controlar la eficacia de enlazado y la calidad de fragmentos en una pequena alfcuota de la muestra. A continuacion, las muestras se sometieron a dos rondas de conversion con bisulfito usando un protocolo EpiTect modificado (Qiagen). qPCR y PCR convencional (Pfu Turbo Cx hotstart, Agilent), seguido por evaluacion con Bioanalyzer 2100 (Agilent) sobre alfcuotas de muestra convertidas, determinaron el numero optimo de ciclos de la pCr antes de la amplificacion de la biblioteca final. La PCR final se llevo a cabo en un volumen de 50 pl (5 pl de 10x tampon PCR; 1,25 pl de cada dNTP a 10 mM; 5 pl de un primer coctel a aproximadamente 5 pM, 15 pl de molde (muestra), 1 pl de PfuTurbo Cx hotstart, y 22,75 pl de agua. El ciclado termico comenzo con incubaciones iniciales a 95 °C durante 5 minuto y a 98 °C durante 30 segundos seguido de 16 ciclos de 98 °C durante 10 segundos, 65 °C durante 30 segundos, y a 72 °C durante 30 segundos. Tras la ciclacion, las muestras se incubaron a 72 °C durante 5 minutos y se mantuvieron a 4 °C hasta la posterior elaboracion y analisis. Las muestras se combinaron en cantidades equimolares en bibliotecas tetramultiplexadas segun un esquema de aleatorizacion y se sometieron a ensayo con el bioanalizador para una comprobacion de la etapa final. Las muestras tambien se analizaron con qPCR usando patrones phiX y cebadores especfficos del adaptador.
Para la secuenciacion, las muestras se cargaron en hileras de celdas de flujo de acuerdo con una asignacion aleatorizada de hileras, donde hileras adicionales estan reservadas para los controles internos del ensayo. La secuenciacion se realizo mediante el NGS Core en la Medical Genome Facility de Mayo con el Illumina HiSeq 2000. Las lecturas fueron unidireccionales para 101 ciclos. Cada hilera de celda de flujo genero 100-120 millones de lecturas, suficiente para una mediana de cobertura de 30x a 50x de profundidad de secuenciacion (basandose en el numero de lecturas por CpG) para las secuencias alineadas. Se uso el programa informatico convencional Illumina para analizar las lecturas junto con RRBSMAP (Xi, y col. (2012) "RRBSMAP: a fast, accurate and user-friendly alignment tool for reduced representation bisulfite sequencing" Bioinformatics 28: 430-432) y un codigo informatico propio (SAAP-RRBS) desarrollado por el personal de Mayo Biomedical and Statistics (Sun y col. (2012) "SAAP-RRBS: streamlined analysis and annotation pipeline for reduced representation bisulfite sequencing" Bioinformatics 28: 2180-1). El analisis bioinformatico consintio en 1) evaluacion y limpieza de la lectura de la secuencia, 2) alineamiento con el genoma de referencia, 3) extraccion del estado de metilacion, y 4) notificacion y anotacion de CpG.
Consideraciones estadfsticas:
La comparacion primaria de interes es las diferencias en la metilacion entre los casos y los controles para cada CpG y/o ventana de CpG apilada. El resultado secundario es la misma comparacion entre casos y capa leucocitaria normal y controles de colon. Se estudio la metilacion diferencial de los marcadores mediante:
1. Evaluacion de las distribuciones del porcentaje de metilacion para cada marcador, y descartar los marcadores con mas de un 2,5 % de fondo metilado en los controles del colon y en la capa leucocitaria normal
2. Analizar la distribucion de la metilacion de los marcadores restantes entre casos y controles mediante la prueba de suma de rangos de Wilcoxon y ordenando los marcadores por los valores p.
3. Usar los valores Q para estimar las tasas de descubrimiento falsas (FDR) (Benjamini y col. (1995) "Multiple Testing" Journal of the Royal Statistical Society. Serie B (Metodologica) 57: 289-300; Storey y col. (2003) "Statistical significance for genomewide studies" Proc Natl Acad Sci U S A 100: 9440-5). Durante el descubrimiento, es aceptable una FDR de hasta el 25 %.
Analisis de datos
Se desarrollo un codigo de analisis de datos en el paquete informatico de analisis de software R ("R: A Language and Environment for Statistical Computing" (2012), R Foundation for Statistical Computing). El flujo de trabajo comprendfa las siguientes etapas:
1. Lectura de todos los sitios CpG
2. Considerar solo aquellos sitios CpG donde la profundidad de cobertura total del grupo es de 200 lecturas o mas. Esto se basa en una evaluacion de potencia para detectar una diferencia entre el 20 % y el 30 % en la metilacion entre dos grupos cualesquiera; cualquier cosa menor tiene pocas posibilidades de significacion. Por lo tanto, si hay 18 sujetos por cada grupo y cada sujeto tiene 12 lecturas, la profundidad de cobertura del grupo es 12*18=216.
3. Excluir todos los sitios CpG donde la varianza del % metilacion a traves de los grupos sea 0 (sitios CpG no informativos).
4. Realizar una regresion logfstica sobredispersa para el % de metilacion (basandose en el recuento real) usando los grupos definidos como Colon/Capa leucocitaria normal, control especffico de la enfermedad, y cancer especffico de interes (casos) para determinar la significacion estadfstica del % de metilacion para los analisis primario y secundario. Se uso un modelo logfstico sobredisperso porque la variabilidad en el % de metilacion entre sujetos es mayor que el permitido por la hipotesis binomica. Este parametro de dispersion se estimo usando la Chi cuadrada de Pearson del ajuste.
5. Generar los valore del area bajo la curva de caracterfsticas operativas del receptor (COR). El area bajo la curva COR es una medida de la precision predictiva del % de metilacion especffica del sujeto y se estimo del a partir del analisis primario (casos vs. control de a enfermedad) y el analisis secundario (casos vs. colon/capa leucocitaria normal), independientemente.
6. De una manera similar al punto 5, tambien se estimaron las veces de cambio (FC, una medida de la separacion entre casos y controles) para el analisis primario y secundario usando la relacion del % de metilacion entre los casos y el correspondiente grupo del control.
7. 4-6 anterior se realizo en sitios CpG individuales asf como en regiones CpG metiladas. Estas regiones se definieron para cada cromosoma como un grupo de al menos 5 sitios CpG con una distancia de aproximadamente 100 pares de bases (pb) con un % de metilacion media < 2,5 % en controles de colon/capa leucocitaria normales
8. Las regiones CpG que muestran promesa para una validacion tecnica y biologica se identificaron por tener una diferencia en la metilacion estadfsticamente significativa, un FC grande, y un valor de ABC elevado para el analisis primario y secundario.
Analisis post-R:
1. Regiones CpGs y CpG individuales clasificadas por el valor p, FC, y ABC. Los cortes fueron <0,01, >20, y >0,85 respectivamente, aunque estos se ajustaron a menudo dependiendo de la solidez de los datos. Por ejemplo, el tejido neoplasico muy heterogeneo dio como resultado valores del % de metilacion inferiores, que a su vez afectan a la filtracion. Las comparaciones primarias y secundarias pueden clasificarse juntas o por separado dependiendo de los requerimientos de especificidad de la aplicacion. Los epitelios colonicos normales se incluyeron como un control para los marcadores sin cobertura adecuados para el ensayo de las heces. Si se esta ensayando el jugo pancreatico, el tejido colonico es innecesario. Esto puede dar como resultado un conjunto completamente diferente de marcadores.
2. Regiones de marcadores clasificadas basadas en los requerimientos de la plataforma de ensayo. En la actualidad, la PCR especffica de la metilacion (MSP), o plataformas de discriminacion similares donde la discriminacion esta basada en la especificidad de la hibridacion del cebador, es la plataforma de eleccion. Para esta metodologfa, es imperativo tener 2-5 regiones CpG discriminadas por oligonucleotido en un tramo amplificable del ADN. Para los ensayos de heces, este requerimiento es incluso mas restrictivo puesto que los amplicones deben ser cortos (<100pb). La seleccion de marcadores, por lo tanto, debe hacerse sobre la base de tramos contiguos cortos de CpG muy discriminadas. Si la plataforma evoluciona a una tecnologfa basada en secuencias, los requisitos de distribucion de CpG en una region pueden ser completamente diferentes.
Resultados
Extractos de ADN emparejados, enmascarados, asignados aleatoriamente de 18 tumores de cancer pancreatico, 18 tejidos pancreaticos benignos del control y 18 tejidos epiteliales colonicos normales, se secuenciaron por RRBS. La mediana de edad fue 61 (intervalo 52- 65), 61 % eran mujeres, y el 44 % eran fumadores actuales o anteriores. Se cartografiaron aproximadamente 6 millones de CpG con una cobertura>10x. Mas de 2000 regiones CpG cumplieron los criterios de significacion par la metilacion diferencial. Despues de aplicar los criterios de filtro anteriores, se identificaron 449 regiones metiladas de forma diferencial (DMR) (Tabla 10). La Tabla 11 presenta las 449 regiones diferencialmente metiladas (DMR) identificadas ordenadas por area decreciente bajo la curva COR (ABC).
En estos marcadores, las firmas de metilacion van de 3 CpG a 56 CpG. Los niveles de metilacion de los canceres pancreaticos superan en raras ocasiones el 25 % en los CpG filtrados, lo que sugiere que los tejidos con cancer pueden tener elevados niveles de celulas y/o estroma normal contaminante. Para estudiar esto, cada uno de los canceres se secuencio para determinar las mutaciones KRAS para verificar las frecuencias alelicas de las muestras positivas. Para el 50 % que tenia un cambio de base KRAS heterocigotico, la frecuencia del alelo mutante era al menos 4 veces menor que el correspondiente alelo natural, lo que respalda la contaminacion por celulas y/o estroma normales.
Se descubrio que 58 de los 449 marcadores estaban en regiones no anotadas y se encuentran en regiones sin elementos de codificacion proteica. De los restantes 391 marcadores candidatos, aproximadamente 225 se habian descrito como asociados con cancer, algunos de los cuales se clasifican como supresores tumorales. Los otros 166 marcadores candidatos tenian anteriormente una baja asociacion con el cancer (por ejemplo, mutaciones y/o alteraciones en el numero de copias observado en cribados de todo el genoma) o no tenian asociaciones con cancer previamente identificadas.
Tabla 10: DMR
N.° marcador Cromosoma Coordenadas del cromosoma Anotacion
1 chr7 87229775-87229856 ABCB1
2 chr2 207307687-207307794 ADAM23
3 chr15 100881373-100881437 ADAMTS17
4 chr16 77468655-77468742 ADAMTS18
5 chr19 41224781-41225006 ADCK4
6 chr7 45613877-45614572 ADCY1
chr2 70994498-70994755 ADD2 chr14 105190863-105191031 ADSSL1 chr10 116064516-116064600 AFAP1L2 (c o n tin u a c io n )
N.° marcador Cromosoma Coordenadas del cromosoma Anotacion 10 chr4 87934353-87934488 AFF1
11 chr2 100720494-100720679 AFF3
12 chr7 100136884-100137350 AGFG2 13 chr9 116151083-116151315 ALAD
14 chr14 103396870-103396920 AMN
15 chr19 10206736-10206757 ANGPTL6 16 chr19 17438929-17438974 ANO8 17 chr15 90358267-90358400 ANPEP 18 chr15 29131299-29131369 APBA2 19 chr19 45430362-45430458 APOC1P1 20 chr13 111767862-111768355 ARHGEF7 21 chr7 98990897-98990989 ARPC1B 22 chr22 51066374-51066431 ARSA 23 chr9 120175665-120176057 ASTN2 24 chr1 203619509-203619829 ATP2B4 25 chr7 69062853-69062972 AUTS2 26 chr8 104152963-104152974 BAALC 27 chr11 64052053-64052132 BAD
28 chr10 121411207-121411375 BAG3 29 chr7 98029116-98029383 BAIAP2L1 30 chr9 135462730-135462765 BARHL1 31 chr10 133795124-133795423 BNIP3 32 chr12 107715014-107715095 BTBD11 33 chr6 105584524-105584800 BVES
34 chr10 21816267-21816490 C10orf140 35 chr12 21680381-21680438 C12orf39 36 chr12 21680681-21680817 C12orf39 37 chr12 117174873-117175030 C12orf49 38 chr13 46960767-46961669 C13orf18 39 chr14 50099743-50099930 C14orf104 40 chr19 16772631-16772712 C19orf42 41 chr20 31061389-31061649 C20orf112 42 chr5 175665232-175665311 C5orf25 43 chr6 42858890-42859092 C6orf226 44 chr9 139735581-139735683 C9orf172 45 chr12 2800756-2800899 CACNA1C 46 chr3 54156904-54156987 CACNA2D3 47 chr11 115373179-115373281 CADM1 48 chr16 89007413-89007432 CBFA2T3 49 chr16 49316205-49316258 CBLN1 50 chr21 44495919-44495933 CBS
51 chr17 77810085-77810206 CBX4 52 chr17 8649567-8649665 CCDC42 53 chr11 64110001-64110069 CCDC88B 54 chr14 91883473-91883674 CCDC88C 55 chr14 99946756-99946806 CCNK 56 chr1 158150797-158151205 CD1D
57 chr5 175969660-175969699 CDHR2 58 chr7 39989959-39990020 CDK13 (c o n tin u a c io n )
N.° marcador Cromosoma Coordenadas del cromosoma Anotacion 59 chr16 80837397-80837505 CDYL2 60 chr10 11059508-11060151 CELF2 61 chr22 47130339-47130459 CERK 62 chr2 233389020-233389049 CHRND 63 chr7 73245708-73245798 CLDN4 64 chr19 51228217-51228732 CLEC11A 65 chr3 139654045-139654132 CLSTN2 66 chr7 155302557-155302639 CNPY1 67 chr6 88875699-88875763 CNR1 68 chr6 88876367-88876445 CNR1 69 chr6 88876701-88876726 CNR1 70 chr2 165698520-165698578 COBLL1 71 chr6 75794978-75795024 COL12A1 72 chr12 48398051-48398093 COL2A1 73 chr12 48398306-48398375 COL2A1 74 chr18 449695-449798 COLEC12 75 chr7 30721980-30722020 CRHR2 76 chr16 84875643-84875772 CRISPLD2 77 chr7 151127086-151127195 CRYGN 78 chr10 126812450-126812653 CTBP2 79 chr20 56089440-56089547 CTCFL 80 chr2 219261190-219261327 CTDSP1 81 chr2 80530326-80530374 CTNNA2 82 chr22 43044555-43044737 CYB5R3 83 chr19 1406516-1406625 DAZAP1 84 chr7 44084171-44084235 DBNL 85 chr11 20178177-20178304 DBX1 86 chr4 151000325-151000356 DCLK2 87 chr4 151000358-151000403 DCLK2 88 chr4 183817058-183817157 DCTD 89 chr13 52378159-52378202 DHRS12 90 chr8 13014567-13014682 DLC1 91 chr11 84432067-84432186 DLG2 92 chr6 170598276-170598782 DLL1 93 chr19 39989824-39989852 DLL3 94 chr19 12996198-12996321 DNASE2 95 chr2 230578698-230578802 DNER 96 chr2 225907414-225907537 DOCK10 97 chr18 32073971-32074004 DTNA 98 chr2 233352345-233352605 ECEL1 99 chr7 37487539-37488596 ELMO1 100 chr20 39995010-39995051 EMILIN3 101 chr19 48833763-48833967 EMP3 102 chr2 119607676-119607765 EN1 103 chr3 27763358-27763617 EOMES 104 chr3 27763909-27763981 EOMES 105 chr12 132435207-132435428 EP400 106 chr19 16473958-16474095 EPS15L1 107 chr6 152129293-152129450 ESR1 108 chr3 185825887-185826002 ETV5 (c o n tin u a c io n )
N.° marcador Cromosoma Coordenadas del cromosoma Anotacion 109 chr9 140201493-140201583 EXD3 110 chr6 133562127-133562229 EYA4 111 chr1 160983607-160983768 F11R 112 chr20 821836-821871 FAM110A 113 chr22 45898798-45898888 FBLN1 114 chr9 97401449-97401602 FBP1 115 chr16 750679-750715 FBXL16 116 chr5 15500208-15500399 FBXL7 117 chr5 15500663-15500852 FBXL7 118 chr5 114880375-114880442 FEM1C 119 chr20 34189488-34189693 FER1L4 120 chr14 53417493-53417618 FERMT2 121 chr2 219849962-219850042 FEV 122 chr17 7339280-7339492 FGF11 123 chr19 49256413-49256451 FGF21 124 chr10 103538848-103539033 FGF8 125 chr11 64008415-64008495 FKBP2 126 chr11 128564106-128564209 FLI1 127 chr10 102985059-102985130 FLJ41350 128 chr13 28674451-28674629 FLT3 129 chr1 240255240-240255264 FMN2 130 chr5 131132146-131132232 FNIP1 131 chr6 108882636-108882682 FOXO3 132 chr3 71478053-71478206 FOXP1 133 chr7 113724864-113725006 FOXP2 134 chr7 113727624-113727693 FOXP2 135 chr5 160975098-160975142 GABRB2 136 chr12 51786085-51786218 GALNT6 137 chr5 179780839-179780955 GFPT2 138 chr20 3641457-3641537 GFRA4 139 chr17 4462834-4463034 GGT6 140 chr17 4463796-4464037 GGT6 141 chr17 42907549-42907807 GJC1 142 chr8 144358251-144358266 GL14 143 chr16 4377510-4377615 GLIS2 144 chr12 56881329-56881414 GLS2 145 chr6 24776486-24776667 GMNN 146 chr19 3095019-3095055 GNA11 147 chr22 19710910-19710984 GP1BB 148 chr22 19711364-19711385 GP1BB 149 chr2 131485151-131485219 GPR148 150 chr2 165477564-165477609 GRB14 151 chr2 165477839-165477886 GRB14 152 chr17 73390467-73390597 GRB2 153 chr19 48918266-48918311 GRIN2D 154 chr19 48946755-48946912 GRIN2D 155 chr13 114018369-114018421 GRTP1 156 chr12 13254503-13254606 GSG1 157 chr7 43152309-43152375 HECW1 158 chr7 139440133-139440341 HIPK2 (c o n tin u a c io n )
N.° marcador Cromosoma Coordenadas del cromosoma Anotacion 159 chr6 34205664-34206018 HMGA1
160 chr12 121416542-121416670 HNF1A
161 chr20 42984244-42984427 HNF4A
162 chr20 43040031-43040119 HNF4A
163 chr5 177632203-177632260 HNRNPAB 164 chr7 27136030-27136245 HOXA1
165 chr2 176971915-176971968 HOXD11 166 chr19 35540057-35540200 HPN
167 chr2 163174366-163174659 IFIH1
168 chr17 47073421-47073440 IGF2BP1 169 chr11 133797643-133797789 IGSF9B
170 chr7 50343838-50344029 IKZF1
171 chr7 50344414-50344453 IKZF1
172 chr20 20345123-20345150 INSM1
173 chr20 20350520-20350532 INSM1
174 chr15 76632356-76632462 ISL2
175 chr2 182321880-182322022 ITGA4
176 chr2 182322168-182322198 ITGA4
177 chr2 173293542-173293644 ITGA6
178 chr19 2097386-2097437 IZUMO4
179 chr21 27011846-27011964 JAM2
180 chr2 47797260-47797371 KCNK12 181 chr10 79397895-79397945 KCNMA1 182 chr5 113696524-113696682 KCNN2
183 chr5 113696971-113697058 KCNN2
184 chr1 154733071-154733232 KCNN3
185 chr8 99439457-99439482 KCNS2
186 chr19 34287890-34287972 KCTD15 187 chr12 121905558-121905792 KDM2B
188 chr8 136469529-136469873 KHDRBS3 189 chr16 85646495-85646594 KIAA0182 190 chr18 46190841-46190970 KIAA0427 191 chr4 37245694-37245718 KIAA1239 192 chr17 72350351-72350403 KIF19
193 chr2 149633039-149633137 KIF5C
194 chr22 50987245-50987312 KLHDC7B 195 chr12 53298237-53298384 KRT8
196 chr19 54974004-54974086 LENG9
197 chr1 180198528-180198542 LHX4
198 chr19 2290471-2290541 LINGO3
199 chr11 19733958-19734013 LOC100126784 200 chr19 58513829-58513851 LOC100128398 201 chr17 43324999-43325188 LOC100133991 202 chr17 43325784-43325960 LOC100133991 203 chr2 109745715-109745742 LOC100287216 204 chr1 178063099-178063167 LOC100302401 205 chr12 53447992-53448072 LOC283335 206 chr1 45769962-45770141 LOC400752 207 chr20 61637950-61638000 LOC63930 208 chr13 88323571-88323647 LOC642345 (c o n tin u a c io n )
N.° marcador Cromosoma Coordenadas del cromosoma Anotacion
209 chr6 111873064-111873162 LOC643749
210 chr5 87956937-87956996 LOC645323
211 chr5 87970260-87970568 LOC645323
212 chr5 87970751-87970850 LOC645323
213 chr12 85430135-85430175 LRRIQ1
214 chr19 497878-497933 MADCAM1
215 chr5 71404528-71404563 MAP1B
216 chr2 39665069-39665282 MAP4K3
217 chr1 156406057-156406118 MAX.chr1.156406057-156406118 218 chr1 23894874-23894919 MAX.chr1.23894874-23894919 219 chr1 240161479-240161546 MAX.chr1.240161479-240161546 220 chr1 244012804-244012986 MAX.chr1.244012804-244012986 221 chr1 35394690-35394876 MAX.chr1.35394690-35394876 222 chr1 35395179-35395201 MAX.chr1.35395179-35395201 223 chr1 39044345-39044354 MAX.chr1.39044345-39044354 224 chr10 101282185-101282257 MAX.chr10.101282185-101282257 225 chr10 127033272-127033428 MAX.chr10.127033272-127033428 226 chr11 120382450-120382498 MAX.chr11.120382450-120382498 227 chr11 47421719-47421776 MAX.chr11.47421719-47421776 228 chr12 133484978-133485066 MAX.chr12.133484978-133485066 229 chr12 133485702-133485739 MAX.chr12.133485702-133485739 230 chr12 54151078-54151153 MAX.chr12.54151078-54151153 231 chr12 58259413-58259475 MAX.chr12.58259413-58259475 232 chr13 25322044-25322165 MAX.chr13.25322044-25322165 233 chr13 29394692-29394771 MAX.chr13.29394692-29394771 234 chr14 100751586-100751695 MAX.chr14.100751586-100751695 235 chr14 61123624-61123707 MAX.chr14.61123624-61123707 236 chr14 89507100-89507162 MAX.chr14.89507100-89507162 237 chr15 40361431-40361644 MAX.chr15.40361431-40361644 238 chr15 89942904-89943197 MAX.chr15.89942904-89943197 239 chr16 25042924-25043187 MAX.chr16.25042924-25043187 240 chr16 85230248-85230405 MAX.chr16.85230248-85230405 241 chr17 1835463-1835690 MAX.chr17.1835463-1835690 242 chr17 60218266-60218449 MAX.chr17.60218266-60218449 243 chr17 76337726-76337824 MAX.chr17.76337726-76337824 244 chr19 11805543-11805639 MAX.chr19.11805543-11805639 245 chr19 22034747-22034887 MAX.chr19.22034747-22034887 246 chr19 32715650-32715707 MAX.chr19.32715650-32715707 247 chr19 5805881-5805968 MAX.chr19.5805881-5805968 248 chr2 127783183-127783233 MAX.chr2.127783183-127783233 249 chr2 232530964-232531124 MAX.chr2.232530964-232531124 250 chr2 239957125-239957163 MAX.chr2.239957125-239957163 251 chr2 43153331-43153424 MAX.chr2.43153331-43153424 252 chr2 71503632-71503860 MAX.chr2.71503632-71503860 253 chr20 43948422-43948484 MAX.chr20.43948422-43948484 254 chr21 47063798-47063877 MAX.chr21.47063798-47063877 255 chr22 17849540-17849622 MAX.chr22.17849540-17849622 256 chr22 38732124-38732211 MAX.chr22.38732124-38732211 257 chr22 42764974-42765049 MAX.chr22.42764974-42765049 258 chr22 46974925-46975007 MAX.chr22.46974925-46975007 (c o n tin u a c io n )
N.° marcador Cromosoma Coordenadas del cromosoma Anotacion
259 chr22 50342922-50343232 MAX.chr22.50342922-50343232 260 chr3 132273353-132273532 MAX.chr3.132273353-132273532 261 chr3 193858771-193858843 MAX.chr3.193858771-193858843 262 chr3 24563009-24563117 MAX.chr3.24563009-24563117 263 chr3 75411368-75411473 MAX.chr3.75411368-75411473 264 chr4 26828422-26828522 MAX.chr4.26828422-26828522 265 chr4 8965831-8965868 MAX.chr4.8965831-8965868 266 chr5 142100518-142100780 MAX.chr5.142100518-142100780 267 chr6 169613138-169613249 MAX.chr6.169613138-169613249 268 chr6 64168133-64168268 MAX.chr6.64168133-64168268 269 chr7 129794337-129794536 MAX.chr7.129794337-129794536 270 chr7 1705957-1706065 MAX.chr7.1705957-1706065 271 chr7 28893550-28893569 MAX.chr7.28893550-28893569 272 chr7 47650711-47650882 MAX.chr7.47650711-47650882 273 chr7 64408106-64408135 MAX.chr7.64408106-64408135 274 chr9 108418404-108418453 MAX.chr9.108418404-108418453 275 chr9 120507310-120507354 MAX.chr9.120507310-120507354 276 chr5 89769002-89769411 MBLAC2
277 chr12 51319165-51319319 METTL7A
278 chr2 191272534-191272765 MFSD6
279 chr19 6236947-6237089 MLLT1
280 chr6 168333306-168333467 MLLT4
281 chr8 89339567-89339662 MMP16
282 chr17 2300399-2300476 MNT
283 chr7 156802460-156802490 MNX1
284 chr19 4343896-4242968 MPND
285 chr16 56715756-56716025 MT1X
286 chr15 48470062-48470503 MYEF2
287 chr15 48470606-48470725 MYEF2
288 chr5 16936010-16936058 MYO10
289 chr3 39851068-39851989 MYRIP
290 chr13 33001061-33001251 N4BP2L1
291 chr4 2060477-2060624 NAT8L
292 chr12 125002129-125002192 NCOR2
293 chr16 23607524-23607650 NDUFAB1
294 chr10 105338596-105338843 NEURL
295 chr1 204797773-204797785 NFASC
296 chr2 233877877-233878027 NGEF
297 chr18 31803017-31803114 NOL4
298 chr9 139438534-139438629 NOTCH1
299 chr5 32714270-32714325 NPR3
300 chr9 127266951-127267032 NR5A1
301 chr11 124615979-124616029 NRGN
302 chr11 124616860-124617005 NRGN
303 chr20 327754-327871 NRSN2
304 chr8 99952501-99952533 OSR2
305 chr5 76926598-76926703 OTP
306 chr3 8809858-8809865 OXTR
307 chr19 14172823-14172948 PALM3
308 chr6 52268531-52268702 PAQR8
(c o n tin u a c io n )
N.° marcador Cromosoma Coordenadas del cromosoma Anotacion 309 chr20 21686466-21686563 PAX1 310 chr21 47063793-47064177 PCBP3 311 chr7 100203461-100203600 PCOLCE 312 chr4 657555-657666 PDE6B 313 chr7 544848-545022 PDGFA 314 chr2 239194812-239194946 PER2 315 chr19 43979400-43979435 PHLDB3 316 chr6 144384503-144385539 PLAGL1 317 chr2 28844174-28844270 PLB1 318 chr1 242687719-242687746 PLD5 319 chr12 6419210-6419489 PLEKHG6 320 chr22 50745629-50745727 PLXNB2 321 chr2 105471752-105471787 POU3F3 322 chr13 79177868-79177951 POU4F1 323 chr1 203044913-203044929 PPFIA4 324 chr22 50825886-50825981 PPP6R2 325 chr17 74519328-74519457 PRCD 326 chr7 601162-601552 PRKAR1B 327 chr16 23846964-23847339 PRKCB 328 chr16 23847507-23847617 PRKCB 329 chr16 23847825-23848168 PRKCB 330 chr22 18923785-18923823 PRODH 331 chr22 45099093-45099304 PRR5 332 chr3 9988302-9988499 PRRT3 333 chr1 11538685-11538738 PTCHD2 334 chr1 11539396-11539540 PTCHD2 335 chr10 23480864-23480913 PTF1A 336 chr19 5340273-5340743 PTPRS 337 chr2 1747034-1747126 PXDN 338 chr2 1748338-1748444 PXDN 339 chr7 4923056-4923107 RADIL 340 chr19 15568448-15568639 RASAL3 341 chr5 80256215-80256313 RASGRF2 342 chr17 77179784-77179887 RBFOX3 343 chr4 40516823-40516984 RBM47 344 chr4 57775698-57775771 REST 345 chr10 43572798-43572896 RET 346 chr10 121302439-121302501 RGS10 347 chr16 318717-318893 RGS11 348 chr1 241520322-241520334 RGS7 349 chr1 42846119-42846174 RIMKLA 350 chr21 43189031-43189229 RIPK4 351 chr7 5821188-5821283 RNF216 352 chr19 23941063-23941142 RPSAP58 353 chr19 23941384-23941670 RPSAP58 354 chr16 29118636-29118891 RRN3P2 355 chr6 127440492-127441039 RSPO3 356 chr17 42392669-42392701 RUNDC3A 357 chr6 45345446-45345595 RUNX2 358 chr6 45387405-45387456 RUNX2 (c o n tin u a c io n )
N.° marcador Cromosoma Coordenadas del cromosoma Anotacion 359 chr3 72496092-72496361 RYBP 360 chr22 20785373-20785464 SCARF2 361 chr8 145561664-145561696 SCRT1 362 chr7 54826636-54826706 SEC61G 363 chr10 38691448-38691521 SEPT7L 364 chr4 154712157-154712232 SFRP2 365 chr7 155597793-155597973 SHH 366 chr4 77610781-77610824 SHROOM3 367 chr21 38120336-38120558 SIM2 368 chr15 68115602-68115675 SKOR1 369 chr17 6949717-6949778 SLC16A11 370 chr11 35441199-35441260 SLC1A2 371 chr19 59025337-59025385 SLC27A5 372 chr2 27486089-27486170 SLC30A3 373 chr12 69140018-69140206 SLC35E3 374 chr12 46661132-46661306 SLC38A1 375 chr3 50243467-50243553 SLC38A3 376 chr7 150760388-150760530 SLC4A2 377 chr5 1445384-1445473 SLC6A3 378 chr2 40679298-40679326 SLC8A1 379 chr5 506178-506343 SLC9A3 380 chr20 61284095-61284194 SLCO4A1 381 chr5 101631546-101631731 SLCO4C1 382 chr10 98945242-98945493 SLIT1 383 chr13 88330094-88330355 SLITRK5 384 chr15 66999854-67000014 SMAD6 385 chr10 112064230-112064280 SMNDC1 386 chr6 84419007-84419072 SNAP91 387 chr17 36508733-36508891 SOCS7 388 chr4 7367687-7367825 SORCS2 389 chr17 70116754-70116823 SOX9 390 chr4 57687746-57687764 SPINK2 391 chr3 140770014-140770193 SPSB4 392 chr17 36762706-36762763 SRCIN1 393 chr6 43141954-43142058 SRF 394 chr7 105029460-105029585 SRPK2 395 chr16 70415312-70415673 ST3GAL2 396 chr2 107502978-107503055 ST6GAL2 397 chr2 107503155-107503391 ST6GAL2 398 chr12 22487528-22487848 ST8SIA1 399 chr10 17496177-17496310 ST8SIA6 400 chr2 242447608-242447724 STK25 401 chr3 120626999-120627116 STXBP5L 402 chr3 33260338-33260423 SUSD5 403 chr16 19179713-19179744 SYT17 404 chr12 115122614-115122632 TBX3 405 chr19 3606372-3606418 TBXA2R 406 chr10 70359250-70359439 TET1 407 chr16 4310204-4310233 TFAP4 408 chr21 32930371-32930409 TIAM1 (c o n tin u a c io n )
N.° marcador Cromosoma Coordenadas del cromosoma Anotacion
409 chr4 942190-942382 TMEM175
410 chr6 130686773-130686820 TMEM200a
411 chr6 130687200-130687735 TMEM200a
412 chr3 185215700-185215782 TMEM41A
413 chr20 42544780-42544835 TOX2
414 chr9 140091343-140091644 TPRN
415 chr8 126441476-126441519 TRIB1
416 chr5 14143759-14143880 TRIO
417 chr22 38148620-38148716 TRIOBP
418 chr7 19156788-19157227 TWIST 1
419 chr7 19157436-19157533 TWIST 1
420 chr4 41259387-41259594 UCHL1
421 chr15 63795401-63795636 USP3
422 chr17 9548120-9548325 USP43
423 chr12 95942077-95942558 USP44
424 chr10 17271896-17271994 VIM
425 chr7 49813135-49814168 VWC2
426 chr7 151078646-151078674 WDR86
427 chr12 49372205-49372274 WNT1
428 chr11 32460759-32460800 WT1
429 chr19 4061206-4061360 ZBTB7A
430 chr8 144623045-144623088 ZC3H3
431 chr2 145274698-145274874 ZEB2
432 chr19 38146299-38146397 ZFP30
433 chr16 88521287-88521377 ZFPM1
434 chr4 2298384-2298498 ZFYVE28
435 chr4 2415252-2415286 ZFYVE28
436 chr20 45986341-45986684 ZMYND8
437 chr22 22862957-22862983 ZNF280B
438 chr6 43336449-43336545 ZNF318
439 chr19 53661819-53662279 ZNF347
440 chr16 88497041-88497148 ZNF469
441 chr19 57019064-57019137 ZNF471
442 chr19 2842178-2842235 ZNF555
443 chr19 37958078-37958134 ZNF570
444 chr8 125985552-125985847 ZNF572
445 chr19 53696101-53696195 ZNF665
446 chr19 53696497-53696704 ZNF665
447 chr19 20149796-20149923 ZNF682
448 chr19 57106617-57106967 ZNF71
449 chr7 6655380-6655652 ZNF853
En la Tabla 10, las bases se numeraron segun el conjunto del genoma humano, de febrero de 2009, GRCh37/hg19 (vease, por ejemplo, Rosenbloom y col. (2012) "ENCODE whole-genome data in the UCSC Genome Browser: actualizacion 20l2" Nucleic Acids Research 40: D912-D917). Los marcadores con nombres BHLHE23 y LOC63930 se refieren al mismo marcador.
Tabla 11.
Cromosoma Coordenadas del Anotacion Area bajo la curva COR cromosoma
chr12 53298237-53298384 KRT8 1,00
(c o n tin u a c io n )
C ro m o so m a C o o rd e n a d a s del A n o ta c io n A re a ba jo la cu rva C O R cro m o so m a
chr7 129794337-129794536 MAX.chr7.129794337-129794536 1,00
chr10 101282185-101282257 MAX.chr10.101282185-101282257 0,99
chr10 126812450-126812653 CTBP2 0,99
chr9 116151083-116151315 ALAD 0,99
chr8 13014567-13014682 DLC1 0,99
chr7 139440133-139440341 HIPK2 0,99
chr3 39851068-39851989 MYRIP 0,99
chr19 4061206-4061360 ZBTB7A 0,99
chr16 84875643-84875772 CRISPLD2 0,99
chr6 52268531-52268702 PAQR8 0,99
chr2 239194812-239194946 PER2 0,99
chr17 1835463-1835690 MAX.chr17.1835463-1835690 0,99
chr5 506178-506343 SLC9A3 0,99
chr20 31061389-31061649 C20orf112 0,98
chr9 139438534-139438629 NOTCH1 0,98
chr15 48470606-48470725 MYEF2 0,98
chr12 125002129-125002192 NCOR2 0,98
chr4 7367687-7367825 SORCS2 0,98
chr19 6236947-6237089 MLLT1 0,98
chr7 544848-545022 PDGFA 0,98
chr7 98029116-98029383 BAIAP2L1 0,98
chr4 2415252-2415286 ZFYVE28 0,98
chr12 6419210-6419489 PLEKHG6 0,98
chr22 50825886-50825981 PPP6R2 0,97
chr20 45986341-45986684 ZMYND8 0,97
chr5 142100518-142100780 MAX.chr5.142100518-142100780 0,97
chr19 16473958-16474095 EPS15L1 0,97
chr16 29118636-29118891 RRN3P2 0,97
chr6 75794978-75795024 COL12A1 0,97
chr9 139735581-139735683 C9orf172 0,97
chr17 4462834-4463034 GGT6 0,97
chr17 4463796-4464037 GGT6 0,96
chr12 95942077-95942558 USP44 0,96
chr20 42984244-42984427 HNF4A 0,96
chr7 47650711-47650882 MAX.chr7.47650711-47650882 0,96
chr4 942190-942382 TMEM175 0,96
chr7 73245708-73245798 CLDN4 0,96
chr22 46974925-46975007 MAX.chr22.46974925-46975007 0,96
chr10 127033272-127033428 MAX.chr10.127033272-127033428 0,96
chr3 132273353-132273532 MAX.chr3.132273353-132273532 0,96
chr4 26828422-26828522 MAX.chr4.26828422-26828522 0,96
chr20 61284095-61284194 SLCO4A1 0,96
chr19 35540057-35540200 HPN 0,96
chr22 45099093-45099304 PRR5 0,95
chr17 60218266-60218449 MAX.chr17.60218266-60218449 0,95
chr6 168333306-168333467 MLLT4 0,95
chr10 105338596-105338843 NEURL 0,95
chr9 120175665-120176057 ASTN2 0,95
(continuacion)
Cromosoma Coordenadas del Anotacion Area bajo la curva COR cromosoma
chr4 183817058-183817157 DCTD 0,95
chr6 108882636-108882682 FOXO3 0,95
chr7 27136030-27136245 HOXA1 0,95
chr19 14172823-14172948 PALM3 0,95
chr3 75411368-75411473 MAX.chr3.75411368-75411473 0,94
chr6 64168133-64168268 MAX.chr6.64168133-64168268 0,94
chr16 318717-318893 RGS11 0,94
chr20 43040031-43040119 HNF4A 0,94
chr7 49813135-49814168 VWC2 0,94
chr16 85230248-85230405 MAX.chr16.85230248-85230405 0,94
chr22 38148620-38148716 TRIOBP 0,94
chr5 89769002-89769411 MBLAC2 0,94
chr1 158150797-158151205 CD1D 0,93
chr19 1406516-1406625 DAZAP1 0,93
chr12 121416542-121416670 HNF1A 0,93
chr17 76337726-76337824 MAX.chr17.76337726-76337824 0,93
chr13 88330094-88330355 SLITRK5 0,93
chr19 54974004-54974086 LENG9 0,93
chr22 47130339-47130459 CERK 0,92
chr7 601162-601552 PRKAR1B 0,92
chr2 70994498-70994755 ADD2 0,92
chr15 40361431-40361644 MAX.chr15.40361431-40361644 0,92
chr19 15568448-15568639 RASAL3 0,92
chr6 24776486-24776667 GMNN 0,92
chr18 449695-449798 COLEC12 0,92
chr7 150760388-150760530 SLC4A2 0,92
chr21 38120336-38120558 SIM2 0,91
chr15 66999854-67000014 SMAD6 0,91
chr2 28844174-28844270 PLB1 0,91
chr11 115373179-115373281 CADM1 0,91
chr21 47063793-47064177 PCBP3 0,91
chr2 1748338-1748444 PXDN 0,91
chr21 47063798-47063877 MAX.chr21.47063798-47063877 0,91
chr16 56715756-56716025 MT1X 0,90
chr4 87934353-87934488 AFF1 0,90
chr9 140091343-140091644 TPRN 0,90
chr5 15500208-15500399 FBXL7 0,90
chr19 48833763-48833967 EMP3 0,90
chr6 43141954-43142058 SRF 0,90
chr3 185215700-185215782 TMEM41A 0,90
chr1 160983607-160983768 F11R 0,90
chr12 58259413-58259475 MAX.chr12.58259413-58259475 0,90
chr2 47797260-47797371 KCNK12 0,89
chr16 4377510-4377615 GLIS2 0,89
chr15 63795401-63795636 USP3 0,89
chr13 33001061-33001251 N4BP2L1 0,89
chr3 120626999-120627116 STXBP5L 0,89
chr7 19156788-19157227 TWIST1 0,89
chr18 46190841-46190970 KIAA0427 0,89
(continuacion)
Cromosoma Coordenadas del Anotacion Area bajo la curva COR cromosoma
chr7 100203461-100203600 PCOLCE 0,88
chr19 51228217-51228732 CLEC11A 0,88
chr19 17438929-17438974 ANO8 0,88
chr12 2800756-2800899 CACNA1C 0,88
chr6 34205664-34206018 HMGA1 0,88
chr15 76632356-76632462 ISL2 0,88
chr6 111873064-111873162 LOC643749 0,88
chr10 70359250-70359439 TET1 0,88
chr2 39665069-39665282 MAP4K3 0,88
chr2 43153331-43153424 MAX.chr2.43153331 -43153424 0,87
chr22 17849540-17849622 MAX.chr22.17849540-17849622 0,87
chr2 233877877-233878027 NGEF 0,87
chr8 89339567-89339662 MMP16 0,87
chr13 46960767-46961669 C13orf18 0,87
chr6 170598276-170598782 DLL1 0,87
chr4 40516823-40516984 RBM47 0,87
chr3 139654045-139654132 CLSTN2 0,87
chr2 27486089-27486170 SLC30A3 0,87
chr17 74519328-74519457 PRCD 0,86
chr2 163174366-163174659 IFIH1 0,86
chr4 41259387-41259594 UCHL1 0,86
chr7 45613877-45614572 ADCY1 0,86
chr7 98990897-98990989 ARPC1B 0,86
chr3 54156904-54156987 CACNA2D3 0,86
chr16 49316205-49316258 CBLN1 0,86
chr3 71478053-71478206 FOXP1 0,86
chr5 87956937-87956996 LOC645323 0,86
chr21 43189031-43189229 RIPK4 0,86
chr12 22487528-22487848 ST8SIA1 0,86
chr20 42544780-42544835 TOX2 0,86
chr20 821836-821871 FAM110A 0,86
chr16 4310204-4310233 TFAP4 0,86
chr11 64110001-64110069 CCDC88B 0,85
chr8 136469529-136469873 KHDRBS3 0,85
chr10 102985059-102985130 FLJ41350 0,85
chr2 176971915-176971968 HOXD11 0,85
chr12 51319165-51319319 METTL7A 0,85
chr22 50342922-50343232 MAX.chr22.50342922-50343232 0,85
chr7 155597793-155597973 SHH 0,85
chr4 154712157-154712232 SFRP2 0,84
chr19 57019064-57019137 ZNF471 0,84
chr5 87970260-87970568 LOC645323 0,84
chr6 130686773-130686820 TMEM200a 0,84
chr9 140201493-140201583 EXD3 0,84
chr12 53447992-53448072 LOC283335 0,84
chr22 43044555-43044737 CYB5R3 0,84
chr19 49256413-49256451 FGF21 0,84
chr17 77810085-77810206 CBX4 0,84
chr7 156802460-156802490 MNX1 0,84
(continuacion)
Cromosoma Coordenadas del Anotacion Area bajo la curva COR cromosoma
chr7 151127086-151127195 CRYGN 0,83
chr6 169613138-169613249 MAX.chr6.169613138-169613249 0,83
chr2 71503632-71503860 MAX.chr2.71503632-71503860 0,83
chr20 21686466-21686563 PAX1 0,83
chr2 173293542-173293644 ITGA6 0,83
chr7 87229775-87229856 ABCB1 0,83
chr2 207307687-207307794 ADAM23 0,83
chr12 21680381-21680438 C12orf39 0,83
chr15 89942904-89943197 MAX.chr15.89942904-89943197 0,83
chr10 43572798-43572896 RET 0,83
chr19 5805881-5805968 MAX.chr19.5805881-5805968 0,83
chr19 53661819-53662279 ZNF347 0,83
chr22 38732124-38732211 MAX.chr22.38732124-38732211 0,83
chr11 124615979-124616029 NRGN 0,83
chr2 100720494-100720679 AFF3 0,83
chr19 497878-497933 MADCAM1 0,82
chr5 14143759-14143880 TRIO 0,82
chr18 32073971-32074004 DTNA 0,82
chr15 48470062-48470503 MYEF2 0,82
chr3 50243467-50243553 SLC38A3 0,82
chr16 70415312-70415673 ST3GAL2 0,82
chr11 35441199-35441260 SLC1A2 0,82
chr12 51786085-51786218 GALNT6 0,82
chr2 232530964-232531124 MAX.chr2.232530964-232531124 0,81
chr22 19710910-19710984 GP1BB 0,81
chr19 2097386-2097437 IZUMO4 0,81
chr11 20178177-20178304 DBX1 0,81
chr7 37487539-37488596 ELMO1 0,81
chr11 128564106-128564209 FLI1 0,81
chr7 105029460-105029585 SRPK2 0,81
chr10 103538848-103539033 FGF8 0,81
chr11 124616860-124617005 NRGN 0,81
chr19 57106617-57106967 ZNF71 0,81
chr9 97401449-97401602 FBP1 0,81
chr5 113696971-113697058 KCNN2 0,80
chr19 53696497-53696704 ZNF665 0,80
chr1 45769962-45770141 LOC400752 0,80
chr14 91883473-91883674 CCDC88C 0,80
chr17 43324999-43325188 LOC100133991 0,80
chr16 23846964-23847339 PRKCB 0,80
chr19 11805543-11805639 MAX.chr19.11805543-11805639 0,80
chr12 117174873-117175030 C12orf49 0,80
chr20 39995010-39995051 EMILIN3 0,80
chr5 87970751-87970850 LOC645323 0,80
chr7 4923056-4923107 RADIL 0,80
chr19 23941063-23941142 RPSAP58 0,80
chr6 45387405-45387456 RUNX2 0,80
chr17 6949717-6949778 SLC16A11 0,80
chr2 165477564-165477609 GRB14 0,80
(c o n tin u a c io n )
C ro m o so m a C o o rd e n a d a s del A n o ta c io n A re a ba jo la cu rva C O R cro m o so m a
chr20 34189488-34189693 FER1L4 0,80
chr22 50745629-50745727 PLXNB2 0,79
chr7 155302557-155302639 CNPY1 0,79
chr7 19157436-19157533 TWIST1 0,79
chr1 203619509-203619829 ATP2B4 0,79
chr2 230578698-230578802 DNER 0,79
chr19 23941384-23941670 RPSAP58 0,79
chr17 73390467-73390597 GRB2 0,79
chr15 68115602-68115675 SKOR1 0,79
chr17 2300399-2300476 MNT 0,79
chr13 79177868-79177951 POU4F1 0,79
chr19 59025337-59025385 SLC27A5 0,79
chr9 135462730-135462765 BARHL1 0,78
chr8 125985552-125985847 ZNF572 0,78
chr5 175665232-175665311 C5orf25 0,78
chr6 42858890-42859092 C6orf226 0,78
chr12 21680681-21680817 C12orf39 0,78
chr14 50099743-50099930 C14orf104 0,78
chr5 175969660-175969699 CDHR2 0,78
chr16 80837397-80837505 CDYL2 0,78
chr19 12996198-12996321 DNASE2 0,78
chr13 28674451-28674629 FLT3 0,78
chr1 154733071-154733232 KCNN3 0,78
chr1 35395179-35395201 MAX.chrl .35395179-35395201 0,78
chr19 5340273-5340743 PTPRS 0,78
chr3 33260338-33260423 SUSD5 0,78
chr2 145274698-145274874 ZEB2 0,78
chr13 25322044-25322165 MAX.chr13.25322044-25322165 0,78
chr2 80530326-80530374 CTNNA2 0,78
chr12 56881329-56881414 GLS2 0,78
chr3 24563009-24563117 MAX.chr3.24563009-24563117 0,78
chr7 6655380-6655652 ZNF853 0,78
chr4 2298384-2298498 ZFYVE28 0,77
chr5 177632203-177632260 HNRNPAB 0,77
chr22 19711364-19711385 GP1BB 0,77
chr2 165477839-165477886 GRB14 0,77
chr13 29394692-29394771 MAX.chr13.29394692-29394771 0,77
chr14 103396870-103396920 AMN 0,77
chr12 132435207-132435428 EP400 0,77
chr8 99439457-99439482 KCNS2 0,77
chr7 5821188-5821283 RNF216 0,77
chr17 9548120-9548325 USP43 0,77
chr3 185825887-185826002 ETV5 0,77
chr12 121905558-121905792 KDM2B 0,77
chr3 193858771-193858843 MAX.chr3.193858771-193858843 0,77
chr19 53696101-53696195 ZNF665 0,77
chr7 69062853-69062972 AUTS2 0,77
chr1 242687719-242687746 PLD5 0,76
chr20 43948422-43948484 MAX.chr20.43948422-43948484 0,76
(c o n tin u a c io n )
C ro m o so m a C o o rd e n a d a s del A n o ta c io n A re a ba jo la cu rva C O R cro m o so m a
chr6 84419007-84419072 SNAP91 0,76
chr17 43325784-43325960 LOC100133991 0,76
chr19 41224781-41225006 ADCK4 0,76
chr5 15500663-15500852 FBXL7 0,76
chr20 20350520-20350532 INSM1 0,76
chr1 23894874-23894919 MAX.chr1.23894874-23894919 0,76
chr1 11538685-11538738 PTCHD2 0,76
chr14 105190863-105191031 ADSSL1 0,76
chr22 22862957-22862983 ZNF280B 0,76
chr17 72350351-72350403 KIF19 0,76
chr7 50343838-50344029 IKZF1 0,76
chr2 191272534-191272765 MFSD6 0,76
chr17 47073421-47073440 IGF2BP1 0,76
chr10 133795124-133795423 BNIP3 0,75
chr5 101631546-101631731 SLCO4C1 0,75
chr12 133485702-133485739 MAX.chr12.133485702-133485739 0,75
chr22 18923785-18923823 PRODH 0,75
chr20 56089440-56089547 CTCFL 0,75
chr6 43336449-43336545 ZNF318 0,75
chr14 61123624-61123707 MAX.chr14.61123624-61123707 0,75
chr7 30721980-30722020 CRHR2 0,75
chr17 7339280-7339492 FGF11 0,75
chr11 84432067-84432186 DLG2 0,75
chr2 233352345-233352605 ECEL1 0,75
chr3 27763358-27763617 EOMES 0,75
chr5 160975098-160975142 GABRB2 0,75
chr1 244012804-244012986 MAX.chr1.244012804-244012986 0,75
chr16 25042924-25043187 MAX.chr16.25042924-25043187 0,75
chr4 57775698-57775771 REST 0,75
chr6 127440492-127441039 RSPO3 0,75
chr8 145561664-145561696 SCRT1 0,75
chr8 144623045-144623088 ZC3H3 0,75
chr12 48398051-48398093 COL2A1 0,75
chr2 182321880-182322022 ITGA4 0,75
chr9 120507310-120507354 MAX.chr9.120507310-120507354 0,74
chr6 133562127-133562229 EYA4 0,74
chr2 127783183-127783233 MAX.chr2.127783183-127783233 0,74
chr11 47421719-47421776 MAX.chr11.47421719-47421776 0,74
chr19 10206736-10206757 ANGPTL6 0,74
chr2 225907414-225907537 DOCK10 0,74
chr1 35394690-35394876 MAX.chr1.35394690-35394876 0,74
chr4 2060477-2060624 NAT8L 0,74
chr2 1747034-1747126 PXDN 0,74
chr6 45345446-45345595 RUNX2 0,74
chr7 50344414-50344453 IKZF1 0,74
chr1 180198528-180198542 LHX4 0,74
chr14 53417493-53417618 FERMT2 0,74
chr17 77179784-77179887 RBFOX3 0,74
chr10 98945242-98945493 SLIT1 0,74
(continuacion)
Cromosoma Coordenadas del Anotacion Area bajo la curva COR cromosoma
chr2 40679298-40679326 SLC8A1 0,74
chr12 48398306-48398375 COL2A1 0,74
chr22 50987245-50987312 KLHDC7B 0,73
chr12 54151078-54151153 MAX.chr12.54151078-54151153 0,73
chr7 28893550-28893569 MAX.chr7.28893550-28893569 0,73
chr10 38691448-38691521 SEPT7L 0,73
chr1 203044913-203044929 PPFIA4 0,73
chr22 51066374-51066431 ARSA 0,73
chr7 113724864-113725006 FOXP2 0,73
chr12 13254503-13254606 GSG1 0,73
chr11 19733958-19734013 LOC100126784 0,73
chr1 39044345-39044354 MAX.chr1.39044345-39044354 0,73
chr3 9988302-9988499 PRRT3 0,73
chr22 20785373-20785464 SCARF2 0,73
chr6 130687200-130687735 TMEM200a 0,73
chr12 46661132-46661306 SLC38A1 0,73
chr19 20149796-20149923 ZNF682 0,73
chr11 133797643-133797789 IGSF9B 0,73
chr2 105471752-105471787 POU3F3 0,72
chr5 179780839-179780955 GFPT2 0,72
chr8 99952501-99952533 OSR2 0,72
chr19 16772631-16772712 C19orf42 0,72
chr2 119607676-119607765 EN1 0,72
chr12 49372205-49372274 WNT1 0,72
chr5 113696524-113696682 KCNN2 0,72
chr17 8649567-8649665 CCDC42 0,72
chr7 1705957-1706065 MAX.chr7.1705957-1706065 0,71
chr2 149633039-149633137 KIF5C 0,71
chr19 2842178-2842235 ZNF555 0,71
chr10 121302439-121302501 RGS10 0,71
chr21 44495919-44495933 CBS 0,71
chr10 11059508-11060151 CELF2 0,71
chr19 48946755-48946912 GRIN2D 0,71
chr12 133484978-133485066 MAX.chr12.133484978-133485066 0,71
chr5 16936010-16936058 MYO10 0,71
chr17 42392669-42392701 RUNDC3A 0,71
chr16 88521287-88521377 ZFPM1 0,71
chr4 37245694-37245718 KIAA1239 0,71
chr16 23847507-23847617 PRKCB 0,71
chr5 76926598-76926703 OTP 0,71
chr18 31803017-31803114 NOL4 0,71
chr2 182322168-182322198 ITGA4 0,70
chr15 90358267-90358400 ANPEP 0,70
chr12 107715014-107715095 BTBD11 0,70
chr16 89007413-89007432 CBFA2T3 0,70
chr4 151000325-151000356 DCLK2 0,70
chr6 152129293-152129450 ESR1 0,70
chr19 38146299-38146397 ZFP30 0,70
chr1 204797773-204797785 NFASC 0,70
(continuacion)
Cromosoma Coordenadas del Anotacion Area bajo la curva COR cromosoma
chr22 42764974-42765049 MAX.chr22.42764974-42765049 0,70
chr2 165698520-165698578 COBLL1 0,70
chr8 144358251-144358266 GL14 0,70
chr2 219261190-219261327 CTDSP1 0,70
chr2 239957125-239957163 MAX.chr2.239957125-239957163 0,70
chr10 121411207-121411375 BAG3 0,69
chr2 233389020-233389049 CHRND 0,69
chr14 99946756-99946806 CCNK 0,69
chr11 120382450-120382498 MAX.chr11.120382450-120382498 0,69
chr16 750679-750715 FBXL16 0,69
chr15 100881373-100881437 ADAMTS17 0,69
chr1 11539396-11539540 PTCHD2 0,69
chr2 242447608-242447724 STK25 0,69
chr16 23847825-23848168 PRKCB 0,69
chr17 42907549-42907807 GJC1 0,69
chr19 48918266-48918311 GRIN2D 0,69
chr10 79397895-79397945 KCNMA1 0,69
chr5 71404528-71404563 MAP1B 0,69
chr19 43979400-43979435 PHLDB3 0,69
chr17 70116754-70116823 SOX9 0,69
chr16 88497041-88497148 ZNF469 0,69
chr2 131485151-131485219 GPR148 0,69
chr8 126441476-126441519 TRIB1 0,68
chr4 151000358-151000403 DCLK2 0,68
chr19 39989824-39989852 DLL3 0,68
chr14 89507100-89507162 MAX.chr14.89507100-89507162 0,68
chr12 115122614-115122632 TBX3 0,68
chr19 58513829-58513851 LOC100128398 0,68
chr5 32714270-32714325 NPR3 0,68
chr3 140770014-140770193 SPSB4 0,68
chr6 88875699-88875763 CNR1 0,68
chr4 657555-657666 PDE6B 0,68
chr16 19179713-19179744 SYT17 0,67
chr3 8809858-8809865 OXTR 0,67
chr10 116064516-116064600 AFAP1L2 0,67
chr4 77610781-77610824 SHROOM3 0,67
chr6 88876367-88876445 CNR1 0,67
chr7 151078646-151078674 WDR86 0,67
chr2 109745715-109745742 LOC100287216 0,67
chr14 100751586-100751695 MAX.chr14.100751586-100751695 0,67
chr21 32930371-32930409 TIAM1 0,67
chr4 57687746-57687764 SPINK2 0,67
chr2 219849962-219850042 FEV 0,66
chr20 327754-327871 NRSN2 0,66
chr1 178063099-178063167 LOC100302401 0,66
chr19 45430362-45430458 APOC1P1 0,66
chr13 111767862-111768355 ARHGEF7 0,66
chr19 37958078-37958134 ZNF570 0,66
chr19 32715650-32715707 MAX.chr19.32715650-32715707 0,66
(continuacion)
Cromosoma Coordenadas del Anotacion Area bajo la curva COR cromosoma
chr8 104152963-104152974 BAALC 0,66
chr19 3095019-3095055 GNA11 0,66
chr19 3606372-3606418 TBXA2R 0,66
chr12 69140018-69140206 SLC35E3 0,66
chr4 8965831-8965868 MAX.chr4.8965831-8965868 0,66
chr17 36508733-36508891 SOCS7 0,66
chr16 85646495-85646594 KIAA0182 0,65
chr7 54826636-54826706 SEC61G 0,65
chr9 108418404-108418453 MAX.chr9.108418404-108418453 0,65
chr7 64408106-64408135 MAX.chr7.64408106-64408135 0,65
chr10 21816267-21816490 C10orf140 0,65
chr7 39989959-39990020 CDK13 0,65
chr1 240255240-240255264 FMN2 0,65
chr13 114018369-114018421 GRTP1 0,65
chr13 88323571-88323647 LOC642345 0,65
chr5 80256215-80256313 RASGRF2 0,65
chr10 112064230-112064280 SMNDC1 0,65
chr12 85430135-85430175 LRRIQ1 0,65
chr1 241520322-241520334 RGS7 0,65
chr19 22034747-22034887 MAX.chr1 9.22034747-22034887 0,65
chr21 27011846-27011964 JAM2 0,65
chr11 64052053-64052132 BAD 0,65
chr1 42846119-42846174 RIMKLA 0,64
chr10 17271896-17271994 VIM 0,64
chr13 52378159-52378202 DHRS12 0,63
chr3 27763909-27763981 EOMES 0,63
chr7 100136884-100137350 AGFG2 0,62
chr6 88876701-88876726 CNR1 0,62
chr19 2290471-2290541 LINGO3 0,62
chr6 105584524-105584800 BVES 0,61
chr16 23607524-23607650 NDUFAB1 0,61
chr11 64008415-64008495 FKBP2 0,60
chr20 3641457-3641537 GFRA4 0,59
chr19 4343896-4242968 MPND 0,59
chr2 107503155-107503391 ST6GAL2 0,59
chr1 240161479-240161546 MAXchr1.240161479-240161546 0,57
chr6 144384503-144385539 PLAGL1 0,57
chr3 72496092-72496361 RYBP 0,57
chr5 131132146-131132232 FNIP1 0,55
chr17 36762706-36762763 SRCIN1 0,55
chr11 32460759-32460800 WT1 0,55
chr9 127266951-127267032 NR5A1 0,53
chr7 44084171-44084235 DBNL 0,46
chr15 29131299-29131369 APBA2 0,44
chr5 114880375-114880442 FEM1C 0,44
chr19 34287890-34287972 KCTD15 0,44
chr16 77468655-77468742 ADAMTS18
chr22 45898798-45898888 FBLN1
chr7 113727624-113727693 FOXP2

Claims (12)

REIVINDICACIONES
1. procedimiento para cribar una neoplasia en una muestra obtenida de un sujeto, comprendiendo el procedimiento: 1) analizar el estado de metilacion de un marcador en una muestra obtenida de un sujeto; y
2) identificar el sujeto que tiene una neoplasia cuando el estado de metilacion del marcador es diferente de un estado de metilacion del marcador analizado en un sujeto que no tiene una neoplasia,
en el que una region cromosomica que tiene una anotacion CLEC11A comprende el marcador,
en el que el marcador comprende una base en una region metilada de manera diferencial (DMR) seleccionada entre DMR 29 o 30 de la Tabla 1, o DMR 64 de la Tabla 10,
en el que la neoplasia es una neoplasia gastrointestinal, una neoplasia del pancreas, una neoplasia colorrectal, una neoplasia del estomago, o una neoplasia del esofago.
2. El procedimiento de la reivindicacion 1, que comprende ademas localizar el sitio de la neoplasia en el sujeto, en el que el estado de metilacion del marcador indica el sitio de la neoplasia en el sujeto.
3. El procedimiento de la reivindicacion 1, en el que la neoplasia esta presente en la region gastrointestinal superior del paciente o en la region gastrointestinal inferior del paciente.
4. procedimiento de la reivindicacion 1 que comprende analizar una pluralidad de marcadores.
5. procedimiento de la reivindicacion 1 en el que analizar el estado de metilacion del marcador en la muestra comprende determinar el estado de metilacion de una o mas bases.
6. procedimiento de la reivindicacion 1 en el que el estado de metilacion del marcador comprende una metilacion aumentada o disminuida del marcador con respecto a un estado de metilacion del marcador normal o un patron de metilacion diferente del marcador con respecto a un estado de metilacion normal del marcador.
7. procedimiento de la reivindicacion 1, en el que la muestra es una muestra de heces, una muestra de tejido, una muestra de jugo pancreatico, una muestra de fluido de un quiste pancreatico, una muestra de sangre, o una muestra de orina.
8. procedimiento de la reivindicacion 1, en el que el ensayo comprende usar la reaccion en cadena de la polimerasa especffica de metilacion, secuenciacion de acidos nucleicos, espectrometrfa de masas, nucleasa especffica de metilacion, separacion por masas, o captura de la diana.
9. procedimiento de la reivindicacion 1, en el que el ensayo comprende usar un oligonucleotido especffico de la metilacion seleccionado de la SEQ ID NO: 47 o la SEQ ID NO: 48.
10. procedimiento de la reivindicacion 1 en el que la DMR es la DMR N.° 29 o 30 de la Tabla 1.
11. procedimiento de la reivindicacion 1 en el que al menos una region cromosomica que tiene una anotacion de CLEC11A comprende el marcador.
12. procedimiento de la reivindicacion 7 en el que el tejido es tejido esofagico o tejido pancreatico.
ES14776150T 2013-03-14 2014-03-12 Detección de neoplasias Active ES2712798T3 (es)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US201361784429P 2013-03-14 2013-03-14
PCT/US2014/024589 WO2014159652A2 (en) 2013-03-14 2014-03-12 Detecting neoplasm

Publications (1)

Publication Number Publication Date
ES2712798T3 true ES2712798T3 (es) 2019-05-14

Family

ID=51529812

Family Applications (3)

Application Number Title Priority Date Filing Date
ES14776150T Active ES2712798T3 (es) 2013-03-14 2014-03-12 Detección de neoplasias
ES19150809T Active ES2859645T3 (es) 2013-03-14 2014-03-12 Detección de neoplasia
ES21157412T Active ES2947873T3 (es) 2013-03-14 2014-03-12 Detección de neoplasias

Family Applications After (2)

Application Number Title Priority Date Filing Date
ES19150809T Active ES2859645T3 (es) 2013-03-14 2014-03-12 Detección de neoplasia
ES21157412T Active ES2947873T3 (es) 2013-03-14 2014-03-12 Detección de neoplasias

Country Status (7)

Country Link
US (6) US9994911B2 (es)
EP (4) EP3878977B1 (es)
CN (2) CN105143465A (es)
AU (1) AU2014244608B2 (es)
CA (1) CA2902916C (es)
ES (3) ES2712798T3 (es)
WO (2) WO2014159650A2 (es)

Families Citing this family (43)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2011119934A2 (en) 2010-03-26 2011-09-29 Mayo Foundation For Medical Education And Research Methods and materials for detecting colorectal neoplasm
US20130282390A1 (en) * 2012-04-20 2013-10-24 International Business Machines Corporation Combining knowledge and data driven insights for identifying risk factors in healthcare
ES2712798T3 (es) * 2013-03-14 2019-05-14 Exact Sciences Dev Co Llc Detección de neoplasias
CN105555965B (zh) * 2013-07-30 2020-06-05 深圳华大基因股份有限公司 确定核酸混合物中核酸组成的方法
WO2015153283A1 (en) 2014-03-31 2015-10-08 Mayo Foundation For Medical Education And Research Detecting colorectal neoplasm
US10184154B2 (en) 2014-09-26 2019-01-22 Mayo Foundation For Medical Education And Research Detecting cholangiocarcinoma
CN113897432A (zh) 2014-12-12 2022-01-07 精密科学公司 用于进行甲基化检测测定的组合物和方法
CA3183545A1 (en) 2014-12-12 2016-06-16 Exact Sciences Corporation Compositions and methods for performing methylation detection assays
US10940160B2 (en) 2014-12-29 2021-03-09 The Regents Of The University Of Michigan Biomarkers for predicting responsiveness to decitabine therapy
US10030272B2 (en) 2015-02-27 2018-07-24 Mayo Foundation For Medical Education And Research Detecting gastrointestinal neoplasms
EP3274440A4 (en) * 2015-03-27 2019-03-06 Exact Sciences Corporation PROOF OF DISEASES OF THE DISHES
US20180291450A1 (en) * 2015-03-27 2018-10-11 The Johns Hopkins University Method of identifying risk for autism
CN108138235B (zh) 2015-08-31 2022-04-15 梅约医药教育及研究基金会 检测胃肿瘤
WO2017075061A1 (en) 2015-10-30 2017-05-04 Exact Sciences Corporation Multiplex amplification detection assay and isolation and detection of dna from plasma
CN106222169A (zh) * 2015-12-13 2016-12-14 周平 长链非编码rna apoc1p1-3基因及其用途
US10370726B2 (en) 2016-04-14 2019-08-06 Mayo Foundation For Medical Education And Research Detecting colorectal neoplasia
CA3020628A1 (en) 2016-04-14 2017-10-19 Mayo Foundation For Medical Education And Research Detecting pancreatic high-grade dysplasia
CA3029866A1 (en) * 2016-07-06 2018-01-11 Case Western Reserve University Methods and compositions for detecting esophageal neoplasias and/or metaplasias in the esophagus
EP4293128A3 (en) * 2016-09-02 2024-03-20 Mayo Foundation for Medical Education and Research Detecting hepatocellular carcinoma
CA3049459A1 (en) * 2017-01-27 2018-08-02 Exact Sciences Development Company, Llc Detection of colon neoplasia by analysis of methylated dna
US10783262B2 (en) * 2017-02-03 2020-09-22 Adobe Inc. Tagging documents with security policies
CN110431241B (zh) 2017-02-28 2024-04-19 梅约医学教育与研究基金会 检测***癌
CN106947822B (zh) * 2017-04-12 2020-04-10 广州市康立明生物科技有限责任公司 Itga4基因甲基化检测试剂、试剂盒及检测方法
AU2018374176A1 (en) 2017-11-30 2020-06-11 Exact Sciences Corporation Detecting breast cancer
CN110511997A (zh) 2018-05-22 2019-11-29 广州市康立明生物科技有限责任公司 肿瘤标志物、甲基化试剂、试剂盒及其应用
EP3856903A4 (en) 2018-09-27 2022-07-27 Grail, LLC METHYLATION MARKER AND TARGETED METHYLATION PROBE PANEL
AU2019200359A1 (en) * 2019-01-18 2020-09-10 Clinical Genomics Pty Ltd Screening method
AU2020211461A1 (en) * 2019-01-24 2021-08-19 Exact Sciences Corporation Detecting endometrial cancer
JP2022526415A (ja) * 2019-04-03 2022-05-24 マヨ ファウンデーション フォア メディカル エデュケーション アンド リサーチ 血漿中の膵管腺癌の検出
US12009061B2 (en) 2019-04-10 2024-06-11 University of Pittsburgh—of the Commonwealth System of Higher Education Computational filtering of methylated sequence data for predictive modeling
AU2020274348A1 (en) * 2019-05-13 2021-12-09 Grail, Llc Model-based featurization and classification
US20220098680A1 (en) * 2019-05-29 2022-03-31 Université de Paris Detection of hypermethylated genes for diagnosing pancreatic cancer
US11396679B2 (en) 2019-05-31 2022-07-26 Universal Diagnostics, S.L. Detection of colorectal cancer
US11001898B2 (en) 2019-05-31 2021-05-11 Universal Diagnostics, S.L. Detection of colorectal cancer
US11898199B2 (en) 2019-11-11 2024-02-13 Universal Diagnostics, S.A. Detection of colorectal cancer and/or advanced adenomas
WO2021097302A1 (en) * 2019-11-13 2021-05-20 University Of South Florida Systems and methods of deep learning for colorectal polyp screening
AU2021245992A1 (en) * 2020-03-31 2022-11-10 Freenome Holdings, Inc. Methods and systems for detecting colorectal cancer via nucleic acid methylation analysis
EP4150121A1 (en) 2020-06-30 2023-03-22 Universal Diagnostics, S.A. Systems and methods for detection of multiple cancer types
US11821045B2 (en) 2021-04-13 2023-11-21 Geninus Inc. Colorectal cancer-specific methylation biomarkers for diagnosing colorectal cancer
AU2022381754A1 (en) * 2021-11-05 2024-05-23 Mayo Foundation For Medical Education And Research Compositions and methods for detecting oropharyngeal cancer
EP4299764A1 (en) * 2022-06-28 2024-01-03 Universal Diagnostics, S.A. Methods for detecting pancreatic cancer using dna methylation markers
CN115424666B (zh) * 2022-09-13 2023-07-11 江苏先声医学诊断有限公司 一种基于全基因组重亚硫酸盐测序数据筛选泛癌早筛分子标志物的方法及***
WO2024112806A1 (en) * 2022-11-21 2024-05-30 Moonwalk Biosciences, Inc. Generation and use of epigenetic maps for drug discovery

Family Cites Families (112)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5288609A (en) 1984-04-27 1994-02-22 Enzo Diagnostics, Inc. Capture sandwich hybridization method and composition
US4683202A (en) 1985-03-28 1987-07-28 Cetus Corporation Process for amplifying nucleic acid sequences
US4683195A (en) 1986-01-30 1987-07-28 Cetus Corporation Process for amplifying, detecting, and/or-cloning nucleic acid sequences
US4965188A (en) 1986-08-22 1990-10-23 Cetus Corporation Process for amplifying, detecting, and/or cloning nucleic acid sequences using a thermostable enzyme
US5011769A (en) 1985-12-05 1991-04-30 Meiogenics U.S. Limited Partnership Methods for detecting nucleic acid sequences
US5541308A (en) 1986-11-24 1996-07-30 Gen-Probe Incorporated Nucleic acid probes for detection and/or quantitation of non-viral organisms
US5124246A (en) 1987-10-15 1992-06-23 Chiron Corporation Nucleic acid multimers and amplified nucleic acid hybridization assays using same
US5359100A (en) 1987-10-15 1994-10-25 Chiron Corporation Bifunctional blocked phosphoramidites useful in making nucleic acid mutimers
US5403711A (en) 1987-11-30 1995-04-04 University Of Iowa Research Foundation Nucleic acid hybridization and amplification method for detection of specific sequences in which a complementary labeled nucleic acid probe is cleaved
CA1340807C (en) 1988-02-24 1999-11-02 Lawrence T. Malek Nucleic acid amplification process
US5639611A (en) 1988-12-12 1997-06-17 City Of Hope Allele specific polymerase chain reaction
US5362623A (en) 1991-06-14 1994-11-08 The John Hopkins University Sequence specific DNA binding by p53
US6800617B1 (en) 1989-03-29 2004-10-05 The Johns Hopkins University Methods for restoring wild-type p53 gene function
US6677312B1 (en) 1989-03-29 2004-01-13 The Johns Hopkins University Methods for restoring wild-type p53 gene function
US5527676A (en) 1989-03-29 1996-06-18 The Johns Hopkins University Detection of loss of the wild-type P53 gene and kits therefor
CA2036946C (en) 1990-04-06 2001-10-16 Kenneth V. Deugau Indexing linkers
US5494810A (en) 1990-05-03 1996-02-27 Cornell Research Foundation, Inc. Thermostable ligase-mediated DNA amplifications system for the detection of genetic disease
US5849481A (en) 1990-07-27 1998-12-15 Chiron Corporation Nucleic acid hybridization assays employing large comb-type branched polynucleotides
US5352775A (en) 1991-01-16 1994-10-04 The Johns Hopkins Univ. APC gene and nucleic acid probes derived therefrom
US6872816B1 (en) 1996-01-24 2005-03-29 Third Wave Technologies, Inc. Nucleic acid detection kits
US5994069A (en) 1996-01-24 1999-11-30 Third Wave Technologies, Inc. Detection of nucleic acids by multiple sequential invasive cleavages
US5846717A (en) 1996-01-24 1998-12-08 Third Wave Technologies, Inc. Detection of nucleic acid sequences by invader-directed cleavage
US5338671A (en) 1992-10-07 1994-08-16 Eastman Kodak Company DNA amplification with thermostable DNA polymerase and polymerase inhibiting antibody
SE501439C2 (sv) 1993-06-22 1995-02-13 Pharmacia Lkb Biotech Sätt och anordning för analys av polynukleotidsekvenser
US6235470B1 (en) 1993-11-12 2001-05-22 The Johns Hopkins University School Of Medicine Detection of neoplasia by analysis of saliva
AU8102694A (en) 1993-11-17 1995-06-06 Id Biomedical Corporation Cycling probe cleavage detection of nucleic acid sequences
EP0734436B1 (en) 1993-11-30 1999-04-14 McGILL UNIVERSITY Inhibition of dna methyltransferase
US5851770A (en) 1994-04-25 1998-12-22 Variagenics, Inc. Detection of mismatches by resolvase cleavage using a magnetic bead support
ATE248224T1 (de) 1994-04-25 2003-09-15 Avitech Diagnostics Inc Die bestimmung von mutationen durch spaltung mit resolvase
DE69528670T2 (de) 1994-12-23 2004-03-11 Dade Behring Inc., Deerfield Nachweis von nukleinsäuren durch nuklease-katalysierte produktbildung
US5882867A (en) 1995-06-07 1999-03-16 Dade Behring Marburg Gmbh Detection of nucleic acids by formation of template-dependent product
US5773258A (en) 1995-08-25 1998-06-30 Roche Molecular Systems, Inc. Nucleic acid amplification using a reversibly inactivated thermostable enzyme
US5854033A (en) 1995-11-21 1998-12-29 Yale University Rolling circle replication reporter systems
US5965408A (en) 1996-07-09 1999-10-12 Diversa Corporation Method of DNA reassembly by interrupting synthesis
CA2239683A1 (en) 1995-12-22 1997-07-03 Dade Behring Marburg Gmbh Homogeneous amplification and detection of nucleic acids
US5670325A (en) 1996-08-14 1997-09-23 Exact Laboratories, Inc. Method for the detection of clonal populations of transformed cells in a genomically heterogeneous cellular sample
US5985557A (en) 1996-01-24 1999-11-16 Third Wave Technologies, Inc. Invasive cleavage of nucleic acids
US5741650A (en) 1996-01-30 1998-04-21 Exact Laboratories, Inc. Methods for detecting colon cancer from stool samples
US5891651A (en) 1996-03-29 1999-04-06 Mayo Foundation For Medical Education And Research Methods of recovering colorectal epithelial cells or fragments thereof from stool
JP3898228B2 (ja) 1996-04-12 2007-03-28 ザ パブリック ヘルス リサーチ インスティチュート オブ ザ シティー オブ ニューヨーク インク 検出プローブ、キット及びアッセイ
US6017704A (en) 1996-06-03 2000-01-25 The Johns Hopkins University School Of Medicine Method of detection of methylated nucleic acid using agents which modify unmethylated cytosine and distinguishing modified methylated and non-methylated nucleic acids
US5786146A (en) 1996-06-03 1998-07-28 The Johns Hopkins University School Of Medicine Method of detection of methylated nucleic acid using agents which modify unmethylated cytosine and distinguishing modified methylated and non-methylated nucleic acids
US5928870A (en) 1997-06-16 1999-07-27 Exact Laboratories, Inc. Methods for the detection of loss of heterozygosity
US6020137A (en) 1996-08-14 2000-02-01 Exact Laboratories, Inc. Methods for the detection of loss of heterozygosity
US5952178A (en) 1996-08-14 1999-09-14 Exact Laboratories Methods for disease diagnosis from stool samples
US6096273A (en) 1996-11-05 2000-08-01 Clinical Micro Sensors Electrodes linked via conductive oligomers to nucleic acids
AU7829398A (en) 1997-06-09 1998-12-30 University Of Southern California A cancer diagnostic method based upon dna methylation differences
US6013459A (en) 1997-06-12 2000-01-11 Clinical Micro Sensors, Inc. Detection of analytes using reorganization energy
DE19754482A1 (de) 1997-11-27 1999-07-01 Epigenomics Gmbh Verfahren zur Herstellung komplexer DNA-Methylierungs-Fingerabdrücke
US6063573A (en) 1998-01-27 2000-05-16 Clinical Micro Sensors, Inc. Cycling probe technology using electron transfer detection
WO1999040222A1 (en) 1998-02-04 1999-08-12 Variagenics, Inc. Mismatch detection techniques
US6235502B1 (en) 1998-09-18 2001-05-22 Molecular Staging Inc. Methods for selectively isolating DNA using rolling circle amplification
US7700324B1 (en) 1998-11-03 2010-04-20 The Johns Hopkins University School Of Medicine Methylated CpG island amplification (MCA)
US6335193B1 (en) 1999-04-15 2002-01-01 Padmanabhan P Nair Isolated colonocytes
CA2394921A1 (en) 1999-12-07 2001-06-14 Anthony P. Shuber Supracolonic aerodigestive neoplasm detection
EP1297185A2 (en) 2000-06-30 2003-04-02 Epigenomics AG Diagnosis of diseases associated with signal transduction
EP1942197A1 (de) 2000-09-01 2008-07-09 Epigenomics AG Verfahren zur Bestimmung des Methylierungsgrades von bestimmten Cytosinen in genomischer DNA im Sequenzkontext 5'-CpG-3'
US20050021240A1 (en) * 2000-11-02 2005-01-27 Epigenomics Ag Systems, methods and computer program products for guiding selection of a therapeutic treatment regimen based on the methylation status of the DNA
AU2002342004A1 (en) 2001-10-05 2003-04-22 Case Western Reserve University Methods and compositions for detecting colon cancers
CN1650033A (zh) 2002-03-07 2005-08-03 约翰霍普金斯大学医学院 针对与癌症相关的表观遗传学沉默基因的基因组筛选
US7662594B2 (en) 2002-09-20 2010-02-16 New England Biolabs, Inc. Helicase-dependent amplification of RNA
EP1604013A4 (en) * 2003-03-17 2009-02-11 Univ Johns Hopkins METHYL GENES ABERRANTY IN PANCREATIC CANCER
JP4781267B2 (ja) 2003-08-14 2011-09-28 ケース ウエスタン リザーブ ユニバーシティ 大腸癌を検出する方法及び組成物
US8346482B2 (en) 2003-08-22 2013-01-01 Fernandez Dennis S Integrated biosensor and simulation system for diagnosis and therapy
WO2005023091A2 (en) 2003-09-05 2005-03-17 The Trustees Of Boston University Method for non-invasive prenatal diagnosis
US20080039413A1 (en) 2003-10-21 2008-02-14 Morris David W Novel compositions and methods in cancer
EP2497836B1 (en) 2004-03-02 2015-01-14 The Johns Hopkins University Mutations of the PIK3CA gene in human cancers
US8114587B2 (en) 2005-06-23 2012-02-14 Ambergen, Inc. Methods for the detection of colorectal cancer
US7851154B2 (en) 2005-07-22 2010-12-14 Simon Daniel Spivack GC tag-modified bisulfite genomic DNA sequencing for continuous methylation spectra
PL1981995T5 (pl) 2006-02-02 2019-10-31 Univ Leland Stanford Junior Nieinwazyjne genetyczne badania przesiewowe płodu metodą analizy cyfrowej
JP4490382B2 (ja) 2006-02-28 2010-06-23 富士フイルム株式会社 感熱転写受像シートおよびその製造方法
WO2007116417A1 (en) 2006-04-07 2007-10-18 Silvia Sabbioni Novel dna methylation markers useful for the diagnosis of neoplastic diseases
WO2007140319A1 (en) 2006-05-26 2007-12-06 Meltzer Stephen J Methylated promoters as biomarkers of colon cancer
GB0700374D0 (en) 2007-01-09 2007-02-14 Oncomethylome Sciences S A NDRG family methylation markers
US20080213870A1 (en) 2007-03-01 2008-09-04 Sean Wuxiong Cao Methods for obtaining modified DNA from a biological specimen
CN101353695B (zh) 2007-07-23 2013-05-01 上海市肿瘤研究所 尿沉淀dna甲基化谱式分析诊断膀胱癌的方法和试剂盒
EP2201131B8 (en) * 2007-09-17 2014-12-10 MDxHealth SA Improved methylation detection
WO2009102788A2 (en) 2008-02-15 2009-08-20 Mayo Foundation For Medical Education And Research Detecting neoplasm
WO2009117327A2 (en) 2008-03-15 2009-09-24 Hologic, Inc. Compositions and methods for analysis of nucleic acid molecules during amplification reactions
WO2010062914A1 (en) 2008-11-26 2010-06-03 The Johns Hopkins University Methods for identifying cancer risk
US20110318738A1 (en) * 2008-12-23 2011-12-29 University Of Utah Research Foundation Identification and regulation of a novel dna demethylase system
EP2233590A1 (en) 2009-01-28 2010-09-29 AIT Austrian Institute of Technology GmbH Methylation assay
DK2394170T3 (en) 2009-02-03 2015-07-13 Mdxhealth Sa Methods for detecting colorectal cancer
CN102292458A (zh) 2009-04-03 2011-12-21 A&T株式会社 大肠肿瘤的检测方法
US20120164110A1 (en) * 2009-10-14 2012-06-28 Feinberg Andrew P Differentially methylated regions of reprogrammed induced pluripotent stem cells, method and compositions thereof
DE102010043541B4 (de) * 2009-12-16 2012-01-26 Technische Universität Dresden Verfahren und Mittel zur Vorhersage der Überlebensdauer beim Pankreaskarzinom durch Analyse von Biomarkern
WO2011119934A2 (en) 2010-03-26 2011-09-29 Mayo Foundation For Medical Education And Research Methods and materials for detecting colorectal neoplasm
WO2011126768A2 (en) 2010-03-29 2011-10-13 Mayo Foundation For Medical Education And Research Methods and materials for detecting colorectal cancer and adenoma
ES2581594T3 (es) * 2010-05-25 2016-09-06 The Johns Hopkins University Composiciones y métodos para detectar una neoplasia
CA2806291C (en) * 2010-07-23 2023-08-29 President And Fellows Of Harvard College Methods for detecting signatures of disease or conditions in bodily fluids
WO2012047899A2 (en) 2010-10-04 2012-04-12 The Johns Hopkins University Novel dna hypermethylation diagnostic biomarkers for colorectal cancer
US8715937B2 (en) 2010-11-15 2014-05-06 Exact Sciences Corporation Mutation detection assay
US8916344B2 (en) 2010-11-15 2014-12-23 Exact Sciences Corporation Methylation assay
US8361720B2 (en) 2010-11-15 2013-01-29 Exact Sciences Corporation Real time cleavage assay
WO2012088298A2 (en) 2010-12-21 2012-06-28 Sloan-Kettering Institute For Cancer Research Epigenomic markers of cancer metastasis
EP2481813A1 (en) * 2011-02-01 2012-08-01 Centro di Riferimento Oncologico - Istituto Nazionale Tumori - Aviano Markers of cutaneous melanoma and uses thereof
WO2012125721A2 (en) 2011-03-14 2012-09-20 Mayo Foundation For Medical Education And Research Methods and materials for using the contents of phagocytes to detect neoplasms
US8993341B2 (en) 2011-05-12 2015-03-31 Exact Sciences Corporation Removal of PCR inhibitors
US8808990B2 (en) 2011-05-12 2014-08-19 Exact Sciences Corporation Serial isolation of multiple DNA targets from stool
US8980107B2 (en) 2011-05-12 2015-03-17 Exact Sciences Corporation Spin filter
ES2773692T3 (es) 2011-05-12 2020-07-14 Exact Sciences Corp Aislamiento de ácidos nucleicos
WO2012167145A2 (en) * 2011-06-01 2012-12-06 University Of Southern California Genome-scale analysis of aberrant dna methylation in colorectal cancer
US20130022974A1 (en) * 2011-06-17 2013-01-24 The Regents Of The University Of Michigan Dna methylation profiles in cancer
WO2012175562A2 (en) * 2011-06-21 2012-12-27 University Of Tartu Methylation and microrna markers of early-stage non-small cell lung cancer
CA2853645A1 (en) 2011-11-30 2013-06-06 National Cancer Center Induced malignant stem cells
US20150126374A1 (en) * 2012-02-28 2015-05-07 The Johns Hopkins University Hypermethylated gene markers for head and neck cancer
CA2865087A1 (en) 2012-03-15 2013-09-19 Mayo Foundation For Medical Education And Research Methods and materials for noninvasive detection of colorectal neoplasia associated with inflammatory bowel disease
EP2698436A1 (en) * 2012-08-14 2014-02-19 Max-Planck-Gesellschaft zur Förderung der Wissenschaften e.V. Colorectal cancer markers
EP2900835A4 (en) 2012-09-27 2016-05-11 Population Diagnotics Inc METHODS AND COMPOSITIONS FOR DETECTING AND TREATING DEVELOPMENTAL DISORDERS
ES2712798T3 (es) * 2013-03-14 2019-05-14 Exact Sciences Dev Co Llc Detección de neoplasias
JP6369857B2 (ja) 2013-05-29 2018-08-08 シスメックス株式会社 肝細胞癌に関する情報の取得方法、ならびに肝細胞癌に関する情報を取得するためのマーカーおよびキット
EP3034624A1 (en) 2014-12-18 2016-06-22 Hospital Clínic de Barcelona Method for the prognosis of hepatocellular carcinoma

Also Published As

Publication number Publication date
CA2902916C (en) 2018-08-28
CN105143465A (zh) 2015-12-09
EP2971179A2 (en) 2016-01-20
EP3543360A2 (en) 2019-09-25
US20160355892A1 (en) 2016-12-08
EP3878977A1 (en) 2021-09-15
CN118028467A (zh) 2024-05-14
WO2014159652A3 (en) 2014-11-27
US10683555B2 (en) 2020-06-16
US20160040246A1 (en) 2016-02-11
US9506116B2 (en) 2016-11-29
US20140274748A1 (en) 2014-09-18
ES2859645T3 (es) 2021-10-04
US11821039B2 (en) 2023-11-21
EP2971179A4 (en) 2017-01-25
EP3543360A3 (en) 2020-01-08
US20240182980A1 (en) 2024-06-06
US9994911B2 (en) 2018-06-12
EP4234721A2 (en) 2023-08-30
EP2971179B1 (en) 2019-01-09
EP3878977B1 (en) 2023-05-03
US20180258498A1 (en) 2018-09-13
EP3543360B1 (en) 2021-02-17
AU2014244608A1 (en) 2015-09-10
WO2014159652A2 (en) 2014-10-02
WO2014159650A3 (en) 2014-11-20
CA2902916A1 (en) 2014-10-02
EP4234721A3 (en) 2023-10-18
AU2014244608B2 (en) 2017-09-14
WO2014159650A2 (en) 2014-10-02
ES2947873T3 (es) 2023-08-23
US20200283853A1 (en) 2020-09-10
US9982310B2 (en) 2018-05-29

Similar Documents

Publication Publication Date Title
ES2712798T3 (es) Detección de neoplasias
US10883144B2 (en) Detecting colorectal neoplasm
ES2956257T3 (es) Detección de carcinoma hepatocelular
US20210317538A1 (en) Detecting pancreatic high-grade dysplasia
JP2021118711A (ja) 胃の新生物を検出すること
US11542557B2 (en) Detecting colorectal neoplasia
US20180037958A1 (en) Detecting esophageal disorders
US11384401B2 (en) Detecting gastrointestinal neoplasms