ES2768344T3 - Métodos y materiales para evaluar el desequilibrio alélico - Google Patents

Métodos y materiales para evaluar el desequilibrio alélico Download PDF

Info

Publication number
ES2768344T3
ES2768344T3 ES12801070T ES12801070T ES2768344T3 ES 2768344 T3 ES2768344 T3 ES 2768344T3 ES 12801070 T ES12801070 T ES 12801070T ES 12801070 T ES12801070 T ES 12801070T ES 2768344 T3 ES2768344 T3 ES 2768344T3
Authority
ES
Spain
Prior art keywords
sample
loci
snp
locus
loh
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
ES12801070T
Other languages
English (en)
Inventor
Alexander Gutin
Kirsten Timms
Jerry Lanchbury
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Myriad Genetics Inc
Original Assignee
Myriad Genetics Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Family has litigation
First worldwide family litigation filed litigation Critical https://patents.darts-ip.com/?family=47357765&utm_source=***_patent&utm_medium=platform_link&utm_campaign=public_patent_search&patent=ES2768344(T3) "Global patent litigation dataset” by Darts-ip is licensed under a Creative Commons Attribution 4.0 International License.
Application filed by Myriad Genetics Inc filed Critical Myriad Genetics Inc
Application granted granted Critical
Publication of ES2768344T3 publication Critical patent/ES2768344T3/es
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6813Hybridisation assays
    • C12Q1/6827Hybridisation assays for detection of mutation or polymorphism
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6844Nucleic acid amplification reactions
    • C12Q1/6858Allele-specific amplification
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6869Methods for sequencing
    • C12Q1/6874Methods for sequencing involving nucleic acid arrays, e.g. sequencing by hybridisation
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6883Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B30/00ICT specially adapted for sequence analysis involving nucleotides or amino acids

Landscapes

  • Chemical & Material Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Organic Chemistry (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Wood Science & Technology (AREA)
  • Zoology (AREA)
  • Physics & Mathematics (AREA)
  • Analytical Chemistry (AREA)
  • Biotechnology (AREA)
  • General Health & Medical Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biophysics (AREA)
  • Genetics & Genomics (AREA)
  • Molecular Biology (AREA)
  • Biochemistry (AREA)
  • General Engineering & Computer Science (AREA)
  • Microbiology (AREA)
  • Immunology (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Medical Informatics (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Theoretical Computer Science (AREA)
  • Pathology (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Apparatus Associated With Microorganisms And Enzymes (AREA)

Abstract

Un método in vitro para detectar el estado de pérdida de heterocigosidad (LOH) en una pluralidad de loci genómicos de SNP en una muestra de tejido embebida en parafina, fijada en formalina de un paciente, que comprende: enriquecer una muestra de ADN genómico en moléculas de ADN cada una que comprende un locus de SNP de interés; secuenciar dichas moléculas de ADN para determinar el genotipo en cada locus de SNP; determinar para cada locus de SNP homocigoto si es homocigoto debido a LOH.

Description

DESCRIPCIÓN
Métodos y materiales para evaluar el desequilibrio alélico
Campo de la invención
La invención en general se refiere al diagnóstico molecular, y en particular a un método y sistema para detectar el desequilibrio alélico en muestras de pacientes.
Antecedentes de la invención
En general, una comparación de secuencias presentes en el mismo locus en cada cromosoma (cada cromosoma autosómico para varones) de un par de cromosomas puede revelar si ese locus particular es homocigoto o heterocigoto dentro del genoma de una célula. Los loci polimórficos dentro del genoma humano son generalmente heterocigotos dentro de un individuo ya que el individuo típicamente recibe una copia del padre biológico y una copia de la madre biológica. En algunos casos, un locus polimórfico o una cadena de loci polimórficos dentro de un individuo es homocigota como un resultado de heredar copias idénticas de ambos padres biológicos. En otros casos, la homocigosidad resulta de una pérdida de heterocigosidad (LOH) de la línea germinal. Debido a que la información de LOH y del número de copias puede ser clínicamente útil, existe la necesidad de métodos mejorados para identificar los loci y las regiones de LOH en las muestras.
Jacobs y otros (2007) describen un análisis integrado de genotipo, LOH y número de copias para el ADN derivado de tejidos FFPE. El análisis se lleva a cabo mediante el uso de una micromatriz que contiene más de 500K SNP. El ordenador se usa para el cálculo
Breve resumen de la invención
La invención se define por las reivindicaciones adjuntas.
El análisis del número de copias (incluido el desequilibrio alélico y la LOH) de los tejidos tumorales se ha realizado tradicionalmente mediante el uso de matrices de polimorfismo de nucleótido simple (SNP). La calidad de los datos frecuentemente es muy variable y, especialmente para las muestras FFPE, tiende a ser pobre. Los inventores han desarrollado un método de análisis de número de copias de todo el genoma que produce datos de alta calidad a partir de todos los tipos de muestras que se basa en la captura en solución de fragmentos de ADN que abarcan los loci diana (por ejemplo, los SNP), seguido de una secuenciación paralela para identificar y cuantificar los alelos. Los datos resultantes permiten un análisis de alta calidad de LOH y del número de copias de la muestra.
En consecuencia, en un aspecto de la presente descripción se proporciona un método para detectar el estado de desequilibrio alélico en una pluralidad de loci genómicos en una muestra tumoral de un paciente con cáncer, que comprende las etapas de enriquecer una muestra de ADN genómico en moléculas de ADN cada una que comprende un locus de interés; secuenciar dichas moléculas de ADN para determinar el genotipo en cada locus; determinar para cada locus si existe un desequilibrio alélico.
En otro aspecto de la presente descripción, se proporciona un método para detectar el estado de LOH en una pluralidad de loci genómicos en una muestra tumoral de un paciente con cáncer, que comprende las etapas de enriquecer una muestra de ADN genómico en moléculas de ADN cada una que comprende un locus de interés; secuenciar dichas moléculas de ADN para determinar el genotipo en cada uno de tales loci; determinar para cada locus homocigoto si es homocigoto debido a LOH.
A menos que se defina de cualquier otra forma, todos los términos técnicos y científicos usados en la presente descripción tienen el mismo significado que el que entiende comúnmente el experto en la técnica a la cual pertenece la invención. Aunque los métodos y materiales similares o equivalentes a los descritos en la presente descripción pueden usarse en la práctica o prueba de la presente invención, los métodos y materiales adecuados se describen más abajo. En caso de conflicto, prevalecerá la presente descripción, incluidas las definiciones. Además, los materiales, métodos, y ejemplos son ilustrativos solamente y no pretenden ser limitantes.
Otras características y ventajas de la invención serán evidentes a partir de la siguiente descripción detallada y a partir de las reivindicaciones.
Breve descripción de las figuras
La Figura 1 es un gráfico que representa las dosificaciones de alelos de células de cáncer de mama de una paciente con cáncer de mama a lo largo del cromosoma 1 según se determinó mediante el uso de un matriz de SNP. La región cromosómica entre las flechas es una región de LOH que tiene aproximadamente 103 Mb de longitud.
La Figura 2 es un gráfico que representa las dosificaciones de alelos de células de cáncer de mama para el mismo paciente con cáncer de mama que en la Figura 1 a lo largo del cromosoma 1 según se determinó mediante el uso de secuenciación de alto rendimiento. La región cromosómica entre las flechas es una región de LOH que tiene aproximadamente 103 Mb de longitud.
La Figura 3 es un diagrama de un ejemplo de un dispositivo informático y un dispositivo informático móvil que puede usarse para implementar las técnicas descritas en la presente descripción.
Descripción detallada de la invención
La invención se define por las reivindicaciones adjuntas. Se ha descubierto sorprendentemente que determinar el desequilibrio alélico (por ejemplo, número de copias anormales, LOH) en muestras embebidas en parafina, fijadas con formalina ("FFPE") mediante el uso de secuenciación de regiones genómicas que comprenden los loci de interés (por ejemplo, los SNP) produce datos de calidad muy superior en comparación con los datos del número de copias y de desequilibrio alélico generados mediante micromatrices. Esta invención permite el análisis a gran escala (por ejemplo, genoma completo) del número de copias (por ejemplo, desequilibrio alélico) de muestras de calidad variable. En particular, permite la producción de datos de alta calidad a partir de a Dn derivado de FFPE. Las plataformas actuales basadas en matrices no pueden producir datos de calidad suficiente a partir de este tipo de muestra.
En consecuencia, en un aspecto de la presente descripción, se proporciona un método para detectar el estado de desequilibrio alélico en una pluralidad de loci genómicos en una muestra tumoral de un paciente con cáncer, que comprende las etapas de enriquecer una muestra de ADN genómico en moléculas de ADN cada una que comprende un locus de interés; secuenciar dichas moléculas de ADN para determinar el genotipo en cada locus; determinar para cada locus si existe un desequilibrio alélico. "Locus" como se usa en la presente descripción tiene su significado habitual en la técnica. Como se usa en la presente descripción, "región" significa una pluralidad de loci sustancialmente adyacentes. A menos que se indique lo contrario o, a menos que el contexto indique claramente lo contrario, las declaraciones hechas sobre un locus generalmente se aplicarán a una región.
Como se usa en la presente descripción, "desequilibrio alélico" significa cualquier caso en el que el número de copias somáticas difiere del número de copias de la línea germinal en un locus o región genómica. En algunas modalidades el desequilibrio alélico se expresa en términos de proporción de copias mayoritarias ("MCP"). La proporción de copias mayoritarias o MCP, como se usa en la presente descripción, significa la relación del número de copias alélicas mayoritarias con relación al número de copias alélicas mayoritarias minoritarias, como sigue:
MCP = [número de copias alélicas mayoritarias] / [número de copias alélicas mayoritarias] [número de copias alélicas minoritarias]
En algunas modalidades, un locus o región muestra un desequilibrio alélico si la MCP en tal locus o región es 0,51, 0,52, 0,53, 0,54, 0,55, 0,6, 0,65, 0,7, 0,75, 0,8, 0,85, 0,9, 0,95 o 1.
Un ejemplo de desequilibrio alélico es la pérdida de heterocigosidad ("LOH"), en la que un locus es heterocigoto en la línea germinal pero homocigoto en el tejido somático. En este sentido, la homocigosidad puede incluir la pérdida homocigótica (es decir, la deleción) del locus en el tejido somático. Los diferentes tipos de LOH y desequilibrio alélico posibles se analizan con más detalle a continuación.
Por lo tanto, en algunas modalidades la presente descripción proporciona un método para detectar el estado de LOH en una pluralidad de loci genómicos en una muestra tumoral de un paciente con cáncer, que comprende enriquecer una muestra de ADN genómico en moléculas de ADN cada una que comprende un locus de interés; secuenciar dichas moléculas de ADN para determinar el genotipo en cada uno de tal locus; determinar para cada locus homocigoto si es homocigoto debido a LOH.
De acuerdo con la presente descripción, las técnicas de secuenciación de ácido nucleico pueden usarse para identificar los loci y/o regiones que tienen un desequilibrio alélico. Por ejemplo, el ADN genómico de una muestra de células (por ejemplo, una muestra de células cancerosas) puede extraerse y fragmentarse. Puede usarse cualquier método apropiado para extraer y fragmentar el ácido nucleico genómico, incluidos, sin limitación, los kits comerciales tales como QIAamp DNA Mini Kit (Qiagen), MagNA Pure DNA Isolation Kit (Roche Applied Science) y GenElute Mammalian Genomic DnA Miniprep Kit (Sigma-Aldrich). Una vez extraído y fragmentado, puede realizarse una secuenciación dirigida o no dirigida para determinar los genotipos de la muestra en los loci de interés. Por ejemplo, la secuenciación del genoma completo, el transcriptoma completo o el exoma completo puede realizarse para determinar genotipos en millones o incluso miles de millones de pares de bases (es decir, los pares de bases pueden ser "loci" a evaluar).
En algunos casos, la secuenciación dirigida de los loci polimórficos conocidos (por ejemplo, los SNP y las secuencias circundantes) puede realizarse como una alternativa al análisis de micromatrices. Por ejemplo, el ADN genómico puede enriquecerse en aquellos fragmentos que contienen un locus (por ejemplo, ubicación de los SNP) a analizar mediante el uso de kits diseñados para este propósito (por ejemplo, Agilent SureSelect, Illumina TruSeq Capture, Nimblegen SeqCap EZ Choice, Raindance Thunderstorm™). Por ejemplo, el ADN genómico que contiene los loci a analizar puede hibridarse a fragmentos de ARN de captura biotinilados para formar complejos biotinilados de ARN/ADN genómico. Alternativamente, pueden utilizarse sondas de captura de ADN que dan como resultado la formación de híbridos de ADN biotinilado/ADN genómico. Pueden usar perlas magnéticas recubiertas con estreptavidina y una fuerza magnética para separar los complejos de ARN biotinilado/ADN genómico de los fragmentos de ADN genómico que no están presentes dentro de un complejo de ARN biotinilado/ADN genómico. Los complejos de ARN biotinilado/ADN genómico obtenidos pueden tratarse para eliminar el ARN capturado de las perlas magnéticas, dejando de este modo fragmentos de ADN genómico intactos que contienen un locus a analizar. Estos fragmentos de ADN genómico intactos que contienen los loci a analizar pueden amplificarse mediante el uso de, por ejemplo, técnicas de PCR. Alternativamente, puede emplearse una reacción de PCR multiplex para enriquecer los loci de interés. Los cebadores de PCR pueden diseñarse para flanquear los loci de interés y puede ejecutarse una reacción de PCR para amplificar secuencias que comprenden tales loci.
Los fragmentos de ADN genómico enriquecido pueden secuenciarse mediante el uso de cualquier técnica de secuenciación. Además de la secuenciación de Sanger, numerosas máquinas y estrategias de secuenciación adecuadas son bien conocidas en la técnica, incluidas, pero no se limitan a, las desarrolladas por Illumina (el Genome Analyzer; Bennett y otros (2005) Pharmacogenomics, 6:373-382; HiSeq; MiSeq); por Applied Biosystems, Inc. (el secuenciador SOLiD™; solid.appliedbiosystems.com); por Roche (por ejemplo, el secuenciador 454 GS FLX™; Margulies y otros (2005) Nature, 437:376-380; patentes núms. 6,274,320; 6,258,568; 6,210,891); por Helicos Biosciences (sistema Heliscope™, ver, por ejemplo, publicación de solicitud de patente de Estados Unidos núm. 2007/0070349); por Oxford Nanopore (por ejemplo, GridION™ y MinION™, ver, por ejemplo, la solicitud internacional núm. PCT/GB2009/001690, publicación núm. WO/2010/004273); y por otros.
Los resultados de secuenciación de los fragmentos de ADN genómico pueden usarse para identificar los loci que tienen un desequilibrio alélico. En algunos casos, puede realizarse un análisis del estado de desequilibrio alélico de los loci sobre una longitud de un cromosoma para determinar la longitud de las regiones de desequilibrio alélico. Por ejemplo, un tramo de ubicaciones de SNP que están separadas (por ejemplo, separadas de aproximadamente 25 kb a aproximadamente 100 kb) a lo largo de un cromosoma puede evaluarse mediante secuenciación, y los resultados de secuenciación pueden usarse para determinar no solo la presencia de una región de desequilibrio alélico (por ejemplo, homocigosidad somática) a lo largo de un cromosoma sino también la longitud de esa región de desequilibrio. Los resultados de secuenciación obtenidos pueden usarse para generar un gráfico que traza las dosificaciones de alelos a lo largo de un cromosoma. La dosificación de alelos di para SNP i puede calcularse a partir del número ajustado de sondas capturadas para dos alelos (A i y Bi): di =. A i/(A i + Bi). Un ejemplo de tal gráfico se presenta en la Figura 2.
Una vez que se ha determinado el genotipo de la muestra (por ejemplo, homocigosidad) para una pluralidad de loci (por ejemplo, los SNP), pueden usarse técnicas comunes para identificar los loci y las regiones de desequilibrio alélico debido a un cambio somático (por ejemplo, LOH). Una forma de determinar si el desequilibrio se debe al cambio somático es comparar el genotipo somático con la línea germinal. Por ejemplo, el genotipo para una pluralidad de loci (por ejemplo, los SNP) puede determinarse tanto en una muestra de línea germinal (por ejemplo, sangre) como en una muestra somática (por ejemplo, tumor). Los genotipos para cada muestra pueden compararse (típicamente por ordenador) para determinar si el genoma de la célula de la línea germinal era, por ejemplo, heterocigoto y si el genoma de la célula somática era, por ejemplo, homocigoto. Tales loci son loci de LOH y las regiones de tales loci son regiones de LOH.
Las técnicas computacionales también pueden usarse para determinar si el desequilibrio alélico es somático (por ejemplo, debido a LOH). Tales técnicas son particularmente útiles cuando una muestra de línea germinal no está disponible para análisis y comparación. Por ejemplo, los algoritmos tales como los descritos en otra parte pueden usarse para detectar regiones de desequilibrio alélico mediante el uso de la información a partir de matrices de SNP (Nannya y otros, Cancer Res., 65:6071-6079 (2005)). Típicamente estos algoritmos no tienen en cuenta explícitamente la contaminación de muestras tumorales con tejido benigno. Cf.solicitud internacional núm. PCT/US2011/026098 de Abkevich y otros; Goransson y otros, PLoS One (2009) 4(6):e6057. Frecuentemente esta contaminación es lo suficientemente alta como para dificultar la detección de regiones de desequilibrio alélico. Los métodos analíticos mejorados de acuerdo con la presente invención para identificar un desequilibrio alélico, incluso a pesar de la contaminación, incluyen los incorporados en productos de software informático como se describe a continuación.
Lo siguiente es un ejemplo. Si la relación observada (por ejemplo, MCP) de las señales de dos alelos, A y B, es de dos a uno, hay dos posibilidades. La primera posibilidad es que las células cancerosas tienen LOH con deleción del alelo B en una muestra con un 50 % de contaminación con células normales. La segunda posibilidad es que no hay LOH pero el alelo A está duplicado en una muestra sin contaminación con células normales. Puede implementarse un algoritmo como un programa informático como se describe en la presente descripción para reconstruir regiones de LOH en función de los datos de genotipo (por ejemplo, genotipo de SNP). Un punto del algoritmo es reconstruir primero los números de copias específicas de alelo (ASCN) en cada locus (por ejemplo, los SNP). Los ASCN son los números de copias de ambos alelos paternos y maternos. Una región de LOH se determina entonces como un tramo de los SNP con uno de los ASCN (paternos o maternos) que es cero. El algoritmo puede basarse en maximizar una función de probabilidad y puede ser conceptualmente parecido a un algoritmo descrito previamente diseñado para reconstruir el número total de copias (en lugar de ASCN) en cada locus (por ejemplo, los SNP). Ver la solicitud internacional núm. PCT/US2011/026098 (publicación núm. WO/2011/106541). La función de probabilidad puede maximizarse sobre ASCN de todos los loci, el nivel de contaminación con tejido benigno, el número total de copias promedio en todo el genoma y el nivel de ruido específico de la muestra. Los datos de entrada para el algoritmo pueden incluir o consistir en (1) intensidades de señal normalizadas específicas de muestra para ambos alelos de cada locus y (2) conjunto de parámetros específicos de ensayo (específicos para diferentes matrices de SNP y para un enfoque basado en secuencias) definido en función del análisis de gran número de muestras con perfiles de ASCn conocidos.
En algunos casos, puede usarse un proceso de selección para seleccionar los loci (por ejemplo, loci de SNP) a evaluar mediante el uso de un ensayo configurado para identificar los loci que tienen un desequilibrio alélico (por ejemplo, ensayos basados en matriz de SNP y ensayos basados en secuenciación). Por ejemplo, cualquier ubicación de SNP humano puede seleccionarse para su inclusión en un ensayo basado en matriz de SNP o un ensayo basado en secuenciación configurado para identificar los loci que tienen un desequilibrio alélico dentro del genoma de las células. En algunos casos, 0,5, 1,0, 1,5, 2,0, 2,5 millones o más loci (por ejemplo, ubicaciones de SNP) presentes dentro del genoma humano pueden evaluarse para identificar los loci que (a) no están presentes en el cromosoma Y, (b) no son loci mitocondriales, (c) tienen una frecuencia de alelos minoritarios de al menos aproximadamente 5 % en la población de interés (por ejemplo, caucásicos), (d) tienen una frecuencia de alelos minoritarios de al menos aproximadamente 1 % en tres poblaciones distintas a la población de interés (por ejemplo, chino, japonés y yoruba), y/o (e) no tienen una desviación significativa del equilibrio de Hardy-Weinberg en ninguna de estas poblaciones. En algunos casos, pueden seleccionarse más de 100000, 150000 o 200000 loci humanos que cumplen con los criterios (a) a (e). De los loci humanos que cumplen con los criterios (a) a (e), puede seleccionarse un grupo de loci (por ejemplo, máximo 2500, 5000, 7500, 10000, 20000, 30000, 40000, 50 000, 75000, 100000, 150000 o 200000 loci) de manera que los loci tengan un alto grado de frecuencia de alelos en la población de interés, abarquen el genoma humano de una manera un tanto espaciada (por ejemplo, al menos un locus de interés cada 5 kb, 10 kb, 25 kb, 50 kb, 75 kb, 100 kb, 150 kb, 200 kb, 300 kb, 400 kb, 500 kb o más), y no estén en desequilibrio de ligamiento con otro locus seleccionado en ninguna de las poblaciones usadas para el análisis. En algunos casos, pueden seleccionarse alrededor de 40, 50, 60, 70, 80, 90, 100, 110, 120, 130 mil o más loci para cumplir con cada uno de estos criterios e incluirlos en un ensayo configurado para identificar regiones de desequilibrio alélico en un genoma humano. Por ejemplo, pueden seleccionarse entre aproximadamente 70 000 y aproximadamente 90 000 (por ejemplo, aproximadamente 80000) SNP para el análisis con un ensayo basado en matriz de SNP, y entre aproximadamente 45 000 y aproximadamente 55000 (por ejemplo, aproximadamente 54000) SNP pueden seleccionarse para el análisis con un ensayo basado en secuenciación.
En consecuencia, en un aspecto de la presente descripción, se proporciona un método para detectar el estado de desequilibrio alélico en una pluralidad de loci genómicos en una muestra de un paciente, que comprende las etapas de enriquecer una muestra de ADN genómico en moléculas de ADN cada una que comprende un locus de interés; secuenciar dichas moléculas de ADN para determinar el genotipo en cada locus; determinar para cada locus si tiene un desequilibrio alélico.
En otro aspecto de la presente descripción, se proporciona un método para detectar el estado de LOH en una pluralidad de loci genómicos en una muestra de un paciente, que comprende las etapas de enriquecer una muestra de ADN genómico en moléculas de ADN cada una que comprende un locus de interés; secuenciar dichas moléculas de ADN para determinar el genotipo en cada locus; determinar para cada locus homocigoto si es homocigoto debido a LOH.
En otro aspecto de la presente descripción, se proporciona un método para detectar el estado del número de copias en una pluralidad de loci genómicos en una muestra de un paciente, que comprende las etapas de enriquecer una muestra de ADN genómico en moléculas de ADN cada una que comprende un locus de interés; secuenciar dichas moléculas de ADN; y cuantificar cada alelo en cada locus para determinar su número de copias.
En algunas modalidades se evalúan al menos 10, 50, 100, 1000, 10000, 50000, 55000, 75000, 100000, 150000, 200 000, 300 000, 400 000, 500 000, 750 000, 1000 000, 2 000 000 o más loci. En algunas modalidades estos loci están separados uniformemente a lo largo del genoma. Como se usa en la presente descripción, los loci están "separados uniformemente a lo largo del genoma" cuando la diferencia porcentual entre la distanciaAB entre dos loci A y B y la distanciaCD entre cualquiera de otros dos loci C y D (es decir, 100*(distanciaAB - distanciaC ü )/distanciaAB o 100*(distanciaAB - distanciaCD)/distanciaCD) es menor o igual a 50 %, 40 %, 30 %, 20 %, 15 %, 10 %, 9 %, 8 %, 7 %, 6 %, 5 %, 4 %, 3 %, 2 %, o 1 %. Tal diferencia porcentual se denomina en la presente descripción la "separación genómica" de los loci. En algunas modalidades la muestra es una muestra de tejido FFPE. En algunas modalidades la muestra es una muestra tumoral del paciente.
Otro aspecto de la descripción proporciona un sistema para determinar el estado de desequilibrio alélico en una pluralidad de loci en una muestra que comprende: un analizador de muestras para (1) enriquecer una muestra de ADN genómico en moléculas de ADN cada una que comprende un locus de interés y (2) secuenciar dichas moléculas de ADN para producir una pluralidad de señales cuantitativas sobre cada locus; un programa informático para analizar dicha pluralidad de señales cuantitativas para determinar si cada locus tiene un desequilibrio alélico.
Otro aspecto de la descripción proporciona un sistema para determinar el estado de LOH en una pluralidad de loci en una muestra que comprende: un analizador de muestras para (1) enriquecer una muestra de ADN genómico en moléculas de ADN cada una que comprende un locus de interés y (2) secuenciar dichas moléculas de ADN para producir una pluralidad de señales cuantitativas sobre cada locus; un programa informático para analizar dicha pluralidad de señales cuantitativas para determinar si cada locus es homocigoto en la muestra; y un programa informático para determinar para cada locus homocigoto si es homocigoto debido a LOH.
Otro aspecto de la descripción proporciona un sistema para detectar el estado del número de copias en una pluralidad de loci genómicos en una muestra de un paciente que comprende: un analizador de muestras para (1) enriquecer una muestra de ADN genómico en moléculas de ADN cada una que comprende un locus de interés y (2) secuenciar dichas moléculas de ADN para producir una pluralidad de señales cuantitativas sobre cada locus; y un programa informático para analizar dicha pluralidad de señales cuantitativas para cuantificar cada alelo en cada locus para determinar su número de copias.
En algunas modalidades de los sistemas de la descripción, un analizador de muestras enriquece la muestra de ADN de interés y secuencia ese ADN. En otras modalidades dos o más analizadores de muestras realizan estas funciones. En algunas modalidades, un programa de software analiza la pluralidad de señales cuantitativas para determinar si cada locus es homocigoto en la muestra y también determina para cada locus homocigoto si es homocigoto debido a LOH.
La figura 3 es un diagrama de un ejemplo de un dispositivo informático 1400 y un dispositivo informático móvil 1450, que puede usarse con las técnicas descritas en la presente descripción. El dispositivo informático 1400 está destinado a representar varias formas de ordenadores digitales, tales como ordenadores portátiles, ordenadores de escritorio, estaciones de trabajo, asistentes digitales personales, servidores, servidores blade, unidades centrales de procesamiento y otros ordenadores apropiados. El dispositivo informático 1450 está destinado a representar diversas formas de dispositivos móviles, tales como asistentes digitales personales, teléfonos celulares, teléfonos inteligentes y otros dispositivos informáticos similares. Los componentes que se muestran aquí, sus conexiones y relaciones, y sus funciones, están destinados a ser solo ilustrativos, y no están destinados a limitar las implementaciones de las invenciones descritas y/o reivindicadas en este documento.
El dispositivo informático 1400 incluye un procesador 1402, memoria 1404, un dispositivo de almacenamiento 1406, una interfaz de alta velocidad 1408 que se conecta a la memoria 1404 y los puertos de expansión de alta velocidad 1410, y una interfaz de baja velocidad 1415 que se conecta al bus de baja velocidad 1414 y al dispositivo de almacenamiento 1406. Cada uno de los componentes 1402, 1404, 1406, 1408, 1410 y 1415, están interconectados mediante diversos buses y pueden montarse en una placa base común o de otras maneras según sea apropiado. El procesador 1402 puede procesar instrucciones para la ejecución dentro del dispositivo informático 1400, incluidas las instrucciones almacenadas en la memoria 1404 o en el dispositivo de almacenamiento 1406 para mostrar información gráfica para un GUI en un dispositivo externo de entrada/salida, tal como una pantalla 1416 acoplada a una interfaz de alta velocidad 1408. En otras implementaciones, pueden usarse múltiples procesadores y/o múltiples buses, según sea apropiado, junto con múltiples memorias y tipos de memoria. Además, pueden conectarse múltiples dispositivos informáticos 1400, donde cada dispositivo proporciona partes de las operaciones necesarias (por ejemplo, como un banco de servidores, un grupo de servidores blade o un sistema multiprocesador).
La memoria 1404 almacena información dentro del dispositivo informático 1400. En una implementación, la memoria 1404 es una unidad o unidades de memoria volátil. En otra implementación, la memoria 1404 es una unidad o unidades de memoria no volátiles. La memoria 1404 también puede ser otra forma de medio legible por ordenador, tal como un disco magnético u óptico.
El dispositivo de almacenamiento 1406 es capaz de proporcionar almacenamiento masivo para el dispositivo informático 1400. En una implementación, el dispositivo de almacenamiento 1406 puede ser o contener un medio legible por ordenador, tal como un dispositivo de disquete, un dispositivo de disco duro, un dispositivo de disco óptico o un dispositivo de cinta, una memoria flash u otro dispositivo de memoria de estado sólido similar, o una disposición de dispositivos, incluidos los dispositivos en una red de área de almacenamiento u otras configuraciones. Un producto de programa informático puede incorporarse de manera tangible en un portador de información. El producto de programa informático también puede contener instrucciones que, cuando se ejecutan, realizan uno o más métodos, tales como los descritos en la presente descripción. El portador de información es un medio legible por ordenador o máquina, tal como la memoria 1404, el dispositivo de almacenamiento 1406, la memoria en el procesador 1402 o una señal propagada.
El controlador de alta velocidad 1408 gestiona las operaciones intensivas de ancho de banda para el dispositivo informático 1400, mientras que el controlador de baja velocidad 1415 gestiona las operaciones intensivas de menor ancho de banda. Tal asignación de funciones es solo ilustrativa. En una implementación, el controlador de alta velocidad 1408 está acoplado a la memoria 1404, la pantalla 1416 (por ejemplo, a través de un procesador o acelerador gráfico) y a puertos de expansión de alta velocidad 1410, que pueden aceptar varias tarjetas de expansión (no mostradas). En la implementación, el controlador de baja velocidad 1415 está acoplado al dispositivo de almacenamiento 1406 y al puerto de expansión de baja velocidad 1414. El puerto de expansión de baja velocidad, que puede incluir varios puertos de comunicación (por ejemplo, USB, Bluetooth, Ethernet o Ethernet inalámbrico) puede estar acoplado a uno o más dispositivos de entrada/salida, tal como un teclado, un dispositivo de puntero, un escáner, un lector óptico, un detector de señal fluorescente o un dispositivo de red tal como un conmutador o enrutador, por ejemplo, a través de un adaptador de red.
El dispositivo informático 1400 puede implementarse en varias formas diferentes, como se muestra en la figura. Por ejemplo, puede implementarse como un servidor estándar 1420, o múltiples veces en un grupo de tales servidores. También puede implementarse como parte de un sistema de servidores en bastidor 1424. Además, puede implementarse en un ordenador personal tal como un ordenador portátil 1422. Alternativamente, los componentes del dispositivo informático 1400 pueden combinarse con otros componentes en un dispositivo móvil (no mostrado), tal como el dispositivo 1450. Cada uno de tales dispositivos puede contener uno o más de dispositivo informático 1400, 1450, y un sistema completo puede estar compuesto de múltiples dispositivos informáticos 1400, 1450 que se comunican entre sí.
El dispositivo informático 1450 incluye un procesador 1452, memoria 1464, un dispositivo de entrada/salida tal como una pantalla 1454, una interfaz de comunicación 1466 y un transceptor 1468, entre otros componentes (por ejemplo, un escáner, un lector óptico, un detector de señal fluorescente). El dispositivo 1450 también puede proporcionarse con un dispositivo de almacenamiento, tal como un micro disco duro u otro dispositivo, para proporcionar almacenamiento adicional. Cada uno de los componentes 1450, 1452, 1464, 1454, 1466 y 1468, están interconectados mediante el uso de varios buses, y varios de los componentes pueden montarse en una placa base común o de otras maneras según sea apropiado.
El procesador 1452 puede ejecutar instrucciones dentro del dispositivo informático 1450, incluidas las instrucciones almacenadas en la memoria 1464. El procesador puede implementarse como un conjunto de circuitos integrados de chips que incluyen procesadores analógicos y digitales separados y múltiples. El procesador puede proporcionar, por ejemplo, la coordinación de los otros componentes del dispositivo 1450, tal como el control de las interfaces del usuario, las aplicaciones ejecutadas por el dispositivo 1450 y la comunicación inalámbrica por el dispositivo 1450.
El procesador 1452 puede comunicarse con un usuario a través de la interfaz de control 1458 y la interfaz de pantalla 1456 acoplada a una pantalla 1454. La pantalla 1454 puede ser, por ejemplo, una pantalla TFT LCD (pantalla de cristal líquido de transistores de película fina) o una pantalla OLED (diodo emisor de luz orgánica) u otra tecnología de pantalla apropiada. La interfaz de pantalla 1456 puede comprender circuitos apropiados para conducir la pantalla 1454 a presentar información gráfica y otra información a un usuario. La interfaz de control 1458 puede recibir comandos de un usuario y convertirlos para enviarlos al procesador 1452. Además, puede proporcionarse una interfaz externa 1462 en comunicación con el procesador 1452, para permitir la comunicación entre áreas cercanas del dispositivo 1450 con otros dispositivos. La interfaz externa 1462 puede proporcionar, por ejemplo, comunicación por cable en algunas implementaciones, o comunicación inalámbrica en otras implementaciones, y también pueden usarse múltiples interfaces.
La memoria 1464 almacena información dentro del dispositivo informático 1450. La memoria 1464 puede implementarse como uno o más de un medio o medios legibles por ordenador, una unidad o unidades de memoria volátil, o una unidad o unidades de memoria no volátil. La memoria de expansión 1474 también puede proporcionarse y conectarse al dispositivo 1450 a través de la interfaz de expansión 1472, que puede incluir, por ejemplo, una interfaz de tarjeta SIMM (módulo de memoria en línea individual). Tal memoria de expansión 1474 puede proporcionar espacio de almacenamiento extra para el dispositivo 1450, o también puede almacenar aplicaciones u otra información para el dispositivo 1450. Por ejemplo, la memoria de expansión 1474 puede incluir instrucciones para llevar a cabo o complementar los procesos descritos en la presente descripción, y también puede incluir información segura. Por lo tanto, por ejemplo, la memoria de expansión 1474 puede proporcionarse como un módulo de seguridad para el dispositivo 1450, y puede programarse con instrucciones que permitan el uso seguro del dispositivo 1450. Además, pueden proporcionarse aplicaciones seguras a través de las tarjetas SIMM, junto con información adicional, tal como colocar información de identificación en la tarjeta SIMM de manera no pirateable.
La memoria puede incluir, por ejemplo, memoria flash y/o memoria NVRAM, como se describe más adelante. En una implementación, un producto de programa informático se incorpora tangiblemente en un portador de información. El producto de programa informático contiene instrucciones que, cuando se ejecutan, realizan uno o más métodos, tales como los descritos en la presente descripción. El portador de información es un medio legible por ordenador o máquina, tal como la memoria 1464, la memoria de expansión 1474, la memoria en el procesador 1452 o una señal propagada que puede ser recibida, por ejemplo, a través del transceptor 1468 o la interfaz externa 1462.
El dispositivo 1450 puede comunicarse de forma inalámbrica a través de la interfaz de comunicación 1466, que puede incluir circuitos de procesamiento de señal digital cuando sea necesario. La interfaz de comunicación 1466 puede proporcionar comunicaciones bajo varios modos o protocolos, tales como llamadas de voz GSM, SMS, EMS o mensajería MMS, CDMA, TDMA, PDC, WCDMA, CDMA2000 o GPRS, entre otros. Tal comunicación puede ocurrir, por ejemplo, a través del transceptor de radiofrecuencia 1468. Además, puede ocurrir una comunicación de corto alcance, tal como mediante el uso de un Bluetooth, WiFi u otro transceptor (no se muestra). Además, el módulo receptor GPS (Sistema de posicionamiento global) 1470 puede proporcionar datos inalámbricos adicionales de navegación y ubicación al dispositivo 1450, que pueden usarse según sea apropiado por las aplicaciones que se ejecutan en el dispositivo 1450.
El dispositivo 1450 también puede comunicarse de forma audible mediante el uso de un códec de audio 1460, que puede recibir información hablada de un usuario y convertirla en una información digital que puede usarse. El códec de audio 1460 también puede generar un sonido audible para un usuario, tal como a través de un altavoz, por ejemplo, en un microteléfono del dispositivo 1450. Tal sonido puede incluir sonido de llamadas telefónicas de voz, puede incluir sonido grabado (por ejemplo, mensajes de voz, archivos de música, etc.) y también puede incluir sonido generado por aplicaciones que operan en el dispositivo 1450.
El dispositivo informático 1450 puede implementarse en varias formas diferentes, como se muestra en la figura. Por ejemplo, puede implementarse como un teléfono celular 1480. También puede implementarse como parte de un teléfono inteligente 1482, asistente digital personal u otro dispositivo móvil similar.
Pueden realizarse diversas implementaciones de los sistemas y técnicas descritos en la presente descripción en circuitos electrónicos digitales, circuitos integrados, ASIC especialmente diseñados (circuitos integrados específicos de aplicación), hardware de ordenador, firmware, software y/o combinaciones de estos. Estas diversas implementaciones pueden incluir la implementación en uno o más programas de ordenador que pueden ejecutarse y/o interpretarse en un sistema programable que incluye al menos un procesador programable, que puede tener un propósito especial o general, acoplado para recibir datos e instrucciones, y para transmitir datos e instrucciones a, un sistema de almacenamiento, al menos un dispositivo de entrada y al menos un dispositivo de salida.
Estos programas de ordenador (también conocidos como programas, software, aplicaciones de software o código) incluyen instrucciones de máquina para un procesador programable, y pueden implementarse en un procedimiento de alto nivel y/o lenguaje de programación orientado a objetos y/o lenguaje ensamblador/de máquina. Como se usa en la presente descripción, los términos "medio legible por máquina" y "medio legible por ordenador" se refieren a cualquier producto de programa informático, aparato y/o dispositivo (por ejemplo, discos magnéticos, discos ópticos, memoria y dispositivos lógicos programables (p Ld )) usado para proporcionar instrucciones de máquina y/o datos a un procesador programable incluido un medio legible por máquina que recibe instrucciones de máquina como una señal legible por máquina. El término "señal legible por máquina" se refiere a cualquier señal usada para proporcionar instrucciones de máquina y/o datos a un procesador programable.
Para proporcionar interacción con un usuario, los sistemas y técnicas descritos en la presente descripción pueden implementarse en un ordenador que tenga un dispositivo de visualización (por ejemplo, un CRT (tubo de rayos catódicos) o un monitor LCD (pantalla de cristal líquido) para mostrar información al usuario y un teclado y un dispositivo de puntero (por ejemplo, un ratón o una bola rastreadora) mediante el cual el usuario puede proporcionar la entrada al ordenador. Otros tipos de dispositivos pueden usarse para proporcionar la interacción con un usuario también, por ejemplo, la retroalimentación proporcionada al usuario puede ser cualquier forma de retroalimentación sensorial (por ejemplo, retroalimentación visual, retroalimentación auditiva, y/o retroalimentación táctil), y la entrada del usuario puede ser recibida en cualquier forma, incluida la entrada acústica, hablada o táctil.
Los sistemas y técnicas descritos en la presente descripción pueden implementarse en un sistema informático que incluye un componente back end (por ejemplo, un servidor de datos), o que incluye un componente de middleware (por ejemplo, un servidor de aplicaciones), o que incluye un componente front end (por ejemplo, una ordenador del cliente que tiene una interfaz del usuario gráfica y/o un navegador a través del cual un usuario puede interactuar con una implementación de los sistemas y técnicas descritas en la presente descripción), o cualquier combinación de tales componentes back end, middleware, o front end. Los componentes del sistema pueden interconectarse mediante cualquier forma o medio de comunicación de datos digitales (por ejemplo, una red de comunicación). Los ejemplos de redes de comunicación incluyen una red de área local ("LAN"), y una red de área amplia ("WAN"), y el Internet.
El sistema informático puede incluir clientes y servidores. Un cliente y un servidor generalmente están alejados entre sí y generalmente interactúan a través de una red de comunicación. La relación entre cliente y servidor surge en virtud de los programas informáticos que se ejecutan en los ordenadores respectivos y que tienen una relación cliente-servidor entre sí.
En algunos casos, un sistema proporcionado en la presente descripción puede configurarse para incluir uno o más analizadores de muestras. Un analizador de muestras puede configurarse para producir una pluralidad de señales sobre el ADN genómico de una célula cancerosa. Por ejemplo, un analizador de muestras puede producir señales que pueden interpretarse de una manera que identifique el estado de desequilibrio alélico de los loci a lo largo de un cromosoma. En algunos casos, un analizador de muestras puede configurarse para llevar a cabo una o más etapas de un ensayo basado en secuenciación y puede configurarse para producir y/o capturar señales de tales ensayos. En algunos casos, un sistema informático proporcionado en la presente descripción puede configurarse para incluir un dispositivo informático. En tales casos, el dispositivo informático puede configurarse para recibir señales de un analizador de muestras.
El dispositivo informático puede incluir instrucciones ejecutables por ordenador o un programa informático (por ejemplo, software) que contenga instrucciones ejecutables por ordenador para llevar a cabo uno o más de los métodos o etapas descritos en la presente descripción. En algunos casos, tales instrucciones ejecutables por ordenador pueden dar una instrucción a un dispositivo informático para que analice las señales de un analizador de muestras, de otro dispositivo informático o de un ensayo basado en secuenciación. El análisis de tales señales puede llevarse a cabo para determinar genotipos, el desequilibrio alélico en ciertos loci, las regiones de desequilibrio alélico, el número de regiones de desequilibrio alélico, para determinar el tamaño de las regiones de desequilibrio alélico, para determinar el número de regiones de desequilibrio alélico que tienen un tamaño o intervalo de tamaños particular, o para determinar una combinación de estos elementos.
En algunos casos, un sistema proporcionado en la presente descripción puede incluir instrucciones ejecutables por ordenador o un programa informático (por ejemplo, software) que contiene instrucciones ejecutables por ordenador para formatear una salida que proporciona una indicación sobre el número de copias, el desequilibrio alélico, la LOH o una combinación de estos elementos.
En algunos casos, un sistema proporcionado en la presente descripción puede incluir un dispositivo de preprocesamiento configurado para procesar una muestra (por ejemplo, células cancerosas) de manera que pueda realizarse un ensayo basado en secuenciación. Los ejemplos de dispositivos de preprocesamiento incluyen, sin limitación, dispositivos configurados para enriquecer poblaciones celulares en células cancerosas en lugar de células no cancerosas, dispositivos configurados para lisar células y/o extraer ácido nucleico genómico, y dispositivos configurados para enriquecer una muestra en fragmentos de ADN genómico particulares.
EJEMPLOS
El proceso descrito aquí utilizó un sistema de captura Agilent SureSelect seguido de la secuenciación en Illumina HiSeq, sin embargo, podría usarse cualquier método de captura en solución o basado en soporte sólido y la plataforma de secuenciación en paralelo de alto rendimiento.
El proceso de selección de diseño inicial utilizó los ~2,5 millones de SNP en la matriz de SNP Illumina Omni2.5. Se eligió esta lista de los SNP porque actualmente es la lista más grande de los SNP a partir de la cual existe información de genotipado disponible para múltiples grupos poblacionales diferentes. Todas las ubicaciones de 2 448 785 SNP se introdujeron en el asistente de Agilent eArray Sure Select Target Enrichment para lecturas largas de extremo único mediante el uso de las configuraciones predeterminadas. 1353 042 pasaron los criterios de selección y tuvieron cebos diseñados.
Después, se seleccionaron 110 000 SNP con altas frecuencias de alelos minoritarios y que abarcan el genoma uniformemente. En la selección, se descartaron los SNP en desequilibrio de ligamiento fuerte y los SNP con una fuerte desviación del equilibrio de Hardy-Weinberg.
Se construyeron dos diseños de bibliotecas preliminares compuestos por 55000 sondas, cada una que se dirige a 55000 ubicaciones de SNP diferentes. Las pruebas se llevaron a cabo mediante el uso de una muestra de ADN normal de alta calidad para verificar la captura uniforme de ambos alelos de cada SNP. Además, se capturaron 4 muestras FFPE y se usaron para seleccionar las sondas con el rendimiento más óptimo. Se buscaron sondas que mostraran una captura robusta e incluso una profundidad de secuencia sin representación excesiva o insuficiente de las lecturas de secuencia en la biblioteca de secuenciación final.
El diseño final de bibliotecas de sondas de captura estaba compuesto por las 55 000 sondas óptimas identificadas mediante el uso de los diseños de captura preliminares.
Los resultados de la medición del número de copias y LOH mediante el uso de la técnica de secuenciación anterior se muestran en la Figura 2 (donde la Figura 1 muestra el análisis de micromatrices en tejido fresco congelado como una comparación).
Aunque la invención anterior se ha descrito en algún detalle a modo de ilustración y ejemplo para propósitos de claridad y comprensión, resultará evidente que ciertos cambios y modificaciones pueden ponerse en práctica dentro del alcance de las reivindicaciones adjuntas.

Claims (8)

REIVINDICACIONES
1. Un método in vitro para detectar el estado de pérdida de heterocigosidad (LOH) en una pluralidad de loci genómicos de SNP en una muestra de tejido embebida en parafina, fijada en formalina de un paciente, que comprende: enriquecer una muestra de ADN genómico en moléculas de ADN cada una que comprende un locus de SNP de interés;
secuenciar dichas moléculas de ADN para determinar el genotipo en cada locus de SNP;
determinar para cada locus de SNP homocigoto si es homocigoto debido a LOH.
2. Uso de un sistema para determinar el estado de LOH en una pluralidad de loci genómicos de SNP en una muestra de tejido embebida en parafina, fijada en formalina, en donde el sistema comprende:
un analizador de muestras para
(1) enriquecer una muestra de ADN genómico en moléculas de ADN cada una que comprende un locus de SNP de interés y
(2) secuenciar dichas moléculas de ADN para producir una pluralidad de señales cuantitativas sobre cada locus de SNP;
un medio de programa informático para analizar dicha pluralidad de señales cuantitativas para determinar el genotipo de cada locus de SNP en la muestra; y
un medio informático para determinar para cada locus de SNP homocigoto si es homocigoto debido a LOH.
3. El método de conformidad con la reivindicación 1 o el uso del sistema de conformidad con la reivindicación 2, en donde dicha pluralidad de loci de SNP genómicos comprende al menos 10, 50, 100, 1000, 10000, 50000, 55000, 75 000, 100000, 150000, 200000, 300000, 400000, 500000, 750000, 1000000 o 2000000 o más loci.
4. El método de conformidad con la reivindicación 1 o el uso del sistema de conformidad con la reivindicación 2, en donde se determina que un locus de SNP tiene un desequilibrio alélico si la proporción de copias mayoritarias en el locus de SNP es 0.51 o mayor.
5. El método de conformidad con la reivindicación 1 o el uso del sistema de conformidad con la reivindicación 2, en donde dichos loci genómicos de SNP están espaciados de uniformemente a lo largo del genoma.
6. El método de conformidad con la reivindicación 5, en donde la diferencia porcentual entre la distancia entre dos cualesquiera de dicha pluralidad de loci genómicos de SNP y la distancia entre cualesquiera otros dos de dicha pluralidad de loci de SNP es menor o igual a 50 %, 40 %, 30 %, 20 %, 15 %, 10 %, 9 %, 8 %, 7 %, 6 %, 5 %, 4 %, 3 %, 2 % o 1 %.
7. El método de conformidad con la reivindicación 1 o el uso del sistema de conformidad con la reivindicación 2, en donde dicha muestra es una muestra tumoral extraída del paciente.
8. El método de conformidad con la reivindicación 7, en donde dicha muestra tumoral contiene al menos 5 %, 10 %, 15 %, 20 %, 25 %, 30 %, 35 %, 40 %, 45 %, 50 %, 55 %, 60 %, 65 %, 70 %, 75 %, 80 %, 85 %, 90 %, 95 %, 99 % o más de contaminación con células notumorales.
ES12801070T 2011-06-17 2012-06-15 Métodos y materiales para evaluar el desequilibrio alélico Active ES2768344T3 (es)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US201161498418P 2011-06-17 2011-06-17
PCT/US2012/042668 WO2012174378A2 (en) 2011-06-17 2012-06-15 Methods and materials for assessing allelic imbalance

Publications (1)

Publication Number Publication Date
ES2768344T3 true ES2768344T3 (es) 2020-06-22

Family

ID=47357765

Family Applications (1)

Application Number Title Priority Date Filing Date
ES12801070T Active ES2768344T3 (es) 2011-06-17 2012-06-15 Métodos y materiales para evaluar el desequilibrio alélico

Country Status (6)

Country Link
US (5) US9279156B2 (es)
EP (2) EP3693473A1 (es)
JP (1) JP6117194B2 (es)
CA (1) CA2839210A1 (es)
ES (1) ES2768344T3 (es)
WO (1) WO2012174378A2 (es)

Families Citing this family (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9512485B2 (en) 2010-08-24 2016-12-06 Dana-Farber Cancer Institute. Inc. Methods for predicting anti-cancer response
JP6117194B2 (ja) * 2011-06-17 2017-04-19 ミリアド・ジェネティックス・インコーポレイテッド アレル不均衡を評価するための方法および材料
EP2794907B2 (en) 2011-12-21 2022-11-23 Myriad Genetics, Inc. Methods and materials for assessing loss of heterozygosity
ES2687024T3 (es) 2012-02-23 2018-10-23 Children's Medical Center Corporation Procedimientos para predecir la respuesta contra el cáncer
CA3190075A1 (en) 2012-06-07 2013-12-12 Institut Curie Methods for detecting inactivation of the homologous recombination pathway (brca1/2) in human tumors
WO2014160080A1 (en) 2013-03-14 2014-10-02 Children's Medical Center Corporation Cancer diagnosis, treatment selection and treatment
EP4023765A1 (en) 2013-12-09 2022-07-06 Institut Curie Methods for detecting inactivation of the homologous recombination pathway (brca1/2) in human tumors
WO2016025958A1 (en) 2014-08-15 2016-02-18 Myriad Genetics, Inc. Methods and materials for assessing homologous recombination deficiency
WO2016071987A1 (ja) * 2014-11-06 2016-05-12 株式会社島津製作所 分析装置システム及び該システム用プログラム
JP2021534803A (ja) * 2018-09-04 2021-12-16 ガーダント ヘルス, インコーポレイテッド 無細胞核酸試料におけるアレル不均衡を検出するための方法およびシステム
CN111534579B (zh) * 2020-05-08 2023-11-03 上海思路迪医学检验所有限公司 基于捕获测序的大片段重排检测的捕获探针、试剂盒和检测方法
BE1029144B1 (fr) 2021-02-25 2022-09-20 Oncodna Méthode de caracterisation d'une tumeur à l'aide d'un séquençage ciblé

Family Cites Families (83)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
YU33730B (en) 1967-04-18 1978-02-28 Farmaceutici Italia Process for preparing a novel antibiotic substance and salts thereof
GB1432563A (en) 1972-04-10 1976-04-22 Rustenburg Platinum Mines Ltd Platinum- co-ordination compounds
GB1432562A (en) 1972-04-10 1976-04-22 Rustenburg Platinum Mines Ltd Platinum co-ordination compounds
ES444380A1 (es) 1976-01-16 1977-06-16 Gosalvez Mario Un procedimiento para preparar derivados metalicos antraci- clinicos.
US4950738A (en) 1984-09-13 1990-08-21 Cytogen Corporation Amine derivatives of anthracycline antibiotics
US5977082A (en) 1985-08-02 1999-11-02 Pharmacia & Upjohn Company Injectable ready-to-use solutions containing an antitumor anthracycline glycoside
DE3630497A1 (de) 1986-09-08 1988-03-10 Behringwerke Ag Cis-platin-komplexe, verfahren zu ihrer herstellung und diese verbindungen enthaltende pharmazeutische mittel
EP0290280B1 (en) 1987-05-08 1994-01-19 Sankyo Company Limited Anti-tumor platinum complexes, their preparation and their therapeutic use
US4996337A (en) 1987-06-23 1991-02-26 American Cyanamid Company Synthesis of cisplatin analogs
US5177075A (en) 1988-08-19 1993-01-05 Warner-Lambert Company Substituted dihydroisoquinolinones and related compounds as potentiators of the lethal effects of radiation and certain chemotherapeutic agents; selected compounds, analogs and process
US5434256A (en) 1988-11-22 1995-07-18 Board Of Regents, The University Of Texas System Diamine platinum complexes as antitumor agents
US4946954A (en) 1989-01-17 1990-08-07 Georgetown University Platinum pharmaceutical agents
US5143854A (en) 1989-06-07 1992-09-01 Affymax Technologies N.V. Large scale photolithographic solid phase synthesis of polypeptides and receptor binding screening thereof
US6040138A (en) 1995-09-15 2000-03-21 Affymetrix, Inc. Expression monitoring by hybridization to high density oligonucleotide arrays
US5744101A (en) 1989-06-07 1998-04-28 Affymax Technologies N.V. Photolabile nucleoside protecting groups
AU647741B2 (en) 1989-12-01 1994-03-31 Regents Of The University Of California, The Methods and compositions for chromosome-specific staining
US5295944A (en) 1991-05-14 1994-03-22 Dana-Farber Cancer Institute Method for treating a tumor with ionizing radiation
NZ245112A (en) 1991-11-15 1995-07-26 Smithkline Beecham Corp Pharmaceutical composition comprising a camptothecin analog and a platinum coordination compound
US5587384A (en) 1994-02-04 1996-12-24 The Johns Hopkins University Inhibitors of poly(ADP-ribose) synthetase and use thereof to treat NMDA neurotoxicity
US5578832A (en) 1994-09-02 1996-11-26 Affymetrix, Inc. Method and apparatus for imaging a sample on a device
US5539083A (en) 1994-02-23 1996-07-23 Isis Pharmaceuticals, Inc. Peptide nucleic acid combinatorial libraries and improved methods of synthesis
US5556752A (en) 1994-10-24 1996-09-17 Affymetrix, Inc. Surface-bound, unimolecular, double-stranded DNA
US5837492A (en) 1995-12-18 1998-11-17 Myriad Genetics, Inc. Chromosome 13-linked breast cancer susceptibility gene
GB9620209D0 (en) 1996-09-27 1996-11-13 Cemu Bioteknik Ab Method of sequencing DNA
GB9626815D0 (en) 1996-12-23 1997-02-12 Cemu Bioteknik Ab Method of sequencing DNA
IL131978A0 (en) 1997-03-20 2001-03-19 Univ Washington Solvent for biopolymer synthesis solvent microdots and methods of use
US6214821B1 (en) 1998-03-05 2001-04-10 Washington State University Research Foundation Methods and composition for the inhibition of cancer cells
GB9806324D0 (en) 1998-03-24 1998-05-20 Pharmacia & Upjohn Spa Antitumour synergetic composition
GB9808145D0 (en) * 1998-04-17 1998-06-17 Zeneca Ltd Assay
US20030049613A1 (en) 1998-08-17 2003-03-13 Manuel Perucho Methods for identifying somatic changes in genomic sequences useful for cancer diagnosis and prognosis
US6465177B1 (en) 1998-10-26 2002-10-15 John Wayne Cancer Institute Detection of loss of heterozygosity in tumor and serum of melanoma patients
WO2000040755A2 (en) * 1999-01-06 2000-07-13 Cornell Research Foundation, Inc. Method for accelerating identification of single nucleotide polymorphisms and alignment of clones in genomic sequencing
US6261775B1 (en) 1999-04-09 2001-07-17 The Regents Of The University Of California Detection of chromosome copy number changes to distinguish melanocytic nevi from malignant melanoma
US6274320B1 (en) 1999-09-16 2001-08-14 Curagen Corporation Method of sequencing a nucleic acid
US7858331B2 (en) 2000-11-03 2010-12-28 Dana Farber Cancer Institute, Inc. Compositions and methods for the treatment of cancer
US6887996B2 (en) 2000-12-01 2005-05-03 Guilford Pharmaceuticals Inc. Compounds and their use
GB0121285D0 (en) 2001-09-03 2001-10-24 Cancer Res Ventures Ltd Anti-cancer combinations
JP2006523082A (ja) * 2002-03-01 2006-10-12 ラブジェン, インコーポレイテッド ゲノム内の変異の迅速分析
WO2004042032A2 (en) 2002-11-01 2004-05-21 The Ohio State University Research Foundation Cytogenetic abnormalities that are predictive of response to therapy for chronic lymphocytic leukemia
WO2004072269A2 (en) * 2003-02-12 2004-08-26 Mayo Foundation For Medical Education And Research Bex4 nucleic acids, polypeptides, and method of using
US20040170983A1 (en) 2003-02-27 2004-09-02 Danenberg Kathleen D. Methods of determining a chemotherapuetic regimin based on loss of heterozygosity at the thymidylate synthase locus
US20050112604A1 (en) 2003-03-14 2005-05-26 Akihide Fujimoto Loss of heterozygosity of the DNA markers in the 12q22-23 region
US7754684B2 (en) 2003-06-11 2010-07-13 Access Pharmaceuticals, Inc. Macromolecular platinum chelates
ATE520702T1 (de) 2003-07-02 2011-09-15 Solux Corp Thermisch stabiles kristallines epirubicin- hydrochlorid und herstellungsverfahren dafür
ATE454893T1 (de) 2003-07-25 2010-01-15 Cancer Rec Tech Ltd Tricyclische parp-hemmer
US7566798B2 (en) 2003-08-13 2009-07-28 University Of South Florida Platinum complexes and methods of use
US20080108057A1 (en) * 2004-06-22 2008-05-08 Griffith Jeffrey K Allelic imbalance in the diagnosis and prognosis of cancer
US7860840B2 (en) 2004-10-05 2010-12-28 Microsoft Corporation Maintaining correct transaction results when transaction management configurations change
US20060088871A1 (en) * 2004-10-22 2006-04-27 Finkelstein Sydney D Dynamic genomic deletion expansion and formulation of molecular marker panels for integrated molecular pathology diagnosis and characterization of tissue, cellular fluid, and pure fluid specimens
US20070070349A1 (en) 2005-09-23 2007-03-29 Helicos Biosciences Corporation Optical train and method for TIRF single molecule detection and analysis
EP1856292B1 (en) 2005-03-09 2013-10-30 Abbott Laboratories Diagnostic methods for identifying candidate patients for the treatment with trastuzumab.
CA2604095A1 (en) * 2005-04-12 2006-10-19 454 Life Sciences Corporation Methods for determining sequence variants using ultra-deep sequencing
CN101163485A (zh) 2005-04-21 2008-04-16 阿尔扎公司 用包封于脂质体的多柔比星治疗晚期卵巢癌的方法
WO2006128195A2 (en) 2005-05-27 2006-11-30 Dana-Farber Cancer Institute Methods of diagnosing and treating cancer by detection of chromosomal abnormalities
US7759488B2 (en) 2005-06-30 2010-07-20 Bionumerik Pharmaceuticals, Inc. Monoazole ligand platinum analogs
WO2007035893A2 (en) * 2005-09-21 2007-03-29 Bioarray Solutions, Ltd. Use of ivt with single stranded primer promoter selector constructs
US20080262062A1 (en) 2006-11-20 2008-10-23 Bipar Sciences, Inc. Method of treating diseases with parp inhibitors
WO2008112193A1 (en) 2007-03-12 2008-09-18 Dana-Farber Cancer Institute Prognostic, diagnostic, and cancer therapeutic uses of fanci and fanci modulating agents
EA018555B1 (ru) 2007-09-07 2013-08-30 Флуидигм Корпорейшн Определение вариаций количества копий, способы и системы
CN101917982B (zh) 2007-11-12 2013-03-20 彼帕科学公司 使用4-碘-3-硝基苯甲酰胺与抗肿瘤剂组合治疗乳腺癌
AU2008333786A1 (en) 2007-12-07 2009-06-11 Bipar Sciences, Inc. Treatment of cancer with combinations of topoisomerase inhibitors and PARP inhibitors
US20090246789A1 (en) * 2008-03-25 2009-10-01 University Of South Carolina Gene Mutation Profiling of CSMD1
WO2009148528A2 (en) 2008-05-30 2009-12-10 Millennium Pharmaceuticals, Inc. Assessment of chromosomal alterations to predict clinical outcome of bortezomib treatment
CN102144037A (zh) 2008-07-07 2011-08-03 牛津纳米孔技术有限公司 检测碱基的孔
US8583380B2 (en) 2008-09-05 2013-11-12 Aueon, Inc. Methods for stratifying and annotating cancer drug treatment options
EP2359277A2 (en) 2008-10-31 2011-08-24 Abbott Laboratories Genomic classification of colorectal cancer based on patterns of gene copy number alterations
WO2010059742A1 (en) 2008-11-18 2010-05-27 Collabrx, Inc. Individualized cancer treatment
US8206910B2 (en) 2008-12-08 2012-06-26 The Cleveland Clinic Foundation Targets for use in diagnosis, prognosis and therapy of breast cancer
KR100925337B1 (ko) 2009-05-25 2009-11-09 주식회사 마크로젠 염색체 수 이상 검출을 통한 유방암 약물 반응성 예측
EP2491139A1 (en) 2009-10-19 2012-08-29 Stichting Het Nederlands Kanker Instituut Predicting benefit of anti-cancer therapy via array comparative genomic hybridization
WO2011106541A2 (en) 2010-02-24 2011-09-01 Myriad Genetics, Inc. Diagnostic methods involving loss of heterozygosity
EP3012329B1 (en) * 2010-06-18 2017-10-25 Myriad Genetics, Inc. Methods and materials for assessing loss of heterozygosity
WO2012019000A2 (en) 2010-08-04 2012-02-09 On-Q-ity Biomarkers for the identification monitoring and treatment of ovarian cancer
US9512485B2 (en) 2010-08-24 2016-12-06 Dana-Farber Cancer Institute. Inc. Methods for predicting anti-cancer response
WO2012092426A1 (en) 2010-12-30 2012-07-05 Foundation Medicine, Inc. Optimization of multigene analysis of tumor samples
JP2013001761A (ja) 2011-06-14 2013-01-07 Nitto Denko Corp 粘着剤組成物、粘着剤層、および粘着シート
JP6117194B2 (ja) * 2011-06-17 2017-04-19 ミリアド・ジェネティックス・インコーポレイテッド アレル不均衡を評価するための方法および材料
EP2794907B2 (en) * 2011-12-21 2022-11-23 Myriad Genetics, Inc. Methods and materials for assessing loss of heterozygosity
ES2687024T3 (es) 2012-02-23 2018-10-23 Children's Medical Center Corporation Procedimientos para predecir la respuesta contra el cáncer
CA3190075A1 (en) 2012-06-07 2013-12-12 Institut Curie Methods for detecting inactivation of the homologous recombination pathway (brca1/2) in human tumors
NZ712663A (en) 2013-04-05 2021-07-30 Myriad Genetics Inc Methods and materials for assessing homologous recombination deficiency
EP4023765A1 (en) 2013-12-09 2022-07-06 Institut Curie Methods for detecting inactivation of the homologous recombination pathway (brca1/2) in human tumors
EP3094752A4 (en) 2014-01-16 2017-08-16 Clovis Oncology, Inc. Use of parp inhibitors to treat breast or ovarian cancer patients showing a loss of heterozygosity

Also Published As

Publication number Publication date
US9279156B2 (en) 2016-03-08
US20170130263A1 (en) 2017-05-11
US20220205022A1 (en) 2022-06-30
US20160145681A1 (en) 2016-05-26
WO2012174378A2 (en) 2012-12-20
US11225685B2 (en) 2022-01-18
EP3693473A1 (en) 2020-08-12
CA2839210A1 (en) 2012-12-20
JP6117194B2 (ja) 2017-04-19
WO2012174378A3 (en) 2013-05-30
EP2721181B1 (en) 2019-12-18
US20200239943A1 (en) 2020-07-30
US9574229B2 (en) 2017-02-21
JP2014519827A (ja) 2014-08-21
US20140162886A1 (en) 2014-06-12
EP2721181A2 (en) 2014-04-23
EP2721181A4 (en) 2014-12-31
US10626449B2 (en) 2020-04-21

Similar Documents

Publication Publication Date Title
ES2768344T3 (es) Métodos y materiales para evaluar el desequilibrio alélico
Collins et al. Defining the diverse spectrum of inversions, complex structural variation, and chromothripsis in the morbid human genome
Job et al. Telomerase activation and ATRX mutations are independent risk factors for metastatic pheochromocytoma and paraganglioma
Hoadley et al. Tumor evolution in two patients with basal-like breast cancer: a retrospective genomics study of multiple metastases
Annala et al. Treatment outcomes and tumor loss of heterozygosity in germline DNA repair–deficient prostate cancer
Kelly et al. Genome-wide mapping of nucleosome positioning and DNA methylation within individual DNA molecules
ES2862331T3 (es) Métodos para predecir el estado de los genes BRCA1 y BRCA2 en una célula de cáncer
Nassar et al. Genomic landscape of carcinogen-induced and genetically induced mouse skin squamous cell carcinoma
ES2909899T3 (es) Métodos para detectar inactivación de la ruta de recombinación homóloga (BRCA1/2) en tumores humanos
Beadling et al. Combining highly multiplexed PCR with semiconductor-based sequencing for rapid cancer genotyping
Wadapurkar et al. Computational analysis of next generation sequencing data and its applications in clinical oncology
Reeser et al. Validation of a targeted RNA sequencing assay for kinase fusion detection in solid tumors
ES2772029T3 (es) Métodos y procesos para la evaluación no invasiva de variaciones genéticas
Huang et al. Identification of false-negative mutations missed by next-generation sequencing in retinitis pigmentosa patients: a complementary approach to clinical genetic diagnostic testing
Schweiger et al. The power of NGS technologies to delineate the genome organization in cancer: from mutations to structural variations and epigenetic alterations
Jaratlerdsiri et al. Next generation mapping reveals novel large genomic rearrangements in prostate cancer
Garsed et al. The genomic and immune landscape of long-term survivors of high-grade serous ovarian cancer
Cha et al. Clinical application of genomic profiling to find druggable targets for adolescent and young adult (AYA) cancer patients with metastasis
EP2971100A1 (en) Primers for dna methylation analysis
Casey et al. Next generation sequencing and a new era of medicine
Zhou et al. Identification of KANSARL as the first cancer predisposition fusion gene specific to the population of European ancestry origin
Bi et al. Long-read individual-molecule sequencing reveals CRISPR-induced genetic heterogeneity in human ESCs
Duraturo et al. Coexistence of MLH3 germline variants in colon cancer patients belonging to families with Lynch syndrome-associated brain tumors
Romagnoli et al. Resolving complex structural variants via nanopore sequencing
Doyle et al. Studying cancer genomics through next-generation DNA sequencing and bioinformatics