ES2945311T3 - Detección rápida de aneuploidía - Google Patents

Detección rápida de aneuploidía Download PDF

Info

Publication number
ES2945311T3
ES2945311T3 ES13768366T ES13768366T ES2945311T3 ES 2945311 T3 ES2945311 T3 ES 2945311T3 ES 13768366 T ES13768366 T ES 13768366T ES 13768366 T ES13768366 T ES 13768366T ES 2945311 T3 ES2945311 T3 ES 2945311T3
Authority
ES
Spain
Prior art keywords
amplicons
chromosome
sequences
dna
dna sample
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
ES13768366T
Other languages
English (en)
Inventor
Bert Vogelstein
Kenneth W Kinzler
Nickolas Papadopoulos
Isaac Kinde
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Johns Hopkins University
Original Assignee
Johns Hopkins University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Johns Hopkins University filed Critical Johns Hopkins University
Application granted granted Critical
Publication of ES2945311T3 publication Critical patent/ES2945311T3/es
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6869Methods for sequencing
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6813Hybridisation assays
    • C12Q1/6827Hybridisation assays for detection of mutation or polymorphism
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6811Selection methods for production or design of target specific oligonucleotides or binding molecules
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6883Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/112Disease subtyping, staging or classification
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/156Polymorphic or mutational markers
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/16Primer sets for multiplex assays

Landscapes

  • Chemical & Material Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Organic Chemistry (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Health & Medical Sciences (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Engineering & Computer Science (AREA)
  • Genetics & Genomics (AREA)
  • Analytical Chemistry (AREA)
  • Microbiology (AREA)
  • Biochemistry (AREA)
  • Biotechnology (AREA)
  • Molecular Biology (AREA)
  • Biophysics (AREA)
  • Physics & Mathematics (AREA)
  • General Health & Medical Sciences (AREA)
  • Immunology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Engineering & Computer Science (AREA)
  • Pathology (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Investigating Or Analysing Materials By Optical Means (AREA)
  • Investigating Or Analysing Materials By The Use Of Chemical Reactions (AREA)
  • Spectrometry And Color Measurement (AREA)

Abstract

Recientemente se demostró que la secuenciación paralela masiva de ADN plasmático materno libre de células es un método de detección seguro y eficaz para las aneuploidías cromosómicas fetales. Aquí, informamos un método de secuenciación mejorado que logra un rendimiento significativamente mayor y un costo reducido al reemplazar los laboriosos pasos de preparación de la biblioteca de secuenciación con PCR que emplea un solo par de cebadores. Usando este enfoque, las muestras que contienen tan solo un 4 % de ADN de trisomía 21 podrían distinguirse fácilmente de las muestras euploides. (Traducción automática con Google Translate, sin valor legal)

Description

DESCRIPCIÓN
Detección rápida de aneuploidía
La presente invención se realizó con fondos de los Institutos Nacionales de Salud de los Estados Unidos, subvenciones CA62924, CA43460 y CA57345. Por lo tanto, el gobierno de los Estados Unidos retiene ciertos derechos sobre la presente invención.
SECTOR TÉCNICO DE LA INVENCIÓN
La presente invención se refiere al área del análisis genético. En particular, se refiere a la evaluación del número relativo de copias de secuencias cromosómicas.
ESTADO DE LA TÉCNICA ANTERIOR
En aproximadamente 1 de cada 140 recién nacidos con vida1 y en una fracción mucho mayor de fetos que no llegan a término o nacen muertos2 se detecta una anomalía cromosómica importante. La aneuploidía más común es la trisomía 21, que actualmente ocurre en 1 de cada 730 nacimientos1. Aunque son menos comunes que la trisomía 21, la trisomía 18 (síndrome de Edwards) y la trisomía 13 (síndrome de Patau) ocurren en 1 de cada 5.500 y 1 de cada 17.200 recién nacidos con vida, respectivamente1. Una gran variedad de defectos congénitos, deficiencias en el crecimiento y discapacidades intelectuales se encuentran en niños con aneuploidías cromosómicas, y estos presentan desafíos de por vida para las familias y las sociedades3. Por estas razones, se ha dedicado mucho esfuerzo a detectar anomalías cromosómicas durante la vida fetal temprana, en un momento en que los abortos terapéuticos pueden ofrecerse como una opción a los futuros padres.
Existe una variedad de pruebas de diagnóstico prenatal que pueden indicar un mayor riesgo de aneuploidía fetal, aunque las pruebas invasivas, tales como la amniocentesis o el muestreo de vellosidades coriónicas, son el modelo de referencia actual4 y están asociadas con un riesgo no despreciable de pérdida fetal. Por lo tanto, se han buscado durante mucho tiempo pruebas no invasivas más fiables para la aneuploidía fetal. Las más prometedoras de estas se basan en la detección de ADN fetal en el plasma materno, tal como inició el grupo de Lo5. Se ha demostrado que la secuenciación paralela masiva de bibliotecas generadas a partir de plasma materno puede detectar de forma fiable anomalías en el cromosoma 21. En el estudio más completo hasta la fecha8, el 98,6 % de los fetos con trisomía 21 se detectaron en el plasma materno, con una tasa de falsos positivos del 0,2 por ciento. En un 0,8 por ciento adicional de las muestras, la prueba no dio ningún resultado. Estos interesantes estudios prometen una nueva era de pruebas prenatales no invasivas. Actualmente, casi la mitad de los bebés con trisomía 21 nacen de madres menores de 35 años, ya que más del 80 % de las mujeres embarazadas tienen menos de 359,10. Aunque se cree que el riesgo de los procedimientos invasivos supera el beneficio de las pruebas invasivas para las madres jóvenes elegibles, está claro que la gran mayoría de los nacimientos asociados con aneuploidías cromosómicas podrían prevenirse de manera segura con pruebas no invasivas fiables que podrían administrarse de manera segura a todas las mujeres embarazadas. Las pruebas prenatales son un ejercicio extraordinariamente estresante para las madres embarazadas y sus familias, y cuanto más rápido sea el proceso, mejor.
Para conseguir este objetivo con las pruebas de ADN fetal circulante, serán necesarias reducciones en el coste y aumentos en el rendimiento. Existen tres componentes principales de las pruebas de ADN en plasma: la preparación de bibliotecas de ADN para cargarlas en el instrumento de secuenciación, la secuenciación de estas bibliotecas y su análisis. El segundo componente está siendo abordado por los fabricantes de instrumentos, que han logrado un progreso notable en los últimos años. Las mejoras potenciales en el primer y tercer componente son el objetivo del presente estudio.
La única prueba disponible en el mercado para la aneuploidía de ADN fetal circulante implica la preparación de bibliotecas de genoma completo y el análisis de una cantidad suficiente de secuencias en los cromosomas relevantes para detectar de forma fiable pequeñas diferencias en el número de copias. La preparación de bibliotecas de genoma completo implica varias etapas secuenciales, que incluyen la reparación de extremos, la fosforilación en 5', la adición de un nucleótido dA terminal en los extremos 3' de los fragmentos, la ligación de los fragmentos a los adaptadores y la amplificación por PCR de los productos ligados, muchas de las cuales requieren purificaciones intermedias. A continuación, los productos de la PCR se cuantifican y se cargan en el instrumento de secuenciación. Después del ciclo de secuenciación, se alinean las etiquetas con el genoma humano y se evalúan con Cariotipado Digital11, es decir, se utiliza el número de etiquetas por locus genómico para construir un cariotipo virtual. Otra prueba descrita recientemente implica menos, pero todavía un gran número, de etapas para preparar bibliotecas para la secuenciación12.
La Patente EP 2261371 A2 da a conocer un procedimiento para amplificar genomas con un solo cebador mediante amplificación por desplazamiento de cadena.
La Patente W02011/087760 A2 da a conocer procesos para identificar aneuploidía, pero no da a conocer la detección de aneuploidía de los cromosomas 21, 13 y 18 utilizando un único par de cebadores.
Existe una necesidad continua en la técnica para detectar anomalías genéticas de forma rápida y no invasiva. CARACTERÍSTICAS DE LA INVENCIÓN
Según una realización de la presente invención, se da a conocer un procedimiento para analizar la aneuploidía en un ser humano, tal como se define en la reivindicación 1 adjunta.
Según otra realización, se da a conocer un procedimiento para analizar cambios en el número de copias de ADN en un ser humano, tal como se define en la reivindicación 9 adjunta.
Se da a conocer un par de cebadores que son útiles para analizar la aneuploidía humana. Un primer cebador comprende la SEQ ID NO: 1 y un segundo cebador que comprende la SeQ ID NO: 2.
Estas y otras realizaciones que resultarán evidentes para los expertos en la materia al leer la memoria descriptiva proporcionan a la técnica nuevas herramientas y procedimientos para evaluar el número de copias genómicas con sensibilidad y rapidez.
DESCRIPCIÓN BREVE DE LOS DIBUJOS
Figuras 1a-1d: Comparación de las distribuciones observadas y predichas de productos de amplificación FAST-SeqS. (Figura 1a) Una representación gráfica de la densidad de la distribución esperada de longitudes de fragmentos, con máximos a 124 y 142 pb. (Figura 1b) Una representación gráfica de la densidad de los recuentos de etiquetas reales obtenidos en ocho ADN de plasma normales. Los fragmentos de 124 pb se amplifican, de manera preferente, en comparación con los fragmentos de 142 pb. Recuadro: gel de poliacrilamida de una biblioteca de secuenciación de FAST-SeqS representativa. Cabe indicar que los productos de amplificación contienen 121 pb adicionales de secuencia flanqueante para facilitar la secuenciación (tabla complementaria 3). (Figura 1c) La representación promedio de retrotransposones L1 dentro de ADN repetitivo en ocho muestras de plasma normales. Aproximadamente el 97 % de las etiquetas se alinean en posiciones que representan solo siete retrotransposones L1. (Figura 1d) Un examen detallado de la distribución observada de ocho ADN de plasma normales en comparación con la distribución de cada uno de los siete retrotransposones L1 predichos mediante RepeatMasker. Las barras de error en cada panel representan el intervalo.
Figuras 2a-2c: Demostración de la capacidad de reproducción de FAST-SeqS. (Figura 2a) Puntuaciones z calculadas para cada autosoma de ocho muestras de ADN de plasma normales. Ningún cromosoma tuvo una puntuación z > 3,0 (intervalo: de -2,1 a 1,9). (Figura 2b) Comparación de las puntuaciones z de pacientes con trisomía 21 (n = 4), trisomía 18 (n = 2) y trisomía 13 (n = 1) con ocho a Dn de bazo o glóbulos blancos normales. Las puntuaciones z que se muestran representan el cromosoma relevante para la comparación. La puntuación z máxima observada para cualquiera de los cromosomas normales comparados fue de 1,9 (chr13). (Figura 2c) El ADN de los glóbulos blancos de control se analizó solo (intervalo de puntuación z: de -0,8 a 1,3) o cuando se mezcló con ADN de un paciente con niveles de trisomía 21 al 4 % (intervalo de puntuación z: de 4,5 a 7,2) o al 8 % (intervalo de puntuación z: de 8,9 a 10). Cada experimento en la (figura 2c) se realizó por cuadruplicado.
Figura 3 (figura complementaria 1) Demostración adicional de la capacidad de reproducción de FAST-SeqS utilizando diferentes instrumentos, muestras y profundidad de secuenciación. (Figura 3a) El ADN de glóbulos blancos (WBC) de sangre periférica emparejado de ocho muestras, cuyo ADN de plasma se secuenció en la figura 2a, también se secuenció en un cuarto de un carril en Illumina HiSeq 2000. Se representan gráficamente las puntuaciones z calculadas para cada autosoma. Ningún cromosoma tuvo una puntuación z > 3,0 (intervalo: de -2,2 a 1,9). (Figura 3b) Se secuenciaron ocho muestras de ADN esplénico o de glóbulos blancos en una mitad de un carril en Illumina GA IIx, diseñado para producir menos etiquetas que las muestras de plasma y glóbulos blancos mencionadas anteriormente (figura 2a y (a)). Se muestran las puntuaciones z calculadas para cada autosoma. A pesar de una secuenciación tres veces menor, ningún cromosoma tuvo una puntuación z > 3,0 (intervalo: de -2,2 a 2,1).
Figura 4 (figura complementaria 2) Experimento piloto de mezcla de ADN con trisomía 21 y ADN euploide. El ADN de glóbulos blancos (WBC) de sangre periférica de control se analizó solo (n = 2) o cuando se mezcló con ADN de un paciente con niveles de trisomía 21 al 5 % (n = 2), 10 % (n = 1) o 25 % (n = 1). Existe una estrecha correlación entre las fracciones esperadas y observadas del cromosoma 21 adicional (r = 0,997 mediante la prueba de correlación de Pearson, n = 6).
Figura 5. (Tabla complementaria 1). Muestras analizadas en este estudio de FAST-SeqS.
Figuras 6A-6B. (Tabla complementaria 2). Características de secuenciación de FAST-SeqS.
Figura 7. (Tabla complementaria 3). 0ligonucleótidos utilizados para preparar y secuenciar muestras de FAST-SeqS (SEQ ID No : 4-14, consecutivamente).
Figura 8. (Tabla 1). Muestras analizadas en este estudio de FAST-SeqS.
DESCRIPCIÓN DETALLADA DE LA INVENCIÓN
Los inventores han desarrollado un procedimiento que detecta de forma rápida y no invasiva anomalías genéticas, en particular anomalías en el número de copias. Se razonó que el proceso en la prueba disponible en el mercado podría simplificarse si un número definido de fragmentos de todo el genoma pudiera amplificarse utilizando un solo par de cebadores, obviando la necesidad de reparación de extremos, adición de 3'-dA terminal o ligación a adaptadores. Además, el menor número de fragmentos a evaluar (en comparación con el genoma completo) agilizaría los procesos de emparejamiento y análisis del genoma. El procedimiento desarrollado fue capaz de detectar trisomías de forma reproducible en experimentos piloto. Presenta ventajas sobre la secuenciación no sesgada del genoma completo en cuanto a la facilidad de implementación, el coste, el tiempo de análisis y el rendimiento.
El enfoque de los inventores para conseguir los objetivos se basó en la utilización de cebadores específicos que se hibridan con un subconjunto de secuencias humanas dispersas por todo el genoma. A este enfoque se le denominó “Fast Aneuploidy Screening Test-Sequencing System (en lo sucesivo, FAST-SeqS). Para obtener la máxima utilidad, se buscó identificar regiones con suficiente similitud para que pudieran amplificarse con un solo par de cebadores, pero suficientemente únicas para permitir que la mayoría de los loci amplificados puedan ser diferenciados. Para ser compatibles con el ADN degradado que se encuentra en el plasma8, se requirió adicionalmente que las secuencias amplificadas fueran de < 150 pb. Utilizando el algoritmo BLAST-Like Alignment Tool (BLAT)13, se buscaron de manera iterativa fragmentos de una parte pequeña del cromosoma 21 (~6,8 Mb) que contenía la región crítica del síndrome de Down para identificar pares de cebadores adecuados, es decir, pares de cebadores que amplificarían muchos fragmentos distintos de ADN de todo el genoma, así como de toda la región crítica del síndrome de Down. Se identificaron tres de estos pares de cebadores y después de probar estos cebadores in silico (utilizando PCR in silicou ), así como en experimentos piloto de secuenciación, se descubrió que uno de los tres pares de cebadores (en lo sucesivo FAST-1) era óptimo (Procedimientos en línea). Se predijo que el par de cebadores fAsT-1 amplificaba subfamilias de elementos de nucleótidos intercalados largos (retrotransposones L1) que, al igual que otras repeticiones humanas, se han extendido por todo el genoma a través de la retrotransposición, en particular en regiones ricas en AT15. Como, en general, es más difícil amplificar y secuenciar de manera uniforme regiones que varían ampliamente en su contenido de GC8,16, se esperaba que esta localización diferencial funcionara a favor de los inventores.
Puede consultarse cualquier cromosoma o región cromosómica. Según la presente invención reivindicada, los cromosomas y regiones de consulta son el cromosoma 21, el cromosoma 13 y el cromosoma 18. Los cromosomas de consulta y de referencia pueden ser nucleares. En algunas realizaciones, como mínimo, dos, tres, cuatro o cinco amplicones probados se emparejan con una secuencia genómica dentro de un cromosoma de consulta o región de consulta.
Los amplicones pueden ser relativamente pequeños, de manera que la naturaleza degradada de algunas muestras no sea un impedimento para la detección. Son de 180 pb o menos y pueden ser de menos de 150 pb, menos de 120 pb, menos de 100 pb o menos de 50 pb. En una realización, el par de cebadores comprende un primer y un segundo cebador en los que el primer cebador comprende la SEQ ID NO: 1 y el segundo cebador que comprende la SEQ ID NO: 2.
La muestra de ADN es de un ser humano. En determinadas realizaciones, la muestra es de una hembra embarazada y la muestra de ADN comprende ADN materno y fetal. La muestra de ADN puede ser de plasma o de suero, por ejemplo. Se pueden utilizar otros fluidos corporales, tales como saliva, lágrimas, sudor, linfa y orina. Las muestras de tejido pueden utilizarse como fuente de ADN. La sangre del cordón umbilical se puede utilizar como fuente de ADN. Debido a que el ADN fetal es solo una pequeña fracción del ADN del plasma materno, el ADN materno podría enmascarar una anomalía fetal. Por lo tanto, se debe contar una cantidad suficiente de amplicones para detectar la aneuploidía fetal, si está presente.
Aunque los amplicones pueden ser más grandes, no es necesario secuenciar el amplicón completo para identificar un amplicón. Según la presente invención reivindicada, se determinan, como mínimo, 30 nucleótidos de la secuencia de nucleótidos de la pluralidad de amplicones. Si se desea, se pueden determinar más.
Los pares de cebadores útiles pueden ser complementarios a las secuencias que se distribuyen, como mínimo, en 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22 o 23 cromosomas humanos. Las secuencias complementarias pueden estar separadas, como mínimo, por 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18 o más nucleótidos.
La divulgación anterior describe, en general, la presente invención. Puede obtenerse una comprensión más completa con referencia a los siguientes ejemplos específicos que se proporcionan en el presente documento únicamente con fines ilustrativos y no pretenden limitar el alcance de la presente invención.
EJEMPL01
Procedimientos
Selección de cebadores
Se comenzó buscando una región de ~6,8 Mb del cromosoma 21 que contenía la región crítica del síndrome de Down (hg1917 coordenadas de 35.888.786 a 42.648.523) para bloques de secuencia de ~ 150 pb que eran similares, pero no idénticos, a los presentes en todos los cromosomas. Utilizando ventanas deslizantes de 150 pb incrementadas en 50 pb (135.186 secuencias de 150 pb de longitud), se consultaron secuencias con el algoritmo13 de BLAST-Like Alignment Tool (BLAT) para identificar dichos bloques. También se requirió que, como mínimo, tres de los bloques estuvieran presentes en el cromosoma 21, además del que se encuentra dentro de la región de ~6,8 Mb descrita anteriormente.
De los 135.186 bloques consultados, se encontraron solo 56 que cumplían con los siguientes criterios:
• contenía, como mínimo, 11 bases variantes de la secuencia de consulta para ayudar a distinguir los loci amplificados;
• no contenía más de 30 bases variantes de la secuencia de consulta para aumentar la posibilidad de amplificación uniforme; y
• abarcaba no más de un total de 180 bases para ser compatible con el análisis de ADN degradado.
A continuación, se rastrearon de forma manual las alineaciones de BLAT de estos 56 bloques para buscar aquellos que tenían extremos 5' y 3' muy similares. Como mínimo, tres de las 56 secuencias cumplieron con estos criterios y se diseñaron cebadores para ellas. Una PCR in silico14 verificó que cada par de cebadores teóricos amplificaría muchas secuencias distintas de cada cromosoma nuclear.
Comprobación de la unicidad del producto de amplificación.
Las secuencias que eran demasiado similares podrían plantear un problema durante la alineación debido a los errores inevitables introducidos durante la preparación o secuenciación de la biblioteca. Por lo tanto, se escribió un guion (“script’) personalizado para evaluar cuántas secuencias distintas quedarían después de permitir uno, dos o tres errores en cada secuencia de ~ 150 pb. Los productos de amplificación teóricos de un par de cebadores (FAST-1) superaron en gran medida a los otros dos, y la superioridad de FAST-1 se confirmó en experimentos piloto de secuenciación. Una PCR in silicou predijo una distribución bimodal de los fragmentos de PCR y esto se confirmó mediante la separación por tamaño de los productos de PCR amplificados sobre un gel de poliacrilamida y a través de la distribución observada de los recuentos por posición (figura 1b).
Plantillas.
El ADN de control se obtuvo a partir de bazo normal, glóbulos blancos (WBC, white blood cells) de sangre periférica o plasma (tabla complementaria 1). Se adquirió ADN de fibroblastos de cinco individuos con trisomía 21 (NA02767, NA04616, NG05120, NG05397 y NG07438), dos con trisomía 18 (NA03623 y NG12614) y uno con trisomía 13 (NA03330) del Instituto Coriell de Investigación Médica (Camden, Nueva Jersey). Se utilizó un total de 33 ng de ADN para cada experimento. Todas las plantillas se cuantificaron mediante D0, excepto los experimentos de mezcla en los que las plantillas se cuantificaron mediante PCR digital20 para conseguir una estimación más precisa de la concentración.
Preparación de la biblioteca de secuenciación.
El importante ahorro de tiempo en FAST-SeqS se debe a la sustitución de una preparación tradicional de las biblioteca de amplificación del genoma completo por una amplificación que utiliza un solo par de cebadores. Las plantillas se amplificaron con cebadores FAST-1 según lo descrito por Kinde et a/21, en el que las moléculas de plantilla individuales se etiquetan con una secuencia de ADN identificadora única. Aunque las secuencias identificadoras únicas resultaron no ser necesarias para FAST-SeqS (véase la sección Recuento preciso de plantillas, a continuación), se incluyeron en el diseño experimental inicial y se continuaron utilizando una vez que se observó que proporcionaban productos de PCR robustos en los experimentos iniciales. De manera resumida, cada uno de los cebadores de amplificación FAST-1 contenía una secuencia de cebador universal (UPS, universal primer sequence) 5' diferente, seguida de las secuencias que permitían la amplificación de los elementos repetidos descritos anteriormente (directo: ACACAGGGAGGGGAACAT; SEQ ID NO: 1; inverso: TGCCATGGTGGTTTGCT; SEQ ID NO: 2) (tabla complementaria 3). Adicionalmente, el cebador directo contenía un tramo de 16-20 bases degeneradas inmediatamente 3' a su UPS (tabla complementaria 3). Se realizó una PCR utilizando la polimerasa Phusion Hot Start II (Thermo Scientific, n.° de catálogo F-549L) en 1X de tampón Phusion HF, 0,5 μM de cada cebador y dos unidades de polimerasa en un total de 50 μl en las siguientes condiciones de ciclado: 98 oC durante 120 segundos, seguido de dos ciclos de 98 oC durante 10 segundos, 57 oC durante 120 segundos y 72 oC durante 120 segundos. Los cebadores de amplificación iniciales se extrajeron con microesferas AMPure XP (Beckman Coulter Genomics, n.° de catálogo A63880) según el fabricante, con la excepción de que las microesferas se añadieron a solo 1,4 veces el volumen de PCR y el volumen de elución se redujo a 10 μl de TE. La elución se utilizó directamente para una segunda ronda de amplificación utilizando cebadores que se hibridaron con el sitio UPS introducido por los cebadores de la primera ronda y que, adicionalmente, contenían las secuencias de injerto 5' necesarias para la hibridación con la celda de flujo de Illumina (tabla complementaria 3). Además, se introdujo uno de los cinco índices (“códigos de barras”) (tabla complementaria 3) a cada muestra en el cebador inverso para permitir posteriormente la secuenciación multiplexada. La segunda ronda de PCR se realizó utilizando la polimerasa Phusion Hot Start II en 1X de tampón Phusion HF, 0,5 μM de cada cebador y dos unidades de polimerasa en un total de 50 μl en las siguientes condiciones de ciclado: 98 oC durante 120 segundos, seguido de 13 ciclos de 98 oC durante 10 segundos, 65 oC durante 15 segundos y 72 oC durante 15 segundos. Los productos de amplificación se purificaron de nuevo con microesferas AMPure XP y se cuantificaron mediante espectrofotometría, PCR en tiempo real o en un bioanalizador Agilent 2100; todos los procedimientos de cuantificación produjeron resultados similares. Los oligonucleótidos se adquirieron de IDT (Coralville, Iowa).
Descripción general del análisis de datos
A diferencia de las bibliotecas tradicionales de amplificación del genoma completo, en las que la gran mayoría de las etiquetas se alinean con el genoma en posiciones únicas y, por tanto, cada etiqueta necesita una alineación independiente, FAST-SeqS produce secuencias que se alinearon en un promedio de solo 21.676 posiciones; tabla complementaria 2). El número de posiciones en las que se alinearon las secuencias varió poco en comparación con el intervalo de datos de secuencia obtenidos en todos los experimentos. Aunque el número de etiquetas alineadas de forma única por experimento abarcó un intervalo de 12 veces (de 1.343.382 a 16.015.347), el número de posiciones varió solo en 0,25 veces (intervalo: de 18.484 a 24.562 posiciones; tabla complementaria 2). Las lecturas sin procesar de todos los experimentos (tabla complementaria 2) se pueden descargar desde el dominio sagenet.org, subdominio fast, documento fast.htm.
Filtrado y alineación de etiquetas de secuencia
Se filtraron por calidad treinta y siete etiquetas de secuencia base que pasaron el filtro de castidad de Illumina y que contenían, como mínimo, tres bases terminales correctas del cebador de amplificación, mediante el enmascaramiento de cualquier base con una puntuación de calidad <20 con una N utilizando un guion personalizado. Por tanto, las etiquetas con bases de baja calidad tuvieron la oportunidad de alinearse considerando solo sus bases más fiables. Después del enmascaramiento de calidad, solo las secuencias distintas se alinearon con el genoma humano (hg1917) utilizando Bowtie 0.12.718. Al construir el índice de referencia para Bowtie, se incluyeron cóntigos22 no definidos o no colocados para garantizar las alineaciones más precisas. Las secuencias que se alinearon de forma única con hasta un desajuste (utilizando las banderas (“f/ags”) -m 1 y -v 1, respectivamente) se mantuvieron y sus alineaciones se emparejaron de nuevo con los datos originales. Un promedio del 38 % de las etiquetas en todas las muestras podría asignarse de manera única a una posición genómica (intervalo: del 31 % al 45 %; tabla complementaria 2).
Estimación de la distribución de fragmentos secuenciados.
Después de confirmar la predicción in silico de una distribución principalmente bimodal de los productos de amplificación FAST-SeqS mediante electroforesis en gel, se investigó si los recuentos de fragmentos secuenciados que se alineaban en posiciones únicas estaban distribuidos de manera similar. Aunque solo se secuenciaron 37 bases, se pudo estimar el tamaño relativo de cada etiqueta a partir de la PCR in silicou y su posición única en el genoma. Este ejercicio podría proporcionar una prueba adicional de que los productos de amplificación reales coincidían con los que se predijeron y podría alertar sobre cualquier sesgo de la amplificación (véase la sección Normalización, a continuación).
En primer lugar, se transformaron los recuentos de etiquetas por posición alineada de forma única a una escala logarítmica, una transformación que se realiza con frecuencia en esta clase de datos para inducir simetría23. Se realizó esta transformación para cada grupo de experimentos (por ejemplo, a partir de ocho muestras de plasma normales analizadas en la mismo ciclo del instrumento; tabla complementaria 2). A continuación, se utilizó un procedimiento no paramétrico para estimar una distribución suavizada (un estimador de densidad de kernel, implementado en R24 utilizando la función de densidad), lo que facilitó la visualización de la modalidad de los datos. Después de representar la distribución utilizando ggplot225 (un paquete R24), se observó que cada grupo de experimentos mostraba una agrupación similar de recuentos de etiquetas por posición, consistente con una distribución principalmente bimodal con un sesgo negativo. En la figura 1b se muestra una gráfica representativa.
Normalización.
La secuenciación paralela de forma masiva generará una cantidad diferente de etiquetas de secuencia de cada muestra, así como de diferentes ciclos de secuenciación de la misma muestra, debido a variaciones estocásticas y experimentales. Por tanto, es esencial normalizar los datos para hacer comparaciones significativas del tipo utilizado en el presente documento. Aunque sería más sencillo expresar simplemente los recuentos de etiquetas como una fracción del número total de etiquetas secuenciadas en un experimento, esta normalización es demasiado simplista y es muy susceptible a los sesgos sistémicos que con frecuencia plagan la secuenciación de próxima generación de plantillas de ADN y ARN, y estos se utilizan de forma rutinaria en los análisis de cariotipado digital, tal como el que se utiliza para el diagnóstico de la trisomía 218,16
Debido a la distribución de tamaño bimodal de los amplicones obtenidos con el par de cebadores FAST-1, se predijo que la mayoría del sesgo en las amplificaciones de FAST-1 se debería a la potencial sobrerrepresentación de los fragmentos de menor tamaño. Este sesgo podría ocurrir durante la preparación de la biblioteca o durante la PCR de puente en fase sólida en la celda de flujo de Illumina. Se descubrió que se podía obtener una normalización adecuada para esta distribución utilizando el procedimiento de cuantiles19, utilizado ampliamente dentro de la comunidad de las micromatrices (“microarrayS’). Al organizar los datos en una lista de posiciones (equivalente a sondas en datos de micromatrices), cada una asociada con un recuento de etiquetas (equivalente a intensidades en datos de micromatrices), se pudo aplicar la normalización de cuantiles estándar a los datos de FAST-SeqS. Para aproximarse mejor al formato de datos de micromatrices, se eligió analizar solo las posiciones que se compartían dentro de cada grupo experimental (por ejemplo, los datos de ocho muestras de plasma normales). Dado que los cebadores FAST-1 amplificaron un conjunto de posiciones altamente reproducible, esto generalmente solo eliminó <1 % de los datos. Para maximizar la capacidad de reproducción, se excluyeron las posiciones que se alineaban con cóntigos no definidos o no colocados y las que se alineaban con los cromosomas sexuales, aunque la inclusión de estos cromosomas solo aumentó de forma marginal la variabilidad entre experimentos (por ejemplo, en ocho muestras de plasma normales, la puntuación z máxima de cualquier cromosoma aumentó de 1,9 a 2,3). La inclusión de cromosomas sexuales podría ser útil para otras aplicaciones, tales como detectar aneuploidías que involucren al cromosoma X o determinar el sexo de una muestra (es decir, mediante la presencia o ausencia de secuencias que se alineen con el cromosoma Y).
Se implementó la normalización cuantil19 para cada grupo experimental (cada uno de los cuales contenía múltiples muestras; tabla complementaria 2) realizando las siguientes etapas:
• generar una matriz ordenada de recuentos de etiquetas que representan cada posición para cada muestra (todas de igual longitud, ya que solo se analizaron las posiciones compartidas en cada experimento);
• combinar estas matrices ordenadas en una matriz de 2 x 2, en la que cada experimento se representa en su propia columna y las posiciones compartidas constituyen las filas;
• reemplazar el recuento de una muestra individual por el recuento promedio para todas las muestras en esa fila en particular; y
• volver a ordenar los recuentos a su orden original.
La distribución de los datos de los inventores siempre fue sesgada de forma negativa (véase la figura 1 b para un ejemplo representativo). Se excluyeron las posiciones que caían dentro de la cola izquierda de la distribución de cada experimento (las posiciones que contenían la menor cantidad de etiquetas) del análisis de los inventores mediante:
• la estimación de la distribución de valores normalizados, tal como se ha descrito anteriormente;
• la determinación del punto de inflexión entre los dos máximos de la distribución bimodal; y
• la consideración de las posiciones que tenían una densidad relativa por debajo del punto de inflexión como la cola izquierda.
Una vez que se determinó la cola izquierda y se descartaron las posiciones dentro de la misma, se repitió la normalización cuantil. A través de este proceso, cada muestra dentro de un grupo experimental tenía la misma suma total de etiquetas y una distribución idéntica de recuentos, por lo que se podían realizar comparaciones directas. Se automatizó la normalización cuantil en R24. Todo el procedimiento de normalización normalmente tardaba menos de unos minutos en completarse.
Determinación cuantitativa del estado de aneuploidía.
Un procedimiento habitual para determinar el estado de aneuploidía de una muestra particular en ensayos basados en cariotipado digital11 es mediante la comparación de puntuaciones z6,8,26. A través de este procedimiento, se determina la media y la desviación estándar de los recuentos de etiquetas que se encuentran dentro de un cromosoma de interés en un grupo de muestras de referencia (por ejemplo, muestras con contenido euploide conocido) y, a continuación, se crea una puntuación estandarizada (es decir, puntuación z) para un cromosoma de interés para cada muestra de la siguiente manera: puntuación zi,chrN = (chrNi - |ichrN)/sdchrN, en la que i representa la muestra que se va a estandarizar, chrN representa el recuento de etiquetas normalizado del cromosoma de la muestra y pchrN y sdchrN representan la media y la desviación estándar de los recuentos de etiquetas normalizados, respectivamente, de chrN en el grupo de referencia. Cuando todas las muestras están estandarizadas de esta manera, los valores atípicos se detectan fácilmente porque tienen una puntuación z > 3,0. Esto indica que el recuento de etiquetas normalizado del valor atípico supera la media del grupo de referencia, como mínimo, en tres desviaciones estándar.
Recuento preciso de plantillas.
Finalmente, se evaluó si contar con precisión las moléculas de plantilla podría aumentar aún más la capacidad de reproducción. Mediante la incorporación de 16-20 bases degeneradas en el extremo 5' de uno de los dos cebadores FAST-1 (tabla complementaria 3), es posible identificar de forma única cada molécula de plantilla que da lugar a un producto de PCR21. Esto podría aumentar potencialmente la precisión al minimizar la posibilidad de que la misma molécula de plantilla se contara más de una vez en el cálculo final para cada cromosoma. Se descubrió que este aumento no alteraba de manera significativa la consistencia de los recuentos normalizados por cromosoma entre las ocho muestras de plasma normales: la puntuación z máxima para cualquier cromosoma aumentó ligeramente de 1,9 a 2,0. Al realizar una prueba de la t bilateral sobre los valores absolutos de las puntuaciones z para todos los procedimientos de análisis de comparación de autosomas, no se descubrieron diferencias estadísticamente significativas entre los dos procedimientos (p = 0,759, n = 22 x 8 para cada grupo).
EJEMPL02
Como prueba inicial del rendimiento de FAST-SeqS, se examinó la representación de cada autosoma en el ADN de plasma de siete mujeres normales, incluida una réplica biológica (tabla complementaria 1). Utilizando solamente 37 ciclos de secuenciación en un cuarto de un carril en un instrumento Illumina HiSeq 2000, se recuperaron un promedio de 31.547.988 etiquetas de alta calidad por individuo (intervalo: de 27.179.424 a 36.0418.017 etiquetas; tabla complementaria 2). Un promedio del 35 % de estas etiquetas (intervalo: del 31 al 37 %) podían mapearse de manera única en una de un promedio de 23.681 posiciones cromosómicas únicas (intervalo: de 22.589 a 24.562 posiciones) cuando se permitía hasta un desajuste durante la alineación con hg1917 utilizando Bowtie18. Tanto la distribución teórica in silico (figura 1a) como la observada de recuentos de etiquetas (figura 1b) mostraron una distribución bimodal de tamaños. De las etiquetas alineadas de forma única, el 99,1 % se alineó con posiciones que RepeatMasker (http://www.repeatmasker.org) predijo que serían ADN repetitivo, de las cuales el 97,5 % se encontraban en solo siete subfamilias de retrotransposones L1 (figura 1c). Adicionalmente, la distribución de cada subfamilia coincidió con la predicha por RepeatMasker (figura 1d). Debido a que la alineación de etiquetas con un conjunto discreto de posiciones cromosómicas es más sencilla que la alineación con el genoma completo, el proceso de análisis posterior a la secuenciación fue muy rápido. De hecho, este mapeo más el análisis estadístico posterior podía completarse en menos de 30 minutos por muestra con una sola computadora que alberga dos CPU de seis núcleos (Intel Xeon X5680). Lo que es más importante, la fracción relativa de etiquetas que mapean en cada cromosoma fue notablemente similar entre las muestras individuales después de normalizar19 para comparar los recuentos de etiquetas cromosómicas entre diferentes muestras (procedimientos en línea). En particular, la fracción de etiquetas que se emparejaban con cualquiera de los autosomas en cualquiera de las ocho muestras estudiadas nunca se desvió del promedio en una puntuación z > 3,0 (figura 2a). Cabe destacar que las puntuaciones z máximas observadas entre las ocho muestras para los cromosomas 21, 18 y 13 fueron 1,3, 1,4 y 1,0, respectivamente.
EJEMPL03
A continuación, se estudió la capacidad de reproducción de la representación cromosómica en dos experimentos adicionales que utilizaban diferentes tipos de muestras, diferentes instrumentos y diferentes profundidades de secuenciación. En el primer experimento, se analizó el ADN de glóbulos blancos (WBC) de sangre periférica de los mismos siete individuos que aportaron plasma. Se secuenciaron cuatro muestras en un solo carril de un Illumina HiSeq 2000, produciendo una media de 10.835.559 etiquetas alineadas de forma única por muestra (intervalo: de 4.905.067 a 16.015.347 etiquetas). Las puntuaciones z máximas para cualquiera de las muestras fueron 1,0, 1,2 y 1,6 para los cromosomas 21, 18 y 13, respectivamente (figura complementaria 1a).
EJEMPL04
En el siguiente experimento, se analizó el ADN esplénico o de glóbulos blancos de ocho individuos adicionales utilizando la mitad de un carril de un instrumento Illumina GA IIx por muestra (tabla complementaria 2). Se obtuvo una media de 4.013.951 etiquetas alineadas de forma única por muestra (intervalo: de 2.847.661 a 4.645.608 etiquetas). A pesar de una secuenciación casi tres veces menor, las puntuaciones z máximas entre las muestras seguían siendo solo 1,3, 1,5 y 1,9 para los cromosomas 21, 18 y 13, respectivamente, muy por debajo del límite de corte ampliamente utilizado de 3,0 (figura complementaria 1b).
Dadas las distribuciones estrechas de las etiquetas evidentes en la figura 2a, se esperaba que fuera sencillo distinguir el ADN de pacientes con trisomías del de individuos normales con constituciones cromosómicas euploides. Los datos representados en la figura 2b demuestran que esta expectativa se cumplió en cada uno de los cuatro pacientes con trisomía 21. Las puntuaciones z entre estos pacientes con trisomía 21 variaron de 32 a 36, mientras que la puntuación z máxima entre ocho individuos normales fue 1,3. De manera similar, las puntuaciones z del ADN de dos pacientes con trisomía 18 y uno con trisomía 13 fueron 51, 56 y 36, respectivamente, superando ampliamente las puntuaciones z máximas para estos cromosomas en individuos normales (figura 2b).
EJEMPL05
El ADN fetal representa una media geométrica del 13,4 % del ADN materno, dependiendo en gran medida del peso materno más que de la edad gestacional8. Para investigar si FAST-SeqS podía distinguir muestras que contenían mezclas de ADN disómico y trisómico, se realizaron experimentos de mezcla utilizando ADN de pacientes con trisomía 21 e individuos normales. En un primer experimento de este tipo, se mezclaron el 5 % (n = 2), 10 % (n = 1) y 25 % (n = 1) de ADN con trisomía 21 en ADN de glóbulos blancos normal junto con dos controles (figura 2 complementaria) y se descubrió una estrecha correlación entre las fracciones esperadas y observadas del cromosoma 21 adicional (r = 0,997 mediante la prueba de correlación de Pearson, n = 6). En un segundo experimento, se evaluaron mezclas que contenían el 4 % o el 8 % de ADN con trisomía 21. Tal como se muestra en la figura 2c, hubo una clara distinción entre las muestras que contenían el 4 % de ADN con trisomía 21 frente a las de individuos normales (p = 2 x 10-4, según lo determinado por la prueba de la t bilateral, n = 4 en cada grupo). Las muestras que contenían el 8 % de ADN con trisomía 21 eran, por supuesto, distinguibles de una manera aún más fácil (p = 4 x 10-6 en comparación con el grupo euploide y p = 1 x 10-3 en comparación con las muestras con el 4 % de trisomía 21, ambas mediante prueba de la t bilateral con n = 4 para cada grupo).
Referencias
La divulgación de cada referencia citada se incorpora de manera expresa en el presente documento.
1. LYF Hsu, en Genetic Disorders and the Fetus, editado por A Milunsky (The Johns Hopkins University Press, Baltimore, 1998), pág. 179.
2. M. Staebler, C. Donner, N. Van Regemorter et al., Prenat Diagn 25 (7), 567 (2005).
3. K.L. Jones, Smith’s recognizable patterns of human malformation, 6 edición (Elsevier Saunders, Philadelphia, 2006).
4. American College of 0bstetricians and Gynecologists, 0bstet Gynecol 110 (6), 1459 (2007).
5. Y. M. Lo, M. S. Tein, T. K. Lau et al., Am J Hum Genet 62 (4), 768 (1998).
6. R. W. Chiu, K. C. Chan, Y. Gao et al., Proc Natl Acad Sci USA 105 (51), 20458 (2008).
7. H. C. Fan, Y. J. Blumenfeld, U. Chitkara et al., Proc Natl Acad Sci USA 105 (42), 16266 (2008).
8. G. E. Palomaki, E. M. Kloza, G. M. Lambert-Messerlian et al., Genet Med 13 (11), 913 (2011).
9. J. Cleary-Goldman, F. D. Malone, J. Vidaver et al., 0bstet Gynecol 105 (5 Pt 1), 983 (2005).
10. R. G. Resta, Am J Med GenetA 133A (1), 31 (2005).
11. T. L. Wang, C. Maierhofer, M. R. Speicher et al., Proc Natl Acad Sci USA 99 (25), 16156 (2002).
12. A. B. Sparks, E. T. Wang, C. A. Struble et al., Prenat Diagn (2012).
13. W. J. Kent, Genome Res 12 (4), 656 (2002).
14. R. M. Kuhn, D. Karolchik, A. S. Zweig et al., Nucleic Acids Res 35 (número de la base de datos), D668 (2007).
15. A. F. Smit, Curr 0pin Genet Dev 9 (6), 657 (1999).
16. H. C. Fan y S. R. Quake, PLoS One 5 (5), e10439 (2010).
17. P. A. Fujita, B. Rhead, A. S. Zweig et al., Nucleic Acids Res 39 (número de la base de datos), D876 (2011).
18. B. Langmead, C. Trapnell, M. Pop et al., Genome Biol 10 (3), R25 (2009).
19. B. M. Bolstad, R. A. Irizarry, M. Astrand et al., Bioinformatics 19 (2), 185 (2003).
20. B. Vogelstein y K. W. Kinzler, Proc Natl Acad Sci USA 96 (16), 9236 (1999).
21. I. Kinde, J. Wu, N. Papadopoulos et al., Proc Natl Acad Sci uSa 108 (23), 9530 (2011).
22. E. S. Lander, L. M. Linton, B. Birren et al., Nature 409 (6822), 860 (2001).
23. J. Tukey, Exploratory Data Analysis. (Addison-Wesley, Reading, Massachusetts, 1977).
24. R Development Core Team, R: A language and environment for statistical computing (R Foundation for Statistical Computing, 2011).
25. H. Wickham, ggplot2: elegant graphics for data analysis. (Springer, New York, 2009).
26. M. Ehrich, C. Deciu, T. Zwiefelhofer et al., Am J Obstet Gynecol 204 (3), 205 e1 (2011).

Claims (14)

REIVINDICACI0NES
1. Procedimiento para analizar la aneuploidía en un ser humano, que comprende:
amplificar utilizando la reacción en cadena de la polimerasa una pluralidad de secuencias cromosómicas en una muestra de ADN de un ser humano con un único par de cebadores complementarios a dicha pluralidad de secuencias cromosómicas para formar una pluralidad de amplicones que son no idénticos, en los que (i) cada amplicón tiene 180 pb o menos;
(ii) la pluralidad de amplicones incluye secuencias en los cromosomas de consulta 21, 13 y 18; y (iii) los amplicones comprenden dichas secuencias cromosómicas complementarias al único par de cebadores y las secuencias que se encuentran entre el par de cebadores;
realizar reacciones para determinar la secuencia de nucleótidos, como mínimo, de 30 nucleótidos de la pluralidad de amplicones;
emparejar las secuencias de nucleótidos de amplicones in silico con secuencias genómicas humanas en un conjunto discreto de loci genómicos;
contar el número de amplicones que se emparejan en loci genómicos individuales de los cromosomas de consulta;
comparar el número de amplicones emparejados con los loci genómicos de, como mínimo, uno de los cromosomas de consulta con el número de amplicones emparejados con los mismos loci genómicos en uno o más cromosomas de referencia que tienen un contenido euploide conocido.
2. Procedimiento, según la reivindicación 1, en el que, como mínimo, un cromosoma de consulta es el cromosoma 21.
3. Procedimiento, según la reivindicación 1, en el que, como mínimo, un cromosoma de consulta es el cromosoma 13.
4. Procedimiento, según la reivindicación 1, en el que el par de cebadores comprende un primer y un segundo cebador, en el que el primer cebador comprende la SEQ ID NO: 1 y el segundo cebador comprende la SEQ ID NO: 2.
5. Procedimiento, según la reivindicación 2, en el que:
(i) como mínimo, uno de los amplicones se empareja con una secuencia genómica dentro de la región crítica del síndrome de Down en el cromosoma 21; o
(ii) como mínimo, tres de los amplicones se emparejan con una secuencia genómica en el cromosoma 21.
6. Procedimiento, según la reivindicación 1, en el que la muestra de ADN es de una hembra embarazada y la muestra de ADN comprende ADN materno y fetal.
7. Procedimiento, según la reivindicación 6, en el que:
(i) la muestra de ADN es de plasma;
(ii) la muestra de ADN es de suero; o
(iii) se cuentan amplicones suficientes para detectar aneuploidía fetal, si está presente.
8. Procedimiento, según la reivindicación 1, en el que:
(i) la muestra de ADN es de plasma; o
(ii) la muestra de ADN es de suero.
9. Procedimiento para analizar los cambios en el número de copias de ADN de un ser humano, que comprende:
amplificar utilizando la reacción en cadena de la polimerasa una pluralidad de secuencias cromosómicas en una muestra de ADN de un ser humano con un único par de cebadores complementarios a dicha pluralidad de secuencias cromosómicas para formar una pluralidad de amplicones que son no idénticos, en los que (i) cada amplicón tiene 180 pb o menos;
(ii) la pluralidad de amplicones incluye secuencias en las regiones cromosómicas de consulta, en los que las regiones cromosómicas de consulta son los cromosomas 21, 13 y 18; y
(iii) los amplicones comprenden secuencias cromosómicas complementarias al único par de cebadores y las secuencias que se encuentran entre el par de cebadores;
realizar reacciones para determinar la secuencia de nucleótidos, como mínimo, de 30 nucleótidos de la pluralidad de amplicones;
emparejar las secuencias de nucleótidos de amplicones in silico con secuencias genómicas humanas en un conjunto discreto de loci genómicos;
contar el número de amplicones que se emparejan en loci genómicos individuales de los cromosomas de consulta;
comparar el número de amplicones emparejados con los loci genómicos, como mínimo, de una de las regiones cromosómicas de consulta con el número de amplicones emparejados con los mismos loci genómicos en una o más regiones cromosómicas de referencia de uno o más cromosomas que tienen un contenido euploide conocido.
10. Procedimiento, según la reivindicación 9, en el que, como mínimo, una región cromosómica de consulta es el cromosoma 21.
11. Procedimiento, según la reivindicación 9, en el que el par de cebadores comprende un primer y un segundo cebador, en el que el primer cebador comprende la SEQ ID NO: 1 y el segundo cebador comprende la SEQ ID NO: 2.
12. Procedimiento, según la reivindicación 9, en el que la muestra de ADN es de una hembra embarazada y la muestra de ADN comprende ADN materno y fetal.
13. Procedimiento, según la reivindicación 12, en el que:
(i) la muestra de ADN es de plasma; o
(ii) la muestra de ADN es de suero.
14. Par de cebadores útiles para analizar la aneuploidía humana, en el que un primer cebador comprende la SEQ ID NO: 1 y un segundo cebador comprende la SEQ ID NO: 2.
ES13768366T 2012-03-26 2013-03-22 Detección rápida de aneuploidía Active ES2945311T3 (es)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201261615535P 2012-03-26 2012-03-26
US201261659695P 2012-06-14 2012-06-14
PCT/US2013/033451 WO2013148496A1 (en) 2012-03-26 2013-03-22 Rapid aneuploidy detection

Publications (1)

Publication Number Publication Date
ES2945311T3 true ES2945311T3 (es) 2023-06-30

Family

ID=49261127

Family Applications (1)

Application Number Title Priority Date Filing Date
ES13768366T Active ES2945311T3 (es) 2012-03-26 2013-03-22 Detección rápida de aneuploidía

Country Status (11)

Country Link
US (3) US10053729B2 (es)
EP (2) EP4239081A3 (es)
CN (2) CN104350158A (es)
AU (1) AU2013240088B2 (es)
CA (1) CA2868836C (es)
ES (1) ES2945311T3 (es)
FI (1) FI2831279T3 (es)
HK (2) HK1205204A1 (es)
IL (1) IL234850B (es)
PL (1) PL2831279T3 (es)
WO (1) WO2013148496A1 (es)

Families Citing this family (40)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CA2760439A1 (en) 2009-04-30 2010-11-04 Good Start Genetics, Inc. Methods and compositions for evaluating genetic markers
US9085798B2 (en) 2009-04-30 2015-07-21 Prognosys Biosciences, Inc. Nucleic acid constructs and methods of use
US10787701B2 (en) 2010-04-05 2020-09-29 Prognosys Biosciences, Inc. Spatially encoded biological assays
CA2794522C (en) 2010-04-05 2019-11-26 Prognosys Biosciences, Inc. Spatially encoded biological assays
US20190300945A1 (en) 2010-04-05 2019-10-03 Prognosys Biosciences, Inc. Spatially Encoded Biological Assays
US9163281B2 (en) 2010-12-23 2015-10-20 Good Start Genetics, Inc. Methods for maintaining the integrity and identification of a nucleic acid template in a multiplex sequencing reaction
GB201106254D0 (en) 2011-04-13 2011-05-25 Frisen Jonas Method and product
EP2697397B1 (en) 2011-04-15 2017-04-05 The Johns Hopkins University Safe sequencing system
WO2013058907A1 (en) 2011-10-17 2013-04-25 Good Start Genetics, Inc. Analysis methods
US8209130B1 (en) 2012-04-04 2012-06-26 Good Start Genetics, Inc. Sequence assembly
US10227635B2 (en) 2012-04-16 2019-03-12 Molecular Loop Biosolutions, Llc Capture reactions
CA2883901C (en) 2012-09-04 2023-04-11 Guardant Health, Inc. Systems and methods to detect rare mutations and copy number variation
US10876152B2 (en) 2012-09-04 2020-12-29 Guardant Health, Inc. Systems and methods to detect rare mutations and copy number variation
US20160040229A1 (en) 2013-08-16 2016-02-11 Guardant Health, Inc. Systems and methods to detect rare mutations and copy number variation
US11913065B2 (en) 2012-09-04 2024-02-27 Guardent Health, Inc. Systems and methods to detect rare mutations and copy number variation
ES2886507T3 (es) 2012-10-29 2021-12-20 Univ Johns Hopkins Prueba de Papanicolaou para cánceres de ovario y de endometrio
WO2014152421A1 (en) 2013-03-14 2014-09-25 Good Start Genetics, Inc. Methods for analyzing nucleic acids
US9879313B2 (en) 2013-06-25 2018-01-30 Prognosys Biosciences, Inc. Methods and systems for determining spatial patterns of biological targets in a sample
US10851414B2 (en) 2013-10-18 2020-12-01 Good Start Genetics, Inc. Methods for determining carrier status
EP3524694B1 (en) 2013-12-28 2020-07-15 Guardant Health, Inc. Methods and systems for detecting genetic variants
US11053548B2 (en) 2014-05-12 2021-07-06 Good Start Genetics, Inc. Methods for detecting aneuploidy
WO2016040446A1 (en) 2014-09-10 2016-03-17 Good Start Genetics, Inc. Methods for selectively suppressing non-target sequences
CA2999708A1 (en) 2014-09-24 2016-03-31 Good Start Genetics, Inc. Process control for increased robustness of genetic assays
WO2016061514A1 (en) * 2014-10-17 2016-04-21 Good Start Genetics, Inc. Pre-implantation genetic screening and aneuploidy detection
CA3010579A1 (en) 2015-01-06 2016-07-14 Good Start Genetics, Inc. Screening for structural variants
JP6929778B2 (ja) * 2015-01-15 2021-09-01 グッド スタート ジェネティクス, インコーポレイテッド 着床前遺伝子スクリーニングにおける一塩基多型を用いた品質管理方法
EP4119677B1 (en) 2015-04-10 2023-06-28 Spatial Transcriptomics AB Spatially distinguished, multiplex nucleic acid analysis of biological specimens
WO2017027653A1 (en) 2015-08-11 2017-02-16 The Johns Hopkins University Assaying ovarian cyst fluid
WO2017106768A1 (en) 2015-12-17 2017-06-22 Guardant Health, Inc. Methods to determine tumor gene copy number by analysis of cell-free dna
CN107699607A (zh) * 2016-08-31 2018-02-16 刘红彦 一种构建胎儿游离dna测序文库的试剂盒、方法及用途
MX2020001575A (es) 2017-08-07 2020-11-18 Univ Johns Hopkins Materiales y métodos para evaluar y tratar el cáncer.
CN112041460A (zh) * 2018-02-28 2020-12-04 克罗玛科德公司 用于胎儿核酸分析的分子靶标
CN108913757B (zh) * 2018-07-05 2021-06-11 广州市达瑞生物技术股份有限公司 一种染色体非整倍体数目异常的引物组与检测试剂盒及其应用
CN108841931B (zh) * 2018-07-05 2021-06-11 广州市达瑞生物技术股份有限公司 一种检测人4号染色体str基因座的引物组与检测试剂盒及其应用
US11100087B2 (en) * 2019-04-26 2021-08-24 Microsoft Technology Licensing, Llc Data tokenization system maintaining data integrity
MX2021013834A (es) * 2019-05-17 2022-06-29 Univ Johns Hopkins Detección rápida de aneuploidía.
WO2020243579A1 (en) 2019-05-30 2020-12-03 10X Genomics, Inc. Methods of detecting spatial heterogeneity of a biological sample
AU2021283174A1 (en) 2020-06-02 2023-01-05 10X Genomics, Inc. Nucleic acid library methods
CN116249785A (zh) 2020-06-02 2023-06-09 10X基因组学有限公司 用于抗原-受体的空间转录组学
EP4162074B1 (en) 2020-06-08 2024-04-24 10X Genomics, Inc. Methods of determining a surgical margin and methods of use thereof

Family Cites Families (26)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CA43460A (en) 1893-07-03 Robert Wellington Bigger Furnace
CA57345A (en) 1897-07-30 1897-09-04 Francis Louis Becker Upright piano-forte action
CA62924A (en) 1898-12-27 1899-03-25 Azarie Mireault Medicinal compound
GB9704444D0 (en) 1997-03-04 1997-04-23 Isis Innovation Non-invasive prenatal diagnosis
US6703228B1 (en) * 1998-09-25 2004-03-09 Massachusetts Institute Of Technology Methods and products related to genotyping and DNA analysis
US6977162B2 (en) 2002-03-01 2005-12-20 Ravgen, Inc. Rapid analysis of variations in a genome
US20060172294A1 (en) * 2002-06-06 2006-08-03 Arturas Petronis Detection of epigenetic abnormalities and diagnostic method based thereon
US7704687B2 (en) * 2002-11-15 2010-04-27 The Johns Hopkins University Digital karyotyping
JP4886298B2 (ja) * 2002-12-20 2012-02-29 キアゲン ゲゼルシャフト ミット ベシュレンクテル ハフツング 核酸増幅
WO2005023091A2 (en) 2003-09-05 2005-03-17 The Trustees Of Boston University Method for non-invasive prenatal diagnosis
US7537889B2 (en) 2003-09-30 2009-05-26 Life Genetics Lab, Llc. Assay for quantitation of human DNA using Alu elements
EP1689884A4 (en) 2003-10-08 2007-04-04 Univ Boston METHODS OF PRENATAL DIAGNOSIS OF CHROMOSOMIC ANOMALIES
US20060019270A1 (en) * 2004-04-01 2006-01-26 Board Of Regents The University Of Texas System Global DNA methylation assessment using bisulfite PCR
US7709194B2 (en) 2004-06-04 2010-05-04 The Chinese University Of Hong Kong Marker for prenatal diagnosis and monitoring
CN101137760B (zh) 2005-03-18 2011-01-26 香港中文大学 检测染色体非整倍性的方法
PL1981995T5 (pl) 2006-02-02 2019-10-31 Univ Leland Stanford Junior Nieinwazyjne genetyczne badania przesiewowe płodu metodą analizy cyfrowej
BRPI0709545A2 (pt) 2006-03-06 2011-07-19 Univ Columbia amplificação especìfica de seqüência de dna fetal de uma mistura de origem fetal-maternal
US8137912B2 (en) 2006-06-14 2012-03-20 The General Hospital Corporation Methods for the diagnosis of fetal abnormalities
KR102516709B1 (ko) * 2007-07-23 2023-04-03 더 차이니즈 유니버시티 오브 홍콩 핵산 서열 불균형의 결정
US20100112590A1 (en) * 2007-07-23 2010-05-06 The Chinese University Of Hong Kong Diagnosing Fetal Chromosomal Aneuploidy Using Genomic Sequencing With Enrichment
ES2620012T3 (es) * 2008-09-20 2017-06-27 The Board Of Trustees Of The Leland Stanford Junior University Diagnóstico no invasivo de la aneuploidia fetal por secuenciación
US8563242B2 (en) 2009-08-11 2013-10-22 The Chinese University Of Hong Kong Method for detecting chromosomal aneuploidy
WO2011066476A1 (en) * 2009-11-25 2011-06-03 Quantalife, Inc. Methods and compositions for detecting genetic material
EP3660165B1 (en) * 2009-12-22 2023-01-04 Sequenom, Inc. Processes and kits for identifying aneuploidy
GB2485645B (en) * 2010-01-19 2012-11-21 Verinata Health Inc Improved identification of partial aneuploidies using a normalising sequence
US20140186827A1 (en) * 2010-05-14 2014-07-03 Fluidigm, Inc. Assays for the detection of genotype, mutations, and/or aneuploidy

Also Published As

Publication number Publication date
AU2013240088A1 (en) 2014-10-16
EP2831279A1 (en) 2015-02-04
CA2868836A1 (en) 2013-10-03
US20220010371A1 (en) 2022-01-13
AU2013240088B2 (en) 2017-02-02
EP2831279A4 (en) 2015-12-30
EP2831279B1 (en) 2023-05-03
IL234850B (en) 2019-08-29
PL2831279T3 (pl) 2023-12-04
EP4239081A2 (en) 2023-09-06
CN104350158A (zh) 2015-02-11
US20150051085A1 (en) 2015-02-19
US10053729B2 (en) 2018-08-21
FI2831279T3 (fi) 2023-05-23
HK1206795A1 (en) 2016-01-15
CA2868836C (en) 2019-08-06
HK1205204A1 (en) 2015-12-11
CN111073962A (zh) 2020-04-28
US20150376691A1 (en) 2015-12-31
WO2013148496A1 (en) 2013-10-03
EP4239081A3 (en) 2023-11-08
IL234850A0 (en) 2014-12-31

Similar Documents

Publication Publication Date Title
ES2945311T3 (es) Detección rápida de aneuploidía
US10619214B2 (en) Detecting genetic aberrations associated with cancer using genomic sequencing
ES2792802T3 (es) Diagnóstico de cáncer utilizando la secuenciación genómica
ES2745556T3 (es) Acidos nucleicos y métodos para detectar anomalías cromosómicas
ES2659487T3 (es) Análisis basado en el tamaño de la fracción de ADN fetal en el plasma materno
CN108138227A (zh) 使用具有独特分子索引(umi)的冗余读段在测序dna片段中抑制误差
JP7334122B2 (ja) 妊娠高血圧腎症に特異的な循環rnaシグネチャー
ES2790533T3 (es) Análisis paralelo múltiplex de regiones genómicas blanco para análisis prenatales no invasivos
US12018329B2 (en) Diagnosing fetal chromosomal aneuploidy using massively parallel genomic sequencing
AU2013203077A1 (en) Diagnosing fetal chromosomal aneuploidy using genomic sequencing
AU2013200581A1 (en) Diagnosing cancer using genomic sequencing