ES2887177T3 - Método de preparación de una biblioteca de secuenciación de ácidos nucleicos - Google Patents

Método de preparación de una biblioteca de secuenciación de ácidos nucleicos Download PDF

Info

Publication number
ES2887177T3
ES2887177T3 ES19158003T ES19158003T ES2887177T3 ES 2887177 T3 ES2887177 T3 ES 2887177T3 ES 19158003 T ES19158003 T ES 19158003T ES 19158003 T ES19158003 T ES 19158003T ES 2887177 T3 ES2887177 T3 ES 2887177T3
Authority
ES
Spain
Prior art keywords
nucleic acid
target nucleic
sequence
nucleic acids
transposon
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
ES19158003T
Other languages
English (en)
Inventor
Frank Steemers
Sasan Amini
Kevin Gunderson
Natasha Pignatelli
Igor Goryshin
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Illumina Inc
Original Assignee
Illumina Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Illumina Inc filed Critical Illumina Inc
Application granted granted Critical
Publication of ES2887177T3 publication Critical patent/ES2887177T3/es
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/1034Isolating an individual clone by screening libraries
    • C12N15/1065Preparation or screening of tagged libraries, e.g. tagged microorganisms by STM-mutagenesis, tagged polynucleotides, gene tags
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/1034Isolating an individual clone by screening libraries
    • C12N15/1075Isolating an individual clone by screening libraries by coupling phenotype to genotype, not provided for in other groups of this subclass
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6806Preparing nucleic acids for analysis, e.g. for polymerase chain reaction [PCR] assay
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6869Methods for sequencing

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Organic Chemistry (AREA)
  • Engineering & Computer Science (AREA)
  • Genetics & Genomics (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biotechnology (AREA)
  • General Engineering & Computer Science (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Molecular Biology (AREA)
  • Biochemistry (AREA)
  • Microbiology (AREA)
  • General Health & Medical Sciences (AREA)
  • Biophysics (AREA)
  • Physics & Mathematics (AREA)
  • Biomedical Technology (AREA)
  • Analytical Chemistry (AREA)
  • Immunology (AREA)
  • Plant Pathology (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

Método para preparar una biblioteca de ácidos nucleicos plantilla para obtener información de secuencia a partir de un ácido nucleico diana, comprendiendo dicho método: (a) compartimentar el ácido nucleico diana en una pluralidad de primeros recipientes proporcionando a cada primer recipiente una cantidad de ácido nucleico diana mayor que aproximadamente uno o más equivalentes haploides del ácido nucleico diana; (b) proporcionar un primer índice al ácido nucleico diana de cada primer recipiente, en donde el primer índice proporcionado al ácido nucleico diana de cada primer recipiente es diferente, en donde la etapa comprende poner en contacto el ácido nucleico diana con una pluralidad de transposomas, comprendiendo cada transposoma una secuencia de transposón que comprende un primer índice y una transposasa asociada con la secuencia de transposón en unas condiciones de manera que al menos algunas de las secuencias transposón se inserten en el ácido nucleico diana, obteniendo, de este modo, una pluralidad de primeros ácidos nucleicos plantilla indexados; (c) combinar los primeros ácidos nucleicos plantilla indexados; (d) compartimentar los primeros ácidos nucleicos plantilla indexados en una pluralidad de segundos recipientes; y (e) proporcionar un segundo índice a los primeros ácidos nucleicos plantilla indexados de cada segundo recipiente, en donde el segundo índice proporcionado a los primeros ácidos nucleicos plantilla indexados de cada segundo recipiente es diferente, obteniendo, de este modo, una pluralidad de segundos ácidos nucleicos plantilla indexados.

Description

DESCRIPCIÓN
Método de preparación de una biblioteca de secuenciación de ácidos nucleicos
Campo de la invención
Las realizaciones de la presente divulgación se refieren a la secuenciación de ácidos nucleicos. En particular, las realizaciones de los métodos y composiciones proporcionados en el presente documento se refieren a la preparación de plantillas de ácidos nucleicos y a la obtención de datos de secuencia a partir de ellos.
Antecedentes de la invención
Se ha utilizado la detección de secuencias específicas de ácidos nucleicos presentes en una muestra biológica, por ejemplo, como método para identificar y clasificar microorganismos, diagnosticar enfermedades infecciosas, detectar y caracterizar anomalías genéticas, identificar cambios genéticos asociados con cáncer, estudiar la susceptibilidad genética a las enfermedades y medir la respuesta a diversos tipos de tratamiento. Una técnica común para detectar secuencias de ácidos nucleicos específicas en una muestra biológica es la secuenciación de ácidos nucleicos. La metodología de secuenciación de ácidos nucleicos ha evolucionado significativamente a partir de los métodos de degradación química utilizados por Maxam y Gilbert y los métodos de extensión de cadenas utilizados por Sanger. En la actualidad, se utilizan varias metodologías de secuenciación que permiten el procesamiento en paralelo de todos ácidos nucleicos en una única ejecución de secuenciación. Como tal, la información generada a partir de una sola ejecución de secuenciación puede ser enorme.
Sumario de la invención
Algunas realizaciones de los métodos y composiciones proporcionados en el presente documento incluyen un método para obtener información de secuencia de un ácido nucleico diana, comprendiendo dicho método: (a) obtener un ácido nucleico plantilla que comprende una pluralidad de transposomas insertados en dicho ácido nucleico diana, en donde al menos algunos de los transposomas insertados comprenden cada uno una primera secuencia de transposón, una segunda secuencia de transposón no contigua con dicha primera secuencia de transposón y una transposasa asociada con la primera secuencia de transposón y la segunda secuencia de transposón; (b) compartimentar el ácido nucleico plantilla que comprende dicha pluralidad de transposomas insertados en cada recipiente de una pluralidad de recipientes; (c) eliminar la transposasa del ácido nucleico plantilla; y (d) obtener información de secuencia del ácido nucleico plantilla de cada recipiente.
En algunas realizaciones, la etapa (b) comprende proporcionar a cada recipiente una cantidad de ácido nucleico plantilla igual a aproximadamente menos de un equivalente haploide, aproximadamente igual a un equivalente haploide, o más de un equivalente haploide del ácido nucleico diana.
En algunas realizaciones, la etapa (b) comprende proporcionar a cada recipiente una cantidad de ácido nucleico plantilla de menos de aproximadamente un equivalente haploide del ácido nucleico diana.
En algunas realizaciones, la etapa (c) comprende un método seleccionado del grupo que consiste en añadir un detergente, cambiar la temperatura, cambiar el pH, añadir una proteasa, añadir una chaperona y añadir una polimerasa.
En algunas realizaciones, la primera secuencia de transposón comprende un primer sitio de cebador y las segundas secuencias de transposón comprenden un segundo sitio de cebador.
En algunas realizaciones, el primer sitio de cebador comprende además un primer código de barras y el segundo sitio de cebador comprende además un segundo código de barras.
En algunas realizaciones, el primer código de barras y el segundo código de barras son diferentes.
En algunas realizaciones, el ácido nucleico diana comprende un ácido nucleico amplificado.
En algunas realizaciones, el ácido nucleico diana se obtiene enriqueciendo una pluralidad de ácidos nucleicos para una secuencia de interés antes o después de la transposición.
En algunas realizaciones, la etapa (a) comprende además enriquecer el ácido nucleico plantilla para una secuencia de interés.
En algunas realizaciones, el ácido nucleico diana comprende ADN genómico.
En algunas realizaciones, la etapa (d) comprende además ensamblar, a partir de datos de secuencia, una representación de al menos una porción de dicho ácido nucleico plantilla de cada recipiente.
En algunas realizaciones, la información de secuencia comprende información de secuencia de haplotipos.
Algunas realizaciones de los métodos y composiciones proporcionados en el presente documento incluyen un método para preparar una biblioteca de ácidos nucleicos plantilla para obtener información de secuencia de un ácido nucleico diana, comprendiendo dicho método: (a) preparar un ácido nucleico plantilla que comprende una pluralidad de transposomas insertados en dicho ácido nucleico diana, en donde al menos algunos de los transposomas insertados comprenden cada uno una primera secuencia de transposón, una segunda secuencia de transposón no contigua con dicha primera secuencia de transposón y una transposasa asociada con la primera secuencia de transposón y la segunda secuencia de transposón; y (b) compartimentar el ácido nucleico plantilla que comprende dicha pluralidad de transposomas insertados en cada recipiente de una pluralidad de recipientes; y (c) eliminar la transposasa del ácido nucleico plantilla.
En algunas realizaciones, la etapa (b) comprende proporcionar a cada recipiente una cantidad de ácido nucleico plantilla igual a menos de un equivalente haploide, aproximadamente un equivalente, o más de un equivalente del ácido nucleico diana.
En algunas realizaciones, la etapa (b) comprende proporcionar a cada recipiente una cantidad de ácido nucleico plantilla de menos de aproximadamente un equivalente haploide del ácido nucleico diana.
En algunas realizaciones, la etapa (c) comprende un método seleccionado del grupo que consiste en añadir un detergente, cambiar la temperatura, cambiar el pH, añadir una proteasa, añadir una chaperona y añadir una polimerasa.
En algunas realizaciones, la primera secuencia de transposón comprende un primer sitio de cebador y las segundas secuencias de transposón comprenden un segundo sitio de cebador.
En algunas realizaciones, el primer sitio de cebador comprende además un primer código de barras y el segundo sitio de cebador comprende además un segundo código de barras.
En algunas realizaciones, el primer código de barras y el segundo código de barras son diferentes.
En algunas realizaciones, el ácido nucleico diana comprende un ácido nucleico amplificado.
En algunas realizaciones, el ácido nucleico diana se obtiene enriqueciendo una pluralidad de ácidos nucleicos para una secuencia de interés.
En algunas realizaciones, la etapa (a) comprende además enriquecer el ácido nucleico plantilla para una secuencia de interés.
En algunas realizaciones, el ácido nucleico diana comprende ADN genómico.
En algunas realizaciones, la información de secuencia comprende información de secuencia de haplotipos.
Algunas realizaciones de los métodos y composiciones proporcionados en el presente documento incluyen una biblioteca de ácidos nucleicos plantilla preparados de acuerdo con uno cualquiera de los métodos anteriores.
Algunas realizaciones de los métodos y composiciones proporcionados en el presente documento incluyen un método para obtener información de secuencia de un ácido nucleico diana, comprendiendo dicho método: (a) compartimentar el ácido nucleico diana en una pluralidad de primeros recipientes; (b) proporcionar un primer índice al ácido nucleico diana de cada primer recipiente, obteniendo, de este modo, un primer ácido nucleico indexado; (c) combinar los primeros ácidos nucleicos indexados; (d) compartimentar los primeros ácidos nucleicos plantilla indexados en una pluralidad de segundos recipientes; (e) proporcionar un segundo índice al primer ácido nucleico plantilla indexado de cada segundo recipiente, obteniendo, de este modo, un segundo ácido nucleico indexado; y (f) obtener información de secuencia del segundo ácido nucleico indexado de cada segundo recipiente.
En algunas realizaciones, la etapa (b) comprende poner en contacto el ácido nucleico diana con una pluralidad de transposomas, comprendiendo cada uno, una transposasa y una secuencia de transposón que comprende el primer índice en unas condiciones de manera que al menos algunas de las secuencias de transposón se insertan en el ácido nucleico diana.
En algunas realizaciones, la etapa (b) comprende poner en contacto el ácido nucleico diana con una pluralidad de transposomas, comprendiendo cada transposón una primera secuencia de transposón que comprende un primer índice, una segunda secuencia de transposón no contigua con dicha primera secuencia de transposón y una transposasa asociada con la primera secuencia de transposón y la segunda secuencia de transposón.
En algunas realizaciones, la etapa (d) comprende eliminar la transposasa de los primeros ácidos nucleicos plantilla indexados compartimentados.
En algunas realizaciones, la transposasa se elimina después de la etapa (b).
En algunas realizaciones, la transposasa se elimina antes de la etapa (f).
En algunas realizaciones, eliminar la transposasa comprende un método seleccionado del grupo que consiste en añadir un detergente, cambiar la temperatura, cambiar el pH, añadir una proteasa, añadir una chaperona y añadir una polimerasa de desplazamiento de cadena.
En algunas realizaciones, la primera secuencia de transposón comprende un primer sitio de cebador y la segunda secuencia de transposón comprende un segundo sitio de cebador.
En algunas realizaciones, el primer sitio de cebador comprende además un primer código de barras y el segundo sitio de cebador comprende además un segundo código de barras.
En algunas realizaciones, el primer código de barras y el segundo código de barras son diferentes.
En algunas realizaciones, la etapa (b) comprende amplificar el ácido nucleico diana con al menos un cebador que comprende el primer índice.
En algunas realizaciones, la etapa (b) comprende unir el ácido nucleico diana con al menos un cebador que comprende el primer índice.
En algunas realizaciones, el primer índice proporcionado al ácido nucleico diana de cada primer recipiente es diferente. En algunas realizaciones, la etapa (a) comprende proporcionar a cada primer recipiente una cantidad de ácido nucleico diana mayor que aproximadamente uno o más equivalentes haploides del ácido nucleico diana.
En algunas realizaciones, la etapa (d) comprende proporcionar a cada recipiente una cantidad de los primeros ácidos nucleicos plantilla indexados mayor que aproximadamente uno o más equivalentes haploides del ácido nucleico diana. En algunas realizaciones, la etapa (e) comprende amplificar el primer ácido nucleico plantilla indexado con al menos un cebador que comprenda el segundo índice.
En algunas realizaciones, la etapa (e) comprende unir el primer ácido nucleico plantilla indexado con al menos un cebador que comprende el segundo índice.
En algunas realizaciones, el segundo índice proporcionado al primer ácido nucleico plantilla indexado de cada segundo recipiente es diferente.
En algunas realizaciones, el ácido nucleico diana comprende un ácido nucleico amplificado.
En algunas realizaciones, el ácido nucleico diana se obtiene enriqueciendo una pluralidad de ácidos nucleicos para una secuencia de interés.
En algunas realizaciones, el ácido nucleico diana comprende ADN genómico.
En algunas realizaciones, la etapa (f) comprende además ensamblar, a partir de datos de secuencia, una representación de al menos una porción de dicho ácido nucleico plantilla de cada recipiente.
Algunas realizaciones de los métodos y composiciones proporcionados en el presente documento incluyen un método de preparación de una biblioteca de ácidos nucleicos plantilla para obtener información de secuencia de un ácido nucleico diana, comprendiendo dicho método: (a) compartimentar el ácido nucleico diana en una pluralidad de primeros recipientes; (b) proporcionar un primer índice al ácido nucleico diana de cada primer recipiente, obteniendo, de este modo, un primer ácido nucleico indexado; (c) combinar los primeros ácidos nucleicos indexados; (d) compartimentar los primeros ácidos nucleicos plantilla indexados en una pluralidad de segundos recipientes; y (e) proporcionar un segundo índice al primer ácido nucleico plantilla indexado de cada segundo recipiente, obteniendo, de este modo, un segundo ácido nucleico indexado.
En algunas realizaciones, la etapa (b) comprende poner en contacto el ácido nucleico diana con una pluralidad de transposomas, comprendiendo cada uno, una transposasa y una secuencia de transposón que comprende el primer índice en unas condiciones de manera que al menos algunas de las secuencias de transposón se insertan en el ácido nucleico diana.
En algunas realizaciones, la etapa (b) comprende poner en contacto el ácido nucleico diana con una pluralidad de transposomas, comprendiendo cada transposón una primera secuencia de transposón que comprende un primer índice, una segunda secuencia de transposón no contigua con dicha primera secuencia de transposón y una transposasa asociada con la primera secuencia de transposón y la segunda secuencia de transposón.
En algunas realizaciones, la etapa (d) comprende eliminar la transposasa de los primeros ácidos nucleicos plantilla indexados compartimentados.
En algunas realizaciones, eliminar la transposasa comprende un método seleccionado del grupo que consiste en añadir un detergente, cambiar la temperatura, cambiar el pH, añadir una proteasa, añadir una chaperona y añadir una polimerasa.
En algunas realizaciones, la primera secuencia de transposón comprende un primer sitio de cebador y la segunda secuencia de transposón comprende un segundo sitio de cebador.
En algunas realizaciones, el primer sitio de cebador comprende además un primer código de barras y el segundo sitio de cebador comprende además un segundo código de barras.
En algunas realizaciones, el primer código de barras y el segundo código de barras son diferentes.
En algunas realizaciones, la etapa (b) comprende amplificar el ácido nucleico diana con al menos un cebador que comprende el primer índice.
En algunas realizaciones, la etapa (b) comprende unir el ácido nucleico diana con al menos un cebador que comprende el primer índice.
En algunas realizaciones, el primer índice proporcionado al ácido nucleico diana de cada primer recipiente es diferente. En algunas realizaciones, la etapa (a) comprende proporcionar a cada primer recipiente una cantidad de ácido nucleico diana mayor que aproximadamente uno o más equivalentes haploides del ácido nucleico diana.
En algunas realizaciones, la etapa (d) comprende proporcionar a cada recipiente una cantidad de los primeros ácidos nucleicos plantilla indexados mayor que aproximadamente uno o más equivalentes haploides del ácido nucleico diana. En algunas realizaciones, la etapa (e) comprende amplificar el primer ácido nucleico plantilla indexado con al menos un cebador que comprenda el segundo índice.
En algunas realizaciones, la etapa (e) comprende unir el primer ácido nucleico plantilla indexado con al menos un cebador que comprende el segundo índice.
En algunas realizaciones, el segundo índice proporcionado al primer ácido nucleico plantilla indexado de cada segundo recipiente es diferente.
En algunas realizaciones, el ácido nucleico diana comprende un ácido nucleico amplificado.
En algunas realizaciones, el ácido nucleico diana se obtiene enriqueciendo una pluralidad de ácidos nucleicos para una secuencia de interés bien antes o después de la transposición.
En algunas realizaciones, el ácido nucleico diana comprende ADN genómico.
Algunas realizaciones de los métodos y composiciones proporcionados en el presente documento incluyen una biblioteca de ácidos nucleicos plantilla preparados de acuerdo con uno cualquiera de los métodos anteriores.
Breve descripción de los dibujos
La figura 1 representa un esquema de un transposoma que comprende una transposasa dimérica y dos secuencias de transposón no contiguas, y un transposoma que comprende una transposasa dimérica y una secuencia de transposón contigua.
La figura 2 representa un método para preparar un transposoma con un enlazador que comprende una secuencia complementaria bicatenaria.
La figura 3 representa una realización para preparar una biblioteca de plantillas usando transposomas que comprenden secuencias de transposón que comprenden un enlazador monocatenario que acopla las dos secuencias de transposón en cada transposoma en una orientación 5'-5'. Las secuencias se amplían utilizando cebadores
La figura 4 representa un esquema para preparar ácidos nucleicos plantilla para obtener información de secuencia en el que un ácido nucleico diana se compartimenta en 96 tubos, se indexa por inserción de transposones derivados de Tn5, los ácidos nucleicos indexados se combinan y se compartimentan adicionalmente en 96 tubos, se indexan adicionalmente por amplificación, los ácidos nucleicos indexados dos veces se pueden combinar a continuación.
La figura 5 representa una realización esquemática para obtener información de secuencia de haplotipos en la que un ácido nucleico plantilla se indexa con el código de barras de un transposón y con un cebador. Se prepara un ácido nucleico plantilla mediante la inserción de un transposón en bucle en un ácido nucleico diana. El ácido nucleico plantilla se diluye en compartimentos. El ácido nucleico plantilla de cada compartimento se indexa mediante amplificación con un cebador. Se secuencian los ácidos nucleicos plantilla indexados, se alinean y se obtiene la representación de secuencia.
La figura 6 representa un esquema que incluye la preparación de un ácido nucleico diana usando amplificación de tipo matepair y en círculo rodante, seguida de la inserción de transposomas en el ácido nucleico diana, dilución del ácido nucleico diana para obtener información sobre el haplotipo, eliminación de la transposasa mediante adición de SDS, generación de bibliotecas indiscriminadas, indexación y secuenciación.
La figura 7 representa un esquema que incluye la preparación de un ácido nucleico diana mediante transposición en horquilla y amplificación de círculo rodante, seguida de la inserción de transposomas en el ácido nucleico diana, dilución del ácido nucleico diana, eliminación de la transposasa mediante adición de SDS, generación de bibliotecas indiscriminadas, indexación y secuenciación para obtener información de haplotipos.
La figura 8 describe un esquema de ejemplo para la generación de bibliotecas de tipo mate pair.
La figura 9 describe un esquema de ejemplo para la generación de bibliotecas de tipo mate pair.
La figura 10 es un gráfico que representa un modelo de tasa de error en la información de secuencia para el número de veces que se secuencia una secuencia concreta asociada con un código de barras.
La figura 11 representa imágenes de geles de agarosa que muestran oligonucleótidos unidos con un acoplamiento de bisoxiamina 5'-5', en el que los transposones precursores en bucle están indicados por la banda de dímeros.
La figura 12 es una imagen de un gel de agarosa que muestra el peso molecular aparente de un ácido nucleico diana transpuesto asociado con transposasa (carril izquierdo) y sin transposasa (+ SDS al 0,1 %, carril central).
La figura 13 resume que se observaron bloques de haplotipos de hasta 100 kb para muestras en las que se eliminó la transposasa mediante SDS después de la dilución.
La figura 14 representa un gráfico que muestra las frecuencias de lecturas de secuenciación para distancias particulares entre lecturas alineadas vecinas para los ácidos nucleicos plantilla preparados mediante la adición de SDS para eliminar la transposasa antes de la dilución para obtener información de haplotipos, o después de la dilución para obtener información de haplotipos.
La figura 15 muestra un gráfico de índices de códigos de barras y la proporción de lecturas y demuestra que se observaron los 9216 compartimentos diferentes en un esquema de indexación de 96 X 96.
La figura 16 representa un análisis de apilamiento de información de haplotipos obtenida usando transposomas que comprenden Mu.
Descripción detallada
Las realizaciones de la presente invención se refieren a la secuenciación de ácidos nucleicos. En particular, las realizaciones de los métodos y composiciones proporcionados en el presente documento se refieren a la preparación de plantillas de ácidos nucleicos y a la obtención de datos de secuencia a partir de ellos. Los métodos y composiciones proporcionados en el presente documento están relacionados con los métodos y composiciones proporcionados en la publicación de solicitud de patente de Estados Unidos n.° 2012/0208705, en la publicación de solicitud de patente de Estados Unidos n.° 2012/0208724 y en la publicación de solicitud de patente internacional n.° WO 2012/061832. Algunas realizaciones de la presente invención se refieren a la preparación de plantillas para obtener información de secuencia de haplotipos a partir de un ácido nucleico diana y a la obtención de información de secuencia de haplotipos a partir de dichas plantillas. Más realizaciones se refieren a la preparación de plantillas para obtener información de secuencia de una cadena de un ácido nucleico diana bicatenario y a la obtención de información de secuencia a partir de dichas plantillas. Las realizaciones particulares proporcionadas en el presente documento se refieren al uso de integrasas, por ejemplo, transposasas, para mantener la proximidad física de los extremos asociados de los ácidos nucleicos fragmentados; y al uso de compartimentos virtuales para permitir el uso de altas concentraciones de ácidos nucleicos.
La obtención de información de haplotipos de un ácido nucleico diana incluye distinguir entre diferentes alelos (p. ej., SNP, anomalías genéticas, etc.) en un ácido nucleico diana. Dichos métodos son útiles para caracterizar diferentes alelos en un ácido nucleico diana y para reducir la tasa de error en la información de secuencia. Generalmente, los métodos para obtener información de secuencia de haplotipos incluyen la obtención de información de secuencia para una porción de un ácido nucleico plantilla. En una realización, se puede diluir un ácido nucleico plantilla y obtener información de secuencia a partir de una cantidad de ácido nucleico plantilla equivalente a aproximadamente un haplotipo del ácido nucleico diana.
En realizaciones adicionales, un ácido nucleico plantilla puede compartimentarse de modo que puedan estar presentes múltiples copias de un cromosoma en el mismo compartimento, como resultado de la indexación doble o múltiple proporcionada en el presente documento, pudiéndose determinar también un haplotipo. En otras palabras, se puede preparar un ácido nucleico plantilla usando compartimentos virtuales. En dichas realizaciones, un ácido nucleico se puede distribuir entre varios primeros compartimentos, proporcionando un primer índice del ácido nucleico de cada compartimento, combinando los ácidos nucleicos, distribuyendo el ácido nucleico entre varios segundos compartimentos y proporcionando un segundo índice al ácido nucleico de cada compartimento. Ventajosamente, dicha indexación permite obtener información de haplotipos a concentraciones más altas de ácido nucleico en comparación con la mera dilución de un ácido nucleico en un solo compartimento hasta una cantidad equivalente a un haplotipo del ácido nucleico.
En algunas realizaciones proporcionadas en el presente documento, las bibliotecas de plantillas se preparan usando transposomas. En algunas de estas bibliotecas, el ácido nucleico diana puede estar fragmentado. Por consiguiente, algunas realizaciones proporcionadas en el presente documento se refieren a métodos para mantener la información de secuencia para determinar la contigüidad física de fragmentos adyacentes. Dichos métodos incluyen el uso de integrasas para mantener la asociación de fragmentos de ácido nucleico plantilla adyacentes en el ácido nucleico diana. Ventajosamente, dicho uso de integrasas para mantener la proximidad física de ácidos nucleicos fragmentados aumenta la probabilidad de que se produzcan ácidos nucleicos fragmentados de la misma molécula original, por ejemplo, cromosoma, en el mismo compartimento.
Otras realizaciones proporcionadas en el presente documento se refieren a la obtención de información de secuencia de cada cadena de un ácido nucleico que puede ser útil para reducir la tasa de error en la información de secuenciación. Se pueden preparar métodos para preparar bibliotecas de ácidos nucleicos plantilla para obtener información de secuencia de cada cadena de un ácido nucleico de modo que se pueda distinguir cada cadena y también se puedan distinguir los productos de cada cadena.
Algunos de los métodos proporcionados en el presente documento incluyen métodos para analizar ácidos nucleicos. Dichos métodos incluyen preparar una biblioteca de ácidos nucleicos plantilla de un ácido nucleico diana, obtener datos de secuencia de la biblioteca de ácidos nucleicos plantilla y ensamblar una representación de secuencia del ácido nucleico diana a partir de dichos datos de secuencia.
Generalmente, los métodos y composiciones proporcionados en el presente documento están relacionados con los métodos y composiciones proporcionados en la publicación de solicitud de patente de Estados Unidos n.° 2012/0208705, en la publicación de solicitud de patente de Estados Unidos n.° 2012/0208724 y en la publicación de solicitud de patente internacional n.° WO 2012/061832. Los métodos proporcionados en el presente documento se refieren al uso de transposomas útiles para insertar características en un ácido nucleico diana. Incluyendo, dichas características, sitios de fragmentación, sitios de cebador, códigos de barras, etiquetas de afinidad, residuos indicadores, etc.
En un método útil con las realizaciones proporcionadas en el presente documento, se prepara una biblioteca de ácidos nucleicos plantilla a partir de un ácido nucleico diana. La biblioteca se prepara insertando una pluralidad de códigos de barras exclusivos en todo el ácido nucleico diana. En algunas realizaciones, cada código de barras incluye una primera secuencia de código de barras y una segunda secuencia de código de barras, teniendo un sitio de fragmentación dispuesto entre ellas. La primera secuencia de código de barras y la segunda secuencia de código de barras pueden identificarse o designarse para emparejarse entre sí. El emparejamiento puede ser informativo de modo que un primer código de barras se asocie con un segundo código de barras. Ventajosamente, las secuencias de códigos de barras emparejadas se pueden usar para ensamblar datos de secuenciación de la biblioteca de ácidos nucleicos plantilla. Por ejemplo, identificar un primer ácido nucleico plantilla que comprende una primera secuencia de código de barras y un segundo ácido nucleico plantilla que comprende una segunda secuencia de código de barras que está emparejada con la primera indica que el primer y segundo ácidos nucleicos plantilla representan secuencias adyacentes entre sí en una representación de secuencia del ácido nucleico diana. Dichos métodos se pueden usar para ensamblar una representación de secuencia de un ácido nucleico diana. de novo, sin la necesidad de un genoma de referencia.
Definiciones
Como se usa en el presente documento, la expresión "ácido nucleico" y/o "oligonucleótido" y/o equivalentes gramaticales de las mismas pueden referirse a al menos dos monómeros de nucleótidos unidos entre sí. Un ácido nucleico generalmente puede contener enlaces fosfodiéster; sin embargo, en algunas realizaciones, los análogos de ácidos nucleicos pueden tener otros tipos de cadenas principales, que comprenden, por ejemplo, enlaces fosforamida (Beaucage et al., Tetrahedron, 49:1925 (1993); Letsinger, J. Org. Chem., 35:3800 (1970); Sprinzl, et al., Eur. J. Biochem., 81:579 (1977); Letsinger, et al., Nucl. Acids Res., 14:3487 (1986); Sawai, et al., Chem. Lett., 805 (1984), Letsinger, et al., J. Am. Chem. Soc., 110:4470 (1988); y Pauwels, et al., Chemica Scripta, 26:141 (1986)), fosforotioato (Mag et al., Nucleic Acids Res., 19:1437 (1991) y la patente de Estados Unidos n.° 5.644.048), fosforoditioato (Briu et al., J. Am. Chem. Soc., 111:2321 (1989), O-metilfosforoamidita (véase Eckstein, Oligonucleotides and Analogues: A Practical Approach, Oxford University Press), y cadenas principales y enlaces de ácidos nucleicos peptídicos (véase Egholm, J. Am. Chem. Soc., 114:1895 (1992); Meier, et al., Chem. Int. Ed. Engl., 31:1008 (1992); Nielsen, Nature, 365:566 (1993); Carlsson, et al., Nature, 380:207 (1996)).
Otros ácidos nucleicos análogos incluyen aquellos con cadenas principales positivas (Denpcy, et al., Proc. Natl. Acad. Sci. USA, 92:6097 (1995)); cadenas principales no iónicas (patentes de Estados Unidos n.° 5.386.023; 5637684; 5602240; 5216141; y 4.469.863; Kiedrowshi, et al., Angew. Chem. Intl. Ed. English, 30:423 (1991); Letsinger, et al., J. Am. Chem. Soc., 110:4470 (1988); Letsinger, et al., Nucleosides & Nucleotides, 13:1597 (1994); Capítulos 2 y 3, ASC Symposium Series 580, "Carbohydrate Modifications in Antisense Research", Ed. Y. S. Sanghui y P. Dan Cook; Mesmaeker, et al., Bioorganic & Medicinal Chem. Lett., 4:395 (1994); Jeffs, et al., J. Biomolecular NMR, 34:17 (1994); Tetrahedron Lett., 37:743 (1996)) y sin ribosa (patente de Estados Unidos n.° 5.235.033 y n.° 5.034.506, y Capítulos 6 y 7, ASC Symposium Series 580, "Carbohydrate Modifications in Antisense Research", Ed. Y. S. Sanghui y P. Dan Coo). Los ácidos nucleicos también pueden contener uno o más azúcares carbocíclicos (véase Jenkins, et al., Chem. Soc. Rev., (1995) págs. 169176).
Pueden realizarse modificaciones de la cadena principal de ribosa-fosfato para facilitar la adición de restos adicionales tales como marcadores, o para aumentar la estabilidad de dichas moléculas en determinadas condiciones. Asimismo, se pueden realizar mezclas de ácidos nucleicos de origen natural y sus análogos. Como alternativa, se pueden realizar mezclas de diferentes análogos de ácidos nucleicos, y mezclas de ácidos nucleicos de origen natural y sus análogos. Los ácidos nucleicos pueden ser monocatenarios o bicatenarios, como se especifica, o contener porciones de la secuencia bicatenaria o monocatenaria. El ácido nucleico puede ser ADN, por ejemplo, genómico o ADNc, ARN o un híbrido, de células sueltas, múltiples células, o de múltiples especies, como con las muestras metagenómicas, tal como de muestras ambientales, además de muestras mixtas, por ejemplo, muestras mixtas de tejidos o muestras mixtas de diferentes individuos de la misma especie, muestras de enfermedades tales como ácidos nucleicos relacionados con cáncer y similares. Un ácido nucleico puede contener cualquier combinación de desoxirribo y ribonucleótidos, y cualquier combinación de bases, incluyendo uracilo, adenina, timina, citosina, guanina, inosina, xantanina, hipoxantanina, isocitosina, isoguanina y análogos de bases tal como nitropirrol (incluyendo 3-nitropirrol) y nitroindol (incluyendo 5-nitroindol), etc.
En algunas realizaciones, un ácido nucleico puede incluir al menos una base promiscua. Las bases promiscuas pueden formar pares de bases con más de un tipo de base diferente. En algunas realizaciones, una base promiscua puede formar pares de bases con al menos dos tipos diferentes de bases y no más de tres tipos diferentes de bases. Un ejemplo de una base promiscua incluye inosina que puede emparejarse con adenina, timina o citosina. Otros ejemplos incluyen hipoxantina, 5-nitroindol, 5-nitroindol acílico, 4-nitropirazol, 4-nitroimidazol y 3-nitropirrol (Loakes et al., Nucleic Acid Res. 22:4039 (1994); Van Aerschot et al., Nucleic Acid Res. 23:4363 (1995); Nichols et al., Nature 369:492 (1994); Bergstrom et al., Nucleic Acid Res. 25:1935 (1997); Loakes et al., Nucleic Acid Res. 23:2361 (1995); Loakes et al., J. Mol. Biol. 270:426 (1997); y Fotin et al., Nucleic Acid Res. 26:1515 (1998)). También se pueden utilizar bases promiscuas que pueden formar pares de bases con al menos tres, cuatro o más tipos de bases.
Como se usa en el presente documento, la expresión "análogo de nucleótido" y/o equivalentes gramaticales de la misma pueden referirse a análogos sintéticos que tienen porciones de bases de nucleótidos modificadas, porciones de pentosa modificadas y/o porciones de fosfato modificadas y, en el caso de polinucleótidos, enlaces internucleotídicos modificados, como se describe generalmente en otra parte (p. ej, Scheit, Nucleotide Analogs, John Wiley, Nueva York, 1980; Englisch, Angew. Chem. Int. Ed. Engl. 30:613-29, 1991; Agarwal, Protocols for Polynucleotides and Analogs, Humana Press, 1994; y S. Verma y F. Eckstein, Ann. Rev. Biochem. 67:99-134, 1998). Generalmente, las porciones de fosfato modificadas comprenden análogos de fosfato en donde el átomo de fósforo está en estado de oxidación 5 y uno o más de los átomos de oxígeno están reemplazados con un resto que no es oxígeno, por ejemplo, azufre. Análogos de fosfato ilustrativos incluyen, pero sin limitación, fosforotioato, fosforoditioato, fosforoselenoato, fosforodiselenoato, fosforoanilotioato, fosforanilidato, fosforamidato, boronofosfatos, incluyendo contraiones asociados, por ejemplo, H+, NH4+, Na+, si están presentes dichos contraiones. Las porciones de bases de nucleótidos modificadas ilustrativas incluyen, pero sin limitación, 5-metilcitosina (5mC); análogos de C-5-propinilo, incluyendo, pero sin limitación, C-5 propinilo-C y C-5 propinilo-U; 2,6-diaminopurina, también conocida como 2-aminoadenina o 2-amino-dA); hipoxantina, pseudouridina, 2-tiopirimidina, isocitosina (isoC), 5-metil isoC e isoguanina (isoG; véase, por ejemplo, la patente de Estados Unidos n.° 5.432.272). Las porciones de pentosa modificadas ilustrativas incluyen, pero sin limitación, análogos de ácidos nucleicos bloqueados (LNA, por sus siglas en inglés) que incluyen, sin limitación, Bz-A-LNA, 5-Me-Bz-C-LNA, dmf-G-LNA y T-LNA (véase, p.ej, The Glen Report, 16(2):5, 2003; Koshkin et al., Tetrahedron 54:3607-30, 1998), y modificaciones 2 'o 3' donde la posición 2' o 3' es hidrógeno, hidroxi, alcoxip.ej., metoxi, etoxi, aliloxi, isopropoxi, butoxi, isobutoxi y fenoxi), azido, amino, alquilamino, flúor, cloro o bromo. Los enlaces intemudeotídicos modificados incluyen análogos de fosfato, teniendo los análogos enlaces intersubunitarios aquirales y no cargados (p. ej., Sterchak, E. P. et al., Organic Chem., 52:4202, 1987), y polímeros basados en morfolino no cargados que tienen enlaces intersubunitarios aquirales (véase, p. ej, la patente de Estados Unidos n.° 5.034.506). Algunos análogos de enlaces internucleotídicos incluyen morfolidato, acetal y heterociclos unidos a poliamida. En una clase de análogos de nucleótidos, conocidos como ácidos nucleicos peptídicos, incluidos los ácidos nucleicos peptídicos ("PNA, por sus siglas en inglés") pseudocomplementarios, se han reemplazado un azúcar convencional y un enlace internucleotídico con un polímero de cadena principal de 2-aminoetilglicina amida (véase, p. ej, Nielsen et al., Science, 254:1497-1500, 1991; Egholm et al., J. Am. Chem. Soc., 114: 1895-18971992; Demidov et al., Proc. Natl. Acad. Sci. 99:5953-58, 2002; Peptide Nucleic Acids: Protocols and Applications, Nielsen, ed., Horizon Bioscience, 2004).
Como se usa en el presente documento, la expresión "lectura de secuenciación" y/o equivalentes gramaticales de la misma pueden referirse a un proceso repetitivo de etapas físicas o químicas que se lleva a cabo para obtener señales indicativas del orden de los monómeros en un polímero. Las señales pueden ser indicativas de un orden de monómeros con una resolución de un solo monómero o una resolución más baja. En realizaciones particulares, las etapas pueden iniciarse en una diana de ácido nucleico y llevarse a cabo para obtener señales indicativas del orden de las bases en la diana de ácido nucleico. El proceso puede llevarse a cabo hasta su finalización habitual, que generalmente se define por el punto en el que las señales del proceso ya no pueden distinguir las bases de la diana con un nivel razonable de certeza. Si se desea, la finalización puede producirse antes, por ejemplo, una vez que se ha obtenido la cantidad deseada de información de secuencia. Se puede realizar una lectura de secuenciación en una única molécula de ácido nucleico diana o simultáneamente en una población de moléculas de ácido nucleico diana que tienen la misma secuencia, o simultáneamente en una población de ácidos nucleicos diana que tienen diferentes secuencias. En algunas realizaciones, una lectura de secuenciación finaliza cuando ya no se obtienen señales de una o más moléculas de ácido nucleico diana a partir de las cuales se inició la adquisición de señales. Por ejemplo, se puede iniciar una lectura de secuenciación para una o más moléculas de ácido nucleico diana que están presentes en un sustrato en fase sólida y terminar tras la eliminación de una o más moléculas de ácido nucleico diana del sustrato. La secuenciación se puede finalizar interrumpiendo de otro modo la detección de los ácidos nucleicos diana que estaban presentes en el sustrato cuando se inició la ejecución de secuenciación.
Como se usa en el presente documento, la expresión "representación de secuenciación" y/o equivalentes gramaticales de la misma pueden referirse a información que significa el orden y tipo de unidades monoméricas en el polímero. Por ejemplo, la información puede indicar el orden y el tipo de nucleótidos en un ácido nucleico. La información puede estar en cualquiera de una variedad de formatos que incluyen, por ejemplo, una representación, imagen, medio electrónico, serie de símbolos, serie de números, serie de letras, serie de colores, etc. La información puede tener una resolución de un solo monómero o una resolución más baja. Un polímero ilustrativo es un ácido nucleico, tal como ADN o ARN, que tiene unidades de nucleótidos. Una serie de letras "A", "T", "G", y "C" son una representación de secuencia bien conocida para el ADN que puede correlacionarse, a resolución de un solo nucleótido, con la secuencia real de una molécula de ADN. Otros polímeros ilustrativos son proteínas que tienen unidades de aminoácidos y polisacáridos que tienen unidades de sacáridos.
Como se usa en el presente documento, la expresión "al menos una porción" y/o equivalentes gramaticales de la misma pueden referirse a cualquier fracción de una cantidad total. Por ejemplo, "al menos una porción" puede referirse a al menos aproximadamente el 1 %, 2 %, 3 %, 4 %, 5 %, 6 %, 7 %, 8 %, 9 %, 10 %, 15 %, 20 %, 25 %, 30 %, 35 %, 40 %, 45 %, 50 %, 55 %, 60 %, 65 %, 70 %, 75 %, 80 %, 85 %, 90 %, 95 %, 99 %, 99,9 % o 100 % de una cantidad total.
Transposomas
Un "transposoma" comprende una enzima de integración tal como una integrasa o transposasa, y un ácido nucleico que comprende un sitio de reconocimiento de integración, tal como un sitio de reconocimiento de transposasas. En realizaciones proporcionadas en el presente documento, la transposasa puede formar un complejo funcional con un sitio de reconocimiento de transposasas que es capaz de catalizar una reacción de transposición. La transposasa puede unirse al sitio de reconocimiento de transposasas e insertar el sitio de reconocimiento de transposasas en un ácido nucleico diana en un proceso denominado a veces "etiquetado". En algunos de estos eventos de inserción, una cadena del sitio de reconocimiento de transposasas puede transferirse al ácido nucleico diana. La figura 1 representa dos ejemplos de transposomas. En un ejemplo, un transposoma (10) comprende una transposasa dimérica que comprende dos subunidades (20) y dos secuencias de transposón (30) no contiguas. En otro ejemplo, un transposoma (50) comprende una transposasa que comprende una transposasa dimérica que comprende dos subunidades (60) y una secuencia de transposón contigua (70).
Algunas realizaciones pueden incluir el uso de una transposasa Tn5 hiperactiva y un sitio de reconocimiento de transposasas de tipo Tn5 (Goryshin y Reznikoff, J. Biol. Chem., 273:7367 (1998)), o transposasa MuA y un sitio de reconocimiento de transposasa Mu que comprende las secuencias terminales R1 y R2 (Mizuuchi, K., Cell, 35: 785, 1983; Savilahti, H, et al., EMBO J., 14: 4893, 1995). También se pueden utilizar secuencias ME optimizadas por un experto en la materia.
Más ejemplos de sistemas de transposición que se pueden usar con determinadas realizaciones de las composiciones y métodos proporcionados en el presente documento incluyen Tn552 de Staphylococcus aureus (Colegio et al., J. Bacteriol., 183: 2384-8, 2001; Kirby C et al., Mol. Microbiol, 43: 173-86, 2002), Tyl (Devine & Boeke, Nucleic Acids Res., 22: 3765-72, 1994 y la publicación internacional WO 95/23875), transposón Tn7 (Craig, N L, Science. 271: 1512, 1996; Craig, N L, Revisión en: Curr Top Microbiol Immunol., 204:27-48, 1996), Tn/O e IS10 (Kleckner N, et al., Curr Top Microbiol Immunol., 204:49-82, 1996), transposasa Mariner (Lampe D J, et al., EMBO J., 15: 5470-9, 1996), Tc1 (Plasterk R H, Curr. Topics Microbiol. Immunol., 204: 125-43, 1996), elemento P (Gloor, G B, Methods Mol. Biol., 260: 97-114, 2004), Tn3 (Ichikawa & Ohtsubo, J Biol. Chem. 265:18829-32, 1990), secuencias de inserción bacteriana (Ohtsubo & Sekine, Curr. Top. Microbiol. Immunol. 204: 1-26, 1996), retrovirus (Brown, et al., Proc Natl Acad Sci USA, 86:2525-9, 1989) y retrotransposón de levadura (Boeke & Corces, Annu Rev Microbiol. 43:403-34, 1989). Más ejemplos incluyen IS5, Tn10, Tn903, IS911 y versiones modificadas por ingeniería de enzimas de la familia de las transposasas (Zhang et al., (2009) PLoS Genet. 5:e1000689. Epub 2009 Oct 16; Wilson C. et al (2007) J. Microbiol. Methods 71:332-5).
Más ejemplos de integrasas que pueden usarse con los métodos y composiciones proporcionados en el presente documento incluyen integrasas retrovíricas y secuencias de reconocimiento de integrasas para dichas integrasas retrovíricas, tal como las integrasas del VIH-1, VIH-2, SIV, PFV-1, RSV.
Secuencias de transposón
Algunas realizaciones de las composiciones y métodos proporcionados en el presente documento incluyen secuencias de transposón. En algunas realizaciones, una secuencia de transposón incluye al menos un sitio de reconocimiento de transposasas. En algunas realizaciones, una secuencia de transposón incluye al menos un sitio de reconocimiento de transposasas y al menos un código de barras. Las secuencias de transposón útiles con los métodos y composiciones proporcionados en el presente documento se proporcionan en la publicación de solicitud de patente de Estados Unidos n.° 2012/0208705, en la publicación de solicitud de patente de Estados Unidos n.° 2012/0208724 y en la publicación de solicitud de patente internacional n.° WO 2012/061832. En algunas realizaciones, una secuencia de transposón incluye un primer sitio de reconocimiento de transposasas, un segundo sitio de reconocimiento de transposasas y un código de barras o códigos de barras dispuestos entre ellos.
Transposomas con secuencias de transposón no contiguas
Algunos transposomas proporcionados en el presente documento incluyen una transposasa que comprende dos secuencias de transposón. En algunas realizaciones de este tipo, las dos secuencias de transposón no están unidas entre sí, en otras palabras, las secuencias de transposón no son contiguas entre sí. En la técnica se conocen ejemplos de dichos transposomas, véase, por ejemplo, la publicación de solicitud de patente de Estados Unidos N.° 2010/0120098. La figura 1 representa un transposoma (10) de ejemplo que comprende una transposasa dimérica (20) y dos secuencias de transposón (30).
Estructuras en bucle
En algunas realizaciones, un transposoma comprende un ácido nucleico de secuencia de transposón que se une a dos subunidades de transposasa para formar un "complejo en bucle" o un "transposoma en bucle". Esencialmente, un complejo de transposasa con transposones contiguos. La figura 1 representa un transposoma (50) de ejemplo que comprende una transposasa dimérica (60) y una secuencia de transposón (70). Los complejos en bucle pueden garantizar que los transposones se inserten en el ADN diana mientras se mantiene la información de orden del ADN diana original y sin fragmentar el ADN diana. Como se apreciará, las estructuras en bucle pueden insertar cebadores, códigos de barras, índices y similares en un ácido nucleico diana, mientras se mantiene la conectividad física del ácido nucleico diana. En algunas realizaciones, la secuencia de transposón de un transposoma en bucle puede incluir un sitio de fragmentación de manera que la secuencia de transposón se pueda fragmentar para crear un transposoma que comprenda dos secuencias de transposón. Dichos transposomas son útiles para garantizar que los fragmentos de ADN diana vecinos, en los que se insertan los transposones, reciben combinaciones de códigos que se pueden ensamblar sin ambigüedades en una etapa posterior del ensayo.
Códigos de barras
Generalmente, un código de barras puede incluir una o más secuencias de nucleótidos que pueden usarse para identificar uno o más ácidos nucleicos particulares. El código de barras puede ser una secuencia artificial o puede ser una secuencia de origen natural generada durante la transposición, tales como secuencias de ADN genómico flanqueantes idénticas (códigos g) al final de fragmentos de ADN anteriormente yuxtapuestos. Un código de barras puede comprender al menos aproximadamente 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20 o más nucleótidos consecutivos. En algunas realizaciones, un código de barras comprende al menos aproximadamente 10, 20, 30, 40, 50, 60, 70, 80, 90, 100 o más nucleótidos consecutivos. En algunas realizaciones, al menos una porción de los códigos de barras en una población de ácidos nucleicos que comprenden códigos de barras es diferente. En algunas realizaciones, al menos aproximadamente el 10 %, 20 %, 30 %, 40 %, 50 %, 60 %, 70 %, 80 %, 90 %, 95 %, 99 % de los códigos de barras son diferentes. En más de dichas realizaciones, todos los códigos de barras son diferentes. La diversidad de diferentes códigos de barras en una población de ácidos nucleicos que comprenden códigos de barras puede estar generada de forma aleatoria o generada de forma no aleatoria.
En algunas realizaciones, una secuencia de transposón comprende al menos un código de barras. En algunas realizaciones, tal como los transposomas que comprenden dos secuencias de transposón no contiguas, la primera secuencia de transposón comprende un primer código de barras y la segunda secuencia de transposón comprende un segundo código de barras. En algunas realizaciones, tal como en los transposomas en bucle, una secuencia de transposón comprende un código de barras que comprende una primera secuencia de código de barras y una segunda secuencia de código de barras. En algunas de las realizaciones anteriores, la primera secuencia de código de barras puede identificarse o designarse para emparejarse con la segunda secuencia de código de barras. Por ejemplo, se puede saber que una primera secuencia de código de barras conocida está emparejada con una segunda secuencia de código de barras conocida usando una tabla de referencia que comprende una pluralidad de secuencias de códigos de barras primeras y segundas que se sabe que están emparejadas entre sí.
En otro ejemplo, la primera secuencia de códigos de barras puede comprender la misma secuencia que la segunda secuencia de códigos de barras. En otro ejemplo, la primera secuencia de código de barras puede comprender el complemento inverso de la segunda secuencia de código de barras. En algunas realizaciones, la primera secuencia de códigos de barras y la segunda secuencia de códigos de barras son diferentes. Las secuencias de códigos de barras primera y segunda pueden comprender un bicódigo.
En algunas realizaciones de composiciones y métodos descritos en el presente documento, los códigos de barras se utilizan en la preparación de ácidos nucleicos plantilla. Como se entenderá, el gran número de códigos de barras disponibles permite que cada molécula de ácido nucleico plantilla comprenda una identificación exclusiva. La identificación exclusiva de cada molécula en una mezcla de ácidos nucleicos plantilla se puede utilizar en varias aplicaciones. Por ejemplo, se pueden aplicar moléculas identificadas de forma exclusiva para identificar moléculas de ácidos nucleicos individuales, en muestras que tienen múltiples cromosomas, en genomas, en células, en tipos de células, en estados de enfermedad celular y en especies, por ejemplo, en secuenciación de haplotipos, en la discriminación de alelos parentales, en secuenciación metagenómica y secuenciación de muestras de un genoma. Enlazadores
Algunas realizaciones que comprenden transposomas en bucle donde una transposasa forma un complejo con transposones contiguos incluyen secuencias de transposón que comprenden una primera secuencia de código de barras y una segunda secuencia de código de barras que tienen un enlazador dispuesto entre ellas. En otras realizaciones, el enlazador puede estar ausente o puede ser la cadena principal de azúcar-fosfato que conecta un nucleótido a otro. El enlazador puede comprender, por ejemplo, uno o más de un nucleótido, un ácido nucleico, un resto químico no nucleotídico, un análogo de nucleótido, aminoácido, péptido, polipéptido o proteína. En realizaciones preferidas, un enlazador comprende un ácido nucleico. El enlazador puede comprender al menos aproximadamente 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, o más nucleótidos. En algunas realizaciones, un enlazador puede comprender al menos aproximadamente 10, 20, 30, 40, 50, 60, 70, 80, 90, 100, 200, 300, 400, 500 o más nucleótidos.
En algunas realizaciones, un enlazador puede ser amplificable, por ejemplo, mediante PCR, amplificación de círculo rodante, amplificación por desplazamiento de cadena y similares. En otras realizaciones, un enlazador puede comprender restos no amplificables. Ejemplos de enlazadores no amplificables incluyen enlazadores químicos orgánicos tales como alquilo, propilo, p EG; bases no naturales tales como IsoC, isoG; o cualquier grupo que no se amplifique en esquemas de amplificación basados en ADN. Por ejemplo, transposones que contienen isoC, los pares de isoG se pueden amplificar con mezclas de dNTP que carecen de isoG e isoC complementarias, asegurando que no se produzca amplificación a través de los transposones insertados.
En algunas realizaciones, el enlazador comprende un ácido nucleico monocatenario. En algunas realizaciones, el enlazador acopla secuencias de transposón en una orientación 5'-3', una orientación de 5'-5', o una orientación de 3'-3'.
Sitios de fragmentación
En algunas realizaciones que comprenden transposomas en bucle, el enlazador puede comprender un sitio de fragmentación. Se puede usar un sitio de fragmentación para escindir la asociación física, pero no informativa entre una primera secuencia de código de barras y una segunda secuencia de código de barras. La escisión puede ser mediante medios bioquímicos, medios químicos u otros. En algunas realizaciones, un sitio de fragmentación puede incluir una secuencia de nucleótidos o nucleótidos que puede fragmentarse por diversos medios. Por ejemplo, un sitio de fragmentación puede comprender un sitio de endonucleasas de restricción; al menos un ribonucleótido escindible con una RNasa; análogos de nucleótidos escindibles en presencia de determinado agente químico; un enlace diol escindible mediante tratamiento con peryodato; un grupo disulfuro escindible con un agente reductor químico; un resto escindible que puede estar sujeto a escisión fotoquímica; y un péptido escindible mediante una enzima peptidasa u otros medios adecuados. Véase, por ejemplo, la publicación de solicitud de patente de Estados Unidos n.° 2012/0208705, la publicación de solicitud de patente de Estados Unidos n.° 2012/0208724 y la publicación de solicitud de patente internacional n.° WO 2012/061832.
Sitios de cebador
En algunas realizaciones, una secuencia de transposón puede incluir un "adaptador de secuenciación" o un "sitio de adaptador de secuenciación", es decir, una región que comprende uno o más sitios que pueden hibridar con un cebador. En algunas realizaciones, una secuencia de transposón puede incluir al menos un primer sitio de cebador útil para la amplificación, secuenciación y similares. En algunas realizaciones que comprenden transposomas en bucle, un enlazador puede incluir un adaptador de secuenciación. En más realizaciones que comprenden transposomas en bucle, un enlazador comprende al menos un primer sitio de cebador y un segundo sitio de cebador. La orientación de los sitios de cebador en dichas realizaciones puede ser de manera que un cebador que hibrida con el primer sitio de cebador y un cebador que hibrida con el segundo sitio de cebador estén en la misma orientación o en diferentes orientaciones.
En algunas realizaciones, un enlazador puede incluir un primer sitio de cebador, un segundo sitio de cebador que tiene un sitio no amplificable dispuesto entre ellos. El sitio no amplificable es útil para bloquear la extensión de una cadena polinucleotídica entre el primer y el segundo sitios de cebador, en donde la cadena polinucleotídica se hibrida con uno de los sitios de cebador. El sitio no amplificable también puede ser útil para prevenir concatámeros. Ejemplos de sitios no amplificables incluyen un análogo de nucleótido, resto químico no nucleotídico, aminoácido, péptido y polipéptido. En algunas realizaciones, un sitio no amplificable comprende un análogo de nucleótido que no forma pares de bases significativamente con A, C, G o T. Algunas realizaciones incluyen un enlazador que comprende un primer sitio de cebador, un segundo sitio de cebador que tiene un sitio de fragmentación dispuesto entre ellos. Otras realizaciones pueden utilizar un diseño de adaptador en horquilla o en forma de Y útil para secuenciación direccional, como se describe en la patente de Estados Unidos n.° 7.741.463.
Etiquetas de afinidad
En algunas realizaciones, una secuencia de transposón o transposasa puede incluir una etiqueta de afinidad. En algunas realizaciones que comprenden transposomas en bucle, un enlazador puede comprender una etiqueta de afinidad. Las etiquetas de afinidad pueden ser útiles para una variedad de aplicaciones, por ejemplo, la separación masiva de ácidos nucleicos diana hibridados con etiquetas de hibridación. La aplicación adicional incluye, pero sin limitación, utilizar etiquetas de afinidad para purificar complejos transposasa/transposón y ADN diana insertado en el transposón, por ejemplo. Como se usa en el presente documento, la expresión "etiqueta de afinidad" y equivalentes gramaticales pueden referirse a un componente de un complejo multicomponente, en donde los componentes del complejo multicomponente interactúan o se unen específicamente entre sí. Por ejemplo, una etiqueta de afinidad puede incluir biotina o poli-His que puede unirse a estreptavidina o níquel, respectivamente. Se enumeran otros ejemplos de complejos de etiquetas de afinidad de componentes múltiples, por ejemplo, en la publicación de solicitud de patente de Estados Unidos n.° 2012/0208705, la publicación de solicitud de patente de Estados Unidos n.° 2012/0208724 y la publicación de solicitud de patente internacional n.° WO 2012/061832.
Restos indicadores
En algunas realizaciones de las composiciones y métodos descritos en el presente documento, una secuencia de transposón o transposasa puede incluir un resto indicador. En algunas realizaciones que comprenden transposomas en bucle, un enlazador puede comprender un resto indicador. Como se usa en el presente documento, la expresión "resto indicador" y sus equivalentes gramaticales pueden referirse a cualquier etiqueta, marcador o grupo identificable. El experto en la materia apreciará que se pueden usar muchas especies diferentes de restos indicadores con los métodos y composiciones descritos en el presente documento, ya sea individualmente o en combinación con uno o más restos indicadores diferentes. En determinadas realizaciones, un resto indicador puede emitir una señal. Ejemplos de una señal incluyen, pero sin limitación, una actividad fluorescente, quimioluminiscente, bioluminiscente, fosforescente, radiactiva, calorimétrica, iónica, señales electrónicas o electroquimioluminiscentes. Se enumeran ejemplos de restos indicadores, por ejemplo, en la publicación de solicitud de patente de Estados Unidos n.° 2012/0208705, la publicación de solicitud de patente de Estados Unidos n.° 2012/0208724 y la publicación de solicitud de patente internacional n.° WO 2012/061832.
Determinados métodos para preparar secuencias de transposón
Las secuencias de transposón proporcionadas en el presente documento se pueden preparar mediante una variedad de métodos. Métodos ilustrativos incluyen síntesis directa, métodos de extensión en horquilla y PCR. En algunas realizaciones, las secuencias de transposón se pueden preparar mediante síntesis directa. Por ejemplo, se puede preparar una secuencia de transposón que comprende un ácido nucleico mediante métodos que comprenden síntesis química. Dichos métodos son bien conocidos en la técnica, por ejemplo, síntesis en fase sólida utilizando precursores de fosforamidita, tal como los derivados de 2'-desoxinucleósidos protegidos, ribonucleósidos o análogos de nucleósidos. Se pueden encontrar ejemplos de métodos para preparar la secuenciación de transposones en, por ejemplo, en la publicación de solicitud de patente de Estados Unidos n.° 2012/0208705, la publicación de solicitud de patente de Estados Unidos n.° 2012/0208724 y la publicación de solicitud de patente internacional n.° WO 2012/061832.
En algunas realizaciones que comprenden transposomas en bucle, se pueden preparar secuencias de transposón que comprenden un enlazador monocatenario. En algunas realizaciones, el enlazador acopla las secuencias de transposón de un transposoma de manera que una secuencia de transposón que comprende una primera secuencia de reconocimiento de transposasas se acopla a una segunda secuencia de transposón que comprende una segunda secuencia de reconocimiento de transposasas en una orientación de 5' a 3'. En algunas realizaciones, el enlazador acopla una secuencia de transposón que comprende una primera secuencia de reconocimiento de transposasas a una segunda secuencia de transposón que comprende una segunda secuencia de reconocimiento de transposasas en una orientación de 5' a 5' o en una orientación de 3' a 3'. El acoplamiento de secuencias de transposón de un transposoma en una orientación de 5' a 5' o en una orientación de 3' a 3' puede ser ventajoso para evitar que los elementos de reconocimiento de transposasas, en particular elementos de mosaico (ME o M), interactúen entre sí. Por ejemplo, las secuencias de transposón acopladas se pueden preparar preparando secuencias de transposón que comprenden un grupo aldehído o un grupo oxiamina. Los grupos aldehído y oxiamina pueden interactuar para formar un enlace covalente acoplando, de este modo, las secuencias de transposón.
En algunas realizaciones, se pueden preparar transposomas que comprenden secuencias complementarias. La figura 2 ilustra una realización en la que se carga una transposasa con secuencias de transposón que comprenden colas complementarias. Las colas se hibridan para formar una secuencia de transposón enlazada. La hibridación se puede producir en condiciones diluidas para disminuir la probabilidad de hibridación entre transposomas.
Ácidos nucleicos diana
Un ácido nucleico diana puede incluir cualquier ácido nucleico de interés. Los ácidos nucleicos diana pueden incluir ADN, ARN, ácido nucleico peptídico, ácido nucleico morfolino, ácido nucleico bloqueado, ácido nucleico glicólico, ácido nucleico treósico, muestras mixtas de ácidos nucleicos, ADN de poliploidía (es decir, ADN vegetal), mezclas de los mismos e híbridos de los mismos. En una realización preferida, el ADN genómico o copias amplificadas del mismo se utilizan como ácido nucleico diana. En otra realización preferida, se utiliza ADNc, ADN mitocondrial o ADN de cloroplasto.
Un ácido nucleico diana puede comprender cualquier secuencia de nucleótidos. En algunas realizaciones, el ácido nucleico diana comprende secuencias de homopolímeros. Un ácido nucleico diana también puede incluir secuencias repetidas. Las secuencias repetidas pueden tener cualquier variedad de longitudes que incluyen, por ejemplo, 2, 5, 10, 20, 30, 40, 50, 100, 250, 500 o 1000 nucleótidos o más. Las secuencias repetidas se pueden repetir, de forma contigua o no contigua, cualquiera de una variedad de veces, incluyendo, por ejemplo, 2, 3, 4, 5, 6, 7, 8, 9, 10, 15 o 20 veces o más.
Algunas realizaciones descritas en el presente documento pueden utilizar un solo ácido nucleico diana. Otras realizaciones pueden utilizar una pluralidad de ácidos nucleicos diana. En dichas realizaciones, una pluralidad de ácidos nucleicos diana puede incluir una pluralidad de los mismos ácidos nucleicos diana, una pluralidad de ácidos nucleicos diana diferentes donde algunos ácidos nucleicos diana son iguales, o una pluralidad de ácidos nucleicos diana donde todos los ácidos nucleicos diana son diferentes. Las realizaciones que utilizan una pluralidad de ácidos nucleicos diana se pueden llevar a cabo en formatos multiplexado de modo que los reactivos se suministren simultáneamente a los ácidos nucleicos diana, por ejemplo, en una o más cámaras o en una superficie de matriz. En algunas realizaciones, la pluralidad de ácidos nucleicos diana puede incluir sustancialmente todo el genoma de un organismo particular. La pluralidad de ácidos nucleicos diana puede incluir al menos una porción del genoma de un organismo en particular incluyendo, por ejemplo, al menos aproximadamente el 1 %, 5 %, 10 %, 25 %, 50 %, 75 %, 80 %, 85 %, 90 %, 95 % o 99 % del genoma. En realizaciones particulares, la porción puede tener un límite superior que sea como máximo aproximadamente el 1 %, 5 %, 10 %, 25 %, 50 %, 75 %, 80 %, 85 %, 90 %, 95 % o 99 % del genoma
Los ácidos nucleicos diana se pueden obtener de cualquier fuente. Por ejemplo, los ácidos nucleicos diana se pueden preparar a partir de moléculas de ácido nucleico obtenidas de un solo organismo o de poblaciones de moléculas de ácido nucleico obtenidas de fuentes naturales que incluyen uno o más organismos. Las fuentes de moléculas de ácido nucleico incluyen, pero sin limitación, orgánulos, células, tejidos, órganos u organismos. Las células que pueden usarse como fuentes de moléculas de ácido nucleico diana pueden ser procariotas (células bacterianas, por ejemplo, géneros Escherichia, Bacillus, Serratia, Salmonella, Staphylococcus, Streptococcus, Clostridium, Chlamydia, Neisseria, Treponema, Mycoplasma, Borrelia, Legionella, Pseudomonas, Mycobacterium, Helicobacter, Erwinia, Agrobacterium, Rhizobium y Streptomyces); archeaon, tal como crenarchaeota, nanoarchaeota o euryarchaeotia; o eucariotas tales como hongos, (por ejemplo, levaduras), plantas, protozoos y otros parásitos y animales (incluidos insectos (por ejemplo, Drosophila spp.), nematodos (p. ej., Caenorhabditis elegans), y mamíferos (por ejemplo, rata, ratón, mono, primate no humano y seres humanos). Los ácidos nucleicos diana y los ácidos nucleicos plantilla pueden enriquecerse respecto de determinadas secuencias de interés usando varios métodos bien conocidos en la técnica. Se proporcionan ejemplos de tales métodos en la publicación internacional n.° WO/2012/108864. En algunas realizaciones, los ácidos nucleicos pueden enriquecerse adicionalmente durante los métodos de preparación de bibliotecas de plantillas. Por ejemplo, los ácidos nucleicos pueden enriquecerse respecto de determinadas secuencias, antes de la inserción de transposomas después de la inserción de transposomas y/o después de la amplificación de ácidos nucleicos.
Asimismo, en algunas realizaciones, los ácidos nucleicos diana y/o los ácidos nucleicos plantilla pueden estar altamente purificados, por ejemplo, los ácidos nucleicos pueden estar al menos aproximadamente un 70 %, 80 %, 90%, 95%, 96%, 97%, 98%, 99% o 100% libres de contaminantes antes de su uso con los métodos proporcionados en el presente documento. En algunas realizaciones, es beneficioso utilizar métodos conocidos en la técnica que mantienen la calidad y el tamaño del ácido nucleico diana, por ejemplo, el aislamiento y/o la transposición directa del ADN diana se puede realizar usando lechos de agarosa. La transposición también se puede realizar directamente en las células, con población de células, lisados y ADN no purificado.
Determinados métodos para preparar ácidos nucleicos plantilla
Algunas realizaciones incluyen métodos para preparar ácidos nucleicos plantilla. Como se usa en el presente documento, "ácido nucleico plantilla" puede referirse a un sustrato para obtener información de secuencia. En algunas realizaciones, un ácido nucleico plantilla puede incluir un ácido nucleico diana, un fragmento del mismo, o cualquier copia del mismo que comprenda al menos una secuencia de transposón, un fragmento del mismo, o cualquier copia del mismo. En algunas realizaciones, un ácido nucleico plantilla puede incluir un ácido nucleico diana que comprende un adaptador de secuenciación, tal como un sitio de cebador de secuenciación.
Algunos métodos de preparación de ácidos nucleicos plantilla incluyen insertar una secuencia de transposón en un ácido nucleico diana, preparando, de este modo, un ácido nucleico plantilla. Algunos métodos de inserción incluyen poner en contacto una secuencia de transposón proporcionada en el presente documento con un ácido nucleico diana en presencia de una enzima, tal como una transposasa o integrasa, en condiciones suficientes para la integración de la secuencia o secuencias de transposón en el ácido nucleico diana.
En algunas realizaciones, la inserción de secuencias de transposón en un ácido nucleico diana puede ser no aleatoria. En algunas realizaciones, las secuencias de transposón pueden ponerse en contacto con ácidos nucleicos diana que comprenden proteínas que inhiben la integración en determinados sitios. Por ejemplo, se puede inhibir la integración de las secuencias de transposón en ADN genómico que comprende proteínas, ADN genómico que comprende cromatina, ADN genómico que comprende nucleosomas o ADN genómico que comprende histonas. En algunas realizaciones, las secuencias de transposón se pueden asociar con etiquetas de afinidad para integrar la secuencia de transposón en una secuencia particular en un ácido nucleico diana. Por ejemplo, una secuencia de transposón puede estar asociada con una proteína que se dirige a secuencias de ácido nucleico específicas, por ejemplo, histonas, proteínas de unión a cromatina, factores de transcripción, factores de iniciación, etc., y anticuerpos o fragmentos de anticuerpos que se unen a proteínas de unión a ácidos nucleicos específicas de secuencia particulares. En una realización ilustrativa, una secuencia de transposón está asociada con una etiqueta de afinidad, tal como biotina; la etiqueta de afinidad puede estar asociada con una proteína de unión a ácido nucleico.
Se entenderá que durante la integración de algunas secuencias de transposón en un ácido nucleico diana, varios nucleótidos consecutivos del ácido nucleico diana en el sitio de integración se duplican en el producto integrado. Por tanto, el producto integrado puede incluir una secuencia duplicada en cada extremo de la secuencia integrada en el ácido nucleico diana. Como se usa en el presente documento, la expresión "etiqueta hospedadora" o "etiqueta g" puede referirse a una secuencia de ácido nucleico diana que está duplicada en cada extremo de una secuencia de transposón integrada. Las porciones monocatenarias de ácidos nucleicos que pueden generarse mediante la inserción de secuencias de transposón pueden repararse mediante una variedad de métodos bien conocidos en la técnica, por ejemplo, usando ligasas, oligonucleótidos y/o polimerasas.
En algunas realizaciones, una pluralidad de las secuencias de transposón proporcionadas en el presente documento se inserta en un ácido nucleico diana. Algunas realizaciones incluyen la selección de condiciones suficientes para lograr la integración de una pluralidad de secuencias de transposón en un ácido nucleico diana de manera que la distancia media entre cada secuencia de transposón integrada comprenda un determinado número de nucleótidos consecutivos en el ácido nucleico diana.
Algunas realizaciones incluyen la selección de condiciones suficientes para lograr la inserción de una secuencia o secuencias de transposón en un ácido nucleico diana, pero no en otra secuencia o secuencias de transposón. Se puede usar una variedad de métodos para reducir la probabilidad de que una secuencia de transposón se inserte en otra secuencia de transposón. Ejemplos de dichos métodos útiles con las realizaciones proporcionadas en el presente documento se pueden encontrar, por ejemplo, en la publicación de solicitud de patente de Estados Unidos n.° 2012/0208705, la publicación de solicitud de patente de Estados Unidos n.° 2012/0208724 y la publicación de solicitud de patente internacional n.° WO 2012/061832.
En algunas realizaciones, las condiciones pueden seleccionarse de modo que la distancia media en un ácido nucleico diana entre secuencias de transposón integradas sea al menos aproximadamente 5, 10, 20, 30, 40, 50, 60, 70, 80, 90, 100 o más nucleótidos consecutivos. En algunas realizaciones, la distancia media en un ácido nucleico diana entre secuencias de transposón integradas es de al menos aproximadamente 100, 200, 300, 400, 500, 600, 700, 800, 900, 1000 o más nucleótidos consecutivos. En algunas realizaciones, la distancia media en un ácido nucleico diana entre secuencias de transposón integradas es de al menos aproximadamente 1 kb, 2 kb, 3 kb, 4 kb, 5 kb, 6 kb, 7 kb, 8 kb, 90 kb, 100 kb o más nucleótidos consecutivos. En algunas realizaciones, la distancia media en un ácido nucleico diana entre secuencias de transposón integradas es de al menos aproximadamente 100 kb, 200 kb, 300 kb, 400 kb, 500 kb, 600 kb, 700 kb, 800 kb, 900 kb, 1000 kb o más nucleótidos consecutivos. Como se entenderá, algunas condiciones que pueden seleccionarse incluyen poner en contacto un ácido nucleico diana con un determinado número de secuencias de transposón.
Algunas realizaciones de los métodos descritos en el presente documento incluyen la selección de condiciones suficientes para lograr al menos una porción de secuencias de transposón integradas en un ácido nucleico diana que son diferentes. En realizaciones preferidas de los métodos y composiciones descritos en el presente documento, cada secuencia de transposón integrada en un ácido nucleico diana es diferente. Algunas condiciones que pueden seleccionarse para lograr una determinada porción de secuencias de transposón integradas en secuencias diana que son diferentes incluyen seleccionar el grado de diversidad de la población de secuencias de transposón. Como se entenderá, la diversidad de secuencias de transposón surge en parte debido a la diversidad de los códigos de barras de dichas secuencias de transposón. Por consiguiente, algunas realizaciones incluyen proporcionar una población de secuencias de transposón en las que al menos una parte de los códigos de barras son diferentes. En algunas realizaciones, al menos aproximadamente el 10 %, 20 %, 30 %, 40 %, 50 %, 60 %, 70 %, 80 %, 90 %, 95 %, 98 %, 99 % o el 100 % de los códigos de barras en una población de secuencias de transposón son diferentes. En algunas realizaciones, al menos una parte de las secuencias de transposón integradas en un ácido nucleico diana son iguales.
Algunas realizaciones de preparación de un ácido nucleico plantilla pueden incluir copiar las secuencias que comprenden el ácido nucleico diana. Por ejemplo, algunas realizaciones incluyen hibridar un cebador con un sitio de cebador de una secuencia de transposón integrada en el ácido nucleico diana. En algunas realizaciones de este tipo, el cebador se puede hibridar con el sitio de cebador y ampliarse. Las secuencias copiadas pueden incluir al menos una secuencia de código de barras y al menos una porción del ácido nucleico diana. En algunas realizaciones, las secuencias copiadas pueden incluir una primera secuencia de código de barras, una segunda secuencia de código de barras y al menos una porción de un ácido nucleico diana dispuesto entre ellas. En algunas realizaciones, al menos un ácido nucleico copiado puede incluir al menos una primera secuencia de código de barras de un primer ácido nucleico copiado que puede identificarse o designarse para emparejarse con una segunda secuencia de código de barras de un segundo ácido nucleico copiado. En algunas realizaciones, el cebador puede incluir un cebador de secuenciación. En algunas realizaciones, los datos de secuenciación se obtienen usando el cebador de secuenciación. En más realizaciones, los adaptadores que comprenden sitios de cebador pueden unirse a cada extremo de un ácido nucleico y amplificarse el ácido nucleico a partir de dichos sitios de cebador.
Algunas realizaciones para preparar un ácido nucleico plantilla pueden incluir secuencias de amplificación que comprenden al menos una porción de una o más secuencias de transposón y al menos una porción de un ácido nucleico diana. En algunas realizaciones, se puede amplificar al menos una porción de un ácido nucleico diana usando cebadores que hibridan con sitios de cebador de secuencias de transposón integradas en un ácido nucleico diana. En algunas realizaciones de este tipo, un ácido nucleico amplificado puede incluir una primera secuencia de código de barras y una segunda secuencia de código de barras que tengan al menos una porción del ácido nucleico diana dispuesta entre ellas. En algunas realizaciones, al menos un ácido nucleico amplificado puede incluir al menos una primera secuencia de código de barras de un primer ácido nucleico amplificado que puede identificarse para emparejarse con una segunda secuencia de código de barras de una segunda secuencia amplificada.
Algunos métodos de preparación de ácidos nucleicos plantilla incluyen la inserción de secuencias de transposón que comprenden enlazadores monocatenarios. La figura 3 ilustra un ejemplo en el que las secuencias de transposón (ME-P1-enlazador-P2-ME; extremo de mosaico-sitio de cebador 1-enlazador-sitio de cebador 2-extremo de mosaico) se insertan en un ácido nucleico diana. El ácido nucleico diana que tiene las secuencias de transposón/enlazador insertadas puede ampliarse y amplificarse.
En una realización de las composiciones y métodos descritos en el presente documento, se utilizan transposomas que tienen secuencias terminales transponibles simétricas para producir un fragmento de ácido nucleico diana etiquetado en el extremo (fragmento etiquetado o etiqueta). Por tanto, cada fragmento etiquetado contiene extremos idénticos, que carecen de direccionalidad. Después se puede emplear una PCR de un solo cebador, que utiliza las secuencias terminales del transposón, para amplificar el número de copias de la plantilla de 2n a 2n*2x dónde x corresponde al número de ciclos de PCR. En una etapa posterior, la PCR con cebadores puede añadir secuencias adicionales, tal como secuencias de secuenciación adaptadoras.
En algunas realizaciones, puede ser ventajoso que cada ácido nucleico plantilla incorpore al menos un sitio de cebador universal. Por ejemplo, un ácido nucleico plantilla puede incluir unas primeras secuencias terminales que comprenden un primer sitio de cebador universal y unas segundas secuencias terminales que comprenden un segundo sitio de cebador universal. Los sitios de cebador universales pueden tener varias aplicaciones, tal como el uso en la amplificación, secuenciación y/o identificación de uno o más ácidos nucleicos plantilla. El primer y segundo sitio de cebador universales pueden ser iguales, sustancialmente similares, similares o diferentes. Los sitios de cebador universales pueden introducirse en ácidos nucleicos mediante diversos métodos bien conocidos en la técnica, por ejemplo, unión de sitios de cebador a ácidos nucleicos, amplificación de ácidos nucleicos usando cebadores con cola e inserción de una secuencia de transposón que comprende un sitio de cebador universal.
Inserción dirigida
En algunas realizaciones de los métodos y composiciones proporcionados en el presente documento, las secuencias de transposón pueden insertarse en secuencias diana particulares de un ácido nucleico diana. La transposición en ADNbc puede ser más eficaz que en dianas de ADNmc. En algunas realizaciones, el ADNbc se desnaturaliza en ADNmc y se hibrida con sondas oligonucleotídicas (20-200 bases). Estas sondas crean sitios de ADNbc que pueden usarse de manera eficaz como sitios de integración con los transposomas proporcionados en el presente documento. En algunas realizaciones, el ADNbc se puede dirigir usando la formación de bucle D con oligosondas recubiertas con recA y la posterior formación de triple hélice. En algunas realizaciones de este tipo, la estructura de horquilla de replicación es el sustrato preferido para los transposomas que comprenden la transposasa Tn4430. En más realizaciones, las regiones de interés en el ADNbc pueden dirigirse utilizando proteínas de unión a ADN específicas de secuencia, tales como complejos de dedos de zinc, y otros ligandos de afinidad por regiones específicas de ADN. En algunas realizaciones, pueden utilizarse transposomas que comprenden una transposasa que tiene un sustrato preferido de posiciones no coincidentes en un ácido nucleico diana para dirigir la inserción en el ácido nucleico diana. Por ejemplo, algunas transposasas MuA, tal como HYPERMU (Epicenter), tienen preferencia por dianas no coincidentes. En algunas realizaciones de este tipo, las sondas oligonucleotídicas que comprenden una falta de coincidencia se hibridan con un ácido nucleico diana monocatenario. Pueden utilizarse transposomas que comprenden transposasas MuA, tal como HYPERMU, para dirigirse a las secuencias no coincidentes del ácido nucleico diana. Fragmentación de ácidos nucleicos plantilla
Algunas realizaciones para preparar un ácido nucleico plantilla pueden incluir la fragmentación de un ácido nucleico diana. En algunas realizaciones, la inserción de transposomas que comprenden secuencias de transposón no contiguas puede dar como resultado la fragmentación de un ácido nucleico diana. En algunas realizaciones que comprenden transposomas en bucle, un ácido nucleico diana que comprende secuencias de transposón puede fragmentarse en los sitios de fragmentación de las secuencias de transposón. Otros ejemplos de métodos útiles para fragmentar ácidos nucleicos diana útiles con las realizaciones proporcionadas en el presente documento se pueden encontrar, por ejemplo, en la publicación de solicitud de patente de Estados Unidos n.° 2012/0208705, la publicación de solicitud de patente de Estados Unidos n.° 2012/0208724 y la publicación de solicitud de patente internacional n.° WO 2012/061832.
Etiquetado de moléculas únicas
La presente divulgación proporciona métodos para etiquetar moléculas de modo que se puedan rastrear e identificar moléculas individuales. Los datos en bruto se pueden deconvolucionar y volverse a convertir en la molécula individual. La capacidad para distinguir moléculas individuales y relacionar la información con la molécula de origen es especialmente importante cuando los procesos desde la molécula original hasta el producto final cambian la representación (estequiométrica) de la población original. Por ejemplo, la amplificación da lugar a la duplicación (p. ej., duplicados por PCR o amplificación sesgada) que puede desviar la representación original. Esto puede alterar la identificación del estado de metilación, el número de copias, la relación alélica debido a amplificación no uniforme y/o el sesgo de amplificación. Al identificar moléculas individuales, el etiquetado con código distingue entre moléculas idénticas después del procesamiento. Como tal, las duplicaciones y el sesgo de amplificación se pueden filtrar, permitiendo la determinación precisa de la representación original de una molécula o población de moléculas.
Una ventaja de etiquetar de forma exclusiva moléculas únicas es que las moléculas idénticas en el conjunto original se identifican de forma exclusiva en virtud de su etiquetado. En análisis posteriores adicionales, se pueden distinguir ahora estas moléculas etiquetadas de forma exclusiva. Esta técnica se puede aprovechar en esquemas de ensayo en los que se emplea amplificación. Por ejemplo, se sabe que la amplificación distorsiona la representación original de una población mixta de moléculas. Si no se empleó el etiquetado exclusivo, la representación original (tal como el número de copias o la proporción alélica) debería tener en cuenta los sesgos (conocidos o desconocidos) de cada molécula en la representación. Con etiquetado exclusivo, la representación se puede determinar con precisión eliminando duplicados y realizando el recuento de la representación original de moléculas, cada una con una etiqueta exclusiva. Por lo tanto, los ADNc se pueden amplificar y secuenciar, sin temor a sesgos porque los datos se pueden filtrar de modo que solamente se seleccionen las secuencias auténticas o las secuencias de interés para un análisis posterior. Se pueden construir lecturas precisas tomando el consenso en muchas lecturas con el mismo código de barras.
En algunas realizaciones de las composiciones y métodos descritos en el presente documento, se prefiere etiquetar la población original en las primeras etapas del ensayo, aunque el etiquetado se puede producir en etapas posteriores si las etapas anteriores no introducen sesgos o no son importantes. En cualquiera de estas aplicaciones, la complejidad de las secuencias de códigos de barras debe ser mayor que el número de moléculas individuales que se van a etiquetar. Esto asegura que las diferentes moléculas diana reciban etiquetas diferentes y exclusivas. Como tal, es deseable un grupo de oligonucleótidos aleatorios de determinada longitud (p. ej., 5, 10, 20, 30, 40, 50, 100 o 200 nucleótidos de longitud). Un grupo aleatorio de etiquetas representa una gran complejidad de etiquetas con espacio de código. 4n donde n es el número de nucleótidos. Se pueden incorporar códigos adicionales (ya sean diseñados o aleatorios) en diferentes etapas para que sirvan como una verificación adicional, tal como una verificación de paridad para la corrección de errores.
En una realización de las composiciones y métodos descritos en el presente documento, las moléculas individuales (tal como el ADN diana) están fijadas a etiquetas exclusivas, tal como secuencias de oligo y/o códigos de barras exclusivas. La fijación de las etiquetas se puede producir mediante unión, química de acoplamiento, adsorción, inserción de secuencias de transposón, etc. Otros medios incluyen amplificación (tal como mediante PCR, RCA o LCR), copia (tal como la adición mediante una polimerasa) e interacciones no covalentes.
Los métodos específicos comprenden la inclusión de códigos de barras (p. ej., secuencias diseñadas o aleatorias) a cebadores de PCR para que cada plantilla reciba un código individual dentro del espacio de código, produciendo, de este modo, amplicones exclusivos que pueden diferenciarse de otros amplicones. Este concepto se puede aplicar a cualquier método que utilice amplificación con polimerasa, tal como los ensayos GoldenGate como se divulga en las patentes de Estados Unidos n.° 7.582.420, n.° 7.955.794 y n.° 8.003.354. Las secuencias diana etiquetadas con código se pueden circularizar y amplificar mediante métodos tales como la amplificación de círculo rodante para producir amplicones etiquetados con código. De manera similar, el código también se puede añadir a ARN Métodos para analizar ácidos nucleicos plantilla
Algunas realizaciones de la tecnología descrita en el presente documento incluyen métodos para analizar ácidos nucleicos plantilla. En dichas realizaciones, la información de secuenciación puede obtenerse a partir de ácidos nucleicos plantilla y esta información puede usarse para generar una representación de secuencia de uno o más ácidos nucleicos diana.
En algunas realizaciones de los métodos de secuenciación descritos en el presente documento, se puede utilizar una estrategia de lecturas enlazadas. Una estrategia de lecturas enlazadas puede incluir la identificación de datos de secuenciación que enlazan al menos dos lecturas de secuenciación. Por ejemplo, una primera lectura de secuenciación puede contener un primer marcador, y una segunda lectura de secuenciación puede contener un segundo marcador. Los primeros y segundos marcadores pueden identificar que los datos de secuenciación de cada lectura de secuenciación son adyacentes en una representación de secuencia del ácido nucleico diana. En algunas realizaciones de las composiciones y métodos descritos en el presente documento, los marcadores pueden comprender una primera secuencia de código de barras y una segunda secuencia de código de barras en los que la primera secuencia de código de barras se puede emparejar con la segunda secuencia de código de barras. En otras realizaciones, los marcadores pueden comprender una primera etiqueta hospedadora y una segunda etiqueta hospedadora. En más realizaciones, los marcadores pueden comprender una primera secuencia de código de barras con una primera etiqueta hospedadora y una segunda secuencia de código de barras con una segunda etiqueta hospedadora.
Una realización ilustrativa de un método de secuenciación de un ácido nucleico plantilla puede comprender las siguientes etapas: (a) secuenciar la primera secuencia de código de barras usando un cebador de secuenciación que hibrida con el primer sitio de cebador; y (b) secuenciar la segunda secuencia de código de barras usando un cebador de secuenciación que hibrida con el segundo cebador. El resultado son dos lecturas de secuencia que ayudan a enlazar el ácido nucleico plantilla con sus vecinos genómicos. Dadas lecturas lo suficientemente largas y fragmentos de biblioteca lo suficientemente cortos, estas dos lecturas se pueden mezclar de forma informática para hacer una lectura larga que cubra todo el fragmento. Usando las lecturas de secuencia de código de barras y la secuencia duplicada de 9 nucleótidos presente en la inserción, las lecturas ahora se pueden enlazar a sus vecinos genómicos para formar "lecturas enlazadas " mucho más largas in silico.
Como se entenderá, una biblioteca que comprende ácidos nucleicos plantilla puede incluir fragmentos de ácidos nucleicos duplicados. La secuenciación de fragmentos de ácidos nucleicos duplicados es ventajosa en métodos que incluyen la creación de una secuencia consenso para fragmentos duplicados. Dichos métodos pueden aumentar la precisión para proporcionar una secuencia consenso para un ácido nucleico plantilla y/o una biblioteca de ácidos nucleicos plantilla.
En algunas realizaciones de la tecnología de secuenciación descrita en el presente documento, el análisis de secuencia se realiza en tiempo real. Por ejemplo, la secuenciación en tiempo real se puede realizar adquiriendo y analizando simultáneamente los datos de secuenciación. En algunas realizaciones, un proceso de secuenciación para obtener datos de secuenciación se puede finalizar en varios puntos, incluso después de que se obtenga al menos una parte de los datos de secuencia de un ácido nucleico diana o antes de que se secuencie la lectura completa del ácido nucleico. Se proporcionan métodos, sistemas y realizaciones ilustrativos adicionales en la publicación de patente internacional n°. WO 2010/062913.
En una realización ilustrativa de un método para ensamblar lecturas de secuencia cortas usando una estrategia de lecturas enlazadas, las secuencias de transposón que comprenden códigos de barras se insertan en el ADN genómico, se prepara una biblioteca y se obtienen datos de secuenciación para la biblioteca de ácidos nucleicos plantilla. Los bloques de plantillas se pueden ensamblar identificando códigos de barras emparejados y después se ensamblan cóntigos más grandes. En una realización, las lecturas ensambladas se pueden ensamblar adicionalmente en cóntigos más grandes a través del emparejamiento de códigos utilizando lecturas solapantes.
Algunas realizaciones de la tecnología de secuenciación descrita en el presente documento incluyen funciones de detección y corrección de errores. Ejemplos de errores pueden incluir errores en las identificaciones de base durante un proceso de secuenciación y errores al ensamblar fragmentos en cóntigos más grandes. Como se puede entender, la detección de errores puede incluir la detección de la presencia o probabilidad de errores en un conjunto de datos y, como tal, es posible que no sea necesario detectar la ubicación de un error o el número de errores. Para la corrección de errores, es útil la información sobre la ubicación de un error y/o el número de errores en un conjunto de datos. Los métodos para la corrección de errores son bien conocidos en la técnica. Los ejemplos incluyen el uso de distancias de hamming y el uso de un algoritmo de checksum (véase, p.ej, la publicación de solicitud de patente de Estados Unidos n.° 2010/0323348; la patente de Estados Unidos n.° 7.574.305; y la patente de Estados Unidos n.° 6.654.696. Bibliotecas anidadas
Un método alternativo implica los métodos de etiquetado de uniones anteriores y la preparación de bibliotecas de secuenciación anidadas. Las subbibliotecas anidadas se crean a partir de fragmentos de a Dn etiquetados con código. Esto puede permitir un etiquetado de transposones menos frecuente a lo largo del genoma. También puede crear una mayor diversidad de lecturas de secuenciación (anidadas). Estos factores pueden dar lugar a una mejor cobertura y precisión.
El submuestreo y la amplificación del genoma completo pueden crear muchas copias de una determinada población de moléculas de partida. Después, los fragmentos de ADN se generan mediante fragmentación específica de transposones, donde cada fragmento recibe un código que le permite enlazar el fragmento de nuevo al vecino original que tiene un código coincidente (ya sea idéntico, complementario o de otro modo enlazado de manera informática). Los fragmentos marcados se fragmentan al menos una segunda vez mediante métodos aleatorios o métodos específicos de secuencia, tal como digestión enzimática, cizalladura aleatoria, cizalladura basada en transposones u otros métodos, creando, de este modo, subbibliotecas de los fragmentos de ADN etiquetados con código. En una variación útil del método descrito anteriormente, los fragmentos etiquetados con código se pueden aislar preferentemente mediante el uso de transposones que contienen una biotina u otra funcionalidad de afinidad para fines de enriquecimiento cadena abajo. La preparación posterior de la biblioteca convierte los fragmentos de ADN anidados en plantillas de secuenciación. La secuenciación de extremos emparejados da como resultado la determinación de la secuencia de la etiqueta de código de los fragmentos de ADN y del ADN diana. Debido a que se crean bibliotecas anidadas para la misma etiqueta de código, los fragmentos de ADN largos se pueden secuenciar con lecturas cortas.
Métodos de secuenciación
Los métodos y la composición descritos en el presente documento se pueden usar junto con una variedad de técnicas de secuenciación. En algunas realizaciones, el proceso para determinar la secuencia de nucleótidos de un ácido nucleico diana puede ser un proceso automatizado.
Algunas realizaciones de los métodos de secuenciación descritos en el presente documento incluyen secuenciación mediante tecnologías de síntesis (SBS, por sus siglas en inglés), por ejemplo, técnicas de pirosecuenciación. La pirosecuenciación detecta la liberación de pirofosfato inorgánico (PP,) a medida que se incorporan nucleótidos particulares en la cadena naciente (Ronaghi et al., Analytical Biochemistry 242(1): 84-9 (1996); Ronaghi, M. Genome Res. 11(1):3-11 (2001); Ronaghi et al., Science 281(5375):363 (1998); patente de Estados Unidos n.° 6.210.891; patente de Estados Unidos n.° 6.258.568 y patente de Estados Unidos n.° 6.274.320).
En otro tipo de ejemplo de SBS, la secuenciación cíclica se lleva a cabo mediante la adición escalonada de nucleótidos con terminador reversible que contienen, por ejemplo, una marcador de colorante escindible o fotoblanqueable como se describe, por ejemplo, en la patente de Estados Unidos n.° 7.427.67, en la patente de Estados Unidos n.° 7.414.1163 y en la patente de Estados Unidos n.° 7.057.026. Este enfoque, que se está comercializando por Illumina Inc., también se describe en las publicaciones de solicitud de patente internacional n.° WO 91/06678 y Wo 07/123744. La disponibilidad de terminadores marcados con fluorescencia, en los que tanto puede invertirse la terminación como escindirse la etiqueta fluorescente, facilita la secuenciación de terminación reversible cíclica (CRT, por sus siglas en inglés) eficaz. Las polimerasas también se pueden,modificar por ingeniería simultáneamente para incorporar y ampliar de manera eficaz a partir de estos nucleótidos modificados.
Sistemas SBS ilustrativos adicionales, y métodos, que se pueden utilizar con los métodos y sistemas descritos en el presente documento se describen en la publicación de solicitud de patente de Estados Unidos n.° 2007/0166705, la publicación de solicitud de patente de Estados Unidos n.° 2006/0188901, la patente de Estados Unidos N.° 7057026, la publicación de solicitud de patente de Estados Unidos n.° 2006/0240439, la publicación de solicitud de patente de Estados Unidos n.° 2006/0281109, la publicación PCT n.° WO 05/065814, la publicación de solicitud de patente de Estados Unidos n.° 2005/0100900, la publicación PCT n.° WO 06/064199 y la patente de Estados Unidos N.°WO 07/010251.
Algunas realizaciones de la tecnología de secuenciación descrita en el presente documento pueden utilizar la secuenciación mediante técnicas de unión. Dichas técnicas utilizan ADN ligasa para incorporar oligonucleótidos e identificar la incorporación de dichos nucleótidos. Los sistemas y métodos de SBS ilustrativos que se pueden utilizar con las composiciones y métodos descritos en el presente documento se describen en la patente de Estados Unidos n.° 6.969.488, en la patente de Estados Unidos n.° 6.172.218 y en la patente de Estados Unidos n.° 6.306.597.
Algunas realizaciones de la tecnología de secuenciación descrita en el presente documento pueden incluir técnicas tales como tecnologías next-next. Un ejemplo puede incluir técnicas de secuenciación con nanoporos (Deamer, D.W. & Akeson, M. ' 'Nanopores and nucleic acids: prospects for ultrarapid sequencing". Trends Biotechnol. 18, 147-151 (2000); Deamer, D. y D. Branton, "Characterization of nucleic acids by nanopore analysis". Acc. Chem. Res. 35:817-825 (2002); Li et al., "DNA molecules and configurations in a solid-state nanopore microscope" Nat. Mater. 2:611-615 (2003). En dichas realizaciones, el ácido nucleico diana pasa a través de un nanoporo. El nanoporo puede ser un poro sintético o una proteína de membrana biológica, tal como a-hemolisina. A medida que el ácido nucleico diana pasa a través del nanoporo, cada par de bases se puede identificar midiendo las fluctuaciones en la conductancia eléctrica del poro. (patente de Estados Unidos N.° 7.001.792; Soni & Meller, "A. Progress toward ultrafast DNA sequencing using solid-state nanopores". Clin. Chem. 53, 1996-2001 (2007); Healy, K. "Nanopore-based single-molecule DNA analysis". Nanomed. 2:459-481 (2007); Cockroft et al., "A single-molecule nanopore device detects DNA polymerase activity with single-nucleotide resolution". J. Am. Chem. Soc. 130:818-820 (2008)). En algunas realizaciones de este tipo, las técnicas de secuenciación con nanoporos pueden ser útiles para confirmar la información de secuencia generada por los métodos descritos en el presente documento.
Algunas realizaciones de la tecnología de secuenciación descrita en el presente documento pueden utilizar métodos que implican la monitorización en tiempo real de la actividad de la ADN polimerasa. Las incorporaciones de nucleótidos se pueden detectar a través de interacciones de transferencia de energía de resonancia (FRET, por sus siglas en inglés) entre una polimerasa que contiene un fluoróforo y nucleótidos marcados con Y-fosfato, como se describe, por ejemplo, en la patente de Estados Unidos n.° 7.329.492 y en la patente de Estados Unidos n.° 7.211.414 o las incorporaciones de nucleótidos se pueden con guías de ondas de modo cero como se describe, por ejemplo, en la patente de Estados Unidos n.° 7.315.019 y usando análogos de nucleótidos fluorescentes y polimerasas modificadas por ingeniería como se describe, por ejemplo, en la patente de Estados Unidos n° 7.405.281 y en la publicación de solicitud de patente de Estados Unidos n° 2008/0108082. La iluminación se puede restringir a un volumen a escala de zeptolitros alrededor de una polimerasa anclada a una superficie de modo que se pueda observar la incorporación de nucleótidos marcados con fluorescencia con un fondo bajo (Levene, M.J. et al. "Zeromode waveguides for singlemolecule analysis at high concentrations". Science 299, 682-686 (2003); Lundquist, P.M. et al. "Parallel confocal detection of single molecules in real time". Opt. Lett. 33, 1026-1028 (2008); Korlach, J. et al. "Selective aluminum passivation for targeted immobilization of single DNA polymerase molecules in zero-mode waveguide nanostructures". Proc. Natl. Acad. Sci. USA 105, 1176-1181 (2008)). En un ejemplo, la tecnología de secuenciación de una sola molécula de ADN en tiempo real (SMRT) proporcionada por Pacific Biosciences Inc. se puede utilizar con los métodos descritos en el presente documento. En algunas realizaciones, se puede utilizar un chip de SMRT o similares (p. ej., patente de Estados Unidos N.° 7.181.122, patente de Estados Unidos n.° 7.302.146 y patente de Estados Unidos n.° 7.313.308). Un chip de SMRT comprende una pluralidad de guías de ondas de modo cero (ZMW, por sus siglas en inglés). Cada ZMW comprende un orificio cilíndrico de decenas de nanómetros de diámetro que perfora una fina película metálica apoyada sobre un sustrato transparente. Cuando la ZMW se ilumina a través del sustrato transparente, la luz atenuada puede penetrar los 20-30 nm inferiores de cada ZMW creando un volumen de detección de aproximadamente 1 x 10-21 L. Los volúmenes de detección más pequeños aumentan la sensibilidad de detección de señales fluorescentes al reducir la cantidad de fondo que se puede observar.
Los chips de SMRT y tecnología similar se pueden usar en asociación con monómeros de nucleótidos marcados con fluorescencia en el fosfato terminal del nucleótido (Korlach J. et al., "Long, processive enzymatic DNA synthesis using 100% dye-labeled terminal phosphate-linked nucleotides"- Nucleosides, Nucleotides and Nucleic Acids, 27:1072-1083, 2008). El marcador se escinde del monómero de nucleótido al incorporar el nucleótido al polinucleótido. Por consiguiente, el marcador no está incorporado en el polinucleótido, aumentando la relación señal:fondo. Además, se reduce la necesidad de condiciones para escindir un marcador de monómeros de nucleótido marcados.
Helicos Biosciences Corp proporciona un ejemplo adicional de una plataforma de secuenciación que puede usarse en asociación con algunas de las realizaciones descritas en el presente documento. En algunas realizaciones, se puede utilizar la secuenciación de una sola molécula verdadera (Harris T.D. et al., "Single Molecule DNA Sequencing of a viral Genome" Science 320:106-109 (2008). En una realización, se puede preparar una biblioteca de ácidos nucleicos diana mediante la adición de una cola de 3' poli(A) a cada ácido nucleico diana. La cola de poli(A) se hibrida con oligonucleótidos poli(T) anclados en un cubreobjetos de vidrio. El oligonucleótido poli(T) se puede usar como cebador para la extensión de un polinucleótido complementario al ácido nucleico diana. En una realización, se suministran monómeros de nucleótidos marcados con fluorescencia, en concreto, A, C, G o T, de uno en uno al ácido nucleico diana en presencia de ADN polimerasa. Se detecta la incorporación de un nucleótido marcado en el polinucleótido complementario al ácido nucleico diana y la posición de la señal fluorescente en el cubreobjetos de vidrio indica la molécula que se ha extendido. El marcador fluorescente se elimina antes de añadir el siguiente nucleótido para continuar el ciclo de secuenciación. El seguimiento de la incorporación de nucleótidos en cada cadena polinucleotídica puede proporcionar información de secuencia para cada ácido nucleico diana individual.
Complete Genomics Inc. proporciona un ejemplo adicional de una plataforma de secuenciación que se puede usar en asociación con los métodos descritos en el presente documento. Se pueden preparar bibliotecas de ácidos nucleicos diana donde las secuencias de ácido nucleico diana se intercalan aproximadamente cada 20 pb con secuencias adaptadoras. Los ácidos nucleicos diana se pueden amplificar usando replicación de círculo rodante y los ácidos nucleicos diana amplificados se pueden usar para preparar una matriz de ácidos nucleicos diana. Los métodos para secuenciar dichas matrices incluyen secuenciación por unión, en particular, secuenciación mediante unión combinatoria de sonda-anclaje (cPAL).
En algunas realizaciones que utilizan cPAL, se pueden determinar aproximadamente 10 bases contiguas adyacentes a un adaptador. Se utiliza un grupo de sondas que incluye cuatro marcadores diferentes para cada base (A, C, T, G) para leer las posiciones adyacentes a cada adaptador. Se utiliza un grupo separado para leer cada posición. Se suministra un conjunto de sondas y un anclaje específico para un adaptador particular al ácido nucleico diana en presencia de ligasa. El anclaje se hibrida con el adaptador y una sonda se hibrida con el ácido nucleico diana adyacente al adaptador. El anclaje y la sonda se unen entre sí. Se detecta la hibridación y se elimina el complejo anclaje-sonda. A continuación, se suministra un anclaje y un conjunto de sondas diferentes al ácido nucleico diana en presencia de ligasa.
Los métodos de secuenciación descritos en el presente documento se pueden llevar a cabo ventajosamente en formatos multiplexados de manera que pueden manipularse de forma simultánea múltiples ácidos nucleicos diana diferentes. En realizaciones particulares, se pueden tratar diferentes ácidos nucleicos diana en un recipiente de reacción común o sobre una superficie de un sustrato particular. Esto permite el suministro conveniente de los reactivos de secuenciación, la eliminación de reactivos sin reaccionar y la detección de eventos de incorporación de una forma multiplexada. En realizaciones que utilizan ácidos nucleicos diana unidos a superficies, los ácidos nucleicos diana pueden estar en un formato de matriz. En un formato de matriz, los ácidos nucleicos diana pueden estar acoplados, de forma habitual, a una superficie en una manera distinguible espacialmente. Por ejemplo, los ácidos nucleicos diana pueden estar unidos mediante fijación covalente directa, fijación a una perla u otra partícula o asociados con una polimerasa u otra molécula que está fijada a la superficie. La matriz puede incluir una sola copia de un ácido nucleico diana en cada sitio (que también se denomina característica) o pueden estar presentes en cada sitio o característica múltiples copias que tengan la misma secuencia. Se pueden producir múltiples copias mediante métodos de amplificación tales como, amplificación por puente o PCR en emulsión como se describe con más detalle en el presente documento.
Los métodos expuestos en el presente documento pueden usar matrices que tienen características en cualquiera de una variedad de densidades que incluyen, por ejemplo, al menos aproximadamente 10 características/cm2, 100 características/cm2, 500 características/cm2, 1.000 características/cm2, 5.000 características/cm2, 10.000 características/cm2, 50.000 características/cm2, 100.000 características/cm2, 1.000.000 características/cm2, 5.000.000 características/cm2, 107 características/cm2, 5x 107 características/cm2, 108 características/cm2, 5x 108 características/cm2, 109 características/cm2, 5x 109 características/cm2, o mayores.
Superficies
En algunas realizaciones, la plantilla de ácido nucleico proporcionada en el presente documento se puede fijar a un soporte sólido ("sustrato"). Los sustratos pueden ser bidimensionales o tridimensionales y pueden comprender una superficie plana (por ejemplo, un portaobjetos de vidrio) o pueden tener forma. Un sustrato puede incluir vidrio (p.ej., vidrio de poro controlado (CPG)), cuarzo, plástico (tal como poliestireno (poliestireno de baja y alta reticulación), policarbonato, polipropileno y poli(metilmetacrilato)), copolímero acrílico, poliamida, silicio, metal (p. ej., oro derivatizado con alcanotiolato), celulosa, nailon, látex, dextrano, matriz de gelp.ej., gel de sílice), poliacroleína o compuestos.
Sustratos tridimensionales adecuados incluyen, por ejemplo, esferas, micropartículas, perlas, membranas, portaobjetos, placas, chips micromecanizados, tubos (p. ej., tubos capilares), micropocillos, dispositivos microfluídicos, canales, filtros o cualquier otra estructura adecuada para anclar un ácido nucleico. Los sustratos pueden incluir matrices o matrices planas capaces de tener regiones que incluyen poblaciones de cebadores o ácidos nucleicos plantilla. Los ejemplos incluyen CPG derivatizado con nucleósidos y portaobjetos de poliestireno; portaobjetos magnéticos derivatizados; poliestireno injertado con polietilenglicol y similares. Se pueden usar varios métodos bien conocidos en la técnica para fijar, anclar o inmovilizar ácidos nucleicos a la superficie del sustrato.
Métodos para reducir las tasas de error en los datos de secuenciación
Algunas realizaciones de los métodos y composiciones proporcionados en el presente documento incluyen la reducción de las tasas de error en los datos de secuenciación. En algunas realizaciones de este tipo, las cadenas en sentido y antisentido de un ácido nucleico diana bicatenario están asociadas cada una con un código de barras diferente. Cada cadena se amplifica, se obtiene la información de secuencia a partir de múltiples copias de las cadenas amplificadas, y se genera una representación de la secuencia consenso del ácido nucleico diana a partir de información de secuencia redundante. Por lo tanto, la información de secuencia puede originarse e identificarse a partir de cada cadena. Por consiguiente, los errores de secuencia se pueden identificar y reducir cuando la información de secuencia que se origina a partir de una cadena es inconsistente con la información de secuencia de la otra cadena.
En algunas realizaciones, las cadenas en sentido y antisentido de un ácido nucleico diana están asociadas con un código de barras diferente. Los códigos de barras pueden asociarse con el ácido nucleico diana mediante una variedad de métodos que incluyen unión de adaptadores e inserción de secuencias de transposón. En algunas realizaciones de este tipo, un adaptador en Y puede estar unido a al menos un extremo de un ácido nucleico diana. El adaptador en Y puede incluir una secuencia bicatenaria y cadenas no complementarias, comprendiendo cada cadena un código de barras diferente. El ácido nucleico diana con el adaptador en Y unido se puede amplificar y secuenciar de manera que cada código de barras se pueda usar para identificar las cadenas en sentido o antisentido originales. Un método similar se describe en Kinde I. et al., (2011) PNAS 108:9530-9535. En algunas realizaciones, las cadenas en sentido y antisentido de un ácido nucleico diana están asociadas con un código de barras diferente insertando secuencias de transposón proporcionadas en el presente documento. En algunas realizaciones de este tipo, las secuencias de transposón pueden comprender códigos de barras no complementarios.
Algunas realizaciones de dichos métodos incluyen obtener información de secuencia de una cadena de un ácido nucleico diana bicatenario que comprende (a) obtener datos de secuencia de un ácido nucleico plantilla que comprende un primer adaptador de secuenciación y un segundo adaptador de secuenciación que tiene al menos una porción del ácido nucleico diana bicatenario dispuesto entre ellos, en donde: (i) el primer adaptador de secuenciación comprende un primer código de barras bicatenario, un primer sitio de cebador monocatenario y un segundo sitio cebador monocatenario, en donde el primer y segundo sitios de cebador son no complementarios y (ii) el segundo adaptador de secuenciación comprende un segundo código de barras bicatenario, un tercer sitio de cebador monocatenario y un cuarto sitio cebador monocatenario, en donde los sitios de cebador tercero y cuarto son no complementarios. En algunas realizaciones, el primer sitio de cebador de la cadena en sentido del ácido nucleico plantilla y el tercer sitio de cebador de la cadena en sentido antisentido del ácido nucleico plantilla comprenden la misma secuencia. En algunas realizaciones, cada código de barras es diferente. En algunas realizaciones, el primer adaptador de secuenciación comprende una horquilla monocatenaria que acopla el primer sitio de cebador y el segundo sitio de cebador.
En otra realización, cada extremo de un ácido nucleico diana está asociado con un adaptador que comprende un código de barras diferente, de modo que los productos de extensión de la cadena en sentido y antisentido de un ácido nucleico se pueden distinguir entre sí. En algunas realizaciones, las secuencias del sitio de cebador y los códigos de barras se seleccionan de manera que la extensión desde un cebador hibridado con la cadena en sentido da lugar a productos que se pueden distinguir de los productos de extensión a partir de un cebador hibridado con la cadena antisentido. En un ejemplo, el sitio de cebador 3' en sentido es el mismo que el sitio de cebador 3' antisentido, pero diferente de los sitios de cebador tanto 5' en sentido como 5' antisentido. La extensión de los cebadores hibridados al sitio de cebador 3' en sentido y el sitio de cebador 3' antisentido produciría los siguientes productos de cada cadena:
Cadena en sentido: (5') código de barras 2 -[secuencia diana] - código de barras 1 (3')
Cadena antisentido: (5') código de barras 1 -[secuencia diana] - código de barras 2 (3')
Por lo tanto, los productos de extensión de las cadenas en sentido y antisentido de un ácido nucleico pueden distinguirse entre sí. Un método ilustrativo se ilustra en Schmitt M.W., et al., PNAS (2012) 109:14508-13. En algunos de estos métodos, los códigos de barras y sitios de cebador pueden asociarse con el ácido nucleico diana mediante una variedad de métodos que incluyen unión de adaptadores e inserción de secuencias de transposón. En algunas realizaciones, las secuencias de transposón pueden diseñarse para proporcionar adaptadores con horquillas. Las horquillas proporcionan la capacidad de mantener la contigüidad física de las cadenas en sentido y antisentido de un ácido nucleico diana. Puede prepararse un ácido nucleico plantilla que comprende horquillas usando secuencias de transposón que comprenden enlazadores descritos en el presente documento. Ejemplos de enlazadores incluyen ácidos nucleicos monocatenarios.
Algunas realizaciones para la preparación de una biblioteca de ácidos nucleicos plantilla para obtener información de secuencia de cada cadena de un ácido nucleico diana bicatenario incluyen (a) proporcionar una población de transposomas que comprende una transposasa y una primera secuencia de transposón que comprende: (i) un primer sitio de reconocimiento de transposasas, un primer sitio de cebador y un primer código de barras, y (ii) una segunda secuencia de transposón que comprende un segundo sitio de reconocimiento de transposasas, un segundo sitio de cebador y un segundo código de barras, en donde la primera secuencia de transposón es no contigua a la segunda secuencia de transposón; y (b) poner en contacto los transposomas con un ácido nucleico bicatenario en unas condiciones de manera que dichas primera y segunda secuencias de transposón se inserten en el ácido nucleico diana bicatenario, preparando, de este modo, una biblioteca de ácidos nucleicos plantilla para obtener información de secuencia de cada cadena del ácido nucleico diana bicatenario. En algunas realizaciones, la población de transposomas comprende además transposomas que comprenden una transposasa y una secuencia de transposón que comprende un tercer sitio de reconocimiento de transposasas y un cuarto sitio de reconocimiento de transposasas que tienen una secuencia de código de barras dispuesta entre ellos, comprendiendo dicha secuencia de código de barras un tercer código de barras y un cuarto código de barras que tienen un adaptador de secuencia dispuesto entre ellos, comprendiendo dicho adaptador de secuenciación un tercer sitio de cebador y un cuarto sitio de cebador que tienen un enlazador dispuesto entre ellos. En algunas realizaciones, el primer sitio de cebador de la cadena en sentido del ácido nucleico plantilla y el tercer sitio de cebador de la cadena en sentido antisentido del ácido nucleico plantilla comprenden la misma secuencia. Algunas realizaciones también incluyen una etapa (c) de selección de ácidos nucleicos plantilla que comprenden secuencias de transposón en donde la primera secuencia de transposón es no contigua a la segunda secuencia de transposón y secuencias de transposón que comprenden un enlazador. En algunas realizaciones, el enlazador comprende una etiqueta de afinidad adaptada para unirse con una sonda de captura. En algunas realizaciones, la etiqueta de afinidad se selecciona del grupo que consiste en His, biotina y estreptavidina. En algunas realizaciones, cada código de barras es diferente. En algunas realizaciones, el enlazador comprende un ácido nucleico monocatenario. En algunas realizaciones, el ácido nucleico diana comprende ADN genómico.
Métodos para obtener información de haplotipos
Algunas realizaciones de los métodos y composiciones proporcionados en el presente documento incluyen métodos para obtener información de haplotipos a partir de un ácido nucleico diana. La información de haplotipos puede incluir determinar la presencia o ausencia de diferentes secuencias en locus especificados en un ácido nucleico diana, tal como un genoma. Por ejemplo, se puede obtener información de secuencia para copias maternas y paternas de un alelo. En un organismo con poliploidía, se puede obtener información de secuencia para al menos un haplotipo. Dichos métodos también son útiles para reducir la tasa de error al obtener información de secuencia a partir del ácido nucleico diana.
Generalmente, los métodos para obtener información de haplotipos incluyen distribuir un ácido nucleico en uno o más compartimentos de manera que cada compartimento comprenda una cantidad de ácido nucleico equivalente a aproximadamente un equivalente haploide del ácido nucleico, o equivalente a menos de aproximadamente un equivalente haploide del ácido nucleico. A continuación, se puede obtener información de secuencia de cada compartimento, obteniendo, de este modo, la información de haplotipos. La distribución del ácido nucleico plantilla en una pluralidad de recipientes aumenta la probabilidad de que un único recipiente incluya una única copia de un alelo o SNP, o que la información de secuencia consenso obtenida a partir de un único recipiente refleje la información de secuencia de un alelo o SNP. Como se entenderá, en algunas realizaciones de este tipo, se puede diluir un ácido nucleico plantilla antes de compartimentar el ácido nucleico plantilla en una pluralidad de recipientes. Por ejemplo, cada recipiente puede contener una cantidad de ácidos nucleicos diana igual a aproximadamente un equivalente haploide del ácido nucleico diana. En algunas realizaciones, un recipiente puede incluir menos de aproximadamente un equivalente haploide de un ácido nucleico diana.
Método de haplotipificación con compartimentos virtuales
Algunos métodos para obtener información de haplotipos proporcionados en el presente documento incluyen el uso de compartimentos virtuales. Ventajosamente, algunos de estos métodos permiten que los compartimentos incluyan cantidades de ácidos nucleicos equivalentes a al menos uno o más equivalentes haploides. En otras palabras, dichos métodos permiten el uso de concentraciones más altas de ácidos nucleicos en compartimentos en comparación con otros métodos de haplotipificación, aumentando, de este modo, la eficacia y los rendimientos de diversas manipulaciones.
En algunos métodos para obtener información de haplotipos con compartimentos virtuales, un ácido nucleico está compartimentado en una pluralidad de primeros recipientes, y los ácidos nucleicos de cada compartimento están provistos de un primer índice; los ácidos nucleicos con el primer índice se combinan y después se compartimentan en una pluralidad de segundos recipientes, y los ácidos nucleicos de cada compartimento se proporcionan con un segundo índice. Se puede preparar un ácido nucleico plantilla sometiéndose a al menos 2, 3, 4, 5, 6, 7, 8, 9, 10 o más rondas de compartimentación, indexación y agrupación. De esta manera, se proporciona un ácido nucleico plantilla con una pluralidad de índices diferentes en un método escalonado. Después de la indexación, los ácidos nucleicos plantilla indexados se pueden agrupar y distribuir en una pluralidad de compartimentos de modo que es probable que cada compartimento incluya una cantidad de un ácido nucleico plantilla particular que tiene una combinación particular de índices que es equivalente a aproximadamente un equivalente haploide del ácido nucleico diana o equivalente a menos de aproximadamente un equivalente haploide del ácido nucleico diana o equivalente a más de aproximadamente un equivalente haploide. En otras palabras, cada recipiente puede recibir una cantidad de ácido nucleico plantilla que comprende más que el equivalente de un equivalente haploide, sin embargo, es probable que cada copia de un alelo o SNP esté asociado con una combinación diferente de índices. Por consiguiente, se puede reducir el número de recipientes para compartimentar un ácido nucleico plantilla de manera que cada recipiente incluya aproximadamente una cantidad de ácido nucleico plantilla equivalente a un haploide o menos de un ácido nucleico diana. Asimismo, la cantidad de ácido nucleico en cada recipiente puede ser mayor que la cantidad de aproximadamente un equivalente haploide, aumentando, de este modo, la eficacia y los rendimientos de diversas manipulaciones.
Existen varios métodos para indexar ácidos nucleicos. Por ejemplo, en algunas realizaciones, los índices pueden insertarse en ácidos nucleicos usando transposomas proporcionados en el presente documento; los índices pueden unirse a ácidos nucleicos; y los índices se pueden añadir a los ácidos nucleicos durante la copia, por ejemplo, amplificación de un ácido nucleico. En algunas realizaciones, se puede preparar un ácido nucleico plantilla que comprende un índice usando transposomas que comprenden una secuencia de transposón contigua. Véase, por ejemplo, el transposoma (50) en la figura 1. La inserción de secuencias de transposón contiguas puede dar como resultado la conservación de la información de posición para una molécula de ácido nucleico particular después de la distribución de ácidos nucleicos plantilla entre varios compartimentos. En algunas realizaciones, se puede preparar un ácido nucleico plantilla que comprende un índice usando transposomas que comprenden secuencias de transposón no contiguas. Véase, por ejemplo, el transposoma (10) en la figura 1. En la publicación de solicitud de patente de Estados Unidos n° 2010/0120098 se exponen ejemplos de dichas secuencias de transposón. La inserción de secuencias de transposón no contiguas puede dar como resultado la fragmentación de una molécula de ácido nucleico particular. Por lo tanto, en algunas realizaciones, la inserción de secuencias de transposón no contiguas en un ácido nucleico plantilla puede reducir la información de posición para una molécula de ácido nucleico particular después de la distribución de los ácidos nucleicos plantilla entre varios compartimentos. En otras palabras, diferentes fragmentos de una molécula de ácido nucleico particular pueden distribuirse en diferentes recipientes.
En un ejemplo con un genoma diploide, después de agrupar y diluir en compartimentos, se puede añadir una mayor cantidad de ácidos nucleicos a cada compartimento ya que la posibilidad de una copia del padre y una copia de la madre de la misma región con los mismos índices es menor. Por ejemplo, una copia del padre y una copia de la madre para la misma región pueden estar presentes en el mismo compartimento siempre que cada una contenga un índice diferente, por ejemplo, una proviene de una reacción de transposición con un primer índice (índice-1) y la otra proviene de una reacción de transposición con un primer índice diferente (índice-2). En otras palabras, pueden estar presentes copias de la misma región/cromosoma en el mismo compartimento, ya que pueden distinguirse por su índice exclusivo incorporado en la primera reacción de transposición. Esto permite que se distribuya más ADN en cada compartimento en comparación con los métodos de dilución alternativos. El esquema de indexación dual crea un número total de compartimentos virtuales del número de reacciones de transposición indexadas iniciales multiplicado por el número de reacciones de PCR indexadas.
La figura 4 representa una realización de ejemplo de la obtención de información de haplotipos utilizando compartimentos virtuales. Un ácido nucleico diana que comprende ADN genómico se distribuye en un primer conjunto de 96 recipientes y los ácidos nucleicos de cada recipiente se proporcionan con un primer índice diferente usando un transposón derivado de Tn5. Por tanto, se obtiene una pluralidad de ácidos nucleicos plantilla con primer índice (p. ej., Tn5-1, Tn5-2 ..., y Tn5-96). La pluralidad de ácidos nucleicos plantilla con primer índice se combinan y después se redistribuyen en un segundo conjunto de 96 recipientes y los ácidos nucleicos de cada recipiente se proporcionan con un segundo índice diferente mediante amplificación de los ácidos nucleicos usando cebadores que comprenden los segundos índices. Por tanto, se obtiene una pluralidad de ácidos nucleicos plantilla con segundo índice (p. ej., PCR1, PCR2 ... y PCR96). La pluralidad de ácidos nucleicos plantilla con segundo índice se puede combinar y obtener información de secuencia. El uso de recipientes físicos de 96 X 96 equivale a 9216 compartimentos virtuales.
Métodos para obtener información de haplotipos ampliados
Como se describe anteriormente, la inserción de secuencias de transposón no contiguas en el ácido nucleico plantilla puede reducir la información de posición para una molécula de ácido nucleico en particular, por ejemplo, después de la distribución de los ácidos nucleicos plantilla entre varios compartimentos. Sin embargo, el solicitante ha descubierto métodos para conservar dicha información de posición para una molécula de ácido nucleico particular. Sin desear quedar ligados a teoría alguna, se ha observado que después de la transposición, los dos fragmentos adyacentes resultantes de una molécula de ácido nucleico particular tenderán a distribuirse en el mismo recipiente en condiciones que mantienen la transposasa en el sitio de inserción de una secuencia de transposón. En otras palabras, la transposasa puede mantener juntos los dos fragmentos adyacentes resultantes de una molécula de ácido nucleico particular.
En algunas realizaciones, se puede eliminar una transposasa de un ácido nucleico plantilla después de distribuir el nucleico plantilla en varios recipientes. Se puede eliminar una transposasa del sitio de una inserción mediante diversos métodos bien conocidos en la técnica, incluyendo la adición de un detergente, tal como SDS, cambio la temperatura, digestión por proteinasas, captura de chaperonas y cambio de pH. También se puede utilizar ADN polimerasas, con o sin propiedades de desplazamiento de cadena, incluyendo, pero sin limitación, ADN polimerasa de phi29, ADN polimerasa de Bst, etc. para desalojar la transposasa del ADN.
La figura 5 representa un esquema de ejemplo en el que un ácido nucleico diana se distribuye en un conjunto de primeros recipientes y se indexa mediante la inserción de transposomas, tales como transposomas que comprenden secuencias de transposón no contiguas. Los primeros ácidos nucleicos plantilla indexados se agrupan y distribuyen en un conjunto de segundos recipientes y se indexan mediante amplificación por PCR. La información de la secuencia se puede obtener a partir de los segundos ácidos nucleicos plantilla indexados.
Algunos métodos para obtener información de haplotipos ampliados a partir de un ácido nucleico diana incluyen (a) obtener un ácido nucleico plantilla que comprende una pluralidad de transposomas insertados en el ácido nucleico diana, en donde al menos algunos de los transposomas insertados comprenden cada uno una primera secuencia de transposón, una segunda secuencia de transposón no contigua con la primera secuencia de transposón y una transposasa asociada con la primera secuencia de transposón y la segunda secuencia de transposón; (b) compartimentar el ácido nucleico plantilla que comprende la pluralidad de transposomas insertados en cada recipiente de una pluralidad de recipientes; (c) eliminar la transposasa del ácido nucleico plantilla; y (d) obtener información de secuencia del ácido nucleico plantilla de cada recipiente, obteniendo, de este modo, información de haplotipos a partir del ácido nucleico diana. En algunas realizaciones, compartimentar el ácido nucleico plantilla incluye proporcionar a cada recipiente una cantidad de ácido nucleico plantilla equivalente a más de aproximadamente un equivalente haploide del ácido nucleico diana, una cantidad de ácido nucleico plantilla equivalente a aproximadamente un equivalente haploide del ácido nucleico diana o una cantidad de ácido nucleico plantilla equivalente a menos de aproximadamente un equivalente haploide del ácido nucleico diana.
Una realización adicional para mantener la contigüidad de ácidos nucleicos diana para aplicaciones de secuenciación comprende utilizar eventos de transposición unilaterales (es decir, un extremo de transposón) en lugar de eventos de transposición bilaterales (es decir, dos extremos de transposones) como se divulga en el presente documento. Por ejemplo, se ha demostrado que las transposasas incluyendo, pero sin limitación Mu, MuE392Q mutante, Tn5, muestran transposición unilateral de una secuencia de transposón en un ácido nucleico diana (Haapa et al., 1999, Nucl. Acids Res. 27(3): 2777-2784). El mecanismo de transposición unilateral de estas transposasas se puede utilizar en los métodos descritos en el presente documento para mantener la contigüidad de una muestra para la secuenciación, por ejemplo, para haplotipificar o ensamblar un ácido nucleico diana.
En un ejemplo de transposición unilateral en un ADN diana, el transposoma, una transposasa Tn5 dimérica está asociada con un solo extremo de secuencia de transposón. En realizaciones preferidas, el extremo del transposón podría comprender además secuencias adicionales tales como secuencias índice, códigos de barras y/o secuencias de cebadores y similares que podrían usarse, por ejemplo, para identificar una muestra, amplificar o ampliar el ácido nucleico diana y alinear secuencias de fragmentos. El complejo del transposoma se asocia con el ácido nucleico diana, en ese caso ADNbc. En el sitio de asociación del transposoma, la transposasa escinde esa cadena del ADN diana e inserta el transposón y cualquier otra secuencia adicional en el punto de escisión. La transposasa permanece asociada con el ADN diana hasta que se elimina, por ejemplo, después de dividir la muestra como se describe en el presente documento, la transposasa puede eliminarse mediante degradación (por ejemplo, uso de SDS u otros métodos como se describe en el presente documento). El ácido nucleico diana, en este caso ADNbc, no se fragmenta después de la eliminación de la transposasa, de manera que el transposón y cualquier secuencia adicional se pueden incorporar al ADN diana sin fragmentar el ADN. Una vez que se elimina la transposasa, se puede realizar amplificación de la diana por cualquier medio conocido en la técnica, en este ejemplo, amplificación de cebadores únicos o múltiples (debido a la incorporación de secuenciación de múltiples cebadores diferentes incluidos en uno o más transposones) ya sea exponencial o lineal, tal como PCR dirigida o amplificación del genoma completo (por ejemplo, mediante desplazamiento de múltiples cadenas), para crear bibliotecas para la secuenciación. Como se describe en el presente documento con respecto a las secuencias de transposón bilaterales, se podría incluir una variedad de diferentes combinaciones de índice, código de barras, sitio o sitios de endonucleasas de restricción y/o secuencia de cebador como parte de la secuencia del transposón dependiendo de las necesidades del usuario. Como tal, también se podrían utilizar complejos de transposomas unilaterales para mantener la contigüidad de un ácido nucleico diana para los métodos divulgados en el presente documento para determinar el haplotipo de un ácido nucleico diana.
También se pueden crear transposomas unilaterales a partir de los dos complejos transposón/transposasa o los complejos transposón/transposasa en bucle divulgados en el presente documento. Por ejemplo, una de las secuencias de transposón de un complejo de dos transposones o un extremo del transposón en bucle podría, por ejemplo, modificarse o bloquearse químicamente para que la transposición no se produzca o se produzca mínimamente, en ese extremo. Por ejemplo, podría incorporarse un didesoxinucleótido, un hapteno tal como una biotina al final de uno de los extremos del transposón, lo que inhibiría la transposición en ese extremo, permitiendo, de este modo, que solamente un transposón, o un extremo de un transposón en bucle, se insertara en el ácido nucleico diana.
En una realización, un método para obtener información de secuencia a partir de un ácido nucleico diana comprende obtener un ácido nucleico plantilla que comprende una pluralidad de transposones insertados en dicho ácido nucleico diana de manera que se conserve la contigüidad de la plantilla, compartimentar los ácidos nucleicos que comprenden la pluralidad de transposones insertados en una pluralidad de recipientes, generar bibliotecas indexadas específicas de compartimento a partir de los ácidos nucleicos diana transpuestos y obtener información de secuencia a de los ácidos nucleicos plantilla en cada recipiente de la pluralidad de recipientes.
Determinados métodos para preparar ácidos nucleicos diana para haplotipificación
Algunas realizaciones de los métodos y composiciones proporcionados en el presente documento incluyen la preparación de ácidos nucleicos diana para la haplotipificación usando los métodos proporcionados en el presente documento. Usando un método de amplificación previa, el número de lecturas exclusivas se incrementa generando múltiples copias idénticas del mismo fragmento de ácido nucleico como un producto contiguo. En algunas realizaciones de este tipo, una biblioteca se amplifica mediante métodos tales como la amplificación de círculo rodante (RCA, por sus siglas en inglés). En algunas realizaciones, se preparan bibliotecas circulares de un ácido nucleico diana y se amplifica la biblioteca mediante RCA. Dichos métodos generan ácidos nucleicos largos ampliados.
Un esquema de ejemplo se muestra en la figura 6. La figura 6 representa un método que incluye la preparación ácidos nucleicos diana para la haplotipificación mediante la generación de una biblioteca que comprende moléculas circulares mediante mate-pair y la selección de tamaños específicos o en un intervalo de ácidos nucleicos de 1-10 kb o 10-20 kb, o 20 kb-50 kb, 50-200 kb; amplificación la biblioteca por RCA para generar ácidos nucleicos solitarios ampliados; inserción de índices en la biblioteca amplificada con transposones; compartimentación de la biblioteca insertada; eliminación de la transposasa con SDS; indexación de manera adicional de la biblioteca; y obtención de información de secuencia de la biblioteca.
Otro esquema de ejemplo se muestra en la figura 7. La figura 7 representa un método que incluye la preparación de ácidos nucleicos diana para la haplotipificación mediante la generación de una biblioteca que comprende moléculas circulares mediante transposición en horquilla, relleno de huecos y selección de un tamaño específico o intervalo de tamaños de ácidos nucleicos de 1-10 kb o 10-20 kb, o 20 kb-50 kb, 50-200 kb; amplificación la biblioteca por RCA para generar ácidos nucleicos solitarios ampliados; inserción de índices en la biblioteca amplificada con transposones; compartimentación de la biblioteca insertada; eliminación de la transposasa con SDS; indexación de manera adicional de la biblioteca; y obtención de información de secuencia de la biblioteca.
Métodos para generar bibliotecas de tipo mate-pair
Los métodos para generar bibliotecas de tipo mate-pair incluyen: fragmentar el ADN genómico en grandes fragmentos normalmente mayores de (aunque sin limitarse a) 1000 pb; circularizar fragmentos individuales mediante un método que etiqueta la unión fijada; fragmentar adicionalmente el ADN; enriquecer las secuencias de unión etiquetadas y unir los adaptadores a las secuencias de unión enriquecidas para que puedan secuenciarse proporcionando información sobre el par de secuencias en los extremos del fragmento de ADN largo original. Estos procesos implican al menos 2 etapas en las que el ADN se fragmenta, ya sea física o enzimáticamente. En al menos una o más etapas diferentes, los adaptadores se unen a los extremos de los fragmentos. Las preparaciones de tipo mate-pair suelen tardar de 2 a 3 días en realizarse y comprenden varias etapas de manipulaciones del ADN. La diversidad de la biblioteca resultante se correlaciona directamente con el número de etapas necesarias para crear la biblioteca.
El método proporcionado en el presente documento simplifica el número de etapas en el protocolo de generación de bibliotecas mediante el empleo de una reacción mediada por transposasas que fragmenta y añade de manera simultánea secuencias adaptadoras a los extremos de los fragmentos. Al menos una o ambas etapas de fragmentación (fragmentación inicial del ADN genómico y fragmentación de fragmentos circularizados) se pueden realizar con un transposoma, reemplazando, de este modo, la necesidad de una etapa separada de fragmentación y unión del adaptador. Obviando el refinado, la preparación y unió de los extremos de los fragmentos reduce el número de etapas del proceso y, por lo tanto, aumenta el rendimiento de datos utilizables en la preparación, además de hacer que el procedimiento sea más fuerte. En una realización, el protocolo se puede realizar sin recurrir a métodos que purifican una selección de tamaños basándose en electroforesis. Este método produce una gama más amplia de tamaños de fragmentos que la que se puede lograr con los métodos electroforéticos en gel, pero sin embargo produce datos utilizables. La ventaja es que se evita una etapa intensiva en mano de obra.
La figura 8 proporciona un esquema de ejemplo en el que solamente la fragmentación inicial se reemplaza con una etapa de etiquetado del transposoma. El a Dn circularizado se fragmenta mediante métodos físicos o métodos químicos/enzimáticos y los fragmentos se convierten en una biblioteca a través de la aplicación de protocolos de preparación de muestras convencional (por ejemplo, TRUSEQ). La figura 9 ilustra un esquema de ejemplo en el que tanto la fragmentación inicial como la fragmentación de ADN circularizado se realizan con una etapa de etiquetado del transposoma. Las secuencias adaptadoras para el transposoma (incluidas las secuencias m E) pueden o no ser diferentes para el adaptador utilizado para el etiquetado inicial y el posterior etiquetado de círculo.
Amplificar el ácido nucleico plantilla mediante la generación de múltiples copias de cada molécula antes de la transposición o la introducción de índices moleculares crea una redundancia que puede ser útil para obtener una mayor cobertura de SNP en cada bloque de haplotipos y también para el ensamblaje del genoma de novo, similar a un enfoque indiscriminado. El ácido nucleico plantilla se puede convertir en una biblioteca de tamaño definido mediante transposición de baja frecuencia, cizalladura física o digestión enzimática, y después amplificarse para un número finito de ciclos mediante PCR o mediante un esquema de amplificación del genoma completo (por ejemplo, usando phi29). La biblioteca amplificada que ya contiene la redundancia incorporada se puede utilizar como material de entrada para el flujo de trabajo de haplotipificación. De esta forma, cada región del genoma está representada varias veces por múltiples copias generadas por adelantado contribuyendo cada copia a una cobertura parcial de esa región; sin embargo, la cobertura consenso estará más cerca de completarse.
Ejemplos
Ejemplo 1: reducción de las tasas de error
Se preparó una biblioteca de ácidos nucleicos plantilla con cada fragmento que comprende un código de barras diferente. Cada fragmento se amplificó y la información de secuencia se obtuvo de al menos un producto amplificado de cada fragmento. Se determinó una secuencia consenso a partir de la información de secuencia de los productos amplificados de cada fragmento. En particular, se secuenció una biblioteca de secuenciación preparada con NEXTERA durante 500 ciclos en un instrumento MISEQ. La biblioteca consistía en una distribución de tamaños, con longitudes máximas de lectura que se extienden hasta -300 nt. Las tasas de error en el ciclo 250 fueron aproximadamente del 15 %. Si una plantilla se representó solamente tres veces, la tasa de error se redujo a ~ 1% en el ciclo 250. La figura 10 ilustra un modelo de tasas de error con un número de productos amplificados secuenciados (cobertura de cada código de barras). Las tasas de error disminuyen a medida que aumenta el número de productos amplificados secuenciados a partir de un fragmento.
Ejemplo 2-secuencias de acoplamiento de transposones
Este ejemplo ilustra métodos para acoplar dos secuencias de transposón en varias orientaciones, incluida una orientación 5'-5 'y una orientación 3'-3'. En un método ilustrativo, la aldehído oxiamina se usa para formar oligos enlazados mediante la formación de éteres de oxiamina. Se combina un oligo modificado con aldehído (en el extremo 5' o en el 3') con un oligo modificado con una oxiamina en el extremo 5' en tampón de reacción y se deja incubar durante 2 horas. El producto final se puede aislar mediante purificación PAGE, por ejemplo.
En otro método ilustrativo, se realizó el acoplamiento con bisoxiamina. Los oligos modificados con aldehído se dimerizaron con un enlazador de bisoxiamina (por ejemplo, dioxiaminobutano) usando concentraciones localmente altas para forzar la bisustitución. Se sintetizaron oligos de 100 meros con un aldehído en el extremo 5' y se purificaron. Se sintetizó el oligo con bisoxiamina. Se preparó una solución 1 mM del oligo con bisoxiamina en un tampón de reacción de pH bajo que contenía un catalizador (urea 5 M, anilina 100 mM, citrato 10 mM, NaCl 150 mM, pH 5,6) y se añadió a una solución 665 pM de oligo con aldehído en agua. El volumen total de la solución se diluyó 1:1 con tampón de reacción y se dejó incubar a temperatura ambiente durante 2 horas. Una titulación de diversas relaciones de aldehído:bisoxiamina mostró dimerización a altas relaciones de bisoxiamina. Las condiciones más satisfactorias se replicaron con oligos con 3' aldehido. La figura 11 muestra los resultados de las reacciones de acoplamiento de bisoxiamina 5'-5' en las que se observaron transposones precursores en bucle en la banda de dímeros indicada. Se observaron resultados similares para las reacciones de acoplamiento con bisoxiamina 3'-3'.
Ejemplo 3: monitorización de la estabilidad del transposoma
Los transposomas se prepararon utilizando secuencias de transposón largas y cortas cargadas en transposasa. Los productos del transposoma incluían: A (2 secuencias cortas); B (secuencias largas y cortas); y C (2 secuencias largas). Las cantidades relativas de cada especie de transposoma se midieron en diversas condiciones, tales como temperatura, tampones, relaciones de secuencias de transposón a transposasa. Generalmente, un alto nivel de sal NaCl o KCl aumentaba el intercambio de secuencias de transposón entre transposomas. Los tampones glutamato y acetato eliminaron o redujeron el intercambio, con concentraciones preferidas entre 100-600 mM. Se determinaron las condiciones óptimas de almacenamiento.
Ejemplo 4: mantenimiento de la contigüidad de la plantilla
Este ejemplo ilustra un método para mantener la información de contigüidad de un ácido nucleico plantilla preparado usando transposomas que comprenden secuencias de transposón no contiguas en las que la transposasa Tn5 permanece unida al ADN plantilla después de la transposición. El ácido nucleico diana se puso en contacto con transposomas que comprenden transposasa Tn5 y secuencias de transposón no contiguas. La figura 12 muestra que las muestras tratadas adicionalmente con SDS aparecieron como un frotis de varios fragmentos de ácido nucleico plantilla; las muestras no tratadas con SDS mostraron conservación de supuesto ácido nucleico plantilla de alto peso molecular. Por lo tanto, aunque un ácido nucleico pueda estar fragmentado, las secuencias adyacentes aún pueden estar asociadas entre sí mediante la transposasa (como lo demuestra el ADN unido a Tn5 que queda en los pocillos). En otro método ilustrativo más, se preparó una biblioteca de ácidos nucleicos plantilla usando transposomas que comprenden secuencias de transposón no contiguas con ácido nucleico diana que comprendía el cromosoma 22 humano. La figura 13 resume que se observaron bloques de haplotipos de hasta 100 kb para muestras en las que se eliminó la transposasa mediante SDS después de la dilución. Por lo tanto, mediante la práctica de métodos como se describen en el presente documento, los ácidos nucleicos diana pueden mantener la integridad de la diana cuando se transponen, diluirse y transformarse en bibliotecas de secuenciación.
Ejemplo 5: mantenimiento de la contigüidad de la plantilla
Los ácidos nucleicos diana se etiquetaron con transposomas que comprenden secuencias de transposón no contiguas (NEXTERA), se diluyeron a la concentración deseada y después se trataron con SDS para eliminar la enzima transposasa antes de la PCR. Como control, se etiquetó la misma cantidad de ADN de entrada, se trató primero con SDS y después se diluyó a la concentración deseada. El tratamiento con SDS antes de la dilución elimina la información de proximidad ya que la enzima transposasa se disocia del ADN diana con SDS, fragmentando, de este modo, el ADN diana. Se establecieron dos reacciones de etiquetado en 50 ng de un ADNg de Coriell, la reacción 1 se detuvo con SDS al 0,1 % y se diluyó a 6 pg. A continuación, la otra reacción se diluyó primero a 6 pg y después se detuvo con SDS al 0,1 %. Todas las reacciones se utilizaron para configurar una reacción de PCR de 30 ciclos y se secuenciaron en una plataforma Gene Analyzer (Illumina), de acuerdo con las instrucciones del fabricante. Las lecturas se mapearon a un genoma de referencia humano y se calculó y trazó la distribución de distancias.
Como se muestra en la figura 14, en la muestra SDS-posterior a la dilución, la distancia media se desplazó a tamaños más pequeños y se hace evidente una gran subpoblación de lecturas ubicadas próximamente. Si existía alguna haplotipificación, se esperaba una acumulación de lecturas proximales. La distribución bimodal de la muestra posterior a la dilución demostró que existe un enriquecimiento de las lecturas proximales.
La distribución de la distancia fue una medida del tamaño de la muestra (es decir, cuantas más lecturas exclusivas, más corta es la distancia). Se muestra el histograma de distancia para las muestras SDS anterior a la dilución y SDS posterior a la dilución. en la Fig. 14. Para corregir la diferencia en el número de lecturas exclusivas, la previa dilución se muestreó hacia abajo para dar el mismo número de lecturas mapeadas exclusivas (664.741). Se observó un enriquecimiento significativo para las lecturas que son vecinas inmediatas (es decir, uniones). Esto se midió mirando la distribución de la "distancia a la siguiente alineación" y encontrando las lecturas cuya distancia a su siguiente alineación es la longitud de lectura de secuencia menos 9 (que corresponde a la duplicación de 9 pb causada por Tn5 en el sitio de inserción). Estas lecturas constituyen el 10 % de los datos (figura 15) y con el empleo de un sistema de cebador único para la amplificación de bibliotecas NEXTERA, se puede duplicar. Además, la implementación de una preparación de muestras más conservadora que permite una menor pérdida de muestras permite la recuperación de más datos de unión. El poder de resolución de haplotipos disminuyó cuando se incrementó el ADN de entrada. Por otro lado, la reducción de la entrada de ADN requirió más amplificación y, por lo tanto, más ciclos de PCR, generando muchos duplicados de PCR. El uso de complejos de Tn5 con códigos de barras de manera individual permitió que el etiquetado y las diluciones posteriores se llevaran a cabo en compartimentos separados. Se combinaron bajos niveles de entrada de material etiquetado y con códigos de barras individualmente para elevar las cantidades de ADN de entrada de PCR al nivel que permitía una amplificación más específica con menos desperdicio de capacidad de secuenciación en lecturas redundantes. Por consiguiente, el uso de suficientes complejos con códigos de barras permitió el ajuste de fase de la mayor parte del genoma humano. Para aumentar el poder de resolución de haplotipos, el código de barras se implementó tanto a nivel complejo como a nivel de cebador de PCR. Dicho esquema de indexación combinatoria permite el uso de ADN de entrada muy bajo de cada complejo con código de barras de manera individual en la reacción de PCR, lo que permitiría una potente resolución de haplotipos. Usando solamente 40 oligos de indexación (8+12=20 para complejos NEXTERA que genera 8*12 = 96 complejos individuales y 8+12=20 para cebadores de PCR que permitirían 8*12 = 96 índices adicionales), se generaron 96*96=9216 compartimentos virtuales para el flujo de trabajo de haplotipificación mencionado anteriormente. Usando una receta de secuenciación modificada, todos los datos se secuenciaron en un HiSeq-2000. Las 9216 posibles combinaciones de códigos de barras se observaron en los resultados de la secuenciación.
Ejemplo 6: obtención de información de haplotipos con Mu
Se utilizaron transposomas que comprenden Mu para obtener información de haplotipos. Se seleccionó como diana 1 ng de ADN genómico con Mu-TSM en un volumen de reacción de 50 pl con tampón 1 X TA y 1,2, 4 u 8 pl de complejos de Mu-TSM 25 pM. Las reacciones se incubaron a 37 °C durante 2 horas. Las muestras se diluyeron a 1 pg/pl. Para la inactivación de Mu, se prepararon 10 pl de cada muestra que contenían 1 pg o 5 pg de ADN genómico total. Se añadió SDS a una concentración final de 0,05 %. Las muestras se incubaron a 55 °C durante 20 minutos. La muestra completa se usó para configurar una reacción de PCR de 50 pl usando NPM. Se realizó PCR durante 30 ciclos. Las muestras de PCR se limpiaron con 0,6 X SPRI y se resuspendieron en 20 pl de tampón de resuspensión. Se obtuvo información de secuenciación. La figura 16muestra las lecturas proximales observadas acumuladas observadas en el contenido subhaploide usando transposomas que comprenden Mu.
La expresión "que comprende/n" tal como se usa en el presente documento es sinónimo de "que incluye/n", "que contiene/n", o "se caracteriza por" y es inclusivo o abierto y no excluye elementos o etapas de métodos adicionales que no se hayan mencionado.

Claims (9)

REIVINDICACIONES
1. Método para preparar una biblioteca de ácidos nucleicos plantilla para obtener información de secuencia a partir de un ácido nucleico diana, comprendiendo dicho método:
(a) compartimentar el ácido nucleico diana en una pluralidad de primeros recipientes proporcionando a cada primer recipiente una cantidad de ácido nucleico diana mayor que aproximadamente uno o más equivalentes haploides del ácido nucleico diana;
(b) proporcionar un primer índice al ácido nucleico diana de cada primer recipiente, en donde el primer índice proporcionado al ácido nucleico diana de cada primer recipiente es diferente, en donde la etapa comprende poner en contacto el ácido nucleico diana con una pluralidad de transposomas, comprendiendo cada transposoma una secuencia de transposón que comprende un primer índice y una transposasa asociada con la secuencia de transposón en unas condiciones de manera que al menos algunas de las secuencias transposón se inserten en el ácido nucleico diana, obteniendo, de este modo, una pluralidad de primeros ácidos nucleicos plantilla indexados; (c) combinar los primeros ácidos nucleicos plantilla indexados;
(d) compartimentar los primeros ácidos nucleicos plantilla indexados en una pluralidad de segundos recipientes; y (e) proporcionar un segundo índice a los primeros ácidos nucleicos plantilla indexados de cada segundo recipiente, en donde el segundo índice proporcionado a los primeros ácidos nucleicos plantilla indexados de cada segundo recipiente es diferente, obteniendo, de este modo, una pluralidad de segundos ácidos nucleicos plantilla indexados.
2. Método de la reivindicación 1, en donde la etapa (d) comprende eliminar la transposasa de los primeros ácidos nucleicos plantilla indexados compartimentados, en donde eliminar la transposasa comprende un método seleccionado del grupo que consiste en añadir un detergente, cambiar la temperatura, cambiar el pH, añadir una proteasa, añadir una chaperona y añadir una polimerasa.
3. Método de cualquiera de las reivindicaciones 1-2, en donde la secuencia de transposón comprende un enlazador que comprende un primer sitio de cebador y un segundo sitio de cebador.
4. Método de cualquiera de las reivindicaciones 1 a 3, en donde la secuencia de transposón comprende una primera secuencia de código de barras y una segunda secuencia de código de barras, en donde la primera secuencia de código de barras y la segunda secuencia de código de barras son diferentes.
5. Método de cualquiera de las reivindicaciones 1-4, en donde la etapa (d) comprende proporcionar a cada primer recipiente una cantidad del primer ácido nucleico plantilla indexado mayor que aproximadamente uno o más equivalentes haploides del ácido nucleico diana.
6. Método de cualquiera de las reivindicaciones 1-5, en donde la etapa (e) comprende amplificar los primeros ácidos nucleicos plantilla indexados con al menos un cebador que comprende el segundo índice.
7. Método de cualquiera de las reivindicaciones 1-5, en donde la etapa (e) comprende unir los primeros ácidos nucleicos plantilla indexados con al menos un cebador que comprende el segundo índice.
8. Método de cualquiera de las reivindicaciones 1-7, en donde el ácido nucleico diana se obtiene enriqueciendo una pluralidad de ácidos nucleicos para una secuencia de interés bien antes o después de la transposición.
9. Método de la reivindicación 1, que comprende además obtener información de secuencia del ácido nucleico plantilla, en donde opcionalmente la información de secuencia comprende información de secuencia de haplotipos.
ES19158003T 2013-03-13 2013-03-13 Método de preparación de una biblioteca de secuenciación de ácidos nucleicos Active ES2887177T3 (es)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
PCT/US2013/031023 WO2014142850A1 (en) 2013-03-13 2013-03-13 Methods and compositions for nucleic acid sequencing
EP19158003.4A EP3553175B1 (en) 2013-03-13 2013-03-13 Method of preparing a nucleic acid sequencing library
EP13711276.9A EP2970951B1 (en) 2013-03-13 2013-03-13 Methods for nucleic acid sequencing

Publications (1)

Publication Number Publication Date
ES2887177T3 true ES2887177T3 (es) 2021-12-22

Family

ID=47913649

Family Applications (2)

Application Number Title Priority Date Filing Date
ES19158003T Active ES2887177T3 (es) 2013-03-13 2013-03-13 Método de preparación de una biblioteca de secuenciación de ácidos nucleicos
ES13711276T Active ES2724824T3 (es) 2013-03-13 2013-03-13 Métodos para la secuenciación de ácidos nucleicos

Family Applications After (1)

Application Number Title Priority Date Filing Date
ES13711276T Active ES2724824T3 (es) 2013-03-13 2013-03-13 Métodos para la secuenciación de ácidos nucleicos

Country Status (8)

Country Link
US (4) US10557133B2 (es)
EP (3) EP3553175B1 (es)
AU (3) AU2013382098B2 (es)
CA (2) CA3094792A1 (es)
DK (2) DK2970951T3 (es)
ES (2) ES2887177T3 (es)
HK (1) HK1219503A1 (es)
WO (1) WO2014142850A1 (es)

Families Citing this family (107)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8383345B2 (en) 2008-09-12 2013-02-26 University Of Washington Sequence tag directed subassembly of short sequencing reads into long sequencing reads
US9074251B2 (en) 2011-02-10 2015-07-07 Illumina, Inc. Linking sequence reads using paired code tags
EP2670894B1 (en) 2011-02-02 2017-11-29 University Of Washington Through Its Center For Commercialization Massively parallel continguity mapping
US9957560B2 (en) 2011-07-25 2018-05-01 Oxford Nanopore Technologies Ltd. Hairpin loop method for double strand polynucleotide sequencing using transmembrane pores
US10689643B2 (en) 2011-11-22 2020-06-23 Active Motif, Inc. Targeted transposition for use in epigenetic studies
EP2836506B1 (en) 2012-04-10 2017-04-19 Oxford Nanopore Technologies Limited Mutant lysenin pores
US10584381B2 (en) 2012-08-14 2020-03-10 10X Genomics, Inc. Methods and systems for processing polynucleotides
US10323279B2 (en) 2012-08-14 2019-06-18 10X Genomics, Inc. Methods and systems for processing polynucleotides
US10221442B2 (en) 2012-08-14 2019-03-05 10X Genomics, Inc. Compositions and methods for sample processing
US9701998B2 (en) 2012-12-14 2017-07-11 10X Genomics, Inc. Methods and systems for processing polynucleotides
US9567631B2 (en) 2012-12-14 2017-02-14 10X Genomics, Inc. Methods and systems for processing polynucleotides
CA3216609C (en) 2012-08-14 2024-05-14 10X Genomics, Inc. Microcapsule compositions and methods
US10752949B2 (en) 2012-08-14 2020-08-25 10X Genomics, Inc. Methods and systems for processing polynucleotides
US11591637B2 (en) 2012-08-14 2023-02-28 10X Genomics, Inc. Compositions and methods for sample processing
US10273541B2 (en) 2012-08-14 2019-04-30 10X Genomics, Inc. Methods and systems for processing polynucleotides
US9951386B2 (en) 2014-06-26 2018-04-24 10X Genomics, Inc. Methods and systems for processing polynucleotides
US10533221B2 (en) 2012-12-14 2020-01-14 10X Genomics, Inc. Methods and systems for processing polynucleotides
US9683230B2 (en) 2013-01-09 2017-06-20 Illumina Cambridge Limited Sample preparation on a solid support
CA2900543C (en) 2013-02-08 2023-01-31 10X Genomics, Inc. Partitioning and processing of analytes and other species
CN105209634B (zh) 2013-03-08 2020-05-12 牛津纳米孔技术公司 酶停滞方法
ES2887177T3 (es) 2013-03-13 2021-12-22 Illumina Inc Método de preparación de una biblioteca de secuenciación de ácidos nucleicos
US9328382B2 (en) 2013-03-15 2016-05-03 Complete Genomics, Inc. Multiple tagging of individual long DNA fragments
GB201313477D0 (en) 2013-07-29 2013-09-11 Univ Leuven Kath Nanopore biosensors for detection of proteins and nucleic acids
AU2014268710B2 (en) 2013-05-23 2018-10-18 The Board Of Trustees Of The Leland Stanford Junior University Transposition into native chromatin for personal epigenomics
US10191929B2 (en) * 2013-05-29 2019-01-29 Noblis, Inc. Systems and methods for SNP analysis and genome sequencing
EP3957750A1 (en) 2013-12-20 2022-02-23 Illumina, Inc. Preserving genomic connectivity information in fragmented genomic dna samples
CA2937411C (en) 2014-01-22 2023-09-26 Oxford Nanopore Technologies Limited Method for attaching one or more polynucleotide binding proteins to a target polynucleotide
US9670530B2 (en) 2014-01-30 2017-06-06 Illumina, Inc. Haplotype resolved genome sequencing
WO2015157567A1 (en) 2014-04-10 2015-10-15 10X Genomics, Inc. Fluidic devices, systems, and methods for encapsulating and partitioning reagents, and applications of same
US10443097B2 (en) 2014-05-02 2019-10-15 Oxford Nanopore Technologies Ltd. Method of improving the movement of a target polynucleotide with respect to a transmembrane pore
CA3172086A1 (en) 2014-06-13 2015-12-17 Illumina Cambridge Limited Methods and compositions for preparing sequencing libraries
EP4053292A1 (en) 2014-06-26 2022-09-07 10X Genomics, Inc. Methods of analyzing nucleic acids from individual cells or cell populations
DK3161152T3 (en) 2014-06-30 2019-03-25 Illumina Inc Methods and compositions using one-sided transposition
CN107075560B (zh) * 2014-10-14 2021-01-26 深圳华大智造科技股份有限公司 一种核酸的转座酶打断一站式处理方法及试剂
DK3207134T3 (da) * 2014-10-17 2019-09-23 Illumina Cambridge Ltd Kontiguitetsbevarende transposition
BR112017007912A2 (pt) 2014-10-17 2018-01-23 Illumina Cambridge Limited transposon de preservação de contiguidade
CN114807307A (zh) 2014-10-29 2022-07-29 10X 基因组学有限公司 用于靶核酸测序的方法和组合物
US9975122B2 (en) 2014-11-05 2018-05-22 10X Genomics, Inc. Instrument systems for integrated sample processing
US10900065B2 (en) 2014-11-14 2021-01-26 University Of Washington Methods and kits for labeling cellular molecules
EP3227461A1 (en) * 2014-12-05 2017-10-11 Amyris, Inc. High-throughput sequencing of polynucleotides
EP3235010A4 (en) 2014-12-18 2018-08-29 Agilome, Inc. Chemically-sensitive field effect transistor
US9857328B2 (en) 2014-12-18 2018-01-02 Agilome, Inc. Chemically-sensitive field effect transistors, systems and methods for manufacturing and using the same
US9859394B2 (en) 2014-12-18 2018-01-02 Agilome, Inc. Graphene FET devices, systems, and methods of using the same for sequencing nucleic acids
US9618474B2 (en) 2014-12-18 2017-04-11 Edico Genome, Inc. Graphene FET devices, systems, and methods of using the same for sequencing nucleic acids
US10020300B2 (en) 2014-12-18 2018-07-10 Agilome, Inc. Graphene FET devices, systems, and methods of using the same for sequencing nucleic acids
US10006910B2 (en) 2014-12-18 2018-06-26 Agilome, Inc. Chemically-sensitive field effect transistors, systems, and methods for manufacturing and using the same
BR112017014902A2 (pt) 2015-01-12 2018-03-13 10X Genomics Inc processos e sistemas para a preparação de bibliotecas de sequenciamento de ácido nucleico e bibliotecas preparadas usando os mesmos
KR20200020997A (ko) 2015-02-10 2020-02-26 일루미나, 인코포레이티드 세포 성분을 분석하기 위한 방법 및 조성물
WO2016137973A1 (en) 2015-02-24 2016-09-01 10X Genomics Inc Partition processing methods and systems
US11274343B2 (en) 2015-02-24 2022-03-15 10X Genomics, Inc. Methods and compositions for targeted nucleic acid sequence coverage
EP3277840A1 (en) * 2015-04-02 2018-02-07 The Jackson Laboratory Method for detecting genomic variations using circularised mate-pair library and shotgun sequencing
US10844428B2 (en) 2015-04-28 2020-11-24 Illumina, Inc. Error suppression in sequenced DNA fragments using redundant reads with unique molecular indices (UMIS)
WO2017004083A1 (en) * 2015-06-29 2017-01-05 The Regents Of The University Of California Methods of producing nucleic acid libraries and compositions and kits for practicing same
CN115369161A (zh) 2015-12-04 2022-11-22 10X 基因组学有限公司 用于核酸分析的方法和组合物
ES2911421T3 (es) * 2015-12-08 2022-05-19 Twinstrand Biosciences Inc Adaptadores, métodos y composiciones mejorados para secuenciación dúplex
EP3402883A4 (en) * 2016-01-12 2019-09-18 Seqwell, Inc. COMPOSITIONS AND METHODS FOR NUCLEIC ACID SEQUENCING
CN108474026A (zh) * 2016-01-29 2018-08-31 豪夫迈·罗氏有限公司 用于核酸测序的新的衔接子和使用方法
US10508305B2 (en) * 2016-02-28 2019-12-17 Damoun Nashtaali DNA sequencing and processing
EP4015531A3 (en) 2016-03-02 2022-09-28 Oxford Nanopore Technologies PLC Mutant pore
US20170283864A1 (en) 2016-03-31 2017-10-05 Agilent Technologies, Inc. Use of transposase and y adapters to fragment and tag dna
AU2017246690B2 (en) 2016-04-06 2022-03-24 Oxford Nanopore Technologies Plc Mutant pore
WO2017197338A1 (en) 2016-05-13 2017-11-16 10X Genomics, Inc. Microfluidic systems and methods of use
EP3459115A4 (en) 2016-05-16 2020-04-08 Agilome, Inc. GRAPHEN-FET DEVICES, SYSTEMS AND METHODS FOR USE THEREOF FOR SEQUENCING NUCLEIC ACIDS
CN110643680B (zh) * 2016-05-27 2023-05-26 深圳市海普洛斯生物科技有限公司 适用于超微量dna测序的接头及其应用
EP3488002B1 (en) 2016-07-22 2021-03-31 Oregon Health & Science University Single cell whole genome libraries and combinatorial indexing methods of making thereof
AU2017313718B2 (en) 2016-08-15 2023-09-14 Pacific Biosciences Of California, Inc. Method and system for sequencing nucleic acids
WO2018057779A1 (en) * 2016-09-23 2018-03-29 Jianbiao Zheng Compositions of synthetic transposons and methods of use thereof
US11021738B2 (en) * 2016-12-19 2021-06-01 Bio-Rad Laboratories, Inc. Droplet tagging contiguity preserved tagmented DNA
US10550429B2 (en) 2016-12-22 2020-02-04 10X Genomics, Inc. Methods and systems for processing polynucleotides
US10815525B2 (en) 2016-12-22 2020-10-27 10X Genomics, Inc. Methods and systems for processing polynucleotides
US10011872B1 (en) 2016-12-22 2018-07-03 10X Genomics, Inc. Methods and systems for processing polynucleotides
EP3565907B1 (en) * 2017-01-06 2022-05-04 Editas Medicine, Inc. Methods of assessing nuclease cleavage
JP7051900B2 (ja) 2017-01-18 2022-04-11 イルミナ インコーポレイテッド 不均一分子長を有するユニーク分子インデックスセットの生成およびエラー補正のための方法およびシステム
EP4029939B1 (en) 2017-01-30 2023-06-28 10X Genomics, Inc. Methods and systems for droplet-based single cell barcoding
KR20230165372A (ko) 2017-02-21 2023-12-05 일루미나, 인코포레이티드 링커를 갖는 고정된 트랜스포좀을 사용한 태그먼트화
WO2018175258A1 (en) 2017-03-20 2018-09-27 Illumina, Inc. Methods and compositions for preparing nuclelic acid libraries
US10161003B2 (en) 2017-04-25 2018-12-25 Omniome, Inc. Methods and apparatus that increase sequencing-by-binding efficiency
WO2018200884A1 (en) * 2017-04-26 2018-11-01 The Broad Institute, Inc. Methods for linking polynucleotides
JP2020522243A (ja) * 2017-05-23 2020-07-30 プレジデント アンド フェローズ オブ ハーバード カレッジ 核酸のマルチプレックス末端タギング増幅
US20180340169A1 (en) 2017-05-26 2018-11-29 10X Genomics, Inc. Single cell analysis of transposase accessible chromatin
SG11201901822QA (en) 2017-05-26 2019-03-28 10X Genomics Inc Single cell analysis of transposase accessible chromatin
EP4273156A3 (en) 2017-06-30 2024-01-17 Vib Vzw Novel protein pores
SG11201911869XA (en) 2017-08-01 2020-01-30 Illumina Inc Spatial indexing of genetic material and library preparation using hydrogel beads and flow cells
US11447818B2 (en) 2017-09-15 2022-09-20 Illumina, Inc. Universal short adapters with variable length non-random unique molecular identifiers
WO2019084043A1 (en) 2017-10-26 2019-05-02 10X Genomics, Inc. METHODS AND SYSTEMS FOR NUCLEIC ACID PREPARATION AND CHROMATIN ANALYSIS
US10907205B2 (en) 2017-11-02 2021-02-02 Bio-Rad Laboratories, Inc. Transposase-based genomic analysis
SG11202003885UA (en) 2017-11-08 2020-05-28 Twinstrand Biosciences Inc Reagents and adapters for nucleic acid sequencing and methods for making such reagents and adapters
CN111051523B (zh) 2017-11-15 2024-03-19 10X基因组学有限公司 功能化凝胶珠
US10829815B2 (en) 2017-11-17 2020-11-10 10X Genomics, Inc. Methods and systems for associating physical and genetic properties of biological particles
EP3752832A1 (en) 2018-02-12 2020-12-23 10X Genomics, Inc. Methods characterizing multiple analytes from individual cells or cell populations
SG11202009889VA (en) 2018-04-06 2020-11-27 10X Genomics Inc Systems and methods for quality control in single cell processing
WO2019217785A1 (en) * 2018-05-10 2019-11-14 St. Jude Children's Research Hospital, Inc. High-throughput method for characterizing the genome-wide activity of editing nucleases in vitro
KR102640255B1 (ko) 2018-05-17 2024-02-27 일루미나, 인코포레이티드 감소된 증폭 편향을 갖는 고속-대량 단일 세포 서열분석
US11932899B2 (en) 2018-06-07 2024-03-19 10X Genomics, Inc. Methods and systems for characterizing nucleic acid molecules
US20210222163A1 (en) * 2018-07-11 2021-07-22 X Gen Us Co. Transposome enabled dna/rna-sequencing (ted rna-seq)
BR112021000409A2 (pt) 2018-07-12 2021-04-06 Twinstrand Biosciences, Inc. Métodos e reagentes para caracterizar edição genômica, expansão clonal e aplicações associadas
NL2022043B1 (en) 2018-11-21 2020-06-03 Akershus Univ Hf Tagmentation-Associated Multiplex PCR Enrichment Sequencing
US11845983B1 (en) 2019-01-09 2023-12-19 10X Genomics, Inc. Methods and systems for multiplexing of droplet based assays
CN112739459A (zh) 2019-02-04 2021-04-30 伊鲁米纳公司 微流体液滴发生器
SG11202108788TA (en) 2019-02-12 2021-09-29 10X Genomics Inc Methods for processing nucleic acid molecules
US11467153B2 (en) 2019-02-12 2022-10-11 10X Genomics, Inc. Methods for processing nucleic acid molecules
JP2022530584A (ja) 2019-04-29 2022-06-30 イルミナ インコーポレイティッド 迅速なインキュベーション及び核酸富化による微生物試料の同定及び分析
US20220127596A1 (en) 2019-07-12 2022-04-28 lllumina Cambridge Limited Nucleic Acid Library Preparation Using Electrophoresis
US11377655B2 (en) 2019-07-16 2022-07-05 Pacific Biosciences Of California, Inc. Synthetic nucleic acids having non-natural structures
IL294909A (en) 2020-02-13 2022-09-01 Zymergen Inc A metagenomic library and natural product discovery platform
JP2024522025A (ja) 2021-04-29 2024-06-10 イルミナ インコーポレイテッド 核酸特性評価のための増幅手法
WO2023204594A1 (ko) * 2022-04-19 2023-10-26 서울대학교산학협력단 태그멘테이션을 이용한 벡터 삽입위치 검출 및 클론 정량 방법

Family Cites Families (147)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US742767A (en) 1903-08-21 1903-10-27 Carl E Wenzel Detonating toy.
US4469863A (en) 1980-11-12 1984-09-04 Ts O Paul O P Nonionic nucleic acid alkyl and aryl phosphonates and processes for manufacture and use thereof
US5235033A (en) 1985-03-15 1993-08-10 Anti-Gene Development Group Alpha-morpholino ribonucleoside derivatives and polymers thereof
US5034506A (en) 1985-03-15 1991-07-23 Anti-Gene Development Group Uncharged morpholino-based polymers having achiral intersubunit linkages
AU622426B2 (en) 1987-12-11 1992-04-09 Abbott Laboratories Assay using template-dependent nucleic acid probe reorganization
GB8810400D0 (en) 1988-05-03 1988-06-08 Southern E Analysing polynucleotide sequences
CA1341584C (en) 1988-04-06 2008-11-18 Bruce Wallace Method of amplifying and detecting nucleic acid sequences
WO1989009835A1 (en) 1988-04-08 1989-10-19 The Salk Institute For Biological Studies Ligase-based amplification method
US5216141A (en) 1988-06-06 1993-06-01 Benner Steven A Oligonucleotide analogs containing sulfur linkages
US5130238A (en) 1988-06-24 1992-07-14 Cangene Corporation Enhanced nucleic acid amplification process
ATE144556T1 (de) 1988-06-24 1996-11-15 Amgen Inc Verfahren und mittel zum nachweis von nukleinsäuresequenzen
EP0425563B1 (en) 1988-07-20 1996-05-15 David Segev Process for amplifying and detecting nucleic acid sequences
US5185243A (en) 1988-08-25 1993-02-09 Syntex (U.S.A.) Inc. Method for detection of specific nucleic acid sequences
EP0450060A1 (en) 1989-10-26 1991-10-09 Sri International Dna sequencing
US5573907A (en) 1990-01-26 1996-11-12 Abbott Laboratories Detecting and amplifying target nucleic acids using exonucleolytic activity
CA2035010C (en) 1990-01-26 1996-12-10 Keith C. Backman Method of amplifying target nucleic acids applicable to both polymerase and ligase chain reactions
US5223414A (en) 1990-05-07 1993-06-29 Sri International Process for nucleic acid hybridization and amplification
US5602240A (en) 1990-07-27 1997-02-11 Ciba Geigy Ag. Backbone modified oligonucleotide analogs
US5386023A (en) 1990-07-27 1995-01-31 Isis Pharmaceuticals Backbone modified oligonucleotide analogs and preparation thereof through reductive coupling
US5432272A (en) 1990-10-09 1995-07-11 Benner; Steven A. Method for incorporating into a DNA or RNA oligonucleotide using nucleotides bearing heterocyclic bases
US5455166A (en) 1991-01-31 1995-10-03 Becton, Dickinson And Company Strand displacement amplification
US5644048A (en) 1992-01-10 1997-07-01 Isis Pharmaceuticals, Inc. Process for preparing phosphorothioate oligonucleotides
DE69531542T2 (de) 1994-02-07 2004-06-24 Beckman Coulter, Inc., Fullerton Ligase/polymerase-vermittelte analyse genetischer elemente von einzelnukleotid-polymorphismen und ihre verwendung in der genetischen analyse
US5637684A (en) 1994-02-23 1997-06-10 Isis Pharmaceuticals, Inc. Phosphoramidate and phosphorothioamidate oligomeric compounds
US5677170A (en) 1994-03-02 1997-10-14 The Johns Hopkins University In vitro transposition of artificial transposons
WO1995025180A1 (en) 1994-03-16 1995-09-21 Gen-Probe Incorporated Isothermal strand displacement nucleic acid amplification
US5552278A (en) 1994-04-04 1996-09-03 Spectragen, Inc. DNA sequencing by stepwise ligation and cleavage
US5641658A (en) 1994-08-03 1997-06-24 Mosaic Technologies, Inc. Method for performing amplification of nucleic acid with two primers bound to a single solid support
US5846719A (en) 1994-10-13 1998-12-08 Lynx Therapeutics, Inc. Oligonucleotide tags for sorting and identification
EP1285960A3 (en) 1994-12-09 2003-05-07 Imperial College Innovations Limited Virulence genes from Salmonella typhimurium
US5750341A (en) 1995-04-17 1998-05-12 Lynx Therapeutics, Inc. DNA sequencing by parallel oligonucleotide extensions
US5965443A (en) 1996-09-09 1999-10-12 Wisconsin Alumni Research Foundation System for in vitro transposition
US5925545A (en) 1996-09-09 1999-07-20 Wisconsin Alumni Research Foundation System for in vitro transposition
GB9620209D0 (en) 1996-09-27 1996-11-13 Cemu Bioteknik Ab Method of sequencing DNA
US5858671A (en) 1996-11-01 1999-01-12 The University Of Iowa Research Foundation Iterative and regenerative DNA sequencing method
GB9626815D0 (en) 1996-12-23 1997-02-12 Cemu Bioteknik Ab Method of sequencing DNA
EP1498494A3 (en) 1997-04-01 2007-06-20 Solexa Ltd. Method of nucleic acid sequencing
EP2327797B1 (en) 1997-04-01 2015-11-25 Illumina Cambridge Limited Method of nucleic acid sequencing
US6969488B2 (en) 1998-05-22 2005-11-29 Solexa, Inc. System and apparatus for sequential processing of analytes
FI103809B (fi) 1997-07-14 1999-09-30 Finnzymes Oy In vitro -menetelmä templaattien tuottamiseksi DNA-sekventointia varten
AR021833A1 (es) 1998-09-30 2002-08-07 Applied Research Systems Metodos de amplificacion y secuenciacion de acido nucleico
CA2256128A1 (en) 1998-12-29 2000-06-29 Stephen William Davies Coded dna processing
US20010046669A1 (en) 1999-02-24 2001-11-29 Mccobmie William R. Genetically filtered shotgun sequencing of complex eukaryotic genomes
US20050191698A1 (en) 1999-04-20 2005-09-01 Illumina, Inc. Nucleic acid sequencing using microsphere arrays
US6355431B1 (en) 1999-04-20 2002-03-12 Illumina, Inc. Detection of nucleic acid amplification reactions using bead arrays
US6274320B1 (en) 1999-09-16 2001-08-14 Curagen Corporation Method of sequencing a nucleic acid
US7244559B2 (en) 1999-09-16 2007-07-17 454 Life Sciences Corporation Method of sequencing a nucleic acid
WO2001034790A1 (fr) 1999-11-08 2001-05-17 Eiken Kagaku Kabushiki Kaisha Procede de synthese d'un acide nucleique
US7955794B2 (en) 2000-09-21 2011-06-07 Illumina, Inc. Multiplex nucleic acid reactions
US7582420B2 (en) 2001-07-12 2009-09-01 Illumina, Inc. Multiplex nucleic acid reactions
US7611869B2 (en) 2000-02-07 2009-11-03 Illumina, Inc. Multiplexed methylation detection methods
US7001792B2 (en) 2000-04-24 2006-02-21 Eagle Research & Development, Llc Ultra-fast nucleic acid sequencing device and a method for making and using the same
US6917726B2 (en) 2001-09-27 2005-07-12 Cornell Research Foundation, Inc. Zero-mode clad waveguides for performing spectroscopy with confined effective observation volumes
US6828098B2 (en) 2000-05-20 2004-12-07 The Regents Of The University Of Michigan Method of producing a DNA library using positional amplification based on the use of adaptors and nick translation
EP2100971A3 (en) 2000-07-07 2009-11-25 Visigen Biotechnologies, Inc. Real-time sequence determination
US7211414B2 (en) 2000-12-01 2007-05-01 Visigen Biotechnologies, Inc. Enzymatic nucleic acid synthesis: compositions and methods for altering monomer incorporation fidelity
AR031640A1 (es) 2000-12-08 2003-09-24 Applied Research Systems Amplificacion isotermica de acidos nucleicos en un soporte solido
US20040110191A1 (en) 2001-01-31 2004-06-10 Winkler Matthew M. Comparative analysis of nucleic acids using population tagging
US7138267B1 (en) 2001-04-04 2006-11-21 Epicentre Technologies Corporation Methods and compositions for amplifying DNA clone copy number
US6777187B2 (en) 2001-05-02 2004-08-17 Rubicon Genomics, Inc. Genome walking by selective amplification of nick-translate DNA library and amplification from complex mixtures of templates
GB0115194D0 (en) 2001-06-21 2001-08-15 Leuven K U Res & Dev Novel technology for genetic mapping
US7057026B2 (en) 2001-12-04 2006-06-06 Solexa Limited Labelled nucleotides
US7399590B2 (en) 2002-02-21 2008-07-15 Asm Scientific, Inc. Recombinase polymerase amplification
US20040002090A1 (en) 2002-03-05 2004-01-01 Pascal Mayer Methods for detecting genome-wide sequence variations associated with a phenotype
US7414116B2 (en) 2002-08-23 2008-08-19 Illumina Cambridge Limited Labelled nucleotides
SI3587433T1 (sl) 2002-08-23 2020-08-31 Illumina Cambridge Limited Modificirani nukleotidi
US7595883B1 (en) 2002-09-16 2009-09-29 The Board Of Trustees Of The Leland Stanford Junior University Biological analysis arrangement and approach therefor
AU2003277984A1 (en) 2002-11-05 2004-06-07 The University Of Queensland Nucleotide sequence analysis by quantification of mutagenesis
US7575865B2 (en) 2003-01-29 2009-08-18 454 Life Sciences Corporation Methods of amplifying and sequencing nucleic acids
DE602004031284D1 (de) 2003-02-10 2011-03-17 Max Delbrueck Centrum Transposon-system zur gezielten integration
WO2005003304A2 (en) 2003-06-20 2005-01-13 Illumina, Inc. Methods and compositions for whole genome amplification and genotyping
WO2005010200A2 (en) 2003-07-15 2005-02-03 Bioarray Solutions, Ltd. Concurrent optimization in selection of primer and capture probe sets for nucleic acid analysis
GB0321306D0 (en) 2003-09-11 2003-10-15 Solexa Ltd Modified polymerases for improved incorporation of nucleotide analogues
EP1682680B2 (en) 2003-10-31 2018-03-21 AB Advanced Genetic Analysis Corporation Methods for producing a paired tag from a nucleic acid sequence and methods of use thereof
WO2005065814A1 (en) 2004-01-07 2005-07-21 Solexa Limited Modified molecular arrays
US7595160B2 (en) 2004-01-13 2009-09-29 U.S. Genomics, Inc. Analyte detection using barcoded polymers
US7727744B2 (en) 2004-03-30 2010-06-01 Epicentre Technologies Corporation Methods for obtaining directionally truncated polypeptides
WO2006047183A2 (en) 2004-10-21 2006-05-04 New England Biolabs, Inc. Recombinant dna nicking endonuclease and uses thereof
US7319142B1 (en) 2004-08-31 2008-01-15 Monsanto Technology Llc Nucleotide and amino acid sequences from Xenorhabdus and uses thereof
CN101914620B (zh) 2004-09-17 2014-02-12 加利福尼亚太平洋生命科学公司 核酸测序的方法
US7170050B2 (en) 2004-09-17 2007-01-30 Pacific Biosciences Of California, Inc. Apparatus and methods for optical analysis of molecules
WO2006064199A1 (en) 2004-12-13 2006-06-22 Solexa Limited Improved method of nucleotide detection
US7393665B2 (en) * 2005-02-10 2008-07-01 Population Genetics Technologies Ltd Methods and compositions for tagging and identifying polynucleotides
US7449297B2 (en) 2005-04-14 2008-11-11 Euclid Diagnostics Llc Methods of copying the methylation pattern of DNA during isothermal amplification and microarrays
JP4990886B2 (ja) 2005-05-10 2012-08-01 ソレックサ リミテッド 改良ポリメラーゼ
US7601499B2 (en) 2005-06-06 2009-10-13 454 Life Sciences Corporation Paired end sequencing
DK1907583T4 (da) 2005-06-15 2020-01-27 Complete Genomics Inc Enkeltmolekyle-arrays til genetisk og kemisk analyse
GB0514936D0 (en) 2005-07-20 2005-08-24 Solexa Ltd Preparation of templates for nucleic acid sequencing
US7405281B2 (en) 2005-09-29 2008-07-29 Pacific Biosciences Of California, Inc. Fluorescent nucleotide analogs and uses therefor
GB0522310D0 (en) 2005-11-01 2005-12-07 Solexa Ltd Methods of preparing libraries of template polynucleotides
US20070128610A1 (en) 2005-12-02 2007-06-07 Buzby Philip R Sample preparation method and apparatus for nucleic acid sequencing
US7537897B2 (en) 2006-01-23 2009-05-26 Population Genetics Technologies, Ltd. Molecular counting
US20080009420A1 (en) 2006-03-17 2008-01-10 Schroth Gary P Isothermal methods for creating clonal single molecule arrays
WO2007123744A2 (en) 2006-03-31 2007-11-01 Solexa, Inc. Systems and devices for sequence by synthesis analysis
US20100022403A1 (en) 2006-06-30 2010-01-28 Nurith Kurn Methods for fragmentation and labeling of nucleic acids
US7754429B2 (en) 2006-10-06 2010-07-13 Illumina Cambridge Limited Method for pair-wise sequencing a plurity of target polynucleotides
US8343746B2 (en) 2006-10-23 2013-01-01 Pacific Biosciences Of California, Inc. Polymerase enzymes and reagents for enhanced nucleic acid sequencing
US20090088331A1 (en) 2006-11-07 2009-04-02 Government Of The United States Of America, As Represented By The Secretary, Dept. Of Health And Influenza virus nucleic acid microarray and method of use
US20080242560A1 (en) 2006-11-21 2008-10-02 Gunderson Kevin L Methods for generating amplified nucleic acid arrays
EP2092322B1 (en) 2006-12-14 2016-02-17 Life Technologies Corporation Methods and apparatus for measuring analytes using large scale fet arrays
US8262900B2 (en) 2006-12-14 2012-09-11 Life Technologies Corporation Methods and apparatus for measuring analytes using large scale FET arrays
US8349167B2 (en) 2006-12-14 2013-01-08 Life Technologies Corporation Methods and apparatus for detecting molecular interactions using FET arrays
CA2675895C (en) 2007-01-19 2016-03-22 Epigenomics Ag Methods and nucleic acids for analyses of cell proliferative disorders
JP2010533840A (ja) 2007-07-13 2010-10-28 ザ ボード オブ トラスティーズ オブ ザ リランド スタンフォード ジュニア ユニヴァーシティ 改善された生物学的アッセイのための電場を用いる方法および器具
EP2188389A4 (en) 2007-08-15 2011-12-07 Univ Hong Kong METHOD AND COMPOSITIONS FOR BISULFIT DNA SEQUENCING WITH HIGH PERFORMANCE AND BENEFITS
US8415099B2 (en) 2007-11-05 2013-04-09 Complete Genomics, Inc. Efficient base determination in sequencing reactions
US8852864B2 (en) 2008-01-17 2014-10-07 Sequenom Inc. Methods and compositions for the analysis of nucleic acids
EP3150727B1 (en) 2008-04-30 2019-07-10 Integrated DNA Technologies Inc. Rnase-h-based assays utilizing modified rna monomers
CA2729159C (en) 2008-06-30 2020-01-14 Bionanomatrix, Inc. Methods and devices for single-molecule whole genome analysis
US8383345B2 (en) 2008-09-12 2013-02-26 University Of Washington Sequence tag directed subassembly of short sequencing reads into long sequencing reads
US20100137143A1 (en) 2008-10-22 2010-06-03 Ion Torrent Systems Incorporated Methods and apparatus for measuring analytes
US9080211B2 (en) 2008-10-24 2015-07-14 Epicentre Technologies Corporation Transposon end compositions and methods for modifying nucleic acids
EP3272879B1 (en) 2008-10-24 2019-08-07 Epicentre Technologies Corporation Transposon end compositions and methods for modifying nucleic acids
SG171421A1 (en) 2008-11-26 2011-07-28 Illumina Inc Methods and systems for analysis of sequencing data
US20100323348A1 (en) 2009-01-31 2010-12-23 The Regents Of The University Of Colorado, A Body Corporate Methods and Compositions for Using Error-Detecting and/or Error-Correcting Barcodes in Nucleic Acid Amplification Process
WO2010099301A2 (en) 2009-02-25 2010-09-02 The Johns Hopkins University Piggybac transposon variants and methods of use
WO2010115122A2 (en) 2009-04-03 2010-10-07 Illumina, Inc. Generation of uniform fragments of nucleic acids using patterned substrates
JP5882234B2 (ja) * 2010-02-25 2016-03-09 アドバンスト リキッド ロジック インコーポレイテッドAdvanced Liquid Logic, Inc. 核酸ライブラリーの作製方法
KR20130101031A (ko) 2010-08-27 2013-09-12 제넨테크, 인크. 핵산 포획 및 서열분석을 위한 방법
US9029103B2 (en) 2010-08-27 2015-05-12 Illumina Cambridge Limited Methods for sequencing polynucleotides
ES2731460T3 (es) 2010-10-08 2019-11-15 Harvard College Alto rendimiento de células individuales con código de barra
EP3928867A1 (en) 2010-10-27 2021-12-29 Illumina, Inc. Microdevices and biosensor cartridges for biological or chemical analysis and systems and methods for the same
US8829171B2 (en) 2011-02-10 2014-09-09 Illumina, Inc. Linking sequence reads using paired code tags
US9074251B2 (en) 2011-02-10 2015-07-07 Illumina, Inc. Linking sequence reads using paired code tags
CA2821299C (en) 2010-11-05 2019-02-12 Frank J. Steemers Linking sequence reads using paired code tags
US8951781B2 (en) 2011-01-10 2015-02-10 Illumina, Inc. Systems, methods, and apparatuses to image a sample for biological or chemical analysis
CA2821559C (en) * 2011-01-28 2017-01-31 Illumina, Inc. Oligonucleotide replacement for di-tagged and directional libraries
EP2670894B1 (en) 2011-02-02 2017-11-29 University Of Washington Through Its Center For Commercialization Massively parallel continguity mapping
WO2012108864A1 (en) 2011-02-08 2012-08-16 Illumina, Inc. Selective enrichment of nucleic acids
EP3789498A1 (en) * 2011-04-25 2021-03-10 Bio-rad Laboratories, Inc. Methods for nucleic acid analysis
US20120283108A1 (en) * 2011-05-03 2012-11-08 Sampas Nicholas M Method for phased genotyping of a diploid genome
WO2012162267A2 (en) * 2011-05-20 2012-11-29 Fluidigm Corporation Nucleic acid encoding reactions
US20130017978A1 (en) 2011-07-11 2013-01-17 Finnzymes Oy Methods and transposon nucleic acids for generating a dna library
NO2694769T3 (es) 2012-03-06 2018-03-03
CA2874343C (en) * 2012-05-21 2021-11-09 Fluidigm Corporation Single-particle analysis of particle populations
AU2013266394B2 (en) 2012-05-21 2019-03-14 The Scripps Research Institute Methods of sample preparation
US9012022B2 (en) 2012-06-08 2015-04-21 Illumina, Inc. Polymer coatings
US8895249B2 (en) 2012-06-15 2014-11-25 Illumina, Inc. Kinetic exclusion amplification of nucleic acid libraries
US9644199B2 (en) 2012-10-01 2017-05-09 Agilent Technologies, Inc. Immobilized transposase complexes for DNA fragmentation and tagging
US9683230B2 (en) 2013-01-09 2017-06-20 Illumina Cambridge Limited Sample preparation on a solid support
CA2900543C (en) 2013-02-08 2023-01-31 10X Genomics, Inc. Partitioning and processing of analytes and other species
JP6222639B2 (ja) 2013-03-07 2017-11-01 積水メディカル株式会社 メチル化dnaの検出方法
ES2887177T3 (es) 2013-03-13 2021-12-22 Illumina Inc Método de preparación de una biblioteca de secuenciación de ácidos nucleicos
AU2014268710B2 (en) * 2013-05-23 2018-10-18 The Board Of Trustees Of The Leland Stanford Junior University Transposition into native chromatin for personal epigenomics
GB2546833B (en) 2013-08-28 2018-04-18 Cellular Res Inc Microwell for single cell analysis comprising single cell and single bead oligonucleotide capture labels
SG11201605344YA (en) 2013-12-30 2016-07-28 Atreca Inc Analysis of nucleic acids associated with single cells using nucleic acid barcodes
BR112017007912A2 (pt) 2014-10-17 2018-01-23 Illumina Cambridge Limited transposon de preservação de contiguidade

Also Published As

Publication number Publication date
EP3919617A1 (en) 2021-12-08
DK3553175T3 (da) 2021-08-23
US20230183680A1 (en) 2023-06-15
AU2013382098B2 (en) 2019-02-07
EP3553175A1 (en) 2019-10-16
US20200157530A1 (en) 2020-05-21
DK2970951T3 (da) 2019-05-13
AU2013382098A1 (en) 2015-08-06
US20220213470A1 (en) 2022-07-07
US10557133B2 (en) 2020-02-11
US20150368638A1 (en) 2015-12-24
CA2898456C (en) 2020-11-10
CA3094792A1 (en) 2014-09-18
EP3553175B1 (en) 2021-07-14
WO2014142850A1 (en) 2014-09-18
AU2021277737A1 (en) 2021-12-23
AU2019203198B2 (en) 2021-09-02
CA2898456A1 (en) 2014-09-18
US11319534B2 (en) 2022-05-03
HK1219503A1 (zh) 2017-04-07
ES2724824T3 (es) 2019-09-16
EP2970951B1 (en) 2019-02-20
AU2019203198A1 (en) 2019-05-30
EP2970951A1 (en) 2016-01-20

Similar Documents

Publication Publication Date Title
ES2887177T3 (es) Método de preparación de una biblioteca de secuenciación de ácidos nucleicos
US11993772B2 (en) Linking sequence reads using paired code tags
US11965158B2 (en) Methods and compositions using one-sided transposition
KR102643955B1 (ko) 근접 보존 전위
CA2821299C (en) Linking sequence reads using paired code tags
JP6366719B2 (ja) 断片化したゲノムdna試料におけるゲノム連結性情報の保存
US8829171B2 (en) Linking sequence reads using paired code tags