ES2947757T3 - Composiciones de transposasas para reducir el sesgo de inserción - Google Patents

Composiciones de transposasas para reducir el sesgo de inserción Download PDF

Info

Publication number
ES2947757T3
ES2947757T3 ES19187628T ES19187628T ES2947757T3 ES 2947757 T3 ES2947757 T3 ES 2947757T3 ES 19187628 T ES19187628 T ES 19187628T ES 19187628 T ES19187628 T ES 19187628T ES 2947757 T3 ES2947757 T3 ES 2947757T3
Authority
ES
Spain
Prior art keywords
tagmentation
transposome
nucleic acid
transposase
tagged
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
ES19187628T
Other languages
English (en)
Inventor
Christian Gloeckner
Kia Amirali
Molly He
Trina Faye Osothprarop
Frank J Steemers
Kevin L Gunderson
Sasan Amini
Jerome Jendrisak
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Illumina Inc
Original Assignee
Illumina Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Illumina Inc filed Critical Illumina Inc
Application granted granted Critical
Publication of ES2947757T3 publication Critical patent/ES2947757T3/es
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/1034Isolating an individual clone by screening libraries
    • C12N15/1065Preparation or screening of tagged libraries, e.g. tagged microorganisms by STM-mutagenesis, tagged polynucleotides, gene tags
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/1034Isolating an individual clone by screening libraries
    • C12N15/1093General methods of preparing gene libraries, not provided for in other subgroups
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/10Transferases (2.)
    • C12N9/12Transferases (2.) transferring phosphorus containing groups, e.g. kinases (2.7)
    • C12N9/1241Nucleotidyltransferases (2.7.7)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y207/00Transferases transferring phosphorus-containing groups (2.7)
    • C12Y207/07Nucleotidyltransferases (2.7.7)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2563/00Nucleic acid detection characterized by the use of physical, structural and functional properties
    • C12Q2563/185Nucleic acid dedicated to use as a hidden marker/bar code, e.g. inclusion of nucleic acids to mark art objects or animals

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Engineering & Computer Science (AREA)
  • Organic Chemistry (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Wood Science & Technology (AREA)
  • Zoology (AREA)
  • General Engineering & Computer Science (AREA)
  • Biomedical Technology (AREA)
  • Biotechnology (AREA)
  • General Health & Medical Sciences (AREA)
  • Biochemistry (AREA)
  • Molecular Biology (AREA)
  • Microbiology (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Plant Pathology (AREA)
  • Physics & Mathematics (AREA)
  • Biophysics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Medicinal Chemistry (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Non-Portable Lighting Devices Or Systems Thereof (AREA)
  • Endoscopes (AREA)
  • Fittings On The Vehicle Exterior For Carrying Loads, And Devices For Holding Or Mounting Articles (AREA)
  • Enzymes And Modification Thereof (AREA)
  • Infusion, Injection, And Reservoir Apparatuses (AREA)
  • Fuel-Injection Apparatus (AREA)
  • Mechanical Coupling Of Light Guides (AREA)

Abstract

En el presente documento se presentan métodos y composiciones para el etiquetado de ácidos nucleicos. Los métodos son útiles para generar fragmentos de ADN marcados que son cualitativa y cuantitativamente representativos de los ácidos nucleicos diana en la muestra a partir de la cual se generan. (Traducción automática con Google Translate, sin valor legal)

Description

DESCRIPCIÓN
Composiciones de transposasas para reducir el sesgo de inserción
Antecedentes
Las enzimas transposasas son útiles en sistemas de transposición in vitro. Permiten la fragmentación y el etiquetado a gran escala del ADN genómico y son útiles para crear bibliotecas de fragmentos de ADN etiquetados a partir del ADN objetivo para su uso en métodos de análisis de ácidos nucleicos, como los métodos de secuenciación y amplificación de última generación. Sigue existiendo la necesidad de composiciones de transposasa y métodos de tagmentación con propiedades mejoradas y que generen fragmentos de ADN etiquetados que sean cualitativa y cuantitativamente representativos de los ácidos nucleicos diana en la muestra a partir de la cual se generan.
Breve resumen
En el presente documento se presentan métodos y composiciones para la tagmentación de ácidos nucleicos. Las composiciones de transposasa y los métodos de tagmentación proporcionados en el presente documento tienen propiedades sorprendentemente mejoradas que incluyen, por ejemplo, generar fragmentos de ADN etiquetados que son representativos cualitativa y cuantitativamente de los ácidos nucleicos diana en la muestra a partir de la cual se generan.
Por consiguiente, se proporciona un método de la reivindicación 1. En el presente documento se analiza un método de tagmentación secuencial que comprende: (a) proporcionar un primer transposoma, comprendiendo el primer transposoma una primera enzima transposasa que tiene un primer perfil de tagmentación; (b) combinar un ácido nucleico diana con la primera enzima transposasa en condiciones adecuadas para la tagmentación, generando así un ácido nucleico tagmentado; (c) combinar el ácido nucleico marcado con un segundo transposoma en condiciones adecuadas para la tagmentación, comprendiendo el transposoma una segunda enzima transposasa que tiene un perfil de tagmentación. Convenientemente, el primer perfil de tagmentación y el segundo perfil de tagmentación son diferentes. Convenientemente, el método comprende una etapa de lavado entre las etapas (b) y (c) para separar sustancialmente el ácido nucleico tagmentado del tampón de reacción usado en el paso (b). En algunas realizaciones, el paso de lavado comprende la unión del ácido nucleico tagmentado a un soporte sólido. En algunas realizaciones, el soporte sólido comprende perlas. En algunas realizaciones, el soporte sólido comprende una columna de centrifugación. En algunas realizaciones, el primer transposoma y el segundo transposoma tienen un sesgo de inserción diferente. En algunas realizaciones, la etapa (c) comprende agregar el segundo transposoma a una mezcla de reacción que comprende el primer transposoma.
En el presente documento también se presenta un método de tagmentación que comprende: (a) proporcionar un primer transposoma, comprendiendo el primer transposoma una primera enzima transposasa que tiene un primer perfil de tagmentación; (b) proporcionar un segundo transposoma, comprendiendo el segundo transposoma una segunda enzima transposasa que tiene un segundo perfil de tagmentación; (c) combinar un ácido nucleico diana con el primer transposoma y el segundo transposoma en condiciones adecuadas para la tagmentación, generando de este modo un ácido nucleico tagmentado.
Los detalles de una o más realizaciones se exponen en los dibujos adjuntos y la siguiente descripción. Otras características, objetos y ventajas serán evidentes a partir de la descripción y los dibujos y a partir de las reivindicaciones.
Breve descripción de los dibujos
La Fig. 1 muestra un diagrama de barras del número de moléculas únicas en las bibliotecas de ADN tagmentadas con EZ-Tn5™ y EZ-Tn5™ Mos1 preparadas utilizando diferentes concentraciones de transposomas.
La Fig. 2 muestra un diagrama de barras del tamaño del inserto en las bibliotecas tagmentadas de la figura 1.
La Fig. 3 muestra un diagrama de barras del porcentaje de omisión de AT y el porcentaje de omisión de GC en las bibliotecas tagmentadas de la figura 1.
La Fig. 4 muestra una gráfica del número de moléculas únicas en las bibliotecas de ADN tagmentadas preparadas utilizando diferentes formulaciones de tampón de tagmentación.
La Fig. 5 muestra un diagrama de barras del tamaño del inserto en las bibliotecas tagmentadas de la figura 4;
La Fig. 6 muestra un diagrama de barras del porcentaje de omisión de AT y el porcentaje de omisión de GC en las bibliotecas tagmentadas de la figura 4.
La Fig. 7 muestra un diagrama de barras del número total de lecturas y la diversidad en bibliotecas tagmentadas con TS-Tn5059 Mos1 preparadas utilizando diferentes concentraciones de transposomas.
La Fig. 8 muestra un diagrama de barras del tamaño del inserto en las bibliotecas tagmentadas de la figura 7.
La Fig. 9 muestra un diagrama de barras del porcentaje de omisión de AT y el porcentaje de omisión de GC en las bibliotecas tagmentadas de la figura 7.
La Fig. 10 muestra una gráfica del número de moléculas únicas en bibliotecas de ADN tagmentadas secuencialmente con Mos1 Tn5.
La Fig. 11 muestra una gráfica del tamaño del inserto en las bibliotecas tagmentadas de la figura 10;
La Fig. 12 muestra una gráfica del porcentaje de omisión de AT y el porcentaje de omisión de GC en las bibliotecas tagmentadas de la figura 10.
La Fig. 13 muestra un diagrama de barras del número de moléculas únicas en las bibliotecas de ADN tagmentadas con Mos1 Tn5 preparadas utilizando diferentes concentraciones de transposomas; y
La Fig. 14 muestra un diagrama de barras del porcentaje de omisión de AT y el porcentaje de omisión de GC en las bibliotecas tagmentadas de la figura 13.
La Fig. 15 muestra la secuencia del transposón HyperMu™.
La Fig. 16 muestra las secuencias del transposón HyperMu™ y varios cebadores usados.
La Fig. 17 muestra el análisis de electroforesis en gel de agarosa de los productos de fragmentación del genoma de bacteriófago a concentraciones variables de transposoma HyperMu™.
La Fig. 18 muestra el análisis de electroforesis en gel de agarosa de los productos amplificados por PCR del cromosoma de E. coli marcado después de la tagmentación con el transposoma Hyper-Mu™.
La Fig. 19 muestra las estadísticas de un experimento de secuenciación del cromosoma de E. coli usando tagmentación con HyperMu™.
La Fig. 20 muestra la distribución de la longitud de los fragmentos después de la tagmentación del cromosoma de E. coli utilizando HyperMu™.
La Fig. 21 muestra la uniformidad de la cobertura de Tn5 solo, HyperMu™ solo, TruSeq solo o una combinación de HyperMu™ y Tn5.
La Fig. 22 A-D muestra el sesgo de secuencia de TruSeq, HyperMu™ y Tn5 (Nextera) y se compara con una tagmentación de referencia. El ADN utilizado en los estudios de referencia es ADN de E. coli. El % de GC se muestra en el eje x y la frecuencia se muestra en el eje y. La Fig. 22A es una comparación de la referencia con los resultados de la tagmentación utilizando 3,2 ng de HyperMu™.
La Fig. 22B es una comparación de la referencia con los resultados de la tagmentación utilizando 1 ng de Nextera (T n5) y 3,2 ng de HyperMu™. La Fig. 22C es una comparación de la referencia con el método T ruSeq. La Fig. 22D es una comparación de la referencia con el método TruSeq, tagmentación con Nextera e HyperMu™.
La Fig. 23 muestra un esquema ilustrativo de preparación de una biblioteca de secuencias mediante tagmentación secuencial utilizando transposomas HyperMu™ y Nextera.
La Fig. 24 muestra un gráfico de la fracción de cobertura normalizada en función del % de GC utilizando la tagmentación con Mos-1 seguida de la tagmentación con TsTn5059/Nextera. Los experimentos incluyen dos flujos de trabajo diferentes, uno con una etapa de limpieza entre dos pasos de tagmentación y el otro donde el tampón se ajusta por dilución entre dos etapas de tagmentación.
La Fig. 25 muestra un gráfico de la fracción de cobertura normalizada en función del % de GC utilizando la tagmentación con TsTn5059/Nextera seguida de la tagmentación con Mos-1.
La Fig. 26 muestra un gráfico de la uniformidad de cobertura utilizando diversas combinaciones de enzimas Mos-1 y TsTn5059/Nextera a varias concentraciones.
La Fig. 27 muestra un diagrama de barras del porcentaje de omisión de AT y el porcentaje de omisión de GC en las bibliotecas tagmentadas utilizando diversas combinaciones de TsTn5059/Nextera y Mos-1.
La Fig. 28 muestra un diagrama de barras que muestra la diversidad en bibliotecas tagmentadas con TS-Tn5059/Nextera Mos1 preparadas usando diferentes concentraciones de transposomas.
Descripción detallada
Las composiciones de transposasa y los métodos de tagmentación proporcionados en el presente documento tienen propiedades sorprendentemente mejoradas que incluyen, por ejemplo, generar fragmentos de ADN etiquetados que son representativos cualitativa y cuantitativamente de los ácidos nucleicos diana en la muestra a partir de la cual se generan.
Los inventores de la presente solicitud han descubierto de manera sorprendente e inesperada que el uso de dos o más transposomas que tienen dos o más perfiles de tagmentación diferentes proporciona una tagmentación más uniforme de un ADN diana. Los inventores también han descubierto que el uso de dos o más transposomas es especialmente ventajoso cuando los perfiles de tagmentación de las transposasas tienen diferentes sesgos de inserción, tales como diferentes frecuencias de omisión de AT y GC.
En un aspecto, los métodos divulgados en el presente documento incluyen tagmentación secuencial que comprende: (a) proporcionar un primer transposoma, comprendiendo el primer transposoma que comprende un primer transposón una primera enzima transposasa que tiene un primer perfil de tagmentación; (b) combinar un ácido nucleico diana con la primera enzima transposasa en condiciones adecuadas para la tagmentación, generando de este modo un primer ácido nucleico tagmentado; (c) combinar el primer ácido nucleico tagmentado con un segundo transposoma en condiciones adecuadas para la tagmentación, comprendiendo el transposoma un segundo transposón y una segunda enzima transposasa que tiene un segundo perfil de tagmentación, generando de este modo un segundo ácido nucleico tagmentado.
En algunas realizaciones, el método comprende una etapa de lavado entre las etapas (b) y (c) para separar sustancialmente el ácido nucleico tagmentado del tampón de reacción usado en el paso (b). En algunas realizaciones, el paso de lavado comprende la unión del ácido nucleico tagmentado a un soporte sólido. En algunas realizaciones, el soporte sólido comprende perlas. En algunas realizaciones, el soporte sólido comprende una columna de centrifugación. En algunas realizaciones, la etapa (c) comprende agregar el segundo transposoma a una mezcla de reacción que comprende el primer transposoma. En algunas realizaciones, una o más de las primeras transposasas se mantuvieron unidas al primer ácido nucleico tagmentado durante la combinación del segundo transposoma con el primer ácido nucleico tagmentado.
En un aspecto, en el presente documento se describen métodos de preparación de una biblioteca de secuenciación. Los métodos incluyen proporcionar un primer transposoma, comprendiendo el primer transposoma un primer transposoma y una primera enzima transposasa que tiene un primer perfil de tagmentación, en el que el primer transposoma está inmovilizado sobre un primer soporte sólido. Se combina un ácido nucleico con la primera enzima transposasa en condiciones adecuadas para la tagmentación, generando de este modo un primer ácido nucleico tagmentado. El ácido nucleico tagmentado se combina con un segundo transposoma en condiciones adecuadas para la tagmentación, comprendiendo el segundo transposoma un segundo transposón y una segunda enzima transposasa que tiene un segundo perfil de tagmentación, generando de este modo un segundo ácido nucleico tagmentado y creando una biblioteca de secuenciación.
En un aspecto, en el presente documento se describen métodos de preparación de una biblioteca de secuenciación. Los métodos incluyen proporcionar un primer transposoma, comprendiendo el primer transposoma que comprende un primer transposón una primera enzima transposasa que tiene un primer perfil de tagmentación. Un ácido nucleico diana se combina con la primera enzima transposasa en condiciones adecuadas para la tagmentación, generando de este modo un primer ácido nucleico tagmentado. El primer ácido nucleico tagmentado se combina con un segundo transposoma en condiciones adecuadas para la tagmentación, comprendiendo el segundo transposoma un segundo transposón y una segunda enzima transposasa que tiene un segundo perfil de tagmentación, en el que el segundo transposoma se inmoviliza sobre un segundo soporte sólido, generando de este modo un segundo ácido nucleico tagmentado y creando una biblioteca de secuenciación.
En un aspecto, en el presente documento se describen métodos de preparación de una biblioteca de secuenciación. Los métodos incluyen proporcionar un primer transposoma, comprendiendo el primer transposoma que comprende un primer transposón una primera enzima transposasa que tiene un primer perfil de tagmentación. Se combina un ácido nucleico con la primera enzima transposasa en condiciones adecuadas para la tagmentación, generando de este modo un primer ácido nucleico tagmentado. El primer ácido nucleico tagmentado se combina con un segundo transposoma en condiciones adecuadas para la tagmentación, comprendiendo el transposoma un segundo transposón y una segunda enzima transposasa que tiene un segundo perfil de tagmentación, creando de este modo una biblioteca de secuenciación.
En un aspecto, en el presente documento se describen métodos de preparación de una biblioteca de secuenciación. Los métodos incluyen proporcionar un primer transposoma, comprendiendo el primer transposoma que comprende un primer transposón una primera enzima transposasa que tiene un primer perfil de tagmentación. Se combina un ácido nucleico con la primera enzima transposasa en condiciones adecuadas para la tagmentación, generando de este modo un primer ácido nucleico tagmentado. El primer ácido nucleico tagmentado se separa sustancialmente del tampón de reacción utilizado para la primera reacción de tagmentación. El primer ácido nucleico tagmentado se combina a continuación con un segundo transposoma en condiciones adecuadas para la tagmentación, comprendiendo el segundo transposoma un segundo transposón y una segunda enzima transposasa que tiene un segundo perfil de tagmentación, generando de este modo un segundo ácido nucleico tagmentado. El segundo ácido nucleico tagmentado, generando de este modo una biblioteca de secuenciación. En algunas realizaciones, el primer conjunto de ácidos nucleicos tagmentados se amplifica opcionalmente.
En otro aspecto, los métodos divulgados en el presente documento incluyen tagmentación, que comprende: (a) proporcionar un primer transposoma, comprendiendo el primer transposoma que comprende un primer transposón una primera enzima transposasa que tiene un primer perfil de tagmentación; (b) proporcionar un segundo transposoma, comprendiendo el segundo transposoma un segundo transposón y una segunda enzima transposasa que tiene un segundo perfil de tagmentación; (c) combinar un ácido nucleico diana con el primer transposoma y el segundo transposoma en condiciones adecuadas para la tagmentación, generando de este modo un ácido nucleico tagmentado. En algunas realizaciones, los transposomas primero y segundo se añaden simultáneamente.
En algunas realizaciones, el primer transposón del primer transposoma comprende un primer adaptador y el segundo transposón del segundo transposoma comprende un segundo adaptador. En algunas realizaciones, el primer y el segundo adaptador son diferentes. En algunas realizaciones, el primer y el segundo adaptador comprenden una secuencia seleccionada entre el grupo que consiste en códigos de barras, secuencias de unión a cebador, sitios de endonucleasa de restricción e índices moleculares únicos.
En algunas realizaciones, el primer, segundo, o ambos transposomas, se inmovilizan sobre un segundo soporte sólido. Algunos soportes sólidos ilustrativos incluyen, pero sin limitación, perlas, superficies de celda de flujo, columnas de centrifugación y matrices de columna. En algunas realizaciones, la primera superficie y la segunda superficie son diferentes. En algunas realizaciones, el primer y el segundo soporte sólido son perlas. En algunas realizaciones, los primeros transposomas se inmovilizan sobre un soporte sólido. En algunas realizaciones, los primeros transposomas inmovilizados sobre un soporte sólido se mantienen unidos al ácido nucleico diana tagmentado y los primeros ácidos nucleicos tagmentados se separan de la solución utilizando el soporte sólido (por ejemplo, perlas de estreptavidina, perlas magnéticas, etc.).
En algunas realizaciones de los aspectos anteriores, el primer ácido nucleico tagmentado se amplifica antes de ponerlo en contacto con el segundo transposoma. En algunas realizaciones de los aspectos anteriores, se amplifica el segundo ácido nucleico tagmentado. En algunas realizaciones, se llevan a cabo dos conjuntos de secuenciación. En el primer conjunto de secuenciación, se amplifica el primer ácido nucleico tagmentado. En el segundo conjunto de amplificación, se amplifica adicionalmente el segundo ácido nucleico tagmentado.
En algunas realizaciones, el primer perfil de tagmentación y el segundo perfil de tagmentación son diferentes. En algunas realizaciones, la primera transposasa y la segunda transposasa tienen un sesgo de inserción diferente. En algunas realizaciones, los perfiles de tagmentación primero y segundo tienen diferentes frecuencias de omisión de AT. En algunas realizaciones, los perfiles de tagmentación primero y segundo tienen diferentes frecuencias de omisión de GC. En algunas realizaciones, el primer perfil de tagmentación tiene una mayor frecuencia de omisión de GC en comparación con el segundo perfil de tagmentación. En algunas realizaciones, la primera transposasa tiene un mayor sesgo de inserción hacia una región rica en AT en comparación con la segunda transposasa. En algunas realizaciones, el segundo perfil de tagmentación tiene una mayor frecuencia de omisión de AT en comparación con el primer perfil de tagmentación. En algunas realizaciones, la segunda transposasa tiene un mayor sesgo de inserción hacia una región rica en GC en comparación con la primera transposasa.
En algunas realizaciones, el primer perfil de tagmentación tiene una mayor frecuencia de omisión de AT en comparación con el segundo perfil de tagmentación. En algunas realizaciones, la primera transposasa tiene un mayor sesgo de inserción hacia una región rica en GC en comparación con la segunda transposasa. En algunas realizaciones, el segundo perfil de tagmentación tiene una mayor frecuencia de omisión de GC en comparación con el primer perfil de tagmentación. En algunas realizaciones, la segunda transposasa tiene un mayor sesgo de inserción hacia una región rica en AT en comparación con la segunda transposasa.
En algunas realizaciones, el tampón de reacción utilizado para la primera reacción de tagmentación se diluye para permitir la reacción de tagmentación con el segundo transposoma. En algunas realizaciones, el tampón de reacción utilizado para la primera reacción de tagmentación se diluye al menos 1,5 veces, 2 veces, 2,5 veces, 3 veces, 4 veces, 5 veces, 6 veces, 7 veces, 8 veces, 9 veces, 10 veces, 12,5 veces, 15 veces, 20 veces, 25 veces, 30 veces, 40 veces, 50 veces, 60 veces, 70 veces, 80 veces, 90 veces, 100 veces, 125 veces, 200 veces, 250 veces, 300 veces o más. En algunas realizaciones, el primer ácido nucleico tagmentado se mantiene inmovilizado sobre un soporte sólido durante la dilución. En algunas realizaciones, el primer ácido nucleico tagmentado se mantiene unido a una o más primeras transposasas durante la dilución. En algunas realizaciones, el primer ácido nucleico tagmentado se mantiene unido a uno o más de los primeros transposomas y los primeros transposomas se inmovilizan sobre un soporte sólido, inmovilizando de este modo el primer ácido nucleico tagmentado.
En algunas realizaciones, los transposomas primero y segundo tienen un perfil de tagmentación diferente para un genoma particular.
En algunas realizaciones, la primera transposasa para la primera reacción de tagmentación es Mos-1 y la segunda transposasa para la segunda reacción de tagmentación es la transposasa Tn5 (por ejemplo, EZTn5™, NexteraV2, o TS-Tn5059).
En una realización, la primera transposasa para la primera reacción de tagmentación es la transposasa Tn5 (por ejemplo, EZTn5™, NexteraV2 o TS-Tn5059) y una segunda transposasa para la segunda reacción de tagmentación es la transposasa Mos1 para generar una biblioteca de ADN tagmentado. En un ejemplo, la segunda reacción de tagmentación utilizando Mos1 se realiza inmediatamente después de la primera reacción de tagmentación utilizando Tn5 (es decir, no se utiliza una etapa de limpieza para eliminar Tn5 del ADN antes de la segunda reacción de tagmentación).
En otra realización, los métodos de la invención utilizan una primera reacción de tagmentación utilizando transposasas Mos1, seguido de una etapa de limpieza de la muestra y una segunda reacción de tagmentación utilizando transposasas Tn5 (por ejemplo, EZTn5™, NexteraV2 o TS-Tn5059) para generar una biblioteca de ADN tagmentado. En un ejemplo, la etapa de limpieza es una etapa de limpieza de ADN realizada utilizando el kit DNA Clean & Concentrator™ (Zymo Research). En esta etapa de limpieza, se desnaturaliza Mos1 y se retira del ADN. En otro ejemplo, la etapa de limpieza de la muestra se realiza usando perlas Agencourt AMPure (Beckman Coulter, Inc.). En este ejemplo, la etapa de limpieza es una etapa de intercambio de tampón, en donde los transposomas de Mos1 se mantienen unidos al ADN.
En otra realización, los métodos de la invención utilizan una primera reacción de tagmentación utilizando transposasas Mu o HyperMu™, seguido de una etapa de limpieza de la muestra y una segunda reacción de tagmentación utilizando transposasas Tn5 (por ejemplo, EZTn5™, NexteraV2 o TS-Tn5059) para generar una biblioteca de ADN tagmentado. En un ejemplo, la etapa de limpieza es una etapa de limpieza de ADN realizada utilizando el kit DNA Clean & Concentrator™ (Zymo Research). En esta etapa de limpieza, se desnaturaliza Mu o HyperMu™ y se retira del ADN. En otro ejemplo, la etapa de limpieza de la muestra se realiza usando perlas Agencourt AMPure (Beckman Coulter, Inc.). En este ejemplo, la etapa de limpieza es una etapa de intercambio de tampón, en donde las transposasas Mu o HyperMu™ se mantienen unidas al a Dn . La figura 23 muestra un esquema ilustrativo de preparación de una biblioteca de secuencias mediante tagmentación secuencial utilizando transposomas HyperMu™ y Nextera. El ADN de entrada se somete en primer lugar a tagmentación utilizando el complejo “ Mu-Nextera” etiquetado. A continuación, se amplifica esta biblioteca mediante PCR, de tal forma que cada fragmento se representa múltiples veces en la reacción amplificada. La biblioteca amplificada se somete a una 2.a ronda de tagmentación con el kit básico de Nextera en un régimen de concentración en el que la enzima es el factor limitante. Esto garantiza que cada molécula individual se tagmenta mínimamente con el complejo de Nextera para preservar la máxima continuidad de la información. A continuación, se secuencia la biblioteca generada. Todos los fragmentos de Nextera que se han generado a partir del mismo amplicón comparten el mismo código de barras (o etiqueta terminal), que puede usarse en el ensamblaje final.
En algunas realizaciones, la cantidad de la primera y segunda transposasa puede ser igual. En algunas realizaciones, la cantidad de la primera y segunda transposasa puede ser diferente.
En una realización, los métodos se utilizan para análisis metagenómicos utilizando muestras microbianas.
Tagmentación secuencial para metagenómica y microbioma
La tagmentación secuencial en todas sus formas puede aplicarse a muestras microbianas para aplicaciones metagenómicas. En algunos ejemplos, el rendimiento de una sola transposasa está altamente afectado por su sesgo y el contexto de secuencia del ADN diana. En caso de que la muestra contenga múltiples especies con diferentes composiciones de secuencia de ADN, la tagmentación puede tener un mejor rendimiento para algunas que para otras. El ADN genómico de algunas especies puede producir fragmentos relativamente más grandes o mucho más pequeños, lo que sesga su representación en la celda de flujo. Esto provocará la pérdida de información metagenómica. En casos extremos, algunas especies pueden no tener representación en la celda de flujo.
El uso de la tagmentación secuencial puede ayudar a reducir el sesgo general de la tagmentación. Concretamente, pueden aplicarse diferentes proporciones de las dos enzimas para retocar la preparación de bibliotecas de diversas composiciones genómicas. Pueden aplicarse múltiples tagmentaciones secuenciales con diferentes proporciones de enzima a la misma muestra. Esto ayuda a capturar una mayor variedad de especies en una muestra de microbioma. Por ejemplo, la muestra puede dividirse en múltiples muestras más pequeñas y aplicar tagmentaciones secuenciales con diferentes proporciones de enzima en cada una. Las diferentes proporciones de enzimas pueden ayudar a capturar mejor datos de secuenciación de diferentes especies en la muestra de microbioma.
Además, puede establecerse un cribado rápido en función de la distribución del tamaño de los fragmentos. Una muestra de microbioma (de una fuente concreta, como el intestino) puede dividirse en muestras de menor tamaño; pueden aplicarse múltiples tagmentaciones secuenciales con diferentes proporciones de enzima a cada una y la distribución del tamaño de los fragmentos de cada una puede almacenarse como valor de referencia. La muestra de la misma fuente puede someterse al mismo proceso y los cambios importantes en las distribuciones de tamaño de los fragmentos pueden indicar un cambio importante en el microbioma. Esto puede usarse en una prueba rápida para comprobar si está cambiando la flora del microbioma de una fuente.
Como se usa en el presente documento, el término “tagmentación” se refiere a la modificación del ADN con un complejo de transposoma que comprende una enzima transposasa y una secuencia terminal de transposón, en el que la secuencia terminal de transposón comprende una secuencia adaptadora. La tagmentación da como resultado la fragmentación simultánea del ADN y el ligamiento de los adaptadores a los extremos 5' de ambas hebras de los fragmentos dúplex.
Después de una etapa de purificación para retirar la enzima transposasa, pueden añadirse secuencias adicionales a los extremos de los fragmentos adaptadores, por ejemplo, mediante PCR, ligamiento o cualquier otra metodología adecuada conocida por los expertos en la materia.
El método de la invención puede utilizar cualquier transposasa que pueda aceptar una secuencia terminal de transposasa y un fragmento de ácido nucleico, uniendo un extremo transferido pero no un extremo no transferido. Un “transposoma” está formado por al menos una enzima transposasa y un sitio de reconocimiento de transposasa. En algunos sistemas de este tipo, denominados “transposomas” , la transposasa puede formar un complejo funcional con un sitio de reconocimiento de transposón que es capaz de catalizar una reacción de trasposición. La transposasa o la integrasa puede unirse al sitio de reconocimiento de transposasa e insertar el sitio de reconocimiento de transposasa en un ácido nucleico diana en un proceso en ocasiones denominado “tagmentación” . En algunos eventos de inserción de este tipo, puede transferirse una hebra del sitio de reconocimiento de transposasa al ácido nucleico diana.
En los métodos de preparación de muestras estándar, cada cadena molde contiene un adaptador en cualquiera de los extremos del inserto y normalmente son necesarias varias etapas tanto para modificar el ADN o el ARN como para purificar los productos deseados de las reacciones de modificación. Estas etapas se realizan en solución antes de la adición de los fragmentos adaptados a una celda de flujo, donde se acoplan a la superficie mediante una reacción de extensión de cebador que copia el fragmento hibridado al extremo de un cebador unido covalentemente a la superficie. Estas cadenas molde “ semilla” dan lugar a continuación a grupos monoclonales de cadenas molde copiadas mediante varios ciclos de amplificación.
El número de etapas necesario para transformar el ADN en cadenas molde modificadas con adaptador en solución listas para la formación de grupos y la secuenciación puede minimizarse utilizando fragmentación y etiquetado mediado por transposasas.
En algunas realizaciones, la tecnología basada en transposones puede utilizarse para fragmentar el ADN, por ejemplo, como se ilustra en el flujo de trabajo de los kits de preparación de muestras de ADN de Nextera™ (Illumina, Inc.), en donde el ADN genómico puede fragmentarse mediante un transposoma modificado por ingeniería genética que fragmenta y etiqueta simultáneamente (“tagmentación” ) el ADN de entrada, creando de este modo una población de moléculas de ácido nucleico fragmentadas que comprenden secuencias adaptadoras únicas en los extremos de los fragmentos.
Algunas realizaciones pueden incluir el uso de una transposasa Tn5 hiperactiva y un sitio de reconocimiento de transposasa de tipo Tn5 (Gory Shin y Reznikoff, J. Biol. Chem., 273:7367 (1998)), o una transposasa MuA y un sitio de reconocimiento de transposasa Mu que comprende secuencias terminales R1 y R2 (Mizuuchi, K., Cell, 35: 785, 1983; Savilahti, H, y col., EMBO J., 14: 4893, 1995). Un sitio de reconocimiento de transposasa ilustrativo que forma un complejo con una transposasa Tn5 hiperactiva (por ejemplo, transposasa EZ-Tn5™, Epicentre Biotechnologies, Madison, Wis.).
Ejemplos adicionales de sistemas de trasposición que pueden utilizarse con determinadas realizaciones proporcionadas en el presente documento incluyen Tn552 de Staphylococcus aureus (Colegio y col., J. Bacteriol., 183: 2384-8, 2001; Kirby C y col., Mol. Microbiol., 43: 173-86, 2002), Ty1 (Devine y Boeke, Nucleic Acids Res., 22: 3765­ 72, 1994 y Publicación Internacional WO 95/23875), el transposón Tn7 (Craig, N L, Science. 271: 1512, 1996; Craig, N L, Revisado en: Curr Top Microbiol Immunol., 204:27-48, 1996), Tn/O e IS10 (Kleckner N, y col., Curr Top Microbiol Immunol., 204:49-82, 1996), transposasa Mariner (Lampe D J, y col., EMBO J., 15: 5470-9, 1996), Tc1 (Plasterk R H, Curr. Topics Microbiol. Immunol., 204: 125-43, 1996), elemento P (Gloor, G B, Methods Mol. Biol., 260: 97-114, 2004), Tn3 (Ichikawa y Ohtsubo, J Biol. Chem. 265:18829-32, 1990), secuencias de inserción bacterianas (Ohtsubo y Sekine, Curr. Top. Microbiol. Immunol. 204: 1-26, 1996), retrovirus (Brown, y col., Proc Natl Acad Sci USA, 86:2525-9, 1989), y retrotransposón de levadura (Boeke y Corces, Annu Rev Microbiol. 43:403-34, 1989). Algunos ejemplos adicionales incluyen IS5, Tn10, Tn903, IS911, y versiones modificadas por ingeniería genética de enzimas de la familia de las transposasas (Zhang y col., (2009) PLoS Genet. 5:e1000689. Epub 2009 Oct. 16; Wilson C. y col. (2007) J. Microbiol. Methods 71:332-5). Además, los métodos y composiciones proporcionados en el presente documento son útiles con transposasas de la especie Vibrio, incluida Vibrio harveyi, como se expone en más detalle en las divulgaciones de los documentos US 2014/0093916 y 2012/0301925. Brevemente, una “ reacción de trasposición” es una reacción en donde se insertan uno o más transposones en ácidos nucleico diana en sitios aleatorios o en sitios prácticamente aleatorios. Los componentes esenciales en una reacción de trasposición son una transposasa y oligonucleótidos de ADN que muestran las secuencias de nucleótidos de un transposón, incluida la secuencia de transposón transferida y su complemento (es decir, la secuencia terminal del transposón no transferido), así como otros componentes necesarios para formar una trasposición o un complejo de transposoma funcional. Los oligonucleótidos de ADN pueden comprender secuencias adicionales (por ejemplo, secuencias adaptadoras o de cebador), según se necesite o desee.
Los adaptadores que se añaden al extremo 5' y/o 3' de un ácido nucleico pueden comprender una secuencia universal. Una secuencia universal es una región de secuencia de nucleótidos que es común a, es decir, está compartida por, dos o más moléculas de ácido nucleico. Opcionalmente, las dos o más moléculas de ácido nucleico también tienen regiones de diferencias de secuencia. Por tanto, por ejemplo, los adaptadores 5' pueden comprender secuencias de ácido nucleico idénticas o universales y los adaptadores 3' pueden comprender secuencias idénticas o universales. Una secuencia universal que puede estar presente en diferentes miembros de una pluralidad de moléculas de ácido nucleico puede permitir la replicación o la amplificación de múltiples secuencias diferentes utilizando un solo cebador universal que es complementario a la secuencia universal.
Como se usa en el presente documento, la expresión “al menos una porción” y/o los equivalentes gramaticales de la misma pueden hacer referencia a cualquier fracción de una cantidad completa. Por ejemplo, “al menos una porción” puede hacer referencia a al menos aproximadamente un 1 %, 2 %, 3 %, 4 %, 5 %, 6 %, 7 %, 8 %, 9 %, 10 %, 15 %, 20 %, 25 %, 30 %, 35 %, 40 %, 45 %, 50 %, 55 %, 60 %, 65 %, 70 %, 75 %, 80 %, 85 %, 90 %, 95 %, 99 %, 99,9 % o 100 % de una cantidad completa.
Como se usa en el presente documento, el término “aproximadamente” significa /-10 %.
Soporte sólido
En algunas realizaciones, el soporte sólido o su superficie no forma un plano, tal como la superficie interna o externa de un tubo o un recipiente. En algunas realizaciones, el soporte sólido es una superficie de una celda de flujo. En algunas realizaciones, el soporte sólido comprende microesferas o perlas. Por “ microesferas” o “ perlas” o “ partículas” o equivalentes gramaticales se entiende en la presente memoria partículas discretas pequeñas. Las composiciones de perlas adecuadas incluyen, pero sin limitación, plástico, cerámica, vidrio, poliestireno, metilestireno, polímeros acrílicos, materiales paramagnéticos, sol te toria, grafito de carbono, dióxido de titanio, látex o dextranos reticulados, tales como sefarosa, celulosa, nailon, micelas reticuladas y Teflón, así como cualquier otro material indicado en el presente documento para soportes sólidos. La “ Microsphere Detection Guide” de Bangs Laboratories, Fishers Ind. es una guía útil. En determinadas realizaciones, las microesferas son microesferas o perlas magnéticas. En algunas realizaciones, las perlas pueden estar codificadas por colores. Por ejemplo, pueden utilizarse microesferas MicroPlex® de Luminex, Austin, TX.
Las perlas no tienen por qué ser esféricas; pueden utilizarse partículas irregulares. De forma alternativa o adicional, las perlas pueden ser porosas. Los tamaños de las perlas varían de nanómetros, es decir, 100 nm, a milímetros, es decir, 1 mm, prefiriéndose las perlas de aproximadamente 0,2 micrómetros a aproximadamente 200 micrómetros, prefiriéndose particularmente las de aproximadamente 0,5 a aproximadamente 5 micrómetros, aunque en algunas realizaciones pueden utilizarse perlas más pequeñas o más grandes. En algunas realizaciones, las perlas pueden tener un diámetro de aproximadamente 1, 1,5, 2, 2,5, 2,8, 3, 3,5, 4, 4,5, 5, 5,5, 6, 6,5, 7, 7,5, 8, 8,5, 9, 9,5, 10, 10,5, 15 o 20 mm.
Códigos de barras
En general, un código de barras puede incluir una o más secuencias de nucleótidos que pueden utilizarse para identificar uno o más ácidos nucleicos particulares. El código de barras puede ser una secuencia artificial o puede ser una secuencia de origen natural generada durante la trasposición, tal como secuencias de ADN genómico flanqueantes idénticas (códigos g) en el extremo de fragmentos de ADN anteriormente yuxtapuestos. En algunas realizaciones, un código de barras es una secuencia artificial que no es natural con respecto al ácido nucleico diana y se utiliza para identificar el ácido nucleico diana o determinar la información de contigüidad del ácido nucleico diana.
Un código de barras puede comprender al menos 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20 o más nucleótidos consecutivos. En algunas realizaciones, un código de barras comprende al menos aproximadamente 10, 20, 30, 40, 50, 60, 70, 80, 90, 100 o más nucleótidos consecutivos. En algunas realizaciones, al menos una porción de los códigos de barras en una población de ácidos nucleicos que comprenden códigos de barras es diferente. En algunas realizaciones, al menos aproximadamente un 10 %, 20 %, 30 %, 40 %, 50 %, 60 %, 70 %, 80 %, 90 %, 95 %, 99 % de los códigos de barras son diferentes. En más realizaciones de este tipo, todos los códigos de barras son diferentes. La diversidad de diferentes códigos de barras en una población de ácidos nucleicos que comprenden códigos de barras puede generarse de manera aleatoria o generarse de manera no aleatoria.
En algunas realizaciones, una secuencia de transposón comprende al menos un código de barras. En algunas realizaciones, tal como en los transposomas que comprenden dos secuencias de transposón no contiguas, la primera secuencia de transposón comprende un primer código de barras y la segunda secuencia de transposón comprende un segundo código de barras. En algunas realizaciones, una secuencia de transposón comprende un código de barras que comprende una primera secuencia de código de barras y una segunda secuencia de código de barras. En algunas de las realizaciones anteriores, la primera secuencia de código de barras puede identificarse o designarse para su emparejamiento con la segunda secuencia de código de barras. Por ejemplo, puede saberse que una primera secuencia de código de barras conocida se empareja con una segunda secuencia de código de barras conocida empleando una tabla de referencia que comprende una pluralidad de secuencias de códigos de barras primeras y segundas que se sabe que se emparejan entre sí.
En otro ejemplo, la primera secuencia de código de barras puede comprender la misma secuencia que la segunda secuencia de código de barras. En otro ejemplo, la primera secuencia de código de barras puede comprender el complemento inverso de la segunda secuencia de código de barras. En algunas realizaciones, la primera secuencia de código de barras y la segunda secuencia de código de barras son diferentes. Las secuencias de códigos de barras primera y segunda pueden comprender un código doble.
En algunas realizaciones de las composiciones y los métodos descritos en el presente documento, los códigos de barras se utilizan en la preparación de cadenas molde de ácido nucleico. Como se comprenderá, el vasto número de códigos de barras disponibles permite que cada molécula de cadena molde de ácido nucleico comprende una identificación única. La identificación única de cada molécula en una mezcla de cadenas molde de ácido nucleico puede usarse en varias aplicaciones. Por ejemplo, las moléculas identificadas de manera única pueden aplicarse para identificar moléculas de ácido nucleico individuales en muestras que tienen múltiples cromosomas, en genomas, en células, en tipos celulares, en patologías celulares y en especies, por ejemplo, en la secuenciación de haplotipos, en la discriminación de alelos precursores, en secuenciación de metagenómica y en secuenciación de muestras de un genoma.
Las secuencias de códigos de barras ilustrativas incluyen, pero sin limitación, TATAGCCT, ATAGAGGC, CCTATCCT, GGCTCTGA, AGGCGAAG, TAATCTTA, CAGGACGT y GTACTGAC.
Ácidos nucleicos diana
Un ácido nucleico diana puede incluir cualquier ácido nucleico de interés. Los ácidos nucleicos diana pueden incluir ADN, ARN, ácidos nucleicos peptídicos, ácidos nucleicos de morfolino, ácidos nucleicos bloqueados, ácidos nucleicos de glicol, ácidos nucleicos de treosa, muestras mixtas de ácidos nucleicos, ADN poliploide (es decir, ADN vegetal), mezclas de los mismos e híbridos de los mismos. En una realización preferida, el ADN genómico o las copias amplificadas del mismo se utilizan como el ácido nucleico diana. En otra realización preferida, se utiliza ADNc, ADN mitocondrial o ADN de cloroplastos.
Un ácido nucleico diana puede comprender cualquier secuencia nucleotídica. En algunas realizaciones, el ácido nucleico diana comprende secuencias homopoliméricas. Un ácido nucleico diana también puede incluir secuencias repetidas. Las secuencias repetidas pueden tener cualquiera de diversas longitudes, lo que incluye, por ejemplo, 2, 5, 10, 20, 30, 40, 50, 100, 250, 500 o 1000 nucleótidos o más. Las secuencias repetidas pueden estar repetidas, ya sea de manera contigua o no contigua, cualquiera de diversos números de veces, lo que incluye, por ejemplo, 2, 3, 4, 5, 6, 7, 8, 9, 10, 15 o 20 veces o más.
Algunas realizaciones descritas en el presente documento pueden utilizar un solo ácido nucleico diana. Otras realizaciones pueden utilizar una pluralidad de ácidos nucleicos diana. En dichas realizaciones, una pluralidad de ácidos nucleicos diana puede incluir una pluralidad de los mismos ácidos nucleicos diana, una pluralidad de ácidos nucleico diana diferentes, donde algunos ácidos nucleico diana son iguales, o una pluralidad de ácidos nucleicos diana, donde todos los ácidos nucleicos diana son diferentes. Las realizaciones que utilizan diversos ácidos nucleicos diana pueden llevarse a cabo en formatos multiplexados, de tal forma que los reactivos se suministran simultáneamente a los ácidos nucleicos diana, por ejemplo, en una o más cámaras o en una superficie de matriz. En algunas realizaciones, la pluralidad de ácidos nucleicos diana pueden incluir sustancialmente la totalidad del genoma de un organismo concreto. La pluralidad de ácidos nucleicos diana puede incluir al menos una porción del genoma de un organismo particular, por ejemplo, al menos aproximadamente un 1 %, 5 %, 10 %, 25 %, 50 %, 75 %, 80 %, 85 %, 90 %, 95 % o un 99 % del genoma. En realizaciones particulares, la porción puede tener un límite superior que es como máximo aproximadamente un 1 %, 5 %, 10 %, 25 %, 50 %, 75 %, 80 %, 85 %, 90 %, 95 % o un 99 % del genoma.
Los ácidos nucleicos diana pueden obtenerse de cualquier fuente. Por ejemplo, los ácidos nucleicos diana pueden prepararse a partir de moléculas de ácido nucleico obtenidas de un solo organismo o de poblaciones de moléculas de ácido nucleico obtenidas de fuentes naturales que incluyen uno o más organismos. Las fuentes de moléculas de ácido nucleico incluyen, pero sin limitación, orgánulos, células, tejidos, órganos, organismos, células individuales u orgánulos individuales. Las células que pueden usarse como fuentes de moléculas de ácido nucleico diana pueden ser procariotas (células bacterianas, por ejemplo, de los géneros Escherichia, Bacillus, Serratia, Salmonella, Staphylococcus, Streptococcus, Clostridium, Chlamydia, Neisseria, Treponema, Mycoplasma, Borrelia, Legionella, Pseudomonas, Mycobacterium, Helicobacter, Erwinia, Agrobacterium, Rhizobium y Streptomyces); arqueas, tales como crenarqueotas, nanoarqueotas o euriarqueotas; o eucariotas, tales como hongos (por ejemplo, levaduras), plantas, protozoos y otros parásitos, y animales (incluidos insectos (por ejemplo, Drosophila spp.), nematodos (por ejemplo, Caenorhabditis elegans) y mamíferos (por ejemplo, ratas, ratones, monos, primates no humanos y seres humanos). Los ácidos nucleicos diana y las cadenas molde de ácidos nucleicos pueden enriquecerse respecto de secuencias de interés específicas utilizando diversos métodos bien conocidos en la técnica. Algunos ejemplos de dichos métodos se proporcionan en la Publicación Internacional N.° WO/2012/108864. En algunas realizaciones, los ácidos nucleicos pueden enriquecerse adicionalmente durante los métodos de preparación de bibliotecas de cadenas molde. Por ejemplo, pueden enriquecerse determinadas secuencias de los ácidos nucleicos antes de la inserción de los transposomas, después de la inserción de los transposomas y/o después de la amplificación de los ácidos nucleicos.
Además, en algunas realizaciones, los ácidos nucleicos diana y/o las cadenas molde de ácido nucleico pueden estar altamente purificados, por ejemplo, los ácidos nucleicos pueden estar aproximadamente un 70 %, 80 %, 90 %, 95 %, 96 %, 97 %, 98 %, 99 % o un 100 % libres de contaminantes antes de su uso con los métodos proporcionados en el presente documento. En algunas realizaciones, es beneficioso utilizar métodos conocidos en la técnica que mantienen la calidad y el tamaño del ácido nucleico diana, por ejemplo, puede realizarse el aislamiento y/o la trasposición directa del ADN diana utilizando tapones de agarosa. La trasposición también puede realizarse directamente en células, con poblaciones de células, lisados y ADN no purificado.
En algunas realizaciones, el ácido nucleico diana puede ser de una única célula. En algunas realizaciones, el ácido nucleico diana puede proceder de una muestra de tejido fijada en formol y embebida en parafina (FFPE). En algunas realizaciones, el ácido nucleico diana puede ser un ácido nucleico reticulado. En algunas realizaciones, el ácido nucleico diana puede estar reticulado con un ácido nucleico. En algunas realizaciones, el ácido nucleico diana puede estar reticulado con proteínas. En algunas realizaciones, el ácido nucleico diana puede ser ácido nucleico extracelular. Los ácidos nucleicos extracelulares incluyen, pero sin limitación, ADN extracelular, ADN tumoral extracelular, ARN extracelular y ARN tumoral extracelular.
En algunas realizaciones, el ácido nucleico diana puede obtenerse de una muestra biológica o una muestra de paciente. La expresión “ muestra biológica” o “ muestra de paciente” , como se usa en el presente documento, incluye muestras, tales como tejidos y fluidos corporales. Los “fluidos corporales” pueden incluir, pero sin limitación, sangre, suero, plasma, saliva, líquido cefalorraquídeo, líquido pleural, lágrimas, líquido de conducto galactóforo, linfa, esputo, orina, líquido amniótico y semen. Una muestra puede incluir un fluido corporal que es “ acelular” . Un “fluido corporal acelular” incluye menos de aproximadamente un 1 % (m/m) de material celular total. El plasma y el suero son ejemplos de fluidos corporales acelulares. Una muestra puede incluir un espécimen de origen natural o sintético (es decir, una muestra celular que se convierte en acelular).
El término “ plasma” , como se usa en el presente documento, se refiere al fluido acelular que se encuentra en la sangre. El “plasma” puede obtenerse de sangre eliminando el material celular completo de la sangre mediante métodos conocidos en la técnica (por ejemplo, centrifugación, filtración y similares).
Métodos de uso
Las transposasas presentadas en el presente documento pueden utilizarse en un procedimiento de secuenciación, tal como una técnica de trasposición in vitro. En resumen, la trasposición in vitro puede iniciarse poniendo en contacto un complejo de transposoma y un ADN diana. Los procedimientos y sistemas de trasposición ilustrativos que pueden adaptarse fácilmente para su uso con las transposasas de la presente divulgación se describen, por ejemplo, en los documentos WO 10/048605; US 2012/0301925; US 2013/0143774. Por ejemplo, en algunas realizaciones, las enzimas transposasas presentadas en el presente documento pueden usarse en un método para generar una biblioteca de fragmentos de ADN etiquetados a partir de ADN diana que comprende un ADNbc de interés (por ejemplo, para su uso como cadenas molde de secuenciación de próxima generación o de amplificación), comprendiendo el método: incubar el ADN diana en una reacción de trasposición in vitro con al menos una transposasa y una composición de extremo de transposón con el que la transposasa forma un complejo de trasposición, comprendiendo la composición de extremo de transposón (i) una hebra transferida que muestra una secuencia de extremo de transposón transferido y, opcionalmente, una secuencia adicional 5' de la secuencia terminal del transposón transferido y (ii) una hebra no transferida que muestra una secuencia que es complementaria a la secuencia terminal del transposón transferido, en condiciones y durante un tiempo suficiente en donde se producen múltiples inserciones en el ADN diana, cada una de las cuales da como resultado la unión de una primera etiqueta que comprende o consiste en la hebra transferida al extremo 5' de un nucleótido en el ADN diana, fragmentando de este modo el ADN diana y generando una población de fragmentos de ADN hibridados etiquetados en 5', cada uno de los cuales tiene la primera etiqueta en el extremo 5'; y después uniendo los extremos 3' de los fragmentos de ADN etiquetados en 5' a la primera etiqueta o a una segunda etiqueta, generando de este modo una biblioteca de fragmentos de ADN etiquetados (por ejemplo, que comprenden fragmentos de ADNmc circular etiquetados o fragmentos de ADN etiquetados en 5' y 3' (o “fragmentos de ADN doblemente etiquetados” ).
Como se usa en el presente documento, el término “diversidad” se refiere al número de moléculas únicas en una biblioteca. En algunas realizaciones, la diversidad es una indicación de la diversidad (complejidad) de la biblioteca.
Como se usa en el presente documento, “tamaño del inserto” significa el tamaño medio de los fragmentos de la biblioteca. La moda y la media de los tamaños de los insertos se determinaron según los datos de secuenciación, después de determinar la longitud del inserto secuenciado. En algunas realizaciones, el tamaño de los fragmentos se determina utilizando un instrumento BioAnalyzer.
Como se usa en el presente documento, “omisión de GC” significa el porcentaje de regiones ricas en GC en el genoma que se omiten (están ausentes) en la biblioteca tagmentada.
Como se usa en el presente documento, “omisión de AT” significa el porcentaje de regiones ricas en AT en el genoma que se omiten (están ausentes) en la biblioteca tagmentada.
Como se usa en el presente documento, la expresión “ sesgo de inserción” se refiere a la preferencia de secuencia de una transposasa por los sitios de inserción. Por ejemplo, si la frecuencia de fondo de NT/C/G en una muestra de polinucleótido se distribuye a partes iguales (25 % de A, 25 % de T, 25 % de C, 25 % de G), cualquier sobrerrepresentación de un nucleótido con respecto a los otros tres en un sitio de unión a transposasa o sitio de escisión refleja un sesgo de inserción en dicho sitio. El sesgo de inserción puede medirse utilizando uno cualquiera de diversos métodos conocidos en la técnica. Por ejemplo, pueden secuenciarse los sitios de inserción y compararse la abundancia relativa de cualquier nucleótido particular en cada posición en un sitio de inserción.
A menos que se especifique otra cosa, los términos “un” o “una” significan “uno/una o más” a lo largo de la presente solicitud.
Ejemplos
Ejemplo 1
Tagmentación secuencial con Tn5 y Mos1
Tagmentación con Tn5 seguida de tagmentación con Mos1
En algunos experimentos, una primera reacción de tagmentación utilizando transposomas Tn5 (por ejemplo, EZTn5™, NexteraV2 o TS-Tn5059) y una segunda reacción de tagmentación utilizando transposomas Mos1 para generar una biblioteca de ADN tagmentado. En un ejemplo, la segunda reacción de tagmentación utilizando Mos1 se realiza inmediatamente después de la primera reacción de tagmentación utilizando Tn5 (es decir, no se utiliza una etapa de limpieza para eliminar Tn5 del ADN antes de la segunda reacción de tagmentación). La enzima Tn5 utilizada fue EZTn5, Tn5 del kit Nextera V2 o TS-Tn5059 mutante.
Para evaluar el efecto de la tagmentación secuencial usando transposomas Tn5 y Mos1 en el resultado de la biblioteca y las métricas de secuenciación, las bibliotecas de ADN tagmentado se construyeron utilizando ADN genómico de Bacillus cereus. Para cada biblioteca tagmentada secuencialmente, se realizó una primera reacción de tagmentación mezclando 20 ml de ADN genómico de B. cereus (50 ng), 25 ml de tampón de tagmentación estándar 2x (TD 2x; Trisacetato 20 mM, pH 7,6, MgCl210 mM y dimetilformamida (DMF) al 20 %) y diversas concentraciones de transposomas de EZ-Tn5™ (Epicentre) en un volumen total de reacción de 50 ml. El transposoma de EZ-Tn5™ se utilizó a concentraciones finales de 3, 6, 12, 25, 50 y 100 nM. Las reacciones se incubaron a 55 0C durante 5 minutos. Tras completarse la primera reacción de tagmentación, se realizó una segunda reacción de tagmentación utilizando transposomas Mos1. El transposoma de Mos1 se utilizó a concentraciones finales de 20 y 100 nM. Las reacciones que emplearon Mos1 también incluyeron la adición de NaCl a una concentración final de 200 mM. Las reacciones se incubaron a 30 0C durante 60 minutos.
Para cada biblioteca de control de Tn5, se realizó una reacción de tagmentación mezclando 20 ml de ADN genómico de B. cereus, 25 ml de tampón de tagmentación estándar 2x y 5 ml de transposomas EZ-Tn5™ (25 nM) o NexteraV2 (25 nM) en un volumen total de reacción de 50 ml. Las reacciones se incubaron a 55 0C durante 5 minutos.
Después de la reacción de tagmentación, las muestras se procesaron según el resto del protocolo de preparación de muestras estándar de Nextera™ (después de la reacción de tagmentación). Las bibliotecas se secuenciaron mediante secuenciación por síntesis (SBS) y se evaluaron mediante herramientas de análisis de secuenciación de próxima generación estándar. La distribución del tamaño de los fragmentos de cada biblioteca también se evaluó en un instrumento BioAnalyzer.
La figura 1 muestra un diagrama de barras 100 del número de moléculas únicas en las bibliotecas de ADN tagmentadas con EZ-Tn5™ y EZ-Tn5™ Mos1 preparadas utilizando diferentes concentraciones de transposomas. El número de moléculas únicas en una biblioteca es una indicación de la diversidad (complejidad) de la biblioteca.
Cada barra de la gráfica representa una biblioteca tagmentada. Las bibliotecas de control (es decir, bibliotecas que se prepararon utilizando condiciones de reacción estándar de transposomas de EZ-T n5™ o NexteraV225 nM) se indican mediante “ std” . Las bibliotecas que se prepararon utilizando diferentes concentraciones de EZ-Tn5™ se indican mediante “ EZT n5 - concentración de la enzima” . Por ejemplo, la tercera barra en el diagrama de barras 100 se marca como “ EZTn5 - 100 nM” e indica una biblioteca que se preparó utilizando EZ-Tn5™ a una concentración final de 100 nM. Las bibliotecas que se prepararon utilizando tagmentación secuencial con EZ-Tn5™ seguida de Mos1 se denominan siguiendo “ EZTn5 - concentración den la enzima - Mos1 - concentración de la enzima” . Por ejemplo, la novena barra en un diagrama de barras 100 se marca como “ EZTN5 - 100 nM - Mos1 - 20 nM” y designa una biblioteca que se preparó utilizando EZ-Tn5™ a una concentración final de 100 nM, seguido de tagmentación utilizando Mos1 a una concentración final de 20 nM. Todas las bibliotecas se prepararon utilizando la formulación de tampón estándar. Una línea 110 indica un grado estándar de diversidad obtenido en una biblioteca de ADN tagmentada con Tn5.
Los datos demuestran que las bibliotecas tagmentadas preparadas utilizando EZ-Tn5™ a 12 nM-50 nM y tagmentación secuencial con Mos1 a 20 nM tienen una mayor diversidad promedio en comparación con las bibliotecas de control y las bibliotecas preparadas utilizando solo EZ-Tn5™. Por ejemplo, la biblioteca “ EZTn5 - 25 nM - Mos1-20 nM” tiene un aumento de la diversidad de aproximadamente el doble en comparación con las bibliotecas de control o las bibliotecas preparadas utilizando únicamente EZ-Tn5™.
La figura 2 muestra un diagrama de barras 200 del tamaño del inserto en las bibliotecas tagmentadas de la figura 1. El valor de la mediana y el valor de la moda de cada biblioteca tagmentada se generaron a partir de los datos de SBS. Dado que los valores de la mediana y la moda se generaron a partir de los datos de SBS, solo se representan los insertos que se amplificaron en el proceso de amplificación de grupos y se secuenciaron. El valor “ BA” se generó a partir de un trazado de BioAnalyzer de la distribución de tamaños de fragmentos en cada muestra tagmentada. Dado que el valor “ BA” se generó a partir del trazado del instrumento BioAnalyzer, se representan todos los fragmentos generados en la reacción de tagmentación (es decir, los fragmentos más grandes que pueden no estar representados en los datos de SBS). Los datos demuestran que hay variabilidad en el tamaño del inserto en las bibliotecas preparadas utilizando diferentes concentraciones de transposomas. Los datos también demuestran que en “ EZTn5 - 25 nM -Mos1- 20 nM’, que es la biblioteca con el mayor grado de diversidad (figura 1), el tamaño del inserto es aproximadamente el mismo que el tamaño del inserto en la biblioteca “ EZTn5-25 nM” .
La figura 3 muestra un diagrama de barras 300 del porcentaje de omisión de AT y el porcentaje de omisión de GC en las bibliotecas tagmentadas de la figura 1. La omisión de AT puede definirse como el porcentaje de regiones ricas en AT en el genoma que no están presentes en la biblioteca tagmentada. La omisión de GC puede definirse como el porcentaje de regiones ricas en GC en el genoma que no están presentes en la biblioteca tagmentada. Una línea 310 indica un umbral estándar de omisión de AT obtenido en una reacción de tagmentación de Tn5 estándar. En una reacción de tagmentación de Tn5, no se observa normalmente la omisión de GC. Los datos muestran que hay variabilidad en el porcentaje de omisión de AT y GC preparado utilizando diferentes concentraciones de transposoma. Los datos también demuestran que en “ EZTn5 - 25 nM - Mos1- 20 nM” , que es la biblioteca con el mayor grado de diversidad (figura 1), el porcentaje de omisión de AT y GC es sustancialmente menor que el porcentaje de omisión en las bibliotecas de control, por ejemplo, “ EZTn5-std-bcereus” , “ NexteraV2-std-bcereus” y “ EZTn5-25 nM” .
Para evaluar el efecto de la composición del tampón de tagmentación en el producto de la biblioteca y las métricas de secuenciación, se prepararon bibliotecas de B. cereus tagmentadas preparadas utilizando formulaciones modificadas del tampón de tagmentación estándar. Las formulaciones de los tampones fueron las siguientes: tampón estándar (TD) (Tris-acetato 10 mM, pH 7,6, MgCl25 mM y DMF al 10 %); tampón de manganeso (Mn; Tris-acetato 10 mM, pH 7,6, MnCl25 mM y DMF al 10 %); tampón de cobalto (Co; Tris-acetato 10 mM, pH 7,6, CoCl25 mM y DMF al 10 %); y tampón de níquel (Ni; Tris-acetato 10 mM, pH 7,6, NiCl25 mM y DMF al 10 %).
La figura 4 muestra una gráfica 400 del número de moléculas únicas en las bibliotecas de ADN tagmentadas preparadas utilizando diferentes formulaciones de tampón de tagmentación. Las bibliotecas de control que se prepararon utilizando el tampón de tagmentación estándar y el volumen de transposomas (5 ml = transposoma 25 nM) se denominan “ EZTn5 - std - bcereus” y “ NexteraV2 - std - bcereus” . Las bibliotecas que se prepararon utilizando diferentes volúmenes (es decir, 10 ml o 15 ml; o 50 nM y 75 nM, respectivamente) de transposoma de NexteraV2 y la formulación de tampón de tagmentación estándar se denominan “ NexteraV2 - 10 ml” y “ NexteraV2 - 15 ml” . Las bibliotecas de NexteraV2 que se prepararon utilizando una formulación de tampón de tagmentación modificada (por ejemplo, Mn, Co o Ni) se denominan “ NexteraV2 - modificación” o “ NexteraV2 - modificación - ml” , donde “ ml” indica el volumen de transposoma utilizado en la reacción. Las bibliotecas que se prepararon utilizando tagmentación secuencial con NexteraV2 (25 nM) y Mos1 se denominan “ NexteraV2 - MBPmos 1 - 20 nM - Mn” , donde 20 nM es la concentración del transposoma de Mos1 y “ Mn” es la formulación del tampón de manganeso. La reacción de la biblioteca de tagmentación secuencial se repitió tres veces (n = 3) y las bibliotecas individuales se denominan a, b o c.
Los datos muestran que las bibliotecas tagmentadas con NexteraV2 preparadas utilizando un tampón de tagmentación que incluye CoCl2 tienen una mayor diversidad en comparación con las bibliotecas preparadas en tampones sin la adición de CoCl2 (es decir, el tampón de tagmentación estándar y tampones que incluyen MnCl2 o NiCl2). Los datos también demuestran que las bibliotecas preparadas utilizando tagmentación secuencial con NexteraV2 y Mos1 en tampón de Mn tienen una mayor diversidad en comparación con las bibliotecas tagmentadas preparadas solo con NexteraV2 en tampón de Mn.
La figura 5 muestra un diagrama de barras 500 del tamaño del inserto en las bibliotecas tagmentadas de la figura 4. Los datos muestran que el tamaño de los insertos en las bibliotecas tagmentadas con NexteraV2 preparadas utilizando tampones de tagmentación que incluyen CoCl2 o NiCl2 son relativamente mayores en comparación con las bibliotecas tagmentadas preparadas utilizando las formulaciones de tampón estándar o de Mn. Los datos también demuestran que en las bibliotecas tagmentadas secuencialmente con “ NexteraV2 - MBPMos 1 - 20 nM - Mn” , el tamaño del inserto es aproximadamente igual que en la biblioteca de control de NextaraV2 (“ NexteraV2 - std - bcereus” ) y la biblioteca de NexteraV2 preparada en tampón de Mn (“ NexteraV2 - Mn” ).
Haciendo ahora referencia a la figura 4 y la figura 5, los datos también demuestran que en las bibliotecas tagmentadas secuencialmente utilizando la formulación de tampón de Mn (NexteraV2 - MBPMos1 - 20 nM - Mn), aumenta la diversidad de la biblioteca (en relación con los valores de control), mientras que el tamaño del inserto en la biblioteca se mantiene aproximadamente igual (en relación con los valores de control).
La figura 6 muestra un diagrama de barras 600 del porcentaje de omisión de AT y el porcentaje de omisión de GC en las bibliotecas tagmentadas de la figura 4. Los datos demuestran que en las bibliotecas preparadas usando tampón de Mn y tagmentación secuencial con NexterV2 y Mos1 (es decir, “ EZTn5 - 25 nM - Mos1- 20 nM” ) hay una reducción sustancial en el porcentaje de omisión de AT y hay un ligero aumento en el porcentaje de omisión de GC, en comparación con las bibliotecas preparadas utilizando únicamente NexteraV2 y cualquiera de los dos tampones de tagmentación (es decir, “ NexteraV2 - std - bcereus” ) o tampón de Mn (“ NexteraV2 - Mn).
Haciendo ahora referencia a las figuras 4 a 6, los datos demuestran que en las bibliotecas tagmentadas secuencialmente preparadas utilizando la formulación de tampón de Mn (NexteraV2 - MBPMos1 - 20 nM - Mn), la diversidad de la biblioteca (figura 4) aumenta, mientras que el tamaño del inserto (figura 5) en la biblioteca se mantiene aproximadamente igual y el porcentaje de omisión de AT (figura 6) se reduce sustancialmente.
En otro ejemplo, se utilizaron los transposomas Tn5, TS-Tn5059 y Mos1 para generar bibliotecas de B. cereus tagmentadas secuencialmente. En este ejemplo, se realizó una primera reacción de tagmentación utilizando TS-TN5059 a concentraciones finales de 40 nM, 80 nM y 240 nM. Se realizó una segunda reacción de tagmentación usando Mos1 a concentraciones finales de 10 y 20 nM. Todas las bibliotecas se prepararon utilizando la formulación de tampón estándar. Las reacciones que emplearon Mos1 también incluyeron la adición de NaCl a una concentración final de 200 mM. Después de la reacción de tagmentación, se procesaron las muestras según el protocolo estándar de preparación de muestras de Nextera™. Las bibliotecas se evaluaron mediante SBS en un instrumento MiSeq (Illumina, Inc.). La distribución del tamaño de los fragmentos de cada biblioteca también se evaluó en un instrumento BioAnalyzer.
La figura 7 muestra un diagrama de barras 700 del número total de lecturas y la diversidad en bibliotecas tagmentadas con TS-Tn5059 Mos1 preparadas utilizando diferentes concentraciones de transposomas. El número total de lecturas es el número total de lecturas de la celda de flujo. La diversidad es el número de moléculas únicas en la biblioteca y se usa como una indicación de la complejidad de la biblioteca. Cada par de barras de la gráfica representa una biblioteca tagmentada. Las bibliotecas que se prepararon utilizando tagmentación secuencial con TS-Tn5059 y Mos1 se denominan siguiendo “TS-Tn5059 - concentración den la enzima - Mos1 - concentración de la enzima” . Se utilizaron EZTn5™ y NexteraV2 para preparar bibliotecas de control comparativas (por ejemplo, “ EZTn5 - std -bcereus” y “ NexteraV2 - std - bcereus” ). “ NexteraV2 - SSB - bcereus” indica una biblioteca que se preparó utilizando el volumen estándar (5 ml) de transposoma, pero incluyó 10 ml adicionales de diluyente de SSB. “ NexteraV2 - 15 ml - bcereus” indica una biblioteca que se preparó utilizando 15 ml (75 nM) de transposoma NexteraV2. Todas las bibliotecas se prepararon utilizando la formulación de tampón estándar.
Los datos demuestran que la diversidad en la biblioteca TS-Tn5059 - 240 nM - Mos1 - 20 nM es mayor en comparación con la diversidad en las bibliotecas de control EZTn5™ y NexteraV2.
La figura 8 muestra un diagrama de barras 800 del tamaño del inserto en las bibliotecas tagmentadas de la figura 7. Esta gráfica muestra el efecto de la concentración de Mos1 en los tamaños finales de los insertos. Una concentración de Mos1 en el intervalo de 10-20 nM no tiene un impacto importante en los tamaños de los insertos. La figura 9 muestra un diagrama de barras 900 del porcentaje de omisión de AT y el porcentaje de omisión de GC en las bibliotecas tagmentadas de la figura 7. Los datos demuestran que en general, las bibliotecas preparadas utilizando tagmentación secuencial hay una reducción sustancial en el porcentaje de omisión de AT y un ligero aumento en el porcentaje de omisión de GC en comparación con las bibliotecas de control de NexteraV2. Por ejemplo, el porcentaje de omisión de AT en TS-Tn5059 - 40 nM - Mos1 - 20 nM se reduce sustancialmente y el porcentaje de omisión de GC aumenta ligeramente en comparación con la biblioteca NexteraV2 -std -bcereus.
Ejemplo 2
Generación de la biblioteca de secuenciación con el complejo de transposoma de Mu
Para generar la biblioteca de secuenciación se utiliza HyperMu™ (Epicentre, Madison, WI), una transposasa Mu mutante. La transposasa HyperMu™ es una enzima hiperactiva que conserva las características de inserción altamente aleatoria de la transposasa MuA, pero que es al menos 50 veces más activa in vitro que la enzima disponible de otros proveedores. Tras la trasposición con Mu, los brazos del transposón (es decir, RI y RII) junto con cualquier secuencia unida, se transferirán a la cadena molde de ADN, fragmentando al mismo tiempo la cadena molde. La secuencia del transposón de HyperMu™ y las secuencias de cebador se muestran en las Fig. 15-16. La enzima T n5 utilizada fue EZT n5, T n5 del kit Nextera V2.
Evaluación de la actividad del transposoma de Mu
La capacidad de tagmentación del transposoma HyperMu™ se evalúa en un genoma de bacteriófago de ~50 kb. La reacción de tagmentación se llevó a cabo en tampón TA durante una hora a 37 0C a concentraciones crecientes de transposoma de HyperMu™. Los productos de fragmentación se analizaron mediante electroforesis en gel de agarosa y los resultados se muestran en la Fig. 17.
Los complejos de HyperMu™ se utilizaron para tagmentar el cromosoma de E. coli y se amplificaron los fragmentos tagmentados para introducir adaptadores de secuenciación. Se realizaron 25 ciclos de PCR utilizando los cebadores P5-MUTS y P7-MLJTS. Los productos de la PCR se analizaron mediante electroforesis en gel de agarosa y se muestran en la Fig. 18. Los productos de la PCR se observaron con diferentes cantidades de ADN de entrada.
Análisis de ADN tagmentado amplificado mediante PCR
Se utilizaron 3,2 ng de ADN para la secuenciación “ paired end” en GAIIX (2x35 pb). La muestra se secuenció en un solo carril en GA. El número total de lecturas fue de 30.071.951 y el número de lecturas únicas <2000 pb fue de 4.599.874. La estadística del experimento de secuenciación se muestra en la Fig. 19. El tamaño medio de los fragmentos secuenciados fue mucho mayor que Nextera y fue próximo a 800 pb, como se muestra en la Fig. 20.
La uniformidad del experimento de secuenciación fue mejor para HyperMu™ en comparación con Tn5. La uniformidad del experimento de secuenciación fue mejor para HyperMu™ con T n5 en comparación con solo HyperMu™ o T n5. La uniformidad del experimento de secuenciación fue comparable con TruSeq. Los resultados se muestran en la Fig. 21. El sesgo de GC observado para HyperMu™ es similar al de Tn5 y se muestra en la Fig. 22.
Los experimentos expuestos en las figuras 1 -5 se realizaron para caracterizar el efecto de la composición del tampón de tagmentación de Tn5 y las condiciones de reacción en el resultado de la biblioteca y las métricas de secuenciación. Concretamente, en los experimentos expuestos en las Fig. 1-3, se añadió Mos-1 a las reacciones de tagmentación con Tn5. La enzima Tn5 utilizada fue EZT n5, Tn5 del kit Nextera V2 o TS-T n5059 mutante.
En los experimentos expuestos en las Fig. 4 y 5, la reacción de tagmentación con Mos-1 se realizó en primer lugar y el ADN tagmentado se lavó para eliminar el tampón de tagmentación de la primera reacción. Posteriormente, el ADN tagmentado se tagmentó adicionalmente utilizando una enzima Tn5 (EZTn5, Tn5 del kit NexteraV2 o TS-Tn5059 mutante). Varios métodos de lavado probados incluyeron perlas Ampure y el kit Zymo Clean and Concentrator (Zymo).
Para evaluar el efecto de la composición del tampón de tagmentación y las condiciones de reacción en el resultado de la biblioteca y las métricas de secuenciación, se construyeron bibliotecas de ADN tagmentado con Tn5 utilizando ADN genómico de Bacillus cereus. Cada biblioteca tagmentada se preparó utilizando 25 ng de entrada de ADN genómico de B. cereus. El contenido genómico de B. cereus es de aproximadamente un 40 % de GC y aproximadamente un 60 % de AT.
Los tampones de tagmentación se prepararon como formulaciones 2x. Para cada biblioteca, se realizó una reacción de tagmentación mezclando 20 ml de ADN genómico de B. cereus (25 ng), 25 ml de tampón de tagmentación 2x y 5 ml de enzima (Ts-Tn5059 10x o Ts-Tn5 10x) en un volumen total de reacción de 50 ml. Las reacciones se incubaron a 55 0C durante 5 minutos. Después de la reacción de tagmentación, se procesaron las muestras según el protocolo estándar de preparación de muestras de Nextera™. Las bibliotecas se secuenciaron utilizando la química de SBS (secuenciación por síntesis) de Illumina en un dispositivo MiSeq. Los experimentos de secuenciación fueron 2x71 ciclos utilizando un kit MiSeq V2. La distribución del tamaño de los fragmentos en cada biblioteca se evaluó en un instrumento BioAnalyzer.
Ejemplo 3
Tagmentación secuencial con Tn5 y Mos1 en solución
Las transposasas Tn5 tienen actividad reducida en tampones que contienen NaCl >50 mM y las transposasas Mos1 tienen actividad reducida en los tampones que contienen NaCl <150 mM. Puede llevarse a cabo una tagmentación secuencial para optimizar la actividad de ambas enzimas.
Tagmentación con Tn5 seguida de tagmentación con Mos1
Se utiliza tagmentación con Nextera™ (Epicentre, Madison, WI) estándar utilizando condiciones y tampones especificados en los protocolos de preparación de bibliotecas de Nextera. Después de la tagmentación inicial con T n5, la temperatura de reacción se reduce a <30 0C. A continuación, se añade NaCl concentrado a la reacción a una concentración final de 150-300 mM. A continuación se añade el transposoma de Mos1 a la reacción de tagmentación y la reacción se incuba a 30 0C. Una vez se ha completado la tagmentación, se limpia la reacción usando perlas Ampure™ (Beckman Coulter, CA, EE. UU.) o cartuchos Zymo Clean & Concentrator™ (Zymo Research, Irvine, CA). El resto del protocolo para la adición del adaptador mediante PCR y la limpieza y selección de tamaños finales se especifica en el protocolo de preparación de bibliotecas de Nextera™.
Tagmentación con Mos1 seguida de limpieza para eliminar el tampón de alta salinidad, seguida de tagmentación con Tn5
Se utilizan tampones de Nextera™ (Epicentre, Madison, WI) estándar con la inclusión de NaCl 150-300 mM para obtener una actividad de Mos1 óptima. A continuación, se añade Mos1 a la reacción y se incuba a 30 0C. Después de la tagmentación, la reacción se limpia utilizando perlas Ampure™ (Beckman Coulter, CA, EE. UU) o cartuchos Zymo Clean & Concentrator™ (Zymo Research, Irvine, CA) o métodos de purificación de ADN similares. El material de ADN fragmentado y limpiado se utiliza a continuación como entrada de ADN para la tagmentación secundaria utilizando transposomas Tn5 o Tn5 mutantes. Después de la segunda tagmentación, se limpia la reacción usando perlas Ampure™ (Beckman Coulter, CA, EE. UU.) o cartuchos Zymo Clean & Concentrator™ (Zymo Research, Irvine, CA) o métodos similares. El resto del protocolo para la adición del adaptador mediante PCR y la limpieza y selección de tamaños finales se especifica en el protocolo de preparación de bibliotecas de Nextera™(Epicentre, Madison, WI).
Tagmentación con Mos1 seguida de una dilución para reducir el tampón de alta salinidad, seguida de tagmentación con Tn5
Se utilizan tampones de Nextera™ (Epicentre, Madison, WI) estándar con la inclusión de NaCl 150-300 mM para obtener una actividad de Mos1 óptima. A continuación, se añade Mos1 a la reacción y se incuba a 30 0C. Después de la tagmentación, la reacción se diluye con cada tampón de reacción para reducir la concentración de NaCl hasta <50 mM. A continuación, se añade Tn5 a la reacción de tagmentación y se incuba a <55 0C. Después de la segunda tagmentación, se limpia la reacción usando perlas Ampure™ (Beckman Coulter, CA, EE. UU.) o cartuchos Zymo Clean & Concentrator™ (Zymo Research, Irvine, CA) o métodos de purificación de ADN similares. El resto del protocolo para la adición del adaptador mediante PCR y la limpieza y selección de tamaños finales se especifica en el protocolo de preparación de bibliotecas de Nextera™(Epicentre, Madison, WI).

Claims (15)

  1. REIVINDICACIONES
    i. Un método para preparar una biblioteca de secuenciación, que comprende:
    (a) proporcionar un primer transposoma, comprendiendo el primer transposoma que comprende un primer transposón una primera enzima transposasa que tiene un primer perfil de tagmentación; (b) combinar un ácido nucleico diana con la primera enzima transposasa en condiciones adecuadas para la tagmentación, generando de este modo un primer ácido nucleico tagmentado;
    (c) separar sustancialmente el primer ácido nucleico tagmentado del tampón de reacción usado en la etapa (b);
    (d) combinar el primer ácido nucleico tagmentado con un segundo transposoma en condiciones adecuadas para la tagmentación, comprendiendo el segundo transposoma un segundo transposón y una segunda enzima transposasa que tiene un segundo perfil de tagmentación, generando de este modo un segundo ácido nucleico tagmentado;
    (e) amplificar el segundo ácido nucleico tagmentado, generando de este modo una biblioteca de secuenciación.
  2. 2. El método de la reivindicación 1, que además comprende amplificar opcionalmente el primer ácido nucleico tagmentado.
  3. 3. El método de una cualquiera de las reivindicaciones 1-2, en donde el primer, segundo, o ambos transposomas, se inmovilizan sobre soportes sólidos, opcionalmente en donde los soportes sólidos son perlas.
  4. 4. El método de una cualquiera de las reivindicaciones 1-3, en donde el primer transposón comprende un primer adaptador o el segundo transposón comprende un segundo adaptador.
  5. 5. El método de una cualquiera de las reivindicaciones 1-3, en donde el primer transposón comprende un primer adaptador y el segundo transposón comprende un segundo adaptador, en donde el primer y el segundo adaptador son diferentes.
  6. 6. El método de una cualquiera de las reivindicaciones 1-5, en donde el primer y el segundo adaptador comprenden una secuencia seleccionada entre el grupo que consiste en códigos de barras, secuencias de unión a cebador, sitios de endonucleasa de restricción e índices moleculares únicos.
  7. 7. El método de una cualquiera de las reivindicaciones 1-6, en donde la primera o la segunda enzima transposasa se selecciona entre el grupo que consiste en Mos-1, HyperMu™, Tn5, Ts-Tn5, Ts-Tn5059, Hermes, Tn7.
  8. 8. El método de una cualquiera de las reivindicaciones 1-7, en donde el tampón de reacción usado en la etapa (b) se diluye para permitir la reacción de tagmentación con el segundo transposoma.
  9. 9. El método de una cualquiera de las reivindicaciones 1 -7, en donde el segundo transposoma se combina con una mezcla de reacción que comprende el primer transposoma y el primer ácido nucleico tagmentado.
  10. 10. El método de la reivindicación 9, en donde una o más de la primera transposasa se mantiene unida al primer ácido nucleico tagmentado durante la combinación del primer ácido nucleico tagmentado con un segundo transposoma.
  11. 11. Un método de tagmentación que comprende:
    (a) proporcionar un primer transposoma, comprendiendo el primer transposoma que comprende un primer transposón una primera enzima transposasa que tiene un primer perfil de tagmentación; (b) proporcionar un segundo transposoma, comprendiendo el segundo transposoma un segundo transposón y una segunda enzima transposasa que tiene un segundo perfil de tagmentación; (c) combinar un ácido nucleico diana con el primer transposoma y el segundo transposoma en condiciones adecuadas para la tagmentación, generando de este modo un ácido nucleico tagmentado.
  12. 12. El método de la reivindicación 11, en donde el primer, segundo, o ambos transposomas, se inmovilizan sobre soportes sólidos, opcionalmente en donde los soportes sólidos son perlas.
  13. 13. El método de una cualquiera de las reivindicaciones 11-12, en donde el primer transposón comprende un primer adaptador y el segundo transposón comprende un segundo adaptador, en donde el primer y el segundo adaptador son diferentes.
  14. 14. El método de una cualquiera de las reivindicaciones 11-13, en donde el primer y el segundo adaptador comprenden una secuencia seleccionada entre el grupo que consiste en códigos de barras, secuencias de unión a cebador, sitios de endonucleasa de restricción e índices moleculares únicos.
  15. 15. El método de una cualquiera de las reivindicaciones 11-14, en donde la primera enzima transposasa se selecciona entre el grupo que consiste en Mos-1, HiperMu™, Tn5, Ts-Tn5, Ts-Tn5059, Hermes, Tn7 o la segunda enzima transposasa se selecciona entre el grupo que consiste en Mos-1, HyperMu™, Tn5, Ts-Tn5, Ts-Tn5059, Hermes, Tn7.
ES19187628T 2014-11-05 2015-11-05 Composiciones de transposasas para reducir el sesgo de inserción Active ES2947757T3 (es)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US201462075713P 2014-11-05 2014-11-05
US201562242935P 2015-10-16 2015-10-16

Publications (1)

Publication Number Publication Date
ES2947757T3 true ES2947757T3 (es) 2023-08-18

Family

ID=54697644

Family Applications (1)

Application Number Title Priority Date Filing Date
ES19187628T Active ES2947757T3 (es) 2014-11-05 2015-11-05 Composiciones de transposasas para reducir el sesgo de inserción

Country Status (10)

Country Link
US (2) US10815478B2 (es)
EP (3) EP3215618B1 (es)
CN (1) CN107532164A (es)
AU (2) AU2015343034B2 (es)
CA (1) CA2965995A1 (es)
DK (2) DK3628732T3 (es)
ES (1) ES2947757T3 (es)
FI (1) FI3628732T3 (es)
SG (1) SG11201703472YA (es)
WO (1) WO2016073690A1 (es)

Families Citing this family (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
ES2947757T3 (es) * 2014-11-05 2023-08-18 Illumina Inc Composiciones de transposasas para reducir el sesgo de inserción
CA3007840C (en) 2015-12-07 2020-09-15 Zymergen Inc. Microbial strain improvement by a htp genomic engineering platform
US11208649B2 (en) 2015-12-07 2021-12-28 Zymergen Inc. HTP genomic engineering platform
US9988624B2 (en) 2015-12-07 2018-06-05 Zymergen Inc. Microbial strain improvement by a HTP genomic engineering platform
KR20180084756A (ko) 2015-12-07 2018-07-25 지머젠 인코포레이티드 코리네박테리움 글루타미컴으로부터의 프로모터
JP2019519241A (ja) 2016-06-30 2019-07-11 ザイマージェン インコーポレイテッド グルコース透過酵素ライブラリーを生成するための方法およびその使用
JP2019519242A (ja) 2016-06-30 2019-07-11 ザイマージェン インコーポレイテッド 細菌ヘモグロビンライブラリーを生成するための方法およびその使用
AU2017311306A1 (en) * 2016-08-10 2019-03-14 President And Fellows Of Harvard College Methods of de novo assembly of barcoded genomic DNA fragments
WO2018125982A1 (en) * 2016-12-29 2018-07-05 Illumina, Inc. Analysis system for orthogonal access to and tagging of biomolecules in cellular compartments
CA3061731A1 (en) 2017-05-19 2018-11-22 Zymergen Inc. Genomic engineering of biosynthetic pathways leading to increased nadph
CN110719956A (zh) 2017-06-06 2020-01-21 齐默尔根公司 用于改良真菌菌株的高通量基因组工程改造平台
CA3064612A1 (en) 2017-06-06 2018-12-13 Zymergen Inc. A htp genomic engineering platform for improving escherichia coli
US20200102554A1 (en) 2017-06-06 2020-04-02 Zymergen Inc. High throughput transposon mutagenesis
JP7350659B2 (ja) 2017-06-06 2023-09-26 ザイマージェン インコーポレイテッド Saccharopolyspora spinosaの改良のためのハイスループット(HTP)ゲノム操作プラットフォーム
JP2021518128A (ja) 2018-03-20 2021-08-02 ザイマージェン インコーポレイテッド チャイニーズハムスター卵巣細胞の遺伝子操作のためのhtpプラットフォーム
US11773441B2 (en) 2018-05-03 2023-10-03 Becton, Dickinson And Company High throughput multiomics sample analysis
WO2020157684A1 (en) 2019-01-29 2020-08-06 Mgi Tech Co., Ltd. High coverage stlfr
US20220127596A1 (en) * 2019-07-12 2022-04-28 lllumina Cambridge Limited Nucleic Acid Library Preparation Using Electrophoresis
US11377655B2 (en) 2019-07-16 2022-07-05 Pacific Biosciences Of California, Inc. Synthetic nucleic acids having non-natural structures
IL294909A (en) 2020-02-13 2022-09-01 Zymergen Inc A metagenomic library and natural product discovery platform
WO2024003332A1 (en) 2022-06-30 2024-01-04 F. Hoffmann-La Roche Ag Controlling for tagmentation sequencing library insert size using archaeal histone-like proteins

Family Cites Families (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5677170A (en) 1994-03-02 1997-10-14 The Johns Hopkins University In vitro transposition of artificial transposons
FI103809B (fi) * 1997-07-14 1999-09-30 Finnzymes Oy In vitro -menetelmä templaattien tuottamiseksi DNA-sekventointia varten
CN1181852C (zh) * 2002-05-21 2004-12-29 崔行善 一种治疗膀胱癌的药物
FR2900935A1 (fr) * 2006-05-15 2007-11-16 Centre Nat Rech Scient Systemes de transposition recombinants hyperactifs derives du transposon mos-1
US9080211B2 (en) * 2008-10-24 2015-07-14 Epicentre Technologies Corporation Transposon end compositions and methods for modifying nucleic acids
EP3272879B1 (en) * 2008-10-24 2019-08-07 Epicentre Technologies Corporation Transposon end compositions and methods for modifying nucleic acids
CA2821299C (en) * 2010-11-05 2019-02-12 Frank J. Steemers Linking sequence reads using paired code tags
WO2012108864A1 (en) 2011-02-08 2012-08-16 Illumina, Inc. Selective enrichment of nucleic acids
US9005935B2 (en) * 2011-05-23 2015-04-14 Agilent Technologies, Inc. Methods and compositions for DNA fragmentation and tagging by transposases
WO2013085918A1 (en) 2011-12-05 2013-06-13 The Regents Of The University Of California Methods and compostions for generating polynucleic acid fragments
US9644199B2 (en) 2012-10-01 2017-05-09 Agilent Technologies, Inc. Immobilized transposase complexes for DNA fragmentation and tagging
US9683230B2 (en) * 2013-01-09 2017-06-20 Illumina Cambridge Limited Sample preparation on a solid support
WO2014205296A1 (en) * 2013-06-21 2014-12-24 The Broad Institute, Inc. Methods for shearing and tagging dna for chromatin immunoprecipitation and sequencing
WO2015089339A2 (en) * 2013-12-11 2015-06-18 Changping Shi Compositions, methods and kits for dna fragmentation and tagmentation
SG11201608585RA (en) * 2014-04-15 2016-11-29 Illumina Inc Modified transposases for improved insertion sequence bias and increased dna input tolerance
ES2947757T3 (es) * 2014-11-05 2023-08-18 Illumina Inc Composiciones de transposasas para reducir el sesgo de inserción

Also Published As

Publication number Publication date
EP3628732B1 (en) 2023-05-03
EP3215618A1 (en) 2017-09-13
US20180016571A1 (en) 2018-01-18
AU2022201248A1 (en) 2022-03-17
CN107532164A (zh) 2018-01-02
AU2015343034B2 (en) 2021-12-16
SG11201703472YA (en) 2017-05-30
EP3215618B1 (en) 2019-07-24
WO2016073690A1 (en) 2016-05-12
DK3628732T3 (da) 2023-05-30
AU2015343034A1 (en) 2017-05-18
AU2015343034A9 (en) 2019-08-01
EP3628732A1 (en) 2020-04-01
EP4239067A2 (en) 2023-09-06
WO2016073690A9 (en) 2017-09-14
CA2965995A1 (en) 2016-05-12
US10815478B2 (en) 2020-10-27
FI3628732T3 (fi) 2023-05-31
US20210047635A1 (en) 2021-02-18
EP4239067A3 (en) 2023-10-25
DK3215618T3 (da) 2019-10-14

Similar Documents

Publication Publication Date Title
ES2947757T3 (es) Composiciones de transposasas para reducir el sesgo de inserción
JP7127104B2 (ja) 連続性を維持した転位
KR102447811B1 (ko) 감소된 증폭 편향을 갖는 고속대량 단일 세포 서열분석
ES2893528T3 (es) Composiciones y métodos para mejorar la identificación de muestras en colecciones de ácidos nucleicos indexadas
ES2933806T3 (es) Tagmentación que usa transposomas inmovilizados con enlazadores
ES2959047T3 (es) Bibliotecas de genoma completo de célula individual para la secuenciación de metilación
US11028429B2 (en) Full interrogation of nuclease DSBs and sequencing (FIND-seq)
ES2887177T3 (es) Método de preparación de una biblioteca de secuenciación de ácidos nucleicos
ES2921401T3 (es) Método de enriquecimiento de ácidos nucleicos usando nucleasas específicas de sitio seguido de captura
US20180291371A1 (en) Method for Constructing Nucleic Acid Single-Stranded Cyclic Library and Reagents Thereof
CN106661561A (zh) 使用单侧转座的方法和组合物
JP7460539B2 (ja) 核酸を結合、修飾、および切断する物質の基質選択性および部位のためのin vitroでの高感度アッセイ
CN106715693A (zh) 用于制备序列文库的方法和组合物
KR20220080091A (ko) Rna 올리고뉴클레오티드를 시퀀싱하기 위한 방법
US20180030435A1 (en) Multiplex characterization of microbial traits using dual barcoded nucleic acid fragment expression library
US11661624B2 (en) Methods of identifying and characterizing gene editing variations in nucleic acids
JP2023506631A (ja) 共有結合で閉端された核酸分子末端を使用したngsライブラリー調製
WO2024119461A1 (en) Compositions and methods for detecting target cleavage sites of crispr/cas nucleases and dna translocation
US20240124921A1 (en) Detection of analytes using targeted epigenetic assays, proximity-induced tagmentation, strand invasion, restriction, or ligation
CN117881796A (zh) 使用靶向表观遗传测定、邻近诱导标签化、链侵入、限制或连接来检测分析物