ES2864531T3

ES2864531T3 - Método para identificación y enumeración de cambios en la secuencia de ácidos nucleicos, expresión, copia, o metilación de ADN, usando reacciones combinadas de nucleasa, ligasa, polimerasa y secuenciación

Info

Publication number: ES2864531T3
Application number: ES19178828T
Authority: ES
Inventors: Francis Barany; John Efcavitch
Original assignee: Cornell University
Current assignee: Cornell University
Priority date: 2014-06-06
Filing date: 2015-06-08
Publication date: 2021-10-14
Anticipated expiration: 2035-06-08
Also published as: CN113046413A; DK3152331T3; US20230295718A1; US10407722B2; US20190345552A1; CA2950295A1; WO2015188192A2; CN106661631A; EP3152331A2; AU2022201907A1; EP3889271B1; CN106661631B; JP7008407B2; WO2015188192A3; CA2950295C; EP3152331B1; US20170204459A1; EP4170044A1; CA3213538A1; EP3567122A1

Abstract

Un sistema que comprende: una colección de diferentes construcciones de ácido nucleico monocatenario quiméricas circulares, comprendiendo cada construcción: un primer segmento monocatenario de ADN genómico original de un organismo hospedador y un segundo segmento de ácido nucleico monocatenario que está unido al primer segmento monocatenario y comprende una secuencia nucleotídica que es exógena al organismo hospedador, comprendiendo dicha secuencia nucleotídica una primera parte específica de cebador de soporte sólido, una segunda parte específica de cebador de soporte sólido, y una secuencia de identificador de paciente, por lo que dichas construcciones de ácido nucleico monocatenario quiméricas de la colección están circularizadas y son adecuadas para amplificación por círculo rodante y/o secuenciación; y una colección de productos de extensión, comprendiendo cada producto de extensión dos o más secuencias lineales en tándem, en donde cada secuencia lineal en tándem es complementaria a la construcción de ácido nucleico monocatenario quimérica de la colección, en donde cada producto de extensión en la colección se hibrida con su construcción de ácido nucleico monocatenario quimérica circular complementaria de la colección.

Description

DESCRIPCIÓN

Método para identificación y enumeración de cambios en la secuencia de ácidos nucleicos, expresión, copia, o metilación de ADN, usando reacciones combinadas de nucleasa, ligasa, polimerasa y secuenciación

CAMPO DE LA INVENCIÓN

La presente divulgación se refiere a un método para la captura altamente específica y dirigida de regiones de genomas y transcriptomas humanos de la sangre, es decir, de ADN libre de células circulantes, exosomas, microARN, células tumorales circulantes o células sanguíneas totales, para permitir la detección altamente sensible de cambios por mutación, expresión, número de copias, translocación, empalme alternativo y metilación usando reacciones combinadas de nucleasa, ligamiento, polimerasa y secuenciación.

ANTECEDENTES DE LA INVENCIÓN

Los avances en la secuenciación del ADN prometen estandarizar y desarrollar un diagnóstico molecular no invasivo para mejorar la atención prenatal, la eficacia del trasplante, la detección del cáncer y de otras enfermedades y el tratamiento individualizado. En la actualidad, los pacientes con predisposición a enfermedad o con enfermedad en estadio inicial no están identificados, y aquellos que están enfermos no reciben el mejor tratamiento -- todo debido a fallos a nivel de diagnóstico.

En el campo del cáncer, existe la necesidad de desarrollar una tecnología de ese tipo para detección precoz, terapia guiada y monitorización de la recurrencia - todo a partir de una muestra de sangre. Esto incluye la necesidad de desarrollar: (i) detección de alta sensibilidad de mutaciones de una sola base, mutaciones por inserciones pequeñas y deleciones pequeñas en genes conocidos (cuando están presentes en un 1 % a un 0,01 % de ADN libre de células); (ii) detección de alta sensibilidad de hipermetilación e hipometilación del promotor (cuando está presente en un 1 % a un 0,01 % de ADN libre de células); (iii) cuantificación exacta de ARNm, ARNInc y miARN específico de tumor aislado de exosomas obtenidos a partir de tumores o complejo RISC, o células tumorales circulantes en sangre; (iv) cuantificación exacta de cambios de copias específicas de tumor en el ADN aislado de células tumorales circulantes; (v) cuantificación exacta de mutaciones, hipermetilación e hipometilación del promotor en ADN aislado de células tumorales circulantes. Todos estos (excepto la cuantificación de cambios de copias específicas de tumor en el ADN aislado de células tumorales circulantes) requieren enfocar la secuenciación en genes diana o regiones del genoma. Además, la determinación de la información de la secuencia o el estado de metilación a partir de ambas hebras del fragmento original proporciona la confirmación de sucesos raros que se necesita de manera crucial.

El plasma normal contiene ácidos nucleicos liberados de células normales que experimentan procesos fisiológicos normales (es decir, exosomas, apoptosis). En condiciones de estrés, inflamación, infección o lesión puede haber una liberación adicional de ácidos nucleicos. En general, el ADN liberado de las células apoptóticas tiene una longitud promedio de 160 pb, mientras que el ADN de las células fetales tiene una longitud promedio de aproximadamente 140 pb. El plasma de un paciente con cáncer contiene ácidos nucleicos liberados de las células cancerosas que experimentan procesos fisiológicos anómalos, así como dentro de las células tumorales circulantes (CTC). Del mismo modo, el plasma de una mujer embarazada contiene ácidos nucleicos liberados de las células fetales.

Hay una serie de desafíos para desarrollar pruebas de diagnóstico e identificación sistemática fiables. El primer desafío es distinguir los marcadores que proceden del tumor o del feto que son indicativos de enfermedad (es decir, cáncer precoz) frente a la presencia de los mismos marcadores que proceden del tejido normal. También es necesario equilibrar el número de marcadores examinados y el coste del ensayo, con la especificidad y la sensibilidad del ensayo. Este es un desafío que debe abordar la variación biológica en enfermedades tales como el cáncer. En muchos casos, el ensayo debería servir como una herramienta de identificación sistemática, lo que requiere la disponibilidad de un seguimiento de diagnóstico secundario (es decir, colonoscopia, amniocentesis). Para abordar el problema biológico existe la necesidad de detectar de manera confiable la mutación de secuencias de ácidos nucleicos o las diferencias de metilación del promotor, o cuantificar de manera confiable el número de copias de ADN o ARN de un número muy pequeño de células iniciales (es decir, de las CTC), o cuando la señal específica del cáncer o del feto está en presencia de una mayor parte de ácido nucleico que procede de células normales. Por último, existe el desafío técnico de distinguir la señal verdadera resultante de detectar las diferencias deseadas de ácidos nucleicos específicos de la enfermedad frente a la señal falsa generada a partir de ácidos nucleicos normales presentes en la muestra frente a la señal falsa generada en ausencia de las diferencias de ácidos nucleicos específicos de la enfermedad.

A modo de ejemplo, considérese el reto de detectar, en plasma, la presencia de ADN tumoral circulante que alberga una mutación en el gen p53 o una región promotora metilada. Una muestra de este tipo contendrá la mayor parte del ADN libre de células procedente de células normales, donde el ADN tumoral solo puede comprender un 0,01 % del ADN total libre de células. Por lo tanto, si se intentara encontrar la presencia de un ADN mutante de ese tipo mediante secuenciación total, sería necesario secuenciar 100.000 genomas para identificar 10 genomas que albergan las mutaciones. Esto requeriría secuenciar 300.000 GB de ADN, una tarea fuera del alcance de la tecnología de secuenciación actual, por no mencionar los enormes problemas de gestión de datos. Para salvar este problema, muchos grupos han intentado capturar regiones diana específicas o amplificar por PCR las regiones en cuestión. La captura de secuencias ha sufrido pérdidas, de modo que tal vez se captura un 90-95 % de las secuencias deseadas, pero faltan los fragmentos deseados. Alternativamente, la amplificación por PCR proporciona el riesgo de introducir un error poco común que no se puede distinguir de una mutación verdadera. Además, la PCR pierde información de metilación. Aunque el tratamiento con bisulfito se ha usado tradicionalmente para determinar la presencia de metilación del promotor, también destruye la muestra de ADN y carece de la capacidad de identificar múltiples cambios de metilación en el ADN libre de células.

Existen varios enfoques diferentes para reducir la tasa de error y mejorar la precisión de las ejecuciones de secuenciación. Una precisión de consenso se puede conseguir en presencia de tasas de error elevadas mediante la secuenciación de la misma región de ADN una y otra vez. Sin embargo, una tasa de error elevada hace que sea extremadamente difícil identificar una variante de secuencia de baja abundancia, por ejemplo, cuando se intenta identificar una mutación cancerosa en presencia de ADN normal. Por lo tanto, se requiere una tasa de error baja para detectar una mutación con una abundancia relativamente baja.

El primer enfoque denominado método de secuenciación profunda de amplicones marcados (Forshew et al., "Noninvasive Identification and Monitoring of Cancer Mutations by Targeted Deep Sequencing of Plasma DNA", Sci Transl Med. 4(136):136 (2012)) se basa en el diseño de cebadores para amplificar 5995 bases que cubrían regiones seleccionadas de genes relacionados con el cáncer, Incluyendo TP53, EGFR, BRAF, y KRAS. Este enfoque es susceptible de identificar mutaciones en el gen p53 a frecuencias de un 2 % a un 65 %. En este enfoque, los cebadores se diseñan para amplificar previamente el ADN (durante 15 ciclos) en una reacción multiplexada con muchos cebadores de PCR. Esto crea productos tanto deseados como no deseados, por lo que se sigue con PCR monoplexada para amplificar aún más cada uno de los productos deseados. Los fragmentos se someten a una PCR de código de barras final antes de la secuenciación convencional de nueva generación. La ventaja de este enfoque es que usa la PCR-PCR multiplexada sometida a ensayo a lo largo del tiempo, que es incomparable para la amplificación de números bajos de ácidos nucleicos de partida. La desventaja es que este enfoque no es susceptible de distinguir una verdadera mutación de un error de PCR en las primeras rondas de amplificación. Por lo tanto, aunque la sensibilidad de un 2 % (es decir, detectar un alelo mutante en 50 alelos en peso) es suficiente para evaluar cánceres en estadio tardío antes de tomar una decisión sobre el tratamiento, no es lo suficientemente sensible para la detección precoz.

Una variación del primer enfoque se denomina Sistema de Secuenciación Segura "Safe-SeqS" (Kinde et al., "Detection and Quantification of Rare Mutations with Massively Parallel Sequencing", Proc Natl Acad Sci USA 108(23):9530-5 (2011)), donde el ADN genómico cortado aleatoriamente se añade a los extremos de los conectores ligados al ADN genómico. El enfoque demostró que la gran mayoría de las mutaciones descritas a partir de la secuenciación genómica son en realidad errores y redujo los supuestos errores de secuenciación en al menos 70 veces. Del mismo modo, un enfoque denominado secuenciación profunda ultrasensible (Narayan et al., "Ultrasensitive Measurement of Hotspot Mutations in Tumor DNA in Blood Using Error-suppressed Multiplexed Deep Sequencing", Cancer Res. 72(14):3492-8 (2012)) añade códigos de barras en cebadores para una amplificación por PCR anidada. Supuestamente, un sistema similar de adición de códigos de barras se desarrolló para detectar mutaciones raras y variaciones en el número de copias que depende de herramientas bioinformáticas (Talasaz, A.; Systems and Methods to Detect Rare Mutations and Copy Number Variation, documento de solicitud de patente de Estados Unidos US 2014/0066317 A1, 6 de marzo de 2014). Las lecturas de los extremos coincidentes se usan para cubrir la región que contiene la supuesta mutación. Este método se usó para rastrear mutaciones conocidas en el plasma de pacientes con cáncer en estadio tardío. Estos enfoques requieren muchas lecturas para establecer secuencias consenso. Ambos métodos requieren extenderse a través del ADN diana y, por lo tanto, podría ser imposible distinguir la mutación verdadera del error generado por la polimerasa, especialmente cuando se copia a través de una base dañada, tal como citosina desaminada. Por último, estos métodos no proporcionan información sobre el estado de metilación de los sitios CpG dentro del fragmento.

El segundo enfoque denominado Secuenciación dúplex (Schmitt et al., "Detection of Ultra-Rare Mutations by Next-Generation Sequencing", Proc Natl Acad Sci USA 109(36):14508-13 (2012)) se basa en el uso de conectores dúplex que contienen 12 marcas aleatorias de base. Al amplificar las hebras tanto superior como inferior del ADN diana de entrada, un fragmento determinado obtiene un identificador único (formado por 12 bases en cada extremo) de modo que se puede rastrear mediante secuenciación. Las lecturas de secuencias que comparten un conjunto único de marcas se agrupan en familias coincidentes con miembros que tienen identificadores de hebra en cualquiera de las orientaciones de hebra superior o hebra inferior. Cada par de familias refleja la amplificación de un fragmento de ADN bicatenario. Las mutaciones presentes solo en uno o unos pocos miembros de la familia representan errores de secuenciación o errores introducidos por la PCR que se producen al final de la amplificación. Las mutaciones que se producen en muchos o todos los miembros de una familia en un par surgen de errores de la PCR durante la primera ronda de amplificación, como podría ocurrir cuando se copia en sitios de daño mutagénico del ADN. Por otro lado, las mutaciones verdaderas presentes en ambas cadenas de un fragmento de ADN aparecen en todos los miembros de un par familiar. Aunque las mutaciones de artefactos pueden producirse simultáneamente en un par familiar con una mutación verdadera, todas, excepto las que surgen durante la primera ronda de amplificación por PCR, se pueden identificar independientemente y descartarse cuando se produce una secuencia consenso monocatenaria con corrección de errores. Las secuencias obtenidas de cada una de las dos hebras de un dúplex de ADN individual a continuación se pueden comparar para obtener la secuencia consenso del dúplex, lo que elimina los errores restantes que se produjeron durante la primera ronda de PCR. La ventaja de este enfoque es que distingue sin ambigüedades las mutaciones verdaderas de los errores de PCR o del daño del ADN mutagénico, y consigue una tasa de error extraordinariamente baja de 3,8 x 10-10. La desventaja de este enfoque es que para obtener al menos cinco miembros de cada hebra en un par familiar (es decir, un mínimo de 10 lecturas de secuencia por fragmento original, pero a menudo requiere muchas más debido a las fluctuaciones) es necesario secuenciar muchos fragmentos. Además, el método no se ha sometido a ensayo en ADNcf, que tiende a ser más pequeño que los fragmentos generados a partir del ADN genómico intacto y, por lo tanto, podría requerir la secuenciación de más fragmentos para cubrir todas las mutaciones potenciales. Por último, el método no proporciona información sobre el estado de metilación de los sitios CpG dentro del fragmento.

El tercer enfoque, denominado smMIP para sondas de inversión molecular de molécula única (Hiatt et al., "Single Molecule Molecular Inversion Probes for Targeted, High-Accuracy Detection of Low-Frequency Variation", Genome Res. 23(5):843-54 (2013) combina el marcado de una sola molécula con la captura multiplexada para permitir una detección altamente sensible de la variación subclonal de baja frecuencia. El método afirma una tasa de error de 2,6 x 10-5 en muestras de ensayo clínicas. La desventaja de este enfoque es que es necesario secuenciar muchos fragmentos para obtener al menos cinco miembros de cada hebra en un par familiar (es decir, un mínimo de 10 lecturas de secuencia por fragmento original, pero a menudo requiere muchas más debido a las fluctuaciones). Además, el método requiere extenderse a través del ADN diana, y por lo tanto podría ser imposible distinguir la mutación verdadera, debido a un error generado por la polimerasa, especialmente al copiar a través de una base dañada, tal como la citosina desaminada. Además, el método no se ha sometido a ensayo en ADNcf, que tiende a ser más pequeño que los fragmentos generados a partir del ADN genómico intacto y, por lo tanto, podría requerir la secuenciación de más fragmentos para cubrir todas las mutaciones potenciales. Por último, el método no proporciona información sobre el estado de metilación de los sitios CpG dentro del fragmento.

El cuarto enfoque, denominado secuenciación circular (Lou et al., "High-throughput DNA Sequencing Errors are Reduced by Orders of Magnitude Using Circle Sequencing", Proc Natl Acad Sci USA 110(49): 19872-7 (2013), véanse también Mutational and fitness landscapes of an RNA virus revealed through population sequencing. Acevedo A, Brodsky L, Andino R., Nature. 30 de enero de 2014; 505(7485):686-90; y Library preparation for highly accurate population sequencing of RNA viruses. Acevedo A, Andino R. Nat Protoc., julio de 2014; 9(7):1760-9) se basa en el corte de a Dn o ARN a aproximadamente 150 bases, desnaturalización para formar hebras simples, circularización de esas cadenas sencillas, usando cebadores hexaméricos aleatorios y ADN polimerasa phi29 para amplificación por círculo rodante (en presencia de Uracil-ADN glicosilasa y Formamidopirimidin-ADN glicosilasa), volviendo a cortar los productos a unas 500 bases y a continuación desarrollando la secuenciación convencional de nueva generación. La ventaja de este enfoque es que la amplificación por círculo rodante hace múltiples copias en tándem del ADN diana original, de modo que puede aparecer un error de polimerasa en una sola copia, pero una mutación verdadera aparece en todas las copias. Las familias leídas tienen un tamaño promedio de 3 copias porque las copias están físicamente unidas entre sí. El método también usa Uracil-ADN glicosilasa y Formamidopirimidin-ADN glicosilasa para retirar dianas que contienen bases dañadas, para eliminar tales errores. La ventaja de esta tecnología es que lleva la tasa de error de secuenciación de un nivel actual de aproximadamente 0,1 a 1 x 10'2, a una tasa tan baja como 7,6 x 10'6. La última tasa de error ahora es suficiente para distinguir mutaciones cancerosas en plasma en presencia de un exceso de 100 a 10.000 veces de ADN de tipo silvestre. Una ventaja adicional es que 2-3 copias de la misma secuencia están unidas físicamente, lo que permite la verificación de una mutación verdadera a partir de datos de secuencias generados a partir de un solo fragmento, en contraposición a al menos 10 fragmentos usando el enfoque de secuenciación de dúplex. Sin embargo, el método no proporciona la capacidad de determinar cambios en el número de copias, ni proporciona información sobre el estado de metilación de los sitios CpG dentro del fragmento.

El quinto enfoque, desarrollado por Complete Genomics (Drmanac et al., "Human Genome Sequencing Using Unchained Base Reads on Self-Assembling DNA Nanoarrays", Science 327(5961):78-81 (2010)) se basa en el uso de lecturas de ligamiento en matrices de nanobolas. Aproximadamente 400 nucleótidos de ADN genómico se circularizan con conectores, se escinden, se recircularizan con conectores adicionales y por último se recircularizan para que contengan aproximadamente cuatro conectores. El ADN se amplifica por círculo rodante utilizando ADN polimerasa phi 29 para generar nanobolas. A continuación, estas se colocan en una matriz y se secuencian usando un enfoque basado en ligamiento. El punto sobresaliente de este enfoque, de relevancia en el presente documento, es que se pueden generar múltiples copias en tándem de la misma secuencia y posteriormente se pueden secuenciar a partir de un único producto de amplificación por círculo rodante. Dado que la misma secuencia es interrogada varias veces por ligasa o polimerasa (combinando el círculo rodante con otros enfoques de secuenciación por síntesis), la tasa de error por base se puede reducir significativamente. Como tal, la secuenciación directamente de un producto de círculo rodante proporciona muchas de las mismas ventajas del enfoque de secuenciación por círculo que se ha descrito anteriormente.

El sexto enfoque, denominado secuenciación en tiempo real de una sola molécula SMRT (Flusberg et al., "Direct Detection of DNA Methylation During Single-Molecule, Real-Time Sequencing", Nat Methods 7(6):461-5 (2010)) se basa en añadir bucles horquillados en los extremos de un fragmento de ADN y permitir que una ADN polimerasa con actividad de desplazamiento de hebra se extienda alrededor del bucle cerrado covalentemente, proporcionando información de secuencia en las dos cadenas complementarias. Específicamente, las moléculas individuales de polimerasa catalizan la incorporación de nucleótidos marcados con fluorescencia en cadenas complementarias de ácido nucleico. La polimerasa se ralentiza o "interrumpe el ritmo" cuando incorpora un nucleótido frente a una base metilada, y los pulsos de fluorescencia resultantes permiten la detección directa de nucleótidos modificados en el molde de ADN, que incluye N6-metiladenina, 5-metilcitosina y 5-hidroximetilcitosina. La precisión del enfoque ha mejorado, especialmente porque la polimerasa puede atravesar el bucle cerrado varias veces, lo que permite la determinación de una secuencia consenso. Aunque la técnica está diseñada para proporcionar información de secuencia en sustratos en forma de "mancuerna" (que contienen principalmente las dos secuencias complementarias de un fragmento lineal de ADN), también se puede aplicar a sustratos circulares monocatenarios. El documento de patente WO 2015/089333 discute métodos para identificar variantes de secuencias en una muestra de ácido nucleico.

El documento de patente WO 2012/003374 discute la preparación de genoteca de secuencia diana mediante circularización de ADN genómico.

La presente invención se refiere a la superación de éstas y otras deficiencias en la técnica.

SUMARIO DE LA INVENCIÓN

La invención se define mediante las reivindicaciones.

Una divulgación se refiere a una colección de diferentes construcciones de ácido nucleico monocatenario quiméricas circulares. Cada construcción de la colección está formada por un primer segmento monocatenario de ADN genómico original de un organismo hospedador y un segundo segmento de ácido nucleico sintético monocatenario que está unido al primer segmento monocatenario y comprende una secuencia nucleotídica que es exógena al organismo hospedador. El segundo segmento de ácido nucleico sintético monocatenario comprende una parte de identificador único, en donde la secuencia de nucleótidos tanto de la parte de identificador único como del segmento de ADN genómico original distingue una construcción de ácido nucleico monocatenario quimérica en la colección de otra construcción de ácido nucleico monocatenario quimérica en la colección. Las construcciones de ácido nucleico monocatenario quiméricas de la colección están circularizadas y son adecuadas para amplificación por círculo rodante y/o secuenciación.

La invención proporciona un sistema que comprende

una colección de diferentes construcciones de ácido nucleico monocatenario quiméricas circulares. Cada construcción de la colección comprende un primer segmento monocatenario de ^aDⁿgenómico original de un organismo hospedador y un segundo segmento de ácido nucleico monocatenario que está unido al primer segmento monocatenario y comprende una secuencia nucleotídica que es exógena al organismo hospedador. La secuencia nucleotídica del segundo segmento de ácido nucleico monocatenario comprende una primera parte específica de cebador de soporte sólido, una segunda parte específica de cebador de soporte sólido, y una secuencia de identificador de paciente. Las construcciones de ácido nucleico monocatenario quiméricas de la colección están circularizadas y son adecuadas para amplificación por círculo rodante y/o secuenciación. El sistema además comprende una colección de productos de extensión, comprendiendo cada producto de extensión dos o más secuencias lineales en tándem complementarias a la construcción de ácido nucleico monocatenario quimérica de la colección. Cada producto de extensión en la colección se hibrida con su construcción de ácido nucleico monocatenario quimérica circular complementaria de la colección.

La invención también proporciona un sistema que comprende una colección de diferentes construcciones de ácido nucleico monocatenario quiméricas circulares. Cada construcción comprende un primer segmento monocatenario de ADN genómico original de un organismo hospedador y un segundo segmento de ácido nucleico monocatenario que está unido al primer segmento monocatenario y comprende una secuencia nucleotídica que es exógena al organismo hospedador. La secuencia nucleotídica del segundo segmento de ácido nucleico monocatenario comprende una primera parte específica de cebador de soporte sólido, una segunda parte específica de cebador de soporte sólido, y una secuencia de identificador de paciente. Las construcciones de ácido nucleico monocatenario quiméricas de la colección son adecuadas para amplificación por círculo rodante y/o secuenciación. El sistema además comprende uno o más cebadores de amplificación de oligonucleótidos, comprendiendo cada cebador al menos una primera parte de secuencia nucleotídica que es complementaria a la primera parte específica de cebador de soporte sólido o la segunda parte específica de cebador de soporte sólido de las construcciones de ácido nucleico monocatenario quiméricas de la colección; y una polimerasa adecuada para amplificación por círculo rodante.

La invención también proporciona métodos para secuenciar una pluralidad de moléculas de ácido nucleico en una muestra usando los sistemas de la presente invención.

Otra divulgación se refiere a un método para identificar, en una muestra, una o más moléculas de ácido ribonucleico diana que se diferencian de otras moléculas de ácido nucleico en la muestra en una o más bases. Este método implica proporcionar una muestra que contiene una o más moléculas de ácido ribonucleico diana que contienen potencialmente una o más diferencias de bases y generar, en la muestra, ADNc de la una o más moléculas de ácido ribonucleico diana, si estuvieran presentes en la muestra. El método además implica proporcionar una o más primeras sondas oligonucleotídicas, comprendiendo cada primera sonda oligonucleotídica (a) una parte de secuencia específica de diana de ADNc en el extremo 3', (b) una parte específica de diana de ADNc en el extremo 5', y una parte adicional, comprendiendo dicha parte adicional (i) una secuencia de identificador único, (ii) una secuencia de identificador de paciente, (iii) una o más secuencias de unión a cebador, o cualquier combinación de (i), (ii), y (iii), y poner en contacto la muestra y la una o más primeras sondas oligonucleotídicas en condiciones eficaces para que las partes específicas de diana en los extremos 3' y 5' de las primeras sondas oligonucleotídicas se hibriden de una forma específica según la base con regiones complementarias del ADNc. Se generan una o más uniones competentes para ligamiento adecuadas para acoplar los extremos 3' y 5' de una primera sonda oligonucleotídica hibridada con su ADNc complementario y la una o más primeras sondas oligonucleotídicas en la una o más uniones de ligamiento se ligan para formar productos ligados circulares que comprenden una copia de ácido desoxirribonucleico de la secuencia de ácido ribonucleico diana acoplada a la parte adicional de la primera sonda oligonucleotídica. El método además implica detectar y distinguir los productos ligados circulares en la muestra para identificar la presencia de una o más moléculas de ácido ribonucleico diana que se diferencian de otras moléculas de ácido ribonucleico en la muestra en una o más bases.

Otra divulgación se refiere a un método para identificar, en una muestra, una o más moléculas de ácido nucleico que comprenden potencialmente regiones de primera diana y segunda diana distintas acopladas entre sí. Este método implica proporcionar una muestra que contiene potencialmente una o más moléculas de ácido nucleico que comprenden regiones de primera diana y segunda diana distintas acopladas entre sí, y proporcionar uno o más conjuntos de sondas oligonucleotídicas, comprendiendo cada conjunto de sondas (i) una primera sonda oligonucleotídica que comprende una primera parte específica de diana en el extremo 5', una segunda parte específica de diana en el extremo 3', y una parte adicional, y (ii) una segunda sonda oligonucleotídica que comprende una segunda parte específica de diana en el extremo 5', una primera parte específica de diana en el extremo 3', y una parte adicional, en donde la parte adicional de la primera o la segunda sondas oligonucleotídicas de un conjunto de sondas comprende (i) una secuencia de identificador único, (ii) una secuencia de identificador de paciente, (iii) una o más secuencias de unión a cebador, o cualquier combinación de (i), (ii), y (iii). Este método además implica poner en contacto la muestra y el uno o más conjuntos de sondas oligonucleotídicas en condiciones eficaces para que la primera y segunda sondas oligonucleotídicas se hibriden de una forma específica según la base con sus correspondientes primera y segunda regiones diana de la molécula de ácido nucleico, si estuvieran presentes en la muestra, y generar una o más uniones competentes para ligamiento adecuadas acoplar los extremos 3' de las primeras sondas oligonucleotídicas a los extremos 5' de las segundas sondas oligonucleotídicas de un conjunto de sondas y para acoplar los extremos 5' de las primeras sondas oligonucleotídicas a los extremos 3' de las segundas sondas oligonucleotídicas de un conjunto de sondas cuando dichos conjuntos de sondas se hibridan con primeras y segundas regiones diana complementarias de una molécula de ácido nucleico. El primer y segundo oligonucleótidos de un conjunto de sondas están ligados a la una o más uniones competentes para ligamiento para formar productos ligados circulares que comprenden una secuencia nucleotídica que corresponde a la primera y segunda regiones diana distintas de una molécula de ácido nucleico acoplada a una parte adicional, y los productos ligados circulares se detectan y distinguen en la muestra identificando de ese modo la presencia, si la hubiera, de una o más moléculas de ácido nucleico que comprenden regiones de primera diana y segunda diana distintas acopladas entre sí en la muestra.

Otra divulgación se refiere a un método para identificar, en una muestra, una o más moléculas de ácido ribonucleico diana que se diferencian de otras moléculas de ácido nucleico en la muestra en una o más bases. Este método implica proporcionar una muestra que contiene una o más moléculas de ácido ribonucleico diana que contienen potencialmente una o más diferencias de bases, y añadir conectores nucleotídicos a los extremos 3' y 5' de las moléculas de ácido ribonucleico diana en la muestra. Este método además implica proporcionar una o más sondas oligonucleotídicas, comprendiendo cada sonda oligonucleotídica (a) una parte en el extremo 3' complementaria al conector nucleotídico en el extremo 3' de la molécula de ácido ribonucleico diana, (b) una parte en el extremo 5' complementaria al conector nucleotídico en el extremo 5' de las moléculas de ácido ribonucleico diana, y (c) una parte adicional, comprendiendo dicha parte adicional (i) una secuencia de identificador único, (ii) una secuencia de identificador de paciente, (iii) una o más secuencias de unión a cebador, o cualquier combinación de (i), (ii), y (iii). La muestra se pone en contacto con la una o más sondas oligonucleotídicas en condiciones eficaces para que las partes en los extremos 3' y 5' de las sondas oligonucleotídicas se hibriden de una forma específica según la base con conectores nucleotídicos complementarios en las moléculas de ácido ribonucleico diana, si estuvieran presentes en la muestra. El extremo 3' de la sonda oligonucleotídica hibridada se extiende para generar un complemento de la una o más moléculas de ácido ribonucleico diana, y el extremo 3' extendido de la sonda oligonucleotídica está ligado al extremo 5' de la sonda oligonucleotídica para formar un producto ligado circular que comprende una secuencia complementaria al conector nucleotídico en el extremo 3' de la molécula de ácido ribonucleico diana, una secuencia complementaria al conector nucleotídico en el extremo 5' de la molécula de ácido ribonucleico diana, el complemento de la una o más moléculas de ácido ribonucleico diana, y la parte adicional de la sonda oligonucleotídica. Este método además implica detectar y distinguir los productos ligados circulares en la muestra identificando de ese modo la presencia de una o más moléculas de ácido ribonucleico diana que se diferencian de otras moléculas de ácido nucleico en la muestra en una o más bases.

Otra divulgación se refiere a un método para identificar, en una muestra, una o más moléculas de ácido ribonucleico diana que se diferencian de otras moléculas de ácido nucleico en la muestra en una o más bases. Este método implica proporcionar una muestra que contiene una o más moléculas de ácido ribonucleico diana que contienen potencialmente una o más diferencias de bases, y ligar conectores nucleotídicos a los extremos 3' y 5' de las moléculas de ácido ribonucleico diana en la muestra, en donde dichos conectores nucleotídicos están acoplados entre sí mediante una parte adicional, comprendiendo dicha parte adicional (i) una secuencia de identificador único, (ii) una secuencia de identificador de paciente, (iii) una o más secuencias de unión a cebador, o cualquier combinación de (i), (ii), y (iii), por lo que dicho ligamiento forma un producto de ligamiento circular que comprende la molécula de ácido ribonucleico diana, las secuencias de conector nucleotídico en los extremos 3' y 5', y la parte adicional. Este método además implica proporcionar uno o más primeros cebadores oligonucleotídicos que comprenden una secuencia nucleotídica que es complementaria a una secuencia de conector nucleotídico en los extremos 3' o 5' del producto de ligamiento circular, e hibridarse con el uno o más primeros cebadores oligonucleotídicos al producto de ligamiento circular de una forma específica según las bases. El extremo 3' del primer cebador oligonucleotídico se extiende para generar un complemento del producto de ligamiento circular, y los complementos del producto de ligamiento circular en la muestra se detectan y distinguen, identificando de ese modo la presencia de una o más moléculas de ácido ribonucleico diana que se diferencian de otras moléculas de ácido nucleico en la muestra en una o más bases.

Otra divulgación se refiere a un método para identificar, en una muestra, una o más moléculas de ácido ribonucleico diana que se diferencian de otras moléculas de ácido nucleico en la muestra en una o más bases. Este método implica proporcionar una muestra que contiene una o más moléculas de ácido ribonucleico diana que contienen potencialmente una o más diferencias de bases, y proporcionar uno o más conjuntos de sondas oligonucleotídicas, comprendiendo cada conjunto (a) una primera sonda oligonucleotídica que tiene una parte de tallo-bucle en el extremo 5' y una parte en el extremo 3' complementaria a una parte en el extremo 3' de la molécula de ácido ribonucleico diana, (b) una segunda sonda oligonucleotídica que tiene una parte en el extremo 3' complementaria a una copia del extremo 5' de la molécula de ácido ribonucleico diana, una parte en el extremo 5' complementaria a la parte de tallo-bucle en el extremo 5' de la primera sonda oligonucleotídica, y una parte adicional que comprende (i) una secuencia de identificador de diana única, (ii) una secuencia de identificador de paciente, (iii) una secuencia de unión a cebador, o cualquier combinación de (i), (ii), y (iii). El método además implica mezclar la muestra, la una o más primeras sondas oligonucleotídicas de un conjunto de sondas, y una transcriptasa inversa para formar una reacción de transcriptasa inversa, y extender el extremo 3' de la primera sonda oligonucleotídica hibridada con su molécula de ácido ribonucleico diana complementaria para generar un complemento de la molécula de ribonucleótido diana, si estuviera presente en la muestra. La una o más segundas sondas oligonucleotídicas de un conjunto de sondas se hibridan con las primeras sondas oligonucleotídicas extendidas que comprenden un complemento de las secuencias ribonucleotídicas diana, una o más uniones competentes para ligamiento se generan entre los extremos 3' y 5' de cada segunda sonda oligonucleotídica hibridada con una primera sonda oligonucleotídica extendida. El método además implica ligar los extremos 3' y 5' de cada segunda sonda oligonucleotídica para formar productos ligados circulares que comprenden una copia de ácido desoxirribonucleico de la secuencia de ácido ribonucleico diana acoplada a la parte adicional de la segunda sonda oligonucleotídica. Los productos ligados circulares en la muestra se detectan y distinguen, identificando de ese modo la presencia de una o más moléculas de ácido ribonucleico diana que se diferencian de otras moléculas de ácido nucleico en la muestra en una o más bases.

La importancia de la divulgación es que enseña un método para la captura dirigida altamente específica de regiones de genomas y transcriptomas humanos de la sangre, es decir, de ADN libre de células circulantes, exosomas, microARN, células tumorales circulantes, o células de sangre completa, para permitir la detección altamente selectiva de mutación, expresión, número de copias, translocación, corte y empalme alternativo, y cambios de metilación adecuados para su uso en un modo de diagnóstico de alto rendimiento. Las construcciones monocatenarias de la divulgación son adecuadas para la lectura mediante una serie de tecnologías diferentes, incluyendo la secuenciación de nueva generación, y están diseñadas para ser agnóstica es con la tecnología de lectura. Con el fin de maximizar la sensibilidad de captura, la divulgación usa no solo hibridación, sino también extensión y ligamiento con polimerasa para disminuir los falsos positivos. Con el fin de maximizar la especificidad, las sondas no ligadas se digieren con exonucleasa conservando las secuencias diana circularizadas. Se puede obtener una especificidad adicional mediante la secuenciación de repeticiones en tándem de la secuencia genómica original producida por amplificación por círculo rodante. Por último, en el presente documento se desvela un método para capturar repeticiones en tándem producidas a partir de la secuencia genómica original, generadas mediante amplificación por círculo rodante en una superficie y a continuación sometiéndolas a secuenciación por síntesis, permitiendo de ese modo detección de mutación, estado de metilación y enumeración de transcriptomas altamente exactos. El método es especialmente adecuado para identificar marcadores específicos del cáncer directamente a partir de la sangre, para identificación sistemática del cáncer, así como para monitorizar la eficacia y la recurrencia del tratamiento. El método también es adecuado para el diagnóstico prenatal de anomalías en las copias y enfermedades mendelianas directamente a partir de la sangre materna.

BREVE DESCRIPCIÓN DE LOS DIBUJOS

La Figura 1 muestra un enfoque para amplificar las construcciones de ácido nucleico monocatenario quiméricas circulares de la divulgación en la preparación para la secuenciación de nueva generación. Este enfoque usa amplificación por círculo rodante (RCA) o replicación por círculo rodante (RCR) con hexámeros aleatorios.

La Figura 2 muestra un método para generar copias lineales en tándem de moléculas de ácido nucleico bicatenario, adecuadas para secuenciación, a partir de un producto de RCA.

La Figura 3 muestra un método para generar copias lineales en tándem de moléculas de ácido nucleico, adecuadas para secuenciación. Este método selecciona específicamente fragmentos que estaban metilados en todos los sitios BstU1 en el ADN diana inicial.

La Figura 4 muestra enfoques alternativos para amplificar las construcciones de ácido nucleico monocatenario quiméricas circulares de la presente divulgación en la preparación para la secuenciación de nueva generación. Este enfoque usa RCA con un cebador específico único ya sea en solución o sobre una superficie.

La Figura 5 ilustra un enfoque para condensar amplicones de ADN lineal generados mediante RCA o RCR en una estructura compacta antes de su captura sobre una superficie celular de flujo de secuenciación.

La Figura 6 representa un método de secuenciación de una pluralidad de moléculas de ácido nucleico en una muestra usando el sistema y métodos de la presente invención.

La Figura 7 representa un método para amplificar moléculas de ácido nucleico y capturar los amplicones resultantes sobre un soporte sólido adecuado para la secuenciación de nueva generación.

La Figura 8 muestra el proceso de secuenciación de amplicones preparados de acuerdo con los métodos de la presente invención sobre una superficie de soporte sólido.

La Figura 9 representa un método para amplificar moléculas de ácido nucleico y capturar los amplicones resultantes sobre un soporte sólido adecuado para la secuenciación de nueva generación. La secuenciación de los amplicones inmovilizados se realiza de acuerdo con los métodos que se muestran en la Figura 8. La Figura 10 representa otro método para amplificar moléculas de ácido nucleico y capturar los amplicones resultantes sobre un soporte sólido adecuado para la secuenciación de nueva generación. La secuenciación de los amplicones inmovilizados se realiza de acuerdo con los métodos que se muestran en la Figura 8. La Figura 11 representa otro método para amplificar moléculas de ácido nucleico y capturar los amplicones resultantes sobre un soporte sólido adecuado para la secuenciación de nueva generación. La secuenciación de los amplicones inmovilizados se realiza de acuerdo con los métodos que se muestran en la Figura 8.

La Figura 12 representa la amplificación por círculo rodante de una diana circular para generar ADN molde de repetición en tándem monocatenario para captura sobre un soporte sólido que comprende cebadores dobles. La Figura 13 representa un método para generar construcciones de ácido nucleico monocatenario quiméricas circulares de la presente divulgación.

La Figura 14 representa un método para generar y amplificar construcciones de ácido nucleico monocatenario quiméricas circulares de la presente divulgación.

La Figura 15 representa un método para generar construcciones de ácido nucleico monocatenario quiméricas circulares de la presente divulgación.

La Figura 16 representa un método para generar y amplificar construcciones de ácido nucleico monocatenario quiméricas circulares de la presente divulgación.

La Figura 17 representa un método para generar construcciones de ácido nucleico monocatenario quiméricas circulares de la presente divulgación.

La Figura 18 representa un método para generar y amplificar construcciones de ácido nucleico monocatenario quiméricas circulares de la presente divulgación.

La Figura 19 representa un método para generar construcciones de ácido nucleico monocatenario quiméricas circulares de la presente divulgación.

La Figura 20 representa un método para generar y amplificar construcciones de ácido nucleico monocatenario quiméricas circulares de la presente divulgación.

La Figura 21 representa un método para generar construcciones de ácido nucleico monocatenario quiméricas circulares de la presente divulgación.

La Figura 22 representa un método para generar y amplificar construcciones de ácido nucleico monocatenario quiméricas circulares de la presente divulgación.

La Figura 23 representa un método para generar construcciones de ácido nucleico monocatenario quiméricas circulares de la presente divulgación.

La Figura 24 representa un método para generar y amplificar construcciones de ácido nucleico monocatenario quiméricas circulares de la presente divulgación.

La Figura 25 representa un método para generar construcciones de ácido nucleico monocatenario quiméricas circulares de la presente divulgación.

La Figura 26 representa un método para generar y amplificar construcciones de ácido nucleico monocatenario quiméricas circulares de la presente divulgación.

La Figura 27 muestra un método para detectar metilación en sitios HinP1 contiguos en una secuencia genética conocida.

La Figura 28 representa un proceso para detectar metilación en sitios HinP1 contiguos en todo el genoma.

La Figura 29 representa un método para generar construcciones de ácido nucleico monocatenario quiméricas circulares de la presente divulgación que contienen sitios de metilación AciI contiguos.

La Figura 30 representa un método para generar y amplificar construcciones de ácido nucleico monocatenario quiméricas circulares de la presente divulgación que contienen sitios de metilación AciI contiguos.

La Figura 31 representa un método para generar construcciones de ácido nucleico monocatenario quiméricas circulares de la presente divulgación que contienen sitios de metilación Acil contiguos.

La Figura 32 representa un método para generar y amplificar construcciones de ácido nucleico monocatenario quiméricas circulares de la presente divulgación que contienen sitios de metilación AciI contiguos.

La Figura 33 muestra un proceso para detectar metilación en sitios AciI contiguos en todo el genoma.

La Figura 34 representa un método para generar construcciones de ácido nucleico monocatenario quiméricas circulares de la presente divulgación que contienen sitios HinPII sin metilar contiguos.

La Figura 35 representa un método para generar y amplificar construcciones de ácido nucleico monocatenario quiméricas circulares de la presente divulgación que contienen sitios HinP11 sin metilar contiguos.

La Figura 36 representa un método para generar construcciones de ácido nucleico monocatenario quiméricas circulares de la presente divulgación que contienen sitios AciI metilados contiguos ubicados entre sitios de restricción HaeIII.

La Figura 37 representa un método para generar y amplificar construcciones de ácido nucleico monocatenario quiméricas circulares de la presente divulgación que contienen sitios AciI metilados contiguos ubicados entre sitios de restricción HaeIII.

La Figura 38 muestra un proceso para producir construcciones de ácido nucleico monocatenario quiméricas circulares de la presente divulgación que contienen sitios Bsh1236I metilados entre sitios HaeIII en regiones genómicas de ADNcf o ADN genómico total cortado.

La Figura 39 representa un método para generar construcciones de ácido nucleico monocatenario quiméricas circulares de la presente divulgación que contienen uno o más sitios AciI metilados cerca de un sitio de restricción HaeIII en el extremo 5'.

La Figura 40 representa un método para generar y amplificar construcciones de ácido nucleico monocatenario quiméricas circulares de la presente divulgación que contienen uno o más sitios AciI metilados cerca de un sitio de restricción HaeIII en el extremo 5'.

La Figura 41 muestra un proceso para producir construcciones de ácido nucleico monocatenario quiméricas circulares adecuado para detectar sitios Bsh1236I metilados cerca de un sitio HaeIII en el extremo 5' en regiones conocidas de ADN genómico.

La Figura 42 representa un método para generar construcciones de ácido nucleico monocatenario quiméricas circulares de la presente divulgación que contienen uno o más sitios AciI metilados cerca de un sitio de restricción HaeIII en el extremo 3'.

La Figura 43 representa un método para generar y amplificar construcciones de ácido nucleico monocatenario quiméricas circulares de la presente divulgación que contienen uno o más sitios AciI metilados cerca de un sitio de restricción HaeIII en el extremo 3'.

La Figura 44 muestra un proceso para producir construcciones de ácido nucleico monocatenario quiméricas circulares adecuado para detectar sitios Bsh1236I metilados cerca de un sitio HaeIII en el extremo 3' en regiones genómicas de ADNcf o ADN genómico total cortado.

La Figura 45 muestra un proceso para producir construcciones de ácido nucleico monocatenario quiméricas circulares adecuado para detectar sitios Bsh1236I metilados contiguos en regiones conocidas de ADN genómico. La Figura 46 muestra un proceso para producir construcciones de ácido nucleico monocatenario quiméricas circulares adecuado para detectar todos los sitios CpG metilados cerca de sitios Bsh1236I en regiones conocidas de ADN genómico.

La Figura 47 representa un método para generar construcciones de ácido nucleico monocatenario quiméricas circulares de la presente divulgación que contienen sitios HinPII sin metilar contiguos.

La Figura 48 representa un método para generar y amplificar construcciones de ácido nucleico monocatenario quiméricas circulares de la presente divulgación que contienen sitios HinP1I sin metilar contiguos.

La Figura 49 representa un método para generar construcciones de ácido nucleico monocatenario quiméricas circulares de la presente divulgación que contienen sitios AciI metilados contiguos ubicados entre sitios de restricción HaeIII.

La Figura 50 representa un método para generar y amplificar construcciones de ácido nucleico monocatenario quiméricas circulares de la presente divulgación que contienen sitios AciI metilados contiguos ubicados entre sitios de restricción HaeIII.

La Figura 51 representa un proceso para detectar sitios HinPII contiguos metilados en regiones genómicas conocidas.

La Figura 52 representa un proceso para detectar sitios AciI contiguos sin metilar en regiones genómicas conocidas.

La Figura 53 representa un método para generar construcciones de ácido nucleico monocatenario quiméricas circulares de la presente divulgación que contienen sitios HinPII contiguos sin metilar en regiones genómicas conocidas.

La Figura 54 representa un método para generar y amplificar construcciones de ácido nucleico monocatenario quiméricas circulares de la presente divulgación que contienen sitios HinPII contiguos sin metilar en regiones genómicas conocidas.

La Figura 55 representa un método para generar construcciones de ácido nucleico monocatenario quiméricas circulares de la presente divulgación que contienen sitios HinPII contiguos sin metilar en regiones genómicas conocidas.

La Figura 56 representa un método para generar y amplificar construcciones de ácido nucleico monocatenario quiméricas circulares de la presente divulgación que contienen sitios HinPlI contiguos sin metilar en regiones genómicas conocidas.

La Figura 57 muestra un proceso para detectar sitios HinPlI contiguos sin metilar en regiones genómicas conocidas.

La Figura 58 representa un método para generar construcciones de ácido nucleico monocatenario quiméricas circulares de la presente divulgación que contienen sitios Hph1 contiguos sin metilar en regiones genómicas conocidas.

La Figura 59 representa un método para generar y amplificar construcciones de ácido nucleico monocatenario quiméricas circulares de la presente divulgación que contienen sitios Hph1 contiguos sin metilar en regiones genómicas conocidas.

La Figura 60 representa un método para generar construcciones de ácido nucleico monocatenario quiméricas circulares de la presente divulgación que contienen sitios Hph1 contiguos sin metilar en regiones genómicas conocidas.

La Figura 61 representa un método para generar y amplificar construcciones de ácido nucleico monocatenario quiméricas circulares de la presente divulgación que contienen sitios Hph1 contiguos sin metilar en regiones genómicas conocidas.

La Figura 62 muestra un proceso para detectar sitios Hph1 contiguos sin metilar en regiones genómicas conocidas.

La Figura 63 muestra un proceso para producir construcciones de diana de ácido nucleico monocatenario quimérico circular a partir de ADNcf o ADN genómico cortado adecuadas para secuenciación.

La Figura 64 muestra un proceso para producir construcciones de diana de ácido nucleico monocatenario quimérico circular a partir de ADNcf o ADN genómico cortado adecuadas para secuenciación.

La Figura 65 muestra un proceso para producir construcciones de diana de ácido nucleico monocatenario quimérico circular a partir de ADNcf o ADN genómico cortado adecuadas para secuenciación.

La Figura 66 muestra el diseño del conector y ligamiento para generar moldes listos para la secuenciación a partir de ADNcf.

La Figura 67 muestra el diseño del conector con "huecos" para secuenciar, identificar y verificar mutaciones en ambas hebras diana de ADNcf.

La Figura 68 muestra el diseño del conector para secuenciar, identificar y verificar mutaciones en ambas hebras diana de ADNcf usando adaptación de C3, ligamiento, activación de rG que contiene conectores con RNasaH2, llenado de huecos y ligamiento.

La Figura 69 muestra el diseño del conector para secuenciar e identificar mutaciones en cualquier hebra diana de ADNcf usando adaptación de dA con inserción de rA limitada, adaptación de C3, ligamiento, activación de rG que contiene conectores con RNasaH2, llenado de huecos y ligamiento.

La Figura 70 muestra un proceso para producir construcciones de diana de ácido nucleico monocatenario quimérico circular a partir de ADNcf o ADN genómico cortado adecuadas para secuenciación.

La Figura 71 muestra un proceso para producir construcciones de diana de ácido nucleico monocatenario quimérico circular a partir de ADNcf que implica activación con RNasa H2.

La Figura 72 muestra otro proceso a modo de ejemplo para producir construcciones de diana de ácido nucleico monocatenario quimérico circular a partir de ADNcf que implica activación con RNasa H2.

La Figura 73 muestra la generación de ADN circular monocatenario que comprende ADNcf diana original con un cebador hibridado.

La Figura 74 muestra la generación de ADN circular monocatenario que comprende ADNcf diana original con un cebador hibridado que contiene un grupo de captura.

La Figura 75 muestra la generación de ADN circular monocatenario que comprende ADNcf diana original con cebador hibridado usando desbloqueo con RNasaH2 del cebador específico de diana.

La Figura 76 muestra la generación de ADN circular monocatenario que comprende ADNcf diana original con un cebador hibridado que contiene un grupo de captura, usando desbloqueo con RNasaH2 del cebador específico de diana.

La Figura 77 muestra un proceso para producir construcciones de diana de ácido nucleico monocatenario quimérico circular a partir de ADNcf o ADN genómico cortado adecuadas para secuenciación.

La Figura 78 muestra un proceso para producir construcciones de diana de ácido nucleico monocatenario quimérico circular a partir de ADNcf o ADN genómico cortado adecuadas para secuenciación.

La Figura 79 muestra un proceso para enriquecer ADN circular monocatenario específico de diana usando captura con cebadores específicos de diana que posteriormente se pueden usar para amplificación por círculo rodante.

La Figura 80 muestra un proceso para enriquecer ADN circular monocatenario específico de diana usando captura mediante cebadores específicos de diana en tándem con huecos que posteriormente se pueden usar para amplificación por círculo rodante.

La Figura 81 muestra un proceso para enriquecer ADN circular monocatenario específico de diana usando cebadores específicos de diana que posteriormente se pueden usar para amplificación por círculo rodante. La Figura 82 muestra un proceso para generar y enriquecer productos de extensión de repetición en tándem monocatenarios específicos de diana genómica adecuados para secuenciación.

La Figura 83 muestra un proceso para generar y enriquecer productos de extensión de repetición en tándem monocatenarios específicos de diana genómica adecuados para secuenciación.

La Figura 84 muestra un proceso para generar y enriquecer productos de extensión de repetición en tándem monocatenarios específicos de diana genómica adecuados para secuenciación.

La Figura 85 muestra un proceso para generar y enriquecer productos de extensión de repetición en tándem monocatenarios específicos de diana genómica adecuados para secuenciación.

La Figura 86 muestra un proceso para generar y enriquecer productos de extensión de repetición en tándem monocatenarios específicos de diana genómica adecuados para secuenciación.

La Figura 87 muestra un proceso para generar y enriquecer productos de extensión de repetición en tándem monocatenarios específicos de diana genómica adecuados para secuenciación.

La Figura 88 muestra un proceso para generar y enriquecer productos de extensión de repetición en tándem monocatenarios específicos de diana genómica adecuados para secuenciación.

La Figura 89 muestra un proceso para generar y enriquecer productos de extensión de repetición en tándem monocatenarios específicos de diana genómica adecuados para secuenciación.

La Figura 90 muestra el mapeo de una familia de sondas oligonucleotídicas ("oligo") a lo largo de una colección de fragmentos diana de ADN libre de células (ADNcf) (160 nucleótidos de longitud) en incrementos de 10 bases nucleotídicas. Cada sonda oligonucleotídica contiene una parte específica de diana en el extremo 3' de 20 bases, una parte específica de diana en el extremo 5' de 60 bases, un conector de 10 bases (barra de color negro), y secuencia de identificador compuesto de 20 - 160 bases (línea fina).

La Figura 91 muestra el mapeo de una familia de sondas oligonucleotídicas ("oligo"), a lo largo de una colección de fragmentos diana de ADNcf (160 nucleótidos de longitud) en incrementos de 10 bases nucleotídicas. Cada sonda oligonucleotídica contiene una parte específica de diana en el extremo 3' de 20 bases, una parte específica de diana en el extremo 5' de 80 bases, un conector de 10 bases (barra de color negro), y secuencia de identificador compuesto de 20 - 160 bases (línea fina).

La Figura 92 muestra el mapeo de una familia de sondas oligonucleotídicas ("oligo"), a lo largo de una colección de fragmentos diana de ADNcf (160 nucleótidos de longitud) en incrementos de 10 bases nucleotídicas. Cada sonda oligonucleotídica contiene una parte específica de diana en el extremo 3' de 50 bases, una parte específica de diana en el extremo 5' de 60 bases, un conector de 10 bases (barra de color negro), y secuencia de identificador compuesto de 20 - 160 bases (línea fina).

La Figura 93 muestra el mapeo de una familia de sondas oligonucleotídicas ("oligo"), a lo largo de una colección de fragmentos diana de ADNcf (160 nucleótidos de longitud) en incrementos de 10 bases nucleotídicas. Cada sonda oligonucleotídica contiene una parte específica de diana en el extremo 3' de 50 bases, una parte específica de diana en el extremo 5' de 80 bases, un conector de 10 bases (barra de color negro), y secuencia de identificador compuesto de 20 - 160 bases (línea fina).

La Figura 94 muestra el mapeo de una familia de sondas oligonucleotídicas ("oligo"), a lo largo de una colección de fragmentos diana de ADNcf (160 nucleótidos de longitud) en incrementos de 10 bases nucleotídicas. Cada sonda oligonucleotídica contiene una parte específica de diana en el extremo 3' de 50 bases, una parte específica de diana en el extremo 5' de 50 bases, conectores de 10 bases en los extremos 3' y 5' (barra de color negro), y secuencia de identificador compuesto de 20 - 160 bases (línea fina).

La Figura 95 muestra el mapeo de una familia de sondas oligonucleotídicas ("oligo"), a lo largo de una colección de fragmentos diana de ADNcf (160 nucleótidos de longitud) en incrementos de 10 bases nucleotídicas. Cada sonda oligonucleotídica contiene una parte específica de diana en el extremo 3' de 60 bases, una parte específica de diana en el extremo 5' de 60 bases, conectores de 10 bases en los extremos 3' y 5' (barra de color negro), y secuencia de identificador compuesto de 20 - 160 bases (línea fina).

La Figura 96 muestra el mapeo de una familia de sondas oligonucleotídicas ("oligo"), a lo largo de una colección de fragmentos diana de ADNcf (160 nucleótidos de longitud) en incrementos de 10 bases nucleotídicas. Cada sonda oligonucleotídica contiene una parte específica de diana en el extremo 3' de 50 bases, una parte específica de diana en el extremo 5' de 50 bases, y secuencia de identificador compuesto de 20 - 160 bases (línea fina).

La Figura 97 muestra el mapeo de una familia de sondas oligonucleotídicas ("oligo"), a lo largo de una colección de fragmentos diana de ADNcf (160 nucleótidos de longitud) en incrementos de 10 bases nucleotídicas. Cada sonda oligonucleotídica una parte específica de diana en el extremo 3' de 60 bases, una parte específica de diana en el extremo 5' de 60 bases, y secuencia de identificador compuesto de 20 - 160 bases (línea fina).

La Figura 98 muestra el mapeo de una familia de sondas oligonucleotídicas ("oligo"), a lo largo de una colección de fragmentos diana de ADNcf (160 nucleótidos de longitud) en incrementos de 10 bases nucleotídicas. Cada sonda oligonucleotídica contiene una parte específica de diana en el extremo 3' de 70 bases, una parte específica de diana en el extremo 5' de 70 bases, y secuencia de identificador compuesto de 20 - 160 bases (línea fina).

La Figura 99 muestra el mapeo de una familia de sondas oligonucleotídicas ("oligo"), a lo largo de una colección de fragmentos diana de ADNcf (160 nucleótidos de longitud) en incrementos de 10 bases nucleotídicas. Cada sonda oligonucleotídica contiene una parte específica de diana en el extremo 3' de 80 bases, una parte específica de diana en el extremo 5' de 80 bases, y secuencia de identificador compuesto de 20 - 160 bases (línea fina).

La Figura 100 ilustra cómo diseñar sondas oligonucleotídicas con una estrategia de mosaico solapante para secuenciar regiones diana contiguas de mayor tamaño (aproximadamente 500 bases que se muestra como ejemplo).

La Figura 101 ilustra cómo diseñar sondas oligonucleotídicas con una estrategia de mosaico solapante para secuenciar regiones diana contiguas de mayor tamaño (aproximadamente 500 bases que se muestra como ejemplo).

La Figura 102 ilustra cómo diseñar sondas oligonucleotídicas con una estrategia de mosaico solapante para secuenciar regiones diana contiguas de mayor tamaño (aproximadamente 500 bases que se muestra como ejemplo).

La Figura 103 ilustra cómo diseñar sondas oligonucleotídicas con una estrategia de mosaico solapante para secuenciar regiones diana contiguas de mayor tamaño (aproximadamente 500 bases que se muestra como ejemplo).

La Figura 104 muestra oligonucleótidos marcados en fase específicos de diana en mosaico a través de dianas génicas contiguas de 160 pb en un tramo de ADN genómico.

La Figura 105 muestra oligonucleótidos marcados en fase específicos de diana en mosaico a través de dianas génicas contiguas de 160 pb en un tramo de ADN genómico.

La Figura 106 muestra oligonucleótidos marcados en fase específicos de diana en mosaico a través de dianas génicas contiguas de 160 pb en un tramo de ADN genómico.

La Figura 107 muestra oligonucleótidos marcados en fase específicos de diana en mosaico a través de dianas génicas contiguas de 160 pb en un tramo de ADN genómico.

La Figura 108 representa un método para generar construcciones de ácido nucleico monocatenario quiméricas circulares que comprenden una copia de secuencia de desoxirribonucleico de una molécula de ácido ribonucleico diana. Las construcciones circulares son adecuadas para RCA y secuenciación de acuerdo con los métodos de la presente invención.

La Figura 109 representa un método para generar construcciones de ácido nucleico monocatenario quiméricas circulares que comprenden una copia de secuencia de desoxirribonucleico de una molécula de ácido ribonucleico diana que contiene supuestas fusiones génicas. Las construcciones circulares son adecuadas para RCA y secuenciación de acuerdo con los métodos de la presente invención.

La Figura 110 representa un método para generar construcciones de ácido nucleico monocatenario quiméricas circulares que comprenden una copia de secuencia de desoxirribonucleico de una molécula de ácido ribonucleico diana que contiene supuestas fusiones génicas. Las construcciones circulares son adecuadas para RCA y secuenciación de acuerdo con los métodos de la presente invención.

La Figura 111 representa un método para generar construcciones de ácido nucleico monocatenario quiméricas circulares que comprenden una copia de secuencia de desoxirribonucleico de una molécula de ácido ribonucleico diana que contiene exones específicos. Las construcciones circulares son adecuadas para RCA y secuenciación de acuerdo con los métodos de la presente invención.

La Figura 112 representa un método para generar construcciones de ácido nucleico monocatenario quiméricas circulares que comprenden una copia de secuencia de desoxirribonucleico de una molécula de ácido ribonucleico diana que contiene exones específicos. Las construcciones circulares son adecuadas para RCA y secuenciación de acuerdo con los métodos de la presente invención.

La Figura 113 representa un método para generar construcciones de ácido nucleico monocatenario quiméricas circulares que comprenden un segmento de ADN que contiene polimorfismos. Las construcciones circulares son adecuadas para RCA y secuenciación de acuerdo con los métodos de la presente invención.

La Figura 114 representa un método para generar construcciones de ácido nucleico monocatenario quiméricas circulares que comprenden una secuencia de desoxirribonucleico que es complementaria a una secuencia de miARN diana. Las construcciones circulares son adecuadas para RCA y secuenciación de acuerdo con los métodos de la presente invención.

La Figura 115 representa un método para generar construcciones de ácido nucleico monocatenario quiméricas circulares que comprenden una secuencia de desoxirribonucleico que es complementaria a una secuencia de miARN diana. Las construcciones circulares son adecuadas para RCA y secuenciación de acuerdo con los métodos de la presente invención.

La Figura 116 representa un método para generar construcciones de ácido nucleico monocatenario quiméricas circulares que comprenden una secuencia de desoxirribonucleico que es complementaria a una secuencia de miARN diana. Las construcciones circulares son adecuadas para RCA y secuenciación de acuerdo con los métodos de la presente invención.

La Figura 117 representa un método para generar construcciones de ácido nucleico monocatenario quiméricas circulares que comprenden una secuencia de desoxirribonucleico que es complementaria a una secuencia de miARN diana. Las construcciones circulares son adecuadas para RCA y secuenciación de acuerdo con los métodos de la presente invención.

DESCRIPCIÓN DETALLADA DE LA INVENCIÓN

Una primera divulgación se refiere a una colección de diferentes construcciones de ácido nucleico monocatenario quiméricas circulares. Cada construcción de la colección comprende un primer segmento monocatenario de ADN genómico original de un organismo hospedador y un segundo segmento de ácido nucleico sintético monocatenario que está unido al primer segmento monocatenario y comprende una secuencia nucleotídica que es exógena al organismo hospedador. El segundo segmento de ácido nucleico sintético monocatenario comprende una parte de identificador único, en donde la secuencia nucleotídica tanto de la parte de identificador único como del segmento de ADN genómico original distingue una construcción de ácido nucleico monocatenario quimérica en la colección de otra construcción de ácido nucleico monocatenario quimérica en la colección. Las construcciones de ácido nucleico monocatenario quiméricas de la colección están circularizadas y son adecuadas para amplificación por círculo rodante y/o secuenciación.

De acuerdo con la presente divulgación, la colección contiene generalmente entre 1.000 y 4.000.000.000 de construcciones de ácido nucleico monocatenario quiméricas circulares. Los métodos para preparar las construcciones de ácido nucleico monocatenario quiméricas circulares de la colección se describen con detalle a continuación.

El primer segmento monocatenario de la construcción de ácido nucleico quimérica comprende un segmento de ADN genómico original de un hospedador. Este segmento de ADN genómico original puede ser un fragmento de ácido nucleico que sea un producto directo de la fragmentación del ADN genómico (es decir, sin adición de una o más partes conectoras a los extremos del fragmento), o un fragmento de ácido nucleico de ADN genómico al que se han añadido conectores. El segmento de ADN genómico original se puede obtener a partir de cualquier genoma, por ejemplo, un genoma de animal, vegetal, protozoo, hongo, bacteria, o virus tal como el genoma de un ser humano, manzano, giardia, levadura, Staphylococcus aureus, o virus del papiloma. El segmento de ADN se puede aislar a partir de cualquier fuente biológica recién preparada, congelada o fijada (por ejemplo, fijada con formalina o embebida en parafina), que incluye, pero no se limita a, tejido, célula, suero, plasma, sangre, o exosomas.

El segundo segmento de ácido nucleico sintético monocatenario de las construcciones de ácido nucleico de la colección está unido covalentemente al primer segmento monocatenario, por ejemplo, mediante un enlace fosfodiéster. El segundo segmento de ácido nucleico sintético monocatenario contiene una secuencia de identificador. En una realización, la secuencia de identificador es un código de barras. El código de barras es generalmente una secuencia de 8-12 bases nucleotídicas que se usa en conjunto con la secuencia del segmento de ADN genómico original para distinguir cada construcción de ácido nucleico de otra en la colección. Cuando los fragmentos de ADN genómico tienen una secuencia similar, es importante que la secuencia de identificador o del código de barras sea suficientemente divergente, de modo que no haya dos construcciones de ácido nucleico iguales. Para colecciones que comprenden aproximadamente 10.000 equivalentes genómicos (los que no más aproximados en 1 ml de ADN libre de células), las secuencias de identificador único de 8 nucleótidos contienen una diversidad suficiente (65.536) para garantizar que cada construcción circular sea única. Para colecciones que comprenden aproximadamente 1.000.000 de equivalentes genómicos (los que no más aproximados de las células totales en 10 ml de sangre), las secuencias de identificador único de 12 nucleótidos contienen una diversidad suficiente (16.777.216) para garantizar que cada construcción circular sea única. Además, cuando el ADN genómico está fragmentado aleatoriamente, cuesta fragmentado biológicamente (es decir, como en el ADN libre de células), las uniones entre el ADN genómico y el ácido nucleico sintético proporcionarán secuencias únicas adicionales para ayudar a distinguir cada construcción circular.

En otra realización, la secuencia de identificador comprende uno o más sitios de unión a cebador y/o secuencias de identificador de paciente como se describe a continuación. Los sitios de unión a cebador se usan no solo para facilitar la amplificación, sino que solos o en combinación con la secuencia de identificador de paciente pueden servir como un segmento de secuencia de identificador con la finalidad de distinguir construcciones circulares individuales dentro de la colección. Por lo tanto, la secuencia de identificador del segundo segmento monocatenario de las construcciones de ácido nucleico de la colección puede comprender una secuencia de código de barras, una o más secuencias de cebador, una secuencia de identificador de paciente, o cualquier combinación de las mismas.

Las construcciones de ácido nucleico quiméricas de la colección están circularizadas, es decir, son moléculas de ácido nucleico circularizadas cerradas. De acuerdo con la presente divulgación, las construcciones circularizadas son completamente monocatenarias. En otras divulgaciones, las construcciones circularizadas pueden ser parcialmente bicatenarias o completamente bicatenarias.

Otra divulgación de la presente invención se refiere a un método para amplificar moléculas de ácido nucleico. Este método implica proporcionar la colección de diferentes construcciones de ácido nucleico monocatenario quiméricas circulares como se desvela en el presente documento, y mezclar la colección con una polimerasa y una pluralidad de cebadores cortos (de 6 a 10 nucleótidos en donde una parte de dicha secuencia comprende bases aleatorias y/o análogos nucleotídicos; por ejemplo, hexámeros, heptámeros, octámeros aleatorios), para formar una reacción de amplificación. El uno o más de los cebadores cortos son complementarios a una parte de una o más construcciones de ácido nucleico monocatenario quiméricas circulares de la colección. La mezcla de reacción de amplificación se somete a uno o más tratamientos de hibridación y extensión, en donde el uno o más cebadores cortos se hibridan con las construcciones de ácido nucleico monocatenario quiméricas circulares y la polimerasa extienden los cebadores hibridados para producir una pluralidad de productos de extensión. Cada producto de extensión comprende dos o más secuencias lineales en tándem que son complementarias a una construcción de ácido nucleico monocatenario quimérica de la colección.

La Figura 1 (etapas A-D) proporciona una ilustración a modo de ejemplo del método que se ha descrito anteriormente para amplificar moléculas de ácido nucleico. La Figura 1, etapa A muestra una construcción de ácido nucleico monocatenario quimérica circular de una colección y una pluralidad de cebadores hexaméricos aleatorios. El primer segmento monocatenario del ADN genómico original de la construcción circular se muestra como una única línea de color negro y fina. Una mutación dentro del segmento de ADN genómico original se indica con un (*). La secuencia de identificador único de la construcción circular se muestra como una línea doble. La extensión continua de un cebador hexamérico hibridado para amplificar la diana circular se consigue usando una polimerasa susceptible de realizar desplazamiento de hebra, por ejemplo, ADN polimerasa Phi29 o similar (representado como un diamante en la Figura 1). Como se muestra en la Figura 1, etapa B, la extensión con polimerasa de un cebador hibridado desplazará opcionalmente al cebador original, creando una cola monocaternaria. Posteriormente uno o más de los cebadores hexaméricos se pueden hibridar con la cola monocatenaria, y la extensión mediada por polimerasa de esos cebadores continúa como se muestra en la Figura 1, etapas C y 1D para formar productos de extensión bicatenarios de longitud variable, conteniendo cada producto de extensión dos o más secuencias lineales en tándem que son complementarias a la construcción circular.

La colección de productos de extensión bicatenarios formados mediante este método de amplificación es adecuada para cualquiera de una amplia gama de protocolos de secuenciación de nueva generación (NGS) (por ejemplo, Pirosecuenciación 454, secuenciación por síntesis Ion Torrent™, secuenciación por ligamiento SOLiD™ o secuenciación mediante los sistemas de síntesis MiSeq™ o HiSeq™). De acuerdo con los protocolos de NGS, los productos de extensión bicatenarios están fragmentados de modo que una o más copias complementarias en tándem del ADN diana se encuentran dentro de un solo fragmento. Los conectores se añaden a los extremos 5' y 3' del ADN fragmentado para permitir la preparación de una genoteca convencional y generación de moldes usando amplificación por agrupamiento o con perlas. Durante la secuenciación se genera una secuencia consenso de todas las copias complementarias unidas físicamente de la molécula de ADN original dentro de la diana circular. Dado que las mutaciones verdaderas (*) estarán presentes 2 o 3 veces dentro de un fragmento, son fácilmente distinguibles del error de la polimerasa.

De acuerdo con este aspecto de la invención y todas las demás divulgaciones, la secuenciación de las construcciones de ácido nucleico quiméricas circulares y los productos de extensión de las mismas se puede llevar a cabo usando cualquier método de secuenciación conocido en la técnica, que incluye, pero no se limita a, secuenciación por hibridación con cebador fluorescente, hibridación con balizas moleculares, extensión de cebadores, reacción de detección de ligasa, reacción en cadena de ligasa, pirosecuenciación, secuenciación basada en exonucleasa, secuenciación por síntesis basada en fluorescencia, secuenciación por ligamiento basada en fluorescencia, secuenciación basada en nanoporos y nanotubos, secuenciación por síntesis basada en iones y secuenciación por ligamiento basada en iones. Como se usa en el presente documento, "secuenciación" incluye un método mediante el cual se obtiene la identidad de al menos 10 nucleótidos consecutivos de una diana o molde polinucleotídico.

En otra divulgación, a la construcción de ácido nucleico circular de la colección comprende un primer segmento monocatenario de ADN genómico original de un organismo hospedador y un segundo segmento de ácido nucleico sintético monocatenario que está unido al primer segmento monocatenario y comprende una secuencia nucleotídica que es exógena al organismo hospedador. El segundo segmento de ácido nucleico sintético monocatenario comprende una parte de identificador único y un sitio de unión a cebador primario, en donde la secuencia nucleotídica de la parte de identificador único, el sitio de unión a cebador primario y el segmento de ADN genómico original distingue una construcción de ácido nucleico monocatenario quimérica en la colección de otra construcción de ácido nucleico monocatenario quimérica en la colección. Las construcciones de ácido nucleico monocatenario quiméricas de la colección están circularizadas y son adecuadas para amplificación por círculo rodante y/o secuenciación.

Otra divulgación se refiere a un método para generar copias lineales en tándem de moléculas de ácido nucleico que son adecuadas para secuenciación. Este método implica proporcionar la colección de diferentes construcciones de ácido nucleico monocatenario quiméricas circulares de la presente invención como se ha descrito anteriormente, y mezclar la colección con una polimerasa con actividad de desplazamiento de hebra, y uno o más cebadores primarios, para formar una reacción de extensión por círculo rodante. El uno o más cebadores primarios son complementarios a una parte de una o más construcciones de ácido nucleico monocatenario quiméricas circulares de la colección. La mezcla de reacción de extensión por círculo rodante se somete a uno o más tratamientos de hibridación y extensión, en donde el uno o más cebadores se hibridan con las construcciones de ácido nucleico monocatenario quiméricas circulares y la polimerasa extienden los cebadores hibridados para producir una pluralidad de productos de extensión. Cada producto de extensión comprende dos o más secuencias lineales en tándem que son complementarias a una construcción de ácido nucleico monocatenario quimérica de la colección.

La Figura 2, etapas A-C proporciona una ilustración a modo de ejemplo del método que se ha descrito anteriormente para amplificar moléculas de ácido nucleico. La Figura 2, etapa A muestra una construcción de ácido nucleico monocatenario quimérica circular de una colección y un cebador primario hibridado. El primer segmento monocatenario del ADN genómico original de la construcción circular se muestra como una única línea de color negro y fina. Una mutación dentro del segmento de ADN genómico original se indica con un (*). La secuencia de identificador único y el sitio de unión a cebador primario de la construcción circular se muestran como una línea ligeramente más gruesa. La extensión continua de un cebador hibridado para amplificar la diana circular se consiguió usando una polimerasa susceptible de realizar desplazamiento de hebra, por ejemplo, ADN polimerasa Phi29 o Bst o similares (representado como un diamante en la Figura 2). Como se muestra en la Figura 2, etapa B, la extensión con polimerasa de un cebador hibridado desplazará opcionalmente al cebador original, creando una cola monocaternaria. El producto de extensión se desnaturaliza desde el círculo (véase la Figura 2, etapa C). Se proporcionan uno o más conjuntos de cebador secundarios, en donde cada conjunto de cebador comprende (a) un primer cebador sin metilar secundario que tiene una secuencia nucleotídica que es complementaria a una primera parte del producto de extensión monocatenario formado a partir del cebador primario, y (b) un segundo cebador metilado secundario que tiene una secuencia nucleotídica que es complementaria a una segunda parte del producto de extensión monocatenario. Los productos de extensión monocatenarios se mezclan con los conjuntos de cebador secundarios, una polimerasa que carece de actividad de desplazamiento de hebra, una ligasa y una endonucleasa que escinde tanto el producto de extensión monocatenario como el primer cebador secundario cuando están hibridados entre sí (es decir, la endonucleasa se escinde en una secuencia de reconocimiento bicatenaria sin metilar).

El primer y segundo cebadores secundarios se hibridan con regiones complementarias de los productos de extensión monocatenarios como se muestra en la Figura 2, etapa C. La polimerasa extiende los cebadores hibridados para formar uniones de ligamiento con cebadores secundarios hibridados en dirección 3'. La ligasa une los cebadores secundarios extendidos entre sí para formar productos de extensión bicatenarios como se muestra en la Figura 2, etapa C. La endonucleasa escinde tanto el producto de extensión como el primer cebador secundario en donde se hibridan para formar fragmentos bicatenarios que contienen copias lineales en tándem de secuencias de ADN genómico diana. El número de secuencias lineales en tándem en los fragmentos de productos de extensión bicatenarios refleja la relación entre el primer y el segundo cebadores secundarios usados en el método que se ha mencionado anteriormente. Estos fragmentos de copia en tándem son adecuados para la secuenciación usando cualquier método de secuenciación conocido en la técnica como se ha descrito anteriormente. Para la secuenciación NGS se añaden conectores para permitir la amplificación convencional por agrupamiento o con perlas y las lecturas de extremos emparejados. La mutación verdadera (*) estará presente 2 o 3 veces y, por lo tanto, se distinguirá del error de la polimerasa.

Otra divulgación se refiere a un método para generar copias lineales en tándem de moléculas de ácido nucleico, si la diana estuviera metilada en el ADN genómico original (la base metilada se representa como "m", véase la Figura 3). El proceso es esencialmente el mismo que el que se ha descrito anteriormente, usando Bst polimerasa para la extensión continua del cebador primario hibridado en presencia de endonucleasa de restricción BstUI (CGACG) (Figura 3, etapa B). BstUI escindirá el ADN bicatenario si no está metilado, pero no el ADN híbrido metilado/sin metilar ni el ADN monocatenario sin metilar (Figura 3, etapa B). (Véase Zierhut y Diffley, "Break Dosage, Cell Cycle Stage and DNA Replication Influence DNA Double Strand Break Response", EMBO J. 27(13): 1875-85 (2008)). Dado que la polimerasa genera varias copias de la diana durante la amplificación por círculo rodante, y dado que los sitios CGCG sin metilar son escindidos por BstU1 en forma bicatenaria, este proceso selecciona específicamente los fragmentos que están metilados en todos los sitios BstU1 en el ADN diana inicial. Aunque la Figura 3 ilustra este método con la endonucleasa de restricción BstUI, se pueden usar otras endonucleasas que escinden el ADN bicatenario si no está metilado, pero no el ADN híbrido metilado/ sin metilar ni el ADN monocatenario sin metilar para amplificar selectivamente el ADN genómico metilado. Estas endonucleasas incluyen, pero no se limitan a, las enzimas termófilas BstHHI (reconoce GCGC; un isoesquizómero de Hhal), BsiSI (reconoce CCGG; un isoesquizómero de HpaII) y Tail (reconoce ACGT; un isoesquizómero de MaeII). Todas estas enzimas son sensibles a la metilación de la secuencia interna de CpG. La última enzima de esta serie, la enzima de restricción TaqI, es insensible a la metilación en el sitio CpG, por lo que no sería adecuada para la técnica mencionada anteriormente.

En otra divulgación, a la construcción de ácido nucleico circular de la colección comprende un primer segmento monocatenario de ADN genómico original de un organismo hospedador unido al segundo segmento de ácido nucleico sintético monocatenario, en donde el segundo segmento monocatenario comprende una o más secuencias específicas de cebador (por ejemplo, una primera y/o segunda partes específicas de cebador de soporte sólido), y opcionalmente, una secuencia de identificador de paciente. De acuerdo con la presente divulgación, el segundo segmento monocatenario puede contener o no una parte de identificador único. Las construcciones de ácido nucleico monocatenario quiméricas de la colección están circularizadas y son adecuadas para amplificación por círculo rodante y/o secuenciación como se describe en el presente documento.

La secuencia de identificador de paciente del segundo segmento monocatenario sirve para identificar la fuente del paciente del ADN genómico original. La secuencia de identificador de paciente generalmente comprende de aproximadamente 5 a 8 nucleótidos de longitud y está diseñada para distinguir secuencias que se obtienen a partir de diferentes pacientes. En la realización preferente, las secuencias de identificador de paciente se diferencian entre sí en al menos 3 posiciones, de modo que un error en una sola base en la secuenciación aún permite la identificación positiva de la secuencia de identificador de paciente correcta. En la práctica de laboratorio clínica actual, el procesamiento de muestras por lotes está diseñado generalmente para que sea compatible con formatos de placa de 96 y 384 pocillos, de modo que se procesan 8, 16, 24, 48, 96 o 384 muestras simultáneamente.

Un aspecto de la presente invención se refiere a un sistema que comprende una colección de diferentes construcciones de ácido nucleico monocatenario quiméricas circulares. Cada construcción de la colección comprende un primer segmento monocatenario de ADN genómico original de un organismo hospedador y un segundo segmento de ácido nucleico monocatenario que está unido al primer segmento monocatenario y comprende una secuencia nucleotídica que es exógena al organismo hospedador. La secuencia nucleotídica del segundo segmento de ácido nucleico monocatenario comprende una primera parte específica de cebador de soporte sólido, una segunda parte específica de cebador de soporte sólido, y una secuencia de identificador de paciente. Las construcciones de ácido nucleico monocatenario quiméricas de la colección están circularizadas y son adecuadas para amplificación por círculo rodante y/o secuenciación. El sistema además comprende una colección de productos de extensión, comprendiendo cada producto de extensión dos o más secuencias lineales en tándem que son complementarias a la construcción de ácido nucleico monocatenario quimérica de la colección. Cada producto de extensión en la colección se hibrida con su construcción de ácido nucleico monocatenario quimérica circular complementaria de la colección. La Figura 4 en la etapa B proporciona una representación a modo de ejemplo de este sistema de la presente invención.

Este sistema de la presente invención puede comprender además un soporte sólido que tiene una pluralidad de primeros cebadores oligonucleotídicos inmovilizados. Cada primer cebador oligonucleotídico sobre el soporte sólido tiene una secuencia nucleotídica que es la misma que la secuencia nucleotídica que la primera parte específica de cebador de soporte sólido de las construcciones de ácido nucleico monocatenario quiméricas de la colección, y que es complementaria a la primera parte específica de cebador de soporte sólido de los productos de extensión. Por lo tanto, uno o más que los primeros cebadores oligonucleotídicos sobre el soporte sólido se pueden hibridar con un producto de extensión de la colección de productos de extensión mediante las primeras partes específicas de cebador de soporte sólido. La Figura 4, etapa C proporciona una representación a modo de ejemplo de este sistema de la presente invención.

El soporte sólido se puede preparar a partir de una amplia variedad de materiales. El sustrato puede ser biológico, no biológico, orgánico, inorgánico o una combinación de cualquiera de éstos, existiendo como partículas, hebras, precipitados, geles, láminas, tubos, esferas, perlas, recipientes, capilares, almohadillas, cortes, películas, placas, portaobjetos, discos, membranas, etc. El sustrato puede tener cualquier forma conveniente, tal como un disco, cuadrado, círculo, etc. El sustrato es preferentemente plano pero puede adoptar una variedad de configuraciones de superficie alternativas. Por ejemplo, el sustrato puede contener regiones elevadas o deprimidas en las que se produce la hibridación. El sustrato y su superficie forman preferentemente un soporte rígido sobre el cual llevar a cabo las reacciones de secuenciación que se describen en el presente documento.

Las plataformas de soporte sólido para secuenciación de nueva generación disponibles en el mercado usadas para la preparación de moldes se pueden usar en los sistemas y métodos que se desvelan en el presente documento. Por ejemplo, la celda de flujo Illumina®, Life Technologies® lonSphere™ y perlas para PCR en emulsión, y perlas para PCR en emulsión 454 se pueden usar en el sistema y métodos de la presente invención. Por lo tanto, la primera parte específica de cebador de soporte sólido de las construcciones de ácido nucleico monocatenario quiméricas circulares se diseña para que sea la misma que la de los cebadores inmovilizados sobre un soporte sólido NGS disponibles en el mercado. Por lo tanto, los productos de extensión que contienen el complemento de la primera parte específica de cebador de soporte sólido son capaces de hibridarse con cebadores sobre la superficie del soporte sólido NGS.

Este sistema de la presente invención puede comprender además una colección de oligonucleótidos de reticulación como se muestra en la Figura 5, etapa A. Un oligonucleótido de reticulación es un oligonucleótido que tiene dos o más repeticiones de una secuencia nucleotídica, en donde la secuencia nucleotídica repetida tiene la misma secuencia que al menos una parte del segundo segmento de ácido nucleico monocatenario de las construcciones de ácido nucleico monocatenario quiméricas en la colección. Por lo tanto, la secuencia nucleotídica repetida del oligonucleótido de reticulación es complementaria al menos a una parte de la secuencia nucleotídica del producto de extensión de la construcción de ácido nucleico quimérica (es decir, una parte del producto de extensión que corresponde al segundo segmento monocatenario). La secuencia nucleotídica repetida puede tener una longitud de aproximadamente 10-25 nucleótidos. Una o más de las repeticiones de la secuencia nucleotídica de cada oligonucleótido de reticulación se hibrida con una secuencia lineal en tándem de un producto de extensión de la colección de productos de extensión como se representa en la Figura 5, etapas B-D para formar una estructura condensada.

Como se muestra en la Figura 5, etapas E-H, el producto de extensión condensado, unido a uno o más oligonucleótidos de reticulación, se puede capturar sobre un soporte sólido que tiene una pluralidad de primeros cebadores oligonucleotídicos inmovilizados. Como se ha descrito anteriormente, los primeros cebadores oligonucleotídicos sobre el soporte sólido tienen una secuencia nucleotídica que es complementaria a la primera parte específica de cebador de soporte sólido de los productos de extensión (es decir, una secuencia nucleotídica que es la misma que la secuencia nucleotídica de la primera parte específica de cebador de soporte sólido de las construcciones de ácido nucleico monocatenario quiméricas). Como se muestra en la Figura 5, etapa E, una o más secuencias lineales en tándem de una estructura de producto de extensión condensada puede hibridarse con uno o más primeros cebadores oligonucleotídicos sobre el soporte sólido, inmovilizando de ese modo la estructura condensada. Los oligonucleótidos de reticulación se pueden diseñar para que contengan uniones escindibles que se escinden por vía enzimática (representado como triángulos en la Figura 5, etapas E y F). Las uniones escindibles adecuadas incluyen, pero no se limitan a, ribonucleótidos, desoxi-uracilo, un sitio apurínico, y 8-oxoguanina. Por ejemplo, el oligonucleótido de reticulación puede contener un sitio apurínico que se extiende mediante APE 1 endonucleasa, Endo III, Endo IV, Endo VIII, Fpg, o hOGG1. La escisión de los oligonucleótidos de reticulación permite que la estructura condensada fracase y las secuencias en tándem individuales del producto de extensión sean capturadas localmente por hibridación con cebadores contiguos sobre la superficie del soporte sólido, creando una estructura similar a una alfombra (Figura 5, etapa F). Como se muestra en la Figura 5, etapa G, este enfoque garantiza que los cientos a miles de copias complementarias en tándem de la secuencia de ADN genómico diana original se capturen cerca una al lado de la otra, y sean adecuadas para la secuenciación posterior.

Otro aspecto de la presente invención se refiere a un sistema que comprende una colección de diferentes construcciones de ácido nucleico monocatenario quiméricas circulares. Cada construcción comprende un primer segmento monocatenario de ADN genómico original de un organismo hospedador y un segundo segmento de ácido nucleico monocatenario que está unido al primer segmento monocatenario y comprende una secuencia nucleotídica que es exógena al organismo hospedador. La secuencia nucleotídica del segundo segmento de ácido nucleico monocatenario comprende una primera parte específica de cebador de soporte sólido, una segunda parte específica de cebador de soporte sólido, y una secuencia de identificador de paciente. Las construcciones de ácido nucleico monocatenario quiméricas de la colección son adecuadas para amplificación por círculo rodante y/o secuenciación. El sistema además comprende uno o más cebadores de amplificación de oligonucleótidos, cada primer comprende al menos una primera parte de secuencia nucleotídica que es complementaria a la primera parte específica de cebador de soporte sólido o la segunda parte específica de cebador de soporte sólido de las construcciones de ácido nucleico monocatenario quiméricas de la colección. Por último con este sistema también tiene una polimerasa adecuada para amplificación por círculo rodante.

En la Figura 4, etapa A se muestran realizaciones a modo de ejemplo de este sistema de la presente invención. Las construcciones de ácido nucleico quiméricas circularizadas contienen el segmento de ADN genómico original (línea fina de color negro), una sustitución o mutación de una sola base de interés dentro del segmento de ADN original se indica con el asterisco (*). El segundo segmento monocatenario de las construcciones contiene una primera parte específica de cebador de soporte sólido de la construcción quimérica (representada como una línea gruesa de color negro) y una segunda parte específica de cebador de soporte sólido (representada como una línea doble de color negro). Los cebadores de amplificación adecuados para cebar la amplificación por círculo rodante de las construcciones quiméricas pueden ser complementarios a un segmento de la primera parte específica de cebador de soporte sólido de la construcción como se muestra en el panel a la izquierda de la Figura 4, etapa A; complementarios a un segmento tanto de la primera como de la segunda partes específicas de cebador de soporte sólido de la construcción quimérica como se muestra en los paneles en la parte media y a la derecha de la Figura 4, etapa A; o complementarios a una parte de la segunda parte específica de cebador de soporte sólido de la construcción como se muestra en la Figura 9, etapa A. En esta última realización, el cebador de amplificación complementario a la segunda parte específica de cebador de soporte sólido de la construcción quimérica se inmoviliza sobre un soporte sólido, que ancla del producto de extensión formado durante la amplificación por círculo rodante directamente al soporte sólido. En una realización alternativa, los cebadores de amplificación pueden comprender una parte adicional que es susceptible de anclarse a un soporte sólido como se muestra en la Figura 4, etapa D y en la Figura 10, etapa A. En una realización, la parte adicional comprende una secuencia nucleotídica única que es complementaria a la secuencia nucleotídica de un oligonucleótido de captura inmovilizado sobre el soporte sólido. En otra realización, la parte adicional comprende una secuencia nucleotídica que es complementaria a un primer o segundo cebador oligonucleotídico sólido inmovilizado sobre el soporte sólido. En otra realización, la parte adicional es un resto de captura que queda capturado por un ligando de captura inmovilizado sobre el soporte sólido. No es necesario que el resto de captura y el ligando de captura sean ácidos nucleicos en cuanto a su naturaleza. Por ejemplo, el resto de captura puede ser un grupo biotina o una marca de His, que podría ser capturado por estreptavidina o matriz de NTA inmovilizadas, respectivamente.

En otra realización, el uno o más cebadores de amplificación de oligonucleótidos comprenden (i) una primera secuencia nucleotídica que es complementaria al segmento de ADN genómico original de las construcciones de ácido nucleico monocatenario quiméricas de la colección, (ii) una parte en el extremo 3' que comprende un nucleótido o análogo de nucleótido escindible y un grupo de bloqueo que bloquea la extensión por polimerasa 3' de dicho cebador de amplificación de oligonucleótidos, y (iii) una parte en el extremo 5' que comprende un nucleótido o análogo de nucleótido escindible y un grupo de captura, en donde el grupo de captura es susceptible de inmovilizarse en un soporte sólido.

En otra realización, el uno o más cebadores de amplificación de oligonucleótidos comprenden (a) un primer cebador de amplificación de oligonucleótidos que tiene (i) una primera secuencia nucleotídica que es complementaria a una primera parte del segmento de ADN genómico original de las construcciones de ácido nucleico monocatenario quiméricas de la colección, y (ii) una parte en el extremo 3' que comprende un nucleótido o análogo de nucleótido escindible y un grupo de bloqueo que bloquea la extensión por polimerasa 3' de dicho primer cebador de amplificación de oligonucleótidos, y (b) un segundo cebador de amplificación de oligonucleótidos que tiene (i) una primera secuencia nucleotídica que es complementaria a una segunda parte del segmento de ADN genómico original de las construcciones de ácido nucleico monocatenario quiméricas de la colección, y (ii) una parte en el extremo 5' que comprende un nucleótido o análogo de nucleótido escindible y un grupo de captura, en donde el grupo de captura es susceptible de inmovilizarse en un soporte sólido.

De acuerdo con este aspecto de la presente invención, el sistema puede comprender además un soporte sólido que tiene una pluralidad de primeros cebadores oligonucleotídicos inmovilizados. Los primeros cebadores oligonucleotídicos sobre el soporte sólido tienen una secuencia nucleotídica que es la misma que la de la secuencia nucleotídica de la primera parte específica de cebador de soporte sólido de las construcciones de ácido nucleico monocatenario quiméricas de la colección (véase por ejemplo, la Figura 6, etapa B). El soporte sólido de este sistema puede comprender además una pluralidad de segundos cebadores oligonucleotídicos inmovilizados que tienen una secuencia nucleotídica que es complementaria a la secuencia nucleotídica de la segunda parte específica de cebador de soporte sólido de las construcciones de ácido nucleico monocatenario quiméricas de la colección (véase, por ejemplo, la Figura 5, etapa B). Como se ha descrito anteriormente, las plataformas de soporte sólido NGS disponibles en el mercado usadas para la preparación de moldes (por ejemplo, celda de flujo Illumina®, Life Technologies IonSphere®, etc.) son adecuadas para los sistemas de la presente invención.

El sistema de la presente invención también puede comprender una colección de oligonucleótidos de reticulación como se ha descrito anteriormente (es decir, un oligonucleótido que tiene dos o más repeticiones de una secuencia nucleotídica, en donde la secuencia nucleotídica repetida tiene la misma secuencia que al menos una parte del segundo segmento de ácido nucleico monocatenario de las construcciones de ácido nucleico monocatenario quiméricas en la colección).

De acuerdo con este aspecto de la presente invención, la polimerasa de este sistema es una polimerasa de desplazamiento de hebra que es adecuada para amplificación por círculo rodante. Las polimerasas de desplazamiento de hebra a modo de ejemplo incluyen, pero no se limitan a, ADN polimerasa phi29, ADN polimerasa Bst (fragmento grande o 5 '^3 ' exo-), ADN polimerasa Bsu (fragmento grande o 5'^-3' exo-), DeepVentR® (exo-) polimerasa, fragmento Klenow (3 '^5 ' exo-), ADN polimerasa I (5 '^3 ' exo-), Transcriptasa inversa M-MuLV, ADN polimerasa VentR® (exo-), y ADN polimerasa PyroPhage 3173. Otras polimerasas de desplazamiento de hebra a modo de ejemplo incluyen las que tienen termoestabilidad y actividad de desplazamiento de hebra, tales como ADN polimerasa SD (una ^aDⁿpolimerasa Taq mutante) (véase la publicación de solicitud de Patente de Estados Unidos n.° 2012/0115l45 de Fu, documento de patente WO2014/161712 de Ignatov et al., e Ignatov et al., "A Strong Stand Displacement Activity of Thermostable DNA Polymerase Markedly Improves the Results of DNA Amplification", BioTechniques 57:81087 (2014)); polimerasa AptaHotTaq (actividad de polimerasa 5 '^3 ' termoestable con una actividad de endonucleasa de aleta en el extremo 5'); polimerasas obtenidas a partir de virus y microbios termófilos (véase la publicación de solicitud de Patente de Estados Unidos n.° 2012/0083018 de Schoenfeld et al., y el documento de Patente de Estados Unidos n.° 8.093.030 de Schoenfeld et al.); polimerasas obtenidas a partir de Thermus antranikianii y Thermus brockianus tal como se desvela en el documento de patente WO2006/030455 de Hjorleifsdottir et al., y en la publicación de solicitud de Patente de Estados Unidos n.° 2008/0311626 de Hjorleifsdottir et al.; la polimerasa termoestable obtenida a partir de Thermus scotoductus (véase el documento de patente WO2007/076461 de Rech et al.); y la ADN polimerasa de tipo I obtenida a partir de Bacillus pallidus (véase el documento de Patente de Estados Unidos n.° 5.736.373 to Hamilton). Otras polimerasas de desplazamiento de hebra conocidas en la técnica también son adecuadas para este sistema y métodos relacionados que se desvelan en el presente documento.

Otro aspecto de la presente invención se refiere a un método para secuenciar una pluralidad de moléculas de ácido nucleico usando este sistema. De acuerdo con este método, los cebadores de amplificación de oligonucleótidos hibridados con construcciones de ácido nucleico monocatenario quiméricas circulares complementarias de la colección se mezclan con la polimerasa para formar una mezcla de reacción de amplificación por círculo rodante. La mezcla de reacción de amplificación por círculo rodante se somete a un tratamiento de extensión en donde la polimerasa extiende el uno o más cebadores de amplificación de oligonucleótidos hibridados para producir una pluralidad de productos de extensión primarios. Cada producto de extensión primario comprende una o más secuencias lineales en tándem, siendo cada secuencia lineal en tándem complementaria a una construcción de ácido nucleico monocatenario quimérica circular en la colección. Las construcciones de ácido nucleico monocatenario quiméricas circulares se pueden secuenciar directamente, por ejemplo, la construcción quimérica circular es el molde para la secuenciación por síntesis. Alternativamente, los productos de extensión primarios formados a partir de la reacción de amplificación por círculo rodante son los moldes usados para la secuenciación. Como se ha indicado anteriormente, para secuenciar las construcciones de ácido nucleico circulares o los productos de extensión primarios de las mismas se puede usar cualquier método de secuenciación conocido en la técnica.

En una realización, los productos de extensión primarios se inmovilizan sobre un soporte sólido antes de la secuenciación. Un soporte sólido adecuado comprende al menos una pluralidad de primeros cebadores oligonucleotídicos teniendo cada uno una secuencia nucleotídica que es la misma que la de la secuencia nucleotídica de la primera parte específica de cebador de soporte sólido de las construcciones de ácido nucleico monocatenario quiméricas de la colección (es decir, que tiene una secuencia complementaria a la primera parte específica de cebador de soporte sólido de los productos de extensión primarios). Los soportes sólidos adecuados incluyen, pero no se limitan a, los que están disponibles en el mercado y se usan para preparación de moldes en plataformas de secuenciación de nueva generación, por ejemplo, celda de flujo Illumina®, Life Technologies™ Ion Sphere™. Los productos de extensión primarios se hibridan con los primeros cebadores oligonucleotídicos sobre el soporte sólido y se secuencian sobre el soporte como se describe con más detalle a continuación.

El soporte sólido puede comprender además una pluralidad de segundos cebadores oligonucleotídicos. Los segundos cebadores tienen una secuencia nucleotídica que es complementaria a la segunda parte de cebador específico de cebador soporte sólido de las construcciones de ácido nucleico monocatenario quiméricas. Como se representa en la Figura 9, etapa B y como se describe con más detalle en el presente documento, la amplificación por círculo rodante de la construcción de ácido nucleico quimérica se puede cebar mediante un segundo cebador oligonucleotídico sobre el soporte sólido. Este enfoque se puede usar para anclar el producto de extensión primario directamente al soporte sólido.

Como se representa en la Figura 5, etapas A-G, los oligonucleótidos de reticulación se pueden usar para condensar el producto de extensión primario en crecimiento a partir de una reacción de amplificación por círculo rodante. Como se muestra en la Figura 5, etapa A, la ADN polimerasa (diamantes rellenos) extiende un cebador de amplificación alrededor de la construcción circular que contiene el segmento genómico original. A medida que la polimerasa continúa la extensión, el producto de extensión primario en crecimiento se condensa por hibridación con regiones repetidas complementarias de oligonucleótidos de reticulación como se muestra en la Figura 5, etapa B. El proceso continúa como se muestra en la Figura 5, etapas C y D para generar de cientos a miles de copias complementarias en tándem de ADN diana en una estructura condensada. Al variar el número de oligonucleótidos con diferentes secuencias complementarias, y el número de repeticiones en tándem dentro de un oligonucleótido dado, el número de bucles de "nodos de reticulación" puede variar, proporcionando la oportunidad de controlar la "compatibilidad" de la estructura. Como se muestra en la Figura 5, etapa E, el producto de extensión primario condensado se puede inmovilizar sobre un soporte sólido mediante la hibridación del producto de extensión primario a primeros cebadores oligonucleotídicos complementarios. Como se muestra en la Figura 5, etapa E, la estructura condensada se hibrida con cebadores complementarios en pocas posiciones. Los oligonucleótidos de reticulación contienen enlaces escindibles, y después de la escisión, la estructura condensada comienza a separarse (Figura 5, etapa F). Los bucles individuales del producto de extensión primario se capturan localmente por hibridación con los primeros cebadores contiguos sobre la superficie del soporte sólido, creando una estructura similar a una alfombra (Figura 5, etapa G). Este enfoque garantiza que los cientos a miles de copias en tándem de la diana se capturen una al lado de la otra, y son adecuadas para la secuenciación posterior.

La Figura 6 representa un método de secuenciación a modo de ejemplo de acuerdo con la presente invención. Como se muestra en la Figura 6, etapa A, el proceso comienza con la ADN polimerasa (por ejemplo, polimerasa Phi29; diamantes rellenos) que extiende un cebador de amplificación hibridado con un molde de construcción de ácido nucleico quimérica circular para generar un producto de extensión primario. El producto de extensión se hibrida con los primeros cebador oligonucleotídicos sobre un soporte sólido (Figura 6, etapa B). Como se muestra en la Figura 6, etapa C, el producto de extensión en crecimiento formado a partir de la reacción de amplificación por círculo rodante se captura localmente sobre el soporte sólido mediante hibridación con primeros cebadores oligonucleotídicos contiguos sobre la superficie, creando una estructura similar a una alfombra. Como se muestra en la Figura 6, etapa D, este enfoque garantiza que los cientos a miles de copias complementarias en tándem del segmento de ADN genómico original se capturen entre sí para la secuenciación posterior.

Una vez que el producto de extensión primario se inmoviliza sobre el soporte sólido (Figura 6, etapa D), un cebador de secuenciación se hibrida contiguo al extremo 3' del primer cebador oligonucleotídico sobre el soporte sólido como se muestra en la Figura 6, etapa E. Opcionalmente, un PNA u oligonucleótido de bloqueo se puede hibridar contiguo al extremo 5' del primer cebador oligonucleotídico como también se representa en la Figura 6, etapa E. El producto de extensión primario es el molde para la reacción de secuenciación por síntesis cebada por el cebador de secuenciación como se representa en la Figura 6, etapa F. La secuenciación continúa hasta que el producto de extensión de secuenciación por síntesis secundario que se está formando ya no se puede extender más debido al PNA u oligonucleótido de bloqueo (Figura 6, etapa G).

Para secuenciar la hebra opuesta (es decir, para obtener la secuencia de los productos de extensión primarios), el primer cebador oligonucleotídico sobre soporte sólido se desbloquea. Una polimerasa (diamantes rellenos) con actividad de nucleasa 5 '^3 ' extiende el cebador de secuenciación anclado sobre el soporte sólido mientras digiere el producto de la reacción de secuenciación por síntesis como se muestra en la Figura 6, etapa H. Como se muestra en la Figura 6, etapa I, la polimerasa (diamantes rellenos) extiende las hebras hasta que no puede avanzar más debido al PNA u oligonucleótido de bloqueo (línea de rayas anchas). Esto genera copias de longitud única del molde, comprendiendo cada molde una copia de la secuencia de ADN genómico original. Como se muestra en la Figura 6, etapa J, el producto de extensión primario original y el molde circular se desnaturalizan y se retiran por lavado. Un segundo cebador de secuenciación se hibrida con cada hebra de molde de longitud única como se muestra en la Figura 6, etapa K, y la secuenciación por síntesis se usa para obtener la secuencia del molde inmovilizado como se muestra en la Figura 6, etapas L y M.

La Figura 7 representa otro método de secuenciación a modo de ejemplo de acuerdo con la presente invención. Este método implica la amplificación por círculo rodante de una construcción de ácido nucleico quimérica circular y la captura del producto de extensión primario sobre un soporte sólido que tiene primeros y segundos cebadores oligonucleotídicos. Como se muestra en la Figura 7, etapa A, una ADN polimerasa de desplazamiento de hebra (diamante relleno) extiende un cebador de amplificación en un molde circularizado para generar un producto de extensión primario monocatenario. Los primeros cebadores oligonucleotídicos sobre la superficie de soporte sólido contienen un grupo de bloqueo extraíble en su extremo 3' que hace que sean incapaces de extenderse durante el proceso de amplificación por círculo rodante (Figura 7, etapa B). Un grupo de bloqueo es un resto químico que evita que una polimerasa u otra enzima se amplifiquen, extiendan o reaccionen con el oligonucleótido de manera productiva. En este ejemplo, el grupo de bloqueo evita la extensión por polimerasa del extremo 3'. Los grupos de bloqueo adecuados incluyen, pero no se limitan a, espaciadores C3, espaciadores C18, nucleótidos finalizadores, derivados de 2-O-metil-ribonucleótido, fosfato 3' u otras modificaciones de los restos 3' o 2' OH. El propio grupo de bloqueo se puede escindir, tal como mediante el uso de nucleótidos finalizadores reversibles, o fosfatos en el extremo 3', o el grupo de bloqueo y, opcionalmente, algunos nucleótidos adicionales se pueden retirar escindiendo un enlace escindible que a continuación libera un extremo 3' OH libre. Los enlaces escindibles adecuados incluyen, pero no se limitan a, ribonucleótidos, desoxi-uracilo, un sitio apurínico y 8-oxoguanina. Como se muestra en la Figura 7, etapa C, a medida que la amplificación por círculo rodante continúa generando un producto de extensión primario en crecimiento, el producto se captura localmente mediante hibridación con los primeros cebadores oligonucleotídicos sobre la superficie de soporte sólido creando una estructura similar a una alfombra. Este enfoque garantiza que los cientos a miles de copias en tándem de la diana se capturen entre sí sobre la superficie de soporte sólido (Figura 7, etapa D).

Como se muestra en la Figura 7, etapa E, el grupo de bloqueo se retira de los primeros cebadores oligonucleotídicos hibridados al producto de extensión primario sobre el soporte sólido. El grupo de bloqueo se puede retirar por escisión de un enlace escindible. Los enlaces escindibles de ribonucleótido se pueden escindir usando RNasaH; los enlaces escindibles de desoxi-uracilo se pueden escindir usando UDG y endonucleasa AP, o usando UDG, Endo VIII, y quinasa T4; los enlaces escindibles del sitio apurínico se pueden escindir usando Tth Endo IV, Endo IV, o endonucleasa AP; y los enlaces escindibles de 8-oxoguanina se pueden escindir con Fgp. Una vez que el cebador está desbloqueado, se extiende copiando de ese modo el producto de extensión primario en cientos a miles de posiciones sobre el soporte sólido usando una polimerasa (diamantes rellenos) que carece de actividad de nucleasa 5 '^3 ' (Figura 7, etapa F). Esto genera productos de extensión secundarios de longitud única del molde circularizado. Como se muestra en la Figura 7, etapa G, el producto de extensión primario y el molde circular se desnaturalizan y se retiran mediante lavado para hacer que los productos de extensión secundarios resultantes del molde sean adecuados para la secuenciación posterior como se representa en la Figura 8, etapas A-I.

La Figura 8 ilustra la secuenciación de la diana amplificada por círculo rodante (por ejemplo, productos de extensión secundarios) capturada sobre un soporte sólido que tiene tanto primeros como segundos cebadores oligonucleotídicos. La Figura 8, etapa A muestra los productos de extensión secundarios de longitud única generados a partir de la extensión mediada por polimerasa de productos de extensión primarios hibridados como se describe en la Figura 7. El proceso de secuenciación comienza con la hibridación de cebadores de secuenciación con los productos de extensión secundarios como se muestra en la Figura 8, etapa A. La secuenciación por síntesis se usa para obtener la secuencia de los productos de extensión secundarios inmovilizados (Figura 8, etapa B). La secuenciación continúa hasta que los productos de extensión alcanzan el final de los primeros cebadores oligonucleotídicos anclados (Figura 8, etapa C). Los productos de secuenciación por síntesis se desnaturalizan a partir de los primeros cebadores oligonucleotídicos anclados y los productos de extensión secundarios monocatenarios se hibridan con los segundos cebadores oligonucleotídicos sobre el soporte sólido como se muestra en la Figura 8, etapa D. Los productos de extensión secundarios se copian extendiendo los segundos cebadores oligonucleotídicos hibridados para generar copias de longitud completa de los productos de extensión secundarios, es decir, productos de extensión terciarios (Figura 8, etapa E). Los productos de extensión secundarios se escinden, desnaturalizan y retiran por lavado (Figura 8, etapas E-F), dejando los productos de extensión terciarios anclados adecuados para la secuenciación posterior. Un cebador de secuenciación se hibrida con los productos de extensión terciarios (Figura 8, etapa G) y la secuenciación por síntesis se lleva a cabo para obtener la secuencia de los productos terciarios como se muestra en la Figura 8, etapas H e I.

La secuenciación de los productos de extensión secundarios y terciarios se puede conseguir usando secuenciación por síntesis como se describe y se representa en el presente documento. La secuenciación por síntesis incluye secuenciación por síntesis basada en fluorescencia y secuenciación por síntesis basada en iones. También se pueden usar otros métodos de secuenciación adecuados, incluyendo, por ejemplo y sin limitación, hibridación con cebador fluorescente, hibridación con balizas moleculares, extensión de cebadores, secuenciación basada en exonucleasa, reacción de detección de ligasa, reacción en cadena de ligasa, pirosecuenciación, secuenciación por ligamiento basada en fluorescencia, secuenciación basada en nanoporos y nanotubos y secuenciación por ligamiento basada en iones.

La Figura 9 representa otro método de secuenciación a modo de ejemplo de acuerdo con la presente invención. Como se muestra en la Figura 9, etapa A, esta realización implica la hibridación directa de la construcción de ácido nucleico quimérica circular con un segundo cebador oligonucleotídico sin bloquear sobre el soporte sólido. El segundo cebador sirve como un cebador de amplificación, cebando la amplificación por círculo rodante de la construcción circular. El producto de extensión primario que se genera está anclado directamente al soporte sólido (Figura 9, etapa A). El producto de extensión primario generado por amplificación por círculo rodante se hibrida con primeros cebadores oligonucleotídicos sobre el soporte sólido que contiene un grupo de bloqueo en el extremo 3' extraíble como se muestra en la Figura 9, etapas B y C, generando de ese modo múltiples estructuras de "bucle similar a una alfombra". El grupo de bloqueo en el extremo 3' de los primeros cebadores se retira (Figura 9, etapa D), permitiendo que los primeros cebadores se puedan extender mediante una polimerasa adecuada (por ejemplo, una polimerasa que carece de actividad de nucleasa 5 '^3 ') para generar una superficie formada por cientos a miles de productos de extensión secundarios de longitud única unidos covalentemente a la superficie del soporte sólido (Figura 9, etapa E). Como se muestra en la Figura 9, etapas E-F, el tratamiento de la superficie con un reactivo o enzima de escisión específicos del sitio que escinde el primer cebador, seguido por una etapa de desnaturalización, libera el producto de extensión primario, dejando los productos de extensión secundarios unidos covalentemente, que son adecuados para la secuenciación posterior como se muestra y se describe en la Figura 8, etapas A-I.

La Figura 10 representa otro método de secuenciación a modo de ejemplo de acuerdo con la presente invención. En esta realización, el cebador de amplificación comprende una cola monocatenaria corta, es decir, una parte adicional que se captura sobre el soporte sólido. Como se representa en la Figura 10, etapa A, la parte adicional puede comprender una secuencia nucleotídica que es complementaria a la secuencia nucleotídica de una sonda o cebador de captura sobre la superficie del soporte sólido. La hibridación de la parte adicional a su sonda o cebador de captura complementarios ancla directamente el producto de extensión primario formado por amplificación por círculo rodante al soporte sólido. A medida que la amplificación por círculo rodante continúan generando un producto de extensión primario en crecimiento que comprende copias complementarias en tándem de la estructura quimérica circular, el producto de extensión primario se captura localmente mediante hibridación con los primeros cebadores oligonucleotídicos bloqueados en el extremo 3' sobre la superficie creando múltiples estructuras de bucle similar a una alfombra sobre la superficie (Figura 10, etapas B y C). Los primeros cebadores se desbloquean (Figura 10, etapa D), y se extienden con una polimerasa que carece de una actividad de nucleasa 5 '^3 ' para formar múltiples productos de extensión secundarios que tienen una longitud uniforme (Figura 10, etapa E). La desnaturalización libera el producto de extensión primario y deja atrás productos de extensión secundarios unidos covalentemente que tienen el mismo sentido que los moldes circularizados originales y todos terminan con una secuencia de unión a cebador de secuenciación definida en sus extremos 3'. Los productos de extensión secundarios unidos covalentemente son moldes adecuados para secuenciación como se muestra en la Figura 8.

La Figura 11 ilustra otro método de secuenciación a modo de ejemplo de acuerdo con la presente invención. En la Figura 11, etapa A, la ADN polimerasa Phi29 (diamantes rellenos) extiende el cebador de amplificación en el molde circular quimérico para generar un producto de extensión primario monocatenario corto. La polimerasa y el producto de extensión primario se desnaturalizan a partir del molde circular. Como se muestra en la Figura 11, etapa B, el producto de extensión primario se hibrida con los primeros cebadores sobre un soporte sólido. El producto de extensión primario se copia mediante extensión con polimerasa de los primeros cebadores oligonucleotídicos inmovilizados en múltiples posiciones (diamantes rellenos). Las polimerasas adecuadas incluyen polimerasa que carece de actividad de proteasa 5 '^3 ' como se ha descrito anteriormente. Esto genera productos de extensión secundarios de longitud única (Figura 11, etapa C). El producto de extensión primario se desnaturaliza y se retira por lavado como se muestra en la Figura 11, etapa D. Los productos de extensión secundarios monocatenarios restantes se amplifican usando un proceso de amplificación de grupos en donde los productos de extensión secundarios se hibridan con segundos cebadores oligonucleotídicos sobre el soporte sólido como se muestra en la Figura 11, etapa E. Los segundos cebadores se extienden con polimerasa (Figura 11, etapa F) para formar productos extensión terciarios. Después de la desnaturalización (Figura 11, etapa G), los productos de extensión secundarios y terciarios se hibridan con primeros y segundos cebadores sobre el soporte sólido (Figura 11, etapa H). Los cebadores hibridados se extienden con polimerasa para formar copias de los productos de extensión secundarios y terciarios como se muestra en la Figura 11I. Los productos de extensión se desnaturalizan, y el proceso se repite para generar suficientes moldes para la secuenciación (Figura 11, etapa J) usando cada hebra el método que se representa en la Figura 8. Los medios alternativos para formar superficies con copias idénticas unidas covalentemente del amplicón de RCA limitado (corto) incluyen amplificación Sequoia (documento de patente WO2013/012440 de Barany et al.) y amplificación Wildfire (Ma et al., "Isothermal Amplification Method for Next-Generation Sequencing", Proc Natl Acad Sci USA 10(35):14320-3 (2013)).

La Figura 12 ilustra otro método de secuenciación a modo de ejemplo de acuerdo con la presente invención, similar al presentado en la Figura 11. En la Figura 12, etapa A, la ADN polimerasa Phi29 o Bst (diamantes rellenos) extiende el cebador de amplificación sobre el molde circular quimérico para generar un producto de extensión primario monocatenario largo. La polimerasa y el producto de extensión primario se desnaturalizan a partir del molde circular. Como se muestra en la Figura 12, etapa B, el producto de extensión primario se hibrida con múltiples primeros cebadores en más de un pocillo o área sobre un soporte sólido. Dado que el producto de extensión primario es largo, se puede extender en múltiples pocillos o áreas específicas sobre la superficie sólida que tiene cebadores. La ventaja de esta propiedad de productos de extensión largos es que la misma diana se secuenciará en múltiples pocillos o áreas contiguos, proporcionando de ese modo una verificación adicional de una mutación de baja abundancia. El producto de extensión primario se copia mediante extensión con polimerasa de los primeros cebadores oligonucleotídicos inmovilizados en múltiples posiciones (diamantes rellenos) como se muestra en la Figura 12, etapa C. Las polimerasas adecuadas incluyen polimerasa que carece de actividad de proteasa 5 '^3 ' como se ha descrito anteriormente. Esto genera productos de extensión secundarios de longitud única, excepto cuando se hace un puente entre pocillos en donde se generan productos de extensión repetidos en tándem (Figura 12, etapas C y D). El producto de extensión primario se desnaturaliza y se retira por lavado como se muestra en la Figura 12, etapa E. Los productos de extensión secundarios monocatenarios restantes se amplifican usando un proceso de amplificación de grupos en donde los productos de extensión secundarios se hibridan con segundos cebadores oligonucleotídicos sobre el soporte sólido como se muestra en la Figura 11, etapas E-I. Los productos de extensión se desnaturalizan, y el proceso se repite para generar suficiente molde para la secuenciación (véase la Figura 11, etapa J) usando cada hebra el método que se representa en la Figura 8.

Otra divulgación se refiere a métodos para preparar las construcciones de ácido nucleico monocatenario quiméricas circulares que son un componente de los sistemas y métodos que se describen en el presente documento. A continuación se describen varios métodos a modo de ejemplo y se representan en las figuras adjuntas.

Un método adecuado para preparar las construcciones de ácido nucleico monocatenario quiméricas circulares implica proporcionar una muestra que contiene uno o más segmentos de ADN genómico diana. Los segmentos de ADN genómico diana pueden contener potencialmente una o más diferencias de base o uno o más restos metilados de interés para detección. El método además implica

proporcionar una o más primeras sondas oligonucleotídicas, comprendiendo cada primera sonda oligonucleotídica (a) una parte específica de diana en el extremo 5', (b) una parte específica de diana en el extremo 3', y (c) una parte adicional. La parte adicional es una secuencia nucleotídica que comprende (i) una secuencia de identificador de paciente, (ii) una primera parte específica de cebador de soporte sólido, y (iii) una segunda parte específica de cebador de soporte sólido. La muestra y la una o más primeras sondas oligonucleotídicas se ponen en contacto en condiciones eficaces para que la parte específica de diana en el extremo 3' de una primera sonda oligonucleotídica se hibride de una forma específica según la base con un extremo 3' complementario de un segmento de ADN genómico diana, y para que la parte específica de diana en el extremo 5' de la primera sonda oligonucleotídica se hibride de una forma específica según la base con un extremo 5' complementario de un segmento de ADN genómico diana, si estuvieran presentes en la muestra. Después de la hibridación, una o más uniones competentes para ligamiento adecuadas para acoplar los extremos 3' y 5' del segmento de ADN genómico diana hibridado con la primera sonda oligonucleotídica se generan y el segmento de ADN genómico diana se liga junto a la una o más uniones de ligamiento para formar una construcción de ácido nucleico monocatenario quimérica circular de la colección.

La Figura 13, etapas A-E muestra un proceso a modo de ejemplo para producir construcciones "diana" de ácido nucleico monocatenario quiméricas circulares adecuadas para la secuenciación como se ha descrito anteriormente. En esta realización, los segmentos genómicos originales comprenden segmentos de ADN libre de células (ADNcf) que tienen una longitud promedio de 160 pb, o segmentos de ADN genómico cortados en fragmentos de aproximadamente 160 pb ("oligonucleótido diana" o "segmento de ADN"). El proceso comienza con el ligamiento de conectores cortos a los segmentos de ADN (barras gruesas de color negro, Figura 13, etapa A). Como se muestra en la Figura 13, etapa B, las sondas oligonucleotídicas que contienen secuencias complementarias a los extremos 5' y 3' del segmento de ADN diana y complementarias al conector en el extremo 3' se hibridan con los segmentos de ADN. La región en bucle cerca del extremo 3' del oligonucleótido de ADN diana en la Figura 13, etapa B es una región del oligonucleótido diana que no es complementaria a la sonda oligonucleotídica. Como se muestra en esta Figura, las regiones pequeñas de no complementariedad entre el segmento oligonucleótido diana y la sonda oligonucleotídica no influyen en el proceso de formación de construcciones quiméricas circulares.

La parte adicional de la sonda oligonucleotídica (mostrada como una barra gruesa de color negro) también puede contener una secuencia de identificador único, una secuencia de identificador de paciente, una secuencia de unión a cebador, y/o un enlace escindible (Figura 13, etapa B, panel a la izquierda, el enlace escindible representado dentro de la barra gruesa marcada como "U"). La sonda oligonucleotídica también puede contener un grupo de bloqueo en un extremo (Figura 13, etapa B, panel a la derecha, la sonda tiene un grupo de bloqueo en el extremo 5'). Como se muestra en la Figura 13, etapa C, una polimerasa (diamante relleno) extiende el extremo 3' del conector corto hibridado del segmento de ADN para copiar la parte adicional de la sonda oligonucleotídica. La polimerasa usada en esta realización puede comprender actividad de exonucleasa, por ejemplo, actividad de exonucleasa de 5' a 3' o actividad de exonucleasa de 3' a 5'. Después de la extensión, una nucleasa 5' se escinde en una base coincidente solapante en el extremo 5' del ADN diana para retirar la región del conector en el extremo 5' dejando de ese modo fosfato 5' competente para ligamiento. La polimerasa también extiende el extremo 3' de la sonda oligonucleotídica usando el segmento de ADN diana como molde (Figura 13, etapa C), pero no escinde el grupo de bloqueo (Figura 13, etapa C, lado izquierdo). En la Figura 13, etapa D (panel a la izquierda), la ligasa (círculo relleno) sella covalentemente la unión de ligamiento entre los extremos 3' y 5' del segmento de ADN genómico diana extendido, y los extremos 3' y 5' de la sonda oligonucleotídica extendida para crear productos de ligamiento circulares. Se introduce una mella en el enlace escindible (por ejemplo, escisión con UDG de dU, triángulo relleno) de la sonda oligonucleotídica circularizada, para hacer que la sonda oligonucleotídica sea susceptible de digestiones por exonucleasa (Figura 13, etapa E, panel a la izquierda). Como se muestra en la Figura 13, etapa D, panel a la derecha, la ligasa (círculo relleno) sella covalentemente la unión de ligamiento entre los extremos 3' y 5' del segmento de ADN genómico diana extendido; sin embargo, el grupo de bloqueo en el extremo 5' en la sonda oligonucleotídica evita la circularización de la sonda oligonucleotídica. Como se muestra en la Figura 13, etapa E, la(s) exonucleasa(s) digiere(n) todos los productos oligonucleotídicos no ligados o con mellas (es decir, sondas oligonucleotídicas) dejando solo las construcciones de ácido nucleico monocatenario circulares deseadas que comprenden el segmento de ADN diana original acoplado a la parte adicional que contiene, por ejemplo, una secuencia de identificador único, secuencia de unión a cebador, o secuencia de identificador de paciente. Como se ha descrito anteriormente, el producto circularizado resultante es adecuado para amplificación por círculo rodante y secuenciación circular.

El proceso que se representa en la Figura 14, etapas A-E es esencialmente el mismo que el que se muestra en la Figura 13, etapas A-E, sin embargo, la sonda oligonucleotídica comprende un grupo de bloqueo (3'-Blk) en su extremo 3', uno o más enlaces escindibles ("r"), una secuencia de unión a cebador, y un grupo de captura en el extremo 5' ("Z") opcional (véase la Figura 14, etapa B). La polimerasa (diamante relleno) extiende el extremo 3' del conector corto hibridado del segmento de ADN para copiar la parte adicional de la sonda oligonucleotídica. La escisión con nucleasa del extremo 5' del segmento de ADN en una base coincidente solapante genera un fosfato 5' competente para ligamiento (Figura 14, etapa C). En la Figura 14, etapa D, la ligasa (círculo relleno) sella covalentemente el extremo extendido para crear un producto de ligamiento diana circular. El grupo de bloqueo en el extremo 3' de la sonda oligonucleotídica evita la extensión de la sonda oligonucleotídica. Posteriormente, el grupo de bloqueo se retira por escisión en el enlace escindible, por ejemplo, escisión con RNasa (triángulo relleno) de ribonucleótido "r" (Figura 14, etapa D). Como se muestra en la Figura 14, etapa E, la polimerasa (diamante relleno) con actividad de desplazamiento de hebra extiende el extremo 3' liberado de la sonda oligonucleotídica para iniciar la amplificación por círculo rodante. El producto de extensión primario formado por amplificación por círculo rodante es adecuado para secuenciación. El grupo Z opcional en el extremo 5' se puede capturar sobre un soporte sólido antes o después de la amplificación por círculo rodante. Una vez capturado, el producto de ligamiento circular unido a cebador o la extensión del mismo se pueden liberar del soporte sólido mediante escisión en el enlace escindible, ya sea antes o después de la amplificación por círculo rodante.

La Figura 15 y la Figura 17 muestran un proceso similar al que se representa en la Figura 13 para producir construcciones "diana" de ácido nucleico monocatenario quiméricas circulares adecuadas para secuenciación. El ADN genómico diana se obtiene a partir de ADNcf con una longitud promedio de 160 pb o ADN genómico cortado en fragmentos de aproximadamente 160 pb. El proceso comienza con el ligamiento de conectores cortos a los segmentos de ADN (barras gruesas de color negro, Figura 15, etapa A y Figura 17, etapa A). Como se muestra en la Figura 15, etapa B y en la Figura 17, etapa B, las sondas oligonucleotídicas que contienen secuencias complementarias a los extremos 5' y 3' del segmento de ADN y complementarias al conector en el extremo 3' del segmento de ADN se hibridan con los segmentos de ADN diana. En la realización representada en la Figura 15, etapa B, la sonda oligonucleotídica contiene una región, es decir, una parte de secuencia nucleotídica que no es complementaria al extremo 3' del oligonucleótido diana (parte en bucle cerca del extremo 3' de la sonda oligonucleotídica en la Figura 15, etapa B). Además, el extremo 5' del oligonucleótido diana, incluyendo el conector, no es complementario a la sonda oligonucleotídica, formando de ese modo una aleta. En la realización de la Figura 17, etapa B, tanto la sonda oligonucleotídica como el oligonucleótido diana contienen partes de secuencia nucleotídica que no son complementarias al oligonucleótido diana o sonda, respectivamente. Estas regiones no complementarias se representan como una región en bucle cerca del extremo 3' de la sonda oligonucleotídica y una región en bucle cerca del extremo 5' del oligonucleótido diana (Figura 17, etapa B). Estas regiones no influyen en el proceso general de formación de las construcciones de ácido nucleico circularizadas.

La parte adicional de las sondas oligonucleotídicas (mostrada como una barra gruesa de color negro) puede contener una secuencia de identificador único, una secuencia de identificador de paciente, una secuencia de unión a cebador, y/o un enlace escindible (representado dentro de la barra gruesa como "U" (Figuras 15, etapa B y 17, etapa B, panel a la izquierda). Las sondas oligonucleotídicas también puede contener un grupo de bloqueo en un extremo (Figura 15, etapa B y Figura 17, etapa B, panel a la derecha; un grupo de bloqueo en el extremo 5' de la sonda oligonucleotídica). Como se muestra en las Figuras 15, etapa C y 17, etapa C, la polimerasa (diamante relleno) extiende el extremo 3' del conector corto hibridado del segmento de ADN para copiar la parte adicional de la sonda oligonucleotídica. La polimerasa usada en esta realización puede comprender actividad de exonucleasa, por ejemplo, actividad de exonucleasa de 5' a 3' o actividad de exonucleasa de 3' a 5'. Después de la extensión, una nucleasa 5' se escinde en una base coincidente solapante en el extremo 5' del ADN diana para retirar la región del conector en el extremo dejando de ese modo fosfato 5' competente para ligamiento (Figura 15, etapa C y Figura 17, etapa C). La polimerasa también extiende el extremo 3' de la sonda oligonucleotídica usando el segmento de ADN diana como molde (Figura 15, etapa C y Figura 17, etapa C). El grupo de bloqueo en el extremo 5' de la sonda (Figuras 15, etapa C y 17, etapa C, lado izquierdo) no está escindido. En la Figura 15, etapa D y en la Figura 17, etapa D (panel a la izquierda), la ligasa (círculo relleno) sella covalentemente la unión de ligamiento entre los extremos 3' y 5' del segmento de ADN genómico diana extendido, y los extremos 3' y 5' de la sonda oligonucleotídica extendida para crear productos de ligamiento circulares. Se introduce una mella en el enlace escindible (por ejemplo, escisión con UDG de dU, triángulo relleno) de la sonda oligonucleotídica circularizada, para hacer que la sonda oligonucleotídica sea susceptible de digestiones con exonucleasa (Figura 15, etapa E y Figura 17, etapa E, panel a la izquierda). Como se muestra en las Figuras 15, etapa D y 17, etapa D, panel a la derecha, la ligasa (círculo relleno) sella covalentemente la unión de ligamiento entre los extremos 3' y 5' del segmento de ADN genómico diana extendido; sin embargo, el grupo de bloqueo en el extremo 5' en la sonda oligonucleotídica evita la circularización de la sonda oligonucleotídica. Como se muestra en la Figura 15, etapa E y en la Figura 17, etapa E, la(s) exonucleasa(s) digiere(n) todos los productos oligonucleotídicos no ligados o con mellas (es decir, sondas oligonucleotídicas) dejando solo las construcciones de ácido nucleico monocatenario circulares deseadas que comprenden el segmento de ADN diana original acoplado a la parte adicional que contiene, por ejemplo, una secuencia de identificador único, secuencia de unión a cebador, o secuencia de identificador de paciente. Como se ha descrito anteriormente, el producto circularizado resultante es adecuado para amplificación por círculo rodante y secuenciación circular.

El proceso representado en las Figuras 16 y 18 es esencialmente el mismo que el que se muestra en las Figuras 15 y 17, respectivamente, sin embargo, la sonda oligonucleotídica comprende un grupo de bloqueo (3'-Blk) en su extremo 3', uno o más enlaces escindibles, una secuencia de unión a cebador, y un grupo de captura en el extremo 5' ("Z") opcional (véase la Figura 16, etapa B y la Figura 18, etapa B). La polimerasa (diamante relleno) extiende el extremo 3' del conector corto hibridado del segmento de ADN para copiar la parte adicional de la sonda oligonucleotídica. La escisión con nucleasa del extremo 5' del segmento de a Dn en una base coincidente solapante genera un fosfato 5' competente para ligamiento (Figura 16, etapa C y Figura 18, etapa C). En la Figura 16, etapa D y en la Figura 18, etapa D, la ligasa (círculo relleno) sella covalentemente el extremo extendido para crear un producto de ligamiento circular. El grupo de bloqueo en el extremo 3' de la sonda oligonucleotídica evita la extensión de la sonda oligonucleotídica. Posteriormente, el grupo de bloqueo se retira por escisión en el enlace escindible, por ejemplo, escisión con RNasa (triángulo relleno) de ribonucleótido "r". Como se muestra en las Figuras 16, etapa E y 18, etapa E, la polimerasa (diamante relleno) con actividad de desplazamiento de hebra extiende el extremo 3' liberado de la sonda oligonucleotídica para iniciar la amplificación por círculo rodante. El producto de extensión primario formado por amplificación por círculo rodante es adecuado para secuenciación. El grupo Z opcional en el extremo 5' se puede capturar sobre un soporte sólido antes o después de la amplificación por círculo rodante. Una vez capturado, el producto de ligamiento circular unido a cebador o la extensión del mismo se pueden liberar del soporte sólido mediante escisión en el enlace escindible, ya sea antes o después de la amplificación por círculo rodante.

Las Figuras 19 y 21 muestran un proceso similar para producir construcciones "diana" de ácido nucleico monocatenario quiméricas circulares adecuadas para la secuenciación como se describe en referencia a las Figuras 13, 15, y 17 mencionadas anteriormente. El ADN genómico diana se obtiene a partir de ADNcf con una longitud promedio de 160 pb o ADN genómico cortado en fragmentos de aproximadamente 160 pb. En esta realización, el proceso comienza con la adición mediada por transferasa terminal de colas de secuencia nucleotídica cortas al extremo 3' de las hebras de oligonucleótidos diana (barras gruesas de color negro en los extremos 3' de los oligonucleótidos diana, Figuras 19, etapa A y 21, etapa A). Como se muestra en la Figura 19, etapa B y en la Figura 21, etapa B, las sondas oligonucleotídicas que contienen secuencias complementarias a los extremos 5' y 3' del segmento de ADN y complementarias al conector en el extremo 3' del segmento de ADN se hibridan con los segmentos de ADN diana. En la realización representada en la Figura 19, etapa B, el oligonucleótido de ADN contiene una región, es decir, una parte de secuencia nucleotídica en su extremo 3' que no es complementaria al oligonucleótido sonda (parte en bucle cerca del extremo 3' del oligonucleótido diana en la Figura 19, etapa B). Además, el extremo 5' del oligonucleótido diana no es complementario a la sonda oligonucleotídica, formando de ese modo una aleta. En la realización de la Figura 21, etapa B, la sonda oligonucleotídica contiene una parte de secuencia nucleotídica que no es complementaria al oligonucleótido diana. Esta región no complementaria se representa como una región en bucle cerca del extremo 3' de la sonda oligonucleotídica. El extremo 5' del oligonucleótido diana en la Figura 21, etapa B no es complementario a la sonda oligonucleotídica, formando una aleta adecuada para la escisión con nucleasa. Estas regiones de no complementariedad entre el oligonucleótido diana y el oligonucleótido sonda no influyen en el proceso general de formación de construcciones de ácido nucleico circularizadas.

La parte adicional de las sondas oligonucleotídicas (mostrada como una barra gruesa de color negro) puede contener una secuencia de identificador único, una secuencia de identificador de paciente, una secuencia de unión a cebador, y/o un enlace escindible (dentro de la barra gruesa marcada como "U") (Figuras 19, etapa B y 21, etapa B, panel a la izquierda). Las sondas oligonucleotídicas también puede contener un grupo de bloqueo en un extremo (por ejemplo, las Figuras 19, etapa B y 21, etapa B, panel a la derecha muestran un grupo de bloqueo en el extremo 5' de la sonda oligonucleotídica). Como se muestra en la Figura 19, etapa C y en la Figura 21, etapa C, la polimerasa (diamante relleno) extiende el extremo 3' del conector corto hibridado del segmento de ADN para copiar la parte adicional de la sonda oligonucleotídica. La polimerasa usada en esta realización puede comprender actividad de exonucleasa, por ejemplo, actividad de exonucleasa de 5' a 3' o actividad de exonucleasa de 3' a 5'. Después de la extensión, una nucleasa 5' se escinde en una base coincidente solapante en el extremo 5' del ADN diana para retirar la región del conector en el extremo dejando de ese modo fosfato 5' competente para ligamiento. La polimerasa también extiende el extremo 3' de la sonda oligonucleotídica usando el segmento de ADN diana como molde (Figuras 19, etapa C y 21, etapa C). El grupo de bloqueo en el extremo 5' de la sonda (Figuras 19, etapa C y 21, etapa C, lado a la derecha) no está escindido. En la Figura 19, etapa D y en la Figura 21, etapa D (panel a la izquierda), la ligasa (círculo relleno) sella covalentemente la unión de ligamiento entre los extremos 3' y 5' del segmento de ADN genómico diana extendido, y los extremos 3' y 5' de la sonda oligonucleotídica extendida para crear productos de ligamiento circulares. Se introduce una mella en el enlace escindible (por ejemplo, escisión con UDG de dU, triángulo relleno) de la sonda oligonucleotídica circularizada para hacer que la sonda oligonucleotídica sea susceptible de digestión con exonucleasa (Figuras 19, etapa E y 21, etapa E, panel a la izquierda). Como se muestra en las Figuras 19, etapa D y 21, etapa D, panel a la derecha, la ligasa (círculo relleno) sella covalentemente la unión de ligamiento entre los extremos 3' y 5' del segmento de ADN genómico diana extendido; sin embargo, el grupo de bloqueo en el extremo 5' en la sonda oligonucleotídica evita la circularización de la sonda oligonucleotídica. Como se muestra en las Figuras 19, etapa E y 21, etapa E, la(s) exonucleasa(s) digiere(n) todos los productos oligonucleotídicos no ligados o con mellas (es decir, sondas oligonucleotídicas) dejando solo las construcciones de ácido nucleico monocatenario circulares deseadas que comprenden el segmento de ADN diana original acoplado a la parte adicional que contiene, por ejemplo, una secuencia de identificador único, secuencia de unión a cebador, o secuencia de identificador de paciente. Como se ha descrito anteriormente, el producto circularizado resultante es adecuado para amplificación por círculo rodante y secuenciación circular.

El proceso representado en las Figuras 20 y 22 es esencialmente el mismo que el que se muestra en las Figuras 19 y 21, respectivamente, sin embargo, la sonda oligonucleotídica comprende un grupo de bloqueo (3'-Blk) en su extremo 3', uno o más enlaces escindibles ("r"), una secuencia de unión a cebador, y un grupo de captura en el extremo 5' ("Z") opcional como se muestra en la Figura 20, etapa B y en la Figura 22, etapa B). La polimerasa (diamante relleno) extiende el extremo 3' del conector corto hibridado del segmento de ADN para copiar la parte adicional de la sonda oligonucleotídica. La escisión con nucleasa del extremo 5' del segmento de ADN en una base coincidente solapante genera un fosfato 5' competente para ligamiento (Figura 20, etapa C y Figura 22, etapa C). En la Figura 20, etapa D y en la Figura 22, etapa D, la ligasa (círculo relleno) sella covalentemente el extremo 3' extendido de la diana a su extremo 5' para crear un producto de ligamiento circular. El grupo de bloqueo en el extremo 3' de la sonda oligonucleotídica evita la extensión de la sonda oligonucleotídica. Posteriormente, el grupo de bloqueo se retira por escisión en el enlace escindible, por ejemplo, escisión con RNasa (triángulo relleno) de ribonucleótido "r". Como se muestra en las Figuras 20, etapa E y 22, etapa E, la polimerasa (diamante relleno) con actividad de desplazamiento de hebra extiende el extremo 3' liberado de la sonda oligonucleotídica para iniciar la amplificación por círculo rodante. El producto de extensión primario formado por amplificación por círculo rodante es adecuado para secuenciación. El grupo Z opcional en el extremo 5' se puede capturar sobre un soporte sólido antes o después de la amplificación por círculo rodante. Una vez capturado, el producto de ligamiento circular unido a cebador o la extensión del mismo se pueden liberar del soporte sólido mediante escisión en el enlace escindible, ya sea antes o después de la amplificación por círculo rodante.

La Figura 23 y la Figura 25 muestran un proceso similar para producir construcciones "diana" de ácido nucleico monocatenario quiméricas circulares adecuadas para la secuenciación como se describe en referencia a las Figuras 13, 15, 17, 19 y 21 mencionadas anteriormente. El ADN genómico diana se obtiene a partir de ADNcf con una longitud promedio de 160 pb o ADN genómico cortado en fragmentos de aproximadamente 160 pb. En las realizaciones de las Figuras 23 y 25, no se añaden conectores ni colas 3' o 5' a los segmentos de ADN genómico. Como se muestra en la Figura 23, etapa B y en la Figura 25, etapa B, las sondas oligonucleotídicas que contienen secuencias complementarias a los extremos 5' y 3' del segmento de ADN se hibridan con los segmentos de ADN diana. En la realización representada en la Figura 23, etapa B, los extremos 3' y 5' del oligonucleótido de ADN no son complementarios a la sonda oligonucleotídica, formando dos aletas no hibridadas. En la realización de la Figura 25, etapa B, los extremos 3' y 5' del oligonucleótido de ADN son complementarios a la sonda oligonucleotídica.

La parte adicional de las sondas oligonucleotídicas (mostrada como una barra gruesa de color negro) puede contener una secuencia de identificador único, una secuencia de identificador de paciente, una secuencia de unión a cebador, y/o un enlace escindible (dentro de la barra gruesa marcada como "U" (Figuras 23, etapa B y 25, etapa B, panel a la izquierda). Las sondas oligonucleotídicas también puede contener un grupo de bloqueo en un extremo (por ejemplo, Figuras 23, etapa B y 25, etapa B, panel a la derecha; un grupo de bloqueo en el extremo 5' de la sonda oligonucleotídica). Como se muestra en la Figura 23, etapa C, una polimerasa (diamante relleno) que tiene actividad de nucleasa 3' retira el extremo 3' monocatenario del oligonucleótido diana y a continuación extiende el extremo 3' del segmento de ADN para copiar la parte adicional de la sonda oligonucleotídica. La extensión mediada por polimerasa del extremo 3' del oligonucleótido diana también se produce en el proceso de la Figura 25, etapa B. Después de la extensión en los procesos de la Figura 23, etapa C y de la Figura 25, etapa C, una nucleasa 5' se escinde en una base coincidente solapante en el extremo 5' del ADN diana para retirar la región del conector en el extremo 5' dejando de ese modo fosfato 5' competente para ligamiento. La polimerasa también extiende el extremo 3' de la sonda oligonucleotídica usando el segmento de ADN diana como molde (Figuras 23, etapa C y 25, etapa C). El grupo de bloqueo en el extremo 5' de la sonda (Figuras 23, etapa C y 25, etapa C, lado a la derecha) no está escindido. En las Figuras 23, etapa D y 25, etapa D (panel a la izquierda), la ligasa (círculo relleno) sella covalentemente la unión de ligamiento entre los extremos 3' y 5' del segmento de ADN genómico diana extendido, y los extremos 3' y 5' de la sonda oligonucleotídica extendida para crear productos de ligamiento circulares. Se introduce una mella en el enlace escindible (por ejemplo, escisión con UDG de dU, triángulo relleno) de la sonda oligonucleotídica circularizada, para hacer que la sonda oligonucleotídica sea susceptible de digestiones con exonucleasa (Figuras 23, etapa E y 25, etapa E, panel a la izquierda). Como se muestra en las Figuras 23, etapa D y 25, etapa D, panel a la derecha, la ligasa (círculo relleno) sella covalentemente la unión de ligamiento entre los extremos 3' y 5' del segmento de ADN genómico diana extendido; sin embargo, el grupo de bloqueo en el extremo 5' en la sonda oligonucleotídica evita la circularización de la sonda oligonucleotídica. Como se muestra en las Figuras 23, etapa E y 25, etapa E, la(s) exonucleasa(s) digiere(n) todos los productos oligonucleotídicos no ligados o con mellas (es decir, sondas oligonucleotídicas) dejando solo las construcciones de ácido nucleico monocatenario circulares deseadas que comprenden el segmento de ADN diana original acoplado a la parte adicional que contiene, por ejemplo, una secuencia de identificador único, secuencia de unión a cebador, o secuencia de identificador de paciente. Como se ha descrito anteriormente, el producto circularizado resultante es adecuado para amplificación por círculo rodante y secuenciación circular.

Las partes específicas de diana en los extremos 3' y 5' de las sondas oligonucleotídicas, por ejemplo, las sondas oligonucleotídicas usadas en el proceso que se representa en la Figura 25, se pueden diseñar para que contengan uno o más emparejamientos erróneos de nucleótidos con el segmento de ADN genómico diana. Esta característica de diseño garantiza que el segmento de ADN genómico diana de la construcción de ácido nucleico circularizada ligada se pueda distinguir de la parte extendida con polimerasa de la construcción de ácido nucleico circularizada ligada (es decir, la línea sólida de la construcción circularizada se puede distinguir que la línea discontinua de la construcción en las Figuras 25E).

El proceso representado en las Figuras 24 y 26 es esencialmente el mismo que el que se muestra en las Figuras 23 y 25, respectivamente, sin embargo, la sonda oligonucleotídica comprende un grupo de bloqueo (3'-Blk) en su extremo 3', uno o más enlaces escindibles, una secuencia de unión a cebador, y un grupo de captura en el extremo 5' ("Z") opcional (Figuras 24, etapa B y 26, etapa B). La polimerasa (diamante relleno) extiende el extremo 3' hibridado del segmento de ADN para copiar la parte adicional de la sonda oligonucleotídica. En la realización de la Figura 24, etapa C, la polimerasa escinde la aleta no complementaria en el extremo 3' del oligonucleótido diana antes de la extensión. La escisión con nucleasa del extremo 5' del segmento de ADN en una base coincidente solapante genera un fosfato 5' competente para ligamiento (Figuras 24, etapa C y 26, etapa C). En las Figuras 24, etapa D y 26, etapa D, la ligasa (círculo relleno) sella covalentemente el extremo 3' extendido del segmento de ADN a su extremo 5' para crear un producto de ligamiento circular. El grupo de bloqueo en el extremo 3' de la sonda oligonucleotídica evita la extensión de la sonda oligonucleotídica. Posteriormente, el grupo de bloqueo se retira por escisión en el enlace escindible, por ejemplo, escisión con RNasa (triángulo relleno) de ribonucleótido "r". Como se muestra en las Figuras 24, etapa E y 26, etapa E, la polimerasa (diamante relleno) con actividad de desplazamiento de hebra extiende el extremo 3' liberado de la sonda oligonucleotídica para iniciar la amplificación por círculo rodante. El producto de extensión primario formado por amplificación por círculo rodante es adecuado para secuenciación. El grupo Z opcional en el extremo 5' se puede capturar sobre un soporte sólido antes o después de la amplificación por círculo rodante. Una vez capturado, el producto de ligamiento circular unido a cebador o la extensión del mismo se pueden liberar del soporte sólido mediante escisión en el enlace escindible, ya sea antes o después de la amplificación por círculo rodante.

La Figura 27 muestra un proceso para formar construcciones de ácido nucleico monocatenario circularizadas que contienen sitios HinPII metilados contiguos (GCGC). Las construcciones de ácido nucleico circularizadas son adecuadas para la detección y/o secuenciación de los sitios HinPII metilados. Como se muestra en la Figura 27, etapa A, el proceso comienza con la escisión de ADNcf o ADN genómico con HinPII en sitios de reconocimiento HinPII sin metilar para formar segmentos de ADN genómico de aproximadamente 160 pb. Los sitios HinP1I metilados dentro de los fragmentos de oligonucleótido diana se indican como 'm'. Como se muestra en la Figura 27, etapa B, las sondas oligonucleotídicas con secuencia de identificador único (línea gruesa de color negro) y secuencias HinPII sin metilar cerca de ambos extremos 3' y 5' de la sonda oligonucleotídica (es decir, complementarios a los sitios HinPII del ADNcf) se hibridan con oligonucleótidos de ADNcf que tienen sitios HinP1I metilados (panel a la izquierda) o sitios HinP1I sin metilar (panel a la derecha). El extremo 5' de la sonda oligonucleotídica contiene un grupo de bloqueo y el extremo 3' no tiene emparejamiento con el oligonucleótido diana para evitar la extensión con polimerasa. En la Figura 27, etapa C, la sonda oligonucleotídica hibridar a al segmento diana genómico se somete a escisión con HinPII (triángulos rellenos). Si tanto los oligonucleótidos sonda como diana no contienen sitios HinPII metilados, HinPII escinde los oligonucleótidos diana y sonda, retirando de ese modo las secuencias diana sin metilar de un análisis adicional. Si el oligonucleótido diana contiene sitios HinPII metilados, el oligonucleótido sonda no contiene sitios HinP1I metilados como se muestra en la Figura 27, etapa C, panel a la izquierda, HinPII escinde solo el oligonucleótido sonda, generando de ese modo un 3' OH competente para extensión y un fosfato 5' competente para ligamiento en la sonda. La polimerasa (diamante relleno) extiende el extremo 3' liberado de la sonda oligonucleotídica, y la ligasa (círculo relleno) sella covalentemente el extremo 3' y el extremo 5' de la sonda oligonucleotídica para crear un producto de ligamiento cerrado covalentemente (Figura 27, etapa D). La inactivación térmica de HinPII, o la incorporación por polimerasa de nucleótidos modificados evita una nueva escisión con HinPII. Como se muestra en la Figura 27, etapa E, la digestión con exonucleasa retira todos los productos no ligados o escindidos, dejando de este modo solo las construcciones circulares de ADN monocatenario que comprenden el complemento del ADN diana con una secuencia de identificador único. Este producto de ligamiento circularizado es adecuado para la amplificación por círculo rodante y la secuenciación posterior.

La Figura 28 muestra un proceso para descubrir la metilación en sitios HinP1I contiguos (GCGC) en todo el genoma. Este proceso implica escindir el ADN genómico con HinPII y ligamiento en conectores cortos (líneas gruesas de color negro) con extremos 5' bloqueados en los fragmentos genómicos escindidos como se muestra en la Figura 28, etapa A. "m" indica sitios HinPII metilados. En la Figura 28, etapa B, la amplificación por PCR limitada con cebadores bloqueados en el extremo 5' genera productos sin metilar. Solo los sitios HinPII contiguos (GCGG) metilados en la diana original generan fragmentos sin bloquear cuando se escinden con HinPII (triángulos rellenos). Como se muestra en la Figura 28, etapa C, el ligamiento (círculos rellenos) en conectores (líneas dobles) que contienen una secuencia de identificador único opcional (líneas dobles rellenas de color gris), una secuencia de identificador de paciente opcional (líneas dobles rellenas de color gris), con el extremo 3' bloqueado o cadena principal que contiene tiofosfato (****) para inhibir la digestión posterior con exonucleasa 3' (triángulos rellenos). Solo los fragmentos con conectores ligados a ambos lados permanecerán bicatenarios. En la Figura 28, etapa D, el extremo libre de los conectores se vuelve competente para ligamiento, ya sea (i) fosforilando el extremo 5', (ii) retirando el grupo en el extremo 3' bloqueado, o (iii) usando la actividad de nucleasa 5' para escindir la aleta o base coincidente solapante en el extremo 5', dejando un fosfato 5' competente para ligamiento, o cualquier combinación de los mismos. En la Figura 28, etapa E, las condiciones de ligamiento están diseñadas para favorecer la oligomerización. Los productos ligados comprenden secuencias HinPII contiguas metiladas originalmente en el ADN diana con una secuencia de identificador único y/o secuencia de identificador de paciente opcionales. El producto final es adecuado para etapas adicionales opcionales y secuenciación posterior.

La Figura 29 muestra un proceso para producir construcciones de ácido nucleico monocatenario quiméricas circulares adecuado para detectar metilación en sitios AciI contiguos (GCGG) en regiones genómicas conocidas comenzando a partir de ADNcf con una longitud promedio de 160 pb o ADN genómico cortado en fragmentos de aproximadamente 160 pb ("oligonucleótido diana" o "segmento de ADN"). Como se muestra en la Figura 29, etapa A, el proceso comienza añadiendo conectores resistentes a bisulfito (líneas gruesas de color negro) en los extremos 3' y 5' de los segmentos de ADN genómico (por ejemplo, mediante ligamiento). El tratamiento con bisulfito del ADN genómico convierte las citosinas sin metilar en uracilos, lo que da como resultado productos monocatenarios ("m" en la Figura 29, etapa A representa sitios AciI metilados). Para generar productos bicatenarios se realiza una PCR limitada, y el producto de PCR resultante se escinde con AciI (triángulos rellenos). Solo los sitios metilados en el segmento diana original permanecen como GCGG y se someten a escisión con AciI para generar extremos competentes para ligamiento. Como se muestra en la Figura 29, etapa B, las sondas oligonucleotídicas que contienen secuencias complementarias a los lados 5' y 3' del oligonucleótido diana escindido, y, opcionalmente, un grupo de bloqueo en el extremo 5', se hibridan con sus respectivos oligonucleótidos diana complementarios. Además de las partes específicas de diana, las sondas oligonucleotídicas también contienen una parte adicional. Esta parte adicional es una parte de secuencia nucleotídica que puede contener una secuencia de identificador único, una secuencia de identificador de paciente, y uno o más sitios de unión a cebador. Como se muestra en la Figura 29, etapa C, la polimerasa que carece de actividad 5 '^3 ' (diamantes rellenos) extiende el extremo 3' del oligonucleótido diana, copiando la parte adicional de la sonda y generando una unión competente para ligamiento con el extremo 5' del oligonucleótido diana. La polimerasa también extiende la sonda oligonucleotídica usando el oligonucleótido diana como molde, pero no escinde el grupo de bloqueo en el extremo 5' de la sonda si estuviera presente. En la Figura 29, etapa D, la ligasa (círculo relleno) sella covalentemente los extremos 3' y 5' del oligonucleótido diana para crear un producto de ligamiento circular que contiene el segmento de ADN diana (tratado con bisulfito y copiado). El grupo de bloqueo en el extremo 5' en la sonda oligonucleotídica evita la circularización de la hebra de la sonda oligonucleotídica. Como se muestra en la Figura 29, etapa E, la(s) exonucleasa(s) digiere(n) todos los productos no ligados o mellados dejando solo el ADN circular monocatenario deseado que comprende el complemento de ADN diana convertido con bisulfito con una secuencia de identificador único. El producto final es adecuado para secuenciación circular usando cualquiera de los métodos que se han descrito anteriormente.

La Figura 30 muestra un proceso para producir construcciones de ácido nucleico monocatenario quiméricas circulares adecuado para detectar metilación en sitios AciI contiguos (GCGG) en regiones genómicas conocidas comenzando a partir de ADNcf con una longitud promedio de 160 pb o ADN genómico cortado en fragmentos de aproximadamente 160 pb. Como se muestra en la Figura 30A, el proceso comienza añadiendo conectores resistentes a bisulfito (líneas gruesas de color negro) a los extremos 3' y 5' de los segmentos de ADN genómico (por ejemplo, mediante ligamiento). "m" en los segmentos de ADN genómico representa sitios AciI metilados. El tratamiento con bisulfito de los segmentos de ADNcf y/o ADN genómico, convierte las C sin metilar en U que generan productos monocatenarios. Para generar productos bicatenarios se realiza una PCR limitada, y los productos de PCR resultantes se escinden con AciI (triángulos rellenos, solo los sitios metillados en la diana original permanecen como GCGG) para generar extremos competentes para ligamiento. Como se muestra en la Figura 30, etapa B, las sondas oligonucleotídicas que contienen secuencias complementarias a los lados 5' y 3' de los productos de PCR diana escindidos se hibridan con sus respectivos oligonucleótidos diana complementarios. La sonda oligonucleotídica puede tener un grupo de bloqueo (3'-Blk) en su extremo 3', uno o más enlaces escindibles, y/o un grupo de captura ("Z") en el extremo 5' opcional. Además de las partes específicas de diana, las sondas oligonucleotídicas también contienen una parte adicional. Esta parte adicional es una parte de secuencia nucleotídica que puede contener una secuencia de identificador único, una secuencia de identificador de paciente, y uno o más sitios de unión a cebador. Como se muestra en la Figura 30, etapa C, una polimerasa que carece de actividad 5 '^3 ' (diamantes rellenos) extiende el extremo 3' del oligonucleótido diana, copiando la parte adicional de la sonda y generando una unión competente para ligamiento el extremo 5' del oligonucleótido diana. En la Figura 30, etapa D, la ligasa (círculo relleno) sella covalentemente los extremos 3' y 5' del oligonucleótido diana para crear un producto de ligamiento circular que contiene el segmento de ADN diana (tratado con bisulfito, copiado). El grupo de bloqueo en el extremo 3' en la sonda oligonucleotídica evitar la extensión y la circularización de la hebra de la sonda oligonucleotídica. La retirada posterior del grupo de bloqueo en el extremo 3' mellando el enlace escindible (por ejemplo, la escisión por RNasa del ribonucleótido r) permite la extensión mediada por polimerasa de la sonda oligonucleotídica (Figura 30, etapa D). Como se muestra en la Figura 30, etapa E, la polimerasa (diamante relleno) con actividad de desplazamiento de hebra extiende el extremo 3' liberado para la amplificación por círculo rodante. Este producto de extensión es adecuado para la secuenciación usando cualquiera de los métodos que se describen en el presente documento. El grupo Z opcional en el extremo 5' se puede capturar sobre un soporte sólido antes o después de la amplificación por círculo rodante. Una vez capturado, el producto de ligamiento circular unido a cebador o la extensión del mismo se pueden liberar del soporte sólido mediante escisión en el enlace escindible, ya sea antes o después de la amplificación por círculo rodante.

La Figura 31 muestra un proceso para producir construcciones de ácido nucleico monocatenario quiméricas circulares adecuadas para detectar metilación en sitios AciI contiguos (GCGG) en regiones genómicas conocidas comenzando a partir de ADNcf con una longitud promedio de 160 pb o ADN genómico cortado en fragmentos de aproximadamente 160 pb (m representa sitios AciI metilados). Como se muestra en la Figura 31, etapa A, el proceso comienza añadiendo conectores resistentes a bisulfito (líneas gruesas de color negro) en los extremos 3' y 5' de los segmentos de ADN genómico (por ejemplo, mediante ligamiento). El tratamiento con bisulfito de los segmentos de ADNcf y/o ADN genómico, convierte las C sin metilar en U que generan productos monocatenarios. Para generar productos bicatenarios se realiza una PCR limitada, y los productos de PCR resultantes se escinden con AciI (triángulos rellenos). Solo los sitios metilados en la diana original permanecen como GCGG y se somete en la escisión con AciI para generar extremos competentes para ligamiento. Como se muestra en la Figura 31, etapa B, sondas oligonucleotídicas dúplex se hibridan con los segmentos de ADN diana escindidos. Las sondas dúplex comprenden una primera hebra de la sonda oligonucleotídica que contiene secuencias nucleotídicas complementarias a los lados 5' y 3' de los segmentos de ADN diana, que están separadas entre sí mediante una parte adicional. La parte adicional comprende una parte de identificador único, y/o una parte de identificador de paciente, y/o una o más secuencias de unión a cebador. La segunda sonda oligonucleotídica de la sonda oligonucleotídica dúplex (línea gruesa de color negro con bucle) contiene una secuencia que es complementaria a la parte adicional de la primera sonda oligonucleotídica. La región en bucle de la segunda sonda oligonucleotídica representa una región no complementaria. Como se muestra en la Figura 31, etapa C, la hibridación de las sondas dúplex con los segmentos de ADN genómico escindidos crea dos uniones competentes para ligamiento, entre el extremo 3' del segmento de ADN y el extremo 5' de la segunda sonda oligonucleotídica y entre el extremo 3' de la segunda sonda oligonucleotídica y el extremo 5' del segmento genómico escindido. La ligasa (círculos rellenos) sella covalentemente las uniones de ligamiento para crear productos de ligamiento circulares que contienen el segmento de ADN diana (tratado con bisulfito, copiado) (Figura 31, etapa C). Como se muestra en la Figura 31, etapa D, la digestión con exonucleasa retira todos los productos sin ligar o mellados dejando solo los productos de ligamiento circulares monocatenario se son adecuados para secuenciación circular usando cualquiera de los métodos que se describen en el presente documento.

La Figura 32 muestra esencialmente el mismo proceso para producir construcciones de ácido nucleico monocatenario quiméricas circulares adecuadas para detectar metilación en sitios AciI contiguos como se muestra y se describe en la Figura 31. En la realización representada en la Figura 32, la primera sonda oligonucleotídica del conjunto de sonda dúplex tiene un grupo de captura ("Z") opcional en el extremo 5' (Figura 32, etapa B). Después de ligamiento de la segunda sonda oligonucleotídica y el segmento de ADN diana (tratado con bisulfito, copiado) para formar un producto de ligamiento circularizado (Figura 32, etapa C), el extremo 3' de la primera sonda oligonucleotídica se extiende usando una polimerasa de desplazamiento de hebra. La amplificación por círculo rodante genera un primer producto de extensión primario, que contiene secuencias lineales en tándem que son complementarias al producto de ligamiento circularizado (Figura 32, etapa D) y son adecuadas para la secuenciación usando los métodos que se describen en el presente documento.

La Figura 33 muestra un proceso para descubrir la metilación en sitios AciI contiguos (GCGG) en todo el genoma comenzando a partir de ADN genómico que se ha cortado a un tamaño promedio de 150 pb o a partir de ADNcf con un tamaño promedio de 160 pb. Como se muestra en la Figura 33, etapa A, el proceso comienza añadiendo, por ejemplo, mediante ligamiento, conectores cortos en los extremos 3' y 5' de los segmentos de ADN (líneas gruesas de color negro). El conector en el extremo 5' contiene un grupo de bloqueo. El tratamiento con bisulfito del ADN genómico convierte las C sin metilar en U dando como resultado productos monocatenarios. Como se muestra en la Figura 33, etapa B, la amplificación por PCR limitada con cebadores bloqueados en el extremo 5' genera productos sin metilar. Solo los sitios AciI contiguos (GCGG) metilados en la diana original generan fragmentos no bloqueados cuando se escinden con AciI (triángulos rellenos). Como se muestra en la Figura 33, etapa C, se añaden conectores (líneas dobles de color gris) que contienen una secuencia de identificador único y/o una secuencia de identificador de paciente (por ejemplo, mediante ligamiento a productos de escisión con AciI). Los conectores contienen un grupo de bloqueo en el extremo 3' o una cadena principal que contiene tiofosfato (****) para inhibir la digestión posterior con exonucleasa 3' (triángulos rellenos). Solo los fragmentos con conectores añadidos a ambos lados permanecen bicatenarios (Figura 33, etapa C, panel inferior). Como se muestra en la Figura 33, etapa D, los extremos del conector se hacen competentes para ligamiento (círculos rellenos), ya sea (i) fosforilando los extremos 5', (ii) retirando los grupos en el extremo 3' bloqueados, o (iii) usando actividad de nucleasa 5' para escindir la base o aleta complementaria solapante en el extremo 5' para generar fosfato 5' competente para ligamiento, o (iv) cualquier combinación de estas técnicas. Las condiciones de ligamiento se diseñan para favorecer la oligomerización. La Figura 33, etapa E muestra productos ligados formados por el complemento de ADN diana convertido con bisulfito (que procede principalmente de las islas CpG) con un identificador único y/o una secuencia de identificador de paciente opcionales. El producto final es adecuado para etapas adicionales y secuenciación posterior.

La Figura 34 muestra un proceso para producir construcciones de ácido nucleico monocatenario quiméricas circulares adecuadas para detectar sitios HinPII contiguos sin metilar en regiones definidas del genoma comenzando a partir de ADNcf con una longitud promedio de 160 pb o ADN genómico cortado en fragmentos de aproximadamente 160 pb. Como se muestra en la Figura 34, etapa A, el proceso comienza con la escisión con HinPII del ADN genómico en sitios de reconocimiento de GCGC (triángulos rellenos) para generar extremos 3' y 5' competentes para ligamiento. Como se muestra en la Figura 34, etapa B, las sondas oligonucleotídicas que contienen secuencias complementarias a los lados 5' y 3' de los segmentos de ADN diana escindidos se hibridan con sus respectivos segmentos de ADN diana escindidos. Las sondas oligonucleotídicas también contienen una parte nucleotídica adicional que contiene una secuencia de identificador único y, opcionalmente, una secuencia de identificador de paciente. En la realización de la Figura 34, la sonda oligonucleotídica también tiene un grupo de bloqueo en un extremo, por ejemplo, en el extremo 5'. La polimerasa (diamantes rellenos) que carece de actividad 5 '^3 ' extiende el extremo 3' del segmento de ADN diana hibridado, copiando la parte adicional de la sonda y creando una unión de ligamiento con el fosfato competente para ligamiento en el extremo 5' de la diana (Figura 34, etapa C). La polimerasa también extiende la sonda oligonucleotídica usando el segmento de ADN diana como molde, pero no escinde el grupo de bloqueo en su extremo 5'. En la Figura 34, etapa D, la ligasa (círculo relleno) sella covalentemente la unión entre el extremo 3' extendido y el extremo 5' del segmento de ADN para crear productos de ligamiento circulares. El grupo de bloqueo en el extremo 5' en la sonda oligonucleotídica evita la circularización de la sonda oligonucleotídica. Alternativamente, se introduce una mella en un enlace escindible contenido en la parte adicional, por ejemplo, la parte adicional contiene un nucleótido uracilo que se escinde usando UDG. Como se muestra en la Figura 34, etapa E, la digestión con exonucleasa de todos los productos sin ligar o mellados deja solo el ADN circular monocatenario que comprende el segmento de ADN diana original acoplado a una secuencia nucleotídica de identificación adicional, por ejemplo, secuencia de identificador único. El producto final es adecuado para amplificación por círculo rodante y secuenciación circular.

La Figura 35 muestra esencialmente el mismo proceso para producir construcciones de ácido nucleico monocatenario quiméricas circulares adecuadas para detectar sitios HinPII contiguos sin metilar en regiones definidas del genoma como se muestra y se describe en la Figura 34. En la realización representada en la Figura 35, la sonda oligonucleotídica contiene secuencias complementarias a los lados 5' y 3' del segmento de ADN diana que están separadas por la parte nucleotídica adicional. Además, la sonda oligonucleotídica también tiene un grupo de bloqueo (3'-Blk) en su extremo 3', uno o más enlaces escindibles, en donde el enlace escindible se representa como "r", y un grupo de captura en el extremo 5' ("Z") opcional (Figura 35, etapa B). El extremo 3' del segmento de ADN diana hibridado se extiende con polimerasa creando una unión de ligamiento con el fosfato competente para ligamiento en el extremo 5' del segmento de ADN diana. Después del ligamiento del extremo 3' extendido y el extremo 5' del segmento de ADN diana para formar un producto de ligamiento circularizado (Figura 35, etapa C), el grupo de bloqueo en el extremo 3' en la sonda oligonucleotídica se retira (por ejemplo, escisión con RNasa H del enlace ribonucleotídico) (Figura 35, etapa D), y una polimerasa (diamantes rellenos) que carece de actividad 5 '^3 ' extiende la sonda oligonucleotídica usando el producto de ligamiento de ADN circularizado como molde (Figura 35, etapa E). La amplificación por círculo rodante genera un producto de extensión primario que contienen secuencias lineales en tándem que son complementarias al producto de ligamiento circularizado (Figuras 35, etapa E). El producto de extensión primario es adecuado para la secuenciación usando los métodos que se describen en el presente documento. El grupo Z opcional en el extremo 5' se puede capturar sobre un soporte sólido antes o después de la amplificación por círculo rodante. Una vez capturado, el producto de ligamiento circular unido a cebador o la extensión del mismo se pueden liberar del soporte sólido mediante escisión en el enlace escindible, ya sea antes o después de la amplificación por círculo rodante.

Las Figuras 36 y 37 muestran un proceso para producir construcciones de ácido nucleico monocatenario quiméricas circulares adecuadas para detectar sitios AciI metilados entre sitios HaeIII en regiones genómicas de ADNcf o ADN genómico total cortado. El ADN genómico se escinde con AciI (triángulos rellenos, GCGG) y HaeIII (triángulos rellenos, GGCC) para generar extremos 3' y 5' competentes para ligamiento; m representa sitios metilados dentro de los segmentos escindidos (Figuras 36, etapa A y 37, etapa A). En la realización de la Figura 36, las sondas oligonucleotídicas que contienen secuencias en los extremos 5' y 3' complementarias a los lados 5' y 3' del segmento de ADN diana se hibridan con los segmentos de ADN escindidos (Figura 36, etapa B). Las sondas oligonucleotídicas también contienen una parte nucleotídica adicional que contiene una o más de una secuencia de identificador único, una secuencia de identificador de paciente, y/o uno o más sitios de unión a cebador. Las sondas oligonucleotídicas también pueden tener un grupo de bloqueo en un extremo (por ejemplo, un grupo de bloqueo en el extremo 5' como se muestra en la Figura 36, etapa B). La polimerasa (diamantes rellenos) que carece de actividad 5 '^3 ' extiende el extremo 3' del segmento de ADN diana hibridado, copiando la parte adicional de la sonda y creando una unión de ligamiento con el fosfato competente para ligamiento en el extremo 5' de la diana (Figura 36, etapa C). La polimerasa también extiende la sonda oligonucleotídica usando el segmento de ADN diana como molde, pero no escinde el grupo de bloqueo en su extremo 5'. En la Figura 36, etapa D, la ligasa (círculo relleno) sella covalentemente la unión entre el extremo 3' extendido y el extremo 5' del segmento de ADN para crear productos de ligamiento circulares. El grupo de bloqueo en el extremo 5' en la sonda oligonucleotídica evita la circularización de la sonda oligonucleotídica. Alternativamente, se introduce una mella en un enlace escindible contenido en la parte adicional, por ejemplo, la parte adicional contiene un nucleótido uracilo que se escinde usando UDG. Como se muestra en la Figura 36, etapa E, la digestión con exonucleasa de todos los productos sin ligar o mellados deja solo el ADN circular monocatenario que comprende el segmento de ADN diana original acoplado a una secuencia nucleotídica de identificación adicional, por ejemplo, secuencia de identificador único. El producto final es adecuado para amplificación por círculo rodante y secuenciación circular.

En la realización representada en la Figura 37 la sonda oligonucleotídica contiene secuencias complementarias a los lados 5' y 3' del segmento de ADN diana que están separadas por la parte nucleotídica adicional. Además, la sonda oligonucleotídica también tiene un grupo de bloqueo (3'-Blk) en su extremo 3', uno o más enlaces escindibles, en donde el enlace escindible se representa como "r", y un grupo de captura en el extremo 5' ("Z") opcional (Figura 37, etapa B). Después del ligamiento del extremo 3' extendido y el extremo 5' del segmento de ADN diana para formar un producto de ligamiento circularizado (Figura 37, etapa C), el grupo de bloqueo en el extremo 3' en la sonda oligonucleotídica se retira (por ejemplo, escisión con RNasa H del enlace ribonucleotídico) (Figura 37, etapa D), y una polimerasa (diamantes rellenos) que carece de actividad 5'—^3' extiende la sonda oligonucleotídica usando el producto de ligamiento de ADN circularizado como molde (Figura 37, etapa E). La amplificación por círculo rodante genera un producto de extensión primario que contiene secuencias lineales en tándem que son complementarias al producto de ligamiento circularizado (Figuras 37, etapa E). El producto de extensión primario es adecuado para la secuenciación usando los métodos que se describen en el presente documento. El grupo Z opcional en el extremo 5' se puede capturar sobre un soporte sólido antes o después de la amplificación por círculo rodante. Una vez capturado, el producto de ligamiento circular unido a cebador o la extensión del mismo se pueden liberar del soporte sólido mediante escisión en el enlace escindible, ya sea antes o después de la amplificación por círculo rodante.

La Figura 38 muestra un proceso para producir construcciones de ácido nucleico monocatenario quiméricas circulares adecuadas para detectar sitios Bsh1236I metilados entre sitios HaeIII en regiones genómicas de ADNcf o ADN genómico total cortado. El ADN genómico se escinde con Bsh1236I (CGCG) y HaeIII (triángulos rellenos, GGCC) para generar extremos 3' y 5' competentes para ligamiento; m representa sitios metilados dentro de los segmentos escindidos (Figura 38, etapa A). En la realización de la Figura 38, las sondas oligonucleotídicas que contienen secuencias en los extremos 5' y 3' complementarias a los lados 5' y 3' del segmento de ADN diana se hibridan con los segmentos de ADN escindidos (Figura 38, etapa B). Las sondas oligonucleotídicas también contienen una parte nucleotídica adicional que contiene una o más de una secuencia de identificador único, una secuencia de identificador de paciente, y/o uno o más sitios de unión a cebador. Las sondas oligonucleotídicas también pueden tener un grupo de bloqueo en un extremo (por ejemplo, un grupo de bloqueo en el extremo 5' como se muestra en la Figura 38, etapa B). La polimerasa (diamantes rellenos) que carece de actividad 5— 3' extiende el extremo 3' del segmento de ADN diana hibridado, copiando la parte adicional de la sonda y creando una unión de ligamiento con el fosfato competente para ligamiento en el extremo 5' de la diana (Figura 38, etapa C). La polimerasa también extiende la sonda oligonucleotídica usando el segmento de ADN diana como molde, pero no escinde el grupo de bloqueo en su extremo 5'. En la Figura 38, etapa D, la ligasa (círculo relleno) sella covalentemente la unión entre el extremo 3' extendido y el extremo 5' del segmento de ADN para crear productos de ligamiento circulares. El grupo de bloqueo en el extremo 5' en la sonda oligonucleotídica evita la circularización de la sonda oligonucleotídica. Alternativamente, se introduce una mella en un enlace escindible contenido en la parte adicional, por ejemplo, la parte adicional contiene un nucleótido uracilo que se escinde usando UDG. Como se muestra en la Figura 38, etapa E, la digestión con exonucleasa de todos los productos sin ligar o mellados deja solo el ADN circular monocatenario que comprende el segmento de ADN diana original acoplado a una secuencia nucleotídica de identificación adicional, por ejemplo, secuencia de identificador único. El producto final es adecuado para amplificación por círculo rodante usando polimerasa Bst en presencia de BstUI (CGCG) para garantizar que los sitios que se metilaron en la diana original no están escindidos, y posteriormente se identifican mediante secuenciación. Este ejemplo muestra Este ejemplo muestra el uso de la endonucleasa de restricción BstUI. Sin embargo, en este método también se pueden usar otras endonucleasas que escinden el ADN bicatenario si no está metilado, pero no el ADN híbrido metilado/sin metilar, ni el ADN monocatenario sin metilar. Estas incluyen, pero no se limitan a, las enzimas termófilas BstHHI (reconoce GCGC; un isoesquizómero de HhaI), BsiSI (reconoce CCGG; un isoesquizómero de HpaII), y Tail (reconoce ACGT; un isoesquizómero de MaeII).

La Figura 39 y la Figura 36 muestran un proceso para producir construcciones de ácido nucleico monocatenario quiméricas circulares adecuadas para detectar sitios AciI metilados cerca de un sitio HaeIII en el extremo 5' en regiones conocidas de ADN genómico. El método es adecuado para detectar sitios AciI metilados en el ADN genómico cortado a un tamaño promedio de 160 pb o ADNcf que tiene un tamaño promedio de 160 pb. El ADN genómico se escinde con AciI (GCGG) y HaeIII (GGCC) para generar extremos 5' competentes para ligamiento (Figuras 39, etapa A y 40, etapa A). En la realización representada en la Figura 39, las sondas oligonucleotídicas que contienen secuencias en los extremos 5' y 3' complementarias a los lados 5' y 3' de los segmentos de ADN genómico diana se hibridan con los segmentos de ADN escindidos (Figura 39, etapa B). Las sondas oligonucleotídicas también contienen una parte nucleotídica adicional que comprende una o más de una secuencia de identificador único, una secuencia de identificador de paciente, y uno o más sitios de unión a cebador. Las sondas oligonucleotídicas también pueden tener un grupo de bloqueo en un extremo (por ejemplo, un grupo de bloqueo en el extremo 5' como se muestra en la Figura 39, etapa B). La polimerasa con actividad de nucleasa 3— 5' (diamantes rellenos), pero que carece de actividad 5— 3' retira el extremo 3' monocatenario, y a continuación extiende el extremo 3' del segmento de ADN diana hibridado, copiando la parte adicional de la sonda y creando una unión de ligamiento con el fosfato competente para ligamiento en el extremo 5' de la diana (Figura 39, etapa C). La polimerasa también extiende la sonda oligonucleotídica usando el segmento de ADN diana como molde, pero no escinde el grupo de bloqueo en su extremo 5'. En la Figura 39, etapa D, la ligasa (círculo relleno) sella covalentemente la unión entre el extremo 3' extendido y el extremo 5' del segmento de ADN para crear productos de ligamiento circulares. El grupo de bloqueo en el extremo 5' en la sonda oligonucleotídica evita la circularización de la sonda oligonucleotídica. Alternativamente, se introduce una mella en un enlace escindible contenido en la parte adicional, por ejemplo, la parte adicional contiene un nucleótido uracilo que se escinde usando UDG. Como se muestra en la Figura 39, etapa E, la digestión con exonucleasa de todos los productos sin ligar o mellados deja solo el ADN circular monocatenario que comprende el segmento de ADN diana original acoplado a una secuencia nucleotídica de identificación adicional, por ejemplo, secuencia de identificador único. El producto final es adecuado para amplificación por círculo rodante y secuenciación circular.

En la realización representada en la Figura 40 las sondas oligonucleotídicas contienen secuencias en los extremos 5' y 3' complementarias a los lados 5' y 3' del segmento de ADN diana escindido que están separadas por la parte nucleotídica adicional. Además, las sondas oligonucleotídicas también tienen un grupo de bloqueo (3'-Blk) en su extremo 3', uno o más enlaces escindibles, en donde el enlace escindible se representa como "r", y un grupo de captura en el extremo 5' ("Z") opcional (Figura 40, etapa A). Después del ligamiento del extremo 3' extendido y el extremo 5' del segmento de ADN diana para formar un producto de ligamiento circularizado (Figura 40, etapa C), el grupo de bloqueo en el extremo 3' en la sonda oligonucleotídica se retira (por ejemplo, escisión con RNasa H del enlace ribonucleotídico) (Figura 40, etapa D), y una polimerasa (diamantes rellenos) que carece de actividad 5 '^3 ' extiende la sonda oligonucleotídica usando el producto de ligamiento de ADN circularizado como molde (Figura 40, etapa E). La amplificación por círculo rodante genera un producto de extensión primario que contiene secuencias lineales en tándem que son complementarias al producto de ligamiento circularizado (Figuras 40, etapa E). El producto de extensión primario es adecuado para la secuenciación usando los métodos que se describen en el presente documento. El grupo Z opcional en el extremo 5' se puede capturar sobre un soporte sólido antes o después de la amplificación por círculo rodante. Una vez capturado, el producto de ligamiento circular unido a cebador o la extensión del mismo se pueden liberar del soporte sólido mediante escisión en el enlace escindible, ya sea antes o después de la amplificación por círculo rodante.

La Figura 41 muestra un proceso para producir construcciones de ácido nucleico monocatenario quiméricas circulares adecuadas para detectar sitios Bsh1236I metilados cerca de un sitio HaeIII en el extremo 5' en regiones conocidas de ADN genómico. El método es adecuado para detectar sitios Bsh1236I metilados en el ADN genómico cortado a un tamaño promedio de 150 pb o ADNcf que tiene un tamaño promedio de 160 pb. El ADN genómico se escinde con Bsh1236I (CGCG) y HaeIII (GGCC) para generar extremos 5' competentes para ligamiento (Figura 41, etapa A). En la realización representada en la Figura 41, las sondas oligonucleotídicas que contienen secuencias en los extremos 5' y 3' complementarias a los lados 5' y 3' de los segmentos de ADN genómico diana se hibridan con los segmentos de ADN escindidos (Figura 41, etapa B). Las sondas oligonucleotídicas también contienen una parte nucleotídica adicional que comprende una o más de una secuencia de identificador único, una secuencia de identificador de paciente, y uno o más sitios de unión a cebador. Las sondas oligonucleotídicas también pueden tener un grupo de bloqueo en un extremo (por ejemplo, un grupo de bloqueo en el extremo 5' como se muestra en la Figura 41, etapa B). La polimerasa con actividad de nucleasa 3 '^5 ' (diamantes rellenos), pero que carece de actividad 5 '^3 ' retira el extremo 3' monocatenario del segmento de ADN diana, y a continuación extiende el extremo 3' escindido del segmento de ADN diana hibridado, copiando la parte adicional de la sonda y creando una unión de ligamiento con el fosfato competente para ligamiento en el extremo 5' de la diana (Figura 41, etapa C). La polimerasa también extiende la sonda oligonucleotídica usando el segmento de ADN diana como molde, pero no escinde el grupo de bloqueo en su extremo 5'. En la Figura 41, etapa D, la ligasa (círculo relleno) sella covalentemente la unión entre el extremo 3' extendido y el extremo 5' del segmento de ADN para crear productos de ligamiento circulares. El grupo de bloqueo en el extremo 5' en la sonda oligonucleotídica evita la circularización de la sonda oligonucleotídica. Alternativamente, se introduce una mella en un enlace escindible contenido en la parte adicional, por ejemplo, la parte adicional contiene un nucleótido uracilo que se escinde usando UDG. Como se muestra en la Figura 41, etapa E, la digestión con exonucleasa de todos los productos sin ligar o mellados deja solo el ADN circular monocatenario que comprende el segmento de ADN diana original acoplado a una secuencia nucleotídica de identificación adicional, por ejemplo, secuencia de identificador único. El producto final es adecuado para amplificación por círculo rodante usando polimerasa Bst en presencia de BstUI (CGCG) para garantizar que los sitios que se metilaron en la diana original posteriormente se identifican mediante secuenciación. Este ejemplo muestra el uso de la endonucleasa de restricción BstUI. Sin embargo, alternativamente se pueden usar otras endonucleasas que escinden el ADN bicatenario si no está metilado, pero no el ADN híbrido metilado/sin metilar, ni el ADN monocatenario sin metilar. Estas incluyen, pero no se limitan a, las enzimas termófilas BstHHI (reconoce GCGC; un isoesquizómero de HhaI), BsiSI (reconoce CCGG; un isoesquizómero de HpaII), y Tail (reconoce ACGT; un isoesquizómero de MaeII).

La Figura 42 y la Figura 43 muestran un proceso para producir construcciones de ácido nucleico monocatenario quiméricas circulares adecuadas para detectar sitios AciI metilados cerca de un sitio HaeIII en el extremo 3' en regiones genómicas de ADNcf o ADN genómico total cortado. El ADN genómico se escinde con AciI (GCGG) y HaeIII (GGCC) para generar extremos 3' competentes para extensión (Figuras 42, etapa A y 43, etapa A). En la realización de la Figura 42, las sondas oligonucleotídicas que contienen secuencias en los extremos 5' y 3' complementarias a los lados 5' y 3' del segmento de ADN diana se hibridan con los segmentos de ADN escindidos (Figura 42, etapa B). Las sondas oligonucleotídicas también contienen una parte nucleotídica adicional que contiene una o más de una secuencia de identificador único, una secuencia de identificador de paciente, y/o uno o más sitios de unión a cebador. Las sondas oligonucleotídicas también pueden tener un grupo de bloqueo en un extremo (por ejemplo, un grupo de bloqueo en el extremo 5' como se muestra en la Figura 42B). La polimerasa (diamantes rellenos) que carece de actividad 5 '^3 ' extiende el extremo 3' del segmento de ADN diana hibridado, copiando la parte adicional de la sonda. La actividad de nucleasa 5' de la polimerasa escinde una base coincidente solapante en el extremo 5' del segmento de ADN diana generando de ese modo un fosfato 5' competente para ligamiento (Figura 42, etapa C). La polimerasa también extiende la sonda oligonucleotídica usando el segmento de ADN diana como molde, pero no escinde el grupo de bloqueo en su extremo 5'. En la Figura 42, etapa D, la ligasa (círculo relleno) sella covalentemente la unión entre el extremo 3' extendido y el extremo 5' del segmento de ADN para crear productos de ligamiento circulares que contienen un segmento de ADN genómico original. El grupo de bloqueo en el extremo 5' en la sonda oligonucleotídica evita la circularización de la sonda oligonucleotídica. Alternativamente, se introduce una mella en un enlace escindible contenido en la parte adicional, por ejemplo, la parte adicional contiene un nucleótido uracilo que se escinde usando UDG. Como se muestra en la Figura 42, etapa E, la digestión con exonucleasa de todos los productos sin ligar o mellados deja solo el ADN circular monocatenario que comprende el segmento de ADN diana original acoplado a una secuencia nucleotídica de identificación adicional, por ejemplo, secuencia de identificador único. El producto final es adecuado para amplificación por círculo rodante y secuenciación circular.

En la realización de la Figura 43, las sondas oligonucleotídicas contiene secuencias complementarias a los lados 5' y 3' del segmento de ADN diana que están separados por la parte nucleotídica adicional. Además, las sondas oligonucleotídicas también tienen un grupo de bloqueo (3'-Blk) en el extremo 3', uno o más enlaces escindibles, en donde el enlace escindible se representa como "r", y un grupo de captura en el extremo 5' ("Z") opcional (Figura 43, etapa B). Después del ligamiento del extremo 3' extendido y del extremo 5' del segmento de ADN diana para formar un producto de ligamiento circularizado (Figura 43, etapa C), el grupo de bloqueo en el extremo 3' en la sonda oligonucleotídica se retira (por ejemplo, escisión con RNasa H del enlace ribonucleotídico) (Figura 43, etapa D), y una polimerasa (diamantes rellenos) que carece de actividad 5 '^3 ' extiende la sonda oligonucleotídica usando el producto de ligamiento de ADN circularizado como molde (Figura 43, etapa E). La amplificación por círculo rodante genera un producto de extensión primario que contiene secuencias lineales en tándem que son complementarias al producto de ligamiento circularizado (Figuras 43, etapa E). El producto de extensión primario es adecuado para la secuenciación usando los métodos que se describen en el presente documento. El grupo Z opcional en el extremo 5' se puede capturar sobre un soporte sólido antes o después de la amplificación por círculo rodante. Una vez capturado, el producto de ligamiento circular unido a cebador o la extensión del mismo se pueden liberar del soporte sólido mediante escisión en el enlace escindible, ya sea antes o después de la amplificación por círculo rodante.

La Figura 44 muestra un proceso para producir construcciones de ácido nucleico monocatenario quiméricas circulares adecuadas para detectar sitios Bsh1236I metilados cerca de un sitio HaeIII en el extremo 3' en regiones genómicas de ADNcf o ADN genómico total cortado. El ADN genómico se escinde con Bsh1236I (CGCG) y HaeIII (GGCC) para generar extremos 3' competentes para extensión (Figura 44, etapa A). En la realización de la Figura 44, las sondas oligonucleotídicas que contienen secuencias en los extremos 5' y 3' complementarias a los lados 5' y 3' del segmento de ADN diana se hibridan con los segmentos de ADN escindidos (Figura 44, etapa B). Las sondas oligonucleotídicas también contienen una parte nucleotídica adicional que contiene una o más de una secuencia de identificador único, una secuencia de identificador de paciente, y/o uno o más sitios de unión a cebador. Las sondas oligonucleotídicas también pueden tener un grupo de bloqueo en un extremo (por ejemplo, un grupo de bloqueo en el extremo 5' como se muestra en la Figura 44, etapa B). La polimerasa (diamantes rellenos) que carece de actividad 5 '^3 ' extiende el extremo 3' del segmento de ADN diana hibridado, copiando la parte adicional de la sonda. La actividad de nucleasa 5' de la polimerasa escinde una base coincidente solapante en el extremo 5' del segmento de ADN diana generando de ese modo un fosfato 5' competente para ligamiento (Figura 44, etapa C). La polimerasa también extiende la sonda oligonucleotídica usando el segmento de ADN diana como molde, pero no escinde el grupo de bloqueo en su extremo 5'. En la Figura 44, etapa D, la ligasa (círculo relleno) sella covalentemente la unión entre el extremo 3' extendido y el extremo 5' del segmento de ADN para crear productos de ligamiento circulares que contienen un segmento de ADN genómico original. El grupo de bloqueo en el extremo 5' en la sonda oligonucleotídica evita la circularización de la sonda oligonucleotídica. Alternativamente, se introduce una mella en un enlace escindible contenido en la parte adicional, por ejemplo, la parte adicional contiene un nucleótido uracilo que se escinde usando UDG. Como se muestra en la Figura 44, etapa E, la digestión con exonucleasa de todos los productos sin ligar o mellados deja solo el ADN circular monocatenario que comprende el segmento de ADN diana original acoplado a una secuencia nucleotídica de identificación adicional, por ejemplo, secuencia de identificador único. El producto final es adecuado para amplificación por círculo rodante usando polimerasa Bst en presencia de BstUI (CGCG) para garantizar que los sitios que estaban metilados en la diana original se identifican posteriormente mediante secuenciación. Este ejemplo muestra el uso de la endonucleasa de restricción BstUI. Sin embargo, se pueden usar otras endonucleasas que escinden el ADN bicatenario si no está metilado, pero no el ADN híbrido metilado/sin metilar, ni el ADN monocatenario sin metilar. Estas incluyen, pero no se limitan a, las enzimas termófilas BstHHI (reconoce GCGC; un isoesquizómero de HhaI), BsiSI (reconoce CCGG; un isoesquizómero de HpaII), y Tail (reconoce ACGT; un isoesquizómero de MaeII).

La Figura 45 muestra un proceso para producir construcciones de ácido nucleico monocatenario quiméricas circulares adecuadas para detectar sitios Bsh1236I metilados contiguos en regiones conocidas de ADN genómico. El método es adecuado para detectar sitios Bsh1236I metilados en el ADN genómico cortado a un tamaño promedio de 150 pb o ADNcf que tiene un tamaño promedio de 160 pb. El ADN genómico se escinde con Bsh1236I (CGCG) en sitios de reconocimiento sin metilar en el ADN diana (Figura 45, etapa A). En la realización representada en la Figura 45, las sondas oligonucleotídicas que contienen secuencias en los extremos 5' y 3' complementarias a los lados 5' y 3' de los segmentos de ADN genómico diana están hibridadas a los segmentos de ADN (Figura 45, etapa B). Las sondas oligonucleotídicas también contienen una parte nucleotídica adicional que comprende una o más de una secuencia de identificador único, una secuencia de identificador de paciente, y uno o más sitios de unión a cebador. Las sondas oligonucleotídicas también pueden tener un grupo de bloqueo en un extremo (por ejemplo, un grupo de bloqueo en el extremo 5' como se muestra en la Figura 44, etapa B). La polimerasa (diamantes rellenos) con actividad 3'-5 retira el extremo 3' monocatenario de la diana, y a continuación extiende el extremo 3' del segmento de ADN diana hibridado, copiando la parte adicional de la sonda. La actividad de nucleasa 5 '^3 ' de la polimerasa escinde una base coincidente solapante en el extremo 5' del segmento de ADN diana generando de ese modo un fosfato 5' competente para ligamiento (Figura 45, etapa C). La polimerasa también extiende la sonda oligonucleotídica usando el segmento de ADN diana como molde, pero no escinde el grupo de bloqueo en su extremo 5'. En la Figura 45, etapa D, la ligasa (círculo relleno) sella covalentemente la unión entre el extremo 3' extendido y el extremo 5' del segmento de ADN para crear productos de ligamiento circulares. El grupo de bloqueo en el extremo 5' en la sonda oligonucleotídica evita la circularización de la sonda oligonucleotídica. Alternativamente, se introduce una mella en un enlace escindible contenido en la parte adicional, por ejemplo, la parte adicional contiene un nucleótido uracilo que se escinde usando UDG. Como se muestra en la Figura 45, etapa E, la digestión con exonucleasa de todos los productos sin ligar o mellados deja solo el ADN circular monocatenario que comprende el segmento de ADN diana original acoplado a una secuencia nucleotídica de identificación adicional, por ejemplo, secuencia de identificador único. El producto final es adecuado para amplificación por círculo rodante usando polimerasa Bst en presencia de BstUI (CGCG). Por lo tanto, los sitios que estaban metilados en la diana original se amplifican y posteriormente se identifican mediante secuenciación. Este ejemplo muestra el uso de la endonucleasa de restricción BstUI. Sin embargo, se pueden usar otras endonucleasas que escinden el ADN bicatenario si no está metilado, pero no el ADN híbrido metilado/sin metilar, ni el ADN monocatenario sin metilar. Estas incluyen, pero no se limitan a, las enzimas termófilas BstHHI (reconoce GCGC; un isoesquizómero de HhaI), BsiSI (reconoce CCGG; un isoesquizómero de HpaII), y Tail (reconoce ACGT; un isoesquizómero de MaeII).

La Figura 46 muestra un proceso para producir construcciones de ácido nucleico monocatenario quiméricas circulares adecuadas para detectar todos los sitios CpG metilados cerca de los sitios Bsh1236I en regiones conocidas de ADN genómico. El método es adecuado para detectar todos los sitios CpG metilados cerca de los sitios Bsh1236I metilados en el ADN genómico cortado a un tamaño promedio de 150 pb o ADNcf que tiene un tamaño promedio de 160 pb. El ADN genómico se escinde con Bsh1236I (CGCG) en sitios de reconocimiento sin metilar (Figura 46, etapa A). El tratamiento con bisulfito convierte las C sin metilar en U y hace que las hebras no sean complementarias. En la realización representada en la Figura 46, las sondas oligonucleotídicas que contienen secuencias en los extremos 5' y 3' complementarias a los lados 5' y 3' de los segmentos de ADN genómico diana metilados tratados con bisulfito se hibridan con los segmentos de ADN (Figura 46, etapa B). Las sondas oligonucleotídicas también contienen una parte nucleotídica adicional que comprende una o más de una secuencia de identificador único, una secuencia de identificador de paciente, y uno o más sitios de unión a cebador. Las sondas oligonucleotídicas también pueden tener un grupo de bloqueo en un extremo (por ejemplo, un grupo de bloqueo en el extremo 5' como se muestra en la Figura 46, etapa B). La polimerasa (diamantes rellenos) con actividad 3 '^5 ' retira el extremo 3' monocatenario de la diana tratada con bisulfito, y a continuación extiende el extremo 3' del segmento de ADN diana hibridado para copiar la parte adicional de la sonda. La actividad de nucleasa 5 '^3 ' de la polimerasa escinde una base coincidente solapante en el extremo 5' del segmento de ADN diana tratado con bisulfito generando de ese modo un fosfato 5' competente para ligamiento (Figura 46, etapa C). La polimerasa también extiende la sonda oligonucleotídica usando el segmento de ADN diana tratado con bisulfito como molde, pero no escinde el grupo de bloqueo en su extremo 5'. En la Figura 46, etapa D, la ligasa (círculo relleno) sella covalentemente la unión entre el extremo 3' extendido y el extremo 5' del segmento de ADN para crear productos de ligamiento circulares. El grupo de bloqueo en el extremo 5' en la sonda oligonucleotídica evita la circularización de la sonda oligonucleotídica. Como se muestra en la Figura 46, etapa E, la digestión con exonucleasa de todos los productos sin ligar o mellados deja solo el ADN circular monocatenario que comprende el segmento de ADN diana tratado con bisulfito original acoplado a una secuencia nucleotídica de identificación adicional, por ejemplo, secuencia de identificador único. El producto final es adecuado para amplificación por círculo rodante usando polimerasa Bst en presencia de BstUI (CGCG) para garantizar que los sitios no convertidos por bisulfito estaban metilados en la diana original, y que los demás sitios CpG metilados se identifican por secuenciación. Este ejemplo muestra el uso de la endonucleasa de restricción BstUI. Sin embargo, se pueden usar otras endonucleasas que escinden el ADN bicatenario si no está metilado, pero no el ADN híbrido metilado/sin metilar, o el ADN monocatenario sin metilar, y que retienen el reconocimiento de restricción de los sitios metilados después del tratamiento con bisulfito. Esto incluye, pero no se limita a, la enzima termófila Tail (reconoce ACGT; un isoesquizómero de MaeII).

La Figura 47 y la Figura 48 muestran un proceso para producir construcciones de ácido nucleico monocatenario quiméricas circulares adecuadas para detectar sitios HinPII contiguos sin metilar en regiones genómicas de ADNcf o ADN genómico total cortado. El ADN genómico se escinde con HinPII (GCGC) (triángulos rellenos) para generar con extremos 3' y 5' competentes para ligamiento (Figuras 47, etapa A y 48, etapa A). Como se muestra en la Figura 47, etapa B, las sondas oligonucleotídicas dúplex se hibridan con los segmentos de ADN diana escindidos. Las sondas dúplex comprenden una primera hebra de la sonda oligonucleotídica que contiene secuencias nucleotídicas complementarias a los lados 5' y 3' del segmento de ADN diana, que están separados por una parte adicional. La parte adicional comprende una parte de identificador único, y/o una parte de identificador de paciente, y/o una o más secuencias de unión a cebador. La segunda sonda oligonucleotídica de las sondas oligonucleotídicas dúplex (línea gruesa de color negro con bucle) contiene una secuencia que es complementaria a la parte adicional de la primera sonda oligonucleotídica. La región en bucle de la segunda sonda oligonucleotídica representa una región no complementaria. Como se muestra en la Figura 47, etapa C, la hibridación de las sondas dúplex con los segmentos de ADN genómico escindidos crea dos uniones competentes para ligamiento, es decir, entre el extremo 3' del segmento de ADN y el extremo 5' de la segunda sonda oligonucleotídica, y entre el extremo 3' de la segunda sonda oligonucleotídica y el extremo 5' del segmento genómico escindido. La ligasa (círculos rellenos) sella covalentemente las uniones de ligamiento para crear productos de ligamiento circulares que contienen segmentos de ADN genómico (Figura 47, etapa C). Como se muestra en la Figura 47, etapa D, la digestión con exonucleasa retira todos los productos sin ligar o mellados dejando solo los productos de ligamiento circulares monocatenarios deseados que son adecuados para secuenciación circular usando cualquiera de los métodos que se describen en el presente documento.

En la realización representada en la Figura 48 la primera sonda oligonucleotídica de la sonda dúplex contiene secuencias complementarias a los lados 5' y 3' del segmento de ADN diana que están separadas por la parte nucleotídica adicional. Además, la primera sonda oligonucleotídica también tiene un grupo de captura en el extremo 5' ("Z") opcional (Figura 48, etapa B). Después de ligamiento en las dos uniones de ligamiento entre el segmento de ADN diana y la segunda sonda oligonucleotídica para formar el producto de ligamiento circularizado de la Figura 48, etapa C, una polimerasa (diamantes rellenos) que tiene actividad de desplazamiento de hebra extiende la primera sonda oligonucleotídica usando el ADN circularizado que contiene producto de ligamiento como molde (Figura 48, etapa D). La amplificación por círculo rodante genera un producto de extensión primario que contiene secuencias lineales en tándem que son complementarias al producto de ligamiento circularizado (Figuras 48, etapa D). El producto de extensión primario es adecuado para la secuenciación usando los métodos que se describen en el presente documento. El grupo Z opcional en el extremo 5' se puede capturar sobre un soporte sólido antes o después de la amplificación por círculo rodante. Una vez capturado, el producto de ligamiento circular unido a cebador o la extensión del mismo se pueden liberar del soporte sólido mediante escisión en el enlace escindible, ya sea antes o después de la amplificación por círculo rodante.

La Figura 49 y la Figura 50 muestran un proceso para producir construcciones de ácido nucleico monocatenario quiméricas circulares adecuadas para detectar sitios AciI ("m") metilados localizados entre sitios HaeIII en regiones genómicas de ADNcf o ADN genómico total cortado. El ADN genómico se escinde con AciI (triángulos rellenos, GCGG) y HaeIII (triángulos rellenos, GGCC) para generar extremos 3' y 5' competentes para ligamiento (Figuras 49, etapa A y 50, etapa A). Como se muestra en las Figuras 49, etapa B y 50, etapa B, las sondas oligonucleotídicas dúplex se hibridan con los segmentos de ADN diana escindidos. En la realización representada en la Figura 49, las sondas dúplex comprenden una primera hebra de la sonda oligonucleotídica que contiene secuencias nucleotídicas complementarias a los lados 5' y 3' del segmento de ADN diana, que están separados por una parte adicional. La parte adicional comprende una parte de identificador único, y/o una parte de identificador de paciente, y/o una o más secuencias de unión a cebador (Figura 49, etapa B). La segunda sonda oligonucleotídica de las sondas oligonucleotídicas dúplex (línea gruesa de color negro con bucle) contiene una secuencia que es complementaria a la parte adicional de la primera sonda oligonucleotídica (Figura 49, etapa B). La región en bucle de la segunda sonda oligonucleotídica representa una región no complementaria. Como se muestra en la Figura 49, etapa C, la hibridación de las sondas dúplex con los segmentos de ADN genómico escindidos crea dos uniones competentes para ligamiento, es decir, entre el extremo 3' del segmento de ADN y el extremo 5' de la segunda sonda oligonucleotídica, y entre el extremo 3' de la segunda sonda oligonucleotídica y el extremo 5' del segmento genómico escindido. La ligasa (círculos rellenos) sella covalentemente las uniones de ligamiento para crear productos de ligamiento circulares que contienen segmentos de ADN genómico metilados (Figura 49, etapa C). Como se muestra en la Figura 49, etapa D, la digestión con exonucleasa retira todos los productos sin ligar o mellados dejando solo los productos de ligamiento circulares monocatenarios deseados que son adecuados para secuenciación circular usando cualquiera de los métodos que se describen en el presente documento.

En la realización representada en la Figura 50 la primera sonda oligonucleotídica de la sonda dúplex contiene secuencias complementarias a los lados 5' y 3' del segmento de ADN diana que están separadas por la parte nucleotídica adicional. Además, la primera sonda oligonucleotídica también tiene un grupo de captura en el extremo 5' ("Z") opcional (Figura 50, etapa B). Después del ligamiento en las dos uniones de ligamiento entre el segmento de ADN diana y la segunda sonda oligonucleotídica para formar un producto de ligamiento metilado circularizado (Figura 50, etapa C), una polimerasa (diamantes rellenos) que tiene actividad de desplazamiento de hebra extiende la primera sonda oligonucleotídica usando el ADN circularizado que contiene producto de ligamiento como molde (Figura 50, etapa D). La amplificación por círculo rodante genera un producto de extensión primario que contiene secuencias lineales en tándem que son complementarias al producto de ligamiento circularizado (Figuras 50, etapa D). El producto de extensión primario es adecuado para la secuenciación usando los métodos que se describen en el presente documento. El grupo Z opcional en el extremo 5' se puede capturar sobre un soporte sólido antes o después de la amplificación por círculo rodante. Una vez capturado, el producto de ligamiento circular unido a cebador o la extensión del mismo se pueden liberar del soporte sólido mediante escisión en el enlace escindible, ya sea antes o después de la amplificación por círculo rodante.

La Figura 51 muestra un proceso para descubrir sitios HinPII contiguos sin metilar (GCGC) en regiones conocidas de ADN genómico. El ADN genómico, ya sea aislado de células completas, o como ADNcf en el plasma, contiene extremos a través de procesos enzimáticos naturales o corte. Estos deben ser bloqueados de las etapas posteriores añadiendo conectores cortos a los extremos 3' y 5' de los extremos del ADN (por ejemplo, añadiendo conectores mediante ligamiento). Los conectores del extremo 5' contienen un grupo de bloqueo (líneas gruesas de color negro) como se muestra en la Figura 51, etapa A. Escinden el ADN con conector añadido con HinPII (GCGC) (triángulos rellenos) (Figura 51, etapa A). Solo los sitios HinPII contiguos (GCGG) sin metilar en el ADN genómico original generan fragmentos no bloqueados cuando se escinden con HinPII. Como se muestra en la Figura 51, etapa B, los conectores largos (líneas dobles parcialmente grises) que contienen una secuencia de identificador único y/o una secuencia de identificador de paciente se añaden a los fragmentos de ADN escindidos con HinPII. Los conectores largos contienen un grupo de bloqueo en el extremo 3' o una cadena principal que contiene tiofosfato (****) para inhibir la digestión posterior con exonucleasa 3' (triángulos rellenos). Solo los fragmentos con conector añadido a ambos lados permanecerán bicatenarios. Como se muestra en la Figura 51, etapa C, el extremo libre de los conectores se vuelve competente para ligamiento, ya sea (i) fosforilando el extremo 5', (ii) retirando el grupo de bloqueo en el extremo 3', (iii) usando la actividad de nucleasa 5' para escindir la aleta o base coincidente solapante en el extremo 5' generando fosfato 5' competente para ligamiento, o (iv) cualquier combinación de (i), (ii), (iii). Las condiciones de ligamiento (círculos rellenos) se diseñan para favorecer la oligomerización. Como se muestra en la Figura 51, etapa D, los productos ligados están formados por secuencias HinPII contiguas originalmente sin metilar en ADN genómico acopladas a una secuencia de identificador único y/o secuencia de identificador de paciente. El producto final es adecuado para la secuenciación posterior.

La Figura 52 muestra un proceso para descubrir sitios AciI contiguos metilados (GCGG) en regiones conocidas en todo el genoma. El ADN genómico se escinde con AciI (triángulos rellenos); m representa sitios metilados. Como se muestra en la Figura 52, etapa A, se añaden conectores cortos con un grupo de bloqueo en el extremo 5' (líneas gruesas de color negro), por ejemplo, mediante ligamiento, al ADN digerido con AciI. El ADN con conector añadido se escinde con HaeIII (GGCC). Solo los sitios HaeIII contiguos (GGCC) con sitios AciI metilados en el ADN genómico original generan fragmentos no bloqueados cuando se escinden con HaeIII. En la Figura 52, etapa B, los conectores largos (líneas dobles parcialmente grises) que contienen una secuencia de identificador único y/o una secuencia de identificador de paciente se añaden a los fragmentos de ADN escindidos con HaeIII. Los conectores largos contienen un grupo de bloqueo en el extremo 3' o una cadena principal que contiene tiofosfato (****) para inhibir la digestión posterior con exonucleasa 3' (triángulos rellenos). Solo los fragmentos con conector añadido a ambos lados permanecerán bicatenarios. Como se muestra en la Figura 52, etapa C, el extremo libre de los conectores se vuelve competente para ligamiento, ya sea (i) fosforilando el extremo 5', (ii) retirando el grupo de bloqueo en el extremo 3', (iii) usando la actividad de nucleasa 5' para escindir la aleta o base coincidente solapante en el extremo 5' generando fosfato 5' competente para ligamiento, o (iv) cualquier combinación de (i), (ii), (iii). Las condiciones de ligamiento (círculos rellenos) se diseñan para favorecer la oligomerización. Como se muestra en la Figura 52, etapa D, los productos ligados están formados por secuencias HaeIII contiguos metiladas originalmente en sitios AciI en ADN genómico acopladas a una secuencia de identificador único y/o secuencia de identificador de paciente. El producto final es adecuado para la secuenciación posterior.

La Figura 53 y la Figura 54 muestran un proceso para producir construcciones de ácido nucleico monocatenario quiméricas circulares adecuadas para detectar sitios HinPII contiguos sin metilar en regiones genómicas de ADNcf o ADN genómico total cortado. El ADN genómico se escinde con HinPII (GCGC) para generar extremos 3' y 5' competentes para ligamiento como se muestra en las Figuras 53, etapa A y 54, etapa A. El tratamiento con bisulfito del ADN digerido con HinP1I, convierte las C sin metilar en U. En la realización de la Figura 53, las sondas oligonucleotídicas que contienen secuencias en los extremos 5' y 3' complementarias a los lados 5' y 3' del segmento de ADN diana se hibridan con los segmentos de ADN escindidos (Figura 53, etapa B). Los oligonucleótidos contienen secuencia de identificador único, secuencia de identificador de paciente opcional, y grupo de bloqueo opcional en un extremo. La polimerasa (diamantes rellenos) que carece de actividad 5 '^3 ' extiende el extremo 3' del segmento de ADN diana, para dejarlo a nivel del fosfato competente para ligamiento en el extremo 5' de la diana, Figura 53, etapa C. La polimerasa también extiende la sonda oligonucleotídica en la diana, pero no escinde el grupo de bloqueo en el extremo 5'. En la Figura 53, etapa D, la ligasa (círculos rellenos) sella covalente en donde los extremos del segmento de ADN diana extendido para crear productos de ligamiento circulares. El grupo de bloqueo evita la circularización de la sonda oligonucleotídica. Como se muestra en la Figura 53, etapa E, la digestión con exonucleasa retira todos los productos sin ligar o mellados dejando solo el ADN circular monocatenario deseado que comprende ADN diana original convertido con bisulfito con una secuencia de identificador único. El producto final es adecuado para amplificación por círculo rodante y secuenciación circular.

En la realización de la Figura 54 las sondas oligonucleotídicas contienen secuencias complementarias a los lados 5' y 3' del segmento de ADN diana que están separadas por la parte nucleotídica adicional. Además, las sondas oligonucleotídicas también tienen un grupo de bloqueo (3'-Blk) en el extremo 3', uno o más enlaces escindibles, en donde el enlace escindible se representa como "r", y un grupo de captura en el extremo 5' ("Z") opcional (Figura 54, etapa B). Después del ligamiento del extremo 3' extendido y el extremo 5' del segmento de ADN diana para formar un producto de ligamiento circularizado (Figura 54, etapa C), el grupo de bloqueo en el extremo 3' en la sonda oligonucleotídica se retira (por ejemplo, escisión con RNasa H del enlace ribonucleotídico) (Figura 54, etapa D), y una polimerasa (diamantes rellenos) que carece de actividad 5 '^3 ' extiende la sonda oligonucleotídica usando el producto de ligamiento de ADN circularizado como molde (Figura 54, etapa E). La amplificación por círculo rodante genera un producto de extensión primario que contiene secuencias lineales en tándem que son complementarias al producto de ligamiento circularizado (Figuras 54, etapa E). El producto de extensión primario es adecuado para la secuenciación usando los métodos que se describen en el presente documento. El grupo Z opcional en el extremo 5' se puede capturar sobre un soporte sólido antes o después de la amplificación por círculo rodante. Una vez capturado, el producto de ligamiento circular unido a cebador o la extensión del mismo se pueden liberar del soporte sólido mediante escisión en el enlace escindible, ya sea antes o después de la amplificación por círculo rodante.

Las Figuras 55 y 56 muestran un proceso para producir construcciones de ácido nucleico monocatenario quiméricas circulares adecuadas para detectar sitios HinPII contiguos sin metilar en regiones genómicas de ADNcf o ADN genómico total cortado. Como se muestra en las Figuras 55, etapa A y 56, etapa A, el ADN genómico se escinde con HinP1I (GCGC) (triángulos rellenos) para generar extremos 3' y 5' competentes para ligamiento. El tratamiento con bisulfito del ADN digerido con HinP11, convierte las C sin metilar en U (Figuras 55, etapa A y 56, etapa A). Como se muestra en las Figuras 55, etapa B y 56, etapa B, las sondas oligonucleotídicas dúplex se hibridan con los segmentos de ADN diana escindidos. En la realización representada en la Figura 55, las sondas dúplex comprenden una primera hebra de la sonda oligonucleotídica que contiene secuencias nucleotídicas complementarias a los lados 5' y 3' del segmento de ADN diana, que están separados por una parte adicional. La parte adicional comprende una parte de identificador único, y/o una parte de identificador de paciente, y/o una o más secuencias de unión a cebador (Figura 55, etapa B). La segunda sonda oligonucleotídica de las sondas oligonucleotídicas dúplex (línea gruesa de color negro con bucle) contiene una secuencia que es complementaria a la parte adicional de la primera sonda oligonucleotídica (Figura 55, etapa B). La región en bucle de la segunda sonda oligonucleotídica representa una región no complementaria. Como se muestra en la Figura 55, etapa C, la hibridación de las sondas dúplex con el ADN genómico digerido con HinPII y tratado con bisulfito crea dos uniones competentes para ligamiento, es decir, entre el extremo 3' del segmento de ADN y el extremo 5' de la segunda sonda oligonucleotídica, y entre el extremo 3' de la segunda sonda oligonucleotídica y el extremo 5' del segmento de ADN. La ligasa (círculos rellenos) sella covalentemente las uniones de ligamiento para crear productos de ligamiento circulares que contienen los segmentos de ADN genómico tratados con bisulfito (Figura 55, etapa C). Como se muestra en la Figura 55, etapa D, la digestión con exonucleasa retira todos los productos sin ligar o mellados dejando solo los productos de ligamiento circulares monocatenarios deseados que son adecuados para secuenciación circular usando cualquiera de los métodos que se describen en el presente documento.

En la realización representada en la Figura 56, la primera sonda oligonucleotídica de la sonda dúplex contiene secuencias complementarias a los lados 5' y 3' del segmento de ADN diana que están separadas por la parte nucleotídica adicional. Además, la primera sonda oligonucleotídica también tiene un grupo de captura en el extremo 5' ("Z") opcional (Figura 56, etapa B). Después del ligamiento en las dos uniones de ligamiento entre el segmento de ADN diana y la segunda sonda oligonucleotídica para formar un producto de ligamiento circularizado (Figura 56, etapa C), una polimerasa (diamantes rellenos) que tiene actividad de desplazamiento de hebra extiende la primera sonda oligonucleotídica usando el ADN circularizado que contiene producto de ligamiento como molde (Figura 56, etapa D). La amplificación por círculo rodante genera un producto de extensión primario que contiene secuencias lineales en tándem que son complementarias al producto de ligamiento circularizado (Figuras 56, etapa D). El producto de extensión primario es adecuado para la secuenciación usando los métodos que se describen en el presente documento. El grupo Z opcional en el extremo 5' se puede capturar sobre un soporte sólido antes o después de la amplificación por círculo rodante. Una vez capturado, el producto de ligamiento circular unido a cebador o la extensión del mismo se pueden liberar del soporte sólido mediante escisión en el enlace escindible, ya sea antes o después de la amplificación por círculo rodante.

La Figura 57 muestra un proceso para descubrir sitios HinP1I contiguos sin metilar (GCGC) en regiones genómicas de ADNcf o ADN genómico total cortado. El ADN genómico, ya sea aislado de células completas, o como ADNcf en el plasma, contiene extremos a través de procesos enzimáticos naturales o corte. Estos deben ser bloqueados de las etapas posteriores añadiendo conectores cortos a los extremos 3' y 5' de los extremos del ADN (por ejemplo, añadiendo conectores mediante ligamiento). Los conectores del extremo 5' contienen un grupo de bloqueo (líneas gruesas de color negro) como se muestra en la Figura 57, etapa A. Escinden el ADN con conector añadido con HinPII (GCGC) (triángulos rellenos) (Figura 57, etapa A). Solo los sitios HinP1I contiguos (GCGG) sin metilar en el ADN genómico original generan fragmentos no bloqueados cuando se escinden con HinP1I. Como se muestra en la Figura 57, etapa B, los conectores largos (líneas dobles parcialmente grises) que contienen una secuencia de identificador único y/o una secuencia de identificador de paciente se añaden a los fragmentos de ADN escindidos con HinP1I. Los conectores largos contienen un grupo de bloqueo en el extremo 3' o una cadena principal que contiene tiofosfato (****) para inhibir la digestión posterior con exonucleasa 3' (triángulos rellenos). Solo los fragmentos con conector añadido a ambos lados permanecerán bicatenarios. Como se muestra en la Figura 57, etapa C, el extremo libre de los conectores se vuelve competente para ligamiento ya sea (i) fosforilando el extremo 5', (ii) retirando el grupo de bloqueo en el extremo 3', (iii) usando actividad de nucleasa 5' para escindir la aleta o base coincidente solapante en el extremo 5' generando fosfato 5' competente para ligamiento, o (iv) cualquier combinación de (i), (ii), (iii). Las condiciones de ligamiento (círculos rellenos) se diseñan para favorecer la oligomerización. Como se muestra en la Figura 57, etapa D, el tratamiento con bisulfito de los productos de ligamiento convierte las C sin metilar en U. Los productos ligados comprenden ADN convertido con bisulfito, dentro de secuencias HinPII contiguas sin metilar originalmente en el ADN diana acoplado a una secuencia de identificador único y/o secuencia de identificador de paciente. El producto final es adecuado para etapas adicionales y secuenciación posterior.

La Figura 58 y la Figura 59 muestran un proceso para producir construcciones de ácido nucleico monocatenario quiméricas circulares adecuadas para detectar sitios "HphI" contiguos sin metilar en regiones genómicas de ADNcf o ADN genómico total cortado. Como se muestra en las Figuras 58, etapa A y 59, etapa A, se añaden conectores cortos (por ejemplo, mediante ligamiento) a fragmentos de ADNcf o ADN genómico cortado. El ADN con conector añadido se trata con bisulfito para convertir las C sin metilar en U. Se realiza una PCR limitada y los productos de PCR resultantes se escinden con Hphl (solo GGCGA sin metilar ^ GGTGA) para generar extremos competentes para ligamiento (Figuras 58, etapa A y 59, etapa A). En la realización de la Figura 58, las sondas oligonucleotídicas que contienen secuencias en los extremos 5' y 3' complementarias a los lados 5' y 3' de los segmentos de PCR diana digeridos se hibridan con los segmentos de ADN escindidos (Figura 58, etapa B). Las sondas oligonucleotídicas también contienen una parte nucleotídica adicional que contiene una o más de una secuencia de identificador único, una secuencia de identificador de paciente, y/o uno o más sitios de unión a cebador. Las sondas oligonucleotídicas también pueden tener un grupo de bloqueo en un extremo (por ejemplo, un grupo de bloqueo en el extremo 5' como se muestra en la Figura 58, etapa B). La polimerasa (diamantes rellenos) que carece de actividad 5 '^3 ' extiende el extremo 3' del segmento de ADN diana hibridado, copiando la parte adicional de la sonda y formando una unión para ligamiento con el extremo 5' del segmento de ADN diana hibridado (Figura 58, etapa C). La polimerasa también extiende la sonda oligonucleotídica usando el segmento de ADN diana como molde, pero no escinde el grupo de bloqueo en su extremo 5'. En la Figura 58, etapa D, la ligasa (círculo relleno) sella covalentemente la unión entre el extremo 3' extendido y el extremo 5' del segmento de ADN para crear productos de ligamiento circulares que contienen los segmentos de ADN digeridos con HphI generados por PCR. El grupo de bloqueo en el extremo 5' en la sonda oligonucleotídica evita la circularización de la sonda oligonucleotídica. Alternativamente, se introduce una mella en un enlace escindible contenido en la parte adicional, por ejemplo, la parte adicional contiene un nucleótido uracilo que se escinde usando UDG. Como se muestra en la Figura 58, etapa E, la digestión con exonucleasa de todos los productos sin ligar o mellados deja solo el ADN circular monocatenario que comprende el segmento de ADN digerido con HphI generado por PCR acoplado a una secuencia nucleotídica de identificación adicional, por ejemplo, secuencia de identificador único. El producto final es adecuado para amplificación por círculo rodante y secuenciación circular.

En la realización de la Figura 59 las sondas oligonucleotídicas también contienen secuencias complementarias a los lados 5' y 3' de los segmentos de PCR diana digeridos que están separadas por la parte nucleotídica adicional. Además, las sondas oligonucleotídicas también tienen un grupo de bloqueo (3'-Blk) en su extremo 3', uno o más enlaces escindibles, en donde el enlace escindible se representa como "r", y un grupo de captura en el extremo 5' ("Z") opcional (Figura 59, etapa B). Después del ligamiento del extremo 3' extendido y el extremo 5' del segmento de PCR diana para formar un producto de ligamiento circularizado (Figura 59, etapa C), el grupo de bloqueo en el extremo 3' en la sonda oligonucleotídica se retira (por ejemplo, escisión con RNasa H del enlace ribonucleotídico) (Figura 59, etapa D), y una polimerasa (diamantes rellenos) que carece de actividad 5 '^3 ' extiende la sonda oligonucleotídica usando el producto de ligamiento de ADN circularizado como molde (Figura 59, etapa E). La amplificación por círculo rodante genera un producto de extensión primario que contiene secuencias lineales en tándem que son complementarias al producto de ligamiento circularizado (Figuras 58, etapa E). El producto de extensión primario es adecuado para la secuenciación usando los métodos que se describen en el presente documento. El grupo Z opcional en el extremo 5' se puede capturar sobre un soporte sólido antes o después de la amplificación por círculo rodante. Una vez capturado, el producto de ligamiento circular unido a cebador o la extensión del mismo se pueden liberar del soporte sólido mediante escisión en el enlace escindible, ya sea antes o después de la amplificación por círculo rodante.

Las Figuras 60 y 61 muestran un proceso para producir construcciones de ácido nucleico monocatenario quiméricas circulares adecuadas para detectar sitios "HphI" contiguos sin metilar en regiones genómicas de ADNcf o ADN genómico total cortado. Como se muestra en las Figuras 60, etapa A y 61, etapa A, se añaden conectores cortos (por ejemplo, mediante ligamiento) a fragmentos de ADNcf o ADN genómico cortado. El ADN con conector añadido se trata con bisulfito para convertir las C sin metilar en U. Se realiza una PCR limitada y los productos de PCR resultantes se escinden con HphI (solo GGCGA sin metilar ^ GGTGA) para generar extremos competentes para ligamiento (Figuras 60, etapa A y 61, etapa A). Como se muestra en las Figuras 60, etapa B y 61, etapa B, las sondas oligonucleotídicas dúplex se hibridan con los segmentos de ADN diana escindidos. En la realización representada en la Figura 60, las sondas dúplex comprenden una primera hebra de la sonda oligonucleotídica que contiene secuencias nucleotídicas complementarias a los lados 5' y 3' de los segmentos de PCR diana. Estas partes específicas de diana de la primera sonda oligonucleotídica están separadas por una parte adicional que comprende una parte de identificador único, y/o una parte de identificador de paciente, y/o una o más secuencias de unión a cebador (Figura 60, etapa B). La segunda sonda oligonucleotídica de las sondas oligonucleotídicas dúplex (línea gruesa de color negro con bucle) contiene una secuencia que es complementaria a la parte adicional de la primera sonda oligonucleotídica (Figura 60, etapa B). La región en bucle de la segunda sonda oligonucleotídica representa una región no complementaria. Como se muestra en la Figura 60, etapa C, la hibridación de las sondas dúplex a los productos de PCR digeridos con HphI crea dos uniones competentes para ligamiento, es decir, entre el extremo 3' del segmento de ADN y el extremo 5' de la segunda sonda oligonucleotídica, y entre el extremo 3' de la segunda sonda oligonucleotídica y el extremo 5' del segmento de ADN. La ligasa (círculos rellenos) sella covalentemente las uniones de ligamiento para crear productos de ligamiento circulares que contienen los segmentos digeridos con HphI (Figura 60, etapa C). Como se muestra en la Figura 60, etapa D, la digestión con exonucleasa retira todos los productos sin ligar o mellados dejando solo los productos de ligamiento circulares monocatenarios deseados que son adecuados para la secuenciación circular usando cualquiera de los métodos que se describen en el presente documento.

En la realización representada en la Figura 61 la primera sonda oligonucleotídica de la sonda dúplex contiene secuencias complementarias a los lados 5' y 3' del segmento de ADN diana que están separadas por la parte nucleotídica adicional. Además, la primera sonda oligonucleotídica también tiene un grupo de captura en el extremo 5' ("Z") opcional (Figura 61, etapa B). Después del ligamiento en las dos uniones de ligamiento entre el segmento de PCR digerido con HphI y la segunda sonda oligonucleotídica para formar un producto de ligamiento circularizado (Figura 61, etapa C), una polimerasa (diamantes rellenos) que tiene actividad de desplazamiento de hebra extiende la primera sonda oligonucleotídica usando el producto de ligamiento circularizado como molde (Figura 61, etapa D). La amplificación por círculo rodante genera un producto de extensión primario que contiene secuencias lineales en tándem que son complementarias al producto de ligamiento circularizado (Figuras 61, etapa D). El producto de extensión primario es adecuado para la secuenciación usando los métodos que se describen en el presente documento. El grupo Z en el extremo 5' se puede capturar sobre un soporte sólido antes o después de la amplificación por círculo rodante. Una vez capturado, el producto de ligamiento circular unido a cebador o la extensión del mismo se pueden liberar del soporte sólido mediante escisión en el enlace escindible, ya sea antes o después de la amplificación por círculo rodante.

La Figura 62 muestra un proceso para descubrir sitios HphI contiguos sin metilar en regiones genómicas de ADNcf o ADN genómico total cortado. El ADN genómico, ya sea aislado de células completas, o como ADNcf en el plasma, contiene extremos a través de procesos enzimáticos naturales o corte. Estos deben ser bloqueados de las etapas posteriores añadiendo conectores cortos a los extremos 3' y 5' de los extremos del ADN (por ejemplo, añadiendo conectores mediante ligamiento). Los conectores del extremo 5' contienen un grupo de bloqueo (líneas gruesas de color negro) como se muestra en la Figura 62, etapa A. El ADN con conector añadido se trata con bisulfito para convertir las C sin metilar en U. Como se muestra en la Figura 62, etapa B, la amplificación por PCR limitada con cebadores bloqueados en el extremo 5' genera productos bicatenarios sin metilar. Solo los sitios HphI contiguos (GGCGA sin metilar ^ GGTGA) que no estaban metilados en la diana original generan fragmentos no bloqueados cuando se escinden con HphI (triángulos rellenos). Como se muestra en la Figura 62, etapa C, se añaden conectores (líneas dobles rellenas de color gris) que contienen una secuencia de identificador único y/o una secuencia de identificador de a los fragmentos de ADN escindidos con HphI. Los conectores contienen un grupo de bloqueo en el extremo 3' o una cadena principal que contiene tiofosfato (****) para inhibir la digestión posterior con exonucleasa 3' (triángulos rellenos). Solo los fragmentos con conector añadido a ambos lados permanecerán bicatenarios. Como se muestra en la Figura 62, etapa D, el extremo libre de los conectores se vuelve competente para ligamiento, ya sea (i) fosforilando el extremo 5', (ii) retirando el grupo de bloqueo en el extremo 3', (iii) usando la actividad de nucleasa 5' para escindir la aleta o base coincidente solapante en el extremo 5' generando fosfato 5' competente para ligamiento, o (iv) cualquier combinación de (i), (ii), (iii). Las condiciones de ligamiento (círculos rellenos) se diseñan para favorecer la oligomerización. Como se muestra en la Figura 62, etapa E, los productos ligados comprenden un complemento de ADN convertido con bisulfito, dentro de secuencias HphI contiguos sin metilar originalmente en ADN genómico con una secuencia de identificador único y/o secuencia de identificador de paciente opcionales. El producto final es adecuado para etapas adicionales opcionales y secuenciación posterior.

Otro enfoque adecuado para generar las diferentes construcciones de ácido nucleico monocatenario quiméricas circulares de la colección implica proporcionar una muestra que contiene uno o más segmentos de ADN genómico diana que contienen potencialmente una o más diferencias de bases o uno o más restos metilados y añadir secuencias de conectores nucleotídicos a los extremos 3' y 5' de los segmentos de ADN genómico diana. Los conectores nucleotídicos añadidos comprenden opcionalmente (i) la secuencia de identificador de paciente, (ii) la primera parte específica de cebador de soporte sólido, (iii) la segunda parte específica de cebador de soporte sólido, y/o (iv) la secuencia de identificador único. Se proporcionan una o más primeras sondas oligonucleotídicas en donde cada primera sonda oligonucleotídica comprende (a) una parte complementaria a una parte del conector en el extremo 3' del segmento de ADN genómico diana con conector añadido, (b) una parte complementaria a la parte del conector en el extremo 5' del segmento de ADN genómico diana con conector añadido, y (c) opcionalmente una parte adicional. La parte adicional comprende opcionalmente (i) la secuencia de identificador de paciente, (ii) la primera parte específica de cebador de soporte sólido, (iii) la segunda parte específica de cebador de soporte sólido y/o (iv) la secuencia de identificador único. La muestra y la una o más primeras sondas oligonucleotídicas se ponen en contacto en condiciones eficaces para que las partes en los extremos 3' y 5' de las primeras sondas oligonucleotídicas se hibriden de una forma específica según la base con conectores complementarios de los segmentos de ADN genómico diana con conector añadido, si estuvieran presentes en la muestra. Se generan una o más uniones competentes para ligamiento adecuadas para acoplar los extremos 3' y 5' del segmento de ADN genómico diana con conector añadido hibridado con la primera sonda oligonucleotídica. El ligamiento del segmento de ADN genómico diana con conector añadido en la una o más uniones de ligamiento forma diferentes construcciones de ácido nucleico monocatenario quimérica circular de la colección.

La Figura 63 muestra procesos relacionados a modo de ejemplo para producir construcciones diana de ácido nucleico monocatenario quiméricas circulares adecuadas para secuenciación como se ha descrito anteriormente. En estas realizaciones, los segmentos genómicos originales comprenden segmentos de ADNcf (~160 pb) o segmentos de ADN genómico cortado (~160 pb) que contienen, por ejemplo, mutaciones específicas de tumor, SNP, o secuencias repetitivas polimórficas. El proceso comienza con el ligamiento de conectores cortos en los extremos 3' y 5' de los segmentos de ADN (barras gruesas de color negro, Figuras 63, etapa A). Los conectores añadidos del proceso representado en la Figura 63, panel a la derecha contienen un grupo fosfato 5' competente para ligamiento mientras que los conectores añadidos del proceso representado en la Figura 63, panel a la izquierda no contienen un grupo fosfato 5' competente para ligamiento. Las sondas oligonucleotídicas (línea gruesa de color negro) que contienen secuencias nucleotídicas complementarias a los conectores en los extremos 5' y 3' del segmento de ADN diana y un grupo de bloqueo en el extremo 5' se hibridan con sus respectivos segmentos de ADN diana (Figura 63, etapa A). Las partes específicas de conector de la sonda oligonucleotídica están separadas por una parte adicional. Esta parte adicional comprende una parte de identificador único opcional, y/o una parte de identificador de paciente, y/o una o más secuencias de unión a cebador. La polimerasa (diamante relleno) extiende el extremo del conector 3' del segmento de ADN diana hibridado para formar una unión de ligamiento con el extremo del conector 5' del segmento de ADN diana (Figura 63, etapa B). En la realización que se muestra en la Figura 63, etapa C, una polimerasa que tiene actividad de nucleasa 5' escinde una base coincidente solapante en el extremo 5' en el conector en el extremo 5' después de la extensión para generar un fosfato 5' competente para ligamiento. En la realización representada en la Figura 63, etapa C, panel a la derecha una polimerasa que carece de actividad de nucleasa 5 '^3 ' se puede usar porque el conector en el extremo 5' del segmento de ADN diana contiene un extremo 5' competente para ligamiento. La polimerasa también extiende el extremo 3' de la sonda oligonucleotídica, usando el segmento de ADN diana circularizado hibridado como molde hasta que alcanza el grupo de bloqueo en el extremo 5' de la sonda. Como se muestra en la Figura 63, etapa D, la ligasa (círculo relleno) sella covalentemente el extremo 3' extendido y el extremo 5' de los segmentos de ADN para crear productos de ligamiento circulares. El grupo de bloqueo en el extremo 5' en la sonda oligonucleotídica evita la circularización de la sonda oligonucleotídica extendida con polimerasa. Como se muestra en la Figura 63, etapa E, la digestión con exonucleasa retira todos los productos sin ligar o mellados dejando solo los productos de ligamiento de ADN circularizados monocatenarios deseados. Estos productos de ligamiento circularizados son adecuados para la captura opcional con secuencias únicas o repetitivas (por ejemplo, repeticiones de cuatro nucleótidos), o para la extensión por círculo rodante con cebadores dirigidos únicos, y secuenciación posterior.

La Figura 64 muestra otro proceso a modo de ejemplo para producir construcciones diana de ácido nucleico monocatenario quiméricas circulares adecuadas para secuenciación como se ha descrito anteriormente. En esta realización, el segmento de ADN genómico diana es un segmento de ADN genómico diana bicatenario que tiene extremos 5' y 3' adecuados para ligamiento o extensión (Figuras 64, etapa B). El segmento de ADN genómico diana se añade con secuencias de conector nucleotídico. De acuerdo con esta realización, los conectores nucleotídicos comprenden primeros y segundos oligonucleótidos conectores, en donde (i) el primer oligonucleótido conector comprende una parte monocatenaria en el extremo 5', uno o más nucleótidos o análogos nucleotídicos escindibles, una secuencia de identificador único, un extremo 3' que es complementario al segundo oligonucleótido conector, y un 3' OH, y (ii) el segundo oligonucleótido conector comprende un extremo 5' OH, una parte 5' que es complementaria al primer oligonucleótido conector, y un extremo bloqueado 3' opcional. El segundo oligonucleótido conector se hibrida con su parte complementaria del primer oligonucleótido conector para formar conectores compuestos adecuados para añadirse al segmento de ADN genómico diana.

Como se muestra en la Figura 64, etapas C-D, el ADN genómico diana bicatenario se mezcla con los conectores compuestos, una ligasa, y una polimerasa en condiciones adecuadas para (i) ligamiento del 3' OH del primer oligonucleótido conector del conector compuesto al extremo 5' de los segmentos de ADN genómico diana bicatenario, (ii) extensión con polimerasa del extremo 3' del segmento de ADN genómico diana bicatenario para crear una copia complementaria del primer oligonucleótido conector del conector compuesto, y (iii) escindir el uno o más nucleótidos o análogos nucleotídicos para formar los segmentos de ADN genómico diana con conector añadido. Las sondas oligonucleotídicas (línea fina de color negro y doble línea) que contienen secuencias nucleotídicas complementarias a las partes monocatenarias en los extremos 5' y 3' de los conectores del segmento de ADN diana se hibridan con sus respectivos segmentos de ADN diana (Figura 64, etapa F). Las sondas oligonucleotídicas contienen la secuencia de identificador de paciente, sitios de unión a cebador, y una cola con emparejamientos erróneos en el extremo 3'. La polimerasa (diamante relleno) extiende el extremo del conector 3' del segmento de ADN diana hibridado para formar una unión de ligamiento con el extremo del conector 5' del segmento de ADN diana (Figura 64, etapa G). Como se muestra en la Figura 64, etapa H, la ligasa (círculo relleno) sella covalentemente los extremos 3' y 5' del segmento de ADN con conector añadido para crear productos de ligamiento circulares. Estos productos de ligamiento circularizados son adecuados para la captura opcional con secuencias únicas o repetitivas (por ejemplo, repeticiones de cuatro nucleótidos), o para la extensión por círculo rodante con cebadores dirigidos únicos, y secuenciación posterior.

La Figura 65 muestra procesos relacionados a modo de ejemplo para producir construcciones diana de ácido nucleico monocatenario quiméricas circulares adecuadas para secuenciación como se ha descrito anteriormente. En estas realizaciones, los segmentos genómicos originales comprenden segmentos de ADNcf (~160 pb) o segmentos de ADN genómico cortado (~160 pb) que contienen, por ejemplo, mutaciones específicas de tumor, SNP, o secuencias repetitivas polimórficas. El proceso comienza con el ligamiento de conectores compuestos que comprenden partes tanto monocatenarias (líneas dobles más finas y de color negro) como bicatenarias (barras gruesas de color negro) en los extremos 3' y 5' de los segmentos de ADN (Figura 65, etapa A). Los conectores añadidos del proceso representado en la Figura 65, etapa B, panel a la derecha contienen un grupo fosfato 5' competente para ligamiento mientras que los conectores añadidos del proceso representado en la Figura 65, etapa B, panel a la izquierda no contienen un grupo fosfato 5' competente para ligamiento. Las sondas oligonucleotídicas (línea fina de color negro y doble línea) que contienen secuencias nucleotídicas complementarias a las partes monocatenarias en los extremos 5' y 3' de los conectores del segmento de ADN diana se hibridan con sus respectivos segmentos de ADN diana. La polimerasa (diamante relleno) extiende el extremo del conector 3' del segmento de ADN diana hibridado para formar una unión de ligamiento con el extremo del conector 5' del segmento de ADN diana (Figura 65, etapa C). En la realización que se muestra en la Figura 65, etapa C, una polimerasa que tiene actividad de nucleasa 5' escinde una base coincidente solapante en el extremo 5' en el conector en el extremo 5' después de la extensión para generar un fosfato 5' competente para ligamiento. Como se muestra en la Figura 65, etapa D, la ligasa (círculo relleno) sella covalentemente los extremos 3' y 5' del segmento de ADN con conector añadido para crear productos de ligamiento circulares. Como se muestra en la Figura 65, etapa E, la digestión con exonucleasa retira todos los productos sin ligar o mellados dejando solo los productos de ligamiento de ADN circularizados monocatenarios deseados. Estos productos de ligamiento circularizados son adecuados para la captura opcional con secuencias únicas o repetitivas (por ejemplo, repeticiones de cuatro nucleótidos), o para la extensión por círculo rodante con cebadores dirigidos únicos, y secuenciación posterior.

El enfoque convencional para añadir conectores se ilustra en la Figura 66 y es bien conocido por los expertos en la materia. En estas realizaciones, los segmentos genómicos originales comprenden segmentos de ADNcf (~160 pb) o segmentos de ADN genómico cortado (~160 pb) que contienen, por ejemplo, mutaciones específicas de tumor, SNP, o secuencias repetitivas polimórficas. Los extremos del ADN fragmentado se reparan usando una polimerasa con actividad de exonucleasa 3 '^5 ' tal como polimerasa T4 o ADN polimerasa I, fragmento grande (Klenow), que extiende los extremos 3' rebajados, o degrada los extremos de protuberancia 3' hasta que se dejan al nivel con el extremo 5' (Figura 66, etapa A). Los extremos 5' se fosforilan con quinasa T4, y una base A adicional añadida al extremo 3' usando ADN polimerasa I, fragmento grande (Klenow), que carece de actividad de nucleasa 3 '^5 ' (Figura 66, etapas B y C). El ligamiento en conectores con protuberancias T en el extremo 3' se realiza usando ligasa T4 (Figura 66, etapa D). En esta figura, las partes de cebador 1 y 3 de los conectores se usan para determinar las secuencias de identificador de paciente y las secuencias de identificador único 1 y 2 opcionales, respectivamente. Las partes de cebador 2 y 3' se usan para secuenciar el ADN diana directo e inverso, respectivamente. Este producto es adecuado para la circularización de la hebra diana original superior o inferior como se ilustra en las Figuras 63 y 65 mencionadas anteriormente.

Aunque el enfoque convencional proporciona la oportunidad de introducir secuencias únicas en las partes monocatenarias de los conectores, estas secuencias no permiten una correspondencia inequívoca de una secuencia de hebra superior con una secuencia de hebra inferior. Para conseguir este tipo de construcción, el enfoque convencional se modifica como se ilustra en la Figura 67. En estas realizaciones, los segmentos genómicos originales comprenden segmentos de ADNcf (~160 pb) o segmentos de ADN genómico cortado (~160 pb) que contienen, por ejemplo, mutaciones específicas de tumor, SNP, o secuencias repetitivas polimórficas. Los extremos del ADN fragmentado se reparan usando una polimerasa con actividad de exonucleasa 3 '^5 ' tal como polimerasa T4 o ADN polimerasa I, fragmento grande (Klenow), que extiende los extremos 3' rebajados, o degrada los extremos de protuberancia 3' hasta que se dejan al nivel con el extremo 5' (Figura 67, etapa A). Los extremos 5' se fosforilan opcionalmente con quinasa T4 (Figura 67, etapa B), y una protuberancia de base A se añade a los extremos 3' usando ADN polimerasa I, fragmento grande (Klenow), que carece de actividad de nucleasa 3'^5'.

En esta realización, la secuencia del conector comprende un primer, segundo y tercer oligonucleótidos. El primer oligonucleótido comprende la primera parte específica de cebador de soporte sólido, una o más primeras secuencias de identificador de paciente, un primer sitio de unión al cebador de secuenciación, y un extremo 3' que es complementario al tercer oligonucleótido. El segundo oligonucleótido que comprende una región complementaria al extremo 5' del tercer oligonucleótido, y el tercer oligonucleótido comprende un extremo 5' que es complementario al segundo oligonucleótido, un segundo sitio de unión al cebador de secuenciación, una parte complementaria al extremo 3' del primer oligonucleótido, una segunda secuencia de identificador de paciente, y la segunda parte específica de cebador de soporte sólido. El tercer oligonucleótido se hibrida con partes complementarias del primer y segundo oligonucleótidos para formar conectores compuestos. Como se muestra en la Figura 67, etapa D, los segmentos de ADN genómico diana bicatenario se mezclan con los conectores compuestos, una ligasa, y una polimerasa en condiciones adecuadas para ligamiento del segundo y tercer oligonucleótidos de los conectores compuestos a los extremos 5' y 3', respectivamente, de los segmentos de ADN genómico diana bicatenario. La polimerasa extiende el extremo 3' del primer oligonucleótido del conector compuesto para crear una unión de ligamiento con el segundo oligonucleótido del conector compuesto en su extremo 5' (Figura 67, etapa E). Si el extremo 5' del segundo oligonucleótido del conector compuesto no está fosforilado, la polimerasa debería tener actividad de nucleasa 5 '^3 ' para liberar un fosfato 5' adecuado para ligamiento. Si el segundo oligonucleótido está fosforilado en el extremo 5', la polimerasa debería carecer de actividad de nucleasa 5'^3', permitiendo la extensión hasta el conector, seguido del sellado de la mella por ligasa. Como se muestra en la Figura 67, etapa E, la ligasa sella covalentemente el primer y segundo oligonucleótidos del conector compuesto en dicha unión de ligamiento para formar ADN genómico diana bicatenario con conector añadido. En esta realización, las partes de cebador 1 y 3 de los conectores se usan para determinar secuencias de identificador de paciente 1 y 2 opcionales, respectivamente (véase la Figura 67, etapa F). Las partes de cebador 2 y 3' de los conectores se usan para secuenciar el ADN diana directo e inverso, así como las secuencias de identificador único 1 y 2, respectivamente. Este producto es adecuado para la circularización de cada una de las hebras diana originales como se ilustra en las Figuras 63 y 65 mencionadas anteriormente. Después de determinar las secuencias de estas hebras, las secuencias de identificador único 1 y 2 permitirán una correspondencia inequívoca de una secuencia de hebra superior con una secuencia de hebra inferior, permitiendo de ese modo la verificación independiente de la mutación de baja abundancia en ambas hebras de la molécula diana original.

La Figura 68 ejemplifica otro enfoque para añadir secuencias de cebador a los extremos del ADN diana, de modo que sea adecuado para producir construcciones diana de ácido nucleico monocatenario quiméricas circulares, y permitir una correspondencia inequívoca de una secuencia de hebra superior con una secuencia de hebra inferior. En estas realizaciones, los segmentos genómicos originales comprenden segmentos de ADNcf (~160 pb) o segmentos de ADN genómico cortado (~160 pb) que contienen, por ejemplo, mutaciones específicas de tumor, SNP, o secuencias repetitivas polimórficas. Los extremos del ADN fragmentado se reparan usando una polimerasa con actividad de exonucleasa 3 '^5 ' tal como polimerasa T4 o ADN polimerasa I, fragmento grande (Klenow), que extiende los extremos 3' rebajados, o degrada los extremos de protuberancia 3' hasta que se dejan al nivel con el extremo 5' (Figura 68, etapa A). Los extremos 5' están fosforilados opcionalmente con quinasa T4 (Figura 68, etapa B). Una transcriptasa inversa tal como transcriptasa inversa del virus de la leucemia murina de Moloney (M-MLV RT, New England Biolabs), o transcriptasa inversa Superscript II o III (Life Technologies) añade tres bases C al extremo 3' de cada diana (Figura 68, etapa C).

En esta realización, las secuencias de conector comprenden (i) un primer oligonucleótido conector que comprende la primera parte específica de cebador de soporte sólido, una o más primeras secuencias de identificador de paciente, un primer sitio de unión al cebador de secuenciación, y bases de riboguanosina en el extremo 3', y (ii) un segundo oligonucleótido conector que comprende un segundo sitio de unión al cebador de secuenciación, una segunda secuencia de identificador de paciente, la segunda parte específica de cebador de soporte sólido, y una parte en el extremo 5' que es complementaria al primer oligonucleótido. Los segmentos de ADN genómico diana bicatenario se mezclan con las secuencias de conector, una transcriptasa inversa, y una ligasa para formar una mezcla de reacción de transcripción inversa-ligamiento. Las bases de riboguanosina del primer oligonucleótido conector se hibridan con la protuberancia de citosina en el extremo 3' del segmento de ADN genómico diana bicatenario (Figura 68, etapa D). La transcripta inversa experimenta un cambio de hebra y el extremo hibridado 3' del segmento de ADN genómico diana bicatenario se extiende para generar una secuencia complementaria a la primera secuencia de identificador de paciente del primer oligonucleótido conector y una unión de ligamiento con el extremo 5' del segundo oligonucleótido conector (Figura 68, etapa D). Los extremos 3' extendidos de los segmentos de ADN genómico diana bicatenario se ligan al extremo 5' del segundo oligonucleótido en la unión de ligamiento. La RNasaH2 escinde las bases de riboguanosina del primer oligonucleótido conector, liberando un 3' OH adecuado para la extensión mediada por polimerasa (Figura 68, etapa E). El extremo 3' del primer oligonucleótido conector se extiende y se liga al extremo 5' del ADN genómico diana bicatenario (Figura 68, etapa F). Si el segundo conector o el ADN diana no están fosforilados en el extremo 5', la polimerasa debería tener actividad de nucleasa 5 '^3 ' para liberar un fosfato 5' adecuado para ligamiento. Si el segundo conector y la diana están fosforilados, como se muestra en la Figura 68, la polimerasa debería carecer de actividad de nucleasa 5'^3', permitiendo la extensión al extremo 5' del segundo cebador o diana respectivamente, seguido del sellado de la mella por ligasa. Como se muestra en la Figura 68, etapa G, las posiciones del cebador 1 y 3 de los conectores se usaron para determinar secuencias de identificador de paciente 1 y 2 opcionales, respectivamente. Las partes de cebador 2 y 3' de los conectores se usan para secuenciar el ADN diana directo e inverso, así como las secuencias de identificador único 1 y 2, respectivamente. Este producto es adecuado para la circularización de cada una de las hebras diana originales como se ilustra en las Figuras 63 y 65 mencionadas anteriormente. Después de determinar las secuencias de estas hebras, las secuencias de identificador único 1 y 2 permitirán una correspondencia inequívoca de una secuencia de hebra superior con una secuencia de hebra inferior, permitiendo de ese modo la verificación independiente de la mutación de baja abundancia en ambas hebras de la molécula diana original.

La Figura 69 ejemplifica otro enfoque para añadir secuencias de cebador a los extremos del ADN diana, de modo que sea adecuado para producir construcciones diana de ácido nucleico monocatenario quiméricas circulares. En esta realización, los segmentos genómicos originales comprenden segmentos de ADNcf (~160 pb) o segmentos de ADN genómico cortado (~160 pb) que contienen, por ejemplo, mutaciones específicas de tumor, SNP, o secuencias repetitivas polimórficas. Los fragmentos se desnaturalizan para hacer que las dianas sean monocatenarias (Figura 69, etapa A). Los extremos 3' se terminan con transferasa terminal usando una mezcla de dATP y ATP, de modo que se añade un promedio de 50-100 bases y hay al menos una incorporación de rATP escindible en las primeras 30 bases (Figura 69, etapa B). De acuerdo con esta realización, se proporcionan uno o más conjuntos de oligonucleótidos, en donde cada conjunto comprende i) un oligonucleótido cebador que comprende la segunda parte específica de cebador de soporte sólido, una o más secuencias de identificador de paciente, sitio de unión a cebador de secuenciación, y una región de repetición mononucleotídica que comprende uno o más nucleótidos escindibles que es complementaria a la región de extensión del segmento de ADN genómico diana, y (ii) un primer oligonucleótido conector que comprende la primera parte específica de cebador de soporte sólido, una o más secuencias de identificador de paciente, un sitio de unión a cebador de secuenciación. El primer oligonucleótido conector tiene dos bases riboguanosina y una base guanosina con ácido nucleico bloqueado en su extremo 3' (rGrG+G). Como se representa en la Figura 69, etapa B, el proceso implica la hibridación del oligonucleótido cebador que contienen sitios de unión a cebador en el extremo 5' (3 y 4) con identificador de paciente e identificador único opcionales (2), una secuencia VN (T,dU)30 en el extremo 3', y enlaces escindibles (dU) a la región de extensión de la transferasa al terminal del ADN genómico diana (Figura 69, etapa B). Una transcriptasa inversa tal como la transcriptasa inversa del virus de la leucemia murina de Moloney (M-MLV RT, New England Biolabs), o la transcriptasa inversa Superscript II o III (Life Technologies) extiende el cebador para hacer una copia de longitud completa de la diana, y añade tres bases C al extremo 3' de la secuencia diana extendida (Figura 68, etapa C). El primer oligonucleótido conector que tiene rGrG+G en el extremo 3' se híbrida con las tres bases C de la secuencia diana extendida como se muestra en la Figura 68, etapa C. La transcripta inversa experimenta un cambio de hebra y copia el primer oligonucleótido conector (Figura 69, etapa D). La RNasaH2 escinde las bases de ADN, liberando el 3' OH de ADN en la cola A, así como hacia frente al rGrG+G del primer oligonucleótido conector (Figura 69, etapa D). La polimerasa con actividad de nucleasa 5 '^3 ' replica las regiones del oligonucleótido cebador, extiende el primer oligonucleótido conector, y libera el fosfato 5' en el ADN diana (Figura 69, etapa F). La ligasa sella la mella del primer oligonucleótido conector para ligar el primer conector a la hebra diana original (Figura 69, etapa G). Posteriormente, se introducen mellas en los enlaces escindibles del oligonucleótido cebador (por ejemplo, escisión con UDG de dU), de modo que la copia de la diana no sufrirá más amplificación, ya que carece de la primera región de unión a cebador. En esta figura, las partes de cebador 1 y 3 se usan para determinar secuencias de identificador de paciente y secuencias de identificador único opcionales 1 y 2, respectivamente (Figura 69, etapa H). Las partes de cebador 2 y 3' se usan para secuenciar el ADN diana directo e inverso, respectivamente. Cuando se usa el cebador en el extremo 3', para el ciclo inicial se usa TTP sin finalizador, de modo que el instrumento no pierda tiempo secuenciando la región T30. Este producto es adecuado para la circularización de la hebra diana original superior o inferior como se ilustra en las Figuras 63 y 65 mencionadas anteriormente.

La Figura 70 muestra otro proceso a modo de ejemplo para producir construcciones diana de ácido nucleico monocatenario quiméricas circulares adecuadas para secuenciación como se ha descrito anteriormente. En estas realizaciones, los segmentos genómicos originales comprenden segmentos de ADNcf (~160 pb) o segmentos de ADN genómico cortado (~160 pb) que contienen, por ejemplo, mutaciones específicas de tumor, SNP, o secuencias repetitivas polimórficas. El proceso comienza con el ligamiento de conectores cortos en los extremos 3' y 5' de los segmentos de ADN (barras gruesas de color negro, Figura 70, etapa A). El extremo 5' de los conectores añadidos contiene opcionalmente un fosfato competente para ligamiento. Las sondas oligonucleotídicas que contienen secuencias complementarias a una parte única o repetitiva (es decir, repetición de AGAT) del segmento de ADN diana, y los lados 5' y 3' de los conectores se hibridan con sus respectivos segmentos de ADN diana como se muestra en las Figuras 70, etapa B. Las sondas oligonucleotídicas también contienen una parte adicional que contiene una o más de una secuencia de identificador único, una secuencia de identificador de paciente, un fosfato 5' competente para ligamiento, y un enlace escindible (dU). La polimerasa (diamantes rellenos) extiende los extremos 3' hibridados del segmento de ADN diana y la sonda oligonucleotídica (Figura 70, etapa C) para crear uniones de ligamiento con el extremo 5' correspondiente del segmento de ADN diana y la sonda, respectivamente. En ausencia de un fosfato 5' competente para ligamiento en el segmento diana o sonda, la actividad de nucleasa 5' de la polimerasa escinde una base coincidente solapante en el extremo 5' para generar un fosfato 5' competente para ligamiento. Como se muestra en la Figura 70, etapa D, la ligasa (círculos rellenos) sella covalentemente los extremos contiguos de la sonda oligonucleotídica y el segmento diana para crear productos de ligamiento interconectados circulares. Posteriormente, se introduce una mella en el enlace escindible de la sonda oligonucleotídica (por ejemplo, escisión con UDG de dU, triángulos rellenos). Como se muestra en la Figura 70, etapa E, la digestión con exonucleasa retira todos los productos sin ligar o mellados dejando solo la construcción circular monocatenaria deseada que comprende un segmento de ADN diana original acoplado a una secuencia de identificador único. El producto final es adecuado para etapas adicionales opcionales y secuenciación posterior.

La Figura 71 muestra otro proceso a modo de ejemplo para producir construcciones diana de ácido nucleico monocatenario quiméricas circulares adecuadas para secuenciación como se ha descrito anteriormente. En estas realizaciones, los segmentos genómicos originales comprenden segmentos de ADNcf (~160 pb) o segmentos de ADN genómico cortado (~160 pb) que contienen, por ejemplo, mutaciones específicas de tumor, SNP, o secuencias únicas. El proceso comienza con el ligamiento de conectores cortos en los extremos 3' y 5' de los segmentos de ADN (barras gruesas de color negro/blanco, Figura 71, etapa A). El extremo 5' de los conectores añadidos contiene opcionalmente un fosfato competente para ligamiento. Las sondas que contienen secuencias complementarias a una secuencia única del segmento de ADN diana, y los lados 5' y 3' de los conectores se hibridan con sus respectivos segmentos de ADN diana como se muestra en la Figura 71, etapa B. Las sondas oligonucleotídicas también contienen una parte adicional que contiene una o más de una secuencia de identificador único, una secuencia de identificador de paciente, un fosfato 5' competente para ligamiento opcional, y un enlace escindible (dU) opcional. En una realización, el extremo 3' de la sonda oligonucleotídica comprende además unas pocas bases adicionales y un grupo de bloqueo, que se libera para formar un 3' OH libre mediante escisión con una nucleasa solo cuando se hibrida con la diana, por ejemplo, una base de ribonucleótido como el grupo de bloqueo y RNasa H2 (estrella) como la nucleasa de escisión (Figura 71, etapa C). La polimerasa (diamantes rellenos) extiende los extremos 3' hibridados del segmento de ADN diana y la sonda oligonucleotídica (Figura 71, etapa C) para crear uniones de ligamiento con el extremo 5' correspondiente del segmento de ADN diana y la sonda, respectivamente. En ausencia de un fosfato 5' competente para ligamiento en el segmento diana o sonda, la actividad de nucleasa 5' de la polimerasa escinde una base coincidente solapante en el extremo 5' para generar un fosfato 5' competente para ligamiento. Como se muestra en la Figura 71, etapa D, la ligasa (círculos rellenos) sella covalentemente los extremos contiguos de la sonda oligonucleotídica y el segmento diana para crear productos de ligamiento interconectados circulares. Posteriormente, se introduce una mella en el enlace escindible de la sonda oligonucleotídica (por ejemplo, escisión con UDG de dU, triángulos rellenos). Como se muestra en la Figura 71, etapa E, la digestión con exonucleasa retira todos los productos sin ligar o mellados dejando solo la construcción circular monocatenaria deseada que comprende un segmento de ADN diana original acoplado a una secuencia de identificador de paciente o de identificador único opcionales. El producto final es adecuado para etapas adicionales opcionales y secuenciación posterior.

La Figura 72 muestra otro proceso a modo de ejemplo para producir construcciones diana de ácido nucleico monocatenario quiméricas circulares adecuadas para secuenciación como se ha descrito anteriormente. En estas realizaciones, los segmentos genómicos originales comprenden segmentos de ADNcf (~160 pb) o segmentos de ADN genómico cortado (~160 pb) que contienen, por ejemplo, mutaciones específicas de tumor, SNP, o secuencias únicas. El proceso comienza con el ligamiento de conectores cortos en los extremos 3' y 5' de los segmentos de ADN (barras gruesas de color negro/blanco, Figura 72, etapa A). El extremo 5' de los conectores añadidos contiene opcionalmente un fosfato competente para ligamiento. Las sondas que contienen secuencias complementarias a una secuencia única del segmento de ADN diana, y los lados 5' y 3' de los conectores se hibridan con sus respectivos segmentos de ADN diana como se muestra en la Figura 71, etapa B. Las sondas oligonucleotídicas también contienen una parte adicional que contiene una o más de una secuencia de identificador único, una secuencia de identificador de paciente, un fosfato 5' competente para ligamiento, y un enlace escindible (dU) opcional. En una realización, el extremo 3' de la sonda oligonucleotídica comprende además unas pocas bases adicionales y un grupo de bloqueo, que se libera para formar un 3' OH libre mediante escisión con una nucleasa solo cuando se hibrida con la diana, por ejemplo, una base de ribonucleótido como el grupo de bloqueo y RNasa H2 (estrella) como la nucleasa de escisión. El extremo 3' OH liberado ahora es adecuado para ligamiento directo al extremo fosforilado 5' cuando la sonda oligonucleotídica se hibrida en la diana (Figura 72, etapa C). La polimerasa (diamantes rellenos) extiende los extremos 3' hibridados del segmento de ADN diana (Figura 72, etapa C) para crear uniones de ligamiento con el extremo 5' correspondiente del segmento de ADN diana. En ausencia de un fosfato 5' competente para ligamiento en el conector del segmento diana, la actividad de nucleasa 5' de la polimerasa escinde una base coincidente solapante en el extremo 5' para generar un fosfato 5' competente para ligamiento. Como se muestra en la Figura 72, etapa D, la ligasa (círculos rellenos) sella covalentemente los extremos contiguos del segmento diana para crear productos de ligamiento interconectados circulares. Posteriormente, se introduce una mella en el enlace escindible de la sonda oligonucleotídica (por ejemplo, escisión con UDG de dU, triángulos rellenos). Como se muestra en la Figura 72, etapa E, la digestión con exonucleasa retira todos los productos sin ligar o mellados dejando solo la construcción circular monocatenaria deseada que comprende un segmento de ADN diana original acoplado a una secuencia de identificador de paciente o de identificador único opcionales. El producto final es adecuado para etapas adicionales opcionales y secuenciación posterior.

La Figura 73 muestra un proceso a modo de ejemplo para producir construcciones diana de ácido nucleico monocatenario quiméricas circulares con un oligonucleótido específico de diana hibridado que es adecuado para cebar la amplificación por círculo rodante y la secuenciación como se ha descrito anteriormente. En estas realizaciones, los segmentos genómicos originales comprenden segmentos de ADNcf (~160 pb) o segmentos de ADN genómico cortado (~160 pb) que contienen, por ejemplo, mutaciones específicas de tumor, SNP, o secuencias únicas. El proceso comienza con el ligamiento de conectores compuestos que comprenden partes tanto monocatenarias (líneas dobles más finas y de color negro) como bicatenarias (barras gruesas de color negro) en los extremos 3' y 5' de los segmentos de ADN (Figura 73, etapa A). Los conectores añadidos del proceso representado en la Figura 73 panel a la izquierda contienen un grupo fosfato 5' competente para ligamiento mientras que los conectores añadidos del proceso representado en la Figura 73 panel a la derecha no contienen un grupo fosfato 5' competente para ligamiento. Las sondas oligonucleotídicas que contienen secuencias nucleotídicas complementarias a una secuencia única del segmento de ADN diana (líneas de color negro más gruesas), y a las partes monocatenarias en los extremos 5' y 3' de los conectores (línea fina de color negro y doble línea) añadidos a los segmentos de ADN diana se hibridan con sus respectivos segmentos de ADN diana como se muestra en la Figura 73, etapa B. Las sondas oligonucleotídicas también contienen una secuencia de identificador único opcional, secuencia de identificador de paciente opcional, fosfato opcional en el extremo 5', y uno o más enlaces escindibles (dU). En una realización, el extremo 3' de la sonda oligonucleotídica comprende además unas pocas bases adicionales y un grupo de bloqueo, que se libera para formar un 3' OH libre mediante escisión con una nucleasa solo cuando se hibrida con la diana, por ejemplo, una base de ribonucleótido como el grupo de bloqueo y RNasa H2 (estrella) como la nucleasa de escisión. La polimerasa (diamantes rellenos) extiende los extremos 3' hibridados del segmento de ADN diana y la sonda oligonucleotídica (Figura 73, etapa C) para crear uniones de ligamiento con el extremo 5' correspondiente del segmento de ADN diana y la sonda, respectivamente. En ausencia de un fosfato 5' competente para ligamiento en el segmento diana o sonda, la actividad de nucleasa 5' de la polimerasa escinde una base coincidente solapante en el extremo 5' para generar un fosfato 5' competente para ligamiento. Como se muestra en la Figura 73, etapa D, la ligasa (círculos rellenos) sella covalentemente los extremos contiguos de la sonda oligonucleotídica y el segmento diana para crear productos de ligamiento interconectados circulares. Posteriormente, se introducen una o más mellas en los enlaces escindibles de la sonda oligonucleotídica (por ejemplo, escisión con UDG de dU, triángulos rellenos). Como se muestra en la Figura 73, etapa E, los fragmentos oligonucleotídicos escindidos se eliminan del ADN diana, dejando solo la construcción circular monocatenaria deseada que comprende un segmento de ADN diana original que tiene un cebador hibridado específico de diana. El producto final es adecuado para amplificación por círculo rodante, etapas adicionales opcionales, y secuenciación posterior.

La Figura 74 representa otro proceso a modo de ejemplo para producir construcciones diana de ácido nucleico monocatenario quiméricas circulares con un oligonucleótido específico de diana hibridado que es adecuado para cebar la amplificación por círculo rodante y la secuenciación como se ha descrito anteriormente. Las etapas de esta realización son similares a las de la realización que se muestra en la Figura 73, etapas A-E. Sin embargo, en esta realización las sondas oligonucleotídicas también comprenden un grupo de captura (Z) (es decir, biotina) adecuado para captura de productos sobre un soporte sólido (es decir, con soporte sólido recubierto con estreptavidina). Como se muestra en la Figura 74, etapa E, los fragmentos oligonucleotídicos escindidos se eliminan del ADN diana, dejando solo la construcción circular monocatenaria deseada que comprende un segmento de ADN diana original que tiene un cebador hibridado específico de diana que también contiene un grupo de captura (Z) para un etapa de captura posterior. El producto final es adecuado para amplificación por círculo rodante, etapas adicionales opcionales, y secuenciación posterior.

La Figura 75 muestra otro proceso a modo de ejemplo para producir construcciones diana de ácido nucleico monocatenario quiméricas circulares con un oligonucleótido específico de diana hibridado que es adecuado para cebar la amplificación por círculo rodante y la secuenciación como se ha descrito anteriormente. En estas realizaciones, los segmentos genómicos originales comprenden segmentos de ADNcf (~160 pb) o segmentos de ADN genómico cortado (~160 pb) que contienen, por ejemplo, mutaciones específicas de tumor, SNP, o secuencias únicas. El proceso comienza con el ligamiento de conectores compuestos que comprenden partes tanto monocatenarias (líneas dobles más finas y de color negro) como bicatenarias (barras gruesas de color negro) en los extremos 3' y 5' de los segmentos de ADN (Figura 75, etapa A). Los conectores añadidos del proceso representado en la Figura 75, parte izquierda, contienen un grupo fosfato 5' competente para ligamiento mientras que los conectores añadidos del proceso representado en la Figura 75, parte derecha, no contienen un grupo fosfato 5' competente para ligamiento. Las sondas oligonucleotídicas que contienen secuencias nucleotídicas complementarias a una secuencia única del segmento de ADN diana (líneas de color negro más gruesas), y a las partes monocatenarias en los extremos 5' y 3' de los conectores añadidos (línea fina de color negro y doble línea) del segmento de ADN diana se hibridan con sus respectivos segmentos de ADN diana como se muestra en la Figura 75, etapa B. Las sondas oligonucleotídicas también contienen opcionalmente una secuencia de identificador único, secuencia de identificador de paciente opcional, un fosfato 5', y uno o más enlaces escindibles (dU). En una realización, el extremo 3' de la sonda oligonucleotídica comprende además unas pocas bases adicionales y un grupo de bloqueo, que se libera para formar un 3' OH libre mediante escisión con una nucleasa solo cuando se hibrida con la diana, por ejemplo, una base de ribonucleótido como el grupo de bloqueo y RNasa H2 (estrella) como la nucleasa de escisión. Como los extremos de las sondas oligonucleotídicas son contiguos entre sí después de la escisión con RNasaH2, son adecuados para sellado con una ligasa (Figura 75, etapa C). La polimerasa (diamantes rellenos) extiende los extremos 3' hibridados del segmento de ADN diana (Figura 75, etapa C, derecha) para crear uniones de ligamiento con el extremo 5' correspondiente del segmento de ADN diana. En ausencia de un fosfato 5' competente para ligamiento en el segmento diana, la actividad de nucleasa 5' de la polimerasa escinde una base coincidente solapante en el extremo 5' para generar un fosfato 5' competente para ligamiento. Como se muestra en la Figura 75, etapa D, la ligasa (círculos rellenos) sella covalentemente los extremos contiguos del segmento diana para crear productos de ligamiento interconectados circulares. Posteriormente, se introducen una o más mellas en los enlaces escindibles de la sonda oligonucleotídica (por ejemplo, escisión con UDG de dU, triángulos rellenos). Como se muestra en la Figura 75, etapa E, los fragmentos oligonucleotídicos escindidos se eliminan del ADN diana, dejando solo la construcción circular monocatenaria deseada que comprende un segmento de ADN diana original con un cebador hibridado específico de diana. El producto final es adecuado para amplificación por círculo rodante, etapas adicionales opcionales, y secuenciación posterior.

La Figura 76 es otro proceso a modo de ejemplo para producir construcciones diana de ácido nucleico monocatenario quiméricas circulares con un oligonucleótido específico de diana hibridado adecuado para la amplificación por círculo rodante y la secuenciación como se ha descrito anteriormente. Las etapas de esta realización son similares a las representadas en la Figura 75, etapas A-E. Sin embargo, en esta realización la sonda oligonucleotídica también comprende un grupo de captura (Z) (es decir, biotina) adecuado para captura de productos sobre un soporte sólido (es decir, con soporte sólido recubierto con estreptavidina). Como se muestra en la Figura 76, etapa E, los fragmentos oligonucleotídicos escindidos se eliminan del ADN diana, dejando solo la construcción circular monocatenaria deseada que comprende un segmento de ADN diana original con un cebador hibridado específico de diana que también contiene un grupo de captura (Z) para un etapa de captura posterior. El producto final es adecuado para amplificación por círculo rodante, etapas adicionales opcionales, y secuenciación posterior.

La Figura 77 muestra otro proceso a modo de ejemplo para producir construcciones diana de ácido nucleico monocatenario quiméricas circulares adecuadas para secuenciación como se ha descrito anteriormente. En estas realizaciones, los segmentos genómicos originales comprenden segmentos de ADNcf (~160 pb) o segmentos de ADN genómico cortado (~160 pb) que contienen, por ejemplo, mutaciones específicas de tumor, SNP, o secuencias repetitivas polimórficas. El proceso comienza con el ligamiento de conectores cortos en los extremos 3' y 5' de los segmentos de ADN (barras gruesas de color negro, Figura 77, etapa A). El extremo 5' de los conectores añadidos contiene opcionalmente un fosfato competente para ligamiento (Figura 77, etapa B, panel a la izquierda). Las sondas oligonucleotídicas que contienen secuencias complementarias a una parte única o repetitiva (es decir, repetición de AGAT) del segmento de ADN diana, y los lados 5' y 3' de los conectores añadidos se hibridan con sus respectivos segmentos de ADN diana como se muestra en la Figura 77, etapa B. Las sondas oligonucleotídicas también contienen una parte adicional que contiene una o más de una secuencia de identificador único, una secuencia de identificador de paciente, un fosfato 5' competente para ligamiento, y un enlace escindible (dU). La Figura 77, etapa C muestra el uso de los 3 dNTP (es decir, dTTP, dCTP, dATP) para la extensión mediada por polimerasa (diamantes rellenos) de los extremos 3' hibridados del segmento de ADN diana y la sonda oligonucleotídica. La extensión del extremo 3' del segmento de ADN diana crea una unión de ligamiento con el extremo 5' correspondiente del segmento de ADN diana. En ausencia de un fosfato 5' competente para ligamiento en el segmento de ADN diana (Figura 77, etapa C), la actividad de nucleasa 5' de la polimerasa escinde una base coincidente solapante en el extremo 5' para generar un fosfato 5' competente para ligamiento. En la Figura 77, etapa D, la ligasa (círculos rellenos) sella covalentemente los extremos contiguos del segmento de ADN diana para crear un producto de ligamiento circular. La digestión con exonucleasa retira todos los productos no ligados o mellados dejando solo la construcción circular monocatenaria deseada que comprende el segmento de ADN diana original acoplado a una secuencia de identificador único. El producto final es adecuado para etapas adicionales opcionales y secuenciación posterior.

La Figura 78 muestra otro proceso a modo de ejemplo para producir construcciones diana de ácido nucleico monocatenario quiméricas circulares adecuadas para secuenciación como se ha descrito anteriormente. En estas realizaciones, los segmentos genómicos originales comprenden segmentos de ADNcf (~160 pb) o segmentos de ADN genómico cortado (~160 pb) que contienen, por ejemplo, mutaciones específicas de tumor, SNP, o secuencias repetitivas polimórficas. El proceso comienza con el ligamiento de conectores cortos en los extremos 3' y 5' de los segmentos de ADN (barras gruesas de color negro, Figuras 78, etapa A). Los conectores añadidos del proceso contienen una secuencia de identificador único, y, opcionalmente, una secuencia de identificador de paciente y un grupo fosfato 5' competente para ligamiento. Como se muestra en la Figura 78, etapa B, las sondas oligonucleotídicas que contienen secuencias complementarias a una parte única o repetitiva (es decir, repetición de AGAT) del segmento de ADN diana y los lados 5' y 3' de los conectores añadidos se hibridan con sus respectivos segmentos de ADN diana. Las sondas oligonucleotídicas también contienen un enlace escindible (dU) opcional y un grupo fosfato competente para ligamiento en el extremo 5'. Cuando el extremo 5' del segmento de ADN diana con conector añadido y/o el extremo 5' de la sonda oligonucleotídica no contienen un extremo 5' competente para ligamiento (Figura 78, panel a la izquierda), sino que contienen una aleta o base solapante (Figura 78, etapa B, panel a la derecha), la actividad de nucleasa 5' (diamantes rellenos) escinde en la base o aleta complementaria solapante en el extremo 5', dejando un fosfato 5' competente para ligamiento (Figura 78, etapa C). Como se muestra en la Figura 78, etapa D, la ligasa (círculos rellenos) sella covalentemente los extremos contiguos de las sondas oligonucleotídicas y los segmentos de ADN diana para crear productos de ligamiento interconectados circulares. Posteriormente, se introduce una mella en el enlace escindible de la sonda oligonucleotídica (por ejemplo, escisión con UDG de dU, triángulos rellenos), y la digestión con exonucleasa retira todos los productos sin ligar o mellados, dejando solo el ADN circular monocatenario deseado que comprende ADN genómico original acoplado a una secuencia de identificador único. El producto final es adecuado para etapas adicionales opcionales y secuenciación posterior.

Los procedimientos usados a modo de ejemplo en las Figuras 63, 65, y 70-78 para producir construcciones diana de ácido nucleico monocatenario quiméricas circulares adecuadas para secuenciación, así como los procedimientos usados a modo de ejemplo en las Figuras 66, 67, 68, y 69 para añadir conectores al ADN diana en el proceso para producir construcciones diana de ácido nucleico monocatenario quiméricas circulares tienen en común la captura del ADN diana original DNA en círculos monocatenarios. En algunas realizaciones, la sonda oligonucleotídica proporciona una cierta selectividad por la diana (Figuras 70-78), y en algunos casos el producto comprende tanto el ADN diana original en un círculo monocatenario con un cebador hibridado específico de diana adecuado para la amplificación por círculo rodante o la captura directa y la secuenciación posterior (Figuras 73-76). Para esos enfoques en donde el producto final es una diana de ácido nucleico monocatenario quimérica circular sin un cebador hibridado, las Figuras 79-81 son un ejemplo de tres enfoques diferentes para hibridar un cebador específico de diana con una especificidad muy elevada, seguido de captura, retirada por lavado de los ácidos nucleicos no diana, y posterior amplificación por círculo rodante.

La Figura 79 muestra un proceso a modo de ejemplo para enriquecer las construcciones diana de ácido nucleico monocatenario quiméricas circulares específicas de diana deseadas adecuadas para secuenciación como se ha descrito anteriormente. Un cebador oligonucleotídico específico de diana se diseña para que contenga un grupo en el extremo 3' bloqueado que es liberado mediante escisión con RNasaH2 de un enlace de ribonucleótido escindible si y solo si se hibrida con la diana (Dobosy et al., "RNase H-Dependent PCR (rhPCR): Improved Specificity and Single Nucleotide Polymorphism Detection Using Blocked Cleavable Primers", BMC Biotechnol. 11:80 (2011)), así como un grupo de captura en el extremo 5' opcional (por ejemplo, un resto de biotina) (véase la Figura 79, etapa B). El ADN circular que comprende las dianas deseadas se enriquece capturando la construcción de cebador hibridado/circular sobre un soporte sólido a través del grupo de captura en el cebador, por ejemplo, captura con estreptavidina del resto de biotina. Los círculos que no contienen la diana se retiran mediante lavado. Se introducen mellas en los enlaces escindibles (por ejemplo, escisión por RNasa de ribonucleótido r) para liberar los círculos que contienen la diana del soporte sólido, y generar un grupo 3' OH en el cebador. La polimerasa con actividad de desplazamiento de hebra extiende el extremo 3' liberado del cebador para la amplificación por círculo rodante (véase la Figura 80, etapa B). Este producto de extensión es adecuado para la secuenciación posterior.

La Figura 80 muestra otro proceso a modo de ejemplo para enriquecer las construcciones diana de ácido nucleico monocatenario quiméricas circulares específicas de diana deseadas adecuadas para secuenciación como se ha descrito anteriormente. En esta realización un cebador oligonucleotídico específico de diana se diseña para que contenga una secuencia de anclaje de 15-20 bases en el extremo 5', 3-5 bases no coincidentes, 6-10 bases coincidentes, complementaria a la diana (Chun et al., "Dual Priming Oligonucleotide System for the Multiplex Detection of Respiratory Viruses and SNP Genotyping of CYP2C19 Gene", Nucleic Acids Res. 35(6):e40 (2007)). Como en la Figura 79, el cebador oligonucleotídico también contiene un grupo en el extremo 3' bloqueado que se libera por la escisión con RNasaH2 en un enlace de ribonucleótido escindible si y solo si se hibrida con la diana, así como un grupo de captura en el extremo 5' opcional (es decir, un resto de biotina) (véase la Figura 80, etapa B). El ADN circular que comprende las dianas deseadas se enriquece capturando la construcción de cebador hibridado/circular sobre un soporte sólido a través del grupo de captura, por ejemplo, captura con estreptavidina del resto de biotina. Los círculos que no contienen la diana se retiran mediante lavado. Se introducen mellas en los enlaces escindibles (por ejemplo, escisión por RNasa de ribonucleótido r) para liberar los círculos que contienen la diana del soporte sólido, y generar un grupo 3' OH en el cebador (Figura 80, etapa C). La polimerasa con actividad de desplazamiento de hebra extiende el extremo 3' liberado del cebador para la amplificación por círculo rodante (Figura 80, etapa D). Este producto de extensión es adecuado para la secuenciación posterior.

La Figura 81 muestra otro proceso a modo de ejemplo para enriquecer las construcciones diana de ácido nucleico monocatenario quiméricas circulares específicas de diana deseadas adecuadas para secuenciación como se ha descrito anteriormente. En esta realización, dos oligonucleótidos contiguos se hibridan con la parte específica de diana de la construcción circular. El cebador oligonucleotídico en dirección 5' comprende un grupo de captura en el extremo 5' opcional (por ejemplo, un resto de biotina). El cebador oligonucleotídico en dirección 3' está diseñado para contener un fosfato 5' y un grupo en el extremo 3' bloqueado que se libera por la escisión con RNasaH2 en un enlace de ribonucleótido escindible si y solo si se hibrida con la diana (Figura 81, etapa B). En presencia de diana, la ligasa une covalentemente los dos oligonucleótidos entre sí (Figura 81, etapa B). El ADN circular que comprende las dianas deseadas se puede enriquecer capturando las construcciones de cebador/circulares hibridadas sobre un soporte sólido a través del grupo de captura, por ejemplo, captura con estreptavidina del resto de biotina. Los círculos que no contienen la diana se retiran mediante lavado. Se introducen mellas en los enlaces escindibles (por ejemplo, escisión por RNasa de ribonucleótido r) para liberar los círculos que contienen la diana del soporte sólido, y generar un grupo 3' OH en el oligonucleótido en dirección 3' (Figura 81, etapa C). La polimerasa con actividad de desplazamiento de hebra extiende el extremo 3' liberado para la amplificación por círculo rodante (Figura 81, etapa D). Este producto de extensión es adecuado para la secuenciación posterior.

Por lo tanto, los procedimientos usados a modo de ejemplo en las Figuras 55, 56, 65, 70, y 71-78 para producir construcciones diana de ácido nucleico monocatenario quiméricas circulares adecuadas para secuenciación, más los procedimientos usados a modo de ejemplo en las Figuras 79-81 proporcionan ejemplos para generar construcciones diana de ácido nucleico monocatenario quiméricas circulares con cebadores específicos de diana o del sitio de unión hibridados y son adecuadas para amplificación por círculo rodante, seguido de secuenciación posterior. Las Figuras 82-89 son ejemplos de diferentes estrategias para capturar o enriquecer adicionalmente las dianas deseadas.

La Figura 82 muestra un proceso a modo de ejemplo para el enriquecimiento de dianas. En esta realización un cebador específico de diana hibridado con construcciones diana de ácido nucleico monocatenario quiméricas circulares se extiende usando polimerasa de desplazamiento de hebra para generar un producto de extensión monocatenario que comprende dos o más copias en tándem de la construcción monocatenaria quimérica circular de copias en tándem (Figura 82, etapa B). Los oligonucleótidos complementarios al producto de extensión se hibridan. Estos oligonucleótidos contienen opcionalmente un extremo bloqueado 3' o con emparejamientos erróneos y contienen un grupo de captura Z (por ejemplo, un resto de biotina) en el extremo 5' (Figura 82, etapa C). El producto de extensión de repetición en tándem específico de diana se captura sobre un soporte sólido y los otros ácidos nucleicos se retiran mediante lavado. El producto de extensión de repetición en tándem se desnaturaliza a partir de oligonucleótidos de captura sobre el soporte sólido (Figura 82, etapa C). Este producto de extensión es adecuado para secuenciación.

La Figura 83 muestra otro proceso a modo de ejemplo para enriquecimiento específico de diana. En esta realización, el cebador oligonucleotídico específico de diana se hibrida con la diana de ácido nucleico monocatenario quimérica circular y contiene un grupo de captura Z (es decir, un resto de biotina) en el extremo 5'. La construcción diana de ácido nucleico monocatenario quimérica circular se captura sobre un soporte sólido y los otros ácidos nucleicos se retiran mediante lavado (Figura 83, etapa A). El cebador hibridado original se extiende usando polimerasa con actividad de nucleasa 5 '^3 ' para generar círculos mellados que se liberan del soporte sólido a medida que la polimerasa escinde la parte 5' del oligonucleótido hibridado que contiene el grupo de captura (Figura 83, etapa B). La polimerasa original se inactiva por calor o por proteasa. El extremo 3' del círculo mellado se extiende con polimerasa de desplazamiento de hebra para generar hebras simples de copias en tándem de ADN diana (Figura 83, etapa C). Este producto de extensión es adecuado para secuenciación.

La Figura 84 muestra otro proceso a modo de ejemplo para enriquecimiento específico de diana. En esta realización, dos oligonucleótidos específicos de diana se hibridan con la diana de ácido nucleico monocatenario quimérica circular como se muestra en la Figura 84, etapa B. Los oligonucleótidos están opcionalmente bloqueados o presentan emparejamientos erróneos en el extremo 3' y contienen el grupo de captura Z (es decir, un resto de biotina) en el extremo 5'. La construcción diana de ácido nucleico monocatenario quimérica circular se captura sobre un soporte sólido y los otros ácidos nucleicos se retiran mediante lavado. Uno de los cebadores hibridados se extiende usando polimerasa con actividad de desplazamiento de hebra para generar hebras simples de copias en tándem de ADN diana, y liberar el producto de extensión del soporte sólido como se muestra en la Figura 84, etapa C. Este producto de extensión es adecuado para secuenciación.

La Figura 85 muestra otro proceso a modo de ejemplo para enriquecimiento específico de diana. En esta realización, un primer oligonucleótido específico de diana se hibrida con una diana de ácido nucleico monocatenario quimérica circular. Este oligonucleótido está opcionalmente bloqueado o presenta emparejamientos erróneos en el extremo 3' y contiene un grupo de captura Z (es decir, un resto de biotina) en el extremo 5'. La construcción diana de ácido nucleico monocatenario quimérica circular se captura sobre un soporte sólido y los otros ácidos nucleicos se retiran mediante lavado. Un segundo cebador específico de diana se hibrida con las construcciones circulares capturadas (Figura 85, etapa B). Una polimerasa con actividad de desplazamiento de hebra se introduce para extender el segundo cebador para generar un producto de extensión monocatenario que contiene copias en tándem del ADN diana y liberar el producto de extensión del soporte sólido (Figura 85, etapa C). Este producto de extensión es adecuado para secuenciación.

Las Figuras 86 y 87 muestran procesos a modo de ejemplo para enriquecimiento específico de diana. En estas realizaciones, un cebador del sitio de unión a cebador se hibrida con una diana de ácido nucleico monocatenario quimérica circular y se extiende usando polimerasa de desplazamiento de hebra para generar un producto de extensión monocatenario que contiene copias en tándem de ADN diana (Figura 86, etapas A-B y Figura 87, etapas A-B). Los oligonucleótidos específicos de diana complementarios al producto de extensión se hibridan. Los oligonucleótidos hibridados están opcionalmente bloqueados o presentan emparejamientos erróneos en el extremo 3' y contienen un grupo de captura Z (es decir, un resto de biotina) en el extremo 5'. El producto de extensión de repetición en tándem específico de diana se captura sobre un soporte sólido y los otros ácidos nucleicos se retiran mediante lavado (Figura 86, etapa C y la Figura 87, etapa C). En la Figura 86, el producto de extensión de repetición en tándem se desnaturaliza a partir de oligonucleótidos de captura sobre el soporte sólido (Figura 86, etapa D). Este producto de extensión es adecuado para secuenciación. En la Figura 87, se hibridan cebadores específicos de diana adicionales complementarios al producto de extensión. La extensión con polimerasa de desplazamiento de hebra libera el producto de extensión original del soporte sólido, mientras se realizan copias adicionales (Figura 87, etapa D). El producto de extensión original y las copias adicionales son adecuados para secuenciación.

La Figura 88 muestra otro proceso a modo de ejemplo para enriquecimiento específico de diana. En esta realización, un primer cebador específico de diana y un segundo oligonucleótido específico del sitio de unión a cebador se hibridan con las construcciones de ácido nucleico monocatenario quiméricas circulares (véase la Figura 88, etapas A-B). El segundo oligonucleótido está opcionalmente bloqueado o presenta emparejamientos erróneos en el extremo 3' y contiene un grupo de captura Z (es decir, un resto de biotina) en el extremo 5'. La construcción diana de ácido nucleico monocatenario quimérica circular se captura sobre un soporte sólido y los otros ácidos nucleicos se retiran mediante lavado. El primer cebador hibridado específico de diana se extiende usando polimerasa con actividad de desplazamiento de hebra para generar un producto de extensión monocatenario que contiene copias en tándem de ADN diana y liberar el producto de extensión del soporte sólido. Este producto de extensión es adecuado para secuenciación.

La Figura 89 muestra otro proceso a modo de ejemplo para enriquecimiento específico de diana. En esta realización, un oligonucleótido específico del sitio de unión a cebador se hibrida inicialmente con la construcción diana de ácido nucleico monocatenario quimérica circular. Este oligonucleótido está opcionalmente bloqueado o presenta emparejamientos erróneos en el extremo 3' y contiene un grupo de captura Z (es decir, un resto de biotina) en el extremo 5'. La construcción diana de ácido nucleico monocatenario quimérica circular se captura sobre un soporte sólido y los otros ácidos nucleicos se retiran mediante lavado (Figura 89, etapa A). Un segundo cebador específico de diana se hibrida con las construcciones circulares capturadas. Una polimerasa con actividad de desplazamiento de hebra se usa para generar productos de extensión monocatenarios que contienen copias en tándem de ADN diana, y liberar dicho producto de extensión del soporte sólido. Este producto de extensión es adecuado para secuenciación.

Las Figuras 90-99 muestran el efecto de cobertura de diferentes construcciones de sondas oligonucleotídicas. Las sondas oligonucleotídicas en cada Figura varían en sus partes específicas de diana en el extremo 5' (en dirección 5'), partes específicas de diana en el extremo 3' (en dirección 3'), longitudes de huecos, y extremos de anclaje solo en 3' o en 5' y 3' para conseguir la cobertura de un segmento diana de ADNcf de 160 nucleótidos. El segmento de ADN genómico diana se mueve en incrementos de 10 bases simulando la "familia" de todas las posibles dianas de 160 nucleótidos producidas mediante protección de nucleosomas.

La Figura 90 muestra diseños de sonda oligonucleotídica adecuados para la detección de todos los posibles fragmentos con conector añadido de 160 nucleótidos (barras de color negro) obtenidos a partir de ADNcf. En esta realización, la sonda oligonucleotídica está anclada al extremo con conector añadido en el extremo 3' de la familia de fragmentos de ADNcf que se muestra, y contiene una parte específica de diana en el extremo 5' o en dirección 5' de 60 bases (barra de color gris), una parte específica de diana en el extremo 3' o en dirección 3' de 20 bases (barra de color gris), una parte específica de conector de 10 bases (barra de color negro), y una secuencia de identificador de 20 bases (línea fina entre la parte específica de diana en el extremo 5' y la parte del conector que se ilustra debajo de las partes específicas en dirección 5' y en dirección 3'). El uso de 20 bases como la secuencia de identificador es para fines ilustrativos; puede contener una secuencia de identificador único de 12 bases y una secuencia de identificador de paciente de 8 bases cuando se amplifica y se secuencia el ADN circular quimérico como se ilustra en la Figura 1. Alternativamente, la parte del identificador puede estar en el intervalo de 40 a 80 bases cuando se usan identificadores del paciente, primeras y segundas partes específicas de cebador adecuadas para captura sobre fase sólida, y secuenciación de regiones de unión a cebador como se ilustra en las Figuras 4-12. En la Figura 13 se proporciona una ilustración de las sondas oligonucleotídicas de esta Figura hibridadas con su fragmento de ADNcf diana. La línea muy fina de longitudes variables entre la parte específica de diana en el extremo 3' y la parte del conector en las sondas oligonucleotídicas que se muestra en la Figura 90 corresponde a la longitud de la región en bucle cerca del extremo 3' del segmento diana que se muestra en las Figuras 13-16. Ilustra que la región de la sonda y la región complementaria a la región de conector están físicamente acopladas entre sí.

El diseño de la sonda oligonucleotídica que se muestra en la Figura 91 es similar al que se muestra en la Figura 90. En esta realización, la sonda oligonucleotídica está anclada al extremo con conector añadido en el extremo 3' de la familia de fragmentos de ADNcf que se muestra, y contiene una parte específica de diana en el extremo 5' o en dirección 5' de 80 bases, una parte específica de diana en el extremo 3' o en dirección 3' de 20 bases, una parte específica de conector de 10 bases (barra gruesa de color negro) y una secuencia de identificador de 20 - 160 bases. En las Figuras 13-16 también se proporciona una ilustración de las sondas oligonucleotídicas de esta Figura hibridadas con su fragmento de ADNcf diana.

La Figura 92 muestra una variación del diseño de la sonda oligonucleotídica adecuada para la detección de todos los posibles fragmentos con conector añadido de 160 nucleótidos (barras de color negro) obtenidos a partir de ADNcf. En esta realización, la sonda oligonucleotídica está anclada al extremo con conector añadido en el extremo 3' de la familia de fragmentos de ADNcf que se muestra, y contiene una parte específica de diana en el extremo 5' o en dirección 5' de 60 bases (barra de color gris), una parte específica de diana en el extremo 3' o en dirección 3' de 50 bases (barra de color gris), una parte específica de conector de 10 bases (barra de color negro) y una secuencia de identificador de 20 - 160 bases (línea fina entre la parte específica de diana en el extremo 5' y la parte del conector). El uso de 20 bases como la secuencia de identificador es solo para fines ilustrativos; también son adecuadas las longitudes alternativas como se ha descrito anteriormente en referencia a la Figura 90. En las Figuras 13 y 15 se proporciona una ilustración de las sondas oligonucleotídicas de esta Figura hibridadas con su fragmento de ADNcf diana. La línea muy fina de longitudes variables entre el conector en el extremo 3' del segmento de ADNcf y el extremo 3' del ADNcf que se muestra en la Figura 92 corresponde a la longitud de la región en bucle de la sonda oligonucleotídica que se muestra en las Figuras 13-16. Ilustra que la región de la sonda y la región complementaria a la región de conector están físicamente acopladas entre sí.

El diseño de la sonda oligonucleotídica que se muestra en la Figura 93 es similar al que se muestra en la Figura 92. En esta realización, la sonda oligonucleotídica está anclada al extremo con conector añadido en el extremo 3' de la familia de fragmentos de ADNcf que se muestra, y contiene una parte específica de diana en el extremo 5' o en dirección 5' de 80 bases, una parte específica de diana en el extremo 3' o en dirección 3' de 50 bases, una parte específica de conector de 10 bases (barra gruesa de color negro), un segmento de separación de 40 bases y una secuencia de identificador de 20 - 160 bases. En las Figuras 13-16 se proporciona una ilustración de las sondas oligonucleotídicas de esta Figura hibridadas con su fragmento de ADNcf diana.

La Figura 94 muestra una ligera variación del diseño de la sonda oligonucleotídica adecuada para la detección de todos los posibles fragmentos con conector añadido de 160 nucleótidos (barras de color negro) obtenidos a partir de ADNcf. En esta realización, la sonda oligonucleotídica está anclada al extremo con conector añadido en el extremo 3' de la familia de fragmentos de ADNcf que se muestra, y contiene una parte específica de diana en el extremo 5' o en dirección 5' de 50 bases (barra de color gris), una parte específica de diana en el extremo 3' o en dirección 3' de 50 bases (barra de color gris), una parte específica de conector en el extremo 3' de 10 bases (barra de color negro), una parte específica de conector en el extremo 5' de 10 bases (barra de color negro), y una secuencia de identificador de 20-80 bases (línea fina entre las partes específicas de diana en los extremos 5' y 3', que se ilustra debajo de las barras de color gris y la parte del conector). En la Figura 14 se proporciona una ilustración de una sonda oligonucleotídica de esta Figura hibridada con su fragmento de ADNcf diana. La línea muy fina de longitudes variables en el segmento de ADNcf diana que se muestra en la Figura 94 corresponde a la región en bucle en la sonda oligonucleotídica de la Figura 14, y la línea muy fina de longitud variable en las sondas oligonucleotídicas de la Figura 94 corresponde a la región en bucle del segmento de ADN diana de las Figuras 17 y 18. Ilustra que la región de la sonda y la región complementaria a la región de conector están físicamente acopladas entre sí.

El diseño de la sonda oligonucleotídica que se muestra en la Figura 95 es similar al que se muestra en la Figura 94. En esta realización, la sonda oligonucleotídica está anclada a dos extremos con conector añadido en el extremo 3' y con conector añadido en el extremo 5' de la familia de fragmentos de ADNcf que se muestra. La sonda contiene una parte específica de diana en el extremo 5' o en dirección 5' de 60 bases, una parte específica de diana en el extremo 3' o en dirección 3' de 60 bases, una parte específica de conector en el extremo 3' de 10 bases, a una parte específica de conector en el extremo 5' de 10 bases y una secuencia de identificador de 20 - 80 bases. En las Figuras 17 y 18 también se proporciona una ilustración de las sondas oligonucleotídicas de esta Figura hibridadas con su fragmento de ADNcf diana.

La Figura 96 muestra otra variación del diseño de la sonda oligonucleotídica adecuada para la detección de todos los posibles fragmentos sin conector añadido de 160 nucleótidos obtenidos a partir de ADNcf (barras de color gris más oscuro). En esta realización, la sonda oligonucleotídica contiene una parte específica de diana en el extremo 5' o en dirección 5' de 50 bases (barra de color gris con líneas de color negro), una parte específica de diana el extremo en 3' o en dirección 3' de 50 bases (barra de color gris con líneas de color negro) y una secuencia de identificador de 20-80 bases (línea fina entre partes específicas de diana en los extremos 5' y 3' y se muestra debajo de las barras de color gris). Las líneas verticales cortas de color negro dentro de las regiones de sonda de color gris simbolizan los emparejamientos erróneos de una sola base con respecto a la diana original, de modo que las regiones de ADN diana auténtico frente a la copia de la sonda se puedan identificar fácilmente. En las Figuras 23-26 se proporciona una ilustración de una sonda oligonucleotídica de esta Figura hibridada con su fragmento de ADNcf diana.

El diseño de la sonda oligonucleotídica que se muestra en la Figura 97 es similar al que se muestra en la Figura 96. En esta realización, la sonda oligonucleotídica contiene una parte específica de diana en el extremo 5' o en dirección 5' de 60 bases, una parte específica de diana en el extremo 3' o en dirección 3' de 60 bases y una secuencia de identificador de 20 - 160 bases. En las Figuras 23, 24, 25 y 26 también se proporciona una ilustración de las sondas oligonucleotídicas de esta Figura hibridadas con su fragmento de ADNcf diana.

El diseño de la sonda oligonucleotídica que se muestra en la Figura 98 es similar al que se muestra en la Figura 96. En esta realización, la sonda oligonucleotídica contiene una parte específica de diana en el extremo 5' o en dirección 5' de 70 bases, una parte específica de diana en el extremo 3' o en dirección 3' de 70 bases y una secuencia de identificador de 20 - 160 bases. En las Figuras 23, 24, 25 y 26 también se proporciona una ilustración de las sondas oligonucleotídicas de esta Figura hibridadas con su fragmento de ADNcf diana.

El diseño de la sonda oligonucleotídica que se muestra en la Figura 99 es similar al que se muestra en la Figura 96. En esta realización, la sonda oligonucleotídica contiene una parte específica de diana en el extremo 5' o en dirección 5' de 80 bases, una parte específica de diana en el extremo 3' o en dirección 3' de 80 bases y una secuencia de identificador de 20 - 160 bases. En las Figuras 23-26 también se proporciona una ilustración de las sondas oligonucleotídicas de esta Figura hibridadas con su fragmento de ADNcf diana.

Las Figuras 100 a 103 muestran la cobertura de una región diana con sondas oligonucleotídicas específicas de diana que tienen regiones de conector en los extremos 3' y/o 5' ya que se disponen en mosaico a través de regiones diana contiguos de 160 pb. Específicamente, la Figura 100 ilustra cómo diseñar sondas oligonucleotídicas con una estrategia de mosaicos solapante para secuenciar regiones contiguas más grandes (como ejemplo se muestran aproximadamente 500 bases). La secuencia de la región diana que se detecta se representa como la parte de color gris oscuro. La secuencia de la región diana que no se detecta se representa como la parte de color gris claro, y los conectores se representan como la parte de color negro. Cada agrupamiento vertical sucesivo en esta Figura ilustra la cobertura de la sonda obtenida desplazando las regiones diana de 160 pb encontradas en fragmentos de ADNcf generados aleatoriamente (o fragmentos cortados aleatoriamente). La región diana se desplaza sucesivamente en incrementos de 10 bases para demostrar la cobertura de la región diana mediante una sola sonda. Cada agrupamiento vertical sucesivos de izquierda a derecha ilustra la cobertura de la región diana y el solapamiento de la sonda con una 2a, 3a y 4a sondas diferentes. La estructura de la sonda oligonucleotídica que se muestra aquí (debajo de cada agrupamiento vertical) contiene una parte de sonda específica de diana en el extremo 5' o en dirección 5' de 60 bases, una sonda en el extremo 3' o en dirección 3' de 50 bases, una parte de conector de 10 bases y una región de identificador de 20 - 160 pb (líneas finas).

La Figura 101 muestra una ilustración similar de cómo diseñar sondas oligonucleotídicas con una estrategia de mosaico solapante para secuenciar regiones contiguas más grandes como se muestra en la Figura 100. La estructura de la sonda oligonucleotídica que se muestra aquí contiene una parte de sonda específica de diana en el extremo 5' o en dirección 5' de 80 bases, una sonda en el extremo 3' o en dirección 3' de 50 bases, una parte de conector de 10 bases y una región de identificador de 20 - 160 pb (líneas finas).

La Figura 102 muestra una ilustración similar de cómo diseñar sondas oligonucleotídicas con una estrategia de mosaico solapante para secuenciar regiones contiguas más grandes como se muestra en la Figura 100. La estructura de la sonda oligonucleotídica que se muestra aquí contiene una parte de sonda específica de diana en el extremo 5' o en dirección 5' de 50 bases, una sonda en el extremo 3' o en dirección 3' de 50 bases, partes de conector en los extremos 5' y 3' de 10 bases y una región de identificador de 20 - 160 pb (líneas finas).

La Figura 103 muestra una ilustración similar de cómo diseñar sondas oligonucleotídicas con una estrategia de mosaico solapante para secuenciar regiones contiguas más grandes como se muestra en la Figura 100. La estructura de la sonda oligonucleotídica que se muestra aquí contiene una parte de sonda específica de diana en el extremo 5' o en dirección 5' de 60 bases, una sonda en el extremo 3' o en dirección 3' de 60 bases, partes de conector en los extremos 5' y 3' de 10 bases y una región de identificador de 20 - 160 pb (líneas finas).

Las Figuras 104 a 107 muestran la cobertura de una región diana con oligonucleótidos marcados en fase específicos de diana sin conectores en los extremos 3' o 5' ya que se disponen en mosaico a través de regiones génicas diana contiguas de 160 pb (representa el proceso que se muestra en las Figuras 20 y 22). Las sondas oligonucleotídicas que tienen regiones específicas de diana en los extremos 5' y 3' de 50 bases contienen un emparejamiento erróneo de una sola base cada 10 bases (marcas de almohadilla verticales). Secuencia de región diana que se detecta (color gris oscuro); secuencia de región diana que no se detecta (color gris claro). Específicamente, la Figura 104 muestra oligonucleótidos marcados en fase específicos de diana en mosaico a través de dianas génicas contiguas de 160 pb (los segmentos diana no llevan conectores añadidos) en un tramo de ADN genómico. Las sondas específicas de diana en los extremos 5' y 3' tienen un emparejamiento erróneo de una sola base cada 10 bases (marcas de almohadilla verticales). Cada agrupamiento sucesivo en la figura ilustra la simulación de la cobertura de la sonda de regiones diana de 160 pb de desplazamiento encontradas en el ADNcf. La región diana se desplaza sucesivamente en incrementos 10 bases para demostrar la cobertura de la región diana mediante una sola sonda. Cada agrupamiento vertical sucesivos de izquierda a derecha ilustra la cobertura de la región diana y el solapamiento de la sonda con una 2a, 3a y 4a sondas diferentes. La estructura de la sonda oligonucleotídica que se muestra en esta figura contiene una parte específica de diana en el extremo 5' o en dirección 5' de 50 bases, una parte específica de diana en el extremo 3' o en dirección 3' de 50 bases, y una parte de identificador de secuencia de 20 - 160 bases.

La Figura 105 muestra un enfoque similar para los oligonucleótidos marcados en fase específicos de diana en mosaico a través de dianas génicas contiguas de 160 pb como se muestra en la Figura 104. La estructura de la sonda oligonucleotídica que se muestra en esta figura contiene una parte específica de diana en el extremo 5' o en dirección 5' de 60 bases, una parte específica de diana en el extremo 3' o en dirección 3' de 60 bases, y una región de identificador de secuencia de 20 - 160 bases.

La Figura 106 muestra un enfoque similar para los oligonucleótidos marcados en fase específicos de diana en mosaico a través de dianas génicas contiguas de 160 pb como se muestra en la Figura 104. La estructura de la sonda oligonucleotídica que se muestra en esta figura contiene una parte específica de diana en el extremo 5' o en dirección 5' de 70 bases, una parte específica de diana en el extremo 3' o en dirección 3' de 70 bases, y una región de identificador de secuencia de 20 - 160 bases.

La Figura 107 muestra un enfoque similar para los oligonucleótidos marcados en fase específicos de diana en mosaico a través de dianas génicas contiguas de 160 pb como se muestra en la Figura 104. La estructura de la sonda oligonucleotídica que se muestra en esta figura contiene una parte específica de diana en el extremo 5' o en dirección 5' de 80 bases, una parte específica de diana en el extremo 3' o en dirección 3' de 80 bases, y una región de identificador de secuencia de 20 - 160 bases.

Otra divulgación se refiere a un método para identificar, en una muestra, una o más moléculas de ácido ribonucleico diana que se diferencian de otras moléculas de ácido nucleico en la muestra en una o más bases. Este método implica proporcionar una muestra que contiene una o más moléculas de ácido ribonucleico diana que contienen potencialmente una o más diferencias de bases y generar, en la muestra, ADNc de la una o más moléculas de ácido ribonucleico diana, si estuvieran presentes en la muestra. El método además implica proporcionar una o más primeras sondas oligonucleotídicas, comprendiendo cada primera sonda oligonucleotídica (a) una parte de secuencia específica de diana de ADNc en el extremo 3', (b) una parte específica de diana de ADNc en el extremo 5', y una parte adicional, comprendiendo dicha parte adicional (i) una secuencia de identificador único, (ii) una secuencia de identificador de paciente, (iii) una o más secuencias de unión a cebador, o cualquier combinación de (i), (ii), y (iii). La muestra se pone en contacto con la una o más primeras sondas oligonucleotídicas en condiciones eficaces para que las partes específicas de diana en los extremos 3' y 5' de las primeras sondas oligonucleotídicas se hibriden de una forma específica según la base con regiones complementarias del ADNc. Se generan una o más uniones competentes para ligamiento adecuadas para acoplar los extremos 3' y 5' de una primera sonda oligonucleotídica hibridada con su ADNc complementario y la primera sonda oligonucleotídica, en la una o más uniones de ligamiento, se liga para formar un producto circular ligado que comprende una copia de ácido desoxirribonucleico de la secuencia de ácido ribonucleico diana acoplada a la parte adicional de la primera sonda oligonucleotídica. El método además implica detectar y distinguir los productos ligados circulares en la muestra para identificar la presencia de una o más moléculas de ácido ribonucleico diana que se diferencian de otras moléculas de ácido ribonucleico en la muestra en una o más bases.

De acuerdo con la presente divulgación, la Figura 108 muestra un proceso para la captura específica de diana de transcritos de ARNm o ARNInc para la secuenciación. Como se muestra en la Figura 108, etapa A, el ARNm o ARNInc que contiene las regiones diana deseadas se transcribe inversamente (transcripción inversa - diamante relleno) para generar una molécula de ADN complementario (ADNc). Como se muestra en la Figura 108, etapa B, una sonda oligonucleotídica que contiene secuencias en los extremos 5' y 3' complementarias a la región diana de ADNc se hibrida con la molécula de ADNc. Las partes específicas de diana de la sonda oligonucleotídica se separan con una parte adicional. La parte adicional comprende una parte de identificador único, opcionalmente una parte de identificados de paciente, y opcionalmente un fosfato 5'. Si fuera necesario, una polimerasa (diamante relleno) extiende el extremo 3' hibridado de la sonda oligonucleotídica para generar un extremo 3' al nivel del extremo 5' de la sonda oligonucleotídica (Figura 108, etapa C). En ausencia de un fosfato competente para ligamiento en el extremo 5', una polimerasa que tiene actividad de nucleasa 5' escinde la base coincidente solapante en el extremo 5' en el extremo 5' para generar un fosfato 5' (lado izquierdo de la Figura 108, etapa C). Como se muestra en la Figura 108, etapa D, la ligasa (círculos rellenos) sella covalentemente los extremos extendidos o competentes para ligamiento para crear productos de ligamiento circulares. Por último, como se muestra en la Figura 108, etapa E, la digestión con exonucleasa retira todos los productos sin ligar o mellados dejando solo la construcción circular monocatenaria deseada que comprende una copia de ADNc de la secuencia de ácido ribonucleico diana acoplada a una secuencia de identificador único o secuencia de identificador de paciente. Este producto es adecuado para la amplificación por círculo rodante y la secuenciación usando cualquiera de los métodos que se describen en el presente documento.

Otra divulgación se refiere a un método para identificar, en una muestra, una o más moléculas de ácido nucleico que comprenden potencialmente regiones de primera diana y segunda diana distintas acopladas entre sí (por ejemplo, supuestas fusiones génicas). Este método implica proporcionar una muestra que contiene potencialmente una o más moléculas de ácido nucleico que comprenden regiones de primera diana y segunda diana distintas acopladas entre sí, y proporcionar uno o más conjuntos de sondas oligonucleotídicas, comprendiendo cada conjunto de sondas (i) una primera sonda oligonucleotídica que comprende una primera parte específica de diana en el extremo 5', una segunda parte específica de diana en el extremo 3', y una parte adicional, y (ii) una segunda sonda oligonucleotídica que comprende una segunda parte específica de diana en el extremo 5', una primera parte específica de diana en el extremo 3', y una parte adicional, en donde la parte adicional de la primera o la segunda sondas oligonucleotídicas de un conjunto de sondas comprende (i) una secuencia de identificador único, (ii) una secuencia de identificador de paciente, (iii) una o más secuencias de unión a cebador, o cualquier combinación de (i), (ii), y (iii). Este método además implica poner en contacto la muestra y el uno o más conjuntos de sondas oligonucleotídicas en condiciones eficaces para que la primera y segunda sondas oligonucleotídicas se hibriden de una forma específica según la base con sus correspondientes primera y segunda regiones diana de la molécula de ácido nucleico, si estuvieran presentes en la muestra, y generar una o más uniones competentes para ligamiento adecuadas acoplar los extremos 3' de las primeras sondas oligonucleotídicas a los extremos 5' de las segundas sondas oligonucleotídicas de un conjunto de sondas y para acoplar los extremos 5' de las primeras sondas oligonucleotídicas a los extremos 3' de las segundas sondas oligonucleotídicas de un conjunto de sondas cuando dichos conjuntos de sondas se hibridan con primeras y segundas regiones diana complementarias de una molécula de ácido nucleico. El primer y segundo oligonucleótidos de un conjunto de sondas están ligados a la una o más uniones competentes para ligamiento para formar productos ligados circulares que comprenden una secuencia nucleotídica que corresponde a la primera y segunda regiones diana distintas de una molécula de ácido nucleico acoplada a una parte adicional. Los productos ligados circulares se detectan y distinguen en la muestra identificando de ese modo la presencia, si la hubiera, de una o más moléculas de ácido nucleico que comprenden regiones de primera diana y segunda diana distintas acopladas entre sí en la muestra.

De acuerdo con la presente divulgación, la Figura 109, etapas A-E muestra un proceso a modo de ejemplo para detectar supuestas fusiones génicas específicas en los ARNm. El ARNm que contiene la supuesta fusión génica se transcribe inversamente para generar una molécula de ADNc (Figura 109, etapa A). Para cada diana potencial, se proporciona un conjunto de sondas que comprende una primera y una segunda sondas oligonucleotídicas. La primera sonda tiene una primera parte específica de diana en el extremo 5' y una segunda parte específica de diana en el extremo 3', mientras que la segunda sonda tiene una segunda parte específica de diana en el extremo 5' y una primera parte específica de diana en el extremo 3'. Las partes específicas de diana de cada sonda están separadas por una secuencia nucleotídica que contiene una secuencia de identificador único, una secuencia de identificador de paciente, una o más secuencias de unión a cebador, o cualquier combinación de las mismas. Las sondas oligonucleotídicas se hibridan con sus respectivas partes complementarias de la molécula de ADNc diana como se muestra en la Figura 109, etapa B. Si las sondas oligonucleotídicas contienen extremos 5' competentes para ligamiento, una ligasa sella covalentemente los extremos contiguos de los oligonucleótidos hibridados para crear un producto de ligamiento circular como se muestra en la Figura 109, etapa D (panel a la izquierda). Si las sondas oligonucleotídicas contienen una aleta 5' o una base nucleotídica solapante, una nucleasa 5' escinde el extremo 5' para generar un fosfato 5' competente para ligamiento (Figura 109, etapa C) antes del ligamiento (Figura 109, etapa D, panel a la derecha). La digestión con exonucleasa retira todos los productos sin ligar o lineales dejando solo las construcciones de ADN circulares monocatenarias deseadas que comprenden las secuencias en dirección 5' y en dirección 3' de los productos de fusión génica acoplados a una secuencia de identificador único, una secuencia de identificador de paciente, y/o una secuencia de captura (por ejemplo, secuencia de unión a cebador). Este producto es adecuado para la amplificación por círculo rodante y secuenciación posterior como se describe en el presente documento.

La Figura 110 muestra una variación del proceso que se representa en la Figura 109 para detectar supuestas fusiones génicas específicas en los ARNm. En esta realización, la primera y la segunda sondas oligonucleotídicas se hibridan con sus respectivas regiones complementarias de la molécula de ADNc como se muestra en la Figura 110, etapa B. Una polimerasa extiende los extremos 3' hibridados de cada primera y segunda sondas para formar uniones de ligamiento con los extremos 5' hibridados de la segunda y la primera sondas, respectivamente como se muestra en la Figura 110, etapa C. Cuando las sondas oligonucleotídicas tienen un 5' OH (lado derecho de la Figura 110, etapa C), la actividad de nucleasa 5' de la polimerasa escinde la base coincidente solapante en el extremo 5', dejando un fosfato 5' competente para ligamiento. La ligasa (círculos rellenos) sella covalentemente los extremos contiguos de las primeras y las segundas sondas oligonucleotídicas hibridadas para crear productos de ligamiento circulares (Figura 110, etapa D). La digestión con exonucleasa retira todos los productos sin ligar o lineales dejando solo las construcciones de ADN circulares monocatenarias deseadas que comprenden las secuencias en dirección 5' y en dirección 3' de los productos de fusión génica acoplados a una secuencia de identificador único, una secuencia de identificador de paciente, y/o una secuencia de captura (es decir, secuencia de unión a cebador). Este producto es adecuado para la amplificación por círculo rodante y secuenciación posterior como se describe en el presente documento.

La Figura 111 muestra otro proceso de acuerdo con la presente divulgación que es adecuado para la detección y cuantificación de exones específicos en ARNm o ARNInc. En esta realización, el ARNm o el ARNInc que contiene los exones deseados se transcribe inversamente en ADNc (Figura 111, etapa A). Como se muestra en la Figura 111, etapa B, para cada diana potencial, se proporcionan dos sondas oligonucleotídicas, conteniendo cada sonda secuencias específicas de diana en los extremos 3' y 5' complementarias a partes únicas de cada exón de la molécula de ADNc. Las partes específicas de diana de cada sonda están separadas por una secuencia nucleotídica que contiene una secuencia de identificador único, una secuencia de identificador de paciente, una o más secuencias de unión a cebador, o cualquier combinación de las mismas. Las sondas se hibridan contiguas entre sí en el ADNc de la diana como se muestra en la Figura 111, etapa B. Si las sondas oligonucleotídicas contienen extremos 5' competentes para ligamiento, una ligasa sella covalentemente los extremos contiguos de los oligonucleótidos hibridados para crear un producto de ligamiento circular como se muestra en la Figura 111, etapa D (panel a la izquierda). Si las sondas oligonucleotídicas contienen una aleta 5' o una base nucleotídica solapante, una nucleasa 5' escinde el extremo 5' para generar un fosfato 5' competente para ligamiento (Figura 111, etapa C) antes del ligamiento (Figura 111, etapa D, panel a la derecha). La digestión con exonucleasa retira todos los productos sin ligar o lineales dejando solo las construcciones de ADN circulares monocatenarias deseadas que comprenden la secuencia de ADNc de los exones deseados acoplados a una secuencia de identificador único, una secuencia de identificador de paciente, y/o una secuencia de captura (por ejemplo, secuencia de unión a cebador). Este producto es adecuado para la amplificación por círculo rodante y secuenciación posterior como se describe en el presente documento.

La Figura 112 muestra una variación del proceso que se representa en la Figura 111 para detectar y cuantificar exones específicos en ARNm o ARNInc. En esta realización, la primera y la segunda sondas oligonucleotídicas se hibridan con su respectiva región complementaria de la molécula de ADNc como se muestra en la Figura 112, etapa B. Una polimerasa extiende los extremos 3' hibridados de cada primera y segunda sondas para formar uniones de ligamiento con los extremos 5' hibridados de la segunda y la primera sondas, respectivamente como se muestra en la Figura 112, etapa C. Cuando las sondas oligonucleotídicas tienen un 5' OH (lado derecho de la Figura 110, etapa C), la actividad de nucleasa 5' de la polimerasa escinde la base coincidente solapante en el extremo 5', dejando un fosfato 5' competente para ligamiento. La ligasa (círculos rellenos) sella covalentemente los extremos contiguos de las primeras y las segundas sondas oligonucleotídicas hibridadas para crear productos de ligamiento circulares (Figura 112, etapa D). La digestión con exonucleasa retira todos los productos sin ligar o lineales dejando solo las construcciones de ADN circulares monocatenarias deseadas que comprenden la secuencia de ADNc de los exones deseados acoplada a una secuencia de identificador único, una secuencia de identificador de paciente, y/o una secuencia de captura (es decir, secuencia de unión a cebador). Este producto es adecuado para la amplificación por círculo rodante y secuenciación posterior como se describe en el presente documento.

La Figura 113 muestra otro proceso de acuerdo con la presente divulgación que es adecuado para la detección de polimorfismos conocidos en la misma hebra de ADN genómico. Como se muestra en la Figura 113, etapa A, las regiones en dirección 5' y en dirección 3' del segmento de ADN genómico diana contienen polimorfismos. Como se muestra en la Figura 113, etapa B, para cada diana potencial se proporcionan dos sondas oligonucleotídicas, conteniendo cada sonda secuencias específicas de diana en los extremos 3' y 5' que son complementarias a las partes en dirección 5' y en dirección 3' del ADN que contiene polimorfismos. Las partes específicas de diana de cada sonda están separadas por una secuencia nucleotídica que contiene una secuencia de identificador único, una secuencia de identificador de paciente, una o más secuencias de unión a cebador, o cualquier combinación de las mismas. Las sondas se hibridan contiguas entre sí en las secuencias de ADN genómico diana como se muestra en la Figura 113, etapa B. Si las sondas oligonucleotídicas contienen extremos 5' competentes para ligamiento, una ligasa sella covalentemente los extremos contiguos de los oligonucleótidos hibridados para crear un producto de ligamiento circular como se muestra en la Figura 113, etapa D (panel a la izquierda). Si las sondas oligonucleotídicas contienen una aleta 5' o una base nucleotídica solapante, una nucleasa 5' escinde el extremo 5' para generar un fosfato 5' competente para ligamiento (Figura 113, etapa C) antes del ligamiento (Figura 113, etapa D, panel a la derecha). La digestión con exonucleasa retira todos los productos sin ligar o lineales dejando solo las construcciones de ADN circulares monocatenarias deseadas que comprenden las secuencias en dirección 5' y en dirección 3' del ADN genómico que contiene polimorfismos acopladas a una secuencia de identificador único, una secuencia de identificador de paciente, y/o una secuencia de captura (por ejemplo, secuencia de unión a cebador). Este producto es adecuado para la amplificación por círculo rodante y secuenciación posterior como se describe en el presente documento.

Otra divulgación se refiere a un método para identificar, en una muestra, una o más moléculas de miARN diana que difieren de otras moléculas de ácido nucleico en la muestra en una o más bases. Este método implica proporcionar una muestra que contiene una o más moléculas de miARN diana que contienen potencialmente una o más diferencias de bases, y añadir conectores nucleotídicos a los extremos 3' y 5' de las moléculas de miARN diana en la muestra. Este método además implica proporcionar una o más sondas oligonucleotídicas, comprendiendo cada sonda oligonucleotídica (a) una parte en el extremo 3' complementaria al conector nucleotídico en el extremo 3' de la molécula de miARN diana, (b) una parte en el extremo 5' complementaria al conector nucleotídico en el extremo 5' de las moléculas de miARN diana, y (c) una parte adicional, comprendiendo dicha parte adicional (i) una secuencia de identificador único, (ii) una secuencia de identificador de paciente, (iii) una o más secuencias de unión a cebador, o cualquier combinación de (i), (ii), y (iii). La muestra se pone en contacto con la una o más sondas oligonucleotídicas en condiciones eficaces para que las partes en los extremos 3' y 5' de las sondas oligonucleotídicas se hibriden de una forma específica según la base con conectores nucleótidos ricos complementarios en las moléculas de miARN diana, si estuvieran presentes en la muestra. El extremo 3' de la sonda oligonucleotídica hibridada se extiende para generar un complemento de la una o más moléculas de miARN diana, y el extremo 3' extendido de la sonda oligonucleotídica está ligado al extremo 5' de la sonda oligonucleotídica para formar un producto ligado circular que comprende una secuencia complementaria al conector nucleotídico en el extremo 3' de la molécula de miARN diana, una secuencia complementaria al conector nucleotídico en el extremo 5' de la molécula de miARN diana, el complemento de la una o más moléculas de miARN diana, y la parte adicional de la sonda oligonucleotídica. Este método además implica detectar y distinguir los productos ligados circulares en la muestra identificando de ese modo la presencia de una o más moléculas de miARN diana que se diferencian de otras moléculas de ácido nucleico en la muestra en una o más bases.

De acuerdo con la presente divulgación, la Figura 114 muestra un proceso para detectar poblaciones genéricas de miARN. El material de partida para este proceso es miARN aislado de suero, o plasma, o exosomas (Figura 114, etapa A). Como se muestra en la Figura 114, etapa B, los conectores nucleotídicos se añaden a los extremos 3' y 5' de las moléculas de ácido ribonucleico diana en la muestra. Como se muestra en la Figura 114, etapa B, el conector en el extremo 3' contiene un grupo de bloqueo en su extremo 3' y un grupo fosfato en su extremo 5' para facilitar el ligamiento usando ARN ligasa T4 (círculos rellenos) en el extremo 3' de la molécula de miARN diana. El conector en el extremo 5', también contiene un grupo de bloqueo en su extremo 5' ligado del mismo modo al extremo 5' de la molécula de miARN usando ARN ligasa T4. Las sondas oligonucleotídicas que contienen una parte en el extremo 3' complementaria al conector nucleotídico en el extremo 3' del miARN diana y una parte en el extremo 5' complementaria al conector nucleotídico en el extremo 5' del miARN diana se hibridan con su molécula de miARN diana con conector añadido (Figura 114, etapa C). Las sondas oligonucleotídicas también contienen una secuencia nucleotídica que comprende una secuencia de identificador único, una secuencia de identificador de paciente, una o más secuencias de unión a cebador, o cualquier combinación de las mismas. La transcriptasa inversa que carece de actividad 5 '^3 ' (diamante relleno) extiende el extremo 3' de la sonda oligonucleotídica hibridada, copiando la secuencia de miARN, hasta que sea contiguo al extremo 5' competente para ligamiento de la sonda oligonucleotídica (Figura 114, etapa D). Como se muestra en la Figura 114, etapa E, la ADN ligasa T4 (círculos rellenos) sella covalentemente el extremo 3' extendido de la sonda oligonucleotídica para crear un producto de ligamiento circular. La UDG y la endonucleasa AP (triángulos rellenos) mellan el miARN (Figura 114, etapa E), y la digestión con exonucleasa de todos los productos sin ligar o mellados deja solo la construcción de ácido nucleico monocatenario circular deseada que comprende una copia de la diana de miARN acoplada a una secuencia de identificador único. Este producto es adecuado para la amplificación por círculo rodante y secuenciación circular como se describe en el presente documento.

Otra divulgación se refiere a un método para identificar, en una muestra, una o más moléculas de miARN diana que se diferencian de otras moléculas de ácido nucleico en la muestra en una o más bases. Este método implica proporcionar una muestra que contiene una o más moléculas de miARN diana que contienen potencialmente una o más diferencias de bases, y ligar conectores nucleotídicos a los extremos 3' y 5' de las moléculas de miARN diana en la muestra. Los conectores nucleotídicos se acoplan entre sí mediante una parte adicional, comprendiendo dicha parte adicional (i) una secuencia de identificador único, (ii) una secuencia de identificador de paciente, (iii) una o más secuencias de unión a cebador, o cualquier combinación de (i), (ii), y (iii), por lo que dicho ligamiento forma un producto de ligamiento circular que comprende la molécula de miARN diana, las secuencias de conector nucleotídico en los extremos 3' y 5', y la parte adicional. Este método además implica proporcionar uno o más primeros cebadores oligonucleotídicos que comprenden una secuencia nucleotídica que es complementaria a una secuencia de conector nucleotídico en los extremos 3' o 5' del producto de ligamiento circular, e hibridarse con el uno o más primeros cebadores oligonucleotídicos al producto de ligamiento circular de una forma específica según las bases. El extremo 3' del primer cebador oligonucleotídico se extiende para generar un complemento del producto de ligamiento circular, y los complementos del producto de ligamiento circular en la muestra se detectan y distinguen, identificando de ese modo la presencia de una o más moléculas de miARN diana que se diferencian de otras moléculas de ácido nucleico en la muestra en una o más bases.

De acuerdo con la presente divulgación, la Figura 115 muestra un proceso para detectar secuencias de miARN específicas. El miARN aislado de suero o exosomas (Figura 115, etapa A), está fosforilado en su extremo 5'. Como se muestra en la Figura 115, etapa B, los conectores nucleotídicos acoplados se ligan en los extremos 3' y 5' de las moléculas de ácido ribonucleico diana en la muestra. Los conectores nucleotídicos están acoplados mediante una secuencia nucleotídica que contiene una secuencia de identificador único, un ribonucleótido en el extremo 3', una secuencia de identificador de paciente, una o más secuencias de unión a cebador, o cualquier combinación de las mismas. El ligamiento de los conectores nucleotídicos acoplados se facilita mediante una sonda oligonucleotídica que tiene una secuencia en el extremo 3' complementaria al extremo 3' del conector acoplado, una secuencia en el extremo 5' complementaria al extremo 5' del conector acoplado, y una secuencia complementaria al miARN diana como se muestra en la Figura 115, etapa B. El ligamiento de los conectores nucleotídicos a la molécula de miARN crea productos de ligamiento circularizados que contienen la molécula de miARN diana. Como se muestra en la Figura 115, etapa C, la digestión con exonucleasa retira todos los productos sin ligar, por ejemplo, la sonda oligonucleotídica, dejando solo la construcción de ácido nucleico monocatenario circularizada deseada que contiene el miARN diana. Como se muestra en la Figura 115, etapa D, un cebador fosforilado en el extremo 5' se hibrida con la construcción circularizada, y una polimerasa que tiene actividad de transcriptasa inversa (diamante), pero que carece de actividad 5'^3', extiende el cebador hibridado alrededor de la construcción circularizada generando una copia complementaria de la molécula de miARN. La ligasa (círculo relleno) sella covalentemente el extremo 3' extendido y el extremo 5' fosforilado del cebador para crear un segundo producto de ligamiento circularizado como se muestra en la Figura 115, etapa E. La UDG y la endonucleasa AP (triángulo relleno) mellan la molécula de miARN original, y la digestión con exonucleasa retira todos los productos sin ligar o mellados dejando solo las construcciones de ácido nucleico monocatenario circulares deseadas que comprenden una copia de la diana de miARN acoplada a una secuencia de identificador único. Este producto es adecuado para la amplificación por círculo rodante y secuenciación circular como se describe en el presente documento.

La Figura 116 muestra una variación del proceso que se representa en la Figura 115 para detectar secuencias de miARN específicas. En esta variación, el ligamiento de los conectores nucleotídicos acoplados al miARN diana se facilita usando una sonda oligonucleotídica que tiene un grupo de bloqueo en el extremo 3' y un espaciador interno ("X") dentro de la secuencia que es complementaria a la secuencia de miARN diana (Figura 116, etapa B, panel a la izquierda). El ligamiento de los conectores nucleotídicos acoplados al miARN diana forma productos de ligamiento circularizados como se muestra en la Figura 116, etapa B (panel a la izquierda). Un cebador 5' OH que contiene tiofosfatos se hibrida con los productos de ligamiento circularizados como se muestra en la Figura 116, etapa C. Una polimerasa que tiene actividad de transcriptasa inversa y actividad de nucleasa 5 '^3 ' (diamantes rellenos) extiende el extremo 3' del cebador hibridado para formar una copia complementaria del producto de ligamiento circularizado y la molécula de miARN diana contenida en el mismo (Figuras 116, etapa C y 116, etapa D, panel a la izquierda). La actividad de nucleasa 5' de la polimerasa escinde la base coincidente solapante en el extremo 5' del cebador, dejando un fosfato 5' competente para ligamiento (Figura 116, etapa D, panel a la izquierda). La ligasa (círculo relleno) sella covalentemente el extremo extendido para crear productos de ligamiento circulares como se muestra en la Figura 116, etapa E. La UDG y la endonucleasa AP (triángulo relleno) mellan la molécula de miARN original (Figura 116, etapa E, panel a la izquierda), y la digestión con exonucleasa retira todos los productos sin ligar o mellados dejando solo el ADN circular monocatenario deseado que comprende una copia de la diana de miARN acoplada a una secuencia de identificador único (Figura 116, etapa F, panel a la izquierda). Este producto es adecuado para la amplificación por círculo rodante y secuenciación circular como se describe en el presente documento. En ausencia de un miARN diana, como se muestra en la Figura 116, etapas B-E, panel a la derecha, la extensión del cebador con nucleasa 5 '^3 ' crea un hueco con una rotura bicatenaria. Los productos con huecos no se ligan y permanecen lineales (Figura 116, etapa E, panel a la derecha). Estos productos lineales se retiran del análisis mediante digestión con exonucleasa (Figura 116, etapa F).

Otra divulgación se refiere a un método para identificar, en una muestra, una o más moléculas de miARN diana que se diferencian de otras moléculas de ácido nucleico en la muestra en una o más bases. Este método implica proporcionar una muestra que contiene una o más moléculas de miARN diana que contienen potencialmente una o más diferencias de bases, y proporcionar uno o más conjuntos de sondas oligonucleotídicas, comprendiendo cada conjunto (a) una primera sonda oligonucleotídica que tiene una parte de tallo-bucle en el extremo 5' y una parte en el extremo 3' complementaria a una parte en el extremo 3' de la molécula de miARN diana, (b) una segunda sonda oligonucleotídica que tiene una parte en el extremo 3' complementaria a una copia del extremo 5' de la molécula de miARN diana, una parte en el extremo 5' complementaria a la parte de tallo-bucle en el extremo 5' de la primera sonda oligonucleotídica, y una parte adicional que comprende (i) una secuencia de identificador de diana única, (ii) una secuencia de identificador de paciente, (iii) una secuencia de unión a cebador, o cualquier combinación de (i), (ii), y (iii). El método además implica mezclar la muestra, la una o más primeras sondas oligonucleotídicas de un conjunto de sondas, y una transcriptasa inversa para formar una reacción de transcriptasa inversa, y extender el extremo 3' de la primera sonda oligonucleotídica hibridada con su molécula de miARN diana complementaria para generar un complemento de la molécula de miARN diana, si estuviera presente en la muestra. La una o más segundas sondas oligonucleotídicas de un conjunto de sondas se hibridan con las primeras sondas oligonucleotídicas extendidas que comprenden un complemento de las secuencias de miARN diana, una o más uniones competentes para ligamiento se generan entre los extremos 3' y 5' de cada segunda sonda oligonucleotídica hibridada con una primera sonda oligonucleotídica extendida. El método además implica ligar los extremos 3' y 5' década segunda sonda oligonucleotídica para formar productos ligados circulares, comprendiendo cada producto una copia de ácido desoxirribonucleico de la secuencia de miARN diana acoplada a la parte adicional de la segunda sonda oligonucleotídica. Los productos ligados circulares en la muestra se detectan y distinguen, identificando de ese modo la presencia de una o más moléculas de miARN diana que se diferencian de otras moléculas de ácido nucleico en la muestra en una o más bases.

De acuerdo con la presente divulgación, la Figura 117 muestra un método para detectar secuencias de miARN específicas. El miARN, aislado de suero, plasma, o exosomas se hibrida con una primera sonda oligonucleotídica que tiene una secuencia que es complementaria al extremo 3' del miARN diana, un tallo-bucle en su extremo 5' (Figura 117, etapa B). La región de tallo-bucle de la primera sonda oligonucleotídica también contienen un enlace escindible (dU). La primera sonda oligonucleotídica se extiende usando una transcriptasa inversa (diamantes rellenos) formando de ese modo una copia complementaria de la molécula de miARN. Como se muestra en la Figura 117, etapa C, una segunda sonda oligonucleotídica que contiene una secuencia en el extremo 3' que es complementaria al extremo 3' de la primera sonda oligonucleotídica extendida, y una secuencia en el extremo 5' que es complementaria al tallo-bucle en el extremo 5' de la primera sonda oligonucleotídica se hibrida con regiones complementarias de la primera sonda oligonucleotídica. Las segundas sondas oligonucleotídicas también pueden contener una secuencia de identificador único, una secuencia de identificador de paciente, una o más secuencias de unión a cebador, un fosfato 5', o cualquier combinación de las mismas. La polimerasa (diamantes rellenos) extiende el extremo 3' de la segunda sonda oligonucleotídica, produciendo una copia complementaria de la secuencia de miARN y crea un puente en el extremo 3' de la sonda contiguo a su extremo 5' para formar una unión de ligamiento. (Figura 117, etapa D). La polimerasa también extiende el extremo 3' de la primera sonda oligonucleotídica (usando la segunda sonda oligonucleotídica hibridada como molde) para crear una unión de ligamiento con su extremo 5' (Figura 117, etapa D). Como se muestra en la Figura 117, etapa E, la ligasa (círculos rellenos) sella covalentemente los extremos 3' y 5' de la primera y la segunda sondas oligonucleotídicas en cada respectiva unión de ligamiento para crear productos de ligamiento circularizados. Se introduce una mella en el enlace escindible de la primera sonda oligonucleotídica (por ejemplo, escisión con UDG de dU, y endonucleasa AP - triángulo relleno). Como se muestra en la Figura 117, etapa E, la digestión con exonucleasa retira todos los productos sin ligar o mellados dejando solo la construcción de ácido nucleico monocatenario circularizada deseada (es decir, la segunda sonda oligonucleotídica) que comprende una copia de la secuencia diana de miARN acoplada a una secuencia de identificador único. Este producto es adecuado para la amplificación por círculo rodante y secuenciación circular como se describe en el presente documento. En la medida en la que los siguientes ejemplos están fuera del ámbito de las reivindicaciones, se proporcionan con fines ilustrativos.

Ejemplos

Ejemplo profético 1 - Marcador de mutaciones de alta sensibilidad (cuando está presente de un 1 % a un 0,01 %), mutaciones de una sola base, mutaciones por inserciones pequeñas y deleciones pequeñas en genes conocidos (por ejemplo, Braf, K-ras, p53).

Los cambios mutacionales en los oncogenes se producen normalmente en regiones o posiciones discretas y, a menudo, pueden conducir a la progresión del tumor. Un listado de estos genes y sus mutaciones se pueden encontrar en bases de datos públicas tales como la base de datos "COSMIC" del Sanger Genome Center. La presencia de tales mutaciones en el suero es un fuerte indicador de algún tejido tumoral en el organismo. Tradicionalmente, tales mutaciones se han identificado usando amplificación por PCR específica de alelos. Este enfoque es susceptible de una falsa amplificación inicial, seguida de la amplificación del producto falso. Otros investigadores han usado PCR digital para tratar de cuantificar el ADN mutante en el suero. Sin embargo, los cambios mutacionales en genes supresores de tumores, tales como p53 y APC, son demasiado numerosos para abarcarlos usando enfoques de PCR específica de alelos. Por lo tanto, el enfoque se ha modificado hacia una secuenciación profunda en todos los exones de la proteína. Cuando el ADN entrante es limitante, es importante conseguir una amplificación equitativa de diferentes regiones para garantizar el mismo nivel general de cobertura. Han existido intentos de conseguir amplificaciones equitativas usando sondas de inversión molecular (MIP), véase por ejemplo, Akhras et al., "Connector Inversion Probe Technology: A Powerful One-Primer Multiplex DNA Amplification System for Numerous Scientific Applications", PLoS One 2(9):e915 (2007); Hiatt et al., "Single Molecule Molecular Inversion Probes for Targeted, High-Accuracy Detection of Low-Frequency Variation", Genome Res.

23(5):843-54 (2013). Sin embargo, estas técnicas dependen de la preparación de una copia de ADN genómico y, por lo tanto, corren el riesgo de introducir errores adicionales.

Visión general del enfoque: la idea es capturar fielmente cada fragmento de ADN diana que cubre las regiones o exones de interés, añadir una secuencia de identificador único y un identificador de paciente opcional, y circularizarlos para la secuenciación posterior, tal como secuenciación circular. La hebra de ADN diana original se circulariza y se secuencia. Esto evita los errores inducidos por la polimerasa que surgen a partir de la extensión (y circularización) de oligonucleótidos hibridados, lo que podría conducir a falsos positivos. Este enfoque proporciona la ventaja de obtener tanto información sobre el número de copias cuando sea necesario (es decir, carga vírica, desequilibrio cromosómico en tumores, detección de aneuploidía en el diagnóstico prenatal no invasivo), como datos mutacionales con la mínima secuenciación requerida.

Variación 1.1: (Figuras 13-16). En esta variación, los conectores cortos se ligan a la diana de ADN (ADNcf con una longitud promedio de aproximadamente 160 bases). Para capturar las regiones deseadas, las sondas oligonucleotídicas que comprenden una región de sonda en el extremo 5' complementaria a las secuencias en el lado 5' de la diana, una secuencia de identificador único, una secuencia de identificador de paciente opcional, una secuencia complementaria al extremo 3' del conector, y una región de sonda en el extremo 3' complementaria a las secuencias en el lado 3' de la diana, se hibridan con la diana. El oligonucleótido puede contener un grupo de bloqueo opcional en un extremo (se muestra el extremo 5'), o un conector escindible opcional. Dependiendo del diseño de la sonda y de las bases de inicio y finalización del fragmento diana, una parte de la diana puede formar un bucle como una región monocatenaria entre el conector en el extremo 3' y la parte de la diana complementaria a la sonda en el extremo 3' (Figuras 13 y 14), o una parte del extremo 5' de la secuencia diana puede no hibridarse, o una parte de la secuencia de sonda 5' del oligonucleótido puede formar un bucle (Figuras 15 y 16). La adición de una polimerasa permite la extensión del extremo 3' del oligonucleótido en la diana, así como la extensión del conector del conector en el extremo 3' a través de la secuencia de identificador único, y la secuencia de identificador de paciente opcional.

Las condiciones de hibridación se eligen de modo que la hibridación de la región de sonda 3' complementaria a la secuencia del lado 3' de la diana deje la concentración local del extremo 3' del conector en la diana al nivel de su complemento, de modo que se hibrida correctamente y se extiende fácilmente con la polimerasa. Sin embargo, si hay una complementariedad insuficiente entre la sonda oligonucleotídica y el ADN diana, entonces el extremo 3' del conector en la diana no se hibridará con su complemento, y rara vez se extenderá con la polimerasa. La extensión del extremo 3' del oligonucleótido en la diana potencia la asociación de la sonda a la diana, y, por lo tanto, aumenta la capacidad del extremo 3' del conector de hibridarse correctamente con su complemento y extenderse con la polimerasa. La actividad de escisión por nucleasa 5 '^3 ' de la polimerasa (o nucleasa Fen) escinde una base coincidente solapante en el extremo 5' de la diana en o cerca de la posición en donde el lado 5' de la diana es complementario a la parte 5' de la sonda, dejando un fosfato 5' competente para ligamiento de la diana auténtica. La polimerasa también extiende el oligonucleótido en la diana, y genera un fosfato 5' competente para ligamiento (lado izquierdo de las Figuras 13 y 15, etapa D), o no escinde el grupo de bloqueo en el extremo 5' del oligonucleótido (lado derecho de las Figuras 13 y 15, etapa D).

La ligasa sella covalentemente los extremos 3' extendidos al fosfato 5' competente para ligamiento para crear productos de ligamiento circulares. El grupo de bloqueo evita la circularización de la sonda oligonucleotídica (Figuras 13 y 15, etapa D, lado derecho), o alternativamente, se introduce una mella en el enlace escindible (por ejemplo, escisión con UDG de dU, seguida de escisión de la cadena principal apurínica con endonucleasa AP, Figuras 13 y 15, etapa D, lado izquierdo). La adición opcional de Uracil-ADN glicosilasa (UDG) y Formamidopirimidina-ADN glicosilasa (Fpg, también conocida como 8-oxoguanina ADN glicosilasa, que actúa como una N-glicosilasa y como una AP-liasa) se puede usar para mellar dianas que contienen bases dañadas. A continuación, se añade(n) exonucleasa(s) para digerir todos los productos no ligados o mellados dejando solo el ADN circular monocatenario deseado que comprende el ADN diana original con una secuencia de identificador único. Este producto es adecuado para la amplificación por círculo rodante y secuenciación circular, o para secuenciación SMRT directa.

Este enfoque requiere una enzima con actividad de nucleasa 5 '^3 ' dependiente de diana de modo que el fosfato 5' competente para ligamiento se genere solo cuando haya una hibridación y complementariedad adecuadas entre la región de sonda en el extremo 5' y la región diana en el extremo 5'. Cuando se usa polimerasa con actividad de escisión por nucleasa 5 '^3', el desafío es evitar que la polimerasa extienda el conector corto a lo largo de la región de sonda en el extremo 5' de modo que destruya la región diana en el extremo 5' (es decir, traducción de mellas) sin una etapa de ligamiento. La traducción de mellas que destruye el ADN diana original y lo sustituye por ADN extendido puede introducir sin darse cuenta un error de polimerasa que se podría propagar y se podría denominar mutación erróneamente. Esto se puede minimizar usando una mezcla de polimerasas, con y sin actividad de escisión por nucleasa 5 '^3 ' (por ejemplo, en una relación de 1:20) en condiciones de extensión distributiva en presencia de ligasa de modo que la mayor parte de la extensión se realice con polimerasa sin actividad de nucleasa hasta que se requiera polimerasa con actividad nucleasa para crear la unión competente para ligamiento, seguida de disociación por polimerasa, y un suceso de ligamiento para generar el producto de ligamiento circular deseado.

El ADNcf, con tamaños en el intervalo de 140 a 170 nucleótidos, refleja la escisión del ADN cromosómico alrededor de las unidades de nucleosomas. Tales sucesos de escisión en cierto modo pueden ser en fase, o más aleatorios, generando un número de fragmentos que se pueden distribuir de manera uniforme o desigual. Por lo tanto, existe la necesidad de diseñar sondas oligonucleotídicas que darán cobertura independiente de dónde se rompa el fragmento.

Las Figuras 90 a 93 proporcionan algunos ejemplos de diferentes diseños de sonda oligonucleotídica para cubrir fragmentos en una región de 250 bases. En estas figuras, el fragmento diana potencial (desplazado 10 bases en una región) está representado por una barra de color gris oscuro, los conectores por una barra corta de color negro, las regiones de la sonda como barras de color gris claro, el identificador de secuencia único y el identificador de paciente opcional como una línea más gruesa de color negro, y la conexión entre dos secuencias dibujada esquemáticamente como una línea más fina. Las Figuras 100 y 101 ilustran cómo se podrían diseñar múltiples sondas para cubrir aproximadamente una región de 500 bases contiguas.

En la Figura 90, la región de sonda en el extremo 5' en dirección 5' (60 bases) es complementaria a las bases diana 50-110, mientras que la región de sonda en el extremo 3' en dirección 3' (20 bases) es complementaria a las bases diana 140-160. Para los fines de este ejemplo, el conector tiene 10 bases, y la secuencia del identificador compuesto tiene 20 bases (12 bases para el identificador de secuencia y 8 bases para el identificador de paciente). Cuando la diana va de la posición 1 a 160, este diseño de sonda permitirá la circularización de un producto de 140 bases, de las cuales 110 bases, es decir, de las posiciones 50 a 160, proporcionan información de la secuencia diana. Cuando la diana va de la posición 11 a 170, este diseño de sonda permitirá la circularización de un producto de 150 bases, de las cuales 120 bases, es decir, de las posiciones 50 a 170, proporcionan información de la secuencia diana. Con este diseño, las 160 bases máximas de información de secuencia se obtendrán a partir de la diana comenzando de las posiciones 51 a 81 y terminando en las posiciones 210 a 240 respectivamente. En la figura, cuando la diana va de la posición 61 a 250, no hay formación de producto circular. Sin embargo, se podría formar algún producto, debido a la región de complementariedad más corta entre la región de sonda en el extremo 5' y el lado 5' de la diana, aunque existe la preocupación de que no siempre se hibridarán. Además, con este diseño, existe la preocupación de que la región "en bucle" de la diana de 90 bases en el lado 3' pueda ser demasiado larga para permitir la hibridación eficaz del extremo 3' del conector con su complemento en el oligonucleótido (barras cortas de color negro en el lado derecho de la ilustración).

En la Figura 91, la región de sonda en el extremo 5' en dirección 5' (80 bases) es complementaria a las bases diana 30-110, mientras que la región de sonda en el extremo 3' en dirección 3' (20 bases) es complementaria a las bases diana 140-160. Esta figura es similar a la Figura 90, excepto porque la región de sonda en el extremo 5' es más larga. Para los primeros 4 ejemplos de dianas, el oligonucleótido más largo permite la captura de más ADN diana, de modo que los círculos resultantes contienen 20 bases adicionales de ADN diana original.

Las Figuras 100 y 101 ilustran cómo diseñar sondas oligonucleotídicas con una estrategia de mosaico solapante para secuenciar regiones contiguas más grandes (en el presente documento se muestran aproximadamente 500 bases). La Figura 100 ilustra cuatro sondas "consecutivas" que usan el diseño de la Figura 90, mientras que la Figura 101 ilustra cuatro sondas "consecutivas" que usan el diseño de la Figura 91. Se ilustran fragmentos potenciales de 160 pb que se podrían generar en la región (desplazados 10 bases). Debajo se muestra el oligonucleótido que podría cubrir todos esos fragmentos anteriores. Si el área en la diana está en color gris claro, no proporcionará información de secuencia fiable. Si el área en la diana está en color gris oscuro, podría proporcionar una buena información de secuencia. En este diagrama, las sondas enumeradas se designan secuencialmente como n.° 1, n.° 2, n.° 3, n.° 4, etc. Para las etapas de extensión multiplexada-ligamiento, las sondas impares n.° 1, n.° 3, n.° 5 se agrupan en un primer grupo de oligonucleótidos, y a continuación, las sondas pares n.° 2, n.° 4, n.° 6 se agrupan en un segundo grupo. Este enfoque evita que los oligonucleótidos contiguos (es decir, n.° 1 y n.° 2) compitan por unirse a la misma hebra diana. Una vez que se ha llevado a cabo la extensión - circularización, los dos grupos se pueden combinar y se puede proceder a las etapas de exonucleasa y etapas posteriores, tales como amplificación por círculo rodante y secuenciación circular, o secuenciación SMRT directa.

Protocolo detallado (V1.1) para detección de alta sensibilidad de mutaciones de una sola base, mutaciones por inserciones pequeñas, o deleciones pequeñas (cuando están presentes en un 1 % a un 0,01 %), en genes conocidos (por ejemplo, Braf, K-ras, p53):

1.1. a. Comenzando con ADNcf (o por ejemplo ADN genómico aislado de CTC, cortado a aproximadamente 150 pb), reparar los extremos con polimerasa T4 y quinasa T4, y posteriormente se añade una protuberancia A en el extremo 3' de una sola base con Klenow (exo-) y dATP. Los conectores tienen una protuberancia T en el extremo 3' de una sola base, de modo que el ligamiento usando ligasa T4 añade conectores en ambos extremos del fragmento. Opcionalmente, purificar el ADN diana del conector sin ligar.

1.1. b. Desnaturalizar los conectores que contienen ADN diana en ambos extremos (94 °C, 1 minuto) en presencia de sondas oligonucleotídicas (que comprenden una región de sonda en el extremo 5' complementaria a las secuencias en el lado 5' de las dianas, una secuencia de identificador único, una secuencia de identificador de paciente opcional, una secuencia complementaria al extremo 3' del conector, y una región de sonda en el extremo 3' complementaria a las secuencias en el lado 3' de las dianas), y permitir que los oligonucleótidos se hibriden con sus regiones complementarias en los fragmentos deseados mediante enfriamiento a una temperatura deseada (por ejemplo, 50 °C durante 2 horas). La polimerasa Taq y la ligasa termoestable (preferentemente de la cepa AK16D), los dNTP y KlenTaq (polimerasa Taq que carece de actividad de nucleasa) opcional se añaden después de la etapa de hibridación, o al comienzo del procedimiento. Permitir la extensión y el ligamiento a la temperatura de hibridación, y, opcionalmente, aumentar la temperatura (por ejemplo, 60 °C) para garantizar la finalización de la extensión y el ligamiento, para generar productos circulares.

1.1. c. Opcionalmente, escindir la hebra de la sonda oligonucleotídica en un enlace escindible (por ejemplo, U escindido usando UDG y endonucleasa AP). Añadir Exonucleasa I (digiere el ADN monocatenario en la dirección 3'^5'), y Exonucleasa III (digiere el ADN bicatenario en la dirección 3'^5'), para digerir todos los productos sin ligar o mellados, dejando solo el ADN monocatenario circular deseado que comprende el ADN diana original, la secuencia del conector, la secuencia de identificador único, y una secuencia de identificador de paciente opcional. Este producto es adecuado para la amplificación por círculo rodante (usando cebadores hexaméricos aleatorios con polimerasa phi-29) para crear repeticiones en tándem de la secuencia deseada, y posterior identificación de las dianas usando secuenciación de nueva generación, o alternativamente, secuenciación SMRT directa en el molde cerrado covalentemente, usando la secuencia del conector como un sitio de unión a cebador.

Nota 1: La sonda oligonucleotídica puede contener un grupo de bloqueo opcional en el lado 5' para interferir con la posterior actividad de nucleasa 5 '^3 ' de la polimerasa, de modo que la sonda oligonucleotídica no se circularice. Alternativamente, en la sonda oligonucleotídica original se puede incluir un enlace escindible. Nota 2: Para generar el fosfato 5' competente para ligamiento en el lado 5' de la diana se puede usar la nucleasa Fen en lugar de la polimerasa con actividad de nucleasa 5'^3'.

Nota 3: Se puede usar una mezcla 1:20 de polimerasa Taq (con actividad de nucleasa 5 '^3 ') y KlenTaq (polimerasa Taq sin actividad de escisión por nucleasa 5 '^3 ' en condiciones de extensión distributiva (es decir, concentración de sal más elevada) para minimizar la degradación del ADN diana por traducción de mellas.

Nota 4: El proceso de extensión y ligamiento se puede llevar a cabo en dos o más tubos de reacción, conteniendo un conjunto las sondas con numeración "impar", conteniendo el segundo conjunto las sondas con numeración "par" para evitar que las sondas compitan por las mismas hebras de ADN diana. Las reacciones separadas se pueden agrupar posteriormente.

Variación 1.2. (Figuras 17-18). En esta variación, el objetivo es capturar toda la secuencia de ADN diana, independientemente de donde se una la sonda a la diana. Como anteriormente, los conectores cortos se ligan a la diana de ADN (ADNcf con una longitud promedio de aproximadamente 160 bases). Para capturar las regiones deseadas, las sondas oligonucleotídicas que comprenden una región de sonda en el extremo 5' complementaria a las secuencias en el lado 5' de la diana, una secuencia complementaria al extremo 5' del conector, una secuencia de identificador único, una secuencia de identificador de paciente opcional, una secuencia complementaria al extremo 3' del conector, y una región de sonda en el extremo 3' complementaria a las secuencias en el lado 3' de la diana, se hibridan con la diana. La sonda oligonucleotídica puede contener un grupo de bloqueo opcional en un extremo (se muestra el extremo 5'), o un conector escindible opcional. Dependiendo del diseño de la sonda y de las bases de inicio y finalización del fragmento diana, una parte de la secuencia diana o de la secuencia de la sonda puede formar un bucle como una región monocatenaria entre el conector en el extremo 3' y la parte de la diana complementaria a la sonda en el extremo 3', así como el conector en el extremo 5' y la parte de la diana complementaria a la sonda en el extremo 5' (Figura 17). La adición de una polimerasa permite la extensión del extremo 3' del oligonucleótido en la diana, así como la extensión del conector del conector en el extremo 3' a través de la secuencia de identificador único, y la secuencia de identificador de paciente opcional hasta que sea contiguo al conector en el extremo 5' en la diana.

Las condiciones de hibridación se eligen de modo que la hibridación de la región de la sonda en el extremo 3' complementaria a las secuencias del lado 3' de la diana lleva la concentración local del extremo 3' del conector en la diana, de modo que se hibrida correctamente y se extiende fácilmente con la polimerasa. El extremo 5' del conector se puede diseñar para que sea ligeramente más largo, de modo que una vez que la polimerasa extiende el conector en el extremo 3', no se extienda a través de la secuencia complementaria del conector en el extremo 5' hasta que llegue a la parte de la diana en el extremo 5' que se hibrida con la región de sonda en el extremo 5'. Sin embargo, el efecto de hibridación "combinada" de las regiones tanto del conector en el extremo 3' como del conector en el extremo 5' con sus complementos en la sonda oligonucleotídica debería tener una Tm por debajo de la temperatura de hibridación, de modo que la hibridación aleatoria de la diana incorrecta a la sonda oligonucleotídica raramente, si se produce, da como resultado extensión y ligamiento para dar un producto circular.

Esta variación requiere que la sonda oligonucleotídica contenga secuencias complementarias a ambas hebras del conector en los extremos 3' y 5', estando dichas secuencias separadas por solo aproximadamente 20 bases. Dado que las secuencias son complementarias a las hebras de conector, que a su vez son complementarias entre sí, es necesario evitar el autoemparejamiento de la sonda oligonucleotídica. Una solución es ligar los conectores que contienen una burbuja interna, de modo que los dos conectores retienen el carácter bicatenario a la baja temperatura usada para el ligamiento del conector (16 °C o incluso 4 °C con ligasa T4). Además el conector en el extremo 5' se puede diseñar para que sea más largo que el conector en el extremo 3'. Por último, las regiones de complementariedad dentro del conector se pueden diseñar para que tengan emparejamientos erróneos sutiles o un análogo de nucleótido (es decir, G:T y T:G; o I:A) que son más desestabilizadores en la sonda oligonucleotídica complementaria (es decir, C:A y A:C; o C:T) de modo que es menos probable que la sonda oligonucleotídica forme el autoemparejamiento interno con un bucle a la temperatura de hibridación global (es decir, 50 °C).

Por ejemplo, un emparejamiento erróneo I:A en el medio de un tramo A en un conector podría reducir la Tm en 2,4 °C en comparación con una coincidencia T:A, mientras que el emparejamiento erróneo complementario en el oligonucleótido, C:T reduce la Tm en 10,1 °C (una diferencia de 7,7 °C). Del mismo modo, un emparejamiento erróneo G:T en el medio de un tramo A en un conector podría reducir la Tm en 10,2 °C en comparación con una coincidencia G:C, mientras que el emparejamiento erróneo complementario en el oligonucleótido, A:C, reduce la Tm en 18,0 °C (una diferencia de 7,8 °C). Véase Kawase et al., "Studies on nucleic acid interactions. I. Stabilities of miniduplexes (dG2A4XA4G2-dC2T4YT4C2) and self-complementary d(GGGAAXYTTCCC) containing deoxyinosine and other mismatched bases", Nucleic Acids Res. 14(19):7727-36 (1986)). Por lo tanto, se podría predecir que la colocación de ambos emparejamientos erróneos dentro del conector disminuirá la Tm del autoemparejamiento del oligonucleótido en aproximadamente 15,5 °C en comparación con el autoemparejamiento del conector. El valor exacto puede variar basándose en el contexto de la secuencia, sin embargo, para los expertos en la materia debería ser evidente que el uso de los emparejamientos erróneos I:A y G:T en un dúplex conector-ADN que permanece bicatenario a la temperatura de ligamiento de 4 °C o 16 °C, podría ser más que suficiente para garantizar que las secuencias complementarias, separadas por aproximadamente 20 bases dentro de un oligonucleótido no se autoemparejarían (es decir, una horquilla con un bucle de 20 bases) a una temperatura de hibridación más elevada de 50 °C.

La extensión del extremo 3' del oligonucleótido en la diana potencia la asociación de la sonda a la diana, y, por lo tanto, aumenta la capacidad del extremo 3' del conector de hibridarse correctamente con su complemento y extenderse con la polimerasa. La actividad de escisión por nucleasa 5 '^3 ' de la polimerasa (o nucleasa Fen) escinde una base coincidente solapante en el extremo 5' del conector en el extremo 5', dejando fosfato 5' competente para ligamiento en el conector. La polimerasa también extiende el oligonucleótido en la diana, y genera un fosfato 5' competente para ligamiento o no escinde el grupo de bloqueo en el extremo 5' del oligonucleótido.

La ligasa sella covalentemente los extremos 3' extendidos al fosfato 5' competente para ligamiento para crear productos de ligamiento circulares. El grupo de bloqueo evita la circularización de la sonda oligonucleotídica, o alternativamente, se introduce una mella en el enlace escindible (por ejemplo, escisión con UDG de dU, seguida de escisión de la cadena principal apurínica con endonucleasa AP). La adición opcional de Uracil-ADN glicosilasa (UDG) y Formamidopirimidina-ADN glicosilasa (Fpg, también conocida como 8-oxoguanina ADN glicosilasa, que actúa como una N-glicosilasa o como una AP-liasa) se puede usar para mellar dianas que contienen bases dañadas. A continuación, se añade(n) exonucleasa(s) para digerir todos los productos no ligados o mellados dejando solo el ADN circular monocatenario deseado que comprende el ADN diana original con una secuencia de identificador único. Este producto es adecuado para la amplificación por círculo rodante y secuenciación circular, o para secuenciación SMRT directa.

El desafío aquí es evitar que la polimerasa extienda el conector en el extremo 3' de modo que destruya el conector en el extremo 5' sin una etapa de ligamiento (es decir, traducción de mellas). Esto se puede conseguir incorporando enlaces tiofosfato en la 2a y 3a posiciones desde el extremo fosfato 5', (que se liberarán por la actividad de nucleasa 5 '^3 ' de la polimerasa). Para minimizar el desplazamiento de la polimerasa de esas bases a medida que extiende una base en exceso (lo que podría hacer imposible el ligamiento al conector en dirección 3'), las bases de la diana en la unión de ligamiento podrían ser preferentemente ricas en AT en el lado 3', y ricas en GC en el lado 5'.

Un enfoque alternativo es usar un conector en el extremo 5' que contenga un sitio apurínico (AP) en la posición contigua al fosfato 5' deseado. Este fosfato 5' se libera usando una EndolII termoestable (tal como Tma EndolII). Esta enzima escinde los sitios AP dejando un fosfato 5' cuando el conector está unido a la diana. La endonucleasa también escinde el conector monocatenario, pero con menor eficacia, y, por lo tanto, el conector hibridado al molde podría ser el sustrato preferente. Cuando se usa EndoIII termoestable, la polimerasa de PCR usada podría carecer de la actividad de exonucleasa 5'^3'.

Como se ha mencionado anteriormente, el problema de la traducción de mellas también se puede minimizar usando una mezcla de polimerasas, con y sin actividad de escisión por nucleasa 5 '^3 ' (por ejemplo, en una relación de 1:20) en condiciones de extensión distributiva en presencia de ligasa de modo que la mayor parte de la extensión se realice con polimerasa sin actividad de nucleasa hasta que se requiera polimerasa con actividad nucleasa para crear la unión competente para ligamiento, seguida de disociación por polimerasa, y un suceso de ligamiento para generar el producto de ligamiento circular deseado.

Las Figuras 94 y 95 proporcionan algunos ejemplos de diferentes diseños de sonda oligonucleotídica para cubrir fragmentos en una región de 250 bases. En estas figuras, el fragmento diana potencial (desplazado 10 bases en una región) está representado por una barra de color gris oscuro, los conectores por una barra corta de color negro, las regiones de la sonda como barras de color gris claro, el identificador de secuencia único y el identificador de paciente opcional como una línea más gruesa de color negro, y la conexión entre dos secuencias dibujada esquemáticamente como una línea más fina. Las Figuras 102 y 103 ilustran cómo se podrían diseñar múltiples sondas para cubrir aproximadamente una región de 500 bases contiguas.

En la Figura 94, la región de sonda en el extremo 5' en dirección 5' (50 bases) es complementaria a las bases diana 50-100, mientras que la región de sonda en el extremo 3' en dirección 3' (50 bases) es complementaria a las bases diana 150-200. Para los fines de este ejemplo, el conector en el extremo 3' tiene 10 bases, y la secuencia del identificador compuesto tiene 20 bases (12 bases para el identificador de secuencia y 8 bases para el identificador de paciente) y el conector en el extremo 5' se ilustra como 10 bases, aunque en otra realización podría ser algo más largo, de aproximadamente 12 a 18 bases. Cuando la diana va de la posición 1 a 160, este diseño de sonda permitirá la circularización de un producto de 200 bases, de las cuales las 160 bases proporcionan información de la secuencia diana. Estas sondas están diseñadas de modo que, independientemente del lugar en donde se encuentre la diana, desde 1 a 160 hasta 91 a 250, aún deberían formar productos de extensión que se circularicen para formar productos de aproximadamente 200 bases.

En la Figura 95, la región de sonda en el extremo 5' en dirección 5' (60 bases) es complementaria a las bases diana 40-100, mientras que la región de sonda en el extremo 3' en dirección 3' (60 bases) es complementaria a las bases diana 140-200. Esta figura es similar a la Figura 94, excepto porque ambas regiones de sonda en los extremos 3' y 5' son más largas. Este diseño de sonda puede ser más eficaz para capturar dianas en los extremos (es decir, dianas 1 a 160; 11 a 170; 81 a 240; y 91 a 250).

Las Figuras 102 y 103 ilustran cómo diseñar sondas oligonucleotídicas con una estrategia de mosaico solapante para secuenciar regiones contiguas más grandes (en el presente documento se muestran aproximadamente 500 bases). La Figura 102 ilustra cuatro sondas "consecutivas" que usan el diseño de la Figura 94, mientras que la Figura 103 ilustra cuatro sondas "consecutivas" que usan el diseño de la Figura 95. Se ilustran fragmentos potenciales de 160 pb que se podrían generar en la región (desplazados 10 bases). Debajo se muestra el oligonucleótido que podría cubrir todos esos fragmentos anteriores. En este diagrama, las sondas enumeradas se designan secuencialmente como n.° 1, n.° 2, n.° 3, n.° 4 etc. Para las etapas de extensión multiplexada-ligamiento, las sondas impares n.° 1, n.° 3, n.° 5 se agrupan en un primer grupo de oligonucleótidos, y a continuación, las sondas pares n.° 2, n.° 4, n.° 6 se agrupan en un segundo grupo. Este enfoque evita que los oligonucleótidos contiguos (es decir, n.° 1 y n.° 2) compitan por unirse a la misma hebra diana. Una vez que se ha llevado a cabo la extensión - circularización, los dos grupos se pueden combinar y se puede proceder a las etapas de exonucleasa y etapas posteriores, tales como amplificación por círculo rodante y secuenciación circular, o secuenciación SMRT directa.

Protocolo detallado (V1.2) para detección de alta sensibilidad de mutaciones de una sola base, mutaciones por inserciones pequeñas, o deleciones pequeñas (cuando están presentes en un 1 % a un 0,01 %), en genes conocidos (por ejemplo, Braf, K-ras, p53):

1.2. a. Comenzando con ADNcf (o por ejemplo ADN genómico aislado de células tumorales circulantes (CTC), cortado a aproximadamente 150 pb), reparar los extremos con polimerasa T4 y quinasa T4, y posteriormente se añade una protuberancia A en el extremo 3' de una sola base con Klenow (exo-) y dATP. Los conectores tienen una protuberancia T en el extremo 3' de una sola base, de modo que el ligamiento usando ligasa T4 a 4 °C añade conectores en ambos extremos del fragmento. Opcionalmente, purificar el ADN diana del conector sin ligar.

1.2. b. Desnaturalizar los conectores que contienen ADN diana en ambos extremos (94 °C, 1 minuto) en presencia de sondas oligonucleotídicas (que comprenden una región de sonda en el extremo 5' complementaria a las secuencias en el lado 5' de las dianas, una secuencia complementaria al extremo 5' del conector, una secuencia de identificador único, una secuencia de identificador de paciente opcional, una secuencia complementaria al extremo 3' del conector, y una región de sonda en el extremo 3' complementaria a las secuencias en el lado 3' de las dianas), y permitir que los oligonucleótidos se hibriden con sus regiones complementarias en los fragmentos deseados mediante enfriamiento a una temperatura deseada (por ejemplo, 50 °C durante 2 horas). La polimerasa Taq y/o KlenTaq (polimerasa Taq que carece de actividad nucleasa), y ligasa termoestable (preferentemente de la cepa AK16D), y los dNTP se añaden después de la etapa de hibridación, o al comienzo del procedimiento. Permitir la extensión y el ligamiento a la temperatura de hibridación, y, opcionalmente, aumentar la temperatura (por ejemplo, 60 °C) para garantizar la finalización de la extensión y el ligamiento, para generar productos circulares.

1.2. c. Opcionalmente, escindir la sonda oligonucleotídica en un enlace escindible (por ejemplo, U escindido usando UDG y endonucleasa AP). Añadir Exonucleasa I (digiere el ADN monocatenario en la dirección 3'^5'), y Exonucleasa III (digiere el ADN bicatenario en la dirección 3'^5'), para digerir todos los productos sin ligar o mellados, dejando solo el ADN monocatenario circular deseado que comprende el ADN diana original, la secuencia del conector, la secuencia de identificador único, y una secuencia de identificador de paciente opcional. Este producto es adecuado para la amplificación por círculo rodante (usando cebadores hexaméricos aleatorios con polimerasa phi-29) para crear repeticiones en tándem de la secuencia deseada, y posterior identificación de las dianas usando secuenciación de nueva generación, o alternativamente, secuenciación SMRT directa en el molde cerrado covalentemente, usando la secuencia del conector como un sitio de unión a cebador.

Nota 1: El oligonucleótido puede contener un grupo de bloqueo opcional en el lado 5' para interferir con la posterior actividad de nucleasa 5 '^3 ' de la polimerasa, de modo que la sonda oligonucleotídica no se circularice. Alternativamente, un enlace escindible se puede incluir en el oligonucleótido original.

Nota 2: Para generar el fosfato 5' competente para ligamiento en el lado 5' de la diana se puede usar la nucleasa Fen en lugar de la polimerasa con actividad de nucleasa 5'^3'.

Nota 3: El conector en el extremo 5' se puede sintetizar para que contenga enlaces tiofosfato en la 2a y 3a posiciones desde el extremo fosfato 5', (que se liberarán por la actividad de nucleasa 5 '^3 ' de la polimerasa). Para minimizar el desplazamiento de la polimerasa de esas bases a medida que extiende una base en exceso (lo que podría hacer imposible el ligamiento al conector en dirección 3'), las bases de la diana en la unión de ligamiento podrían ser preferentemente ricas en AT en el lado 3', y ricas en GC en el lado 5'.

Nota 4: Cuando se usa la polimerasa KlenTaq (polimerasa Taq sin actividad de escisión por nucleasa 5'^3'), el conector en el extremo 5' se puede sintetizar para que contenga un sitio apurínico (AP) en la posición contigua al fosfato 5' deseado. Este fosfato 5' se libera usando una EndoIII termoestable (tal como Tma EndoIII). Esta enzima escinde los sitios AP dejando un fosfato 5' cuando está unido a la diana. La endonucleasa también escinde el oligonucleótido monocatenario, pero con menor eficacia, y, por lo tanto, el conector hibridado al molde podría ser el sustrato preferente.

Nota 5: Cuando se usa la polimerasa KlenTaq (polimerasa Taq sin actividad de escisión por nucleasa 5'^3'), el conector en el extremo 5' se puede sintetizar para que contenga un fosfato 5'. Alternativamente, el fosfato 5' se puede añadir usando quinasa T4 antes del ligamiento al ADN diana, o después de esa etapa de ligamiento.

Nota 6: Se puede usar una mezcla 1:20 de polimerasa Taq (con actividad de nucleasa 5 '^3 ') y KlenTaq (polimerasa Taq sin actividad de escisión por nucleasa 5 '^3 ') en condiciones de extensión distributiva (es decir, concentración de sal más elevada) para minimizar la degradación del ADN diana por traducción de mellas.

Nota 7: El proceso de extensión y ligamiento se puede llevar a cabo en dos o más tubos de reacción, conteniendo un conjunto las sondas con numeración "impar", conteniendo el segundo conjunto las sondas con numeración "par" para evitar que las sondas compitan por las mismas hebras de ADN diana. Las reacciones separadas se pueden agrupar posteriormente.

Nota 8: Los oligonucleótidos iSx-003-ShAdT (hebra superior) e iSx-004-pShAdB (hebra inferior) proporcionan ejemplos de conectores que contienen protuberancias "T" en el extremo 3' de una sola base (véase la Tabla 1). Los oligonucleótidos iSx-006-MdAdT (hebra superior), e iSx-007-pMdAdB (hebra inferior) proporcionan ejemplos de conectores ligeramente más largos, para potenciar la unión a la región del conector (véase la Tabla 1). Los conectores iSx-003-ShAdT e iSx-006-MdAdT (véase la Tabla 1) pueden contener grupos tiofosfato opcionales cerca del extremo 5' para evitar la traducción de mellas y facilitar la circularización de las dianas con los extremos del conector. Los conectores iSx-004-pShAdB e iSx-007-pMdAdB (véase la Tabla 1) pueden contener grupos tiofosfato opcionales cerca o en el extremo 3' para evitar la degradación si se usa una polimerasa con actividad de corrección de errores, y facilitar la circularización de las dianas con los extremos de conector.

Nota 9: Si no se añade una base extra al ADN diana (es decir, omitiendo la etapa de Klenow), entonces se usa un ligamiento de extremo romo. Para evitar el ligamiento de conector a conector, el extremo romo del conector está sin fosforilar. Los oligonucleótidos iSx-003-ShAdT (hebra superior) e iSx-005-ShAdB (hebra inferior) proporcionan ejemplos de conectores que contienen extremos romos (véase la Tabla 1).

Nota 10: Cuando se diseñan oligonucleótidos para su uso con secuencias de conector más largas, que comprenden secuencias de "código de barras" o "indexación" para su uso con instrumentos comerciales, puede ser necesario ensamblar el oligonucleótido usando PCR, amplificación de desplazamiento de hebra, o una combinación de las mismas. Durante la PCR, el uso de dUTP en lugar de TTP incorpora uracilo, adecuado para su posterior escisión con UDG. El cebador de hebra inversa puede estar fosforilado, permitiendo su digestión usando exonucleasa lambda o una exonucleasa 5 '^3 ' similar. Una secuencia de dA30 se puede añadir al extremo 5' del cebador directo, lo que permite la amplificación por desplazamiento de hebra. En la Tabla 1 (a continuación) se muestran ejemplos de oligonucleótidos adecuados para ensamblaje y amplificación para la secuenciación de regiones de KRAS, BRAF y exones 5-8 de TP53 que contienen mutaciones en puntos calientes (hotspot) e incluyen los siguientes: (i) regiones diana directa e inversa de KRAS (iSx-001-bkA30, iSx-016-bkA30-KRSF11, iSx-017-pKRSF12, iSx-008-701F, iSx-009-501R, iSx-018-pKRSF13, e iSx-018-pKRSR14) e (iSx-015-pKRSF10, iSx-017-pKRSF12, iSx-008-701F, iSx-009-501R, iSx-018-pKRSF13, iSx-019-bkA30-KRSR15, e iSx-001-bkA30); (ii) regiones diana directa e inversa de BRAF (iSx-001-bkA30, iSx-023-bkA30-BRF-F11, iSx-024-pBRF-F12, iSx-008-701F, iSx-009-501R, iSx-025-pBRF-F13, e iSx-026-pBRF-R14) e (iSx-022-pBRF-F10, iSx-024-pBRF-F12, iSx-008-701F, iSx-009-501R, iSx-025-pBRF-F13, iSx-027-bkA30-pBRF-R15, e iSx-001-bkA30); (iii) regiones diana directa e inversa del exón 5 de TP53 en dirección 5' (iSx-001-bkA30, iSx-035-bkA30-pTP53e5F11, iSx-036-pTP53e5F12, iSx-008-701F, iSx-009-501R, iSx-037-pTP53e5F13, iSx-038-pTP53e5R14) e (iSx-034-pTP53e5F10, iSx-036-pTP53e5F12, iSx-008-701F, iSx-009-501R, iSx-037-pTP53e5F13, iSx-039-bkA30-TP53e5R15, e iSx-001-bkA30); (iv) regiones diana directa e inversa del exón 5 de TP53 en dirección 3' (iSx-001-bkA30, iSx-043-bkA30-TP53e5F21, iSx-044-pTP53e5F22, iSx-008-701F. iSx-009-501R, iSx-045-pTP53e5F23, e iSx-046-pTP53e5R24) e (iSx-042-pTP53e5F20, iSx-044-pTP53e5F22, iSx-008-701F. iSx-009-501R, iSx-045-pTP53e5F23, iSx-047-bkA30-TP53e5R25 e iSx-001-bkA30); (v) regiones diana directa e inversa del exón 6 de TP53 (iSx-001-bkA30, iSx-053-bkA30-TP53e6F31, iSx-054-pTP53e6F32, iSx-008-701F, iSx-009-501R, iSx-055-pTP53e6F33, e iSx-056-pTP53e6R34) e (iSx-052-pTP53e6F30, iSx-054-pTP53e6F32, iSx-008-701F, iSx-009-501R, iSx-055-pTP53e6F33, iSx-057-bkA30-TP53e6R35, e iSx-001-bkA30); (vi) regiones diana directa e inversa del exón 7 de TP53 (iSx-001-bkA30, iSx-063-bkA30-TP53e7F41, iSx-064-pTP53e7F42, iSx-008-701F, iSx-009-501R, iSx-065-pTP53e7F43, e iSx-066-pTP53e7R44) e (iSx-062-pTP53e7F40, iSx-064-pTP53e7F42, iSx-008-701F, iSx-009-501R, iSx-065-pTP53e7F43, iSx-067-pTP53e7R45, e iSx-001-bkA30); y (vii) regiones diana directa e inversa del exón 8 de TP53 (iSx-001-bkA30, iSx-073-bkA30-TP53e8F51, iSx-074-pTP53e8F52, iSx-008-701F, iSx-009-501R, iSx-075-pTP53e8F53, e iSx-076-pTP53e8R54) e (iSx-072-pTP53e8F50, iSx-074-pTP53e8F52, iSx-008-701F, iSx-009-501R, iSx-075-pTP53e8F53, iSx-077-bkA30-TP53e8R55, e iSx-001-bkA30).

Nota 11: Después de generar los productos circulares que comprenden regiones diana de KRAS, BRAF, y los exones 5-8 de TP53 que contienen mutaciones en puntos calientes, estas regiones se pueden someter a amplificación por círculo rodante usando cebadores específicos de diana para generar productos de repetición en tándem. Estos productos se pueden generar antes o después de la captura de las dianas deseadas con oligonucleótidos específicos de diana sobre un soporte sólido (véase la nota 12 a continuación). Los cebadores pueden contener una base nucleotídica escindible interna o un sitio abásico tal como 1,2'-didesoxirribosa (dSpacer), lo que permite la incorporación de dUTP durante la amplificación por círculo rodante para protección contra la contaminación por arrastre. Los ejemplos de tales cebadores se muestran en la Tabla 1 que sigue a continuación e incluyen los siguientes: (i) cebadores directos e inversos de KRAS (iSx-108-KRS-rcF26, iSx-109-KRS-rcR27); (ii) cebadores directos e inversos de BRAF (iSx-118-BRF-rcF26, iSx-119-BRF-rcR27); (iii) cebadores directos e inversos del exón 5 de TP53 (iSx-128-TP53e5- rcF66, iSx-129-TP53e5-rcR67; iSx-130-TP53e5-rcF68, iSx-131-TP53e5-rcR69); (iv) cebadores directos e inversos del exón 6 de TP53 (iSx-138-TP53e6-rcF76, iSx-139-TP53e6-rcR77); (v) cebadores directos e inversos del exón 7 de TP53 (iSx-148-TP53e7-rcF86, iSx-149-TP53e7-rcR87); y (vi) cebadores directos e inversos del exón 8 de TP53 (iSx-158-TP53e8-rcF96, iSx-159-TP53e8-rcR97).

Nota 12: Después de generar los productos circulares que comprenden regiones diana de KRAS, BRAF, y los exones 5-8 de TP53 que contienen mutaciones en puntos calientes, y/o generar productos de repetición en tándem, estos productos se pueden capturar mediante hibridación con oligonucleótidos más largos, que contienen un grupo de captura adecuado para la captura posterior sobre un soporte sólido. Los ejemplos de tales cebadores, que contienen grupos biotina adecuados para captura a través de superficies sólidas recubiertas con estreptavidina se muestran en la Tabla 1 que sigue a continuación e incluyen los siguientes: (i) oligonucleótidos de captura directa e inversa de KrAs (iSx-013-KRS-bcF1, iSx-014-KRS-bcR2); (ii) oligonucleótidos de captura directa e inversa de BRAF (iSx-020-BRF-bcF1, iSx-021-BRF-bcR2); (iii) oligonucleótidos de captura directa e inversa del exón 5 de TP53 (iSx-030-TP53e5-bcF1, iSx-031-TP53e5-bcR2; iSx-032-TP53e5-bcF3, iSx-033-TP53e5-bcR4); (iv) oligonucleótidos de captura directa e inversa del exón 6 de TP53 (iSx-050-TP53e6-bcF5, iSx-051-TP53e6-bcR6); (v) oligonucleótidos de captura directa e inversa del exón 7 de TP53 (iSx-060-TP53e7-bcF7, iSx-061-TP53e7-bcR8); y (vi) oligonucleótidos de captura directa e inversa del exón 8 de TP53 (iSx-070-TP53e8-bcF9, iSx-071-TP53e8-bcR10).

Nota 13: Con los productos mencionados anteriormente generados usando los diseños de cebadores y conectores mencionados anteriormente, después de la amplificación por agolpamiento o con perlas, o captura dentro de un pocillo, dirección, o superficie de una celda de flujo en un instrumento comercial, para iniciar reacciones de secuenciación se pueden usar los siguientes cebadores: (i) iLx-003-PEsqP1, cebador de secuenciación de extremo emparejado 1; (ii) iLx-004-BrCdR1, cebador de indexación, lectura de código de barras 1; (iii) iLx-001-P5-BrCdR2, lectura de código de barras 2; y (iv) iLx-005-PEsqP2, cebador de secuenciación de extremo emparejado 2 (véase la Tabla 1 para secuencias de cebador).

Variación 1.3: (véanse por ejemplo, las Figuras 19-22). En esta variación, en lugar de ligar conectores cortos a la diana de ADN, se añade una cola de mononucleótido corta usando transferasa terminal (ADNcf con una longitud promedio de aproximadamente 160 bases). Los etapas restantes son las mismas que en las Figuras 13 y 15. Es difícil controlar cuántas bases añade la transferasa terminal. Por lo tanto, la longitud del tramo de homonucleótido (es decir, poliA) dentro del oligonucleótido determina la Tm de hibridación. Puede ser necesario usar también una polimerasa con actividad de corrección de errores en dirección 3'—^5' para retirar parte del tramo de homonucleótido en exceso hasta que esté a nivel con su complemento, y es adecuado para la extensión con polimerasa.

Variación 1.4: (véanse por ejemplo, las Figuras 23-26). En esta variación, no se añade nada a la diana de ADN (ADNcf con una longitud promedio de aproximadamente 160 bases). Para capturar las regiones deseadas, los oligonucleótidos que comprenden una región de sonda en el extremo 5' complementaria a las secuencias en el lado 5' de la diana, una secuencia de identificador único, una secuencia de identificador de paciente opcional, una secuencia de unión a cebador opcional, y una región de sonda en el extremo 3' complementaria a las secuencias en el lado 3' de la diana, se hibridan con la diana. Las regiones de sonda en los extremos 5' y 3' contienen emparejamientos erróneos opcionales a intervalos regulares (es decir, 10, 12, o 15 bases). La sonda oligonucleotídica puede contener un grupo de bloqueo opcional en un extremo (se muestra el extremo 5'), o un conector escindible opcional. Dependiendo del diseño de la sonda y de las bases de inicio y finalización del fragmento diana, una parte del extremo 5' o 3' de la secuencia diana puede no hibridarse (Figura 23). La adición de una polimerasa o un conjunto de polimerasas que contienen actividad de nucleasa tanto 3— 5' como 5— 3' permite la extensión del extremo 3' del oligonucleótido en la diana, así como la digestión opcional del extremo 3' monocatenario de la diana hasta que se deja al nivel de la región de la sonda en el extremo 3' del oligonucleótido (Figura 23), seguido por extensión del extremo 3' de la diana a través de la secuencia de identificador único, y la secuencia de identificador de paciente opcional.

Las condiciones de hibridación se eligen de modo que la hibridación de la región de sonda en el extremo 3' complementaria a la secuencia del lado 3' de la diana y la hibridación de la región de sonda en el extremo 5' complementaria a la secuencia del lado 5' de la diana se enriquecen sobre las dianas que se hibridan con un solo lado (y podrían formar un producto de extensión no productivo que podría no circularizarse). La extensión del extremo 3' de la sonda oligonucleotídica en la diana potencia la asociación de la sonda a la diana. La actividad de escisión por nucleasa 5— 3' de la polimerasa (o nucleasa Fen) escinde una base coincidente solapante en el extremo 5' de la diana en o cerca de la posición en donde el lado 5' de la diana es complementario a la parte 5' de la sonda, dejando un fosfato 5' competente para ligamiento de la diana auténtica. La polimerasa también extiende la sonda oligonucleotídica usando la diana en el molde, y genera un fosfato 5' competente para ligamiento (lado izquierdo de las Figuras 23 y 22), o no escinde el grupo de bloqueo en el extremo 5' del oligonucleótido (lado derecho de las Figuras 23 y 25).

La ligasa sella covalentemente los extremos 3' extendidos al fosfato 5' competente para ligamiento para crear productos de ligamiento circulares. El grupo de bloqueo evita la circularización de la sonda oligonucleotídica (lado derecho), o alternativamente, se introduce una mella en el enlace escindible (por ejemplo, escisión con UDG de dU, seguida de escisión de la cadena principal apurínica con endonucleasa AP, lado izquierdo). La adición opcional de Uracil-ADN glicosilasa (UDG) y Formamidopirimidina-ADN glicosilasa (Fpg, también conocida como 8-oxoguanina ADN glicosilasa, que actúa como una N-glicosilasa y como una AP-liasa) se puede usar para mellar dianas que contienen bases dañadas. A continuación, se añade(n) exonucleasa(s) para digerir todos los productos no ligados o mellados dejando solo el ADN circular monocatenario deseado que comprende el ADN diana original con una secuencia de identificador único. Este producto es adecuado para la amplificación por círculo rodante y secuenciación circular, o para secuenciación SMRT directa.

Este enfoque requiere una enzima o conjunto de enzimas con actividad de nucleasa 5 '^3 ' y 3 '^5 ' dependiente de diana de modo que el fosfato 5' competente para ligamiento se genera solo cuando hay una hibridación y complementariedad adecuadas entre la región de sonda en el extremo 5' y la región diana en el extremo 5'. Cuando se usa polimerasa con actividad de escisión por nucleasa 5'^3', el desafío es evitar que la polimerasa extienda el conector corto a lo largo de la región de sonda en el extremo 5' de modo que destruya la región diana en el extremo 5' (es decir, traducción de mellas) sin una etapa de ligamiento. La traducción de mellas que destruye el ADN diana original y lo sustituye por ADN extendido puede introducir sin darse cuenta un error de polimerasa que se podría propagar y se podría denominar mutación erróneamente. Esto se puede minimizar usando una mezcla de polimerasas, con y sin actividad de escisión por nucleasa 5 '^3 ' (por ejemplo, en una relación de 1:20) en condiciones de extensión distributiva en presencia de ligasa de modo que la mayor parte de la extensión se realice con polimerasa sin actividad de nucleasa hasta que se requiera polimerasa con actividad nucleasa para crear la unión competente para ligamiento, seguida de disociación por polimerasa, y un suceso de ligamiento para generar el producto de ligamiento circular deseado. El uso de diseño de sonda oligonucleotídica como se representa en las Figuras 25 y 26 puede obviar la necesidad de polimerasa con actividad de nucleasa 3'^5'. El uso de quinasa T4 para añadir un fosfato 5' de la diana en una reacción inicial, también se puede usar para crear un fosfato 5' competente para ligamiento, y obviar la necesidad de polimerasa con actividad de nucleasa 5'^3'.

Las Figuras 96-99 proporcionan algunos ejemplos de diferentes diseños de sonda oligonucleotídica para cubrir fragmentos en una región de 250 bases. En estas figuras, el fragmento diana potencial (desplazado 10 bases en una región) está representado por una barra de color gris oscuro, las regiones de la sonda como barras de color gris claro con líneas finas de color negro dentro de las barras de color gris que indican bases con emparejamientos erróneos, di el identificador de secuencia único y el identificador de paciente opcional como una línea más gruesa de color negro. Las Figuras 104-107 ilustran cómo se podrían diseñar múltiples sondas para cubrir aproximadamente una región de 500 bases contiguas.

En la Figura 96, la región de sonda en el extremo 5' en dirección 5' (50 bases) es complementaria a las bases diana 40-90, mientras que la región de sonda en el extremo 3' en dirección 3' (50 bases) es complementaria a las bases diana 150-200. Para los fines de este ejemplo, existen emparejamientos erróneos cada 10 bases, y la secuencia de identificador compuesto tiene 20 bases (12 bases para el identificador de secuencia y 8 bases para el identificador de paciente). Cuando la diana va de la posición 1 a 160, este diseño de sonda permitirá la circularización de un producto de 180 bases, de las cuales 110 bases, es decir, de las posiciones 50 a 160, proporcionan información de la secuencia diana. Cuando la diana va de la posición 11 a 170, este diseño de sonda permitirá la circularización de un producto de 180 bases, de las cuales 120 bases, es decir, de las posiciones 50 a 170, proporcionan información de la secuencia diana. Con este diseño, las 140 bases máximas de información de secuencia se obtendrán con la diana comenzando desde la posición 31 a 51 y terminando en las posiciones 190 a 210 respectivamente. En la figura, cuando la diana va de la posición 81 a 250, no hay formación de producto circular. Sin embargo, se podría formar algún producto, debido a la región de complementariedad más corta entre la región de sonda en el extremo 5' y el lado 5' de la diana, aunque existe la preocupación de que no siempre se hibridarán.

En la Figura 97, la región de sonda en el extremo 5' en dirección 5' (60 bases) es complementaria a las bases diana 30-90, mientras que la región de sonda en el extremo 3' en dirección 3' (60 bases) es complementaria a las bases diana 150-210. Esta figura es similar a la Figura 96, excepto porque ambas regiones de sonda en los extremos 5' y 3' son más largas. Para los 5 primeros ejemplos de dianas, el oligonucleótido más largo permite la captura de más ADN diana, de modo que los círculos resultantes contienen 20 bases adicionales de ADN diana original.

Las Figuras 98 y 99 amplían las tendencias de las Figuras 96 y 97, con regiones de sonda de 70 y 80 bases respectivamente. Como anteriormente, las regiones de sonda más largas garantizan una mayor cobertura de la diana. Los emparejamientos erróneos ayudan a distinguir la diana auténtica de una copia de la sonda por polimerasa. Cuando el ADN en cuestión contiene la base de tipo silvestre, se originó a partir de la diana, así como la secuencia de ADN contiguo a ella. Cuando el ADN contiene el complemento de la base con errores de emparejamiento en la sonda, entonces se sabe que la base se generó a partir de la sonda.

Las Figuras 104-107 ilustran cómo diseñar sondas oligonucleotídicas con una estrategia de mosaico solapante para secuenciar regiones contiguas más grandes (en el presente documento se muestran aproximadamente 500 bases). La Figura 104 ilustra cuatro sondas "consecutivas" que usan el diseño de la Figura 96, mientras que las Figuras 105 107 ilustra cuatro sondas "consecutivas" que usan el diseño de la Figura 97-99, respectivamente. Se ilustran fragmentos potenciales de 160 pb que se podrían generar en la región (desplazados 10 bases). Debajo se muestra el oligonucleótido que podría cubrir todos esos fragmentos anteriores. Si el área en la diana está en color gris claro, no proporcionará información de secuencia fiable. Si el área en la diana está en color gris oscuro, podría proporcionar una buena información de secuencia. En este diagrama, las sondas enumeradas se designan secuencialmente como n.° 1, n.° 2, n.° 3, n.° 4 etc. Para las etapas de extensión multiplexada-ligamiento, las sondas impares n.° 1, n.° 3, n.° 5 se agrupan en un primer grupo de oligonucleótidos, y a continuación, las sondas pares n.° 2, n.° 4, n.° 6 se agrupan en un segundo grupo. Este enfoque evita que los oligonucleótidos contiguos (es decir, n.° 1 y n.° 2) compitan por unirse a la misma hebra diana. Una vez que se ha llevado a cabo la extensión -circularización, los dos grupos se pueden combinar y se puede proceder a las etapas de exonucleasa y etapas posteriores tales como amplificación por círculo rodante y secuenciación circular, o alternativamente, secuenciación SMRT directa en el molde cerrado covalentemente, usando la secuencia de unión a cebador opcional como un sitio de unión a cebador.

Protocolo detallado para la detección de alta sensibilidad de mutaciones de una sola base, mutaciones por inserciones pequeñas, o deleciones pequeñas (cuando están presentes en un 1 % a un 0,01 %), en genes conocidos (por ejemplo, Braf, K-ras, p53):

1.4. a. Comenzando con ADNcf (o por ejemplo ADN genómico aislado de CTC, cortado a aproximadamente 150 pb), desnaturalizar el ADN diana (94 °C, 1 minuto) en presencia de oligonucleótidos (que comprenden una región de sonda en el extremo 5' complementaria a las secuencias en el lado 5' de las dianas, una secuencia de identificador único, una secuencia de identificador de paciente opcional, una secuencia de unión a cebador opcional, y una región de sonda en el extremo 3' complementaria a las secuencias en el lado 3' de las dianas), y permitir que los oligonucleótidos se hibriden con sus regiones complementarias en los fragmentos deseados mediante enfriamiento a una temperatura deseada (por ejemplo, 40 °C o 45 °C durante 2 horas). La temperatura de la reacción se reduce, y las ADN polimerasas (es decir, la polimerasa T4 tiene una fuerte actividad de corrección de errores en dirección 3 '^5 ') y la ADN polimerasa 1 (que tiene una actividad de corrección de errores en dirección 3 '^5 ' débil, pero buena actividad 5'^3'), y opcionalmente el fragmento Klenow (sin actividad 5'^3')), ADN ligasa (ligasa T4 o ligasa de E. coli), y los dNTP se añaden después de la etapa de hibridación. Permitir la extensión y el ligamiento a 23 °C o 30 °C, y, opcionalmente, aumentar la temperatura (por ejemplo, 37 °C) para garantizar la finalización de la extensión y el ligamiento, para generar productos circulares.

1.4. b. Opcionalmente, escindir la sonda oligonucleotídica en un enlace escindible (por ejemplo, U escindido usando UDG y endonucleasa AP). Añadir Exonucleasa I (digiere el ADN monocatenario en la dirección 3'^5'), y Exonucleasa III (digiere el ADN bicatenario en la dirección 3'^5'), para digerir todos los productos sin ligar o mellados, dejando solo el ADN monocatenario circular deseado que comprende el ADN diana original, la secuencia del conector, la secuencia de identificador único, y una secuencia de identificador de paciente opcional. Este producto es adecuado para la amplificación por círculo rodante (usando cebadores hexaméricos aleatorios con polimerasa phi-29) para crear repeticiones en tándem de la secuencia deseada, y posterior identificación de las dianas usando secuenciación de nueva generación, o alternativamente, secuenciación SMRT directa en el molde cerrado covalentemente, usando la secuencia del conector como un sitio de unión a cebador.

Nota 3: Una mezcla 1:20 de polimerasa T4 (con actividad de nucleasa 5'^3'), ADN polimerasa I (actividad de corrección de errores en dirección 3 '^5 ' débil, pero buena actividad 5 '^3 ') y Klenow (ADN polimerasa I sin actividad de escisión por nucleasa 5 '^3 ') se puede usar en condiciones de extensión distributiva (es decir, concentración de sal más elevada) para minimizar la degradación del ADN diana por traducción de mellas. Nota 4: El proceso de extensión y ligamiento se puede llevar a cabo en dos o más tubos de reacción, conteniendo un conjunto las sondas con numeración "impar", conteniendo el segundo conjunto las sondas con numeración "par" para evitar que las sondas compitan por las mismas hebras de ADN diana. Las reacciones separadas se pueden agrupar posteriormente.

Nota 5: El uso de bases emparejadas erróneamente en la secuencia de la sonda a intervalos regulares (es decir, 10, 12, o 15 bases) permite distinguir la secuencia de ADN diana auténtica de la secuencia generada copiando la hebra de la sonda. Los oligonucleótidos enumerados en la Nota 6 que sigue a continuación contienen bases emparejadas erróneamente aproximadamente cada 15 bases en las regiones de la secuencia diana.

Nota 6: Cuando se diseñan oligonucleótidos para su uso con secuencias de conector más largas, que comprenden secuencias de "código de barras" o "indexación" para su uso con instrumentos comerciales, puede ser necesario ensamblar el oligonucleótido usando PCR, amplificación de desplazamiento de hebra, o una combinación de las mismas. Durante la PCR, el uso de dUTP en lugar de TTP incorpora uracilo, adecuado para su posterior escisión con UDG. El cebador de hebra inversa puede estar fosforilado, permitiendo su digestión usando exonucleasa lambda o una exonucleasa 5 '^3 ' similar. Una secuencia de dA30 se puede añadir al extremo 5' del cebador directo, lo que permite la amplificación por desplazamiento de hebra. En la Tabla 1 (a continuación) se muestran ejemplos de oligonucleótidos adecuados para ensamblaje y amplificación para la secuenciación de regiones de KRAS, BRAF y exones 5-8 de TP53 que contienen mutaciones en puntos calientes e incluyen los siguientes: (i) regiones diana directa e inversa de KRAS (iSx-001-bkA30, iSx-103-bkA30-KRSF21, iSx-104-pKRSF22, iSx-100-705F, iSx-101-502R, iSx-105- pKRSF23, e iSx-106-pKRSR24) e (iSx-102-pKRSF20, iSx-104-pKRSF22, iSx-100-705F, iSx-101-502R, iSx-105-pKRSF23, iSx-107-bkA30-KRSR25, e iSx-001-bkA30); (ii) regiones diana directa e inversa de BRAF (iSx-001-bkA30, iSx-113-bkA30-BRF-F21, iSx-114-pBRF-F22, iSx-100-705F, iSx-101-502R, iSx-115-pBRF-F23, e iSx-116-pBRF-R24) e (iSx-112-pBRF-F20, iSx-114-pBRF-F22, iSx-100-705F, iSx-101-502R, iSx-115-pBRF-F23, iSx-117-bkA30-BRF-R25 e iSx-001-bkA30); (iii) regiones diana directa e inversa del exón 5 de TP53 (iSx-001-bkA30, iSx-123-bkA30-TP53e5F61, iSx-124-pTP53e5F62, iSx-100-705F, iSx-101-502R, iSx-125-pTP53e5F63, e iSx-126-pTP53e5R64) e (iSx-122-pTP53e5F60, iSx-124-pTP53e5F62, iSx-100-705F, iSx-101-502R, iSx-125-pTP53e5F63, iSx-127-bkA30-TP53e5F65, e iSx-001-bkA30); (iv) regiones diana directa e inversa del exón 6 de TP53 (iSx-001-bkA30, iSx-133-bkA30-TP53e6F71, iSx-134-pTP53e6F72, iSx-100-705F, iSx-101-502R, iSx-135-pTP53e6F73, e iSx-136-pTP53e6R74) e (iSx-132-pTP53e6F70, iSx-134-pTP53e6F72, iSx-100-705F, iSx-101-502R, iSx-135-pTP53e6F73, iSx-137-bkA30-TP53e6F75, e iSx-001-bkA30); (v) regiones diana directa e inversa del exón 7 de TP53 (iSx-001-bkA30, iSx-143-bkA30-TP53e7F81, iSx-144-pTP53e7F82, iSx-100-705F, iSx-101-502R, iSx-145-pTP53e7F83, e iSx-146-pTP53e7R84) e (iSx-142-pTP53e7F80, iSx-144-pTP53e7F82, iSx-100-705F, iSx-101-502R, iSx-145-pTP53e7F83, iSx-147-bkA30-TP53e7R85, e iSx-001-bkA30); y (vi) regiones diana directa e inversa del exón 8 de TP53 (iSx-001-bkA30, iSx-153-bkA30-TP53e8F91, iSx-154-pTP53e8F92, iSx-100-705F, iSx-101-502R, iSx-155-pTP53e8F93, e iSx-156-pTP53e8R94) e (iSx-152-pTP53e8F90, iSx-154-pTP53e8F92, iSx-100-705F, iSx-101-502R, iSx-155-pTP53e8F93, iSx-157-bkA30-TP53e8R95 e iSx-001-bkA30).

Nota 7: Después de generar los productos circulares que comprenden regiones diana de KRAS, BRAF, y los exones 5-8 de TP53 que contienen mutaciones en puntos calientes, estas regiones se pueden someter a amplificación por círculo rodante usando cebadores específicos de diana para generar productos de repetición en tándem. Estos productos se pueden generar antes o después de la captura de las dianas deseadas con oligonucleótidos específicos de diana sobre un soporte sólido (véase la nota 8 que sigue a continuación). Los cebadores pueden contener una base nucleotídica escindible interna o un sitio abásico tal como 1',2'-didesoxirribosa (dSpacer), lo que permite la incorporación de dUTP durante la amplificación por círculo rodante para protección contra la contaminación por arrastre. Los ejemplos de tales cebadores se muestran en la Tabla 1 (a continuación) e incluyen los siguientes: (i) cebadores directos e inversos de KRAS (iSx-108-KRS-rcF26, iSx-109-KRS-rcR27); (ii) cebadores directos e inversos de BRAF (iSx-118-BRF-rcF26, iSx-119-BRF-rcR27); (iii) cebadores directos e inversos del exón 5 de TP53 (iSx-128-TP53e5-rcF66, iSx-129-TP53e5-rcR67; iSx-130-TP53e5-rcF68, iSx-131-TP53e5-rcR69); (iv) cebadores directos e inversos del exón 6 de TP53 (iSx-138-TP53e6-rcF76, iSx-139-TP53e6-rcR77); (v) cebadores directos e inversos del exón 7 de TP53 (iSx-148-TP53e7-rcF86, iSx-149-TP53e7-rcR87); y (vi) cebadores directos e inversos del exón 8 de TP53 (iSx-158-TP53e8-rcF96, iSx-159-TP53e8-rcR97).

Nota 8: Después de generar los productos circulares que comprenden regiones diana de KRAS, BRAF, y los exones 5-8 de TP53 que contienen mutaciones en puntos calientes, y/o generar productos de repetición en tándem, estos productos se pueden capturar mediante hibridación con oligonucleótidos más largos, que contienen un grupo de captura adecuado para la captura posterior sobre un soporte sólido. Algunos ejemplos de tales oligonucleótidos de captura, que contienen grupos biotina adecuados para la captura a través de superficies sólidas recubiertas con estreptavidina se muestran en la Tabla 1 (a continuación) e incluyen los siguientes: (i) oligonucleótidos de captura directa e inversa de KRAS (iSx-013-KRS-bcF1, iSx-014-KRS-bcR2); (ii) oligonucleótidos de captura directa e inversa de BRAF (iSx-020-BRF-bcF1, iSx-021-BRF-bcR2);

(iii) oligonucleótidos de captura directa e inversa del exón 5 de TP53 (iSx-030-TP53e5-bcF1, iSx-031-TP53e5-bcR2; iSx-032-TP53e5-bcF3, iSx-033-TP53e5-bcR4); (iv) oligonucleótidos de captura directa e inversa del exón 6 de TP53 (iSx-050-TP53e6-bcF5, iSx-051-TP53e6-bcR6); (v) oligonucleótidos de captura directa e inversa del exón 7 de TP53 (iSx-060-TP53e7-bcF7, iSx-061-TP53e7-bcR8); y (vi) oligonucleótidos de captura directa e inversa del exón 8 de TP53 (iSx-070-TP53e8-bcF9, iSx-071-TP53e8-bcR10).

Nota 9: Con los productos mencionados anteriormente generados usando los diseños de cebadores y conectores mencionados anteriormente, después de la amplificación por agrupamiento o con perlas, o captura dentro de un pocillo, dirección, o superficie de una celda de flujo en un instrumento comercial, para iniciar reacciones de secuenciación se pueden usar los siguientes cebadores: (i) iLx-003-PEsqP1, cebador de secuenciación de extremo emparejado 1; (ii) iLx-004-BrCdR1, cebador de indexación, lectura de código de barras 1; (iii) iLx-001-P5-BrCdR2, lectura de código de barras 2; y (iv) iLx-005-PEsqP2, cebador de secuenciación de extremo emparejado 2 (las secuencias de cebador se proporcionan en la Tabla 1 que sigue a continuación).

Ejemplo profético 2 - Detección de marcadores de metilación de alta sensibilidad para hipermetilación del promotor (cuando está presente en un 1 % a un 0,01 %) en ADN plasmático

La metilación del promotor desempeña un papel importante en la regulación de la expresión génica. Los promotores de genes a menudo tienen regiones de alto contenido de CpG conocidas como "islas CpG". Cuando los genes, tales como los genes supresores de tumores, con las islas CpG del promotor se desactivan, esto va normalmente acompañado de metilación de la mayoría de las secuencias de CpG dentro del promotor y de las regiones del 1er exón. Ha habido dos enfoques tradicionales para detectar cambios de metilación.

El primero aprovecha las enzimas de restricción sensibles a metilo, en donde el ADN genómico se escinde cuando no está metilado, y esto va seguido de una amplificación por PCR usando cebadores que flanquean el sitio o los sitios. Si el ADN estuviera metilado, se debería amplificar, si no estuviera metilado, no se debería amplificar. Esta técnica tiene la desventaja de que las digestiones no siempre se completan y, además, no es una técnica precisa para encontrar niveles bajos de ADN metilado cuando la mayor parte de la misma secuencia no está metilada, como podría ser el caso en la detección en plasma.

El segundo enfoque se conoce como "PCR específica de metilo" y se basa en el tratamiento con bisulfito del ADN, que convierte las C sin metilar en U. Si la base está metilada, entonces no se convierte. La PCR específica de metilo se basa en el uso de cebadores y sondas TaqMan que son específicas para la secuencia convertida resultante si estuviera metilada, pero no de la secuencia sin metilar. La PCR específica de metilo tiene la ventaja de poder detectar niveles muy bajos de ADN metilado. Una mejora adicional de esta técnica usa un oligonucleótido de bloqueo que se hibrida con la secuencia del ADN no metilado convertido con bisulfito, enriqueciendo por lo tanto la amplificación del ADN metilado convertido con bisulfito. La desventaja es que el tratamiento con bisulfito destruye del 50 % al 90 % de la integridad del ADN original al producirle mellas. Si se comienza con ADN del plasma (con una longitud promedio de aproximadamente 160 bases), esto puede ser un problema importante. Además, la conversión de las C en U reduce la complejidad de la secuencia de 4 bases a 3 bases. Dado que la secuencia convertida ahora es más rica en A:T, también se requieren cebadores de PCR más largos. Por lo tanto, se pueden producir amplificaciones no específicas, ya que los cebadores tienen más probabilidades de realizar un cebado erróneo en secuencias estrechamente relacionadas pero incorrectas. Esto requiere normalmente un enfoque de PCR anidada, y se corre el riesgo de contaminación por arrastre y en general no es ideal para amplificaciones multiplexadas.

Visión general del enfoque: La idea es copiar fielmente cada fragmento de ADN diana que contenga metilación en sitios de restricción contiguos para las regiones de interés, añadir una secuencia de identificador único y un identificador de paciente opcional, y circularizarlos para la secuenciación posterior. La hebra de ADN oligonucleotídica se circulariza y se secuencia. Este enfoque proporciona la ventaja de obtener tanto información sobre el número de copias cuando sea necesario, como de los datos de metilación con el mínimo de secuenciación requerido.

Detección de metilación en sitios contiguos

Variación 2.1: (véase por ejemplo, la Figura 27). En esta variación, el ADN se escinde inicialmente con HinP1I para reducir significativamente la cantidad de diana no metilada. Para capturar las regiones metiladas deseadas, los oligonucleótidos que comprenden una región de sonda en el extremo 5' complementaria a las secuencias en el lado 5' de la diana, una secuencia de identificador único, una secuencia de identificador de paciente opcional, y una región de sonda en el extremo 3' complementaria a las secuencias en el lado 3' de la diana, se hibridan con la diana. El oligonucleótido contiene secuencias HinP11 sin metilar cerca tanto del extremo 3' de la sonda en dirección 5' como de un extremo incompetente para ligamiento o bloqueado en 5' de la sonda en dirección 3'. El extremo 3' contiene emparejamientos erróneos con la diana, o está bloqueado para evitar la extensión con polimerasa. HinP1I producirá mellas en las hebras sin metilar del híbrido diana de la sonda si el ADN diana estuviera metilado, liberando un extremo 3' OH competente para extensión, y un fosfato 5' competente para ligamiento (lado izquierdo de la Figura 27). Si la diana estuviera sin metilar, ambas hebras se escinden, destruyendo el molde de la diana (lado derecho de la Figura 27). La adición de ligasa y polimerasa que carecen de actividad de desplazamiento de hebra y actividad de nucleasa tanto 3 '^5 ' como 5 '^3 ', permite la extensión del extremo 3' liberado de la sonda en la diana metilada, seguido de ligamiento al extremo 5' liberado de la sonda para formar un producto circular que contiene tanto una secuencia de identificador único como una secuencia de identificador de paciente opcional. Los productos sin ligar se eliminan por digestión con exonucleasa. Este producto circular es adecuado para etapas adicionales opcionales y secuenciación posterior.

Al insistir en que la endonucleasa de restricción genere tanto el 3' OH como el fosfato 5', esto evita una señal falsa, y también debería eliminar cualquier señal de ligamiento no específica. Por lo tanto, cualquier fragmento raro de ADN genómico que sea monocatenario después de la purificación, o que no se haya escindido no formará un sustrato productivo y será destruido en la etapa de tratamiento con exonucleasa.

Protocolo detallado para la detección altamente sensible de metilación del promotor:

2.1a. Escindir el ADNcf aislado, o el ADN enriquecido con metilo con una o más enzimas sensibles a metilo (AciI, HinP1I, Hpy99I, y HpyCH4IV). En este ejemplo, se usa HinP1I. Inactivar con calor la(s) endonucleasa(s) (65 °C durante 15 minutos) y desnaturalizar el ADN (94 °C, 1 minuto).

2.1b. Desnaturalizar el ADN diana (94 °C, 1 minuto) en presencia de sondas oligonucleotídicas (que comprenden una región de sonda en el extremo 5' complementaria a la secuencia del lado 5' de la diana, una secuencia de identificador único, una secuencia de identificador de paciente opcional, un sitio de unión a cebador opcional y una región de sonda 3' complementaria a la secuencia del lado 3' de la diana), y permitir que los oligonucleótidos se hibriden con sus regiones complementarias en los fragmentos deseados mediante enfriamiento a una temperatura deseada (por ejemplo, 40-50 °C durante 2 horas). El oligonucleótido contiene secuencias HinP1I sin metilar cerca de los extremos tanto 3' como 5' de las sondas, que están diseñadas para que contengan emparejamientos erróneos, grupos de bloqueo, o carecen de fosforilación, de modo que no son sustratos para la polimerasa ni para la ligasa. Enfriar a 37 °C y añadir HinP1I, lo que mellará las hebras sin metilar del híbrido diana de la sonda si el ADN diana estuviera metilado, liberando un extremo 3' OH competente para extensión, y un fosfato 5' competente para ligamiento. Inactivar con calor la(s) endonucleasa(s) (65 °C durante 15 minutos). KlenTaq (polimerasa Taq que carece de actividad de nucleasa), y ligasa termoestable (preferentemente de la cepa AK16D), y los dNTP se añaden después de la etapa de hibridación, o después de la etapa de mellado con endonucleasa de restricción. Permitir la extensión y el ligamiento a 50 °C, y, opcionalmente, aumentar la temperatura (por ejemplo, 60 °C) para garantizar la finalización de la extensión y el ligamiento, para generar productos circulares.

2.1.c. Añadir Exonucleasa I (digiere el ADN monocatenario en la dirección 3'^5'), y Exonucleasa III (digiere el ADN bicatenario en la dirección 3'^5'), para digerir todos los productos sin ligar o mellados, dejando solo el ADN circular monocatenario deseado que comprende una copia del ADN metilado, la secuencia de identificador único, y una secuencia de identificador de paciente opcional. Este producto circular es adecuado para etapas adicionales opcionales y secuenciación posterior.

Nota 1: El oligonucleótido puede carecer de un fosfato 5', o puede contener un grupo de bloqueo opcional en el lado 5', de modo que el extremo 5' del oligonucleótido no es adecuado para ligamiento. El oligonucleótido puede contener puede contener emparejamientos erróneos en el extremo 3', horquilla en el extremo 3', o un grupo de bloqueo opcional en el lado 3', de modo que el extremo 3' del oligonucleótido no es adecuado para la extensión en la diana. En ambos casos, el bloqueo solo se libera mediante el mellado con enzima de restricción de la sonda cuando se hibrida con la diana metilada.

Nota 2: El ejemplo anterior usa KlenTaq, una polimerasa que carece de actividad de desplazamiento de hebra, así como actividad de nucleasa tanto 3 '^5 ' como 5'^3'. Si el oligonucleótido tiene un grupo de bloqueo en el lado 3', entonces se puede usar polimerasa con actividad de nucleasa 3'^5', mientras que si el grupo de bloqueo está en el lado 5', entonces se puede usar polimerasa con actividad de nucleasa 5'^3'. Nota 3: En el ejemplo, la endonucleasa de restricción (HinP1I) se inactiva por calor incubando a 65 °C durante 15 minutos. Un enfoque alternativo, (o cuando se usa una enzima insensible al calor tal como BstUI) es realizar la extensión con análogos nucleotídicos (es decir, 5-metil-dCTP o alfa-tiofosfato dCTP) que hacen que un sitio de restricción sea resistente a la nueva escisión con la endonucleasa homóloga. Si el sitio de restricción en el lado 5' del oligonucleótido no se convierte en una forma resistente mediante el uso de análogos nucleotídicos (es decir, HinP1I), entonces este caso se puede resolver usando un oligonucleótido con un grupo de bloqueo en el lado 5', así como una polimerasa que tiene actividad de nucleasa 5'^3'. Inicialmente, el grupo de bloqueo se retira por la actividad de mellado de la endonucleasa de restricción. Posteriormente durante la etapa de extensión usando análogos de nucleótidos, la polimerasa que tiene actividad de nucleasa 5 '^3 ' traduce la mella a través del sitio de reconocimiento, reemplazándolo con nucleótidos que hacen que el sitio sea resistente a una escisión adicional.

Nota 4: En el ejemplo anterior, además de minimizar la traducción de mellas más allá de la secuencia de reconocimiento, la parte del oligonucleótido directamente contiguo al sitio de restricción de la parte de sonda en el extremo 5' se puede sintetizar para que contenga enlaces tiofosfato. Para minimizar el desplazamiento de la polimerasa de esas bases a medida que extiende una base en exceso (o que podría hacer imposible el ligamiento al cebador en dirección 3'), las bases de la diana en la unión de ligamiento podrían ser preferentemente ricas en AT en el lado 3', y ricas en GC en el lado 5'.

Nota 5: Las partes específicas de diana de la sonda oligonucleotídica están diseñadas de modo que permanecerán hibridadas con la diana incluso después de la liberación de los extremos 3' y 5' no productivos. Si la diana contiene sitios de restricción adicionales que se solapan con las partes de la sonda, entonces la sonda se puede sintetizar con 5-metil-dC en esas posiciones. Si la diana estuviera metilada en esas posiciones, entonces el sitio se metilará tanto en la diana como en la sonda oligonucleotídica, y, por lo tanto, será resistente al mellado. Sin embargo, si la diana no estuviera metilada en esas posiciones, entonces el sitio se mellará en la hebra diana, interfiriendo de ese modo con la hibridación de la sonda con la diana (acortada).

Nota 6. El producto circular es adecuado para la amplificación por círculo rodante (usando cebadores hexaméricos aleatorios con polimerasa phi-29) para crear repeticiones en tándem complementarias a la secuencia deseada, y posterior identificación de las dianas usando secuenciación de nueva generación, o alternativamente, secuenciación SMRT directa en el molde cerrado covalentemente, usando la secuencia de unión a cebador como un sitio de unión a cebador.

Nota 7. Si las sondas oligonucleotídicas también comprenden sitios de unión a cebador opcionales (es decir, sitios de unión a cebador universales), para la amplificación por PCR, seguido de la identificación posterior de las dianas podría ser adecuado el uso de secuenciación de nueva generación, ensayos TaqMan, ensayos UniTaq, ensayos de PCR en tiempo real, PCR digital, micromatriz, hibridación, u otro método de detección.

Base de datos del estado de metilación en sitios de restricción sensibles a metilo contiguos

La base de datos del TCGA actual contiene información sobre el estado de metilación de aproximadamente 450.000 sitios CpG en el genoma humano, tanto para tejido normal como para tejido tumoral de muchos sitios tisulares diferentes. Sin embargo, no cubre todo el estado de metilación de sitios HinP1I contiguos, ni podría distinguir que ambos sitios están metilados en el mismo trozo de ADN genómico.

Por lo tanto, para que el método de ensayo mencionado anteriormente sea el más útil, podría ser de ayuda crear una base de datos del estado de metilación en sitios de restricción sensibles a metilo contiguos. Un enfoque de ese tipo se ilustra en la Figura 28.

Visión general del enfoque: La idea es generar una genoteca de pequeños fragmentos que solo se podrían haber formado si ambos extremos del fragmento contuvieran sitios de restricción que estuvieran metilados en el ADN genómico original. Los fragmentos tienen conectores añadidos con secuencias de identificador único opcional y de identificador de paciente opcional que ahora son susceptibles de ligamiento para crear multímeros de fragmentos que a continuación serán sustratos para etapas adicionales y secuenciación posterior.

Variación 2.1.1: (véase por ejemplo, la Figura 28). Este enfoque muestra cómo descubrir la metilación en sitios HinP1I contiguos (GC*GC) en todo el genoma. El material de partida puede ser ADN genómico intacto o ADNcf con una longitud promedio de aproximadamente 160 pb. Escindir el ADN genómico con HinP1I para fragmentar el ADN en sitios HinP1I sin metilar. Los conectores cortos que contienen un extremo 5' bloqueado en el extremo de no ligamiento, se ligan en ambos extremos de los extremos escindidos con HinP1I rellenados y los extremos reparados de los fragmentos diana. (Estos conectores no recrean un sitio HinP1I en la unión de ligamiento). Unos pocos ciclos de amplificación por PCR usando los dNTP sin metilar y cebadores bloqueados en el extremo 5' generan productos que ahora están sin metilar en los sitios HinP1I restantes. A continuación estos productos se escinden con HinP1I. Solo los amplicones de PCR que contienen sitios HinP1I contiguos (GCGC) que estaban metilados en la diana original generarán fragmentos que están desbloqueados (es decir, competentes para ligamiento con los conectores) en ambos extremos, cuando se escinden con HinP1I. Los conectores que contienen secuencia de identificador único opcional, y secuencia de identificador de paciente opcional están ligados a estos extremos escindidos con HinP1I rellenos recién generados. Estos nuevos conectores contienen, en su lado de no ligamiento, el extremo 3' bloqueado, o una cadena principal que contiene tiofosfato (que se muestra como **** en la Figura 28). Después de añadir una exonucleasa 3' bicatenaria (es decir, Exonucleasa III), los fragmentos que contienen el conector corto original en uno o ambos lados se digerirán y se volverán monocatenarios. Solo los fragmentos con el nuevo conector ligado a ambos lados permanecerán bicatenarios, ya que el grupo de bloqueo en el extremo 3' o los tiofosfatos inhiben la digestión con la exonucleasa 3'. Los extremos libres de los fragmentos restantes que contienen conector se vuelven competentes para ligamiento, ya sea (i) fosforilando el extremo 5', (ii) retirando el grupo 3' bloqueado, o (iii) usando actividad de nucleasa 5' para escindir la aleta o base coincidente solapante en el extremo 5', dejando un fosfato 5' competente para ligamiento, o cualquier combinación de los mismos. Las condiciones de ligamiento se diseñan para favorecer la multimerización, por ejemplo usando agentes de aglomeración (es decir, PEG al 20 %), y/o mezclando dos conjuntos de productos de ligamiento, en donde la protuberancia del conector en el extremo 5' no palindrómico del primer conjunto es complementaria a la protuberancia del conector en el extremo 5' no palindrómico del segundo conjunto. Los productos de ligamiento comprenden secuencias HinP1I contiguas originalmente metiladas en el ADN diana con una secuencia de identificador único y/o secuencia de identificador de paciente opcionales. Este producto es adecuado para etapas adicionales opcionales y secuenciación posterior.

Protocolo detallado para generar una base de datos del estado de metilación en sitios de restricción sensibles a metilo contiguos:

2.1.1a. Escindir ADN genómico aislado, o ADN enriquecido con metilo con una o más enzimas sensibles a metilo (AciI, HinP1I, Hpy99I, y HpyCH4IV). En este ejemplo, se usa HinP1I. Opcionalmente, inactivar con calor la(s) endonucleasa(s) (65 °C durante 15 minutos). Ligar los conectores que están bloqueados en el extremo 5' del extremo de no ligamiento. Los extremos diana se reparan con polimerasa T4 y quinasa T4, y posteriormente se genera una protuberancia A en el extremo 3' de una sola base con Klenow (exo-) y dATP. Los conectores tienen una protuberancia T en el extremo 3' de una sola base, de modo que el ligamiento usando ligasa T4 añade conectores en ambos extremos del fragmento. (Véase la Nota 1, a continuación).

2.1.1b. Añadir cebadores bloqueados en el extremo 5', polimerasa Taq y los dNTP y realizar algunos ciclos de PCR para generar productos que ahora están sin metilar en los sitios HinP1I restantes.

2.1.1. c. Añadir HinP1I para escindir los productos que contengan dichos sitios. Solo los amplicones de PCR que contienen sitios HinP1I contiguos (GCGC) que estaban metilados en la diana original generarán fragmentos que están desbloqueados (es decir, competentes para ligamiento con los conectores) en ambos extremos, cuando se escinden con HinP1I. La polimerasa residual de la polimerasa Taq rellenará la protuberancia de 2 bases (opcionalmente, aumentar la temperatura a 60 °C). Retirar los dNTP (a través de una columna de centrifugación) y volver a añadir solo dATP para generar una protuberancia A en el extremo 3' de una sola base.

2.1.1.d. Usar ligasa T4, añadiendo conectores (que contengan secuencia de identificador único opcional, y secuencia de identificador de paciente opcional) con una protuberancia A en el extremo 3' de una sola base en el extremo de ligamiento a la protuberancia A de una sola base de las secuencias diana escindidas y rellenadas. El lado 5' de no ligamiento del conector contiene una protuberancia en el extremo 5', y, opcionalmente, no está fosforilado. El lado 3' de no ligamiento del conector contiene un grupo de bloqueo en el extremo 3' y/o tiofosfatos para inhibir la digestión con la exonucleasa 3'.

2.1. I.e. Añadir una exonucleasa 3' (es decir, Exonucleasa III) y digerir a 37 °C. Los fragmentos que contienen el conector corto original en uno o ambos lados se digerirán y se volverán monocatenarios. Solo los fragmentos con el nuevo conector ligado a ambos lados permanecerán bicatenarios. La exonucleasa también hará que los conectores se vuelvan monocatenarios. Opcionalmente, retirar los productos de digestión de los fragmentos deseados con una columna de centrifugación.

2.1.1.f Los extremos libres de los fragmentos restantes que contienen conector se vuelven competentes para ligamiento, ya sea (i) fosforilando el extremo 5' usando quinasa T4, (ii) retirando el grupo en el extremo 3' bloqueado, o (iii) usando la actividad de nucleasa 5 '^3 ' de la polimerasa Taq para escindir la aleta o base coincidente solapante en el extremo 5', dejando un fosfato 5' competente para ligamiento, o cualquier combinación de los mismos. Las condiciones de ligamiento se diseñan para favorecer la multimerización. Los productos de ligamiento comprenden multímeros de fragmentos diana con secuencias HinP1I contiguas originalmente metiladas en el ADN diana con secuencia de identificador único y/o secuencia de identificador de paciente opcionales. Este producto es adecuado para etapas adicionales opcionales y secuenciación posterior.

Nota 1: Con respecto a los ligamientos de conectores: Como alternativa al rellenado, reparando los extremos, y adaptando A antes del ligamiento de conectores con conectores que contienen una protuberancia T de una sola base, se puede aprovechar la protuberancia CpG en el extremo 5' generada por HinP1I. Se puede generar una protuberancia C en el extremo 3' de una sola base usando Klenow (exo-) y dCTP. Los conectores tienen una protuberancia C en el extremo 3' de una sola base, de modo que el ligamiento usando ligasa T4 añade conectores en ambos extremos del fragmento. Alternativamente, los conectores con una protuberancia CG se pueden usar directamente, sin rellenado de sitios, pero los conectores están diseñados de modo que si se autoligan, crean un sitio AclI (AAACGTT). Por lo tanto, el ADN genómico se escinde con el sitio Hinpll (GACGC) y el sitio AclI (AAACGTT) en presencia tanto de conectores como de ligasa T4 a 37 °C. El ligamiento de los fragmentos entre sí se escinde con Hinp1I, El ligamiento de los conectores entre sí se escinde con AclI, sin embargo, ninguna enzima escinde el ligamiento de los conectores a los extremos de los fragmentos, por lo que esta mezcla de ligamiento de 3 enzimas sirve como una "selección bioquímica" para enriquecer los productos deseados.

Nota 2: El extremo 3' del conector bloqueado se puede sintetizar para que contenga un uracilo o un sitio apurínico (AP) en una posición interna al bloqueo, y después del tratamiento con UDG y endonucleasa AP, liberar un extremo 3' competente para ligamiento.

Nota 3: Para generar el fosfato 5' competente para ligamiento en el lado 5' de la diana se puede usar la nucleasa Fen en lugar de la polimerasa con actividad de nucleasa 5'^3'.

Nota 4: El ligamiento favorecerá la formación de multímeros usando agentes de aglomeración (es decir, PEG al 20 %), y/o mezclando dos conjuntos de productos de ligamiento, en donde la protuberancia del conector en el extremo 5' no palindrómico del primer conjunto es complementaria a la protuberancia del conector en el extremo 5' no palindrómico del segundo conjunto.

Detección de metilación en sitios contiguos usando tratamiento con bisulfito

El enfoque anterior es ideal para identificar y enumerar fragmentos que contienen sitios HinP1I metilados contiguos como sustituto de la metilación dentro de ese fragmento de ADN. Sin embargo, para algunas aplicaciones, es importante identificar el estado de metilación de sitios CpG individuales dentro de una región determinada. Por lo tanto puede ser necesario tratar el ADN entrante con bisulfito, que convierte la C regular, pero no la metil-C, en U.

Visión general del enfoque usando bisulfito: La idea es copiar fielmente cada fragmento de ADN diana que está metilado en sitios de restricción AciI contiguos de la secuencia (G*CGG) para las regiones de interés, tratar con bisulfito, añadir una secuencia de identificador único, una secuencia de unión a cebador opcional, y un identificador de paciente opcional, y circularizarlo para la secuenciación posterior. La hebra de ADN oligonucleotídica se circulariza y se secuencia. Este enfoque proporciona la ventaja de obtener, tanto información sobre el número de copias cuando sea necesario, como de los datos de metilación con el mínimo de secuenciación requerido.

La idea aprovecha una propiedad única de la secuencia de reconocimiento para AciI. La enzima escinde la secuencia de reconocimiento de 3.5 bases GACGG en una orientación, y CACGC en la segunda orientación. Si un sitio AciI metilado se trata con bisulfito en la primera orientación (G*CGG), el sitio permanecerá sin cambios (G*CGG), mientras que en la segunda orientación (C*CGC), cambiará (U*CGU, en donde *C indica 5-meC). Después de algunos ciclos de amplificación por PCR, la 5-metil C se convierte en C, mientras que el U se convierte en T. Por lo tanto, un sitio AciI metilado en la primera orientación permanece como GCGG, un sitio AciI sin metilar en la primera orientación se convierte en GTGG, un sitio AciI metilado en la segunda orientación se convierte en TCGT, y un sitio AciI sin metilar en la segunda orientación se convierte en TTGT. Cuando se escinde con AciI, solo los sitios AciI contiguos metilados en la diana original crearán fragmentos que son competentes para ligamiento en ambos extremos 3' y 5'.

Una característica única de este enfoque es que la conversión con bisulfito crea dos hebras no complementarias. Por lo tanto, la hebra superior tendrá secuencias G*CGG contiguos, e incluso si hay una secuencia C*CGC que interviene, no importa porque se convierte en U*CGU, que después de la conversión por PCR en TCGT no se reconoce como un sitio AciI. Además, incluso si hay un sitio G*CGG o GCGG (es decir, sin metilar) que interviene, AciI no lo mellará, ya que estará en una región que es monocatenaria. Incluso mejor, las secuencias de la hebra superior de la forma C*CGC serán G*CGG en la hebra inferior. La hebra inferior también se puede usar para consultar el estado de metilación, y, dado que las dos secuencias ahora son muy diferentes, las sondas oligonucleotídicas para la hebra superior e inferior no se hibridarán entre sí, solo con las dianas convertidas. Por lo tanto, este enfoque permite obtener un estado detallado de metilación en el promotor usando información de las hebras superior e inferior.

El principio de tratar el ADN con bisulfito para convertir el ADN no metilado en una secuencia que no es escindible por una enzima de restricción pero que, si está metilado, todavía es escindible por esa misma enzima de restricción, se puede extender a algunos sitios de restricción adicionales. Por ejemplo, un sitio BstUI (CGACG) conserva su misma secuencia después de la conversión con bisulfito siempre que ambos sitios CG estén metilados (es decir, *CG*CG). Del mismo modo, un sitio Hpy99I (CGWCGA) también conserva su misma secuencia después de la conversión con bisulfito siempre que ambos sitios CG estén metilados (*CGW*CG). En un tipo diferente de ejemplo, HpyCH2IV (AACGT) escindirá ambas secuencias de la forma A*CGT y A*CGC después de la conversión con bisulfito, ya que ambas se convierten en A*CGT. Por lo tanto, las variaciones que se consideran a continuación para Acil son igualmente válidas para, pero sin limitarse a, las endonucleasas de restricción BstUI, Hpy99I, HpyCH2IV y sus isoesquizómeros.

Variación 2.2: (véanse por ejemplo, las Figuras 29-30). En esta variación, los conectores cortos que contienen 5-metil C se ligan a los extremos del ADN. A continuación el ADN se trata con bisulfito, lo que hace que las hebras no sean complementarias para que se vuelvan monocatenarias. Algunos ciclos de amplificación por PCR generan productos que ahora no están metilados en los sitios AciI restantes. A continuación estos productos se escinden con AciI. Solo los amplicones de PCR que contienen sitios AciI contiguos (GCGG) que estaban metilados en la diana original generarán fragmentos que ahora son competentes para ligamiento en ambos extremos. Para capturar las regiones deseadas, las sondas oligonucleotídicas que comprenden una región de sonda en el extremo 5' complementaria a la secuencia del lado 5' de la diana, una secuencia de identificador único, una secuencia de unión a cebador opcional, una secuencia de identificador de paciente opcional, y una región de sonda en el extremo 3' complementaria a la secuencia del lado 3' de la diana, se hibridan con la diana. La adición de ligasa y polimerasa que carecen de actividad de desplazamiento de hebra y actividad de nucleasa tanto 3 '^5 ' como 5'^3', permite la extensión del extremo 3' de la diana sin metilar, seguido de ligamiento al extremo 5' de la diana para formar un producto circular que contiene una secuencia de identificador único, una secuencia de identificador de paciente opcional, y un sitio de unión a cebador opcional. Los productos sin ligar se eliminan por digestión con exonucleasa. Este producto circular es adecuado para etapas adicionales opcionales y secuenciación posterior.

Protocolo detallado para la detección altamente sensible de la metilación del promotor:

2.2. a. Ligar en conectores que contienen 5-metil C para retener la secuencia después de la conversión con bisulfito. Los extremos diana se reparan con polimerasa T4 y quinasa T4, y posteriormente se genera una protuberancia A en el extremo 3' de una sola base con Klenow (exo-) y dATP. Los conectores tienen una protuberancia T en el extremo 3' de una sola base, de modo que el ligamiento usando ligasa T4 añade conectores en ambos extremos del fragmento. Incubar el ADNcf con bisulfito, que convierte la C regular, pero no la metil-C, en U. El tratamiento con bisulfito convierte las hebras superior e inferior de manera diferente, de modo que después del tratamiento, las hebras ya no serán complementarias entre sí y se fusionarán por separado. 2.2. b. Añadir cebadores, polimerasa Taq y los dNTP y realizar algunos ciclos de PCR para generar productos que ahora están sin metilar en los sitios AciI restantes.

2.2. c. Añadir AciI para escindir los productos que contengan tales sitios. Solo los amplicones de PCR que contienen sitios AciI contiguos (GCGG) que estaban metilados en la diana original generarán fragmentos que están desbloqueados (es decir, competentes para ligamiento con los conectores) en ambos extremos, cuando se escinden con AciI. La polimerasa residual de la polimerasa Taq rellenará la protuberancia de 2 bases (opcionalmente, aumentar la temperatura a 60 °C).

2.2. d. Desnaturalizar el ADN diana (94 °C, 1 minuto) en presencia de sondas oligonucleotídicas (que comprenden una región de sonda en el extremo 5' complementaria a la secuencia del lado 5' de las dianas, una secuencia de identificador único, una secuencia de identificador de paciente opcional, un sitio de unión a cebador opcional y una región de sonda 3' complementaria a la secuencia del lado 3' de las dianas), y permitir que los oligonucleótidos se hibriden con sus regiones complementarias en los fragmentos deseados mediante enfriamiento a una temperatura deseada (por ejemplo, 50 °C-60 °C durante 2 horas). KlenTaq (polimerasa Taq que carece de actividad de nucleasa), y ligasa termoestable (preferentemente de la cepa AK16D), y los dNTP se añaden para permitir la extensión y el ligamiento a 50 °C, y, opcionalmente, aumentar la temperatura (por ejemplo, 60 °C) para garantizar la finalización de la extensión y el ligamiento, para generar productos circulares.

2.2. e. Añadir Exonucleasa I (digiere el ADN monocatenario en la dirección 3'^5'), y Exonucleasa III (digiere el ADN bicatenario en la dirección 3'^5'), para digerir todos los productos sin ligar o mellados, dejando solo el ADN circular monocatenario deseado que comprende una copia del ADN metilado, la secuencia de identificador único, y una secuencia de identificador de paciente opcional. Este producto circular es adecuado para etapas adicionales opcionales y secuenciación posterior.

Nota 1. El oligonucleótido puede carecer de un fosfato 5', o puede contener un grupo de bloqueo opcional en el lado 5', de modo que el extremo 5' del oligonucleótido no es adecuado para ligamiento.

Nota 2. El ejemplo anterior usa KlenTaq, una polimerasa que carece de actividad de desplazamiento de hebra, así como actividad de nucleasa tanto 3 '^5 ' como 5^-3'. Si el oligonucleótido tiene un grupo de bloqueo en el lado 5', entonces se puede usar polimerasa con actividad de nucleasa 5'^3'.

Nota 3. El producto circular es adecuado para la amplificación por círculo rodante (usando cebadores hexaméricos aleatorios con polimerasa phi-29) para crear repeticiones en tándem de la secuencia deseada, y posterior identificación de las dianas usando secuenciación de nueva generación, o alternativamente, secuenciación SMRT directa en el molde cerrado covalentemente, usando la secuencia de unión a cebador como un sitio de unión a cebador.

Nota 4. Si el oligonucleótido(s) también comprende sitios de unión a cebador opcionales (es decir, sitios de unión a cebador universales), para la amplificación por PCR, seguido de la identificación posterior de las dianas podría ser adecuado el uso de secuenciación de nueva generación, ensayos TaqMan, ensayos UniTaq, ensayos de PCR en tiempo real, PCR digital, micromatriz, hibridación, u otro método de detección.

En la variación 2.2 se usan tanto una polimerasa como una ligasa para formar un círculo cerrado covalentemente que contiene una secuencia de identificador único, una secuencia de identificador de paciente opcional, y un sitio de unión a cebador opcional. Esto también se puede conseguir usando solo una ligasa.

Variación 2.3: (véanse por ejemplo, las Figuras 31-32). En esta variación, los conectores cortos que contienen 5-metil C se ligan a los extremos del ADN. A continuación el ADN se trata con bisulfito, lo que hace que las hebras no sean complementarias para que se vuelvan monocatenarias. Algunos ciclos de amplificación por PCR generan productos que ahora no están metilados en los sitios AciI restantes . A continuación estos productos se escinden con AciI. Solo los amplicones de PCR que contienen sitios AciI contiguos (GCGG) que estaban metilados en la diana original generarán fragmentos que ahora son competentes para ligamiento en ambos extremos. Para capturar las regiones sin metilar deseadas, un par de oligonucleótidos parcialmente bicatenarios que comprende una primera sonda oligonucleotídica con una región de sonda en el extremo 5' complementaria a la secuencia del lado 5' de la diana, una secuencia de unión a cebador opcional, una secuencia de identificador de paciente opcional, y una región de sonda en el extremo 3' complementaria a la secuencia del lado 3' de la diana, y una segunda sonda oligonucleotídica que comprende una región en el extremo 5' complementaria a la primera hebra de la sonda oligonucleotídica, una secuencia de identificador único y una región en el extremo 3' complementaria a la primera hebra de la sonda oligonucleotídica, se hibridan con la diana. La adición de ligasa permite el ligamiento del extremo 3' de la diana al extremo 5' de la segunda sonda oligonucleotídica, y el extremo 5' de la diana al extremo 3' de la segunda sonda oligonucleotídica, para formar un producto circular que contiene una secuencia de identificador único, una secuencia de identificador de paciente opcional, y un sitio de unión a cebador opcional. Los productos sin ligar se eliminan por digestión con exonucleasa. Este producto circular es adecuado para etapas adicionales opcionales y secuenciación posterior.

Protocolo detallado para la detección altamente sensible de la no metilación del promotor:

2.3. a. Ligar en conectores que contienen 5-metil C para retener la secuencia después de la conversión con bisulfito. Los extremos diana se reparan con polimerasa T4 y quinasa T4, y posteriormente se genera una protuberancia A en el extremo 3' de una sola base con Klenow (exo-) y dATP. Los conectores tienen una protuberancia T en el extremo 3' de una sola base, de modo que el ligamiento usando ligasa T4 añade conectores en ambos extremos del fragmento. Incubar el ADNcf con bisulfito, que convierte la C regular, pero no la metil-C, en U. El tratamiento con bisulfito convierte las hebras superior e inferior de manera diferente, de modo que después del tratamiento, las hebras ya no serán complementarias entre sí y se fusionarán por separado. 2.3. b. Añadir cebadores, polimerasa Taq y los dNTP y realizar algunos ciclos de PCR para generar productos que ahora están sin metilar en los sitios AciI restantes.

2.3. c. Añadir AciI para escindir los productos que contengan tales sitios. Solo los amplicones de PCR que contienen sitios AciI contiguos (GCGG) que estaban metilados en la diana original generarán fragmentos que están desbloqueados (es decir, competentes para ligamiento con los conectores) en ambos extremos, cuando se escinden con AciI. La polimerasa residual de la polimerasa Taq rellenará la protuberancia de 2 bases (opcionalmente, aumentar la temperatura a 60 °C).

2.3. d. Desnaturalizar el ADN diana (94 °C, 1 minuto) en presencia de pares de oligonucleótidos parcialmente bicatenarios (que comprenden una primera sonda oligonucleotídica con una región de sonda en el extremo 5' complementaria a la secuencia del lado 5' de la diana, una secuencia de unión a cebador opcional, una secuencia de identificador de paciente opcional, y una región de sonda en el extremo 3' complementaria a la secuencia del lado 3' de la diana, y una segunda sonda oligonucleotídica que comprende una región en el extremo 5' complementaria a la primera sonda oligonucleotídica, una secuencia de identificador único y una región en el extremo 3' complementaria a la primera sonda oligonucleotídica), y permitir que los oligonucleótidos se hibriden con sus regiones complementarias en los fragmentos deseados mediante enfriamiento a una temperatura deseada (por ejemplo, 50 °C-60 °C durante 2 horas). Una ligasa termoestable (preferentemente de la cepa AK16D), se añade para permitir el ligamiento a 60 °C para generar productos circulares.

2.3.e. Añadir Exonucleasa I (digiere el ADN monocatenario en la dirección 3'^5'), y Exonucleasa III (digiere el ADN bicatenario en la dirección 3'^5'), para digerir todos los productos sin ligar o mellados, dejando solo el ADN circular monocatenario deseado que comprende una copia del ADN metilado, la secuencia de identificador único, y una secuencia de identificador de paciente opcional. Este producto circular es adecuado para etapas adicionales opcionales y secuenciación posterior.

Nota 1. El producto circular es adecuado para la amplificación por círculo rodante (usando cebadores hexaméricos aleatorios con polimerasa phi-29) para crear repeticiones en tándem de la secuencia deseada, y posterior identificación de las dianas usando secuenciación de nueva generación, o alternativamente, secuenciación SMRT directa en el molde cerrado covalentemente, usando la secuencia de unión a cebador como un sitio de unión a cebador.

Nota 2. Si el oligonucleótido(s) también comprende sitios de unión a cebador opcionales (es decir, sitios de unión a cebador universales), para la amplificación por PCR, seguido de la identificación posterior de las dianas podría ser adecuado el uso de secuenciación de nueva generación, ensayos TaqMan, ensayos UniTaq, ensayos de PCR en tiempo real, PCR digital, micromatriz, hibridación, u otro método de detección.

Base de datos del estado de metilación en sitios de restricción sensibles a metilo contiguos (sitios Acil)

La base de datos del TCGA actual contiene información sobre el estado de metilación de aproximadamente 450.000 sitios CpG en el genoma humano, tanto para tejido normal como para tejido tumoral de muchos sitios tisulares diferentes. Sin embargo, no cubre todos el estado de metilación de sitios AciI contiguos, ni podría distinguir que ambos sitios están metilados en el mismo trozo de ADN genómico.

Por lo tanto, para que el método de ensayo mencionado anteriormente sea el más útil, podría ser útil crear una base de datos del estado de metilación en sitios de restricción AciI contiguos de la misma orientación (GCGG). Este enfoque también incluirá sitios de restricción AciI contiguos de la otra orientación (CCGC), ya que serán GCGG en la hebra opuesta después de la conversión con bisulfito. Un enfoque de ese tipo se ilustra en la Figura 33.

Visión general del enfoque: La idea es generar una genoteca de pequeños fragmentos que solo se podrían haber formado si ambos extremos del fragmento contuvieran sitios de restricción que estuvieran metilados en el ADN genómico original. Esta idea aprovecha una propiedad única de la secuencia de reconocimiento para AciI. La enzima escinde la secuencia de reconocimiento de 3.5 bases GACGG en una orientación, y CACGC en la otra orientación. Comenzar con un sitio AciI metilado y tratar con bisulfito. En la primera orientación (G*CGG), el sitio permanecerá sin cambios, mientras que en la segunda orientación cambiará, cambiará (U*CGU, en donde *C indica 5-meC). Después de algunos ciclos de amplificación por PCR, el primer sitio se convierte en GCGG, que es reconocido por AciI, mientras que el segundo sitio se convierte en TCGT, que no está escindido. Por lo tanto, AciI se puede usar para identificar secuencias metiladas de forma única después del tratamiento con bisulfito. Los fragmentos tienen conectores añadidos con secuencias de identificador único opcional y de identificador de paciente opcional que ahora son susceptibles de ligamiento para crear multímeros de fragmentos que a continuación serán sustratos para etapas adicionales y secuenciación posterior.

Variación 2.3.1: (véase por ejemplo, la Figura 33). Este enfoque muestra cómo descubrir la metilación en sitios AciI contiguos (GC*GG) en todo el genoma. El material de partida puede ser ADN genómico intacto o ADNcf con una longitud promedio de aproximadamente 160 pb. Los conectores cortos que contienen un extremo 5' bloqueado en el extremo de no ligamiento, se ligan en los extremos del ADN. Tratar el ADN con bisulfito, que convierte la C regular, pero no la metil-C, en U. Unos pocos ciclos de amplificación por PCR usando los dNTP sin metilar y cebadores bloqueados en el extremo 5' generan productos que ahora están sin metilar en los sitios AciI restantes. A continuación estos productos se escinden con AciI. Solo los amplicones de PCR que contienen sitios AciI contiguos (GCGG) que estaban metilados en la diana original generarán fragmentos que están desbloqueados (es decir, competentes para ligamiento con los conectores) en ambos extremos, cuando se escinden con AciI. Los conectores que contienen secuencia de identificador único opcional, y secuencia de identificador de paciente opcional se ligan en estos extremos escindidos con AciI rellenos recién generados. Estos nuevos conectores contienen, en su lado de no ligamiento, el extremo 3' bloqueado, o una cadena principal que contiene tiofosfato (que se muestra como **** en la Figura 33). Después de añadir una exonucleasa 3' bicatenaria (es decir, Exonucleasa III), los fragmentos que contienen el conector corto original en uno o ambos lados se digerirán y se volverán monocatenarios. Solo los fragmentos con el nuevo conector ligado a ambos lados permanecerán bicatenarios, ya que el grupo de bloqueo en el extremo 3' o los tiofosfatos inhiben la digestión con la exonucleasa 3'. Los extremos libres de los fragmentos restantes que contienen conector se vuelven competentes para ligamiento, ya sea (i) fosforilando el extremo 5', (ii) retirando el grupo 3' bloqueado, o (iii) usando actividad de nucleasa 5' para escindir la aleta o base coincidente solapante en el extremo 5', dejando un fosfato 5' competente para ligamiento, o cualquier combinación de los mismos. Las condiciones de ligamiento se diseñan para favorecer la multimerización, por ejemplo usando agentes de aglomeración (es decir, PEG al 20 %), y/o mezclando dos conjuntos de productos de ligamiento, en donde la protuberancia del conector en el extremo 5' no palindrómico del primer conjunto es complementaria a la protuberancia del conector en el extremo 5' no palindrómico del segundo conjunto. Los productos de ligamiento comprenden secuencias Acil contiguas en la misma orientación (es decir, GCGG), originalmente metiladas en el ADN diana con secuencia de identificador único y/o secuencia de identificador de paciente opcionales. Este producto es adecuado para etapas adicionales opcionales y secuenciación posterior.

Protocolo detallado para generar una base de datos del estado de metilación en sitios de restricción Acil contiguos:

2.3.1. a. Ligar los conectores que están bloqueados en el extremo 5' del extremo de no ligamiento. Los extremos diana se reparan con polimerasa T4 y quinasa T4, y posteriormente se genera una protuberancia A en el extremo 3' de una sola base con Klenow (exo-) y dATP. Los conectores tienen una protuberancia T en el extremo 3' de una sola base, de modo que el ligamiento usando ligasa T4 añade conectores en ambos extremos del fragmento. Incubar el ADNcf con bisulfito, que convierte la C regular, pero no la metil-C, en U. El tratamiento con bisulfito convierte las hebras superior e inferior de manera diferente, de modo que después del tratamiento, las hebras ya no serán complementarias entre sí y se fusionarán por separado.

2.3.1. b. Añadir cebadores bloqueados en el extremo 5', polimerasa Taq y los dNTP y realizar algunos ciclos de PCR para generar productos que ahora están sin metilar en los sitios AciI restantes.

2.3.1. c. Añadir AciI para escindir los productos que contengan tales sitios. Solo los amplicones de PCR que contienen sitios AciI contiguos (GCGG) que estaban metilados en la diana original generarán fragmentos que están desbloqueados (es decir, competentes para ligamiento con los conectores) en ambos extremos, cuando se escinden con AciI. La polimerasa residual de la polimerasa Taq rellenará la protuberancia de 2 bases (opcionalmente, aumentar la temperatura a 60 °C). Retirar los dNTP (a través de una columna de centrifugación) y volver a añadir solo dATP para generar una protuberancia A en el extremo 3' de una sola base.

2.3.1. d. Usar ligasa T4, añadiendo conectores (que contengan secuencia de identificador único opcional, y secuencia de identificador de paciente opcional) con una protuberancia A en el extremo 3' de una sola base en el extremo de ligamiento a la protuberancia A de una sola base de las secuencias diana escindidas y rellenadas. El lado 5' de no ligamiento del conector contiene una protuberancia en el extremo 5', y, opcionalmente, no está fosforilado. El lado 3' de no ligamiento del conector contiene un grupo de bloqueo en el extremo 3' y/o tiofosfatos para inhibir la digestión con la exonucleasa 3'.

2.3.1. e. Añadir una exonucleasa 3' (es decir, Exonucleasa III) y digerir a 37 °C. Los fragmentos que contienen el conector corto original en uno o ambos lados se digerirán y se volverán monocatenarios. Solo los fragmentos con el nuevo conector ligado a ambos lados permanecerán bicatenarios. La exonucleasa también hará que los conectores se vuelvan monocatenarios. Opcionalmente, retirar los productos de digestión de los fragmentos deseados con una columna de centrifugación.

2.3.1. f Los extremos libres de los fragmentos restantes que contienen conector se vuelven competentes para ligamiento, ya sea (i) fosforilando el extremo 5' usando quinasa T4, (ii) retirando el grupo en el extremo 3' bloqueado, o (iii) usando la actividad de nucleasa 5 '^3 ' de la polimerasa Taq para escindir la aleta o base coincidente solapante en el extremo 5', dejando un fosfato 5' competente para ligamiento, o cualquier combinación de los mismos. Las condiciones de ligamiento se diseñan para favorecer la multimerización. Los productos de ligamiento comprenden multímeros de fragmentos diana con secuencias AciI contiguas originalmente metiladas en el ADN diana con secuencia de identificador único y/o secuencia de identificador de paciente opcionales. Este producto es adecuado para etapas adicionales opcionales y secuenciación posterior.

Nota 1: El extremo 3' del conector bloqueado se puede sintetizar para que contenga un uracilo o un sitio apurínico (AP) en una posición interna al bloqueo, y después del tratamiento con UDG y endonucleasa AP, liberar un extremo 3' competente para ligamiento.

Nota 3: El ligamiento favorecerá la formación de multímeros usando agentes de aglomeración (es decir, PEG al 20 %), y/o mezclando dos conjuntos de productos de ligamiento, en donde la protuberancia del conector en el extremo 5' no palindrómico del primer conjunto es complementaria a la protuberancia del conector en el extremo 5' no palindrómico del segundo conjunto.

Ejemplo profético 3 - Detección de marcadores de no metilación de alta sensibilidad para hipometilación (cuando está presente en un 1 % a un 0,1 %) en ADN plasmático total

La mayoría de los cambios de metilación en los tumores se deben a la hipometilación. Cuando tal hipometilación se produce en una región promotora que anteriormente estaba metilada, puede causar un aumento de la expresión de un gen, tal como un oncogén. Además, las regiones de elementos repetitivos y los elementos móviles se silencian en general mediante metilación general, pero dicho silenciamiento se pierde cuando se produce hipometilación en el tumor.

Aunque las enzimas de restricción sensibles a metilo se pueden usar para ayudar a amplificar e identificar selectivamente niveles bajos de secuencias metiladas, el enfoque no funciona para identificar niveles bajos de secuencias sin metilar. El tratamiento con bisulfito y el uso de cebadores de PCR dirigidos a ADN sin metilar modificado con bisulfito se puede usar, aunque tales cebadores son muy ricos en AT y puede haber dificultades para amplificar todos los fragmentos deseados, especialmente cuando se intenta la PCR multiplexada.

Visión general del enfoque: La idea es copiar fielmente cada fragmento de ADN diana que está sin metilar en sitios de restricción contiguos para las regiones de interés, añadir una secuencia de identificador único, una secuencia de unión a cebador opcional, y un identificador de paciente opcional, y circularizarlos para la secuenciación posterior. La hebra de ADN oligonucleotídica se circulariza y se secuencia. Este enfoque proporciona la ventaja de obtener tanto información sobre el número de copias cuando sea necesario, como los datos de no metilación con el mínimo de secuenciación requerido.

Variación 3.1: (véanse por ejemplo, las Figuras 34 y 35). En esta variación, el ADN se escinde con HinP11 (u otra endonucleasa de restricción sensible a la metilación) para generar extremos 3' y 5' competentes para ligamiento. Para capturar las regiones sin metilar deseadas, las sondas oligonucleotídicas que comprenden una región de sonda en el extremo 5' complementaria a la secuencia del lado 5' de la diana, una secuencia de identificador único, una secuencia de unión a cebador opcional, una secuencia de identificador de paciente opcional, y una región de sonda en el extremo 3' complementaria a la secuencia del lado 3' de la diana, se hibridan con la diana. La adición de ligasa y polimerasa que carecen de actividad de desplazamiento de hebra y actividad de nucleasa tanto 3 '^5 ' como 5'^3', permite la extensión del extremo 3' de la diana sin metilar, seguido de ligamiento al extremo 5' de la diana para formar un producto circular que contiene tanto una secuencia de identificador único como una secuencia de identificador de paciente opcional y un sitio de unión a cebador opcional. Los productos sin ligar se eliminan por digestión con exonucleasa. Este producto circular es adecuado para etapas adicionales opcionales y secuenciación posterior.

3.1a. Escindir el ADNcf aislado con una o más enzimas sensibles a metilo (AciI, HinP1I, Hpy99I, y HpyCH4IV). Este ejemplo ilustra el uso de HinP1I . Inactivar con calor la(s) endonucleasa(s) (65 °C durante 15 minutos) y desnaturalizar el ADN (94 °C, 1 minuto).

3.1b. Desnaturalizar el ADN diana (94 °C, 1 minuto) en presencia de oligonucleótidos (que comprenden una región de sonda en el extremo 5' complementaria a la secuencia del lado 5' de las dianas, una secuencia de identificador único, una secuencia de identificador de paciente opcional, un sitio de unión a cebador opcional y una región de sonda 3' complementaria a la secuencia del lado 3' de las dianas), y permitir que los oligonucleótidos se hibriden con sus regiones complementarias en los fragmentos deseados mediante enfriamiento a una temperatura deseada (por ejemplo, 50°-60 °C durante 2 horas). KlenTaq (polimerasa Taq que carece de actividad de nucleasa), y ligasa termoestable (preferentemente de la cepa AK16D), y los dNTP se añaden para permitir la extensión y el ligamiento a 50 °C, y, opcionalmente, aumentar la temperatura (por ejemplo, 60 °C) para garantizar la finalización de la extensión y el ligamiento, para generar productos circulares.

3.1.c. Añadir Exonucleasa I (digiere el ADN monocatenario en la dirección 3'^5'), y Exonucleasa III (digiere el ADN bicatenario en la dirección 3'^5'), para digerir todos los productos sin ligar o mellados, dejando solo el ADN circular monocatenario deseado que comprende una copia del ADN metilado, la secuencia de identificador único, y una secuencia de identificador de paciente opcional. Este producto circular es adecuado para etapas adicionales opcionales y secuenciación posterior.

Nota 2. El ejemplo anterior usa KlenTaq, una polimerasa que carece de actividad de desplazamiento de hebra, así como actividad de nucleasa tanto 3 '^5 ' como 5'^3'. Si el oligonucleótido tiene un grupo de bloqueo en el lado 5', entonces se puede usar polimerasa con actividad de nucleasa 5'^3'.

Nota 3. El producto circular es adecuado para la amplificación por círculo rodante (usando cebadores hexaméricos aleatorios con polimerasa phi-29) para crear repeticiones en tándem de la secuencia deseada, y posterior identificación de las dianas usando secuenciación de nueva generación, o alternativamente, secuenciación SMRT directa en el molde cerrado covalentemente, usando la secuencia de unión a cebador como un sitio de unión a cebador. Cuando se usa la secuenciación SMRT directa, la pérdida del estado de metilación del ADN del molde original se puede determinar directamente.

Nota 4. Si el oligonucleótido(s) también comprende sitios de unión a cebador opcionales (es decir, sitios de unión a cebador universales), para la amplificación por PCR, seguido de la identificación posterior de las dianas podría ser adecuado el uso de secuenciación de nueva generación, ensayos TaqMan, ensayos UniTaq, ensayos de PCR en tiempo real, PCR digital, micromatriz, hibridación, u otro método de detección. Nota 5. El mismo enfoque se puede usar para identificar regiones que están metiladas en regiones promotoras (véanse por ejemplo, las Figuras 36 y 37). Escindir el ADNcf aislado con un cóctel de enzimas sensibles a metilo (AciI, HinP11, Hpy99I, y HpyCH4IV), así como con enzimas insensibles a metilo (HaeIII y MspI). La figura ilustra esto con sitios AciI metilados, internos a, y flanqueados por dos sitios HaeIII. Este enfoque funcionará incluso si solo hay un sitio de restricción insensible a metilo (véanse por ejemplo, las Figuras 39, 40, 42, 43). Si la endonucleasa de restricción insensible a metilo libera un extremo 3' competente, entonces ese extremo se podría extender en el oligonucleótido con polimerasa Taq (con actividad de nucleasa 5'^3'), y la polimerasa se podría extender y escindir la secuencia en el extremo 5' extra en la diana, generando un fosfato 5' competente para ligamiento en la diana que es adecuado para ligamiento para crear el producto circular (Figura 39). Si la endonucleasa de restricción insensible a metilo libera un fosfato 5' competente, entonces el uso de una polimerasa con actividad de nucleasa 3 '^5 ' podría digerir la secuencia 3' extra en la diana (si fuera necesario), y a continuación, una vez colocada a nivel con la secuencia complementaria en la sonda oligonucleotídica, la polimerasa podría extender la hebra diana hasta el fosfato 5' competente para ligamiento en la diana, y la mella se podría sellar por ligasa para crear el producto circular (Figura 40). Después de digestión con exonucleasa, la supervivencia de la hebra después de la escisión con endonucleasa de restricción sensible a metilo es un marcador de la metilación de esa región. Además, cuando se usa la secuenciación SMRT directa en el molde cerrado covalentemente, se puede determinar el estado de metilación del ADN del molde original.

Nota 6. El mismo enfoque se puede usar para identificar regiones que están metiladas en sitios Bsh1236I de regiones promotoras (véanse por ejemplo, las Figuras 38, 41, 44, 45, 46). Escindir el ADNcf aislado con Bsh1236I (CGCG), así como con enzimas insensibles a metilo (HaeIII). La Figura 38 ilustra esto con sitios Bsh1236I metilados, internos a, y flanqueados por dos sitios HaeIII. Este enfoque funcionará incluso si solo hay un sitio de restricción insensible a metilo (véanse por ejemplo, las Figuras 41, 44, 45). Si la endonucleasa de restricción insensible a metilo libera un extremo 3' competente, entonces ese extremo se podría extender en el oligonucleótido con polimerasa Taq (con actividad de nucleasa 5'^3'), y la polimerasa se podría extender y escindir la secuencia en el extremo 5' extra en la diana, generando un fosfato 5' competente para ligamiento en la diana que es adecuado para ligamiento para crear el producto circular (Figura 38). Si la endonucleasa de restricción insensible a metilo libera un fosfato 5' competente, entonces el uso de una polimerasa con actividad de nucleasa 3 '^5 ' podría digerir la secuencia 3' extra en la diana (si fuera necesario), y a continuación, una vez colocada a nivel con la secuencia complementaria en la sonda oligonucleotídica, la polimerasa podría extender la hebra diana hasta el fosfato 5' competente para ligamiento en la diana, y la mella se podría sellar por ligasa para crear el producto circular (Figuras 41 y 45). Después de digestión con exonucleasa, la supervivencia de la hebra después de la escisión con endonucleasa de restricción sensible a metilo es un marcador de la metilación de esa región. La replicación por círculo rodante usando polimerasa Bst en presencia de BstUI (CGCG) garantiza que los sitios estaban metilados en la muestra original.

En la variación 3.1, se usan tanto una polimerasa como una ligasa para formar un círculo cerrado covalentemente que contiene una secuencia de identificador único, una secuencia de identificador de paciente opcional, y un sitio de unión a cebador opcional. Esto también se puede conseguir usando solo una ligasa.

Variación 3.2: (véanse por ejemplo, las Figuras 47 y 48). En esta variación, el ADN se escinde con HinP11 (u otra endonucleasa de restricción sensible a la metilación) para generar extremos 3' y 5' competentes para ligamiento. Para capturar las regiones sin metilar deseadas, un par de oligonucleótidos parcialmente bicatenarios que comprende una primera sonda oligonucleotídica con una región de sonda en el extremo 5' complementaria a la secuencia del lado 5' de la diana, una secuencia de unión a cebador opcional, una secuencia de identificador de paciente opcional, y una región de sonda en el extremo 3' complementaria a la secuencia del lado 3' de la diana, y una segunda sonda oligonucleotídica que comprende una región en el extremo 5' complementaria a la primera sonda, una secuencia de identificador único y una región en el extremo 3' complementaria a la primera sonda, se hibridan con la diana. La adición de ligasa permite el ligamiento del extremo 3' de la diana al extremo 5' de la segunda sonda oligonucleotídica, y el extremo 5' de la diana al extremo 3' de la segunda sonda oligonucleotídica para formar un producto circular que contiene una secuencia de identificador único, una secuencia de identificador de paciente opcional, y un sitio de unión a cebador opcional. Los productos sin ligar se eliminan por digestión con exonucleasa. Este producto circular es adecuado para etapas adicionales opcionales y secuenciación posterior.

3.2. a. Escindir el ADNcf aislado con una o más enzimas sensibles a metilo (AciI, HinP1I, Hpy99I, y HpyCH4IV). En este ejemplo, se usa HinP1I. Inactivar con calor la(s) endonucleasa(s) (65 °C durante 15 minutos) y desnaturalizar el ADN (94 °C, 1 minuto).

3.2. b. Desnaturalizar el ADN diana (94 °C, 1 minuto) en presencia de pares de oligonucleótidos parcialmente bicatenarios (que comprenden una primera sonda oligonucleotídica con una región de sonda en el extremo 5' complementaria a la secuencia del lado 5' de la diana, una secuencia de unión a cebador opcional, una secuencia de identificador de paciente opcional, y una región de sonda en el extremo 3' complementaria a la secuencia del lado 3' de la diana, y una segunda sonda oligonucleotídica que comprende una región en el extremo 5' complementaria a la primera hebra, una secuencia de identificador único y una región en el extremo 3' complementaria a la primera hebra), y permitir que los oligonucleótidos se hibriden con sus regiones complementarias en los fragmentos deseados mediante enfriamiento a una temperatura deseada (por ejemplo, 50°-60 °C durante 2 horas). Una ligasa termoestable (preferentemente de la cepa AK16D), se añade para permitir el ligamiento a 60 °C para generar productos circulares.

3.2.c. Añadir Exonucleasa I (digiere el ADN monocatenario en la dirección 3'^5'), y Exonucleasa III (digiere el ADN bicatenario en la dirección 3'^5'), para digerir todos los productos sin ligar o mellados, dejando solo el ADN circular monocatenario deseado que comprende una copia del ADN metilado, la secuencia de identificador único, y una secuencia de identificador de paciente opcional. Este producto circular es adecuado para etapas adicionales opcionales y secuenciación posterior.

Nota 1. El producto circular es adecuado para la amplificación por círculo rodante (usando cebadores hexaméricos aleatorios con polimerasa phi-29) para crear repeticiones en tándem de la secuencia deseada, y posterior identificación de las dianas usando secuenciación de nueva generación, o alternativamente, secuenciación SMRT directa en el molde cerrado covalentemente, usando la secuencia de unión a cebador como un sitio de unión a cebador. Cuando se usa la secuenciación SMRT directa, la pérdida del estado de metilación del ADN del molde original se puede determinar directamente.

Nota 2. Si el oligonucleótido(s) también comprende sitios de unión a cebador opcionales (es decir, sitios de unión a cebador universales), para la amplificación por PCR, seguido de la identificación posterior de las dianas podría ser adecuado el uso de secuenciación de nueva generación, ensayos TaqMan, ensayos UniTaq, ensayos de PCR en tiempo real, PCR digital, micromatriz, hibridación, u otro método de detección. Nota 3. El mismo enfoque se puede usar para identificar regiones que están metiladas en regiones promotoras (véanse por ejemplo, las Figuras 49 y 51). Escindir el ADNcf aislado con un cóctel de enzimas sensibles a metilo (AciI, HinP11, Hpy99I, y HpyCH4IV), así como con enzimas insensibles a metilo (HaeIII y MspI). Estas figuras ilustran sitios AciI metilados, internos a, y flanqueados por dos sitios HaeIII. La supervivencia de la hebra después de la escisión con endonucleasa de restricción sensible a metilo es un marcador de la metilación de esa región. Además, cuando se usa la secuenciación SMRT directa en el molde cerrado covalentemente, se puede determinar el estado de metilación del ADN del molde original.

Base de datos del estado de no metilación en sitios de restricción sensibles a metilo contiguos

La base de datos del TCGA actual contiene información sobre el estado de metilación de aproximadamente 450.000 sitios CpG en el genoma humano, tanto para tejido normal como para tejido tumoral de muchos sitios tisulares diferentes. Sin embargo, no cubre todo el estado de no metilación de sitios HinP11 contiguos, ni podría distinguir que ambos sitios no están metilados en el mismo trozo de ADN genómico.

Por lo tanto, para que el método de ensayo mencionado anteriormente sea el más útil, podría ser útil crear una base de datos del estado de no metilación de sitios de restricción sensibles a metilo contiguos. Un enfoque de ese tipo se ilustra en la Figura 51.

Visión general del enfoque: La idea es generar una genoteca de pequeños fragmentos que solo se podrían haber formado si ambos extremos del fragmento contuvieran sitios de restricción que no estaban metilados en el ADN genómico original. Los fragmentos tienen conectores añadidos con secuencias de identificador único opcional y de identificador de paciente opcional que ahora son susceptibles de ligamiento para crear multímeros de fragmentos que a continuación serán sustratos para etapas adicionales y secuenciación posterior.

Variación 3.2.1: (véase por ejemplo, la Figura 51). Este enfoque muestra cómo descubrir la no metilación en sitios HinP1I contiguos (GCGC) en todo el genoma. El material de partida puede ser ADN genómico intacto o ADNcf con una longitud promedio de aproximadamente 160 pb. Los conectores cortos que contienen un extremo 5' bloqueado en el extremo de no ligamiento, se ligan en el ADN diana. Escindir el ADN genómico con HinP11 para fragmentar el ADN en sitios HinP1I sin metilar. Los conectores que contienen secuencia de identificador único opcional, y secuencia de identificador de paciente opcional están ligados a estos extremos escindidos con HinP1I rellenos recién generados. Estos nuevos conectores contienen, en su lado de no ligamiento, el extremo 3' bloqueado, o una cadena principal que contiene tiofosfato (que se muestra como **** en la Figura 51). Después de añadir una exonucleasa 3' bicatenaria (es decir, Exonucleasa III), los fragmentos que contienen el conector corto original en uno o ambos lados se digerirán y se volverán monocatenarios. Solo los fragmentos con el nuevo conector ligado a ambos lados permanecerán bicatenarios, ya que el grupo de bloqueo en el extremo 3' o los tiofosfatos inhiben la digestión con exonucleasa 3'. Los extremos libres de los fragmentos restantes que contienen conector se vuelven competentes para ligamiento, ya sea (i) fosforilando el extremo 5', (ii) retirando el grupo 3' bloqueado, o (iii) usando actividad de nucleasa 5' para escindir la aleta o base coincidente solapante en el extremo 5', dejando un fosfato 5' competente para ligamiento, o cualquier combinación de los mismos. Las condiciones de ligamiento se diseñan para favorecer la multimerización, por ejemplo usando agentes de aglomeración (es decir, PEG al 20 %), y/o mezclando dos conjuntos de productos de ligamiento, en donde la protuberancia del conector en el extremo 5' no palindrómico del primer conjunto es complementaria a la protuberancia del conector en el extremo 5' no palindrómico del segundo conjunto. Los productos de ligamiento comprenden secuencias HinP1I contiguas originalmente no metiladas en el ADN diana con secuencia de identificador único y/o secuencia de identificador de paciente opcionales. Este producto es adecuado para etapas adicionales opcionales y secuenciación posterior.

3.2.1a. Ligar los conectores que están bloqueados en el extremo 5' del extremo de no ligamiento. Los extremos diana se reparan con polimerasa T4 y quinasa T4, y posteriormente se genera una protuberancia A en el extremo 3' de una sola base con Klenow (exo-) y dATP. Los conectores tienen una protuberancia T en el extremo 3' de una sola base, de modo que el ligamiento usando ligasa T4 añade conectores en ambos extremos del fragmento. Escindir el ADN genómico aislado, o ADN enriquecido con metilo con una o más enzimas sensibles a metilo (AciI, HinP1I, Hpy99I, y HpyCH4IV). En este ejemplo, se usó HinP1I. Opcionalmente, inactivar con calor la(s) endonucleasa(s) (65 °C durante 15 minutos).

3.2.1. b. Añadir HinP1I para escindir los productos que contengan dichos sitios. Solo la diana que contiene sitios HinP1I contiguos (GCGC) que estaban sin metilar en la diana original generarán fragmentos que están sin bloquear (es decir, competentes para ligamiento con los conectores) en ambos extremos, cuando se escinden con HinP1I. La polimerasa residual de la polimerasa Taq rellenará la protuberancia de 2 bases (opcionalmente, aumentar la temperatura a 60 °C). Retirar los dNTP (a través de una columna de centrifugación) y añadir solo dATP para generar una protuberancia A en el extremo 3' A de una sola base.

3.2.1. c. Usar ligasa T4, añadiendo conectores (que contengan secuencia de identificador único opcional, y secuencia de identificador de paciente opcional) con una protuberancia A en el extremo 3' de una sola base en el extremo de ligamiento a la protuberancia A de una sola base de las secuencias diana escindidas y rellenadas. El lado 5' de no ligamiento del conector contiene una protuberancia en el extremo 5', y, opcionalmente, no está fosforilado. El lado 3' de no ligamiento del conector contiene un grupo de bloqueo en el extremo 3' y/o tiofosfatos para inhibir la digestión con la exonucleasa 3'.

3.2.1. d. Añadir una exonucleasa 3' (es decir, Exonucleasa III) y digerir a 37 °C. Los fragmentos que contienen el conector corto original en uno o ambos lados se digerirán y se volverán monocatenarios. Solo los fragmentos con el nuevo conector ligado a ambos lados permanecerán bicatenarios. La exonucleasa también hará que los conectores se vuelvan monocatenarios. Opcionalmente, retirar los productos de digestión de los fragmentos deseados con una columna de centrifugación.

3.2.1.1. e. Los extremos libres de los fragmentos restantes que contienen conector se vuelven competentes para ligamiento, ya sea (i) fosforilando el extremo 5' usando quinasa T4, (ii) retirando el grupo en el extremo 3' bloqueado, o (iii) usando la actividad de nucleasa 5 '^3 ' de la polimerasa Taq para escindir la aleta o base coincidente solapante en el extremo 5', dejando un fosfato 5' competente para ligamiento, o cualquier combinación de los mismos. Las condiciones de ligamiento se diseñan para favorecer la multimerización. Los productos de ligamiento comprenden multímeros de fragmentos diana con secuencias HinP1I contiguas originalmente metiladas en el ADN diana con secuencia de identificador único y/o secuencia de identificador de paciente opcionales. Este producto es adecuado para etapas adicionales opcionales y secuenciación posterior.

Nota 4. El mismo enfoque se puede usar para identificar regiones que están metiladas en regiones promotoras (véase por ejemplo, la Figura 52). Escindir el ADNcf aislado con un cóctel de enzimas sensibles a metilo (AciI, HinP1I, Hpy99I, y HpyCH4IV), y ligar en los conectores cortos con los extremos 5' bloqueados. A continuación, escindir la diana con enzimas insensibles a metilo (HaeIII y MspI). AciI y HaeIII se ilustran en esta figura. La supervivencia de la hebra después de la escisión con endonucleasa de restricción sensible a metilo es un marcador de la metilación de esa región. Solo los sitios HaeIII contiguos (GGCC) con sitios AciI metilados en la diana original generan fragmentos no bloqueados cuando se escinden con HaeIII. El ligamiento posterior de conectores más largos es como se ha descrito anteriormente. Cuando se usa la secuenciación SMRT directa en los productos ligados, se puede determinar el estado de metilación del ADN del molde original.

Detección de sitios contiguos no metilados en la región promotora

Puede existir el deseo de determinar el estado de no metilación de las secuencias de CpG entre dos sitios de restricción sensibles a metilo en una región promotora. Esto es similar a los enfoques mencionados anteriormente, e incluye una etapa extra de tratamiento con bisulfito.

Visión general del enfoque: La idea es copiar fielmente cada fragmento de ADN diana que está sin metilar en sitios de restricción contiguos para las regiones de interés, tratar con bisulfito, añadir una secuencia de identificador único, una secuencia de unión a cebador opcional, y un identificador de paciente opcional, y circularizarlos para la secuenciación posterior. La hebra de ADN oligonucleotídica se circulariza y se secuencia. Este enfoque proporciona la ventaja de obtener tanto información sobre el número de copias cuando sea necesario, como los datos de no metilación con el mínimo de secuenciación requerido.

Variación 3.3: (véanse por ejemplo, las Figuras 53 y 54). En esta variación, el ADN se escinde con HinP11 (u otra endonucleasa de restricción sensible a la metilación) para generar extremos 3' y 5' competentes para ligamiento. A continuación el ADN se trata con bisulfito, lo que hace que las hebras no sean complementarias para que se vuelvan monocatenarias. Para capturar las regiones sin metilar deseadas, las sondas oligonucleotídicas que comprenden una región de sonda en el extremo 5' complementaria a la secuencia del lado 5' de la diana, una secuencia de identificador único, una secuencia de unión a cebador opcional, una secuencia de identificador de paciente opcional, y una región de sonda en el extremo 3' complementaria a la secuencia del lado 3' de la diana, se hibridan con la diana. La adición de ligasa y polimerasa que carecen de actividad de desplazamiento de hebra y actividad de nucleasa tanto 3 '^5 ' como 5'^3', permite la extensión del extremo 3' de la diana sin metilar, seguido de ligamiento al extremo 5' de la diana para formar un producto circular que contiene una secuencia de identificador único, una secuencia de identificador de paciente opcional, y un sitio de unión a cebador opcional. Los productos sin ligar se eliminan por digestión con exonucleasa. Este producto circular es adecuado para etapas adicionales opcionales y secuenciación posterior.

3.3. a. Escindir el ADNcf aislado con una o más enzimas sensibles a metilo (AciI, HinP1I, Hpy99I, y HpyCH4IV). Este ejemplo describe HinP1I. Inactivar con calor la(s) endonucleasa(s) (65 °C durante 15 minutos) y desnaturalizar el ADN (94 °C, 1 minuto). Incubar el ADNcf con bisulfito, que convierte la C regular, pero no la metil-C, en U. El tratamiento con bisulfito convierte las hebras superior e inferior de manera diferente, de modo que después del tratamiento, las hebras ya no serán complementarias entre sí y se fusionarán por separado. 3.3. b. Desnaturalizar el ADN diana (94 °C, 1 minuto, si fuera necesario) en presencia de oligonucleótidos (que comprenden una región de sonda en el extremo 5' complementaria a las secuencias en el lado 5' de las dianas, una secuencia de identificador único, una secuencia de identificador de paciente opcional, un sitio de unión a cebador opcional, y una región de sonda en el extremo 3' complementaria a las secuencias en el lado 3' de las dianas), y permitir que los oligonucleótidos se hibriden con sus regiones complementarias en los fragmentos deseados mediante enfriamiento a una temperatura deseada (por ejemplo, 50 °C-60 °C durante 2 horas). KlenTaq (polimerasa Taq que carece de actividad de nucleasa), y ligasa termoestable (preferentemente de la cepa AK16D), y los dNTP se añaden para permitir la extensión y el ligamiento a 50 °C, y, opcionalmente, aumentar la temperatura (por ejemplo, 60 °C) para garantizar la finalización de la extensión y el ligamiento, para generar productos circulares.

3.3. c. Añadir Exonucleasa I (digiere el ADN monocatenario en la dirección 3'^5'), y Exonucleasa III (digiere el ADN bicatenario en la dirección 3'^5'), para digerir todos los productos sin ligar o mellados, dejando solo el ADN circular monocatenario deseado que comprende una copia del ADN metilado, la secuencia de identificador único, y una secuencia de identificador de paciente opcional. Este producto circular es adecuado para etapas adicionales opcionales y secuenciación posterior.

Nota 4. Si el oligonucleótido(s) también comprende sitios de unión a cebador opcionales (es decir, sitios de unión a cebador universales), para la amplificación por PCR, seguido de la identificación posterior de las dianas podría ser adecuado el uso de secuenciación de nueva generación, ensayos TaqMan, ensayos UniTaq, ensayos de PCR en tiempo real, PCR digital, micromatriz, hibridación, u otro método de detección. En la variación 3.3 se usaron tanto una polimerasa como una ligasa para formar un círculo cerrado covalentemente que contenía una secuencia de identificador único, una secuencia de identificador de paciente opcional, y un sitio de unión a cebador opcional. Esto también se puede conseguir usando solo una ligasa.

Variación 3.4: (véanse por ejemplo, las Figuras 55 y 56). En esta variación, el ADN se escinde con HinP11 (u otra endonucleasa de restricción sensible a la metilación) para generar extremos 3' y 5' competentes para ligamiento, seguido de tratamiento con bisulfito. Para capturar las regiones sin metilar deseadas, un par de oligonucleótidos parcialmente bicatenarios que comprende una primera sonda oligonucleotídica con una región de sonda en el extremo 5' complementaria a la secuencia del lado 5' de la diana, una secuencia de unión a cebador opcional, una secuencia de identificador de paciente opcional, y una región de sonda en el extremo 3' complementaria a la secuencia del lado 3' de la diana, y una segunda sonda oligonucleotídica que comprende una región en el extremo 5' complementaria a la primera sonda, una secuencia de identificador único y una región en el extremo 3' complementaria a la primera sonda, se hibridan con la diana. La adición de ligasa permite el ligamiento al extremo 3' de la diana al extremo 5' de la segunda sonda oligonucleotídica, y el extremo 5' de la diana al extremo 3' de la segunda sonda oligonucleotídica, para formar un producto circular que contiene una secuencia de identificador único, una secuencia de identificador de paciente opcional, y un sitio de unión a cebador opcional. Los productos sin ligar se eliminan por digestión con exonucleasa. Este producto circular es adecuado para etapas adicionales opcionales y secuenciación posterior.

3.4. a. Escindir el ADNcf aislado con una o más enzimas sensibles a metilo (AciI, HinP1I, Hpy99I, y HpyCH4IV). Este ejemplo usa HinP1I. Inactivar con calor la(s) endonucleasa(s) (65 °C durante 15 minutos) y desnaturalizar el ADN (94 °C, 1 minuto). Incubar el ADNcf con bisulfito, que convierte la C regular, pero no la metil-C, en U. El tratamiento con bisulfito convierte las hebras superior e inferior de manera diferente, de modo que después del tratamiento, las hebras ya no serán complementarias entre sí y se fusionarán por separado.

3.4. b. Desnaturalizar el ADN diana (94 °C, 1 minuto) en presencia de pares de oligonucleótidos parcialmente bicatenarios (que comprenden una primera sonda oligonucleotídica con una región de sonda en el extremo 5' complementaria a las secuencias en el lado 5' de la diana, una secuencia de unión a cebador opcional, una secuencia de identificador de paciente opcional, y una región de sonda en el extremo 3' complementaria a las secuencias en el lado 3' de la diana, y una segunda sonda oligonucleotídica que comprende una región en el extremo 5' complementaria a la primera hebra, una secuencia de identificador único y una región en el extremo 3' complementaria a la primera hebra), y permitir que los oligonucleótidos se hibriden con sus regiones complementarias en los fragmentos deseados mediante enfriamiento a una temperatura deseada (por ejemplo, 50°-60 °C durante 2 horas). Una ligasa termoestable (preferentemente de la cepa AK16D), se añade para permitir el ligamiento a 60 °C para generar productos circulares.

3.4. c. Añadir Exonucleasa I (digiere el ADN monocatenario en la dirección 3'^5'), y Exonucleasa III (digiere el ADN bicatenario en la dirección 3'^5'), para digerir todos los productos sin ligar o mellados, dejando solo el ADN circular monocatenario deseado que comprende una copia del ADN metilado, la secuencia de identificador único, y una secuencia de identificador de paciente opcional. Este producto circular es adecuado para etapas adicionales opcionales y secuenciación posterior.

La base de datos del TCGA actual contiene información sobre el estado de metilación de aproximadamente 450.000 sitios CpG en el genoma humano, tanto para tejido normal como para tejido tumoral de muchos sitios tisulares diferentes. Sin embargo, no cubre todo el estado de no metilación de sitios HinP1I contiguos, ni los sitios CpG entre esos sitios, ni podría distinguir que ambos sitios no están metilados en el mismo trozo de ADN genómico.

Por lo tanto, para que el método de ensayo mencionado anteriormente sea el más útil, podría ser útil crear una base de datos del estado de no metilación de sitios de restricción sensibles a metilo contiguos. Un enfoque de ese tipo se ilustra en la Figura 57.

Visión general del enfoque: La idea es generar una genoteca de pequeños fragmentos que solo se podrían haber formado si ambos extremos del fragmento contuvieran sitios de restricción que no estaban metilados en el ADN genómico original. Los fragmentos tienen conectores añadidos con secuencias de identificador único opcional y de identificador de paciente opcional que ahora son susceptibles de ligamiento para crear multímeros de fragmentos, seguido de tratamiento con bisulfito para revelar las posiciones de metilación o no metilación, que a continuación serán sustratos para etapas adicionales y secuenciación posterior.

Variación 3.4.1: (véase por ejemplo, la Figura 57). Este enfoque muestra cómo descubrir la no metilación en sitios HinP1I contiguos (GCGC) en todo el genoma. El material de partida puede ser ADN genómico intacto o ADNcf con una longitud promedio de aproximadamente 160 pb. Los conectores cortos que contienen un extremo 5' bloqueado en el extremo de no ligamiento, se ligan en el ADN diana. Escindir el ADN genómico con HinP11 para fragmentar el ADN en sitios HinP1I sin metilar. Los conectores que contienen secuencia de identificador único opcional, y secuencia de identificador de paciente opcional están ligados a estos extremos escindidos con HinP1I rellenos recién generados. Estos nuevos conectores contienen, en su lado de no ligamiento, el extremo 3' bloqueado, o una cadena principal que contiene tiofosfato (que se muestra como **** en la Figura 57). Después de añadir una exonucleasa 3' bicatenaria (es decir, Exonucleasa III), los fragmentos que contienen el conector corto original en uno o ambos lados se digerirán y se volverán monocatenarios. Solo los fragmentos con el nuevo conector ligado a ambos lados permanecerán bicatenarios, ya que el grupo de bloqueo en el extremo 3' o los tiofosfatos inhiben la digestión con la exonucleasa 3'. Los extremos libres de los fragmentos restantes que contienen conector se vuelven competentes para ligamiento, ya sea (i) fosforilando el extremo 5', (ii) retirando el grupo 3' bloqueado, o (iii) usando actividad de nucleasa 5' para escindir la aleta o base coincidente solapante en el extremo 5', dejando un fosfato 5' competente para ligamiento, o cualquier combinación de los mismos. Las condiciones de ligamiento se diseñan para favorecer la multimerización, por ejemplo usando agentes de aglomeración (es decir, PEG al 20 %), y/o mezclando dos conjuntos de productos de ligamiento, en donde la protuberancia del conector en el extremo 5' no palindrómico del primer conjunto es complementaria a la protuberancia del conector en el extremo 5' no palindrómico del segundo conjunto. Los productos de ligamiento comprenden secuencias HinP1I contiguas originalmente no metiladas en el ADN diana con secuencia de identificador único y/o secuencia de identificador de paciente opcionales. A continuación el producto se incuba con bisulfito, que convierte la C regular, pero no la metil-C, en U. El tratamiento con bisulfito convierte las hebras superior e inferior de manera diferente, de modo que después del tratamiento, las hebras ya no serán complementarias entre sí y se fusionarán por separado. Estos productos monocatenarios son adecuados para etapas adicionales opcionales y secuenciación posterior.

3.4.1a. Ligar los conectores que están bloqueados en el extremo 5' del extremo de no ligamiento. Los extremos diana se reparan con polimerasa T4 y quinasa T4, y posteriormente se genera una protuberancia A en el extremo 3' de una sola base con Klenow (exo-) y dATP. Los conectores tienen una protuberancia T en el extremo 3' de una sola base, de modo que el ligamiento usando ligasa T4 añade conectores en ambos extremos del fragmento. Escindir el ADN genómico aislado, o ADN enriquecido con metilo con una o más enzimas sensibles a metilo (AciI, HinP1I, Hpy99I, y HpyCH4IV). En este ejemplo, se usa HinP1I. Opcionalmente, inactivar con calor la(s) endonucleasa(s) (65 °C durante 15 minutos).

3.4.1. b. Añadir HinP1I para escindir los productos que contengan dichos sitios. Solo la diana que contiene sitios HinP1I contiguos (GCGC) que estaban sin metilar en la diana original generarán fragmentos que están sin bloquear (es decir, competentes para ligamiento con los conectores) en ambos extremos, cuando se escinden con HinP1I. La polimerasa residual de la polimerasa Taq rellenará la protuberancia de 2 bases (opcionalmente, aumentar la temperatura a 60 °C). Retirar los dNTP (a través de una columna de centrifugación) y volver a añadir solo dATP para generar una protuberancia A en el extremo 3' de una sola base.

3.4.1. c. Usar ligasa T4, añadiendo conectores (que contengan secuencia de identificador único opcional, y secuencia de identificador de paciente opcional) con una protuberancia A en el extremo 3' de una sola base en el extremo de ligamiento a la protuberancia A de una sola base de las secuencias diana escindidas y rellenadas. El lado 5' de no ligamiento del conector contiene una protuberancia en el extremo 5', y, opcionalmente, no está fosforilado. El lado 3' de no ligamiento del conector contiene un grupo de bloqueo en el extremo 3' y/o tiofosfatos para inhibir la digestión con la exonucleasa 3'.

3.4.1. d. Añadir una exonucleasa 3' (es decir, Exonucleasa III) y digerir a 37 °C. Los fragmentos que contienen el conector corto original en uno o ambos lados se digerirán y se volverán monocatenarios. Solo los fragmentos con el nuevo conector ligado a ambos lados permanecerán bicatenarios. La exonucleasa también hará que los conectores se vuelvan monocatenarios. Opcionalmente, retirar los productos de digestión de los fragmentos deseados con una columna de centrifugación.

3.4.1.1e. Los extremos libres de los fragmentos restantes que contienen conector se vuelven competentes para ligamiento, ya sea (i) fosforilando el extremo 5' usando quinasa T4, (ii) retirando el grupo en el extremo 3' bloqueado, o (iii) usando la actividad de nucleasa 5 '^3 ' de la polimerasa Taq para escindir la aleta o base coincidente solapante en el extremo 5', dejando un fosfato 5' competente para ligamiento, o cualquier combinación de los mismos. Las condiciones de ligamiento se diseñan para favorecer la multimerización. Los productos de ligamiento comprenden multímeros de fragmentos diana con secuencias HinP1I contiguas originalmente metiladas en el ADN diana con secuencia de identificador único y/o secuencia de identificador de paciente opcionales. Incubar los productos de ligamiento con bisulfito, que convierte la C regular, pero no la metil-C, en U. El tratamiento con bisulfito convierte las hebras superior e inferior de manera diferente, de modo que después del tratamiento, las hebras ya no serán complementarias entre sí y se fusionarán por separado. Estos productos monocatenarios son adecuados para etapas adicionales opcionales y secuenciación posterior.

Nota 1: El extremo 3' del conector bloqueado más largo se puede sintetizar para que contenga un uracilo o un sitio apurínico (AP) en una posición interna al bloqueo, y después del tratamiento con UDG y endonucleasa AP, liberar un extremo 3' competente para ligamiento. Además, estos conectores se pueden sintetizar con 5-metil C, de modo que después del tratamiento con bisulfito conserven su estado original.

Detección del estado de no metilación de sitios CpG individuales dentro de una región determinada

El enfoque anterior es ideal para identificar y enumerar fragmentos que contienen sitios HinP11 sin metilar contiguos como un sustituto de la no metilación dentro de ese fragmento de ADN. Sin embargo, para algunas aplicaciones, es importante identificar el estado de no metilación de sitios CpG individuales dentro de una región determinada. Por lo tanto puede ser necesario tratar el ADN entrante con bisulfito, que convierte la C regular, pero no la metil-C, en U.

Visión general del enfoque usando bisulfito: La idea es copiar fielmente cada fragmento de ADN diana que está sin metilar en sitios de restricción HphI contiguos de la secuencia (GGTGA) para las regiones de interés, tratar con bisulfito (convertir GGCGA en GGTGA), añadir una secuencia de identificador único, una secuencia de unión a cebador opcional, y un identificador de paciente opcional, y circularizarlos para la secuenciación posterior. La hebra de ADN oligonucleotídica se circulariza y se secuencia. Este enfoque proporciona la ventaja de obtener, tanto información sobre el número de copias cuando sea necesario, como de los datos de metilación con el mínimo de secuenciación requerido.

La idea aprovecha una propiedad única de la secuencia de reconocimiento para HphI. La enzima escinde la secuencia de reconocimiento de 4.5 bases GGTGA en una orientación, y TCACC en la otra orientación. Si el sitio GGCGA sin metilar se trata con bisulfito, en la primera orientación, el sitio se convertirá en una secuencia de reconocimiento de HphI GGTGA. Después de algunos ciclos de amplificación por PCR, la 5-metil C se convierte en C, mientras que el U se convierte en T. Cuando se escinde con HphI, solo los sitios contiguos sin metilar en la diana original crearán fragmentos que son competentes para ligamiento en ambos extremos 3' y 5'.

Una característica única de este enfoque es que la conversión con bisulfito crea dos hebras no complementarias. Por lo tanto, la hebra superior tendrá secuencias GGCGA o GGTGA contiguas, e incluso si hay una secuencia TCACC que interviene, no importa porque se convierte en TUAUU, que no se reconoce como un sitio HphI. Incluso mejor, las secuencias en la hebra superior de la forma TCGCC serán GGCGA en la hebra inferior. La hebra inferior también se puede usar para consultar el estado de metilación, y, dado que las dos secuencias ahora son muy diferentes, las sondas oligonucleotídicas para la hebra superior e inferior no se hibridarán entre sí, solo con las dianas convertidas. Por lo tanto, este enfoque permite obtener un estado detallado de metilación en el promotor usando información de las hebras superior e inferior.

El principio de tratar el ADN con bisulfito para convertir el ADN sin metilar en una secuencia que es escindible por una enzima de restricción, pero que, si está metilado, no es escindible por esa misma enzima de restricción, se puede extender a algunos sitios de restricción adicionales. Por ejemplo, la secuencia CCGTC se convertirá en un sitio BccI (CCATC), siempre que el CG interno no esté metilado. (Esto es el resultado de la conversión de la hebra opuesta, es decir, GACGG en la secuencia de reconocimiento de la hebra opuesta de BccI; es decir, GATGG). Del mismo modo, la secuencia GGACG se convertirá en un sitio FokI (GGATG) siempre que el CG interno no esté metilado. Por lo tanto, las variaciones que se consideran a continuación para HphI son igualmente válidas para, pero sin limitarse a, las endonucleasas de restricción BccI, FokI, y sus isoesquizómeros.

Variación 3.5: (véanse por ejemplo, las Figuras 58 y 59). En esta variación, los conectores cortos que contienen 5-metil C se ligan a los extremos del ADN. A continuación el ADN se trata con bisulfito, lo que hace que las hebras no sean complementarias para que se vuelvan monocatenarias. Algunos ciclos de amplificación por PCR generan productos que ahora están sin metilar en los sitios HphI. A continuación estos productos se escinden con HphI. Solo los amplicones de PCR que contienen sitios "HphI" contiguos (GGCGA, o GGTGA) que estaban sin metilar en la diana original generaran fragmentos que ahora son competentes para ligamiento en ambos extremos. Para capturar las regiones deseadas, las sondas oligonucleotídicas que comprenden una región de sonda en el extremo 5' complementaria a la secuencia del lado 5' de la diana, una secuencia de identificador único, una secuencia de unión a cebador opcional, una secuencia de identificador de paciente opcional, y una región de sonda en el extremo 3' complementaria a la secuencia del lado 3' de la diana, se hibridan con la diana. La adición de ligasa y polimerasa que carecen de actividad de desplazamiento de hebra y actividad de nucleasa tanto 3 '^5 ' como 5'^3', permite la extensión del extremo 3' de la diana sin metilar, seguido de ligamiento al extremo 5' de la diana para formar un producto circular que contiene una secuencia de identificador único, una secuencia de identificador de paciente opcional, y un sitio de unión a cebador opcional. Los productos sin ligar se eliminan por digestión con exonucleasa. Este producto circular es adecuado para etapas adicionales opcionales y secuenciación posterior.

3.5. a. Ligar en conectores que contienen 5-metil C para retener la secuencia después de la conversión con bisulfito. Los extremos diana se reparan con polimerasa T4 y quinasa T4, y posteriormente se genera una protuberancia A en el extremo 3' de una sola base con Klenow (exo-) y dATP. Los conectores tienen una protuberancia T en el extremo 3' de una sola base, de modo que el ligamiento usando ligasa T4 añade conectores en ambos extremos del fragmento. Incubar el ADNcf con bisulfito, que convierte la C regular, pero no la metil-C, en U. El tratamiento con bisulfito convierte las hebras superior e inferior de manera diferente, de modo que después del tratamiento, las hebras ya no serán complementarias entre sí y se fusionarán por separado. 3.5. b. Añadir cebadores, polimerasa Taq y los dNTP y realizar algunos ciclos de PCR para generar productos que ahora están sin metilar en los sitios HphI restantes.

3.5. c. Añadir HphI para escindir los productos que contienen tales sitios. Solo los amplicones de PCR que contienen sitios HphI contiguos (GGCGA o GGTGA) que estaban sin metilar en la diana original generarán fragmentos que están sin bloquear (es decir, competentes para ligamiento con los conectores) en ambos extremos, cuando se escinden con HphI.

3.5. d. Desnaturalizar el ADN diana (94 °C, 1 minuto) en presencia de oligonucleótidos (que comprenden una región de sonda en el extremo 5' complementaria a las secuencias en el lado 5' de las dianas, una secuencia de identificador único, una secuencia de identificador de paciente opcional, un sitio de unión a cebador opcional, y una región de sonda en el extremo 3' complementaria a las secuencias en el lado 3' de las dianas), y permitir que los oligonucleótidos se hibriden con sus regiones complementarias en los fragmentos deseados mediante enfriamiento a una temperatura deseada (por ejemplo, 50 °C-60 °C durante 2 horas). KlenTaq (polimerasa Taq que carece de actividad de nucleasa), y ligasa termoestable (preferentemente de la cepa AK16D), y los dNTP se añaden para permitir la extensión y el ligamiento a 50 °C, y, opcionalmente, aumentar la temperatura (por ejemplo, 60 °C) para garantizar la finalización de la extensión y el ligamiento, para generar productos circulares.

3.5. e. Añadir Exonucleasa I (digiere el ADN monocatenario en la dirección 3'^5'), y Exonucleasa III (digiere el ADN bicatenario en la dirección 3'^5'), para digerir todos los productos sin ligar o mellados, dejando solo el ADN circular monocatenario deseado que comprende una copia del ADN metilado, la secuencia de identificador único, y una secuencia de identificador de paciente opcional. Este producto circular es adecuado para etapas adicionales opcionales y secuenciación posterior.

Nota 4. Si la sonda oligonucleotídica también comprende sitios de unión a cebador opcionales (es decir, sitios de unión a cebador universales), para la amplificación por PCR, seguido de la identificación posterior de las dianas podría ser adecuado el uso de secuenciación de nueva generación, ensayos TaqMan, ensayos UniTaq, ensayos de PCR en tiempo real, PCR digital, micromatriz, hibridación, u otro método de detección.

En la variación 3.5, una polimerasa y una ligasa se usan para formar un círculo cerrado covalentemente que contiene una secuencia de identificador único, una secuencia de identificador de paciente opcional, y un sitio de unión a cebador opcional. Esto también se puede conseguir usando solo una ligasa.

Variación 3.6: (véanse por ejemplo, las Figuras 60 y 61). En esta variación, los conectores cortos que contienen 5-metil C se ligan a los extremos del ADN. A continuación el ADN se trata con bisulfito, lo que hace que las hebras no sean complementarias para que se vuelvan monocatenarias. Algunos ciclos de amplificación por PCR generan productos que ahora están sin metilar en los sitios HphI. A continuación estos productos se escinden con HphI. Solo los amplicones de PCR que contienen sitios "HphI" contiguos (GGCGA, o GGTGA) que estaban sin metilar en la diana original generaran fragmentos que ahora son competentes para ligamiento en ambos extremos. Para capturar las regiones sin metilar deseadas, un par de oligonucleótidos parcialmente bicatenarios que comprende una primera sonda oligonucleotídica con una región de sonda en el extremo 5' complementaria a la secuencia del lado 5' de la diana, una secuencia de unión a cebador opcional, una secuencia de identificador de paciente opcional, y una región de sonda en el extremo 3' complementaria a la secuencia del lado 3' de la diana, y una segunda sonda oligonucleotídica que comprende una región en el extremo 5' complementaria a la primera hebra, una secuencia de identificador único y una región en el extremo 3' complementaria a la primera hebra, se hibridan con la diana. La adición de ligasa permite el ligamiento del extremo 3' de la diana al extremo 5' de la segunda sonda oligonucleotídica, y el extremo 5' de la diana al extremo 3' de la segunda sonda oligonucleotídica, para formar un producto circular que contiene una secuencia de identificador único, una secuencia de identificador de paciente opcional, y un sitio de unión a cebador opcional. Los productos sin ligar se eliminan mediante digestión con exonucleasa. Este producto circular es adecuado para etapas adicionales opcionales y secuenciación posterior.

3.6. a. Ligar en conectores que contienen 5-metil C para retener la secuencia después de la conversión con bisulfito. Los extremos diana se reparan con polimerasa T4 y quinasa T4, y posteriormente se genera una protuberancia A en el extremo 3' de una sola base con Klenow (exo-) y dATP. Los conectores tienen una protuberancia T en el extremo 3' de una sola base, de modo que el ligamiento usando ligasa T4 añade conectores en ambos extremos del fragmento. Incubar el ADNcf con bisulfito, que convierte la C regular, pero no la metil-C, en U. El tratamiento con bisulfito convierte las hebras superior e inferior de manera diferente, de modo que después del tratamiento, las hebras ya no serán complementarias entre sí y se fusionarán por separado. 3.6. b. Añadir cebadores, polimerasa Taq y los dNTP y realizar algunos ciclos de PCR para generar productos que ahora están sin metilar en los sitios HphI restantes.

3.6. c. Añadir HphI para escindir los productos que contienen tales sitios. Solo los amplicones de PCR que contienen sitios HphI contiguos (GGCGA o GGTGA) que estaban sin metilar en la diana original generarán fragmentos que están sin bloquear (es decir, competentes para ligamiento con los conectores) en ambos extremos, cuando se escinden con HphI.

3.6. d. Desnaturalizar el ADN diana (94 °C, 1 minuto) en presencia de pares de oligonucleótidos parcialmente bicatenarios (que comprenden una primera sonda oligonucleotídica con una región de sonda en el extremo 5' complementaria a la secuencia del lado 5' de la diana, una secuencia de unión a cebador opcional, una secuencia de identificador de paciente opcional, y una región de sonda en el extremo 3' complementaria a la secuencia del lado 3' de la diana, y una segunda sonda oligonucleotídica que comprende una región en el extremo 5' complementaria a la primera hebra, una secuencia de identificador único y una región en el extremo 3' complementaria a la primera hebra), y permitir que los oligonucleótidos se hibriden con sus regiones complementarias en los fragmentos deseados mediante enfriamiento a una temperatura deseada (por ejemplo, 50°-60 °C durante 2 horas). Una ligasa termoestable (preferentemente de la cepa AK16D), se añade para permitir el ligamiento a 60 °C para generar productos circulares.

3.6. e. Añadir Exonucleasa I (digiere el ADN monocatenario en la dirección 3'^5'), y Exonucleasa III (digiere el ADN bicatenario en la dirección 3'^5'), para digerir todos los productos sin ligar o mellados, dejando solo el ADN circular monocatenario deseado que comprende una copia del ADN metilado, la secuencia de identificador único, y una secuencia de identificador de paciente opcional. Este producto circular es adecuado para etapas adicionales opcionales y secuenciación posterior.

Nota 2. Si la sonda oligonucleotídica también comprende sitios de unión a cebador opcionales (es decir, sitios de unión a cebador universales), para la amplificación por PCR, seguido de la identificación posterior de las dianas podría ser adecuado el uso de secuenciación de nueva generación, ensayos TaqMan, ensayos UniTaq, ensayos de PCR en tiempo real, PCR digital, micromatriz, hibridación, u otro método de detección.

Base de datos del estado de metilación en sitios de restricción HphI contiguos

La base de datos del TCGA actual contiene información sobre el estado de metilación de aproximadamente 450.000 sitios CpG en el genoma humano, tanto para tejido normal como para tejido tumoral de muchos sitios tisulares diferentes. Sin embargo, no cubre todo el estado de no metilación de sitios AciI contiguos, ni podría distinguir que ambos sitios están metilados en el mismo trozo de ADN genómico.

Por lo tanto, para que el método de ensayo mencionado anteriormente sea el más útil, podría ser útil crear una base de datos del estado de metilación en sitios de restricción HphI contiguos de la misma orientación (GGCGA convertido en GGTGA). Este enfoque también incluirá sitios de restricción HphI contiguos de la otra orientación (TCACC y TCGCC), ya que serán GGTGA en la hebra opuesta después de la conversión con bisulfito. Un enfoque de ese tipo se ilustra en la Figura 62.

Visión general del enfoque: La idea es generar una genoteca de pequeños fragmentos que solo se podrían haber formado si ambos extremos del fragmento contuvieran GGCGA convertido (en GGTGA) que no estaban metilados en el ADN genómico original. La idea aprovecha una propiedad única de la secuencia de reconocimiento para HphI. La enzima escinde la secuencia de reconocimiento de 4.5 bases GGTGA en una orientación, y TCACC en la otra orientación. Si un sitio GGCGA sin metilar se trata con bisulfito, en la primera orientación, t el sitio se convertirá en una secuencia de reconocimiento de HphI GGTGA. Después de algunos ciclos de amplificación por PCR, la 5-metil C se convierte en C, mientras que el U se convierte en T. Cuando se escinde con HphI, solo los sitios contiguos sin metilar en la diana original crearán fragmentos que son competentes para ligamiento en ambos extremos 3' y 5'. Los fragmentos tienen conectores añadidos con secuencias de identificador único opcional y de identificador de paciente opcional que ahora son susceptibles de ligamiento para crear multímeros de fragmentos que a continuación serán sustratos para etapas adicionales y secuenciación posterior.

Variación 3.6.1: (véase por ejemplo, la Figura 62). En esta variación, los conectores cortos que contienen 5-metil C se ligan a los extremos del ADN. A continuación el ADN se trata con bisulfito, lo que hace que las hebras no sean complementarias para que se vuelvan monocatenarias. Algunos ciclos de amplificación por PCR generan productos que ahora están sin metilar en los sitios HphI. A continuación estos productos se escinden con HphI. Solo los amplicones de PCR que contienen sitios "HphI" contiguos (GGCGA, o GGTGA) que estaban sin metilar en la diana original generaran fragmentos que ahora son competentes para ligamiento en ambos extremos. Para capturar las regiones deseadas, los oligonucleótidos que comprenden una región de sonda en el extremo 5' complementaria a la secuencia del lado 5' de la diana, una secuencia de identificador único, una secuencia de unión a cebador opcional, una secuencia de identificador de paciente opcional, y una región de sonda en el extremo 3' complementaria a la secuencia del lado 3' de la diana, se hibridan con la diana. La adición de ligasa y polimerasa que carecen de actividad de desplazamiento de hebra y actividad de nucleasa tanto 3 '^5 ' como 5'^3', permite la extensión del extremo 3' de la diana sin metilar, seguido de ligamiento al extremo 5' de la diana para formar un producto circular que contiene una secuencia de identificador único, una secuencia de identificador de paciente opcional, y un sitio de unión a cebador opcional. Los productos sin ligar se eliminan por digestión con exonucleasa. Este producto circular es adecuado para etapas adicionales opcionales y secuenciación posterior.

Variación 3.6.1: (véase por ejemplo, la Figura 62). Este enfoque muestra cómo descubrir la no metilación en sitios "HphI" contiguos (GGCGA o GGTGA) en todo el genoma. El material de partida puede ser ADN genómico intacto o ADNcf con una longitud promedio de aproximadamente 160 pb. Los conectores cortos que contienen un extremo 5' bloqueado en el extremo de no ligamiento, se ligan en los extremos del ADN. Tratar el ADN con bisulfito, que convierte la C regular, pero no la metil-C, en U. Unos pocos ciclos de amplificación por PCR usando los dNTP sin metilar y cebadores bloqueados en el extremo 5' generan productos que ahora están sin metilar en los sitios HphI restantes. A continuación estos productos se escinden con HphI. Solo los amplicones de PCR que contienen sitios HphI contiguos (GGCGA y GGTGA) que estaban sin metilar en la diana original generarán fragmentos que están sin bloquear (es decir, competentes para ligamiento con los conectores) en ambos extremos, cuando se escinden con HphI. Los conectores que contienen secuencia de identificador único opcional, y secuencia de identificador de paciente opcional están ligados en estos extremos escindidos con HphI recién generados. Estos nuevos conectores contienen, en su lado de no ligamiento, el extremo 3' bloqueado, o una cadena principal que contiene tiofosfato (que se muestra como **** en la Figura 62). Después de la adición de una exonucleasa 3' bicatenaria (es decir, Exonucleasa III), los fragmentos que contienen el conector corto original en uno o ambos lados se digerirán y se volverán monocatenarios. Solo los fragmentos con el nuevo conector ligado a ambos lados permanecerán bicatenarios, ya que el grupo de bloqueo en el extremo 3' o los tiofosfatos inhiben la digestión con la exonucleasa 3'. Los extremos libres de los fragmentos restantes que contienen conector se vuelven competentes para ligamiento, ya sea (i) fosforilando el extremo 5', (ii) retirando el grupo en el extremo 3' bloqueado, o (iii) usando nucleasa 5', o cualquier combinación de las mismas. Las condiciones de ligamiento se diseñan para favorecer la multimerización, por ejemplo usando agentes de aglomeración (es decir, PEG al 20 %), y/o mezclando dos conjuntos de productos de ligamiento, en donde la protuberancia del conector en el extremo 5' no palindrómico del primer conjunto es complementaria a la protuberancia del conector en el extremo 5' no palindrómico del segundo conjunto. Los productos de ligamiento comprenden secuencias AciI contiguas en la misma orientación (es decir, GCGG), originalmente metiladas en el ADN diana con secuencia de identificador único y/o secuencia de identificador de paciente opcionales. Este producto es adecuado para etapas adicionales opcionales y secuenciación posterior.

Protocolo detallado para generar una base de datos del estado de no metilación en sitios de restricción "HphI" contiguos:

3.6.1.a. Ligar los conectores que están bloqueados en el extremo 5' del extremo de no ligamiento. Los extremos diana se reparan con polimerasa T4 y quinasa T4, y posteriormente se genera una protuberancia A en el extremo 3' de una sola base con Klenow (exo-) y dATP. Los conectores tienen una protuberancia T en el extremo 3' de una sola base, de modo que el ligamiento usando ligasa T4 añade conectores en ambos extremos del fragmento. Incubar el ADNcf con bisulfito, que convierte la C regular, pero no la metil-C, en U. El tratamiento con bisulfito convierte las hebras superior e inferior de manera diferente, de modo que después del tratamiento, las hebras ya no serán complementarias entre sí y se fusionarán por separado.

3.6.1. b. Añadir cebadores bloqueados en el extremo 5', polimerasa Taq y los dNTP y realizar algunos ciclos de PCR para generar productos que ahora están sin metilar en los sitios HphI restantes.

3.6.1. c. Añadir HphI para escindir los productos que contienen tales sitios. Solo los amplicones de PCR que contienen sitios HphI contiguos (GGCGA o GGTG^a) que estaban sin metilar en la diana original generarán fragmentos que están sin bloquear (es decir, competentes para ligamiento con los conectores) en ambos extremos, cuando se escinden con HphI. Los extremos diana se reparan con polimerasa T4 y quinasa T4. Retirar los dNTP (a través de una columna de centrifugación) y volver a añadir solo dATP para generar una protuberancia A en el extremo 3' de una sola base.

3.6.1. d. Usar ligasa T4, añadiendo conectores (que contengan secuencia de identificador único opcional, y secuencia de identificador de paciente opcional) con una protuberancia A en el extremo 3' de una sola base en el extremo de ligamiento a la protuberancia A de una sola base de las secuencias diana escindidas y rellenadas. El lado 5' de no ligamiento del conector contiene una protuberancia en el extremo 5', y, opcionalmente, no está fosforilado. El lado 3' de no ligamiento del conector contiene un grupo de bloqueo en el extremo 3' y/o tiofosfatos para inhibir la digestión con la exonucleasa 3'.

3.6.1. e. Añadir una exonucleasa 3' (es decir, Exonucleasa III) y digerir a 37 °C. Los fragmentos que contienen el conector corto original en uno o ambos lados se digerirán y se volverán monocatenarios. Solo los fragmentos con el nuevo conector ligado a ambos lados permanecerán bicatenarios. La exonucleasa también hará que los conectores se vuelvan monocatenarios. Opcionalmente, retirar los productos de digestión de los fragmentos deseados con una columna de centrifugación.

3.6.1.f. Los extremos libres de los fragmentos restantes que contienen conector se vuelven competentes para ligamiento, ya sea (i) fosforilando el extremo 5' usando quinasa T4, (ii) retirando el grupo en el extremo 3' bloqueado, o (iii) usando la actividad de nucleasa 5 '^3 ' de la polimerasa Taq para escindir la aleta o base coincidente solapante en el extremo 5', dejando un fosfato 5' competente para ligamiento, o cualquier combinación de los mismos. Las condiciones de ligamiento se diseñan para favorecer la multimerización. Los productos de ligamiento comprenden multímeros de fragmentos diana con secuencias AciI contiguas originalmente metiladas en el ADN diana con secuencia de identificador único y/o secuencia de identificador de paciente opcionales. Este producto es adecuado for etapas adicionales opcionales y secuenciación posterior.

Ejemplo profético 4 - Cuantificación exacta de cambios en el número de copias específicos de tumor en el ADN aislado de células tumorales circulantes

Los cambios en el número de copias de ADN tumoral puede ser un fuerte indicador de resultados. En los últimos años, la mayoría de los trabajos sobre el número de copias se ha realizado en chips de SNP, en donde los enfoques bioinformáticos hacen un promedio de la señal en una región para determinar el número relativo de copias. Para cantidades bajas de células se usan enfoques de PCR digital para obtener un recuento exacto de las moléculas iniciales.

Visión general del enfoque: En general, los cambios en el número de copias se producen en grandes regiones del ADN, tales como los brazos cromosómicos. Dado que el número de células tumorales es muy bajo, la exactitud de las mediciones se podría mejorar interrogando simultáneamente múltiples regiones de un brazo cromosómico dado y añadiendo o haciendo el promedio de la señal resultante. Del mismo modo, en algunos tumores se amplifican genes específicos (es decir, Her2-neu, IGF2), que pueden predecir el resultado o guiar el tratamiento.

Además de los cambios en el número de copias, la pérdida de heterocigosis se puede seguir no solo contando los cromosomas, sino también buscando la pérdida tradicional de heterocigosis entre los SNP o marcadores polimórficos dentro de la región de interés. Los marcadores más heterogéneos están en secuencias repetitivas. En el presente documento se ilustran los conceptos que usan secuencias repetidas de tetranucleótidos, aunque también se pueden considerar secuencias repetidas de tri y dinucleótidos.

El protocolo detallado para la cuantificación de los cambios en el número de copias específicos de tumor en el ADN aislado de células tumorales circulantes se abordará en la siguiente sección que evalúa las mutaciones de las células tumorales circulantes, ya que el enfoque general es muy similar.

Ejemplo profético 5 - Detección de mutaciones en el ADN aislado de células tumorales circulantes o ADNcf Las células tumorales circulantes proporcionan la ventaja de concentrar el ADN que contiene las mutaciones, por lo que ya no es necesario encontrar mutaciones de bajo nivel en un exceso de secuencia de tipo silvestre. Sin embargo, dado que el número de moléculas de ADN de partida es bajo, es importante amplificar todas las regiones con exactitud y verificar que las mutaciones estén realmente presentes.

Visión general del enfoque: aquí el enfoque es similar al de encontrar mutaciones puntuales comunes conocidas o al de secuenciar múltiples exones, como se ha explicado anteriormente. Sin embargo, cuando se trata de cantidades bajas de ADN entrante, existe la posibilidad de un error de polimerasa. Este problema se soluciona usando secuenciación circular o secuenciación SMRT.

Dado que el ADN se obtiene de unas pocas células tumorales capturadas, si una mutación estuviera presente, debería estar presente en algunas, si no en la mayoría de las células capturadas.

A continuación se describe un protocolo detallado para la detección de mutaciones en el ADN aislado de las células tumorales circulantes, incluyendo la cuantificación del número de copias, ya que el enfoque es muy similar.

Variación 5.1: (véase por ejemplo, la Figura 63). Aquí la idea general es convertir todo el ADNcf o ADN de CTC en círculos monocatenarios, en donde cada fragmento contiene una secuencia de identificador único, una secuencia de identificador de paciente opcional, y una secuencia de unión a cebador opcional. Una vez que se ha producido esa conversión, los círculos son ahora adecuados para secuenciación pura, captura específica de secuencia de las dianas deseadas usando sondas biotiniladas o para amplificación por círculo rodante y aumento de la captura de las dianas deseadas usando sondas biotiniladas.

En esta variación, el objetivo es capturar toda la secuencia de ADN diana y no diana, sin usar sondas para unirse a la diana. Los conectores se ligan a la diana de ADN (ADNcf con una longitud promedio de aproximadamente 160 bases). Para capturar todas las secuencias, las sondas oligonucleotídicas que comprenden una secuencia en el extremo 5' complementaria al extremo 5' del conector, una secuencia de identificador único, una secuencia de identificador de paciente opcional, una secuencia de unión a cebador opcional, y una secuencia complementaria al extremo 3' del conector, se hibridan con la diana. El oligonucleótido puede contener un grupo de bloqueo opcional en un extremo (se muestra el extremo 5'). La adición de una polimerasa permite la extensión del extremo 3' del oligonucleótido en la diana, así como la extensión del conector del conector en el extremo 3' a través de la secuencia de identificador único, la secuencia de unión a cebador opcional, y la secuencia de identificador de paciente opcional hasta que sea contiguo al conector en el extremo 5' en la diana.

El extremo 5' del conector se puede diseñar para que sea ligeramente más largo, de modo que una vez que la polimerasa extiende el conector en el extremo 3', no se extienda a través de la secuencia complementaria del conector en el extremo 5' hasta que llegue a la parte de la diana en el extremo 5' que se hibrida con la región de sonda en el extremo 5'.

Esta variación requiere que la sonda oligonucleotídica contenga secuencias complementarias a ambas hebras del conector en los extremos 3' y 5', estando dichas secuencias separadas por solo aproximadamente 20-40 bases. Dado que las secuencias son complementarias a las hebras de conector, que a su vez son complementarias entre sí, es importante evitar que las dos secuencias dentro de la sonda oligonucleotídica formen solo una horquilla interna con un bucle de 20-40 bases. Una solución es ligar los conectores que contienen una burbuja interna, de modo que los dos conectores retienen el carácter bicatenario a la baja temperatura usada para el ligamiento del conector (16 °C o incluso 4 °C con ligasa T4). Además el conector en el extremo 5' se puede diseñar para que sea más largo que el conector en el extremo 3'. Por último, las regiones de complementariedad dentro del conector se pueden diseñar para tener emparejamientos erróneos sutiles (es decir, G:T y T:G) que son más desestabilizadores en la sonda oligonucleotídica complementaria (es decir, C:A y A:C) de modo que es menos probable que la sonda oligonucleotídica forme la horquilla interna a la temperatura de hibridación global (es decir, 40-50 °C).

La extensión del extremo 3' del oligonucleótido en la diana potencia la asociación de la sonda a la diana, y, por lo tanto, aumenta la capacidad del extremo 3' del conector de hibridarse correctamente con su complemento y extenderse con la polimerasa. La actividad de escisión por nucleasa 5 '^3 ' de la polimerasa (o nucleasa Fen) escinde una base coincidente solapante en el extremo 5' del conector en el extremo 5', dejando un fosfato 5' competente para ligamiento en el conector. La polimerasa también extiende el oligonucleótido en la diana, y no escinde el grupo de bloqueo en el extremo 5' del oligonucleótido.

La ligasa sella covalentemente los extremos 3' extendidos al fosfato 5' competente para ligamiento para crear productos de ligamiento circulares. El grupo de bloqueo evita la circularización de la sonda oligonucleotídica. La adición opcional de Uracil-ADN glicosilasa (UDG) y Formamidopirimidina-ADN glicosilasa (Fpg, también conocida como 8-oxoguanina ADN glicosilasa, que actúa como una N-glicosilasa y como una AP-liasa) se puede usar para mellar dianas que contienen bases dañadas. A continuación, se añade(n) exonucleasa(s) para digerir todos los productos no ligados o mellados dejando solo el ADN circular monocatenario deseado que comprende el ADN diana original con una secuencia de identificador único. Este producto es adecuado para la captura específica de secuencia de las dianas deseadas usando sondas biotiniladas, combinado con amplificación por círculo rodante y secuenciación circular, o para secuenciación SMRT directa.

El desafío aquí es evitar que la polimerasa extienda el conector 3' de modo que destruya el conector en el extremo 5' sin una etapa de ligamiento (es decir, traducción de mellas). Esto se puede conseguir incorporando enlaces tiofosfato en la 2a y 3a posiciones desde el extremo fosfato 5', (que se liberarán por la actividad de nucleasa 5 '^3 ' de la polimerasa). Para minimizar el desplazamiento de la polimerasa de esas bases a medida que extiende una base en exceso (o que podría hacer imposible el ligamiento al cebador en dirección 3'), las bases de la diana en la unión de ligamiento podrían ser preferentemente ricas en AT en el lado 3', y ricas en GC en el lado 5'.

Un enfoque alternativo es usar un conector en el extremo 5' que contenga un sitio apurínico (AP) en la posición contigua al fosfato 5' deseado. Este fosfato 5' se libera usando una EndolII termoestable (tal como Tma EndolII). Esta enzima escinde los sitios AP dejando un fosfato 5' cuando el cebador está unido a la diana. La endonucleasa también escinde el cebador monocatenario, pero con menor eficacia, y por lo tanto el cebador hibridado con el molde podría ser el sustrato preferente. Cuando se usa EndoIII termoestable, la polimerasa de PCR usada podría carecer de la actividad de exonucleasa 5'^3'.

Protocolo detallado para la cuantificación exacta de cambios en el número de copias específicos de tumor o la detección de mutaciones en genes conocidos (por ejemplo, Braf, K-ras, p53) en ADN aislado de células tumorales circulantes o ADNcf:

5.1. a. Comenzando con ADNcf o ADN genómico aislado de las CTC, (cortado a aproximadamente 150 pb), reparar los extremos con polimerasa T4 y quinasa T4, y posteriormente se añade una protuberancia A en el extremo 3' de una sola base con Klenow (exo-) y dATP. Los conectores tienen una protuberancia T en el extremo 3' de una sola base, de modo que el ligamiento usando ligasa T4 a 4 °C añade conectores en ambos extremos del fragmento. Opcionalmente, purificar el ADN diana del conector sin ligar.

5.1. b. Desnaturalizar los conectores que contienen ADN diana en ambos extremos (94 °C, 1 minuto) en presencia de sondas oligonucleotídicas (que comprenden una secuencia en el extremo 5' complementaria al extremo 5' del conector, una secuencia de identificador único, una secuencia de identificador de paciente opcional, una secuencia de unión a cebador opcional, y una secuencia complementaria al extremo 3' del conector), y permitir que las sondas oligonucleotídicas se hibriden con sus regiones complementarias en los fragmentos deseados enfriando a una temperatura deseada (por ejemplo, 40-50 °C durante 30 min). Las sondas oligonucleotídicas pueden contener un grupo de bloqueo opcional en el extremo 5'. La polimerasa Taq y/o KlenTaq (polimerasa Taq que carece de actividad de nucleasa), y ligasa termoestable (preferentemente de la cepa AK16D), y los dNTP se añaden después de la etapa de hibridación, o al comienzo del procedimiento. Permitir la extensión y el ligamiento a la temperatura de hibridación, y, opcionalmente, aumentar la temperatura (por ejemplo, 60 °C) para garantizar la finalización de la extensión y el ligamiento, para generar productos circulares.

5.1. c. Añadir Exonucleasa I (digiere el ADN monocatenario en la dirección 3'^5'), y Exonucleasa III (digiere el ADN bicatenario en la dirección 3'^5'), para digerir todos los productos sin ligar o mellados, dejando solo el ADN monocatenario circular deseado que comprende el ADN diana original, la secuencia del conector, la secuencia de identificador único, una secuencia de unión a cebador opcional, y una secuencia de identificador de paciente opcional. Este producto es adecuado para la captura específica de secuencia de las dianas deseadas usando sondas biotiniladas, o para la amplificación por círculo rodante (usando un cebador complementario a la secuencia de unión a cebador con la polimerasa phi-29) para crear repeticiones en tándem de la secuencia deseada, seguido de una captura potenciada de las dianas deseadas usando sondas biotiniladas. Esto puede ir seguido de la identificación de las dianas usando secuenciación de nueva generación, o alternativamente, secuenciación SMRT directa en el molde cerrado covalentemente, usando la secuencia del conector o la secuencia de unión a cebador opcional como un sitio de unión a cebador.

Nota 1: El oligonucleótido puede contener un grupo de bloqueo opcional en el lado 5' para interferir con la posterior actividad de nucleasa 5 '^3 ' de la polimerasa, de modo que la sonda oligonucleotídica no se circularice.

Nota 3: El conector en el extremo 5' se puede sintetizar para que contenga enlaces tiofosfato en la 2a y 3a posiciones desde el extremo fosfato 5', (que se liberarán por la actividad de nucleasa 5 '^3 ' de la polimerasa). Para minimizar el desplazamiento de la polimerasa de esas bases a medida que extiende una base en exceso (lo que podría hacer imposible el ligamiento al cebador en dirección 3'), las bases de la diana en la unión de ligamiento podrían ser preferentemente ricas en AT en el lado 3', y ricas en GC en el lado 5'.

Nota 4: Cuando se usa la polimerasa KlenTaq (polimerasa Taq sin actividad de escisión por nucleasa 5'—^3'), el conector en el extremo 5' se puede sintetizar para que contenga un sitio apurínico (AP) en la posición contigua al fosfato 5' deseado. Este fosfato 5' se libera usando una EndoIII termoestable (tal como Tima EndoIII). Esta enzima escinde los sitios AP dejando un fosfato 5' cuando el cebador está unido a la diana. La endonucleasa también escinde el cebador monocatenario, pero con menor eficacia, y por lo tanto el cebador hibridado con el molde podría ser el sustrato preferente.

Nota 5: Cuando se usa la polimerasa KlenTaq (polimerasa Taq sin actividad de escisión por nucleasa 5— 3'), el conector en el extremo 5' se puede sintetizar para que contenga un fosfato 5'. Alternativamente, el fosfato 5' se puede añadir usando quinasa T4 antes del ligamiento al ADN diana, o después de esa etapa de ligamiento.

Nota 6: Se puede usar una mezcla 1:20 de polimerasa Taq (con actividad de nucleasa 5— 3') y KlenTaq (polimerasa Taq sin actividad de escisión por nucleasa 5— 3') en condiciones de extensión distributiva (es decir, concentración de sal más elevada) para minimizar la degradación del ADN diana por traducción de mellas.

Nota 7: La captura de copias repetidas en tándem de la diana (generadas mediante amplificación por círculo rodante) proporciona la ventaja única de unión multivalente para potenciar la captura de la diana correcta. Esto permite usar condiciones de hibridación/captura más rigurosas, lo que da como resultado mayores eficacias de captura y menos captura de secuencias no deseadas. Este enfoque también se puede usar para capturar todas las dianas que contienen secuencias repetitivas (es decir, repetición de tetranucleótidos AGAT), lo que permite evaluar la pérdida de heterocigosis, la variación en el número de copias, el haplotipado, el establecimiento de paternidad y otras aplicaciones.

Nota 8: El identificador de secuencia único garantiza que, incluso después de la amplificación por círculo rodante u otras etapas de selección/amplificación, cada secuencia diana original se pueda evaluar de manera única, lo que permite una cuantificación exacta del número de copias originales de cada diana.

Nota 9: La secuencia de identificador único se puede añadir a ambos lados del conector. Si no se añade una base extra al ADN diana (es decir, omitiendo la etapa de Klenow), entonces se usa un ligamiento de extremo romo. Para evitar el ligamiento de conector a conector, el extremo romo del conector está sin fosforilar. Algunos ejemplos de conectores que contienen identificadores únicos y extremos romos los proporcionan los oligonucleótidos iSx-201-MdAdT (hebra superior), e iSx-202-MdLgAdB-bk (hebra inferior) (véase la Tabla 1). La hebra superior es más larga, creando una protuberancia monocatenaria en el extremo 5' en el lado de no ligamiento. La hebra inferior tiene un 5' OH y, opcionalmente, contiene un grupo de bloqueo en el extremo 3' para evitar la extensión, así como grupos 5-nitroindol internos para actuar como bases universales cuando se realiza el emparejamiento con las secuencias de identificador único de la hebra superior. Después del ligamiento del conector de extremo romo, añadiendo secuencias únicas a los extremos 5' de la diana de ADN bicatenario, esas secuencias se copian extendiendo el extremo 3' con polimerasa. Opcionalmente, la hebra superior contiene bases dU para la posterior escisión con UDG y FPG para liberar un fosfato 5', adecuado para ligamiento y circularización en etapas posteriores. El conector iSx-201-MdAdT (véase la Tabla 1) pueden contener grupos tiofosfato opcionales contiguos al fosfato el extremo 5' recién liberado para evitar la traducción de mellas y facilitar la circularización de las dianas con los extremos de conector.

Nota 10: Cuando se diseñan oligonucleótidos para su uso con secuencias de conector más largas, que comprenden secuencias de "código de barras" o "indexación" para su uso con instrumentos comerciales, puede ser necesario ensamblar el oligonucleótido usando PCR, amplificación de desplazamiento de hebra, o una combinación de las mismas. Durante la PCR, el uso de dUTP en lugar de TTP incorpora uracilo, adecuado para su posterior escisión con UDG. El cebador de hebra inversa puede estar fosforilado, permitiendo su digestión usando exonucleasa lambda o una exonucleasa 5— 3' similar. Una secuencia de dA30 se puede añadir al extremo 5' del cebador directo, lo que permite la amplificación por desplazamiento de hebra. Ejemplos de oligonucleótidos para el ensamblaje de una secuencia complementaria inversa, que son adecuados para su uso con los conectores mencionados anteriormente son: iSx-204-bkA30-Lk-F2, iSx-205-r503-F3, iSx-206-d701-R4, e iSx-207-Lk-R5 (véase la Tabla 1).

Nota 11: En otra variación para agregar la secuencia de identificador único que se puede añadir en ambos lados del conector, una hebra también comprende una secuencia de "código de barras" o "índice" para su uso con instrumentos comerciales (véase por ejemplo, la Figura 64). Al dividir la región larga entre el conector y el oligonucleótido de hibridación, las diferentes secuencias se pueden sintetizar directamente y se pueden mantener una longitud de aproximadamente 100 bases. Algunos ejemplos de conectores que contienen secuencias de índice o código de barras, identificadores únicos y extremos romos los proporcionan los oligonucleótidos iSx-211-r702-LgAdT (hebra superior), e iSx-202-MdLgAdB-bk (hebra inferior, igual que anteriormente) (véase la Tabla 1). La hebra superior es considerablemente más larga, creando una protuberancia monocatenaria en el extremo 5' en el lado de no ligamiento. La hebra inferior tiene un 5' OH y, opcionalmente, contiene un grupo de bloqueo en el extremo 3' para evitar la extensión, así como grupos 5-nitroindol internos para actuar como bases universales cuando se realiza el emparejamiento con las secuencias de identificador único de la hebra superior. Después del ligamiento del conector de extremo romo, añadiendo secuencias únicas a los extremos 5' de la diana de ADN bicatenario, esas secuencias se copian extendiendo el extremo 3' con polimerasa. Opcionalmente, la hebra superior contiene bases dU para la posterior escisión con UDG y FPG para liberar un fosfato 5', adecuados para ligamiento y circularización en etapas posteriores. El oligonucleótido puente, iSx-212-r503-R4 (véase la Tabla 1), se hibridar con el conector que contiene fosfato 5' escindido, así como el extremo 3' extendido largo, permitiendo la extensión con polimerasa y la circularización con ligasa.

Nota 12: Con los productos mencionados anteriormente generados usando los diseños de cebadores y conectores mencionados anteriormente, después de la amplificación por agolpamiento o con perlas, o captura dentro de un pocillo, dirección, o superficie de una celda de flujo en un instrumento comercial, para iniciar reacciones de secuenciación se pueden usar los siguientes cebadores: (i) iLx-003-PEsqP1, cebador de secuenciación de extremo emparejado 1; (ii) iLx-004-BrCdR1, cebador de indexación, lectura de código de barras 1; (iii) iLx-001-P5-BrCdR2, lectura de código de barras 2; y (iv) iLx-005-PEsqP2, cebador de secuenciación de extremo emparejado 2 (las secuencias de cebador se proporcionan en la Tabla 1 que sigue a continuación).

El procedimiento anterior usa conectores con un 5'OH. La variación 5.2 usa conectores con un fosfato 5' para evitar algunos problemas potenciales asociados con el uso de polimerasa con una actividad de nucleasa 5 '^3 ' (véase por ejemplo, la Figura 63).

5.2. a. Comenzando con ADNcf o ADN genómico aislado de las CTC, (cortado a aproximadamente 150 pb), reparar los extremos con polimerasa T4 y quinasa T4, y posteriormente se añade una protuberancia A en el extremo 3' de una sola base con Klenow (exo-) y dATP. Los conectores tienen una protuberancia T en el extremo 3' de una sola base, de modo que el ligamiento usando ligasa T4 a 4 °C añade conectores en ambos extremos del fragmento. El conector en el extremo 5' contiene un grupo fosfato (añadido opcionalmente usando quinasa T4).

5.2. b. Desnaturalizar los conectores que contienen ADN diana en ambos extremos (94 °C, 1 minuto) en presencia de sondas oligonucleotídicas (que comprenden una secuencia en el extremo 5' complementaria al extremo 5' del conector, una secuencia de identificador único, una secuencia de identificador de paciente opcional, una secuencia de unión a cebador opcional, y una secuencia complementaria al extremo 3' del conector), y permitir que las sondas oligonucleotídicas se hibriden con sus regiones complementarias en los fragmentos deseados enfriando a una temperatura deseada (por ejemplo, 40-50 °C for 30 min). La sonda oligonucleotídica puede contener un grupo de bloqueo opcional en el extremo 5'. KlenTaq (polimerasa Taq que carece de actividad de nucleasa), y ligasa termoestable (preferentemente de la cepa AK16D), y los dNTP se añaden después de la etapa de hibridación, o al comienzo del procedimiento. Permitir la extensión y el ligamiento a la temperatura de hibridación, y, opcionalmente, aumentar la temperatura (por ejemplo, 60 °C) para garantizar la finalización de la extensión y el ligamiento, para generar productos circulares.

5.2. c. Añadir Exonucleasa I (digiere el ADN monocatenario en la dirección 3'^5'), y Exonucleasa III (digiere el ADN bicatenario en la dirección 3'^5'), para digerir todos los productos sin ligar o mellados, dejando solo el ADN monocatenario circular deseado que comprende el ADN diana original, la secuencia del conector, la secuencia de identificador único, una secuencia de unión a cebador opcional, y una secuencia de identificador de paciente opcional. Este producto es adecuado para la captura específica de secuencia de las dianas deseadas usando sondas biotiniladas, o para la amplificación por círculo rodante (usando un cebador complementario a la secuencia de unión a cebador con la polimerasa phi-29) para crear repeticiones en tándem de la secuencia deseada, seguido de una captura potenciada de las dianas deseadas usando sondas biotiniladas. Esto puede ir seguido de la identificación de las dianas usando secuenciación de nueva generación, o alternativamente, secuenciación SMRT directa en el molde cerrado covalentemente, usando la secuencia del conector o la secuencia de unión a cebador opcional como un sitio de unión a cebador.

Nota 1: El oligonucleótido puede contener un grupo de bloqueo opcional en el lado 5', o un 5' OH, de modo que la sonda oligonucleotídica no se circularice.

Nota 2: Los conectores se pueden sintetizar con fosfato 5', o el fosfato se puede añadir usando quinasa T4. Nota 3: La captura de copias repetidas en tándem de la diana (generadas mediante amplificación por círculo rodante) proporciona la ventaja única de unión multivalente para potenciar la captura de la diana correcta. Esto permite usar condiciones de hibridación/captura más rigurosas, lo que da como resultado mayores eficacias de captura y menos captura de secuencias no deseadas. Este enfoque también se puede usar para capturar todas las dianas que contienen secuencias repetitivas (es decir, repetición de tetranucleótidos AGAT), lo que permite evaluar la pérdida de heterocigosis, la variación en el número de copias, el haplotipado, el establecimiento de paternidad y otras aplicaciones.

Nota 4: El identificador de secuencia único garantiza que, incluso después de la amplificación por círculo rodante u otras etapas de selección/amplificación, cada secuencia diana original se pueda evaluar de manera única, lo que permite una cuantificación exacta del número de copias originales de cada diana.

Nota 5: Algunos ejemplos de conectores y oligonucleótidos complementarios para facilitar la circularización son: iSx-220-d503-AdT1, iSx-221-pd707-AdB2, e iSx-222-Lk-uRC1, respectivamente (véase la Tabla 1). El conector iSx-220-d503-AdT1 (véase la Tabla 1) puede contener grupos tiofosfato opcionales en la 2a y 3a posiciones desde el extremo 5' para evitar la traducción de mellas y facilitar la circularización de las dianas con los extremos de conector.

Los enfoques que se describen en las Figuras 64 y 65 usan conectores universales para capturar y circularizar el ADN genómico total y, a continuación, realizar etapas posteriores, tales como captura de las dianas deseadas usando sondas biotiniladas para seleccionar las dianas para el análisis de secuencias. Las sondas biotiniladas se capturan en perlas antes de la hibridación, o después de la hibridación, por lo que, aunque en el segundo caso el etapa de hibridación puede ser líquida, en última instancia hay un etapa de líquido a sólido, y estas etapas pueden dar como resultado rendimientos menores o pérdidas de fragmentos.

La variación 5.3 describe un enfoque alternativo, en donde la etapa de captura se produce en líquido, usando sondas diseñadas para hibridar cerca o contiguamente entre sí en la diana, y a continuación se crea una "plataforma de aterrizaje" para que los conectores en los extremos de la diana se hibriden, se extiendan y se liguen para crear la diana o dianas circulares cerradas covalentemente. Este enfoque puede ser particularmente útil cuando se seleccionan dianas que contienen ADN repetitivo.

5.3. a. Comenzando con ADNcf o ADN genómico aislado de las CTC, (cortado a aproximadamente 150 pb), reparar los extremos con polimerasa T4 y quinasa T4, y posteriormente se añade una protuberancia A en el extremo 3' de una sola base con Klenow (exo-) y dATP. Los conectores tienen una protuberancia T en el extremo 3' de una sola base, de modo que el ligamiento usando ligasa T4 a 4 °C añade conectores en ambos extremos del fragmento. Los conectores se pueden sintetizar con fosfato 5', o el fosfato se puede añadir usando quinasa T4. Opcionalmente, purificar el ADN diana del conector sin ligar.

5.3. b. Desnaturalizar los conectores que contienen ADN diana en ambos extremos (94 °C, 1 minuto) en presencia de sondas oligonucleotídicas (que comprenden una secuencia en el extremo 5' complementaria a una parte única o repetitiva (es decir, repetición de AGAT) de la diana, una región espaciadora opcional, una secuencia complementaria al extremo 5' del conector, una secuencia de identificador único, una secuencia de identificador de paciente opcional, una secuencia de unión a cebador opcional, una región espaciadora opcional, una secuencia complementaria al extremo 3' del conector, y una secuencia en el extremo 3' complementaria a una parte única o repetitiva (es decir, repetición de AGAT) de la diana, y contigua a la secuencia en el extremo 5' complementaria a la diana), y permitir que los oligonucleótidos se hibriden con sus regiones complementarias en los fragmentos deseados mediante enfriamiento a una temperatura deseada (por ejemplo, 50 °C durante 2 horas). El oligonucleótido puede contener un grupo de bloqueo opcional en el lado 5'. La polimerasa Taq y/o KlenTaq (polimerasa Taq que carece de actividad de nucleasa), y ligasa termoestable (preferentemente de la cepa AK16D), y los dNTP se añaden después de la etapa de hibridación, o al comienzo del procedimiento. En el caso en donde la secuencia del conector tenga un fosfato 5', KlenTaq extiende el extremo 3' hasta que es directamente contiguo al extremo 5' competente para ligamiento (lado izquierdo de la Figura 70). En el caso de que la secuencia del conector tenga un 5' OH, la actividad de nucleasa 5 '^3 ' de la polimerasa escinde la base coincidente solapante en el extremo 5' para crear un fosfato 5' competente para ligamiento (lado derecho de la Figura 70). Permitir la extensión y el ligamiento a la temperatura de hibridación, y, opcionalmente, aumentar la temperatura (por ejemplo, 60 °C) para garantizar la finalización de la extensión y el ligamiento, para generar productos circulares.

5.3. c. Opcionalmente, escindir la sonda oligonucleotídica en un enlace escindible (por ejemplo, U escindido usando UDG y endonucleasa AP). Añadir Exonucleasa I (digiere el ADN monocatenario en la dirección 3'^5'), y Exonucleasa III (digiere el ADN bicatenario en la dirección 3'^5'), para digerir todos los productos sin ligar o mellados, dejando solo el ADN monocatenario circular deseado que comprende el ADN diana original, la secuencia del conector, la secuencia de identificador único, una secuencia de unión a cebador opcional, y una secuencia de identificador de paciente opcional. Este producto es adecuado para la captura específica de secuencia de las dianas deseadas usando sondas biotiniladas, o para la amplificación por círculo rodante (usando un cebador complementario a la secuencia de unión a cebador con la polimerasa phi-29) para crear repeticiones en tándem de la secuencia deseada, seguido de una captura potenciada de las dianas deseadas usando sondas biotiniladas. Esto puede ir seguido de la identificación de las dianas usando secuenciación de nueva generación, o alternativamente, secuenciación SMRT directa en el molde cerrado covalentemente, usando la secuencia del conector o la secuencia de unión a cebador opcional como un sitio de unión a cebador.

Nota 3: El conector en el extremo 5' se puede sintetizar para que contenga enlaces tiofosfato en la 2a y 3a posiciones desde el extremo fosfato 5', (que se liberarán por la actividad de nucleasa 5 '^3 ' de la polimerasa). Para minimizar el desplazamiento de la polimerasa de esas bases a medida que extiende una base en exceso (o que podría hacer imposible el ligamiento al cebador en dirección 3'), las bases de la diana en la unión de ligamiento podrían ser preferentemente ricas en AT en el lado 3', y ricas en GC en el lado 5'.

Nota 4: Cuando se usa la polimerasa KlenTaq (polimerasa Taq sin actividad de escisión por nucleasa 5'^3'), el conector en el extremo 5' se puede sintetizar para que contenga un sitio apurínico (AP) en la posición contigua al fosfato 5' deseado. Este fosfato 5' se libera usando una EndoIII termoestable (tal como Tima EndoIII). Esta enzima escinde los sitios AP dejando un fosfato 5' cuando el cebador está unido a la diana. La endonucleasa también escinde el cebador monocatenario, pero con menor eficacia, y por lo tanto el cebador hibridado con el molde podría ser el sustrato preferente.

Nota 5: Cuando se usa la polimerasa KlenTaq (polimerasa Taq sin actividad de escisión por nucleasa 5'^-3'), el conector en el extremo 5' se puede sintetizar para que contenga un fosfato 5'. Alternativamente, el fosfato 5' se puede añadir usando quinasa T4 antes del ligamiento al ADN diana, o después de esa etapa de ligamiento.

Nota 9: La secuencia de identificador único se puede añadir a ambos lados de los conectores que comprenden secuencias de "índice" o "código de barras", usando un ligamiento de protuberancia T de una sola base (véase por ejemplo, la Figura 67). Reparar los extremos de la diana con polimerasa T4, fosforilar el extremo 5' con quinasa T4. Añadir una base A al extremo 3' de la diana usando el fragmento Klenow que carece de actividad de nucleasa 3'^5'. Ligar en conectores de "hueco" de 3 unidades con protuberancia T en el extremo 3' usando la ligasa T4 a 30 °C. Usar el fragmento Klenow que carece de actividad de nucleasa 3 '^5 ' para llenar el hueco y ligar a una hebra pequeña de conector en presencia de ligasa T4. Opcionalmente, usar ADN polimerasa que carece de actividad de nucleasa 3 '^5 ' para llenar el hueco y ligar a una hebra pequeña de conector en presencia de ligasa T4. Algunos ejemplos de tales oligonucleótidos conectores de 3 unidades son: iSx-223-d504-AdT3, iSx-224-pSmAdT4, e iSx-225-pd708-N6AdB5 (véase la Tabla 1). El conector iSx-223-d504-AdT3 (véase la Tabla 1) puede contener grupos tiofosfato opcionales en la 2a y 3a posiciones desde el extremo 5' para evitar la traducción de mellas y facilitar la circularización de las dianas con los extremos de conector.

Nota 10: La secuencia de identificador único se puede añadir a ambos lados de los conectores que comprenden secuencias de "índice" o "código de barras", usando ligamiento de extremo romo. Reparar los extremos de la diana con polimerasa T4. Ligar en conectores de "hueco" de 3 unidades con fosfato 3' y protuberancia roma usando ligasa T4 a 30 °C. Usar el fragmento Klenow que carece de actividad de nucleasa 3 '^5 ' para llenar el hueco a 37 °C, calentar a 50 °C para desnaturalizar el conector pequeño. Usar ADN polimerasa Taq (que carece de actividad de nucleasa 3'^5', pero con actividad de nucleasa 5 '^3 ') para llenar el hueco, y ligar a la diana con ligasa termoestable. Algunos ejemplos de tales oligonucleótidos conectores de 3 unidades son: iSx-226-d505-AdT6, iSx-227-SmAdT7p, e iSx-225-pd708-N6AdB5 (igual que anteriormente; véase la Tabla 1). El conector iSx-226-d505-AdT6 (véase la Tabla 1) puede contener grupos tiofosfato opcionales en la 2a y 3a posiciones desde el extremo 5' para evitar la traducción de mellas y facilitar la circularización de las dianas con los extremos de conector.

Nota 11: La secuencia de identificador único se puede añadir a ambos lados de los conectores que comprenden secuencias de "índice" o "código de barras", usando transcripción inversa. Reparar los extremos de la diana con polimerasa T4, fosforilar el extremo 5' con quinasa T4 (véase por ejemplo, la Figura 68).

Añadir 3 bases C al extremo 3' de la diana usando transcriptasa inversa. Hibridar los pares de conectores en donde el primer conector tiene rGrG+G on el extremo 3' (+G es el símbolo para LNA, rG3), sitios de unión a cebador con identificador de paciente y único y fosfato 5', mientras que el segundo conector tiene sitios de unión a cebador con identificador de paciente. La transcriptasa inversa experimenta un cambio de hebra y copia un identificador único para llenar el hueco. La ligasa sella covalentemente la diana extendida al segundo conector. La RNasa H2 escinde las bases de ARN, liberando el 3' OH de rG3 (rGrG+G) en la primera secuencia de conector. La polimerasa llena los huecos y la ligasa sella covalentemente los extremos extendidos. Algunos ejemplos de tales oligonucleótidos conectores son: iSx-228-d506-AdT83+G, e iSx-229-pd709-AdB6. El conector iSx-228-d506-AdT83+G (véase la Tabla 1) puede contener grupos tiofosfato opcionales en la 2a y 3a posiciones desde el extremo 5' para evitar la traducción de mellas y facilitar la circularización de las dianas con los extremos de conector.

Nota 12: Una variación es usar oligonucleótidos que comprenden múltiples enlaces escindibles, de modo que después de la extensión/ligamiento y el tratamiento con el agente de escisión, se genera un cebador único en la hebra diana, adecuado para la amplificación por círculo rodante para generar productos de repetición en tándem. En la Tabla 1 que sigue a continuación se muestran ejemplos de tales oligonucleótidos adecuados para generar los productos circulares que comprenden regiones diana de KRAS, BRAF, y los exones 5-8 de TP53 que contienen mutaciones en puntos calientes e incluyen: (i) oligonucleótidos de extensión/ligamiento de diana directos e inversos de K^rAS (iSx-232-KRS-T32, iSx-233-KRS-B33); (ii) oligonucleótidos de extensión/ligamiento de diana directos e inversos de BRAF (iSx-234-BRF-T34, iSx-235-BRF-B35); (iii) oligonucleótidos de extensión/ligamiento de diana directos e inversos del exón 5 de TP53 (iSx-241-TP53e5-T41, iSx-242-TP53e5-B42, iSx-243-TP53e5-T43, iSx-244-TP53e5-B44); (iv) oligonucleótidos de extensión/ligamiento de diana directos e inversos del exón 6 de TP53 (iSx-245-TP53e6-T45, iSx-246-TP53e6-B46); (v) oligonucleótidos de extensión/ligamiento de diana directos e inversos del exón 7 de TP53 (iSx-247-TP53e7-T47, iSx-248-TP53e7-B48); y (vi) oligonucleótidos de extensión/ligamiento de diana directos e inversos del exón 8 de TP53 (iSx-249-TP53e8-T49, iSx-250-TP53e8-B50). Los oligonucleótidos de extensión/ligamiento mencionados anteriormente pueden contener grupos tiofosfato opcionales en la 2a y 3a posiciones desde el extremo 5' para evitar la traducción de mellas y facilitar la circularización en dianas complementarias.

Nota 13: Alternativamente, después de generar los productos circulares que comprenden regiones diana de KRAS, BRAF, y los exones 5-8 de TP53 que contienen mutaciones en puntos calientes, estas regiones se pueden someter a amplificación por círculo rodante usando cebadores específicos de diana recién añadidos para generar productos de repetición en tándem. Estos productos se pueden generar antes o después de la captura de las dianas deseadas con oligonucleótidos específicos de diana sobre un soporte sólido (véase la nota 8 que sigue a continuación). Los cebadores pueden contener una base nucleotídica escindible interna o un sitio abásico tal como 1',2'-Didesoxirribosa (dSpacer), lo que permite la incorporación de dUTP durante la amplificación por círculo rodante para protección contra la contaminación por arrastre. Los ejemplos de tales cebadores se muestran en la Tabla 1 que sigue a continuación e incluyen los siguientes: (i) cebadores directos e inversos de KRAS (iSx-108-KRS-rcF26, iSx-109-KRS-rcR27); (ii) cebadores directos e inversos de BRAF (iSx-118-BRF-rcF26, iSx-119-BRF-rcR27); (iii) cebadores directos e inversos del exón 5 de TP53 (iSx-128-TP53e5-rcF66, iSx-129-TP53e5-rcR67; iSx-130-TP53e5-rcF68, iSx-131-TP53e5-rcR69); (iv) cebadores directos e inversos del exón 6 de TP53 (iSx-138-TP53e6-rcF76, iSx-139-TP53e6-rcR77); (v) cebadores directos e inversos del exón 7 de TP53 (iSx-148-TP53e7-rcF86, iSx-149-TP53e7-rcR87); y (vi) cebadores directos e inversos del exón 8 de TP53 (iSx-158-TP53e8-rcF96, iSx-159-TP53e8-rcR97).

Nota 14: Después de generar los productos circulares que comprenden regiones diana de KRAS, BRAF, y los exones 5-8 de TP53 que contienen mutaciones en puntos calientes, y/o generar productos de repetición en tándem, estos productos se pueden capturar mediante hibridación con oligonucleótidos más largos, que contienen un grupo de captura adecuado para la captura posterior sobre un soporte sólido. Algunos ejemplos de tales oligonucleótidos de captura, que contienen grupos biotina adecuados para la captura a través de superficies sólidas recubiertas con estreptavidina se muestran en la Tabla 1 que sigue a continuación e incluyen los siguientes: (i) oligonucleótidos de captura directa e inversa de KRAS (iSx-013-KRS-bcF1, iSx-014-KRS-bcR2); (ii) oligonucleótidos de captura directa e inversa de BRAF (iSx-020-BRF-bcF1, iSx-021-BRF-bcR2); (iii) oligonucleótidos de captura directa e inversa del exón 5 de TP53 (iSx-030-TP53e5-bcF1, iSx-031-TP53e5-bcR2; iSx-032-TP53e5-bcF3, iSx-033-TP53e5-bcR4); (iv) oligonucleótidos de captura directa e inversa del exón 6 de TP53 (iSx-050-TP53e6-bcF5, iSx-051-TP53e6-bcR6); (v) oligonucleótidos de captura directa e inversa del exón 7 de TP53 (iSx-060-TP53e7-bcF7, iSx-061-TP53e7-bcR8); y (vi) oligonucleótidos de captura directa e inversa del exón 8 de TP53 (iSx-070-TP53e8-bcF9, iSx-071-TP53e8-bcR10).

Nota 15: Con los productos mencionados anteriormente generados usando los diseños de cebadores y conectores mencionados anteriormente, después de la amplificación por agrupamiento o con perlas, o captura dentro de un pocillo, dirección, o superficie de una celda de flujo en un instrumento comercial, para iniciar reacciones de secuenciación se pueden usar los siguientes cebadores: (i) iLx-003-PEsqP1, cebador de secuenciación de extremo emparejado 1; (ii) iLx-004-BrCdR1, cebador de indexación, lectura de código de barras 1; (iii) iLx-001-P5-BrCdR2, lectura de código de barras 2; y (iv) iLx-005-PEsqP2, cebador de secuenciación de extremo emparejado 2 (las secuencias de cebador se proporcionan en la Tabla 1 que sigue a continuación).

El enfoque que se describe en la Figura 70 usó ligamiento tanto de la sonda oligonucleotídica así como de la diana que contenía conector, dando como resultado productos de ligamiento interconectados circulares. Posteriormente, se introduce una mella en el enlace escindible. Para secuencias repetitivas, el extremo 3' solo se puede extender usando solo 3 dNTP como se describe a continuación en la Variación 5.4, véase por ejemplo, la Figura 77.

5.4. a. Comenzando con ADNcf o ADN genómico aislado de las CTC, (cortado a aproximadamente 150 pb), reparar los extremos con polimerasa T4 y quinasa T4, y posteriormente se añade una protuberancia A en el extremo 3' de una sola base con Klenow (exo-) y dATP. Los conectores tienen una protuberancia T en el extremo 3' de una sola base, de modo que el ligamiento usando ligasa T4 a 4 °C añade conectores en ambos extremos del fragmento. Los conectores se pueden sintetizar con fosfato 5', o el fosfato se puede añadir usando quinasa T4. Opcionalmente, purificar el ADN diana del conector sin ligar.

5.4. b. Desnaturalizar los conectores que contienen ADN diana en ambos extremos (94 °C, 1 minuto) en presencia de sondas oligonucleotídicas (que comprenden una secuencia en el extremo 5' complementaria al extremo 5' del conector, una secuencia de identificador único, una secuencia de identificador de paciente opcional, una secuencia de unión a cebador opcional, una región espaciadora opcional, una secuencia complementaria al extremo 3' del conector, y una secuencia en el extremo 3' complementaria a una parte única o repetitiva (es decir, repetición de AGAT) de la diana), y permitir que las sondas oligonucleotídicas se hibriden con sus regiones complementarias en los fragmentos deseados enfriando a una temperatura deseada (por ejemplo, 50 °C durante 2 horas). Las sondas oligonucleotídicas pueden contener un grupo de bloqueo opcional en el lado 5'. La polimerasa Taq y/o KlenTaq (polimerasa Taq que carece de actividad de nucleasa), y ligasa termoestable (preferentemente de la cepa AK16D), y para el ejemplo de repeticiones de AGAT, solo los tres nucleótidos complementarios (es decir, dTTP, dCTP, dATP) se añaden después de la etapa de hibridación, o al comienzo del procedimiento. En el caso en el que la secuencia del conector tenga un fosfato 5', KlenTaq extiende el extremo 3' hasta que es directamente contiguo al extremo 5' competente para ligamiento (lado izquierdo de la Figura 77). En el caso de que la secuencia del conector tenga un 5' Oh , la actividad de nucleasa 5 '^3 ' de la polimerasa escinde la base coincidente solapante en el extremo 5' para crear un fosfato 5' competente para ligamiento (lado derecho de la Figura 77). Permitir la extensión y el ligamiento a la temperatura de hibridación, y, opcionalmente, aumentar la temperatura (por ejemplo, 60 °C) para garantizar la finalización de la extensión y el ligamiento, para generar productos circulares.

5.4.c. Añadir Exonucleasa I (digiere el ADN monocatenario en la dirección 3'^5'), y Exonucleasa III (digiere el ADN bicatenario en la dirección 3'^5'), para digerir todos los productos sin ligar o mellados, dejando solo el ADN monocatenario circular deseado que comprende el ADN diana original, la secuencia del conector, la secuencia de identificador único, una secuencia de unión a cebador opcional, y una secuencia de identificador de paciente opcional. Este producto es adecuado para la captura específica de secuencia de las dianas deseadas usando sondas biotiniladas, o para la amplificación por círculo rodante (usando un cebador complementario a la secuencia de unión a cebador con la polimerasa phi-29) para crear repeticiones en tándem de la secuencia deseada, seguido de una captura potenciada de las dianas deseadas usando sondas biotiniladas. Esto puede ir seguido de la identificación de las dianas usando secuenciación de nueva generación, o alternativamente, secuenciación SMRT directa en el molde cerrado covalentemente, usando la secuencia del conector o la secuencia de unión a cebador opcional como un sitio de unión a cebador.

Nota 4: Cuando se usa la polimerasa KlenTaq (polimerasa Taq sin actividad de escisión por nucleasa 5'^3'), el conector en el extremo 5' se puede sintetizar para que contenga un sitio apurínico (AP) en la posición contigua al fosfato 5' deseado. Este fosfato 5' se libera usando una EndoIII termoestable (tal como Tma EndoIII). Esta enzima escinde los sitios AP dejando un fosfato 5' cuando el cebador está unido a la diana. La endonucleasa también escinde el cebador monocatenario, pero con menor eficacia, y por lo tanto el cebador hibridado con el molde podría ser el sustrato preferente.

Para evitar problemas con la extensión por polimerasa y la traducción de mellas, el procedimiento se puede realizar sin una etapa de extensión por polimerasa, usando solo ligasa o ligasa combinada con la actividad de nucleasa 5 '^3 ' de la polimerasa, como se ilustra en la Figura 78 (v5.5). El truco consiste en añadir la secuencia de identificador único al conector.

5.5. a. Comenzando con ADNcf o ADN genómico aislado de las CTC, (cortado a aproximadamente 150 pb), reparar los extremos con polimerasa T4 y quinasa T4, y posteriormente se añade una protuberancia A en el extremo 3' de una sola base con Klenow (exo-) y dATP. Los conectores tienen una protuberancia T en el extremo 3' de una sola base, de modo que el ligamiento usando ligasa T4 a 4 °C añade conectores en ambos extremos del fragmento. Los conectores contienen una secuencia de identificador único en el lado monocatenario en el extremo 5' del conector, y se pueden sintetizar con fosfato 5', o el fosfato se puede añadir usando quinasa T4. Opcionalmente, purificar el ADN diana del conector sin ligar y/o los dNTP.

5.5. b. Desnaturalizar los conectores que contienen ADN diana en ambos extremos (94 °C, 1 minuto) en presencia de oligonucleótidos (que comprenden una secuencia en el extremo 5' complementaria a una parte única o repetitiva (es decir, repetición de AGAT) de la diana, una región espaciadora opcional, una secuencia complementaria al extremo 5' del conector, una secuencia de identificador de paciente opcional, una secuencia de unión a cebador opcional, una región espaciadora opcional, una secuencia complementaria al extremo 3' del conector, y una secuencia en el extremo 3' complementaria a una parte única o repetitiva (es decir, repetición de AGAT) de la diana, y directamente contigua, o con un solapamiento de una sola base o aleta, la secuencia en el extremo 5' complementaria a la diana), y permitir que los oligonucleótidos se hibriden con sus regiones complementarias en los fragmentos deseados mediante enfriamiento a una temperatura deseada (por ejemplo, 50 °C durante 2 horas). El oligonucleótido puede contener un grupo de bloqueo opcional en el lado 5'. Opcionalmente, la polimerasa Taq y la ligasa termoestable (preferentemente de la cepa AK16D), se añaden después de la etapa de hibridación, o al comienzo del procedimiento. En el caso en el que la secuencia del conector tenga un fosfato 5', el conector el extremo 3' es directamente contiguo al extremo 5' competente para ligamiento (lado izquierdo de la Figura 78). En el caso de que la secuencia del conector tenga un 5' OH, la actividad de nucleasa 5 '^3 ' de la polimerasa escinde la aleta o base coincidente solapante en el extremo 5' para crear un fosfato 5' competente para ligamiento (lado derecho de la Figura 78). Permitir la escisión de la aleta opcional y el ligamiento a la temperatura de hibridación, y, opcionalmente, aumentar la temperatura (por ejemplo, 60 °C) para asegurar la finalización del ligamiento, para generar productos circulares.

5.5. c. Opcionalmente, escindir la sonda oligonucleotídica en un enlace escindible (por ejemplo, U escindido usando UDG y endonucleasa AP). Añadir Exonucleasa I (digiere el ADN monocatenario en la dirección 3'^5'), y Exonucleasa III (digiere el ADN bicatenario en la dirección 3'^5'), para digerir todos los productos sin ligar o mellados, dejando solo el ADN monocatenario circular deseado que comprende el ADN diana original, la secuencia del conector, la secuencia de identificador único, una secuencia de unión a cebador opcional, y una secuencia de identificador de paciente opcional. Este producto es adecuado para la captura específica de secuencia de las dianas deseadas usando sondas biotiniladas, o para la amplificación por círculo rodante (usando un cebador complementario a la secuencia de unión a cebador con la polimerasa phi-29) para crear repeticiones en tándem de la secuencia deseada, seguido de una captura potenciada de las dianas deseadas usando sondas biotiniladas. Esto puede ir seguido de la identificación de las dianas usando secuenciación de nueva generación, o alternativamente, secuenciación SMRT directa en el molde cerrado covalentemente, usando la secuencia del conector o la secuencia de unión a cebador opcional como un sitio de unión a cebador.

Nota 3: La captura de copias repetidas en tándem de la diana (generadas mediante amplificación por círculo rodante) proporciona la ventaja única de unión multivalente para potenciar la captura de la diana correcta. Esto permite usar condiciones de hibridación/captura más rigurosas, lo que da como resultado mayores eficacias de captura y menos captura de secuencias no deseadas. Este enfoque también se puede usar para capturar todas las dianas que contienen secuencias repetitivas (es decir, repetición de tetranucleótidos AGAT), lo que permite evaluar la pérdida de heterocigosis, la variación en el número de copias, el haplotipado, el establecimiento de paternidad y otras aplicaciones.

Ejemplo profético 6 -- Cuantificación exacta de ARNm específico de tumor o ARNlnc aislado de exosomas, células tumorales circulantes, o células sanguíneas totales que incluyen células tumorales circulantes (por ejemplo, una docena de marcadores de expresión que predicen el resultado o guían el tratamiento)

Los cambios en la expresión de ARNm específico de tumor o ARNlnc son una herramienta potente para clasificar el estado de la enfermedad de una manera histoespecífica. Esto incluye la detección y cuantificación exactas de exones específicos de los ARNm o los ARNlnc (véanse por ejemplo, las Figuras 108, 111, 112) o la detección y cuantificación de fusiones de genes recurrentes presentes en los ARNm (véanse por ejemplo, las Figuras 109 y 110). El ARNm total o poli-A o el ARNlnc poli-A se aíslan de exosomas o de células tumorales circulantes y se convierten en ADNc usando transcriptasa inversa para su uso en el proceso. Los ADNc se generan mediante el uso de cebadores específicos de exones usando reglas de diseño convencional para obtener la máxima especificidad de las regiones, que en general se extienden a los límites exón-intrón de un transcrito específico. Alternativamente, el cebado aleatorio de hexámeros se puede usar para copiar todo el transcriptoma, o se pueden usar cebadores polidT para enriquecer los extremos 3' de todos los transcritos.

Los oligonucleótidos que contienen secuencias complementarias a regiones contiguas pero separadas se hibridan con las dianas de ADNc. Las Figuras 108 y 112 muestran un método de detección y cuantificación de exones que usa un hueco (es decir, 10-20 nucleótidos) entre los oligonucleótidos en los extremos 5' y 3' en donde se usa polimerasa para extender el extremo o extremos 3' de las secuencias de unión a diana para copiar parte de la secuencia de la diana y cerrar el hueco para generar una unión competente para ligamiento adecuada para el ligamiento posterior para formar un producto circular. En una realización, el hueco entre los extremos 5' y 3' de las sondas oligonucleotídicas es de 10-20 nucleótidos. Sin embargo, el hueco que se va a copiar se puede adaptar a la longitud de lectura usada en la etapa de secuenciación posterior. La Figura 111 muestra un método de detección y cuantificación de exones en donde las dos secuencias de unión a diana están inmediatamente contiguas entre sí y no existe ningún hueco.

La enumeración de estos círculos informadores se puede llevar a cabo mediante una diversidad de métodos cuantitativos que incluyen, pero no se limitan a, secuenciación de nueva generación. Además de permitir la detección múltiple simultánea de numerosas secuencias diana mediante la formación de círculos, la secuenciación de nueva generación, a medida que la lectura progresa, proporciona información adicional (dos identificadores únicos) sobre los círculos informadores que distingue fácilmente los productos de ligamiento legítimos de los artefactos de ligamiento, aumentando de ese modo la sensibilidad del ensayo.

Las Figuras 109 y 110 describen dos variantes para la detección y cuantificación de fusiones de genes recurrentes encontradas en ARNm. Dado que las uniones de fusión de dos genes se producen de manera imprecisa con la deleción de secuencia de cientos a miles de bases de longitud entre los dos extremos 5' de un gen y el extremo 3' del otro gen, podría ser difícil diseñar un ensayo que contuviera docenas de pares de sondas en dirección 5' y en dirección 3' de la unión de fusión indeterminada, de modo que el método que se describe en el presente documento usa dos sondas oligonucleotídicas semicirculares que tienen cada una un extremo en un exón en dirección 5' y el otro extremo en un exón en dirección 3'. El ligamiento para formar un único producto circular solo se puede producir después de la hibridación de ambas sondas (cuatro extremos) contiguas con un hueco entre ellas, o inmediatamente contiguas entre sí en la diana de ADNc. La posterior digestión de las sondas oligonucleotídicas sin ligar (usando exonucleasas) deja un producto circular que en una variación (véase, por ejemplo, la Figura 109) no contiene información de secuencia adicional (sin hueco) del ADNc diana original. En otra variación (véase, por ejemplo, la Figura 110), la polimerasa extiende los extremos 3' de cada una de las sondas cerrando el hueco hasta que encuentra cada uno de los extremos 5' de las sondas cercanas. Estos dos círculos informadores contienen secuencia de identificador único, secuencia de identificador de paciente opcional y una de ellas contiene un sitio de unión a cebador opcional. La enumeración de estos círculos informadores se puede llevar a cabo mediante una diversidad de procedimientos cuantitativos que incluyen, pero no se limitan a, secuenciación de nueva generación. Además de permitir la detección múltiple simultánea de numerosos transcritos de fusión, la secuenciación de nueva generación proporciona información adicional (dos copias de identificadores únicos) sobre los círculos informadores que distingue fácilmente los productos de ligamiento legítimos de los artefactos de ligamiento. Cada una de las dos variaciones (Figuras 109 y 110) también muestra dos enfoques para la generación de extremos 5' competentes para ligamiento. O bien las sondas tienen fosfatos 5' antes de la hibridación (lado izquierdo de las figuras) o usan la actividad de nucleasa 5 '^3 ' de la polimerasa Taq para escindir la aleta o base coincidente solapante en el extremo 5', generando un fosfato 5' competente para ligamiento (lado derecho de las figuras).

Protocolo detallado para la detección y cuantificación de exones en ARNm o ARNlnc aislado de exosomas, células tumorales circulantes, o células sanguíneas totales que incluyen células tumorales circulantes

Variación 6.1, véase por ejemplo, la Figura 108: 6.1.a Comenzando con ARNm total o poli-A o ARNInc poli-A aislado de exosomas, células tumorales circulantes, o células sanguíneas totales que incluyen células tumorales circulantes, generar ADNc mediante el uso de transcriptasa inversa y cebadores específicos de exones.

6.1.b. Desnaturalizar el ADNc diana (94 °C, 1 minuto) en presencia de oligonucleótidos (que comprenden una región de sonda en el extremo 5' complementaria a una parte del ADNc hacia el lado 5', una secuencia de identificador único, una secuencia de identificador de paciente opcional, una secuencia de unión a cebador opcional, y una región de sonda en el extremo 3' complementaria a otra parte del ADNc hacia el lado 3'el lado 3'), y permitir que los oligonucleótidos se hibriden con sus regiones complementarias en los fragmentos deseados mediante enfriamiento a una temperatura deseada (por ejemplo, 40-50 °C durante 30 min). Los oligonucleótidos pueden contener un grupo fosfato opcional en el extremo 5' o una aleta o una base coincidente solapante en el extremo 5'. Opcionalmente, la polimerasa Taq y/o KlenTaq (polimerasa Taq que carece de actividad de nucleasa), y ligasa termoestable (preferentemente de la cepa AK16D), y opcionalmente los dNTP se añaden después de la etapa de hibridación, o al comienzo del procedimiento. En el caso en el que los oligonucleótidos tengan un fosfato 5' directamente contiguo al 3' OH en la unión, los dos extremos se pueden unir directamente usando ligasa (lado derecho de la Figura 108). En el caso en el que los oligonucleótidos tengan un fosfato 5' con un hueco entre los extremos 5' y 3', el 3' OH se extiende con KlenTaq. En el caso en el que los oligonucleótidos tengan un 5' OH, la actividad de nucleasa 5 '^3 ' de la Taq polimerasa escinde la aleta o base coincidente solapante en el extremo 5' para crear un fosfato 5' competente para ligamiento (lado izquierdo de la Figura 108). Permitir la extensión y el ligamiento a la temperatura de hibridación, y, opcionalmente, aumentar la temperatura (por ejemplo, 60 °C) para garantizar la finalización de la extensión y el ligamiento, para generar productos circulares.

6.1. c. Añadir Exonucleasa I (digiere el ADN monocatenario en la dirección 3'^5'), y Exonucleasa III (digiere el ADN bicatenario en la dirección 3'^5'), para digerir todos los productos sin ligar o mellados, dejando solo el ADN circular monocatenario deseado que comprende una copia de un tramo corto del ADNc diana original, la secuencia de identificador único, una secuencia de unión a cebador opcional, y una secuencia de identificador de paciente opcional. Este producto es adecuado para amplificación por círculo rodante (usando cebadores hexaméricos aleatorios con polimerasa phi-29) para crear repeticiones en tándem de la secuencia deseada, y posterior identificación de las dianas usando secuenciación de nueva generación, o alternativamente, secuenciación SMRT directa en el molde cerrado covalentemente, usando la secuencia de unión a cebador como un sitio de unión a cebador.

Nota 1: Para generar el fosfato 5' competente para ligamiento en el lado 5' de la diana se puede usar la nucleasa Fen en lugar de la polimerasa con actividad de nucleasa 5'^3'.

Nota 2: El extremo 5' del cebador oligonucleotídico se puede sintetizar para que contenga en enlaces tiofosfato en la 2a y 3a posiciones desde el extremo fosfato 5', (que se liberarán por la actividad de nucleasa 5 '^3 ' de la polimerasa). Para minimizar el desplazamiento de la polimerasa de esas bases a medida que extiende una base en exceso (o que podría hacer imposible el ligamiento al cebador en dirección 3'), las bases de la diana en la unión de ligamiento podrían ser preferentemente ricas en AT en el lado 3', ricas en GC en el lado 5'.

Nota 3: Cuando se usa la polimerasa KlenTaq (polimerasa Taq sin actividad de escisión por nucleasa 5'^3'), el conector en el extremo 5' se puede sintetizar para que contenga un sitio apurínico (AP) en la posición contigua al fosfato 5' deseado. Este fosfato 5' se libera usando una EndoIII termoestable (tal como Tma EndoIII). Esta enzima escinde los sitios AP dejando un fosfato 5' cuando el cebador está unido a la diana. La endonucleasa también escinde el cebador monocatenario, pero con menor eficacia, y por lo tanto el cebador hibridado con el molde podría ser el sustrato preferente.

Nota 4: Cuando se usa la polimerasa KlenTaq (polimerasa Taq sin actividad de escisión por nucleasa 5'^3'), el conector en el extremo 5' se puede sintetizar para que contenga un fosfato 5'. Alternativamente, el fosfato 5' se puede añadir usando quinasa T4 antes del ligamiento al ADN diana, o después de esa etapa de ligamiento.

Nota 5: Se puede usar una mezcla 1:20 de polimerasa Taq (con actividad de nucleasa 5 '^3 ') y KlenTaq (polimerasa Taq sin actividad de escisión por nucleasa 5 '^3 ') en condiciones de extensión distributiva (es decir, concentración de sal más elevada) para minimizar la degradación del ADN diana por traducción de mellas.

Nota 6: Si el oligonucleótido(s) también comprende sitios de unión a cebador opcionales (es decir, sitios de unión a cebador universales), para la amplificación por PCR, seguido de la identificación posterior de las dianas podría ser adecuado el uso de secuenciación de nueva generación, ensayos TaqMan, ensayos UniTaq, ensayos de PCR en tiempo real, PCR digital, micromatriz, hibridación, u otro método de detección. Nota 7: La transcriptasa inversa M^mLV se puede manipular por ingeniería para sintetizar ADNc a 50-60 °C, a partir del ARN entrante total (Invitrogen Superscript III). Alternativamente, las ADN polimerasas Tth o Tma se han manipulado por ingeniería para mejorar su actividad de Transcriptasa inversa (puede requerir la adición de cofactor Mn). Por último, la ADN polimerasa termófila PyroPhage 3173 tiene tanto actividad de desplazamiento de hebra como de transcripción inversa, y también se puede usar.

Protocolo detallado para la detección y cuantificación de fusiones génicas en ARNm aislado de exosomas, células tumorales circulantes, o células sanguíneas totales que incluyen células tumorales circulantes

Variación 6.2 (véase por ejemplo, la Figura 109): 6.2.a. El ARNm aislado de exosomas o de las CTC se convierte primero en ADNc mediante una transcriptasa inversa de tal manera que se extienda a las uniones de cualquier posible transcrito de fusión. En el método preferente, se usan cebadores específicos de exón.

6.2. b. Desnaturalizar el ADNc diana (94 °C, 1 minuto) en presencia de dos oligonucleótidos (comprendiendo el primero una secuencia en el extremo 5' complementaria a una parte única del exón diana n.° 1, una secuencia de identificador único, una secuencia de identificador de paciente opcional, una secuencia de unión a cebador opcional, y una secuencia en el extremo 3' complementaria a una parte única del exón diana n.° 2 y comprendiendo el segundo una secuencia en el extremo 5' complementaria a una parte única del exón diana n.° 2, una secuencia de identificador único, una secuencia de identificador de paciente opcional y una secuencia en el extremo 3' complementaria a una parte única del exón diana n.° 1), y permitir que los oligonucleótidos se hibriden con sus regiones complementarias en los fragmentos deseados mediante enfriamiento a una temperatura deseada (por ejemplo, 50 °C durante 2 horas). Una ligasa termoestable (preferentemente de la cepa AK16D), y opcionalmente la polimerasa Taq y los dNTP se añaden después de la etapa de hibridación, o al comienzo del procedimiento. En el caso en el que ambas secuencias oligonucleotídicas tengan un fosfato 5', no se requiere polimerasa (lado izquierdo de la Figura 109). En el caso en el que ambas secuencias oligonucleotídicas tengan un 5' OH, la actividad de nucleasa 5 '^3 ' de la polimerasa escinde la base coincidente solapante en el extremo 5' para crear un fosfato 5' competente para ligamiento (lado derecho de la Figura 109). Permitir la escisión de la aleta y el ligamiento a la temperatura de hibridación, y, opcionalmente, aumentar la temperatura (por ejemplo, 60 °C) para garantizar la finalización de la escisión de la aleta y el ligamiento, para generar productos circulares.

6.2. c. Añadir Exonucleasa I (digiere el ADN monocatenario en la dirección 3'^5'), y Exonucleasa III (digiere el ADN bicatenario en la dirección 3'^5'), para digerir todos los productos sin ligar o mellados, dejando solo el ADN monocatenario circular deseado que comprende el ADN diana original, la secuencia del conector, la secuencia de identificador único, una secuencia de unión a cebador opcional, y una secuencia de identificador de paciente opcional. Este producto es adecuado para la amplificación por círculo rodante (usando cebadores hexaméricos aleatorios con polimerasa phi-29) para crear repeticiones en tándem de la secuencia deseada, y posterior identificación de las dianas usando secuenciación de nueva generación, o alternativamente, secuenciación SMRT directa en el molde cerrado covalentemente, usando la secuencia de unión a cebador como un sitio de unión a cebador.

Nota 2: Si el oligonucleótido(s) también comprende sitios de unión a cebador opcionales (es decir, sitios de unión a cebador universales), para la amplificación por PCR, seguido de la identificación posterior de las dianas podría ser adecuado el uso de secuenciación de nueva generación, ensayos TaqMan, ensayos UniTaq, ensayos de PCR en tiempo real, PCR digital, micromatriz, hibridación, u otro método de detección. Nota 3: En los sistemas que usan dos sondas oligonucleotídicas puente, cada una conteniendo secuencia de identificador único, secuencia de identificador de paciente opcional y un sitio de unión a cebador opcional, se recomienda que solo uno y no ambos oligonucleótidos contengan un sitio de unión a cebador (ya sea el oligonucleótido en dirección 5' o en dirección 3'). Para un nivel adicional de detección de falsos positivos, se recomienda que la secuencia de identificador único sea diferente en las sondas en dirección 5' y en dirección 3'.

Nota 4: La transcriptasa inversa MMLV se puede manipular por ingeniería para sintetizar ADNc a 50-60 °C, a partir del ARN entrante total (Invitrogen Superscript III). Alternativamente, las ADN polimerasas Tth o Tma se han manipulado por ingeniería para mejorar su actividad de Transcriptasa inversa (puede requerir la adición de cofactor Mn). Por último, la ADN polimerasa termófila PyroPhage 3173 tiene tanto actividad de desplazamiento de hebra como de transcripción inversa, y también se puede usar.

Protocolo detallado para otra variación para detección y cuantificación de fusiones génicas en ARNm aislado de exosomas, células tumorales circulantes, o células sanguíneas totales que incluyen células tumorales circulantes

Variación 6.3 (véase por ejemplo, la Figura 110): 6.3.a. El ARNm aislado de exosomas o de las CTC se convierte primero en ADNc mediante una transcriptasa inversa de tal manera que se extienda a las uniones de cualquier posible transcrito de fusión. En el método preferente, se usan cebadores específicos de exón.

6.3. b. Desnaturalizar el ADNc diana (94 °C, 1 minuto) en presencia de dos oligonucleótidos (comprendiendo el primero una secuencia en el extremo 5' complementaria a una parte única del exón diana n.° 1, una secuencia de identificador único, una secuencia de identificador de paciente opcional, una secuencia de unión a cebador opcional, y una secuencia en el extremo 3' complementaria a una parte única del exón diana n.° 2 y comprendiendo el segundo una secuencia en el extremo 5' complementaria a una parte única del exón diana n.° 2, una secuencia de identificador único, una secuencia de identificador de paciente opcional y una secuencia en el extremo 3' complementaria a una parte única del exón diana n.° 1), y permitir que los oligonucleótidos se hibriden con sus regiones complementarias en los fragmentos deseados mediante enfriamiento a una temperatura deseada (por ejemplo, 50 °C durante 2 horas). La polimerasa Taq y/o KlenTaq (polimerasa Taq que carece de actividad nucleasa), ligasa termoestable (preferentemente de la cepa AK16D), y los dNTP se añaden después de la etapa de hibridación, o al comienzo del procedimiento. En el caso en el que ambas secuencias oligonucleotídicas tengan un fosfato 5', KlenTaq extiende el extremo 3' hasta que es directamente contiguo al extremo 5' competente para ligamiento (lado izquierdo de la Figura 110). En el caso en el que ambas secuencias oligonucleotídicas tengan un 5' OH, la actividad de nucleasa 5 '^3 ' de la polimerasa escinde la base coincidente solapante en el extremo 5' para crear un fosfato 5' competente para ligamiento (lado derecho de la Figura 110). Permitir la extensión y el ligamiento a la temperatura de hibridación, y, opcionalmente, aumentar la temperatura (por ejemplo, 60 °C) para garantizar la finalización de la extensión y el ligamiento, para generar productos circulares.

6.3. c. Añadir Exonucleasa I (digiere el ADN monocatenario en la dirección 3'^5'), y Exonucleasa III (digiere el ADN bicatenario en la dirección 3'—^5'), para digerir todos los productos sin ligar o mellados, dejando solo el ADN monocatenario circular deseado que comprende el ADN diana original, la secuencia del conector, la secuencia de identificador único, una secuencia de unión a cebador opcional, y una secuencia de identificador de paciente opcional. Este producto es adecuado para la amplificación por círculo rodante (usando cebadores hexaméricos aleatorios con polimerasa phi-29) para crear repeticiones en tándem de la secuencia deseada, y posterior identificación de las dianas usando secuenciación de nueva generación, o alternativamente, secuenciación SMRT directa en el molde cerrado covalentemente, usando la secuencia de unión a cebador como un sitio de unión a cebador.

Nota 1: Para generar el fosfato 5' competente para ligamiento en el lado 5' de la diana se puede usar la nucleasa Fen en lugar de la polimerasa con actividad de nucleasa 5— 3'.

Nota 2: El extremo 5' del cebador oligonucleotídico se puede sintetizar para que contenga en enlaces tiofosfato en la 2a y 3a posiciones desde el extremo fosfato 5', (que se liberarán por la actividad de nucleasa 5— 3' de la polimerasa). Para minimizar el desplazamiento de la polimerasa de esas bases a medida que extiende una base en exceso (o que podría hacer imposible el ligamiento al cebador en dirección 3'), las bases de la diana en la unión de ligamiento podrían ser preferentemente ricas en AT en el lado 3', y ricas en GC en el lado 5'.

Nota 3: Cuando se usa la polimerasa KlenTaq (polimerasa Taq sin actividad de escisión por nucleasa 5— 3'), el conector en el extremo 5' se puede sintetizar para que contenga un sitio apurínico (AP) en la posición contigua al fosfato 5' deseado. Este fosfato 5' se libera usando una EndolII termoestable (tal como Tma Endolll). Esta enzima escinde los sitios AP dejando un fosfato 5' cuando el cebador está unido a la diana. La endonucleasa también escinde el cebador monocatenario, pero con menor eficacia, y por lo tanto el cebador hibridado con el molde podría ser el sustrato preferente.

Nota 4: Cuando se usa la polimerasa KlenTaq (polimerasa Taq sin actividad de escisión por nucleasa 5— 3'), el conector en el extremo 5' se puede sintetizar para que contenga un fosfato 5'. Alternativamente, el fosfato 5' se puede añadir usando quinasa T4 antes del ligamiento al ADN diana, o después de esa etapa de ligamiento.

Nota 5: Se puede usar una mezcla 1:20 de polimerasa Taq (con actividad de nucleasa 5— 3') y KlenTaq (polimerasa Taq sin actividad de escisión por nucleasa 5— 3') en condiciones de extensión distributiva (es decir, concentración de sal más elevada) para minimizar la degradación del ADN diana por traducción de mellas.

Nota 6: Si el oligonucleótido(s) también comprende sitios de unión a cebador opcionales (es decir, sitios de unión a cebador universales), para la amplificación por PCR, seguido de la identificación posterior de las dianas podría ser adecuado el uso de secuenciación de nueva generación, ensayos TaqMan, ensayos UniTaq, ensayos de PCR en tiempo real, PCR digital, micromatriz, hibridación, u otro método de detección. Nota 7: En los sistemas que usan dos sondas oligonucleotídicas puente, cada una conteniendo secuencia de identificador único, secuencia de identificador de paciente opcional y un sitio de unión a cebador opcional, se recomienda que solo uno y no ambos oligonucleótidos contengan un sitio de unión a cebador (ya sea el oligonucleótido en dirección 5' o en dirección 3'). Para un nivel adicional de detección de falsos positivos, se recomienda que la secuencia de identificador único sea diferente en las sondas en dirección 5' y en dirección 3'.

Nota 8: La transcriptasa inversa MMLV se puede manipular por ingeniería para sintetizar ADNc a 50-60 °C, a partir del ARN entrante total (Invitrogen Superscript III). Alternativamente, las ADN polimerasas Tth o Tma se han manipulado por ingeniería para mejorar su actividad de Transcriptasa inversa (puede requerir la adición de cofactor Mn). Por último, la ADN polimerasa termófila PyroPhage 3173 tiene tanto actividad de desplazamiento de hebra como de transcripción inversa, y también se puede usar.

Protocolo detallado para la detección y cuantificación de ARNm que contiene exones específicos (que pueden no ser contiguos entre sí) en ARNm aislado de exosomas, células tumorales circulantes, o células sanguíneas totales que incluyen células tumorales circulantes

Variación 6.4 (véase por ejemplo, la Figura 111) 6.4.a. El ARNm aislado de exosomas o de las CTC se convierte primero en ADNc mediante una transcriptasa inversa de tal manera que incluya ambas regiones del exón. En el método preferente, se usan cebadores específicos de exón.

6.4.b. Desnaturalizar el ADNc diana (94 °C, 1 minuto) en presencia de dos oligonucleótidos (comprendiendo el primero una secuencia en el extremo 5' complementaria a una parte única del exón diana n.° 1, una secuencia de identificador único, una secuencia de identificador de paciente opcional, una secuencia de unión a cebador opcional, y una secuencia en el extremo 3' complementaria a una parte única del exón diana n.° 2 y comprendiendo el segundo una secuencia en el extremo 5' complementaria a una parte única del exón diana n.° 2, una secuencia de identificador único, una secuencia de identificador de paciente opcional y una secuencia en el extremo 3' complementaria a una parte única del exón diana n.° 1), y permitir que los oligonucleótidos se hibriden con sus regiones complementarias en los fragmentos deseados mediante enfriamiento a una temperatura deseada (por ejemplo, 50 °C durante 2 horas). Una ligasa termoestable (preferentemente de la cepa AK16D), y opcionalmente la polimerasa Taq y los dNTP se añaden después de la etapa de hibridación, o al comienzo del procedimiento. En el caso en el que ambas secuencias oligonucleotídicas tengan un fosfato 5', no se requiere polimerasa (lado izquierdo de la Figura 111). En el caso en el que ambas secuencias oligonucleotídicas tengan un 5' OH, la actividad de nucleasa 5 '^3 ' de la polimerasa escinde la base coincidente solapante en el extremo 5' para crear un fosfato 5' competente para ligamiento (lado derecho de la Figura 111). Permitir la escisión de la aleta y el ligamiento a la temperatura de hibridación, y, opcionalmente, aumentar la temperatura (por ejemplo, 60 °C) para garantizar la finalización de la escisión de la aleta y el ligamiento, para generar productos circulares.

6.4. c. Añadir Exonucleasa I (digiere el ADN monocatenario en la dirección 3'^5'), y Exonucleasa III (digiere el ADN bicatenario en la dirección 3'^5'), para digerir todos los productos sin ligar o mellados, dejando solo el ADN monocatenario circular deseado que comprende el ADN diana original, la secuencia del conector, la secuencia de identificador único, una secuencia de unión a cebador opcional, y una secuencia de identificador de paciente opcional. Este producto es adecuado para la amplificación por círculo rodante (usando cebadores hexaméricos aleatorios con polimerasa phi-29) para crear repeticiones en tándem de la secuencia deseada, y posterior identificación de las dianas usando secuenciación de nueva generación, o alternativamente, secuenciación SMRT directa en el molde cerrado covalentemente, usando la secuencia de unión a cebador como un sitio de unión a cebador.

Variación 6.5 (véase por ejemplo, la Figura 112): 6.5.a. El ARNm aislado de exosomas o de las CTC se convierte primero en ADNc mediante una transcriptasa inversa de tal manera que incluya ambas regiones del exón. En el método preferente, se usan cebadores específicos de exón.

6.5. b. Desnaturalizar el ADNc diana (94 °C, 1 minuto) en presencia de dos oligonucleótidos (comprendiendo el primero una secuencia en el extremo 5' complementaria a una parte única del exón diana n.° 1, una secuencia de identificador único, una secuencia de identificador de paciente opcional, una secuencia de unión a cebador opcional, y una secuencia en el extremo 3' complementaria a una parte única del exón diana n.° 2 y comprendiendo el segundo una secuencia en el extremo 5' complementaria a una parte única del exón diana n.° 2, una secuencia de identificador único, una secuencia de identificador de paciente opcional y una secuencia en el extremo 3' complementaria a una parte única del exón diana n.° 1), y permitir que los oligonucleótidos se hibriden con sus regiones complementarias en los fragmentos deseados mediante enfriamiento a una temperatura deseada (por ejemplo, 50 °C durante 2 horas). La polimerasa Taq y/o KlenTaq (polimerasa Taq que carece de actividad nucleasa, una ligasa termoestable (preferentemente de la cepa AK16D), y los dNTP se añaden después de la etapa de hibridación, o al comienzo del procedimiento. En el caso en el que ambas secuencias oligonucleotídicas tengan un fosfato 5', KlenTaq extiende el extremo 3' hasta que es directamente contiguo al extremo 5' competente para ligamiento (lado izquierdo de la Figura 112). En el caso en el que ambas secuencias oligonucleotídicas tengan un 5' OH, la actividad de nucleasa 5 '^3 ' de la polimerasa escinde la base coincidente solapante en el extremo 5' para crear un fosfato 5' competente para ligamiento (lado derecho de la Figura 112). Permitir la extensión y el ligamiento a la temperatura de hibridación, y, opcionalmente, aumentar la temperatura (por ejemplo, 60 °C) para garantizar la finalización de la extensión y el ligamiento, para generar productos circulares.

6.5. c. Añadir Exonucleasa I (digiere el ADN monocatenario en la dirección 3'^5'), y Exonucleasa III (digiere el ADN bicatenario en la dirección 3'^5'), para digerir todos los productos sin ligar o mellados, dejando solo el ADN monocatenario circular deseado que comprende el ADN diana original, la secuencia del conector, la secuencia de identificador único, una secuencia de unión a cebador opcional, y una secuencia de identificador de paciente opcional. Este producto es adecuado para la amplificación por círculo rodante (usando cebadores hexaméricos aleatorios con polimerasa phi-29) para crear repeticiones en tándem de la secuencia deseada, y posterior identificación de las dianas usando secuenciación de nueva generación, o alternativamente, secuenciación SMRT directa en el molde cerrado covalentemente, usando la secuencia de unión a cebador como un sitio de unión a cebador.

Nota 2: El extremo 5' del cebador oligonucleotídico se puede sintetizar para que contenga en enlaces tiofosfato en la 2a y 3a posiciones desde el extremo fosfato 5', (que se liberarán por la actividad de nucleasa 5 '^3 ' de la polimerasa). Para minimizar el desplazamiento de la polimerasa de esas bases a medida que extiende una base en exceso (o que podría hacer imposible el ligamiento al cebador en dirección 3'), las bases de la diana en la unión de ligamiento podrían ser preferentemente ricas en AT en el lado 3', y ricas en GC en el lado 5'.

Nota 3: Cuando se usa la polimerasa KlenTaq (polimerasa Taq sin actividad de escisión por nucleasa 5'^3'), el conector en el extremo 5' se puede sintetizar para que contenga un sitio apurínico (AP) en la posición contigua al fosfato 5' deseado. Este fosfato 5' se libera usando una EndolII termoestable (tal como Tma Endolll). Esta enzima escinde los sitios AP dejando un fosfato 5' cuando el cebador está unido a la diana. La endonucleasa también escinde el cebador monocatenario, pero con menor eficacia, y por lo tanto el cebador hibridado con el molde podría ser el sustrato preferente.

Ejemplo profético 7 -- Cuantificación exacta de miARN específico de tumor aislado de exosomas o proteínas Argonaut, (por ejemplo, una docena de marcadores de microARN que predicen el resultado o guían el tratamiento)

El microARN (miARN) se ha identificado como marcador potencial histoespecífico de la presencia de tumores, su clasificación y pronóstico. Los miARN existen en suero y plasma como complejos con proteínas Ago2 o mediante encapsulación como exosomas.

Las Figuras 114 - 117 describen métodos para capturar secuencias de miARN para su posterior enumeración mediante secuenciación de alta precisión. En todos los métodos mostrados, el procedimiento implica preparar una copia de ADNc de la secuencia de miARN diana que se convierte en un ADN circular adecuado.

Protocolo detallado para la captura, identificación y cuantificación de todas las especies de miARN que están presentes en suero, plasma o exosomas sin ninguna selección

Variación 7.1 (véase por ejemplo, la Figura 114) 7.1.a. Aislar el miARN de los exosomas o las CTC. Ligar un conector universal al extremo 3' del miARN usando un conector de ADN con un fosfato 5' y un extremo 3' bloqueado usando ARN ligasa 1.

7.1. b. Fosforilar el extremo 5' del miARN modificado con quinasa T4. Ligar un conector universal al extremo 5' del conector modificado usando un conector de ADN con un fosfato 5' y un extremo 3' bloqueado.

7.1. c. Después de retirar el exceso de conectores, desnaturalizar los ácidos nucleicos (94 °C, 1 minuto) en presencia de oligonucleótidos (que comprenden secuencias complementarias a los extremos 5' y 3' de los conectores, una secuencia de identificador único, una secuencia de identificador de paciente opcional, una secuencia de unión a cebador opcional, y permitir que los oligonucleótidos se hibriden con sus regiones complementarias en los fragmentos deseados mediante enfriamiento a una temperatura deseada (por ejemplo, 40-50 °C durante 30 min). Añadir una transcriptasa inversa que carece de actividad 5 '^3 ' (es decir, ADN polimerasa Tth usando cofactor Mn2+), una ligasa termoestable (preferentemente de la cepa AK16D) y los dNTP; los componentes se añaden después de la etapa de hibridación, o al comienzo del procedimiento. Permitir la extensión y el ligamiento a la temperatura de hibridación, y, opcionalmente, aumentar la temperatura (por ejemplo, 60 °C) para garantizar la finalización de la extensión y el ligamiento, para generar productos circulares.

7.1. d. Añadir UDG y endonucleasas AP para mellar el miARN en la diana original, añadir Exonucleasa I (digiere el ADN monocatenario en la dirección 3'^5'), y Exonucleasa III (digiere el ADN bicatenario en la dirección 3'^5'), para digerir todos los productos sin ligar o mellados, dejando solo el ADN circular monocatenario deseado que comprende una copia del miARN diana original, la secuencia de identificador único, una secuencia de unión a cebador opcional, y una secuencia de identificador de paciente opcional. Este producto es adecuado para la amplificación por círculo rodante (usando un cebador complementario a la secuencia de unión a cebador con la polimerasa phi-29) para crear repeticiones en tándem de la secuencia deseada. Esto puede ir seguido de la identificación de las dianas usando secuenciación de nueva generación, o alternativamente, secuenciación SMRT directa en el molde cerrado covalentemente, usando la secuencia de unión a cebador opcional como un sitio de unión a cebador.

Nota 1. Si el oligonucleótido(s) también comprenden sitios de unión a cebador opcionales (es decir, sitios de unión a cebador universales), el ADN circular podría ser adecuado para amplificación por PCR, seguido de identificación posterior de las dianas usando secuenciación de nueva generación, ensayos TaqMan, ensayos UniTaq, ensayos de PCR en tiempo real, PCR digital, micromatriz, hibridación u otros métodos de detección.

Las siguientes variantes del método (véanse por ejemplo, las Figuras 115 - 117) están diseñadas para la captura de secuencias de miARN específicas de miARN total aislado de suero, plasma o exosomas. Estos métodos hacen uso de sondas de captura complementarias a todas o parte de las secuencias de miARN diana, pero posteriormente preparan copias de ADNc de la secuencia de miARN original y, por lo tanto, son capaces de detectar variaciones de una sola base en el miARN o de captura debido a una hibridación errónea.

Protocolo detallado para la captura, identificación y cuantificación de especies específicas de miARN que están presentes en suero, plasma o exosomas sin ninguna selección

Variación 7.2 (véase por ejemplo, la Figura 115) 7.2.a. Aislar el miARN de los exosomas o las CTC. Fosforilar el miARN aislado usando quinasa T4. Hibridar pares oligonucleotídicos, comprendiendo el primero de los cuales una secuencia complementaria a la diana de miARN, flanqueada por secuencias de los conectores 5' y 3' únicos, mientras que el segundo oligonucleótido comprende un extremo fosforilado en el extremo 5' seguido del complemento del conector en el extremo 3' único, una secuencia de identificador único, una secuencia de identificador de paciente opcional, una secuencia de unión a cebador opcional y un complemento del conector en el extremo 5' único, siendo la última base una base ribonucleotídica. La ARN ligasa T4 2 está presente para sellar covalentemente los extremos del miARN creando productos de ligamiento circulares.

7.2. b. Añadir Exonucleasa I (digiere el ADN monocatenario en la dirección 3'^5'), y Exonucleasa III (digiere el ADN bicatenario en la dirección 3'^5'), para digerir todos los oligonucleótidos no ligados, dejando solo las quimeras de miARN y ADN circulares monocatenarias deseadas. Inactivar con calor las exonucleasas a 80 °C durante 20 minutos.

7.2. c. Añadir un cebador universal fosforilado en el extremo 5' a los productos circulares, hibridar a 37 °C. Añadir transcriptasa inversa que carece de actividad de exonucleasa 5 '^3 ' (ADN polimerasa Tth usando cofactor Mn2+), ligasa termoestable (preferentemente de la cepa AK16D) y los dNTP; los componentes se añaden después de la etapa de hibridación, o al comienzo del procedimiento. Permitir la extensión y el ligamiento a la temperatura de hibridación, y, opcionalmente, aumentar la temperatura (por ejemplo, 60 °C) para garantizar la finalización de la extensión y el ligamiento, para generar productos circulares que ahora contienen una copia del miARN diana original.

7.2. d. Añadir UDG y endonucleasas AP para mellar el miARN en la diana original, añadir Exonucleasa I (digiere el ADN monocatenario en la dirección 3'^5'), y Exonucleasa III (digiere el ADN bicatenario en la dirección 3'^5'), para digerir todos los productos sin ligar o mellados, dejando solo el ADN circular monocatenario deseado que comprende una copia del miARN diana original, la secuencia de identificador único, una secuencia de unión a cebador opcional, y una secuencia de identificador de paciente opcional. Este producto es adecuado para la amplificación por círculo rodante (usando un cebador complementario a la secuencia de unión a cebador con la polimerasa phi-29) para crear repeticiones en tándem de la secuencia deseada. Esto puede ir seguido de la identificación de las dianas usando secuenciación de nueva generación, o alternativamente, secuenciación SMRT directa en el molde cerrado covalentemente, usando la secuencia de unión a cebador opcional como un sitio de unión a cebador.

La siguiente variación del método hace uso de un espaciador C6 o C18 que permite copiar el miARN diana pero evita completar un producto circular y, por lo tanto, elimina la detección de falsos positivos de niveles bajos del miARN deseado. La traducción de mellas de un cebador universal que contiene tiofosfatos en la 2a y 3a posiciones con respecto al extremo 5' no tiene la capacidad de intercalar el espaciador C6 o C18 en el medio de la secuencia del complemento de unión a miARN diana que permite la destrucción de cualquier sonda de miARN no ligada.

Variación 7.3 (véase por ejemplo, la Figura 116): 7.3.a. Aislar el miARN de los exosomas o las CTC. Fosforilar el miARN aislado usando quinasa T4. Hibridar pares oligonucleotídicos, comprendiendo el primero de los cuales una secuencia complementaria secuencia complementaria a la diana de miARN que contiene un único espaciador C6 o C18, flanqueada por secuencias de los conectores 5' y 3' únicos, mientras que el segundo oligonucleótido comprende un extremo fosforilado en 5' seguido del complemento del conector en el extremo 3' único, una secuencia de identificador único, una secuencia de identificador de paciente opcional, una secuencia de unión a cebador opcional y un complemento del conector en el extremo 5' único, siendo la última base una base ribonucleotídica. En la mezcla de hibridación también está presente un cebador universal que contiene enlaces tiofosfatos en la 2a y 3a posiciones del extremo 5'. La ARN ligasa T42 está presente para sellar covalentemente los extremos del miARN creando productos de ligamiento circulares.

7.3. b. Añadir transcriptasa inversa que tiene actividad de exonucleasa 5 '^3 ' (ADN polimerasa Tth usando cofactor Mn2+) y ligasa termoestable (preferentemente de la cepa AK16D), y los dNTP se añaden después de la etapa de hibridación, o al comienzo del procedimiento. Permitir la extensión y el ligamiento a la temperatura de hibridación, y, opcionalmente, aumentar la temperatura (por ejemplo, 60 °C) para garantizar la finalización de la extensión y el ligamiento, para generar productos circulares ahora contienen una copia del miARN diana original.

7.3. c. Añadir UDG y endonucleasas AP para mellar el miARN en la diana original, a continuación, añadir Exonucleasa I (digiere el ADN monocatenario en la dirección 3'^5'), y Exonucleasa III (digiere el ADN bicatenario en la dirección 3'^5'), para digerir todos los productos sin ligar o mellados, dejando solo el ADN circular monocatenario deseado que comprende una copia del miARN diana original, la secuencia de identificador único, una secuencia de unión a cebador opcional, y una secuencia de identificador de paciente opcional. Este producto es adecuado para la amplificación por círculo rodante (usando un cebador complementario a la secuencia de unión a cebador con la polimerasa phi-29) para crear repeticiones en tándem de la secuencia deseada. Esto puede ir seguido de la identificación de las dianas usando secuenciación de nueva generación, o alternativamente, secuenciación SMRT directa en el molde cerrado covalentemente, usando la secuencia de unión a cebador opcional como un sitio de unión a cebador.

Otra variante (Figura 117) aprovecha una sonda de captura de tallo-bucle complementaria a alguna parte del miARN diana. El protocolo detallado es como se describe a continuación:

Variación 7.4 (véase por ejemplo, la Figura 117): 7.4.a. Aislar el miARN de los exosomas o las CTC. Hibridar una sonda de tallo-bucle que consta del extremo 5' que forma un tallo-bucle, una región en el extremo 3' sobresaliente complementaria a alguna parte del miARN diana. La parte del bucle contiene una secuencia de identificador único, una secuencia de identificador de paciente opcional, una secuencia de unión a cebador opcional y un enlace escindible opcional. Extender el extremo 3' de la sonda de tallo-bucle con una transcriptasa inversa y los dNTP.

7.4. b. Desnaturalizar los ácidos nucleicos (94 °C, 1 minuto) en presencia de oligonucleótidos (que comprenden secuencias complementarias a la secuencia de tallo-bucle en el extremo 5' y los extremos 3' del ADNc extendido. Además, el extremo 5' está bloqueado para evitar la traducción de mellas) y permitir que los oligonucleótidos se hibriden con sus regiones complementarias en los fragmentos deseados mediante enfriamiento a una temperatura deseada (por ejemplo, 40-50 °C durante 30 min).

7.4. c. Añadir KlenTaq (polimerasa Taq que carece de actividad de nucleasa) y ligasa termoestable (preferentemente de la cepa AK16D), y los dNTP se añaden después de la etapa de hibridación, o al comienzo del procedimiento. KlenTaq extiende el extremo 3' hasta que es directamente contiguo al extremo 5' competente para ligamiento. Permitir la extensión y el ligamiento a la temperatura de hibridación, y, opcionalmente, aumentar la temperatura (por ejemplo, 60 °C) para garantizar la finalización de la extensión y el ligamiento, para generar productos circulares.

7.4.d. Escindir la sonda oligonucleotídica en un enlace escindible (por ejemplo, U escindido usando UDG y endonucleasa AP). Añadir Exonucleasa I (digiere el ADN monocatenario en la dirección 3'^5'), y Exonucleasa III (digiere el ADN bicatenario en la dirección 3'^5'), para digerir todos los productos sin ligar y el exceso de sondas, dejando solo el ADN circular monocatenario deseado que comprende una copia de un tramo corto del ADNc diana original, la secuencia de identificador único, una secuencia de unión a cebador opcional, y una secuencia de identificador de paciente opcional. Este producto es adecuado para la amplificación por círculo rodante (usando cebadores hexaméricos aleatorios con polimerasa phi-29) para crear repeticiones en tándem de la secuencia deseada, y posterior identificación de las dianas usando secuenciación de nueva generación, o alternativamente, secuenciación SMRT directa en el molde cerrado covalentemente, usando la secuencia de unión a cebador como un sitio de unión a cebador.

Ejemplo profético 8 -- Necesidad clínica en diagnóstico prenatal de una muestra de plasma materno

En el campo de la atención prenatal existe una necesidad urgente de desarrollar ensayos no invasivos para aneuploidías comunes, tales como la trisomía de los cromosomas 21, 18 o 13, pequeñas deleciones tales como las que se obtienen a partir de deleciones en el gen de la distrofia muscular de Duchenne (DMD), otras pequeñas anomalías en el número de copias tales como las responsables del autismo, translocaciones equilibradas para determinar potenciales manifestaciones clínicas, cambios en la metilación, que pueden dar como resultado enfermedades asociadas con la impronta genómica tales como el síndrome de Angelman o el síndrome de Prader-Willi, cambios en repeticiones triples responsables de enfermedades tales como la enfermedad de Huntington, mutaciones puntuales, tales como las del gen CFTR responsable de la fibrosis quística.

Visión general: Un trabajo reciente ha demostrado que el ADN fetal como porcentaje del ADN materno en el plasma es de aproximadamente un 6 %, un 20 % y un 26 % en el 1er, 2°, y 3er trimestres respectivamente. Debido a cómo se degrada el ADN, el ADN materno tiene en general aproximadamente 160 bases y sigue asociado con la histona HI, mientras que el ADN fetal tiene aproximadamente 140 bases y no está asociado con la histona. Dependiendo de la necesidad clínica, y cuando el conocimiento proporcione la mejor atención, se pueden desarrollar ensayos con suficiente sensibilidad para detectar el ADN fetal en el trimestre apropiado.

Existen aproximadamente 3.500 trastornos genéticos recesivos en donde se conoce el gen responsable. Los trastornos más comunes son el resultado de anomalías en las copias del ADN, ya sea por un cromosoma adicional, tal como en la trisomía del cromosoma 21, o por la eliminación de una parte de un gen, tal como en el gen de la distrofia muscular de Duchenne (DMD). Al considerar la identificación sistemática prenatal, es necesario sopesar la probabilidad de un trastorno genético frente al riesgo del procedimiento. En la actualidad, el procedimiento de diagnóstico habitual recomienda la amniocentesis durante la semana 17 para mujeres embarazadas a partir de los 35 años, ya que el riesgo de trisomía del cromosoma 21 o de otra aneuploidía cromosómica en 1 de cada 200 embarazos coincide ahora con el riesgo de aborto espontáneo después del procedimiento.

Al considerar el uso de los métodos de secuenciación de ácidos nucleicos que se describen en el presente documento para la identificación sistemática prenatal, se recomiendan dos niveles de ensayos. Para de identificación sistemática de bajo coste de todos los embarazos para trisomía de los cromosomas 21, 13 y 18, los métodos de secuenciación de la presente invención se pueden usar para identificar rápidamente genes expresados diferencialmente en los cromosomas 21, 13 y 18, por ejemplo, identificar aquellos genes que están desactivados en el feto como consecuencia del silenciamiento de la metilación, pero están presentes en el adulto. Se identifican regiones similares en tres cromosomas de control, es decir, 2, 5, 7. Incluso cuando se aísla el ADN del suero de una madre en el primer trimestre, se puede calcular rápidamente el porcentaje de ADN que procede del feto comparando el ADN metilado con el no metilado entre las regiones cromosómicas de control - en el ejemplo del presente documento, sería de un 6 %. Si existe trisomía en cualquiera de los otros cromosomas, es decir, trisomía del cromosoma 21, a continuación los promotores de ese cromosoma mostrarán metilación en aproximadamente un 9 %, en otras palabras, un 50 % más que en el caso de la disomía normal. Se recomienda evaluar 1.000 equivalentes genómicos, de modo que un recuento de 90 copias metiladas para el caso de la trisomía se distinga fácilmente de 60 copias metiladas para la muestra normal.

Como primera etapa en dicho procedimiento, identificar aquellas regiones promotoras que están metiladas en el ADN fetal durante las primeras etapas de desarrollo, pero que nunca están metiladas en el ADN materno (es decir, WBC). Esto se debe realizar empíricamente, comparando el patrón de metilación del ADNcf aislado de mujeres embarazadas con un feto diploide, un feto que contiene una trisomía y sin embarazo. Para una revisión generalizada sobre el uso de marcadores epigenéticos para NIPD (diagnóstico prenatal no invasivo) véase Patsalis et al., "A New Non-invasive Prenatal Diagnosis of Down syndrome through Epigenetic Markers and Realtime qPCR", Expert Opin Biol Ther. 12 Supl 1:S155-61 (2012). Como ejemplo que detecta el estado de metilación en un único marcador PDE9A, véase Lim et al., "Non-invasive Epigenetic Detection of Fetal Trisomy 21 in First Trimester Maternal Plasma", PLoS One 6(11):e27709 (2011). Los enfoques que se describen en el presente documento podrán identificar tales marcadores mucho más rápidamente. Para identificar la metilación en sitios HinPlI contiguos en todo el genoma, se podría usar el enfoque que se destaca en la Figura 28. Alternativamente, al centrarse en genes conocidos en los cromosomas seleccionados, se pueden diseñar sondas para regiones diana específicas y evaluar la metilación como en la Figura 27. Este enfoque también se podría usar en el ensayo de identificación sistemática prenatal final. Para sitios de metilación más abundantes, es decir, en sitios AciI contiguos entre sitios HaeIII, en todo el genoma, se podría usar el enfoque que se destaca en la Figura 36. Al centrarse en genes conocidos, se pueden diseñar sondas para regiones diana específicas y evaluar la metilación como en las Figuras 36, 37, 39, y 40. Si los enfoques anteriores no proporcionan suficientes marcadores, se pueden identificar sitios de metilación en sitios AciI contiguos en todo el genoma usando el enfoque que se destaca en la Figura 33. F Para estos sitios, se pueden usar los enfoques más dirigidos que se destacan en las Figuras 29, y 31.

Alternativamente, existen ciertos genes que se activan durante el desarrollo fetal y que están desactivados en el tejido o la sangre de los adultos. En estas condiciones, podría ser importante identificar regiones promotoras sin metilar comparando el patrón de no metilación del ADNcf aislado de mujeres embarazadas con un feto diploide, un feto que contiene una trisomía y sin embarazo. Para identificar patrones de pérdida de metilación en todo el genoma, se pueden usar los métodos que se describen en las Figuras 51, 57 o 62. Para identificar genes conocidos de no metilación en los cromosomas seleccionados, se pueden diseñar sondas para regiones diana específicas y evaluar la metilación como en las Figuras 53, 55, 58, 60. Este enfoque también se podría usar en el ensayo de identificación sistemática prenatal final.

Además, el enfoque anterior podrá cuantificar con exactitud los cambios de metilación en otras posiciones del genoma, que pueden dar como resultado enfermedades asociadas con la impronta genómica, tales como el síndrome de Angelman o el síndrome de Prader-Willi. La capacidad de la presente divulgación para determinar el estado de metilación y al mismo tiempo determinar si la deleción está en el cromosoma paterno o materno por detección de los SNP o polimorfismos de secuencia repetitiva de identificación materna o paterna ubicados en cis en dirección 5' o en dirección 3') potenciará su discriminación diagnóstica de enfermedades de impronta genómica.

Recientemente se ha informado de un enfoque basado en ligasa para hacer el recuento de fragmentos cromosómicos para el diagnóstico prenatal no invasivo denominado DANSR (Sparks et al., "Selective Analysis of Cell-free DNA in Maternal Blood for Evaluation of Fetal Trisomy", Prenat Diagn. 32(1):3-9 (2012)). Este enfoque se basa en el uso de 3 fragmentos en una reacción de ligamiento en el brazo cromosómico: un fragmento izquierdo que contiene una secuencia universal en dirección 5', un fragmento intermedio y un fragmento derecho que contiene una secuencia universal en dirección 3'. Después de una reacción de ligamiento, los productos se separan de los cebadores entrantes, se amplifican por PCR y se secuencian. Los ligamientos falsos (es decir, en dirección 5' directamente al cebador en dirección 3' incorrecto, sin fragmento intermedio) se distinguen fácilmente por secuenciación y fueron inferiores al 5 %. La presente divulgación también puede usar este enfoque, ya sea capturando dianas específicas de los productos ligados de todo el genoma, como se describe en las Figuras 63-69, o usando sondas específicas de diana durante el suceso de ligamiento inicial, como se describe en las Figuras 13-26 o las Figuras 70-78.

Dado que el enfoque mencionado anteriormente depende del recuento de las regiones cromosómicas, la exactitud de la técnica se puede mejorar aprovechando los polimorfismos en tales regiones. Las Figuras 70, 77 y 78 describen un conjunto de técnicas para capturar fragmentos que contienen polimorfismos de secuencia repetitiva. Estos polimorfismos permitirán identificar las diferencias en el número de copias, ya sea en todo el genoma o en lugares definidos, ya sea para ganancias o pérdidas de copias - esto también es relevante para el análisis del genoma del cáncer. La trisomía puede surgir de la no disyunción durante la meiosis inicial o durante la segunda meiosis. Por ejemplo tomar el caso de la espermatogénesis. Si la no disyunción se produce en la primera división meiótica, entonces los cromosomas homólogos se mueven al mismo polo durante la anafase. Cuando estos se dividen a continuación para formar gametos, dos serán disómicos (conteniendo 1 de cada uno de los cromosomas originales) y dos serán nulosómicos. Si estos gametos fertilizan un ovocito euploide, los cigotos resultantes podrían ser 2 trisómicos (1 1 1) y dos monosómicos. Si, por otra parte, la no disyunción se produce en la segunda división meiótica, entonces las cromátidas hermanas se mueven al mismo polo durante la anafase. Cuando estas se dividen a continuación para formar gametos, una será disómica (conteniendo 2 de los mismos cromosomas parentales) y una será nulosómica, y dos serán euploides (1 cromosoma cada uno). Si estos gametos fertilizan un ovocito euploide, los cigotos resultantes podrían ser 1 trisómico (2 1), y uno monosómico, y dos euploides (disómicos). Lo mismo es cierto para los cromosomas maternos. Por lo tanto, un feto con trisomía puede tener varias combinaciones diferentes de cromosomas paternos y maternos.

El ejemplo de 1.000 equivalentes genómicos para el ADN materno y 100 equivalentes genómicos para el ADN fetal se puede usar para ilustrar la diferencia en la distinción al evaluar la presencia de copias frente a la presencia de polimorfismos. Cuando se usan marcadores altamente polimórficos tales como las repeticiones de tetranucleótidos, no es inusual que 3 o los 4 polimorfismos sean diferentes. Los resultados se compararán con estos casos, en donde los marcadores para el cromosoma materno o paterno son iguales o diferentes. El cromosoma 2 se usará como control y el 21 como ejemplo para la trisomía.

Caso 1 (solo número de copias)

Maternos Feto Total

Crom. 2 2.000 200 2.200

Crom. 21 2.000 300 2.300

Caso 2 (marcadores maternos homocigóticos, no disyunción materna, primera meiosis)

Maternos Feto Total

Crom. 2M1 1.000 0 Crom. 2M2 1.000 100 2.100* Crom. 2P1 0 100 100 Crom. 2P2 0 0 0 Crom. 21M1 1.000 100 Crom. 21M2 1.000 100 2.200* Crom. 21P1 0 100 100 Crom. 21P2 0 0 0 *Nota: Dado que los alelos 2M1 y 2M2 son iguales, total = 2.100. Del mismo modo, dado que los alelos 21M1 y

21M2 son iguales, total = 2.200. Los alelos paternos pueden ser heterocigóticos u homocigóticos

Caso 3 (marcadores maternos homocigóticos, no disyunción materna, segunda meiosis)

Maternos Feto Total

Crom. 2M1 1.000 0 Crom. 2M2 1.000 100 2.100* Crom. 2P1 0 100 100 Crom. 2P2 0 0 0 Crom. 21M1 1.000 0 Crom. 21M2 1.000 200 2.200* Crom. 21P1 0 100 100 Crom. 21P2 0 0 0 *Nota: Dado que los alelos 2M1 y 2M2 son iguales, total = 2.100. Del mismo modo, dado que los alelos 21M1 y

Caso 4 (marcadores maternos heterocigóticos, no disyunción materna, primera meiosis)

Maternos Feto Total

Crom. 2M1 1.000 0 1.000

Crom. 2M2 1.000 100 1.100

Crom. 2P1 0 100 100

Crom. 2P2 0 0 0

Crom. 21M1 1.000 100 1.100

Crom. 21M2 1.000 100 1.100

Crom. 21P1 0 100 100

Crom. 21P2 0 0 0

Caso 5 (marcadores maternos heterocigóticos, no disyunción materna, segunda meiosis)

Maternos Feto Total Crom. 2M1 1.000 0 1.000 Crom. 2M2 1.000 100 1.100 Crom. 2P1 0 100 100 Crom. 2P2 0 0 0 Crom. 21M1 1.000 0 1.000 Crom. 21M2 1.000 200* 1.200 Crom. 21P1 0 100 100 Crom. 21P2 0 0 0 *Nota: Hay una combinación adicional de trisomía en donde 2 copias del alelo 21M1 están en el ovocito fertilizado.

Caso 6 (marcadores maternos homocigóticos, no disyunción paterna, primera meiosis)

Maternos Feto Total Crom. 2M1 1.000 0 Crom. 2M2 1.000 100 2.100* Crom. 2P1 0 100 100 Crom. 2P2 0 0 0 Crom. 21M1 1.000 0 Crom. 21M2 1.000 100 2.100* Crom. 21P1 0 100 100 Crom. 21P2 0 100 100 *Nota: Dado que los alelos 2M1 y 2M2 son iguales, total = 2.100. Del mismo modo, dado que los alelos 21M1 y 21M2 son iguales, total = 2.100. Los alelos paternos pueden ser heterocigóticos u homocigóticos

Caso 7 (marcadores maternos homocigóticos, no disyunción paterna, segunda meiosis)

Maternos Feto Total

Crom. 2M1 1.000 0 Crom. 2M2 1.000 100 2.100* Crom. 2P1 0 100 100 Crom. 2P2 0 0 0 Crom. 21M1 1.000 0 Crom. 21M2 1.000 100 2.100* Crom. 21P1 0 200 200 Crom. 21P2 0 0 0 *Nota: Dado que los alelos 2M1 y 2M2 son iguales, total = 2.100. Del mismo modo, dado que los alelos 21M1 y 21M2 son iguales, total = 2.100. Los alelos paternos pueden ser heterocigóticos u homocigóticos

Caso 8 (marcadores maternos heterocigóticos, no disyunción paterna, primera meiosis)

Maternos Feto Total

Crom. 2M1 1.000 0 1.000

Crom. 2M2 1.000 100 1.100

Crom. 2P1 0 100 100

Crom. 2P2 0 0 0

Crom. 21M1 1.000 0 1.000

Crom. 21M2 1.000 100 1.100

Crom. 21P1 0 100 100

Crom. 21P2 0 100 100

Caso 9 (marcadores maternos heterocigóticos, no disyunción paterna, segunda meiosis)

Maternos Feto Total Crom. 2M1 1.000 0 1.000 Crom. 2M2 1.000 100 1.100 Crom. 2P1 0 100 100 Crom. 2P2 0 0 0 Crom. 21M1 1.000 0 1.000 Crom. 21M2 1.000 100 1.100 Crom. 21P1 0 200 200 Crom. 21P2 0 0 0 *Nota: Hay una combinación adicional de trisomía en donde 2 copias del alelo 21P2 están en el ovocito fertilizado.

A partir de este análisis, está claro que para distinguir la trisomía, los marcadores más útiles son aquellos en donde los loci maternos son polimórficos y los loci paternos son diferentes a ambos alelos maternos. No es necesario que los loci paternos sean polimórficos. Para deleciones relacionadas con el cromosoma X, tales como las que se encuentran en la distrofia muscular de Duchenne, el enfoque es más simple, ya que la enfermedad se manifiesta principalmente en niños varones. De nuevo, comparar el cromosoma 2 con el cromosoma X en el área de la deleción podría dar como resultado:

Caso 10 (marcadores maternos heterocigóticos, deleción relacionada con el cromosoma X hereditaria)

Maternos Feto Total

Crom. 2M1 1.000 0 1.000

Crom. 2M2 1.000 100 1.100

Crom. 2P 1 0 100 100

Crom. 2P2 0 0 0

Crom. XM1 1.000 0 1.000

Crom. XM2 0* 0* 0

Crom. XP 1 0 0 0

Crom. YP2 0 100 100

*Nota: deleción de región hereditaria

Caso 11 (marcadores maternos heterocigóticos, el feto no contiene deleción relacionada con el cromosoma X)

Maternos Feto Total

Crom. 2M1 1.000 0 1.000

Crom. 2M2 1.000 100 1.100

Crom. 2P 1 0 100 100

Crom. 2P2 0 0 0

Crom. XM1 1.000 100 1.100

Crom. XM2 0* 0* 0

Crom. XP 1 0 0 0

Crom. YP2 0 100 100

*Nota: deleción de región hereditaria

Caso 11 (marcadores maternos heterocigóticos, deleción relacionada con el cromosoma X esporádica)

Maternos Feto Total

Crom. 2M1 1.000 0 1.000

Crom. 2M2 1.000 100 1.100

Crom. 2P 1 0 100 100

Crom. 2P2 0 0 0

Crom. XM1 1.000 0 1.000

Crom. XM2 1.000 0* 1.000

Crom. XP 1 0 0 0

Crom. YP2 0 100 100

*Nota: deleción de región hereditaria

El caso 10 muestra la distrofia muscular de Duchenne hereditaria, en donde la madre es portadora. En estas condiciones, el porcentaje de la cantidad total de dos alelos del cromosoma X parece ser la mitad del de otras posiciones. En el caso 11, el feto no tiene la enfermedad, y en el caso 12 la enfermedad es una mutación esporádica que aparece en el feto. El marcador del cromosoma Y confirma que el feto es varón. Lo anterior muestra cómo se podría realizar el genotipado en el locus DMD. Si existe conocimiento previo de que la madre es portadora, entonces se puede determinar la sincronización de la deleción con polimorfismos contiguos (véase a continuación) y, a continuación, estos polimorfismos contiguos también se pueden usar para verificar si el feto también es portador de la deleción, y si el feto es varón y susceptible de enfermedad. Este enfoque se puede usar para encontrar cambios dominantes relacionados con el cromosoma X y autosómicos.

Para determinar si el feto contiene una mutación hereditaria o esporádica en uno de los otros aproximadamente 3.500 trastornos, que incluyen deleciones, mutaciones puntuales o metilación anómala, se podría recomendar un análisis más sofisticado. El análisis de secuencias determina fácilmente la presencia del alelo recesivo en ambos padres. Si la mutación es diferente en los padres, es posible determinar si el niño es un heterocigoto compuesto para la enfermedad evaluando el ADN libre circulante del suero materno. Para obtener la respuesta completa del análisis del ADN fetal en el suero materno este ensayo puede requerir dos partes. La primera es establecer la fase para los SNP o polimorfismos maternos en regiones repetidas que rodean el gen de la enfermedad. Esto se puede conseguir aislando el ADN de alto peso molecular de los glóbulos blancos de la madre o de la saliva del padre.

La determinación exacta de la fase o haplotipo se puede conseguir mediante el uso de una variación de un enfoque desarrollado por Complete Genomics (véase Peters et al., "Accurate Whole-genome Sequencing and Haplotyping from 10 to 20 Human Cells", Nature 487(7406): 190-5 (2012)). Para la presente solicitud, el ADN HMW (de alto peso molecular) se distribuye en placas de 96 o 384 pocillos de modo que exista menos de un cromosoma por pocillo. Posteriormente, la amplificación del genoma completo se usa para determinar qué pocillos contienen el cromosoma y, a continuación, se determina la fase de 96 SNP o polimorfismos de secuencia repetitiva contiguos al alelo de la enfermedad materna para el gen en cuestión. Una vez conseguido esto, se evalúa la presencia del alelo de la enfermedad a partir del padre (como se describe en el enfoque 4 mencionado anteriormente) y, usando la secuenciación, se verifica que el cromosoma que se hereda de la madre también contiene un alelo de la enfermedad. En el presente documento se describen múltiples enfoques para capturar secuencias repetitivas de ADN en todo el genoma, que se pueden usar para identificar polimorfismos a partir de ADN original o amplificado en el genoma completo.

La capacidad para determinar los haplotipos a partir de genomas diploides sigue siendo una tarea técnicamente compleja y de coste elevado que se basa esencialmente en el aislamiento físico de cromosomas o fragmentos subcromosómicos antes del genotipado por secuenciación o alguna otra tecnología. Lo que sigue a continuación describe un procedimiento rápido y sencillo para capturar dos regiones en la misma hebra de ADN genómico para permitir la determinación de la estructura de haplotipo definida por las dos regiones.

Para cada diana potencial, dos oligonucleótidos se hibridan simultáneamente, conteniendo cada uno secuencias complementarias a las partes en dirección 5' y en dirección 3' que flanquean cada uno de los dos polimorfismos en la diana. Estos polimorfismos pueden ser repeticiones de tetranucleótidos, trinucleótidos o dinucleótidos o SNP. Los polimorfismos que proporcionan más información son aquellos que son polimórficos tanto en los cromosomas maternos como polimórficos en el cromosoma del padre que se transfiere al feto. La polimerasa se usa para la extensión desde cada uno de los dos extremos 3' para cerrar el hueco y determinar el genotipo de los polimorfismos ubicados entre los dos pares de secuencias de unión flanqueantes. No es necesario que los dos polimorfismos dirigidos sean necesariamente contiguos entre sí, y pueden estar separados por otros polimorfismos. La distancia entre los dos polimorfismos de interés está limitada solo por la probabilidad de que se forme un puente por las cuatro secuencias de unión contenidas en los dos oligonucleótidos. Cada uno de los oligonucleótidos contiene secuencia de identificador único, secuencia de identificador de paciente opcional, secuencia de unión a cebador opcional, y fosfato opcional en el extremo 5'.

Protocolo detallado para determinar el haplotipo entre dos polimorfismos conocidos:

Variación 8.1 (véase por ejemplo, la Figura 113): 8.1.a. El ADN genómico se aísla mediante un método que produce material de alto peso molecular (>15 kb).

8.1. b. Desnaturalizar el ADN diana (94 °C, 1 minuto) en presencia de dos oligonucleótidos (comprendiendo el primero una secuencia en el extremo 5' complementaria a una región única en dirección 5' del polimorfismo diana n.° 1, una secuencia de identificador único, una secuencia de identificador de paciente opcional, una secuencia de unión a cebador opcional, y una secuencia en el extremo 3' complementaria a una región única en dirección 3' del polimorfismo diana n.° 2 y comprendiendo el segundo una secuencia en el extremo 5' complementaria a una región única en dirección 5' del polimorfismo diana n.° 2, una secuencia de identificador único, una secuencia de identificador de paciente opcional y una secuencia en el extremo 3' complementaria a una región única en dirección 3' del polimorfismo diana n.° 1), y permitir que los oligonucleótidos se hibriden con sus regiones complementarias en los fragmentos deseados mediante enfriamiento a una temperatura deseada (por ejemplo, 50 °C durante 2 horas). La polimerasa Taq y/o KlenTaq (polimerasa Taq que carece de actividad de nucleasa), y ligasa termoestable (preferentemente de la cepa AK16D), y los dNTP se añaden después de la etapa de hibridación, o al comienzo del procedimiento. En el caso en el que ambas secuencias oligonucleotídicas tengan un fosfato 5', KlenTaq extiende el extremo 3' hasta que es directamente contiguo al extremo 5' competente para ligamiento (lado izquierdo de la Figura 113). En el caso en el que ambas secuencias oligonucleotídicas tengan un 5' OH, la actividad de nucleasa 5 '^3 ' de la polimerasa escinde la base coincidente solapante en el extremo 5' para crear un fosfato 5' competente para ligamiento (lado derecho de la Figura 113). Permitir la extensión y el ligamiento a la temperatura de hibridación, y, opcionalmente, aumentar la temperatura (por ejemplo, 60 °C) para garantizar la finalización de la extensión y el ligamiento, para generar productos circulares.

8.1. c. Añadir Exonucleasa I (digiere el ADN monocatenario en la dirección 3'^5'), y Exonucleasa III (digiere el ADN bicatenario en la dirección 3'^5'), para digerir todos los productos sin ligar o mellados, dejando solo el ADN monocatenario circular deseado que comprende el ADN diana original, la secuencia del conector, la secuencia de identificador único, una secuencia de unión a cebador opcional, y una secuencia de identificador de paciente opcional. Este producto es adecuado para la amplificación por círculo rodante (usando cebadores hexaméricos aleatorios con polimerasa phi-29) para crear repeticiones en tándem de la secuencia deseada, y posterior identificación de las dianas usando secuenciación de nueva generación, o alternativamente, secuenciación SMRT directa en el molde cerrado covalentemente, usando la secuencia de unión a cebador como un sitio de unión a cebador.

Nota 1: Este enfoque también permite establecer fácilmente el haplotipo (es decir, la fase) con la mutación real que causa la enfermedad. Los cebadores se diseñan de modo que uno de los sitios polimórficos sea el gen de la enfermedad real.

Nota 2: En los sistemas que usan dos sondas oligonucleotídicas puente, cada una conteniendo secuencia de identificador único, secuencia de identificador de paciente opcional y un sitio de unión a cebador opcional, se recomienda que solo uno y no ambos oligonucleótidos contengan un sitio de unión a cebador (ya sea el oligonucleótido en dirección 5' o en dirección 3'. Para un nivel adicional de detección de falsos positivos, se recomienda que la secuencia de identificador único sea diferente en las sondas en dirección 5' y en dirección 3'.

Nota 3: Es importante maximizar la formación de productos de ligamiento en donde las dos secuencias de unión al oligo están realmente unidas por un tramo contiguo de ADN, y minimizar la formación de productos de productos de ligamiento en donde los fragmentos unidos por puente no son contiguos.

Considerar el siguiente ejemplo para fines ilustrativos. La región en dirección 5' se denomina "X" y tiene una repetición del tetranucleótido AGAT, mientras que la región en dirección 3' se denomina "Y", y tiene una repetición del dinucleótido CA. La región X en dirección 5' se ilustra a continuación como "X-up", el sitio de unión del cebador en dirección 5', AGAT (n) es la región de repetición del tetranucleótido, y "X-dn" es el sitio de unión a cebador en dirección 3'. La región Y en dirección 3' se ilustra a continuación como "Y-up", el sitio de unión del cebador en dirección 5', CA (n) es la región de repetición del dinucleótido, y "Y-dn" es el sitio de unión del cebador en dirección 3'. En este ejemplo, las dos regiones están separadas por 10 kb, y los dos cromosomas maternos tienen la forma:

X-up AGAT(12) X-dn........ (10 kb) ... Y-up CA(23) Y-dn

X-up AGAT(16) X-dn........ (10 kb) ... Y-up CA(18) Y-dn

A continuación, añadir cebadores de ligamiento - extensión que se unen a la hebra inferior (como en la Figura 113). Tendrán la forma:

(Izquierda) 5' X-dn - sitio de cebador - identificador n.° 1 - Y-up 3'

(Derecha) 5' Y-dn - identificador n.° 2 - X-up 3'

(En este ejemplo, el sitio de unión a cebador está solo en el cebador izquierdo).

A continuación, los 2 productos de ligamiento posibles definidos por los haplotipos (linealizados en el sitio de unión a cebador para que sea más fácil de seguir) podrían tener la forma:

sitio de cebador - identificador n.° 1 - Y-up CA(23) Y-dn -identificador n.° 2 - X-up AGAT(12) X-dn

sitio de cebador - identificador n.° 1 - Y-up Ca (18) Y-dn -identificador n.° 2 - X-up AGAT(16) X-d

La formación de los productos correctos que se obtienen a partir de sitios contiguos en los mismos fragmentos cromosómicos se puede maximizar diluyendo la reacción, de modo que la probabilidad de que se obtengan productos que se obtienen a partir de sitios no contiguos se vuelve infinitesimalmente pequeña. Además, dado que el cebador está en un gran exceso con respecto al ADN cromosómico, si dos fragmentos no son contiguos, entonces hay una probabilidad mucho mayor de que cada fragmento tenga ya un sitio de unión a cebador compuesto "izquierdo" y "derecho" (es decir, 4 cebadores que se unen a dos fragmentos separados). Solo cuando los dos fragmentos son contiguos existe una mayor probabilidad de que las dos regiones se unan entre sí por cada uno de los cebadores compuestos "izquierdo" y "derecho". Es un experimento sencillo para optimizar el rendimiento de los productos de ligamiento correctos mediante la generación de una matriz de condiciones de diferentes concentraciones diana frente a diferentes diluciones de los cebadores de ligamiento /extensión.

Si existe un producto de ligamiento incorrecto que se obtiene a partir de dos regiones cromosómicas diferentes que se unen, entonces se podría crear erróneamente un producto en donde CA(23) está en conjunto con AGAT(16), y CA(18) está en conjunto con AGAT(12).

Como ejemplo, considerar el peor de los escenarios, en donde un 80 % del producto de ligamiento se obtiene a partir de fragmentos unidos por puente que no son contiguos. Por cuestiones de simplicidad, suponer 1.000 equivalentes genómicos. Tener en cuenta que si el producto se obtiene a partir de fragmentos unidos por puente, entonces existe la misma posibilidad de que provengan del mismo cromosoma materno como de cromosomas opuestos (es decir, 400 cada uno). Pero los productos que se obtienen a partir de ADN contiguo solo provendrán del mismo cromosoma materno (es decir, 200 cada uno). Por lo tanto, deberían existir las siguientes combinaciones:

CA(23) y AGAT(12) 600 (= 400 200)

CA(23) y AGAT(16) 400

CA(18) y AGAT(12) 400

CA(18) y AGAT(16) 600 (= 400 200)

Incluso si estos números fluctuaran en 50 en la dirección menos favorable (equivalente a que un 90 % de los productos de ligamiento que surgen a partir de fragmentos unidos por puente, todavía podría ser sencillo distinguir el haplotipo en cada cromosoma como CA(23) y AGAT(12); así como CA(18) y AGAT(16).

CA(23) y AGAT(12) 550 (= 400 - 50 200)

CA(23) y AGAT(16) 450 (= 400 50)

CA(18) y AGAT(12) 450 (= 400 50)

CA(18) y AGAT(16) 550 (= 400 - 50 200)

Alternativamente, en un segundo enfoque, los genes de enfermedades se pueden dividir en las 20 enfermedades hereditarias más comunes, así como en enfermedades autosómicas dominantes, y a continuación dividirse en 17 grupos de secuencias mutadas menos frecuentes que cubren un promedio de 200 genes cada uno. Cada grupo de genes podría estar cubierto por conjuntos de sondas de captura y, a continuación, dependiendo de los resultados del análisis de secuenciación original, la sangre materna podría recibir identificadores de pacientes adecuados y se podría evaluar con uno o más de los 17 conjuntos de sondas de captura especiales.

El primero de los enfoques anteriores identificará mutaciones hereditarias y esporádicas, y también determinará si el feto heredó una región portadora de mutaciones de la madre. Este enfoque también podría ser susceptible de determinar la presencia de deleciones para enfermedades hereditarias relacionadas con el cromosoma X, otras deleciones cromosómicas, metilación anómala en el feto, enfermedades que surgen de la repetición de tripletes y enfermedades que surgen de translocaciones cromosómicas u otros reordenamientos.

El segundo enfoque identificará las condiciones de enfermedad para los genes interrogados. La cuestión clave será la importancia que otorga la familia a la obtención de la respuesta correcta. Es sencillo determinar si ambos padres son portadores y si las mutaciones son diferentes, y es relativamente sencillo determinar si el alelo de la enfermedad del padre está presente en el feto. Si está ausente, entonces el feto estará libre de enfermedad o será portador. Si está presente, entonces las posibilidades de heredar el alelo materno y contraer la enfermedad son del 50 %. Si se ha determinado el haplotipo para el alelo materno, entonces se pueden usar marcadores de haplotipo para verificar la presencia o ausencia del alelo materno hereditario. También puede ser prudente realizar una amniocentesis y evaluar directamente la presencia del alelo materno. La recomendación actual es secuenciar el gen como se ha explicado anteriormente y evaluar el alelo de la enfermedad paterna. Si está presente, o si las mutaciones específicas de la enfermedad materna y paterna son idénticas, entonces el médico recomienda la amniocentesis.

Los métodos de la presente invención también se pueden usar para el diagnóstico prenatal no invasivo y el diagnóstico genético preimplantatorio (PGD) de translocaciones cromosómicas desequilibradas. Las personas que son portadores de translocaciones cromosómicas tienen un mayor riesgo de infertilidad, aborto espontáneo, muerte fetal y/o tener un hijo con anomalías congénitas. El diagnóstico genético preimplantatorio es susceptible de distinguir entre embriones que tienen la cantidad correcta de material genético (equilibrado/normal) y embriones a los que les falta material genético como resultado de la translocación (desequilibrado). Muchas parejas en donde un miembro es portador de translocaciones han experimentado abortos espontáneos o han tenido que enfrentarse a decisiones difíciles al enterarse de un embarazo con un conjunto desequilibrado de cromosomas. Los métodos de PGD basado en la presente invención podrían reducir la probabilidad de tener que enfrentarse a estas circunstancias particulares sabiendo, antes de la concepción, que los embriones transferidos tienen translocaciones cromosómicas equilibradas.

El enfoque de evaluación de los SNP o polimorfismos de secuencia repetitiva específicos de cromosomas también se puede usar en la identificación sistemática previa al implante. A diferencia del embarazo, en donde solo la trisomía 21, 18 y 13 llegan a término (así como las anomalías relacionadas con el cromosoma X e Y), en la fertilización in vitro aún se puede permitir el crecimiento de otras anomalías cromosómicas en la fase de 16, 32 o un número de células más elevado. Por lo tanto, se necesitarán polimorfismos en todo el genoma para tener en cuenta tanto el número de copias adecuado como la pérdida o ganancia de regiones cromosómicas. Cuanto mayor sea el número de polimorfismos que se interrogan, más exacta podrá ser la determinación de cambios en el número de copias.

Ejemplo profético 9 -- Pruebas de paternidad del feto (por ejemplo, apoyo de atención prenatal)

Visión general: El enfoque básico es buscar la presencia de alelos presentes en el padre, pero ausentes en la madre. Existen dos formas generales de abordar esto. Una puede comenzar con los SNP en donde el alelo común tiene una frecuencia de aproximadamente un 70-75 %, de modo que hay aproximadamente un 50 % de posibilidades de que la madre sea homocigótica para el alelo principal. Se comienza con aproximadamente 48 SNP, de los cuales en aproximadamente la mitad de ellos (24) la madre será homocigótica para el alelo común, y existe un 50 % de posibilidades de que el padre sea heterocigótico u homocigótico para el alelo minoritario. Se evalúa simplemente la presencia del alelo minoritario en la sangre materna, de forma similar a la búsqueda de mutaciones, pero también se cuantifica la cantidad presente solo para confirmar que es un alelo minoritario del padre. Un segundo enfoque es comenzar con alelos con una frecuencia de aproximadamente un 50 %, por lo que existe un 50 % de posibilidades de que la madre sea homocigótica para uno de los alelos, y existe un 75 % de posibilidades de que el padre tenga el otro alelo en esa posición. Este enfoque proporciona algo menos de información para diferenciar a los padres, pero el número de posiciones que proporcionarán información será mayor. Un tercer enfoque es usar polimorfismos de secuencia repetitiva, en donde existe un alto grado de polimorfismo, de modo que existe una alta probabilidad de que el alelo del padre sea diferente de cualquiera de los alelos de la madre en una posición determinada. Esto podría requerir la menor cantidad de alelos. En todas estas condiciones, el médico debe asegurarse de respetar la privacidad de la madre en caso de que el esposo no sea el padre del feto (no paternidad).

Claims

REIVINDICACIONES

1. Un sistema que comprende:

una colección de diferentes construcciones de ácido nucleico monocatenario quiméricas circulares, comprendiendo cada construcción:

un primer segmento monocatenario de ADN genómico original de un organismo hospedador y

un segundo segmento de ácido nucleico monocatenario que está unido al primer segmento monocatenario y comprende una secuencia nucleotídica que es exógena al organismo hospedador, comprendiendo dicha secuencia nucleotídica una primera parte específica de cebador de soporte sólido, una segunda parte específica de cebador de soporte sólido, y una secuencia de identificador de paciente, por lo que dichas construcciones de ácido nucleico monocatenario quiméricas de la colección están circularizadas y son adecuadas para amplificación por círculo rodante y/o secuenciación; y

una colección de productos de extensión, comprendiendo cada producto de extensión dos o más secuencias lineales en tándem, en donde cada secuencia lineal en tándem es complementaria a la construcción de ácido nucleico monocatenario quimérica de la colección, en donde cada producto de extensión en la colección se hibrida con su construcción de ácido nucleico monocatenario quimérica circular complementaria de la colección.

2. El sistema de la reivindicación 1 que además comprende:

un soporte sólido sobre el que está inmovilizada una pluralidad de primeros cebadores oligonucleotídicos, comprendiendo cada primer cebador oligonucleotídico una secuencia nucleotídica que es la misma que la secuencia nucleotídica de la primera parte específica de cebador de soporte sólido de las construcciones de ácido nucleico monocatenario quiméricas de la colección, en donde uno o más de la pluralidad de primeros cebadores oligonucleotídicos sobre el soporte sólido se hibridan con un producto de extensión de la colección de productos de extensión.

3. Un sistema que comprende:

un segundo segmento de ácido nucleico monocatenario que está unido al primer segmento monocatenario y comprende una secuencia nucleotídica que es exógena al organismo hospedador, comprendiendo dicha secuencia nucleotídica una primera parte específica de cebador de soporte sólido, una segunda parte específica de cebador de soporte sólido, y una secuencia de identificador de paciente, por lo que dichas construcciones de ácido nucleico monocatenario quiméricas de la colección son adecuadas para amplificación por círculo rodante y/o secuenciación;

uno o más cebadores de amplificación de oligonucleótidos, comprendiendo cada cebador de amplificación al menos una primera secuencia nucleotídica que es complementaria a una parte de las construcciones de ácido nucleico monocatenario quiméricas de la colección; y

una polimerasa adecuada para amplificación por círculo rodante.

4. El sistema de la reivindicación 3, en donde el uno o más cebadores de amplificación de oligonucleótidos comprenden una primera secuencia nucleotídica que es complementaria a la segunda parte específica de cebador de soporte sólido de las construcciones de ácido nucleico monocatenario quiméricas de la colección, y dicho uno o más cebadores de amplificación están inmovilizados sobre un soporte sólido.

5. El sistema de la reivindicación 3, en donde el uno o más cebadores de amplificación de oligonucleótidos comprenden (i) una primera secuencia nucleotídica que es complementaria a la primera parte específica de cebador de soporte sólido de las construcciones de ácido nucleico monocatenario quiméricas de la colección y (ii) una segunda secuencia nucleotídica que es complementaria a la segunda parte específica de cebador de soporte sólido de las construcciones de ácido nucleico monocatenario quiméricas de la colección.

6. El sistema de la reivindicación 3, en donde el uno o más cebadores de amplificación de oligonucleótidos comprenden (i) una primera secuencia nucleotídica que es complementaria al segmento de ADN genómico original de las construcciones de ácido nucleico monocatenario quiméricas de la colección, (ii) una parte en el extremo 3' que comprende un nucleótido o análogo de nucleótido escindible y un grupo de bloqueo que bloquea la extensión por polimerasa 3' de dicho cebador de amplificación de oligonucleótidos, y (iii) una parte en el extremo 5' que comprende un nucleótido o análogo de nucleótido escindible y un grupo de captura, siendo dicho grupo de captura susceptible de inmovilizarse en un soporte sólido.

7. El sistema de la reivindicación 3, en donde el uno o más cebadores de amplificación de oligonucleótidos comprenden (a) un primer cebador de amplificación de oligonucleótidos que tiene (i) una primera secuencia nucleotídica que es complementaria a una primera parte del segmento de ADN genómico original de las construcciones de ácido nucleico monocatenario quiméricas de la colección, y (ii) una parte en el extremo 3' que comprende un nucleótido o análogo de nucleótido escindible y un grupo de bloqueo que bloquea la extensión por polimerasa 3' de dicho primer cebador de amplificación de oligonucleótidos, y (b) un segundo cebador de amplificación de oligonucleótidos que tiene (i) una primera secuencia nucleotídica que es complementaria a una segunda parte del segmento de ADN genómico original de las construcciones de ácido nucleico monocatenario quiméricas de la colección, y (ii) una parte en el extremo 5' que comprende un nucleótido o análogo de nucleótido escindible y un grupo de captura, siendo dicho grupo de captura susceptible de inmovilizarse en un soporte sólido.

8. El sistema de la reivindicación 3, en donde el uno o más cebadores de amplificación comprenden una parte que es susceptible de anclarse a un soporte sólido.

9. El sistema de la reivindicación 3 que además comprende:

un soporte sólido sobre el que está inmovilizada una pluralidad de primeros cebadores oligonucleotídicos, comprendiendo cada primer cebador oligonucleotídico una secuencia nucleotídica que es la misma que la secuencia nucleotídica de la primera parte específica de cebador de soporte sólido de las construcciones de ácido nucleico monocatenario quiméricas de la colección.

10. Un método para secuenciar una pluralidad de moléculas de ácido nucleico, comprendiendo dicho método:

proporcionar el sistema de la reivindicación 3;

mezclar uno o más cebadores de amplificación de oligonucleótidos hibridados con construcciones de ácido nucleico monocatenario quiméricas circulares de la colección con la polimerasa para formar una mezcla de reacción de amplificación por círculo rodante;

someter la mezcla de reacción de amplificación por círculo rodante a un tratamiento de extensión donde la polimerasa extiende el uno o más cebadores de amplificación de oligonucleótidos hibridados para producir una pluralidad de productos de extensión primarios, comprendiendo cada producto de extensión primario una o más secuencias lineales en tándem, en donde cada secuencia lineal en tándem es complementaria a una construcción de ácido nucleico monocatenario quimérica circular en la colección; y

secuenciar las construcciones de ácido nucleico monocatenario quiméricas circulares directamente o dicha pluralidad de productos de extensión primarios de las mismas.

11. El método de la reivindicación 10, en donde las construcciones de ácido nucleico monocatenario quiméricas circulares de la colección se preparan mediante un método que comprende:

proporcionar una muestra que contiene uno o más segmentos de ADN genómico diana;

proporcionar una o más primeras sondas oligonucleotídicas, comprendiendo cada primera sonda oligonucleotídica (a) una parte específica de diana en el extremo 5', (b) una parte específica de diana en el extremo 3', y (c) una parte adicional, comprendiendo dicha parte adicional (i) la secuencia de identificador de paciente, (ii) la primera parte específica de cebador de soporte sólido, y (iii) la segunda parte específica de cebador de soporte sólido;

poner en contacto la muestra y la una o más primeras sondas oligonucleotídicas en condiciones eficaces para que la parte específica de diana en el extremo 3' de una primera sonda oligonucleotídica se hibride de una forma específica según la base con un extremo 3' complementario de un segmento de ADN genómico diana y para que la parte específica de diana en el extremo 5' de la primera sonda oligonucleotídica se hibride de una forma específica según la base con un extremo 5' complementario del segmento de ADN genómico diana, si estuvieran presentes en la muestra;

generar una unión competente para ligamiento entre los extremos 3' y 5' de cada segmento de ADN genómico diana hibridado con la primera sonda oligonucleotídica; y

ligar la unión de ligamiento de cada segmento de ADN genómico diana para formar diferentes construcciones de ácido nucleico monocatenario quiméricas circulares de la colección.

12. El método de la reivindicación 10, en donde las diferentes construcciones de ácido nucleico monocatenario quiméricas circulares de la colección se preparan mediante un método que comprende:

proporcionar una muestra que contiene uno o más segmentos de ADN genómico diana, en donde dichos segmentos de ADN genómico diana contienen potencialmente una o más diferencias de base o uno o más restos metilados;

añadir conectores nucleotídicos a los extremos 3' y 5' de los segmentos de ADN genómico diana para formar segmentos de ADN genómico diana con conector añadido;

proporcionar una o más primeras sondas oligonucleotídicas, comprendiendo cada primera sonda oligonucleotídica (a) una parte en el extremo 3' complementaria al conector nucleotídico en el extremo 3' del segmento de ADN genómico diana, (b) una parte en el extremo 5' complementaria al conector nucleotídico en el extremo 5' del segmento de ADN genómico diana, y (c) una parte adicional, comprendiendo dicha parte adicional (i) la secuencia de identificador de paciente, (ii) la primera parte específica de cebador de soporte sólido, y/o (iii) la segunda parte específica de cebador de soporte sólido;

poner en contacto la muestra y la una o más primeras sondas oligonucleotídicas en condiciones eficaces para que las primeras sondas oligonucleotídicas se hibriden de una forma específica según la base con secuencias de conector nucleotídico complementarias de los segmentos de ADN genómico diana con conector añadido, si estuvieran presentes en la muestra;

generar una o más uniones competentes para ligamiento adecuadas para acoplar los extremos 3' y 5' de los segmentos de ADN genómico diana hibridados con las primeras sondas oligonucleotídicas; y

ligar los segmentos de ADN genómico diana a la una o más uniones de ligamiento para formar diferentes construcciones de ácido nucleico monocatenario quiméricas circulares de la colección.

13. El método de la reivindicación 10, en donde las diferentes construcciones de ácido nucleico monocatenario quiméricas circulares de la colección se preparan mediante un método que comprende:

proporcionar una muestra que contiene uno o más segmentos de ADN genómico diana, en donde dichos segmentos de ADN genómico diana tienen extremos 3' y 5';

añadir secuencias de conector a los extremos 3' y 5' de los segmentos de ADN genómico diana, en donde dichas secuencias de conector comprenden (i) una o más secuencias de identificador de paciente, (ii) la primera parte específica de cebador de soporte sólido, y (iii) la segunda parte específica de cebador de soporte sólido para formar segmentos de ADN genómico diana con conector añadido;

proporcionar una o más primeras sondas oligonucleotídicas, comprendiendo cada primera sonda oligonucleotídica (a) una parte complementaria a la secuencia de conector en el extremo 3' del segmento de ADN genómico diana con conector añadido, y (b) una parte complementaria a la secuencia de conector en el extremo 5' del segmento de ADN genómico diana con conector añadido; y

poner en contacto la muestra y la una o más primeras sondas oligonucleotídicas en condiciones eficaces para que las primeras sondas oligonucleotídicas se hibriden de una forma específica según la base con las secuencias de conector en los extremos 3' y 5' complementarias de los segmentos de ADN genómico diana con conector añadido, si estuvieran presentes en la muestra;

generar una o más uniones competentes para ligamiento adecuadas para acoplar los extremos 3' y 5' de los segmentos de ADN genómico diana con conector añadido hibridados con las primeras sondas oligonucleotídicas; y

ligar los segmentos de ADN genómico diana con conector añadido a la una o más uniones de ligamiento para formar diferentes construcciones de ácido nucleico monocatenario quiméricas circulares de la colección.