ES2935285T3

ES2935285T3 - Método para identificación y enumeración de cambios en la secuencia de ácidos nucleicos, expresión, copia, o metilación de ADN, usando reacciones combinadas de nucleasa, ligasa, polimerasa y secuenciación

Info

Publication number: ES2935285T3
Application number: ES21157460T
Authority: ES
Inventors: Francis Barany; John William Efcavitch
Original assignee: Cornell University
Current assignee: Cornell University
Priority date: 2014-06-06
Filing date: 2015-06-08
Publication date: 2023-03-03
Anticipated expiration: 2035-06-08
Also published as: CN113046413A; DK3152331T3; US20230295718A1; US10407722B2; US20190345552A1; CA2950295A1; WO2015188192A2; CN106661631A; EP3152331A2; AU2022201907A1; EP3889271B1; CN106661631B; JP7008407B2; WO2015188192A3; ES2864531T3; CA2950295C; EP3152331B1; US20170204459A1; EP4170044A1; CA3213538A1

Abstract

La presente invención se refiere a un método para la captura dirigida altamente específica de regiones de genomas humanos y transcriptomas de la sangre, es decir, de ADN circulante libre de células, exosomas, microARN, células tumorales circulantes o células sanguíneas totales, para permitir la alta detección sensible de cambios de mutación, expresión, número de copias, translocación, corte y empalme alternativo y metilación utilizando reacciones combinadas de nucleasa, ligadura, polimerasa y secuenciación paralela masiva. El método genera una colección de diferentes construcciones de ácidos nucleicos monocatenarios quiméricos circulares, adecuados para la secuenciación en múltiples plataformas. En algunas realizaciones, cada construcción de la colección comprendía un primer segmento monocatenario de ADN genómico original de un organismo huésped y un segundo segmento de ácido nucleico sintético monocatenario que está unido al primer segmento monocatenario y comprende una secuencia de nucleótidos que es exógena al organismo huésped. Estas construcciones quiméricas son adecuadas para identificar y enumerar mutaciones, cambios de copia, translocaciones y cambios de metilación. En otras realizaciones, la entrada de mRNA, IncRNA o miRNA se utiliza para generar productos de ADN circular que reflejan la presencia y el número de copias de mRNA específicos, variantes del sitio de corte y empalme de IncRNA, translocaciones y miRNA. cambios de copia, translocaciones y cambios de metilación. En otras realizaciones, la entrada de mRNA, IncRNA o miRNA se utiliza para generar productos de ADN circular que reflejan la presencia y el número de copias de mRNA específicos, variantes del sitio de corte y empalme de IncRNA, translocaciones y miRNA. cambios de copia, translocaciones y cambios de metilación. En otras realizaciones, la entrada de mRNA, IncRNA o miRNA se utiliza para generar productos de ADN circular que reflejan la presencia y el número de copias de mRNA específicos, variantes del sitio de corte y empalme de IncRNA, translocaciones y miRNA. (Traducción automática con Google Translate, sin valor legal)

Description

DESCRIPCIÓN

Método para identificación y enumeración de cambios en la secuencia de ácidos nucleicos, expresión, copia, o metilación de ADN, usando reacciones combinadas de nucleasa, ligasa, polimerasa y secuenciación

CAMPO DE LA INVENCIÓN

La presente invención se refiere a un método para la captura dirigida altamente específica de regiones de genomas y transcriptomas humanos de la sangre, es decir, de ADN circulante no asociado a células, exosomas, microARN, células tumorales circulantes o células sanguíneas totales, para permitir la detección altamente sensible de cambios en mutación, expresión, número de copias, translocación, corte y empalme alternativo y metilación usando reacciones combinadas de nucleasa, ligamiento, polimerasa y secuenciación.

ANTECEDENTES DE LA INVENCIÓN

Los avances en la secuenciación del ADN prometen estandarizar y desarrollar el diagnóstico molecular no invasivo para mejorar la atención prenatal, la eficacia de trasplantes, y la detección y el tratamiento individualizado de cáncer y de otras enfermedades. En la actualidad, los pacientes con predisposición a una enfermedad o con una enfermedad en estadio inicial no se identifican, y los que están enfermos no reciben el mejor tratamiento -- todo ello debido a fallos a nivel de diagnóstico.

En el campo del cáncer, existe la necesidad de desarrollar una tecnología de ese tipo para detección precoz, terapia guiada y monitorización de recurrencia - todo a partir de una muestra de sangre. Esto incluye la necesidad de desarrollar: (i) detección de alta sensibilidad de mutaciones de base única, mutaciones por inserciones pequeñas y deleciones pequeñas en genes conocidos (cuando están presentes en un 1 % a un 0,01 % de ADN no asociado a células); (ii) detección de alta sensibilidad de hipermetilación e hipometilación de promotor (cuando están presentes en un 1 % a un 0,01 % de ADN no asociado a células); (iii) cuantificación exacta de ARNm, ARNInc y miARN específicos tumorales aislados de exosomas de origen tumoral o complejo RISC o células tumorales circulantes en sangre; (iv) cuantificación exacta de cambios de copias específicos tumorales en el ADN aislado de células tumorales circulantes; (v) cuantificación exacta de mutaciones, e hipermetilación e hipometilación de promotor en ADN aislado de células tumorales circulantes. Todos estos (excepto la cuantificación de cambios de copias específicos tumorales en el ADN aislado de células tumorales circulantes) requieren enfocar la secuenciación a genes, o regiones del genoma, dirigidos. Además, la determinación de la información de secuencia o el estado de metilación a partir de ambas cadenas del fragmento original proporciona confirmación crucialmente necesaria de sucesos raros.

El plasma normal contiene ácidos nucleicos liberados de células normales que experimentan procesos fisiológicos normales (es decir, exosomas, apoptosis). Puede haber liberación adicional de ácidos nucleicos en condiciones de estrés, inflamación, infección o lesión. En general, el ADN liberado de células apoptóticas tiene una media de 160 pb de longitud, mientras que el ADN de células fetales tiene una media de aproximadamente 140 pb. El plasma de un paciente con cáncer contiene ácidos nucleicos liberados de células cancerosas que experimentan procesos fisiológicos anómalos, así como dentro de células tumorales circulantes (CTC). Del mismo modo, el plasma de una mujer embarazada contiene ácidos nucleicos liberados de células fetales.

Existen una diversidad de desafíos a la hora de desarrollar ensayos fiables de diagnóstico y cribado. El primer desafío es distinguir los marcadores procedentes del tumor o del feto que son indicativos de enfermedad (es decir, cáncer precoz) frente a la presencia de los mismos marcadores procedentes de tejido normal. También es necesario equilibrar el número de marcadores examinados y el coste del ensayo con la especificidad y la sensibilidad del ensayo. Este es un desafío que necesita abordar la variación biológica en enfermedades tales como cáncer. En muchos casos, el ensayo debería servir como herramienta de cribado, lo que requiere la disponibilidad de un seguimiento de diagnóstico secundario (es decir, colonoscopia, amniocentesis). La dificultad del problema biológico es la necesidad de detectar de manera fiable mutación de secuencias de ácidos nucleicos o diferencias de metilación de promotor, o cuantificar de manera fiable el número de copias de ADN o ARN, a partir de un número muy pequeño de células iniciales (es decir, a partir de CTC), o cuando la señal específica de cáncer o de feto se encuentra en presencia de una mayoría de ácidos nucleicos procedentes de células normales. Por último, existe el desafío técnico de distinguir la señal verdadera resultante de la detección de las diferencias deseadas de ácidos nucleicos específicas de enfermedad frente a la señal falsa generada a partir de ácidos nucleicos normales presentes en la muestra frente a la señal falsa generada en ausencia de diferencias de ácidos nucleicos específicas de enfermedad.

A modo de ejemplo, se ha de considerar el reto de detectar, en plasma, la presencia de ADN tumoral circulante que albergue una mutación en el gen p53 o una región promotora metilada. Tal muestra contendrá una mayoría de ADN no asociado a células que surge de células normales, donde el ADN tumoral puede comprender solo un 0,01 % del ADN total no asociado a células. De ese modo, si se intentara descubrir la presencia de tal ADN mutante mediante secuenciación total, sería necesario secuenciar 100.000 genomas para identificar 10 genomas que alberguen las mutaciones. Esto requeriría secuenciar 300.000 GB de ADN, una tarea fuera del alcance de la tecnología de secuenciación actual, por no mencionar los problemas en la manipulación de una cantidad de datos enorme. Para soslayar este problema, muchos grupos han intentado capturar regiones diana específicas o amplificar por PCR las regiones en cuestión. La captura de secuencias adolece de pérdidas, de modo que tal vez se capture un 90-95 % de las secuencias deseadas, pero falten los fragmentos deseados. Alternativamente, la amplificación por PCR proporciona el riesgo de introducir un error poco común que sea indistinguible de una mutación verdadera. Además, la PCR pierde información de metilación. Aunque se ha usado tradicionalmente tratamiento con bisulfito para determinar la presencia de metilación de promotor, este también destruye la muestra de ADN y carece de la capacidad de identificar cambios de metilación múltiple en ADN no asociado a células.

Existen diversos enfoques diferentes para reducir la tasa de error y mejorar la exactitud de los procesos de secuenciación. Puede conseguirse una exactitud de consenso en presencia de tasas de error elevadas mediante la secuenciación de la misma región de ADN una y otra vez. Sin embargo, una tasa de error elevada hace que sea extremadamente difícil identificar una variante de secuencia de baja abundancia, por ejemplo, cuando se intenta identificar una mutación cancerosa en presencia de ADN normal. Por lo tanto, se requiere una tasa de error baja para detectar una mutación con una abundancia relativamente baja.

El primer enfoque, denominado método de secuenciación profunda de amplicones marcados (Forshew et al., "Noninvasive Identification and Monitoring of Cancer Mutations by Targeted Deep Sequencing of Plasma DNA", Sci Transl Med. 4(136):136 (2012)) se basa en el diseño de cebadores para amplificar 5995 bases que cubren regiones seleccionadas de genes relacionados con cáncer, incluyendo TP53, EGFR, BRAF, y KRAS. Este enfoque es capaz de identificar mutaciones en el gen p53 para frecuencias de un 2 % a un 65 %. En este enfoque, los cebadores se diseñan para preamplificar el ADN (durante 15 ciclos) en una reacción multiplexada con muchos cebadores de PCR. Esto crea productos tanto deseados como no deseados, de modo que se continúa con PCR monoplexada para amplificar aún más cada uno de los productos deseados. Los fragmentos se someten a una PCR de código de barras final antes de la secuenciación de nueva generación convencional. La ventaja de este enfoque es que usa la PCR-PCR multiplexada sometida a ensayo a lo largo del tiempo, que es incomparable para la amplificación de un número bajo de ácidos nucleicos de partida. La desventaja es que este enfoque es incapaz de distinguir una verdadera mutación de un error de PCR en las primeras rondas de amplificación. De ese modo, aunque la sensibilidad de un 2 % (es decir, la detección de un alelo mutante en 50 alelos en peso) es suficiente para la evaluación de cánceres en estadio tardío antes de tomar una decisión sobre el tratamiento, no es lo suficientemente sensible para la detección precoz.

Una variación del primer enfoque se denomina Sistema de Secuenciación Segura "Safe-SeqS" (Kinde et al., "Detection and Quantification of Rare Mutations with Massively Parallel Sequencing", Proc Natl Acad Sci USA 108(23):9530-5 (2011)), donde se añade ADN genómico cortado aleatoriamente a los extremos de los conectores ligados al ADN genómico. El enfoque ha demostrado que la gran mayoría de las mutaciones descritas a partir de la secuenciación genómica son en realidad errores y ha reducido los supuestos errores de secuenciación en al menos 70 veces. Del mismo modo, un enfoque denominado secuenciación profunda ultrasensible (Narayan et al., "Ultrasensitive Measurement of Hotspot Mutations in Tumor DNA in Blood Using Error-suppressed Multiplexed Deep Sequencing", Cancer Res. 72(14):3492-8 (2012)) añade códigos de barras a cebadores para una amplificación por PCR anidada. Supuestamente, se ha desarrollado un sistema similar de adición de códigos de barras para detectar mutaciones raras y variaciones en el número de copias que depende de herramientas bioinformáticas (Talasaz, A.; Systems and Methods to Detect Rare Mutations and Copy Number Variation, documento de Solicitud de Patente de Estados Unidos US 2014/0066317 A1, 6 de marzo de 2014). Las lecturas de los extremos emparejados se usan para cubrir la región que contiene la supuesta mutación. Este método se ha usado para rastrear mutaciones conocidas en el plasma de pacientes con cáncer en estadio tardío. Estos enfoques requieren muchas lecturas para establecer secuencias de consenso. Ambos métodos requieren extenderse a través del ADN diana y, de ese modo, podría ser imposible distinguir la mutación verdadera del error generado por la polimerasa, especialmente cuando se copia a través de una base dañada, tal como citosina desaminada. Por último, estos métodos no proporcionan información sobre el estado de metilación de los sitios CpG dentro del fragmento.

El segundo enfoque, denominado Secuenciación dúplex (Schmitt et al., "Detection of Ultra-Rare Mutations by Next-Generation Sequencing", Proc Natl Acad Sci USA 109(36):14508-13 (2012)), se basa en el uso de conectores dúplex que contienen 12 marcas aleatorias de base. Mediante la amplificación de las cadenas tanto superior como inferior del ADN diana de entrada, un fragmento determinado obtiene un identificador único (formado por 12 bases en cada extremo) de modo que puede rastrearse mediante secuenciación. Las lecturas de secuencias que comparten un conjunto único de marcas se agrupan en familias emparejadas con miembros que tienen identificadores de cadena en cualquiera de las orientaciones de cadena superior o cadena inferior. Cada pareja de familia refleja la amplificación de un fragmento de ADN bicatenario. Las mutaciones presentes solo en uno o unos pocos miembros de la familia representan errores de secuenciación o errores introducidos por la PCR que se producen al final de la amplificación. Las mutaciones que se producen en muchos o todos los miembros de una familia en una pareja surgen de errores de la PCR durante la primera ronda de amplificación, como podría ocurrir cuando se copia a través de sitios de daño de ADN mutagénico. Por otro lado, las mutaciones verdaderas presentes en ambas cadenas de un fragmento de ADN aparecen en todos los miembros de una pareja de familia. Aunque las mutaciones de artefactos pueden producirse conjuntamente en una pareja de familia con una mutación verdadera, todas, excepto las que surgen durante la primera ronda de amplificación por PCR, pueden identificarse independientemente y descartarse cuando se produce una secuencia de consenso monocatenaria con corrección de errores. A continuación, pueden compararse las secuencias obtenidas de cada una de las dos cadenas de un dúplex de ADN individual para obtener la secuencia de consenso del dúplex, lo que elimina los errores restantes que se produjeron durante la primera ronda de PCR. La ventaja de este enfoque es que distingue sin ambigüedades las mutaciones verdaderas de los errores de PCR o del daño de ADN mutagénico, y consigue una tasa de error extraordinariamente baja de 3,8 x 10-10. La desventaja de este enfoque es que necesitan secuenciarse muchos fragmentos con el fin de obtener al menos cinco miembros de cada cadena en una pareja de familia (es decir, un mínimo de 10 lecturas de secuencia por fragmento original, pero a menudo requiere muchas más debido a fluctuaciones). Además, el método no se ha sometido a ensayo en ADNcf, que tiende a ser más pequeño que los fragmentos generados a partir del ADN genómico intacto y, de ese modo, podría requerir la secuenciación de más fragmentos para cubrir todas las mutaciones potenciales. Por último, el método no proporciona información sobre el estado de metilación de los sitios CpG dentro del fragmento.

El tercer enfoque, denominado smMIP para sondas de inversión molecular de molécula única (Hiatt et al., "Single Molecule Molecular Inversion Probes for Targeted, High-Accuracy Detection of Low-Frequency Variation", Genome Res. 23(5):843-54 (2013), combina el marcado de una sola molécula con la captura multiplexada para permitir una detección altamente sensible de la variación subclonal de baja frecuencia. El método reivindica una tasa de error de 2,6 x 10-5 en muestras clínicas. La desventaja de este enfoque es que necesita secuenciar muchos fragmentos para obtener al menos cinco miembros de cada cadena en una pareja de familia (es decir, un mínimo de 10 lecturas de secuencia por fragmento original, pero a menudo requiere muchas más debido a fluctuaciones). Además, el método requiere extenderse a través del ADN diana, y de ese modo, podría ser imposible distinguir una mutación verdadera de un error generado por la polimerasa, especialmente cuando se copia a través de una base dañada, tal como citosina desaminada. Además, el método no se ha sometido a ensayo en ADNcf, que tiende a ser más pequeño que los fragmentos generados a partir del ADN genómico intacto y, de ese modo, podría requerir la secuenciación de más fragmentos para cubrir todas las mutaciones potenciales. Por último, el método no proporciona información sobre el estado de metilación de los sitios CpG dentro del fragmento.

El cuarto enfoque, denominado secuenciación circular (Lou et al., "High-throughput DNA Sequencing Errors are Reduced by Orders of Magnitude Using Circle Sequencing", Proc Natl Acad Sci USA 110(49):19872-7 (2013), véanse también: Mutational and fitness landscapes of an RNA virus revealed through population sequencing. Acevedo A, Brodsky L, Andino R., Nature. 30 de enero de 2014; 505(7485):686-90; y, Library preparation for highly accurate population sequencing of RNA viruses. Acevedo A, Andino R. Nat Protoc., julio de 2014; 9(7):1760-9), se basa en el corte de ADN o ARN a aproximadamente 150 bases, desnaturalización para formar cadenas individuales, circularización de esas cadenas individuales, uso de cebadores hexámeros aleatorios y ADN polimerasa phi29 para amplificación por círculo rodante (en presencia de Uracil-ADN glicosilasa y Formamidopirimidina-ADN glicosilasa), nuevo corte de los productos a aproximadamente 500 bases y, a continuación, realizar una secuenciación de nueva generación convencional. La ventaja de este enfoque es que la amplificación por círculo rodante hace múltiples copias en tándem del ADN diana original, de modo que un error de polimerasa puede aparecer en una sola copia, pero una mutación verdadera aparece en todas las copias. Las familias leídas tienen un tamaño medio de 3 copias porque las copias están físicamente unidas entre sí. El método también usa Uracil-ADN glicosilasa y Formamidopirimidina-ADN glicosilasa para retirar dianas que contienen bases dañadas, para eliminar tales errores. La ventaja de esta tecnología es que lleva la tasa de error de secuenciación de un nivel actual de aproximadamente 0,1 a 1 x 10-2, a una tasa tan baja como 7,6 x 10-6. Ahora, está última tasa de error es suficiente para distinguir mutaciones cancerosas en plasma en presencia de un exceso de 100 a 10.000 veces de ADN de tipo natural. Una ventaja adicional es que 2-3 copias de la misma secuencia están unidas físicamente, lo que permite la verificación de una mutación verdadera a partir de datos de secuencia generados a partir de un solo fragmento, a diferencia de los al menos 10 fragmentos que usa el enfoque de secuenciación dúplex. Sin embargo, el método no proporciona la capacidad de determinar cambios en el número de copias, ni proporciona información sobre el estado de metilación de los sitios CpG dentro del fragmento.

El quinto enfoque, desarrollado por Complete Genomics (Drmanac et al., "Human Genome Sequencing Using Unchained Base Reads on Self-Assembling DNA Nanoarrays", Science 327(5961):78-81 (2010)), se basa en el uso de lecturas de ligamiento en matrices de nanobolas. Aproximadamente 400 nucleótidos de ADN genómico se circularizan con conectores, se escinden, se recircularizan con conectores adicionales y, por último, se recircularizan para que contengan aproximadamente cuatro conectores. El ADN experimenta amplificación por círculo rodante usando ADN polimerasa phi 29 para generar nanobolas. A continuación, estas se colocan en una matriz y se secuencian usando un enfoque basado en ligamiento. El punto sobresaliente de este enfoque, de relevancia en el presente documento, es que pueden generarse múltiples copias en tándem de la misma secuencia y posteriormente pueden secuenciarse de un único producto de amplificación por círculo rodante. Dado que la ligasa o la polimerasa interrogan múltiples veces la misma secuencia (por combinación de círculo rodante con otros enfoques de secuenciación por síntesis), puede reducirse significativamente la tasa de error por base. Como tal, la secuenciación directa de un producto de círculo rodante proporciona muchas de las mismas ventajas del enfoque de secuenciación por círculo que se han descrito anteriormente.

El sexto enfoque, denominado secuenciación en tiempo real de una sola molécula SMRT (Flusberg et al., "Direct Detection of DNA Methylation During Single-Molecule, Real-Time Sequencing", Nat Methods 7(6):461-5 (2010)), se basa en añadir bucles de horquilla en los extremos de un fragmento de ADN, y permitir que una ADN polimerasa con actividad de desplazamiento de cadena se extienda alrededor del bucle cerrado covalentemente, lo que proporciona información de secuencia en las dos cadenas complementarias. Específicamente, las moléculas individuales de polimerasa catalizan la incorporación de nucleótidos marcados con fluorescencia a cadenas complementarias de ácido nucleico. La polimerasa se ralentiza o "interrumpe el ritmo" cuando incorpora un nucleótido frente a una base metilada, y los pulsos de fluorescencia resultantes permiten la detección directa de nucleótidos modificados en el molde de ADN, que incluye N6-metiladenina, 5-metilcitosina y 5-hidroximetilcitosina. La exactitud del enfoque ha mejorado, especialmente dado que la polimerasa puede atravesar el bucle cerrado varias veces, lo que permite la determinación de una secuencia de consenso. Aunque la técnica está diseñada para proporcionar información de secuencia en sustratos en forma de "mancuerna" (que contienen principalmente las dos secuencias complementarias de un fragmento lineal de ADN), también puede aplicarse a sustratos circulares monocatenarios.

La presente invención se refiere a superar éstas y otras deficiencias en la técnica. El documento de patente WO2007/092538 desvela sondas, que comprenden marcas de paciente, que pueden circularizarse por ligamiento en presencia de ADN o ARN diana.

SUMARIO DE LA INVENCIÓN

La invención proporciona:

Un método para identificar, en una muestra, una o más moléculas de ácido nucleico que comprenden potencialmente primeras y segundas regiones diana distintas acopladas entre sí, comprendiendo dicho método:

la provisión de una muestra que contiene potencialmente una o más moléculas de ácido nucleico que comprenden primeras y segundas regiones diana distintas acopladas entre sí;

la provisión de uno o más conjuntos de sondas oligonucleotídicas, comprendiendo cada conjunto de sondas (i) una primera sonda oligonucleotídica que comprende una primera parte específica de diana 5', una segunda parte específica de diana 3', y una parte adicional, y (ii) una segunda sonda oligonucleotídica que comprende una segunda parte específica de diana 5', una primera parte específica de diana 3', y una parte adicional, en donde la parte adicional de la primera o la segunda sondas oligonucleotídicas de un conjunto de sondas comprende (i) una secuencia de identificador único, (ii) una secuencia de identificador de paciente, (iii) una o más secuencias de unión de cebador, o cualquier combinación de (i), (ii) y (iii);

la puesta en contacto de la muestra y los uno o más conjuntos de sondas oligonucleotídicas en condiciones eficaces para que las primera y segunda sondas oligonucleotídicas de un conjunto de sondas se hibriden de forma específica de acuerdo con las bases con sus correspondientes primera y segunda regiones diana de la molécula de ácido nucleico, si estuviera presente en la muestra;

la generación de una o más uniones competentes para ligamiento adecuadas para acoplar los extremos 3' de las primeras sondas oligonucleotídicas a los extremos 5' de las segundas sondas oligonucleotídicas de un conjunto de sondas o para acoplar los extremos 5' de las primeras sondas oligonucleotídicas a los extremos 3' de las segundas sondas oligonucleotídicas de un conjunto de sondas cuando dichos conjuntos de sondas se hibridan con las primera y segunda regiones diana complementarias de una molécula de ácido nucleico;

el ligamiento de los primero y segundo oligonucleótidos de un conjunto de sondas en las una o más uniones competentes para ligamiento para formar productos ligados circulares que comprenden una secuencia nucleotídica que corresponde a las primera y segunda regiones diana distintas de una molécula de ácido nucleico acoplada a una parte adicional; y

la detección y distinción de los productos ligados circulares en la muestra, mediante lo cual se identifica la presencia, si la hubiera, de una o más moléculas de ácido nucleico que comprenden primeras y segundas regiones diana distintas acopladas entre sí en la muestra.

La invención también proporciona:

Un método para identificar, en una muestra, una o más moléculas de ácido ribonucleico diana que difieren de otras moléculas de ácido nucleico en la muestra en una o más bases, comprendiendo dicho método:

la provisión de una muestra que contiene una o más moléculas de ácido ribonucleico diana que contienen potencialmente una o más diferencias de bases;

la adición de conectores nucleotídicos a los extremos 3' y 5' de las moléculas de ácido ribonucleico diana en la muestra;

la provisión de una o más sondas oligonucleotídicas, comprendiendo cada sonda oligonucleotídica (a) una parte 3' complementaria al conector nucleotídico 3' de la molécula de ácido ribonucleico diana, (b) una parte 5' complementaria al conector nucleotídico 5' de las moléculas de ácido ribonucleico diana, y (c) una parte adicional, comprendiendo dicha parte adicional (i) una secuencia de identificador único, (ii) una secuencia de identificador de paciente, (iii) una o más secuencias de unión de cebador, o cualquier combinación de (i), (ii) y (iii);

la puesta en contacto de la muestra y las una o más sondas oligonucleotídicas en condiciones eficaces para que las partes 3' y 5' de las sondas oligonucleotídicas se hibriden de forma específica de acuerdo con las bases con conectores nucleotídicos complementarios en las moléculas de ácido ribonucleico diana, si estuvieran presentes en la muestra;

la extensión del extremo 3' de la sonda oligonucleotídica hibridada para generar un complemento de las una o más moléculas de ácido ribonucleico diana;

el ligamiento del extremo extendido 3' de la sonda oligonucleotídica al extremo 5' de la sonda oligonucleotídica para formar un producto ligado circular que comprende una secuencia complementaria al conector nucleotídico 3' de la molécula de ácido ribonucleico diana, una secuencia complementaria al conector nucleotídico 5' de la molécula de ácido ribonucleico diana, el complemento de las una o más moléculas de ácido ribonucleico diana, y la parte adicional de la sonda oligonucleotídica; y

la detección y distinción de los productos ligados circulares en la muestra, mediante lo cual se identifica la presencia de una o más moléculas de ácido ribonucleico diana que difieren de otras moléculas de ácido nucleico en la muestra en una o más bases.

La invención proporciona además:

el ligamiento de conectores nucleotídicos a los extremos 3' y 5' de las moléculas de ácido ribonucleico diana en la muestra, en donde dichos conectores nucleotídicos están acoplados entre sí mediante una parte adicional, comprendiendo dicha parte adicional (i) una secuencia de identificador único, (ii) una secuencia de identificador de paciente, (iii) una o más secuencias de unión de cebador, o cualquier combinación de (i), (ii) y (iii), mediante lo cual dicho ligamiento forma un producto de ligamiento circular que comprende la molécula de ácido ribonucleico diana, las secuencias de conector nucleotídico 3' y 5', y la parte adicional;

la provisión de uno o más primeros cebadores oligonucleotídicos que comprenden una secuencia nucleotídica que es complementaria a una secuencia de conector nucleotídico 3' o 5' del producto de ligamiento circular; la hibridación de los uno o más primeros cebadores oligonucleotídicos con el producto de ligamiento circular de forma específica de acuerdo con las bases;

la extensión del extremo 3' del primer cebador oligonucleotídico para generar un complemento del producto de ligamiento circular; y

la detección y distinción de los complementos de producto de ligamiento circular en la muestra, mediante lo cual se identifica la presencia de una o más moléculas de ácido ribonucleico diana que difieren de otras moléculas de ácido nucleico en la muestra en una o más bases.

La invención también proporciona:

la provisión de uno o más conjuntos de sondas oligonucleotídicas, comprendiendo cada conjunto (a) una primera sonda oligonucleotídica que tiene una parte de tallo-bucle 5' y una parte 3' complementaria a una parte 3' de la molécula de ácido ribonucleico diana, (b) una segunda sonda oligonucleotídica que tiene una parte 3' complementaria a una copia del extremo 5' de la molécula de ácido ribonucleico diana, una parte 5' complementaria a la parte de tallo-bucle 5' de la primera sonda oligonucleotídica, y una parte adicional que comprende (i) una secuencia de identificador de diana único, (ii) una secuencia de identificador de paciente, (iii) una secuencia de unión de cebador, o cualquier combinación de (i), (ii) y (iii);

la mezcla de la muestra, las una o más primeras sondas oligonucleotídicas de un conjunto de sondas, y una transcriptasa inversa para formar una reacción de transcriptasa inversa;

la extensión del extremo 3' de la primera sonda oligonucleotídica hibridada con su molécula de ácido ribonucleico diana complementaria para generar un complemento de la molécula ribonucleotídica diana, si estuviera presente en la muestra;

la hibridación de las una o más segundas sondas oligonucleotídicas de un conjunto de sondas con las primeras sondas oligonucleotídicas extendidas que comprenden un complemento de las secuencias ribonucleotídicas diana;

la generación de una o más uniones competentes para ligamiento entre extremos 3' y 5' de cada segunda sonda oligonucleotídica hibridada con una primera sonda oligonucleotídica extendida;

el ligamiento de los extremos 3' y 5' de cada segunda sonda oligonucleotídica para formar productos ligados circulares que comprenden una copia de ácido desoxirribonucleico de la secuencia de ácido nucleico diana acoplada a la parte adicional de la segunda sonda oligonucleotídica; y

En el presente documento se desvela una colección de diferentes construcciones de ácido nucleico monocatenarias quiméricas circulares. Cada construcción de la colección está formada por un primer segmento monocatenario de ADN genómico original de un organismo hospedador y un segundo segmento de ácido nucleico sintético monocatenario que está unido al primer segmento monocatenario y comprende una secuencia nucleotídica que es exógena al organismo hospedador. El segundo segmento de ácido nucleico sintético monocatenario comprende una parte de identificador único, en donde la secuencia nucleotídica tanto de la parte de identificador único como del segmento de ADN genómico original distingue una construcción de ácido nucleico monocatenaria quimérica en la colección de otra construcción de ácido nucleico monocatenaria quimérica en la colección. Las construcciones de ácido nucleico monocatenarias quiméricas de la colección están circularizadas y son adecuadas para amplificación por círculo rodante y/o secuenciación.

En el presente documento también se desvela un sistema que comprende una colección de diferentes construcciones de ácido nucleico monocatenarias quiméricas circulares. Cada construcción de la colección comprende

un primer segmento monocatenario de ADN genómico original de un organismo hospedador y un segundo segmento de ácido nucleico monocatenario que está unido al primer segmento monocatenario y comprende una secuencia nucleotídica que es exógena al organismo hospedador. La secuencia nucleotídica del segundo segmento de ácido nucleico monocatenario comprende una primera parte específica de cebador de soporte sólido, una segunda parte específica de cebador de soporte sólido, y una secuencia de identificador de paciente. Las construcciones de ácido nucleico monocatenarias quiméricas de la colección están circularizadas y son adecuadas para amplificación por círculo rodante y/o secuenciación. El sistema comprende además una colección de productos de extensión, comprendiendo cada producto de extensión dos o más secuencias lineales en tándem complementarias a la construcción de ácido nucleico monocatenaria quimérica de la colección. Cada producto de extensión en la colección se hibrida con su construcción de ácido nucleico monocatenaria quimérica circular complementaria de la colección.

También se desvela un sistema que comprende una colección de diferentes construcciones de ácido nucleico monocatenarias quiméricas circulares. Cada construcción comprende un primer segmento monocatenario de ADN genómico original de un organismo hospedador y un segundo segmento de ácido nucleico monocatenario que está unido al primer segmento monocatenario y comprende una secuencia nucleotídica que es exógena al organismo hospedador. La secuencia nucleotídica del segundo segmento de ácido nucleico monocatenario comprende una primera parte específica de cebador de soporte sólido, una segunda parte específica de cebador de soporte sólido, y una secuencia de identificador de paciente. Las construcciones de ácido nucleico monocatenarias quiméricas de la colección son adecuadas para amplificación por círculo rodante y/o secuenciación. El sistema comprende además uno o más cebadores de amplificación oligonucleotídicos, comprendiendo cada cebador al menos una primera parte de secuencia nucleotídica que es complementaria a la primera parte específica de cebador de soporte sólido o la segunda parte específica de cebador de soporte sólido de las construcciones de ácido nucleico monocatenarias quiméricas de la colección; y una polimerasa adecuada para amplificación por círculo rodante.

Algunos aspectos de la presente invención se refieren a métodos de secuenciación de una pluralidad de moléculas de ácido nucleico en una muestra que pueden usar la colección y los sistemas desvelados en el presente documento.

También se desvela en el presente documento un método para identificar, en una muestra, una o más moléculas de ácido ribonucleico diana que se diferencian de otras moléculas de ácido nucleico en la muestra en una o más bases. Este método implica proporcionar una muestra que contiene una o más moléculas de ácido ribonucleico diana que contienen potencialmente una o más diferencias de bases y generar, en la muestra, ADNc de las una o más moléculas de ácido ribonucleico diana, si estuvieran presentes en la muestra. El método implica además proporcionar una o más primeras sondas oligonucleotídicas, comprendiendo cada primera sonda oligonucleotídica (a) una parte de secuencia específica de diana de ADNc 3', (b) una parte específica de diana de ADNc 5', y una parte adicional, comprendiendo dicha parte adicional (i) una secuencia de identificador único, (ii) una secuencia de identificador de paciente, (iii) una o más secuencias de unión de cebador, o cualquier combinación de (i), (ii), y (iii), y poner en contacto la muestra y las una o más primeras sondas oligonucleotídicas en condiciones eficaces para que las partes específicas de diana 3' y 5' de las primeras sondas oligonucleotídicas se hibriden de forma específica de acuerdo con las bases con regiones complementarias del ADNc. Se generan una o más uniones competentes para ligamiento adecuadas para acoplar los extremos 3' y 5' de una primera sonda oligonucleotídica hibridada con su ADNc complementario y las una o más primeras sondas oligonucleotídicas en las una o más uniones de ligamiento se ligan para formar productos ligados circulares que comprenden una copia de ácido desoxirribonucleico de la secuencia de ácido ribonucleico diana acoplada a la parte adicional de la primera sonda oligonucleotídica. El método implica además detectar y distinguir los productos ligados circulares en la muestra para identificar la presencia de una o más moléculas de ácido ribonucleico diana que se diferencian de otras moléculas de ácido ribonucleico en la muestra en una o más bases.

Otro aspecto de la presente invención se refiere a un método para identificar, en una muestra, una o más moléculas de ácido nucleico que comprenden potencialmente primeras y segundas regiones diana distintas acopladas entre sí. Este método implica proporcionar una muestra que contiene potencialmente una o más moléculas de ácido nucleico que comprenden primeras y segundas regiones diana distintas acopladas entre sí, y proporcionar uno o más conjuntos de sondas oligonucleotídicas, comprendiendo cada conjunto de sondas (i) una primera sonda oligonucleotídica que comprende una primera parte específica de diana 5', una segunda parte específica de diana 3', y una parte adicional, y (ii) una segunda sonda oligonucleotídica que comprende una segunda parte específica de diana 5', una primera parte específica de diana 3', y una parte adicional, en donde la parte adicional de la primera o la segunda sondas oligonucleotídicas de un conjunto de sondas comprende (i) una secuencia de identificador único, (ii) una secuencia de identificador de paciente, (iii) una o más secuencias de unión de cebador, o cualquier combinación de (i), (ii), y (iii). Este método implica además poner en contacto la muestra y los uno o más conjuntos de sondas oligonucleotídicas en condiciones eficaces para que la primera y la segunda sondas oligonucleotídicas se hibriden de forma específica de acuerdo con las bases con sus correspondientes primera y segunda regiones diana de la molécula de ácido nucleico, si estuvieran presentes en la muestra, y generar una o más uniones competentes para ligamiento adecuadas para acoplar los extremos 3' de las primeras sondas oligonucleotídicas a los extremos 5' de las segundas sondas oligonucleotídicas de un conjunto de sondas y para acoplar los extremos 5' de las primeras sondas oligonucleotídicas a los extremos 3' de las segundas sondas oligonucleotídicas de un conjunto de sondas cuando dichos conjuntos de sondas se hibridan con primeras y segundas regiones diana complementarias de una molécula de ácido nucleico. El primer y el segundo oligonucleótidos de un conjunto de sondas se ligan a las una o más uniones competentes para ligamiento para formar productos ligados circulares que comprenden una secuencia nucleotídica que corresponde a la primera y la segunda regiones diana distintas de una molécula de ácido nucleico acoplada a una parte adicional, y los productos ligados circulares se detectan y distinguen en la muestra para identificar de ese modo la presencia, si la hubiera, de una o más moléculas de ácido nucleico que comprenden primeras y segundas regiones diana distintas acopladas entre sí en la muestra.

Otro aspecto de la presente invención se refiere a un método para identificar, en una muestra, una o más moléculas de ácido ribonucleico diana que se diferencian de otras moléculas de ácido nucleico en la muestra en una o más bases. Este método implica proporcionar una muestra que contiene una o más moléculas de ácido ribonucleico diana que contienen potencialmente una o más diferencias de bases, y añadir conectores nucleotídicos a los extremos 3' y 5' de las moléculas de ácido ribonucleico diana en la muestra. Este método implica además proporcionar una o más sondas oligonucleotídicas, comprendiendo cada sonda oligonucleotídica (a) una parte 3' complementaria al conector nucleotídico 3' de la molécula de ácido ribonucleico diana, (b) una parte 5' complementaria al conector nucleotídico 5' de las moléculas de ácido ribonucleico diana, y (c) una parte adicional, comprendiendo dicha parte adicional (i) una secuencia de identificador único, (ii) una secuencia de identificador de paciente, (iii) una o más secuencias de unión de cebador, o cualquier combinación de (i), (ii), y (iii). La muestra se pone en contacto con las una o más sondas oligonucleotídicas en condiciones eficaces para que las partes 3' y 5' de las sondas oligonucleotídicas se hibriden de forma específica de acuerdo con las bases con conectores nucleotídicos complementarios en las moléculas de ácido ribonucleico diana, si estuvieran presentes en la muestra. El extremo 3' de la sonda oligonucleotídica hibridada se extiende para generar un complemento de las una o más moléculas de ácido ribonucleico diana, y el extremo 3' extendido de la sonda oligonucleotídica se liga al extremo 5' de la sonda oligonucleotídica para formar un producto ligado circular que comprende una secuencia complementaria al conector nucleotídico 3' de la molécula de ácido ribonucleico diana, una secuencia complementaria al conector nucleotídico 5' de la molécula de ácido ribonucleico diana, el complemento de las una o más moléculas de ácido ribonucleico diana, y la parte adicional de la sonda oligonucleotídica. Este método implica además detectar y distinguir los productos ligados circulares en la muestra para identificar de ese modo la presencia de una o más moléculas de ácido ribonucleico diana que se diferencian de otras moléculas de ácido nucleico en la muestra en una o más bases.

Otro aspecto de la presente invención se refiere a un método para identificar, en una muestra, una o más moléculas de ácido ribonucleico diana que se diferencian de otras moléculas de ácido nucleico en la muestra en una o más bases. Este método implica proporcionar una muestra que contiene una o más moléculas de ácido ribonucleico diana que contienen potencialmente una o más diferencias de bases, y ligar conectores nucleotídicos a los extremos 3' y 5' de las moléculas de ácido ribonucleico diana en la muestra, en donde dichos conectores nucleotídicos están acoplados entre sí mediante una parte adicional, comprendiendo dicha parte adicional (i) una secuencia de identificador único, (ii) una secuencia de identificador de paciente, (iii) una o más secuencias de unión de cebador, o cualquier combinación de (i), (ii), y (iii), mediante lo cual dicho ligamiento forma un producto de ligamiento circular que comprende la molécula de ácido ribonucleico diana, las secuencias de conector nucleotídico 3' y 5', y la parte adicional. Este método implica además proporcionar uno o más primeros cebadores oligonucleotídicos que comprenden una secuencia nucleotídica que es complementaria a una secuencia de conector nucleotídico 3' o 5' del producto de ligamiento circular, e hibridación de los uno o más primeros cebadores oligonucleotídicos con el producto de ligamiento circular de forma específica de acuerdo con las bases. El extremo 3' del primer cebador oligonucleotídico se extiende para generar un complemento del producto de ligamiento circular, y los complementos del producto de ligamiento circular en la muestra se detectan y distinguen, para identificar de ese modo la presencia de una o más moléculas de ácido ribonucleico diana que se diferencian de otras moléculas de ácido nucleico en la muestra en una o más bases.

Otro aspecto de la presente invención se refiere a un método para identificar, en una muestra, una o más moléculas de ácido ribonucleico diana que se diferencian de otras moléculas de ácido nucleico en la muestra en una o más bases. Este método implica proporcionar una muestra que contiene una o más moléculas de ácido ribonucleico diana que contienen potencialmente una o más diferencias de bases, y proporcionar uno o más conjuntos de sondas oligonucleotídicas, comprendiendo cada conjunto (a) una primera sonda oligonucleotídica que tiene una parte de tallo-bucle 5' y una parte 3' complementaria a una parte 3' de la molécula de ácido ribonucleico diana, (b) una segunda sonda oligonucleotídica que tiene una parte 3' complementaria a una copia del extremo 5' de la molécula de ácido ribonucleico diana, una parte 5' complementaria a la parte de tallo-bucle 5' de la primera sonda oligonucleotídica, y una parte adicional que comprende (i) una secuencia de identificador de diana único, (ii) una secuencia de identificador de paciente, (iii) una secuencia de unión de cebador, o cualquier combinación de (i), (ii), y (iii). El método implica además mezclar la muestra, las una o más primeras sondas oligonucleotídicas de un conjunto de sondas, y una transcriptasa inversa para formar una reacción de transcriptasa inversa, y extender el extremo 3' de la primera sonda oligonucleotídica hibridada con su molécula de ácido ribonucleico diana complementaria para generar un complemento de la molécula de ribonucleótido diana, si estuviera presente en la muestra. Las una o más segundas sondas oligonucleotídicas de un conjunto de sondas se hibridan con las primeras sondas oligonucleotídicas extendidas que comprenden un complemento de las secuencias ribonucleotídicas diana, y se generan una o más uniones competentes para ligamiento entre los extremos 3' y 5' de cada segunda sonda oligonucleotídica hibridada con una primera sonda oligonucleotídica extendida. El método implica además ligar los extremos 3' y 5' de cada segunda sonda oligonucleotídica para formar productos ligados circulares que comprenden una copia de ácido desoxirribonucleico de la secuencia de ácido ribonucleico diana acoplada a la parte adicional de la segunda sonda oligonucleotídica. Los productos ligados circulares en la muestra se detectan y distinguen, para identificar de ese modo la presencia de una o más moléculas de ácido ribonucleico diana que se diferencian de otras moléculas de ácido nucleico en la muestra en una o más bases.

La importancia de la invención es que enseña un método para la captura dirigida altamente específica de regiones de genomas y transcriptomas humanos de la sangre, es decir, de ADN circulante no asociado a células, exosomas, microARN, células tumorales circulantes, o células de sangre completa, para permitir la detección altamente selectiva de cambios en mutación, expresión, número de copias, translocación, corte y empalme alternativo, y metilación, adecuado para su uso en un modo de diagnóstico de alto rendimiento. Las construcciones monocatenarias descritas en el presente documento son adecuadas para la lectura mediante una serie de tecnologías diferentes, incluyendo la secuenciación de nueva generación, y están diseñadas para ser operativas con cualquier tecnología de lectura. Con el fin de maximizar la sensibilidad de captura, la invención usa no solo hibridación, sino también extensión y ligamiento con polimerasa para disminuir los falsos positivos. Con el fin de maximizar la especificidad, las sondas no ligadas se digieren con exonucleasa para conservar las secuencias diana circularizadas. Puede obtenerse aún más especificidad mediante la secuenciación de repeticiones en tándem de la secuencia genómica original producida mediante amplificación por círculo rodante. Además, se desvela un método para capturar repeticiones en tándem producidas a partir de la secuencia genómica original, generadas mediante amplificación por círculo rodante en una superficie y a continuación someterlas a secuenciación por síntesis, para permitir de ese modo una detección de mutación, un estado de metilación y una enumeración de transcriptomas con alta exactitud. El método es especialmente adecuado para identificar marcadores específicos de cáncer directamente a partir de la sangre, para cribado de cáncer, así como para monitorizar la eficacia y la recurrencia del tratamiento. El método también es adecuado para el diagnóstico prenatal de anomalías en las copias y enfermedades mendelianas directamente a partir de la sangre materna.

BREVE DESCRIPCIÓN DE LOS DIBUJOS

La Figura 1 muestra un enfoque para amplificar las construcciones de ácido nucleico monocatenarias quiméricas circulares de la presente divulgación en la preparación para la secuenciación de nueva generación. Este enfoque usa amplificación por círculo rodante (RCA) o replicación por círculo rodante (RCR) con hexámeros aleatorios. La Figura 2 muestra un método para generar copias lineales en tándem de moléculas de ácido nucleico bicatenarias, adecuadas para secuenciación, a partir de un producto de RCA.

La Figura 3 muestra un método para generar copias lineales en tándem de moléculas de ácido nucleico, adecuadas para secuenciación. Este método selecciona específicamente fragmentos que estaban metilados en todos los sitios de BstUl en el ADN diana inicial.

La Figura 4 muestra enfoques alternativos para amplificar las construcciones de ácido nucleico monocatenarias quiméricas circulares de la presente divulgación en la preparación para la secuenciación de nueva generación. Este enfoque usa RCA con un cebador específico único ya sea en solución o sobre una superficie.

La Figura 5 ilustra un enfoque para condensar amplicones de ADN lineal generados mediante RCA o RCR en una estructura compacta antes de su captura sobre una superficie celular de flujo de secuenciación.

La Figura 6 representa un método de secuenciación de una pluralidad de moléculas de ácido nucleico en una muestra usando el sistema y los métodos de la presente divulgación.

La Figura 7 representa un método para amplificar moléculas de ácido nucleico y capturar los amplicones resultantes sobre un soporte sólido adecuado para la secuenciación de nueva generación.

La Figura 8 muestra el proceso de secuenciación de amplicones preparados de acuerdo con los métodos de la presente divulgación sobre una superficie de soporte sólido.

La Figura 9 representa un método para amplificar moléculas de ácido nucleico y capturar los amplicones resultantes sobre un soporte sólido adecuado para la secuenciación de nueva generación. La secuenciación de los amplicones inmovilizados se realiza de acuerdo con los métodos que se muestran en la Figura 8.

La Figura 10 representa otro método para amplificar moléculas de ácido nucleico y capturar los amplicones resultantes sobre un soporte sólido adecuado para la secuenciación de nueva generación. La secuenciación de los amplicones inmovilizados se realiza de acuerdo con los métodos que se muestran en la Figura 8.

La Figura 11 representa otro método para amplificar moléculas de ácido nucleico y capturar los amplicones resultantes sobre un soporte sólido adecuado para la secuenciación de nueva generación. La secuenciación de los amplicones inmovilizados se realiza de acuerdo con los métodos que se muestran en la Figura 8.

La Figura 12 representa la amplificación por círculo rodante de una diana circular para generar ADN molde de repetición en tándem monocatenario para captura sobre un soporte sólido que comprende cebadores dobles. La Figura 13 representa un método para generar construcciones de ácido nucleico monocatenarias quiméricas circulares de la presente divulgación.

La Figura 14 representa un método para generar y amplificar construcciones de ácido nucleico monocatenarias quiméricas circulares de la presente divulgación.

La Figura 15 representa un método para generar construcciones de ácido nucleico monocatenarias quiméricas circulares de la presente divulgación.

La Figura 16 representa un método para generar y amplificar construcciones de ácido nucleico monocatenarias quiméricas circulares de la presente divulgación.

La Figura 17 representa un método para generar construcciones de ácido nucleico monocatenarias quiméricas circulares de la presente divulgación.

La Figura 18 representa un método para generar y amplificar construcciones de ácido nucleico monocatenarias quiméricas circulares de la presente divulgación.

La Figura 19 representa un método para generar construcciones de ácido nucleico monocatenarias quiméricas circulares de la presente divulgación.

La Figura 20 representa un método para generar y amplificar construcciones de ácido nucleico monocatenarias quiméricas circulares de la presente divulgación.

La Figura 21 representa un método para generar construcciones de ácido nucleico monocatenarias quiméricas circulares de la presente divulgación.

La Figura 22 representa un método para generar y amplificar construcciones de ácido nucleico monocatenarias quiméricas circulares de la presente divulgación.

La Figura 23 representa un método para generar construcciones de ácido nucleico monocatenarias quiméricas circulares de la presente divulgación.

La Figura 24 representa un método para generar y amplificar construcciones de ácido nucleico monocatenarias quiméricas circulares de la presente divulgación.

La Figura 25 representa un método para generar construcciones de ácido nucleico monocatenarias quiméricas circulares de la presente divulgación.

La Figura 26 representa un método para generar y amplificar construcciones de ácido nucleico monocatenarias quiméricas circulares de la presente divulgación.

La Figura 27 muestra un método para detectar metilación en sitios de HinP1 adyacentes en una secuencia genética conocida.

La Figura 28 representa un proceso para detectar metilación en sitios de HinP1 adyacentes en todo el genoma. La Figura 29 representa un método para generar construcciones de ácido nucleico monocatenarias quiméricas circulares de la presente divulgación que contienen sitios de metilación de AciI adyacentes.

La Figura 30 representa un método para generar y amplificar construcciones de ácido nucleico monocatenarias quiméricas circulares de la presente divulgación que contienen sitios de metilación de AciI adyacentes.

La Figura 31 representa un método para generar construcciones de ácido nucleico monocatenarias quiméricas circulares de la presente divulgación que contienen sitios de metilación de AciI adyacentes.

La Figura 32 representa un método para generar y amplificar construcciones de ácido nucleico monocatenarias quiméricas circulares de la presente divulgación que contienen sitios de metilación de AciI adyacentes.

La Figura 33 muestra un proceso para detectar metilación en sitios de AciI adyacentes en todo el genoma. La Figura 34 representa un método para generar construcciones de ácido nucleico monocatenarias quiméricas circulares de la presente divulgación que contienen sitios de HinPlI sin metilar adyacentes.

La Figura 35 representa un método para generar y amplificar construcciones de ácido nucleico monocatenarias quiméricas circulares de la presente divulgación que contienen sitios de HinP1I sin metilar adyacentes.

La Figura 36 representa un método para generar construcciones de ácido nucleico monocatenarias quiméricas circulares de la presente divulgación que contienen sitios de AciI metilados adyacentes ubicados entre sitios de restricción de HaeIII.

La Figura 37 representa un método para generar y amplificar construcciones de ácido nucleico monocatenarias quiméricas circulares de la presente divulgación que contienen sitios de AciI metilados adyacentes ubicados entre sitios de restricción de HaeIII.

La Figura 38 muestra un proceso para producir construcciones de ácido nucleico monocatenarias quiméricas circulares de la presente divulgación que contienen sitios de Bsh1236I metilados entre sitios de HaeIII en regiones genómicas de ADNcf o ADN genómico total cortado.

La Figura 39 representa un método para generar construcciones de ácido nucleico monocatenarias quiméricas circulares de la presente divulgación que contienen uno o más sitios de AciI metilados cerca de un sitio de restricción de HaeIII 5'.

La Figura 40 representa un método para generar y amplificar construcciones de ácido nucleico monocatenarias quiméricas circulares de la presente divulgación que contienen uno o más sitios de AciI metilados cerca de un sitio de restricción de HaeIII 5'.

La Figura 41 muestra un proceso para producir construcciones de ácido nucleico monocatenarias quiméricas circulares adecuado para detectar sitios de Bsh1236I metilados cerca de un sitio de HaeIII 5' en regiones conocidas de ADN genómico.

La Figura 42 representa un método para generar construcciones de ácido nucleico monocatenarias quiméricas circulares de la presente divulgación que contienen uno o más sitios de Acil metilados cerca de un sitio de restricción de HaeIII 3'.

La Figura 43 representa un método para generar y amplificar construcciones de ácido nucleico monocatenarias quiméricas circulares de la presente divulgación que contienen uno o más sitios de AciI metilados cerca de un sitio de restricción de HaeIII 3'.

La Figura 44 muestra un proceso para producir construcciones de ácido nucleico monocatenarias quiméricas circulares adecuado para detectar sitios de Bsh1236I metilados cerca de un sitio de HaeIII 3' en regiones genómicas de ADNcf o ADN genómico total cortado.

La Figura 45 muestra un proceso para producir construcciones de ácido nucleico monocatenarias quiméricas circulares adecuado para detectar sitios de Bsh1236I metilados vecinales en regiones conocidas de ADN genómico.

La Figura 46 muestra un proceso para producir construcciones de ácido nucleico monocatenarias quiméricas circulares adecuado para detectar todos los sitios CpG metilados cerca de sitios de Bsh1236I en regiones conocidas de ADN genómico.

La Figura 47 representa un método para generar construcciones de ácido nucleico monocatenarias quiméricas circulares de la presente divulgación que contienen sitios de HinPlI sin metilar adyacentes.

La Figura 48 representa un método para generar y amplificar construcciones de ácido nucleico monocatenarias quiméricas circulares de la presente divulgación que contienen sitios de HinP1I sin metilar adyacentes.

La Figura 49 representa un método para generar construcciones de ácido nucleico monocatenarias quiméricas circulares de la presente divulgación que contienen sitios de AciI metilados adyacentes ubicados entre sitios de restricción de HaeIII.

La Figura 50 representa un método para generar y amplificar construcciones de ácido nucleico monocatenarias quiméricas circulares de la presente divulgación que contienen sitios de AciI metilados adyacentes ubicados entre sitios de restricción de HaeIII.

La Figura 51 representa un proceso para detectar sitios de HinPlI adyacentes metilados en regiones genómicas conocidas.

La Figura 52 representa un proceso para detectar sitios de AciI adyacentes sin metilar en regiones genómicas conocidas.

La Figura 53 representa un método para generar construcciones de ácido nucleico monocatenarias quiméricas circulares de la presente divulgación que contienen sitios de HinPlI adyacentes sin metilar en regiones genómicas conocidas.

La Figura 54 representa un método para generar y amplificar construcciones de ácido nucleico monocatenarias quiméricas circulares de la presente divulgación que contienen sitios de HinPlI adyacentes sin metilar en regiones genómicas conocidas.

La Figura 55 representa un método para generar construcciones de ácido nucleico monocatenarias quiméricas circulares de la presente divulgación que contienen sitios de HinPlI adyacentes sin metilar en regiones genómicas conocidas.

La Figura 56 representa un método para generar y amplificar construcciones de ácido nucleico monocatenarias quiméricas circulares de la presente divulgación que contienen sitios de HinPlI adyacentes sin metilar en regiones genómicas conocidas.

La Figura 57 muestra un proceso para detectar sitios de HinPlI adyacentes sin metilar en regiones genómicas conocidas.

La Figura 58 representa un método para generar construcciones de ácido nucleico monocatenarias quiméricas circulares de la presente divulgación que contienen sitios de Hph1 adyacentes sin metilar en regiones genómicas conocidas.

La Figura 59 representa un método para generar y amplificar construcciones de ácido nucleico monocatenarias quiméricas circulares de la presente divulgación que contienen sitios de Hph1 adyacentes sin metilar en regiones genómicas conocidas.

La Figura 60 representa un método para generar construcciones de ácido nucleico monocatenarias quiméricas circulares de la presente divulgación que contienen sitios de Hph1 adyacentes sin metilar en regiones genómicas conocidas.

La Figura 61 representa un método para generar y amplificar construcciones de ácido nucleico monocatenarias quiméricas circulares de la presente divulgación que contienen sitios de Hph1 adyacentes sin metilar en regiones genómicas conocidas.

La Figura 62 muestra un proceso para detectar sitios de Hph1 adyacentes sin metilar en regiones genómicas conocidas.

La Figura 63 muestra un proceso para producir construcciones de diana de ácido nucleico monocatenarias quiméricas circulares a partir de ADNcf o ADN genómico cortado adecuadas para secuenciación.

La Figura 64 muestra un proceso para producir construcciones de diana de ácido nucleico monocatenarias quiméricas circulares a partir de ADNcf o ADN genómico cortado adecuadas para secuenciación.

La Figura 65 muestra un proceso para producir construcciones de diana de ácido nucleico monocatenarias quiméricas circulares a partir de ADNcf o ADN genómico cortado adecuadas para secuenciación.

La Figura 66 muestra el diseño de conector y el ligamiento para generar moldes listos para secuenciación a partir de ADNcf.

La Figura 67 muestra el diseño de conector "con huecos" para secuenciar, identificar y verificar mutaciones en ambas cadenas diana de ADNcf.

La Figura 68 muestra el diseño de conector para secuenciar, identificar y verificar mutaciones en ambas cadenas diana de ADNcf usando formación de cola en C3, ligamiento, activación de conectores que contienen rG con RNasaH2, llenado de huecos y ligamiento.

La Figura 69 muestra el diseño de conector para secuenciar e identificar mutaciones en cualquier cadena diana de ADNcf usando formación de cola en dA con inserción de rA limitada, formación de cola en C3, ligamiento, activación de conectores que contienen rG con RNasaH2, llenado de huecos y ligamiento.

La Figura 70 muestra un proceso para producir construcciones de ácido nucleico monocatenarias quiméricas circulares a partir de ADNcf o ADN genómico cortado adecuadas para secuenciación.

La Figura 71 muestra un proceso para producir construcciones de ácido nucleico monocatenarias quiméricas circulares a partir de ADNcf que implica activación con RNasa H2.

La Figura 72 muestra otro proceso a modo de ejemplo para producir construcciones de ácido nucleico monocatenarias quiméricas circulares a partir de ADNcf que implica activación con RNasa H2.

La Figura 73 muestra la generación de ADN circular monocatenario que comprende ADNcf diana original con un cebador hibridado.

La Figura 74 muestra la generación de ADN circular monocatenario que comprende ADNcf diana original con un cebador hibridado que contiene un grupo de captura.

La Figura 75 muestra la generación de ADN circular monocatenario que comprende ADNcf diana original con un cebador hibridado usando desbloqueo con RNasaH2 de cebador específico de diana.

La Figura 76 muestra la generación de ADN circular monocatenario que comprende ADNcf diana original con un cebador hibridado que contiene un grupo de captura, usando desbloqueo con RNasaH2 de cebador específico de diana.

La Figura 77 muestra un proceso para producir construcciones de ácido nucleico monocatenarias quiméricas circulares a partir de ADNcf o ADN genómico cortado adecuadas para secuenciación.

La Figura 78 muestra un proceso para producir construcciones de ácido nucleico monocatenarias quiméricas circulares a partir de ADNcf o ADN genómico cortado adecuadas para secuenciación.

La Figura 79 muestra un proceso para enriquecer ADN circular monocatenario específico de diana usando captura con cebadores específicos de diana que posteriormente puede usarse para amplificación por círculo rodante.

La Figura 80 muestra un proceso para enriquecer ADN circular monocatenario específico de diana usando captura con cebadores específicos de diana en tándem con huecos que posteriormente puede usarse para amplificación por círculo rodante.

La Figura 81 muestra un proceso para enriquecer ADN circular monocatenario específico de diana usando cebadores específicos de diana que posteriormente puede usarse para amplificación por círculo rodante.

La Figura 82 muestra un proceso para generar y enriquecer productos de extensión de repetición en tándem monocatenarios específicos de diana genómica adecuados para secuenciación.

La Figura 83 muestra un proceso para generar y enriquecer productos de extensión de repetición en tándem monocatenarios específicos de diana genómica adecuados para secuenciación.

La Figura 84 muestra un proceso para generar y enriquecer productos de extensión de repetición en tándem monocatenarios específicos de diana genómica adecuados para secuenciación.

La Figura 85 muestra un proceso para generar y enriquecer productos de extensión de repetición en tándem monocatenarios específicos de diana genómica adecuados para secuenciación.

La Figura 86 muestra un proceso para generar y enriquecer productos de extensión de repetición en tándem monocatenarios específicos de diana genómica adecuados para secuenciación.

La Figura 87 muestra un proceso para generar y enriquecer productos de extensión de repetición en tándem monocatenarios específicos de diana genómica adecuados para secuenciación.

La Figura 88 muestra un proceso para generar y enriquecer productos de extensión de repetición en tándem monocatenarios específicos de diana genómica adecuados para secuenciación.

La Figura 89 muestra un proceso para generar y enriquecer productos de extensión de repetición en tándem monocatenarios específicos de diana genómica adecuados para secuenciación.

La Figura 90 muestra el mapeo de una familia de sondas oligonucleotídicas ("oligo") a lo largo de una colección de fragmentos diana de ADN no asociado a células (ADNcf) (160 nucleótidos de longitud) en incrementos de 10 bases nucleotídicas. Cada sonda oligonucleotídica contiene una parte específica de diana 3' de 20 bases, una parte específica de diana 5' de 60 bases, un conector de 10 bases (barra de color negro), y una secuencia compuesta de identificador de 20 - 160 bases (línea fina).

La Figura 91 muestra el mapeo de una familia de sondas oligonucleotídicas ("oligo"), a lo largo de una colección de fragmentos diana de ADNcf (160 nucleótidos de longitud) en incrementos de 10 bases nucleotídicas. Cada sonda oligonucleotídica contiene una parte específica de diana 3' de 20 bases, una parte específica de diana 5' de 80 bases, un conector de 10 bases (barra de color negro), y una secuencia compuesta de identificador de 20 -160 bases (línea fina).

La Figura 92 muestra el mapeo de una familia de sondas oligonucleotídicas ("oligo"), a lo largo de una colección de fragmentos diana de ADNcf (160 nucleótidos de longitud) en incrementos de 10 bases nucleotídicas. Cada sonda oligonucleotídica contiene una parte específica de diana 3' de 50 bases, una parte específica de diana 5' de 60 bases, un conector de 10 bases (barra de color negro), y una secuencia compuesta de identificador de 20 -160 bases (línea fina).

La Figura 93 muestra el mapeo de una familia de sondas oligonucleotídicas ("oligo"), a lo largo de una colección de fragmentos diana de ADNcf (160 nucleótidos de longitud) en incrementos de 10 bases nucleotídicas. Cada sonda oligonucleotídica contiene una parte específica de diana 3' de 50 bases, una parte específica de diana 5' de 80 bases, un conector de 10 bases (barra de color negro), y una secuencia compuesta de identificador de 20 -160 bases (línea fina).

La Figura 94 muestra el mapeo de una familia de sondas oligonucleotídicas ("oligo"), a lo largo de una colección de fragmentos diana de ADNcf (160 nucleótidos de longitud) en incrementos de 10 bases nucleotídicas. Cada sonda oligonucleotídica contiene una parte específica de diana 3' de 50 bases, una parte específica de diana 5' de 50 bases, conectores de 10 bases en los extremos 3' y 5' (barra de color negro), y una secuencia compuesta de identificador de 20 - 160 bases (línea fina).

La Figura 95 muestra el mapeo de una familia de sondas oligonucleotídicas ("oligo"), a lo largo de una colección de fragmentos diana de ADNcf (160 nucleótidos de longitud) en incrementos de 10 bases nucleotídicas. Cada sonda oligonucleotídica contiene una parte específica de diana 3' de 60 bases, una parte específica de diana 5' de 60 bases, conectores de 10 bases en los extremos 3' y 5' (barra de color negro), y una secuencia compuesta de identificador de 20 - 160 bases (línea fina).

La Figura 96 muestra el mapeo de una familia de sondas oligonucleotídicas ("oligo"), a lo largo de una colección de fragmentos diana de ADNcf (160 nucleótidos de longitud) en incrementos de 10 bases nucleotídicas. Cada sonda oligonucleotídica contiene una parte específica de diana 3' de 50 bases, una parte específica de diana 5' de 50 bases, y una secuencia compuesta de identificador de 20 - 160 bases (línea fina).

La Figura 97 muestra el mapeo de una familia de sondas oligonucleotídicas ("oligo"), a lo largo de una colección de fragmentos diana de ADNcf (160 nucleótidos de longitud) en incrementos de 10 bases nucleotídicas. Cada sonda oligonucleotídica contiene una parte específica de diana 3' de 60 bases, una parte específica de diana 5' de 60 bases, y una secuencia compuesta de identificador de 20 - 160 bases (línea fina).

La Figura 98 muestra el mapeo de una familia de sondas oligonucleotídicas ("oligo"), a lo largo de una colección de fragmentos diana de ADNcf (160 nucleótidos de longitud) en incrementos de 10 bases nucleotídicas. Cada sonda oligonucleotídica contiene una parte específica de diana 3' de 70 bases, una parte específica de diana 5' de 70 bases, y una secuencia compuesta de identificador de 20 - 160 bases (línea fina).

La Figura 99 muestra el mapeo de una familia de sondas oligonucleotídicas ("oligo"), a lo largo de una colección de fragmentos diana de ADNcf (160 nucleótidos de longitud) en incrementos de 10 bases nucleotídicas. Cada sonda oligonucleotídica contiene una parte específica de diana 3' de 80 bases, una parte específica de diana 5' de 80 bases, y una secuencia compuesta de identificador de 20 - 160 bases (línea fina).

La Figura 100 ilustra la forma en la que diseñar sondas oligonucleotídicas con una estrategia de mosaico solapante para secuenciar regiones diana contiguas de mayor tamaño (aproximadamente 500 bases mostradas como ejemplo).

La Figura 101 ilustra la forma en la que diseñar sondas oligonucleotídicas con una estrategia de mosaico solapante para secuenciar regiones diana contiguas de mayor tamaño (aproximadamente 500 bases mostradas como ejemplo).

La Figura 102 ilustra la forma en la que diseñar sondas oligonucleotídicas con una estrategia de mosaico solapante para secuenciar regiones diana contiguas de mayor tamaño (aproximadamente 500 bases mostradas como ejemplo).

La Figura 103 ilustra la forma en la que diseñar sondas oligonucleotídicas con una estrategia de mosaico solapante para secuenciar regiones diana contiguas de mayor tamaño (aproximadamente 500 bases mostradas como ejemplo).

La Figura 104 muestra oligonucleótidos marcados en fase específicos de diana en mosaico a través de dianas génicas contiguas de 160 pb en un tramo de ADN genómico.

La Figura 105 muestra oligonucleótidos marcados en fase específicos de diana en mosaico a través de dianas génicas contiguas de 160 pb en un tramo de ADN genómico.

La Figura 106 muestra oligonucleótidos marcados en fase específicos de diana en mosaico a través de dianas génicas contiguas de 160 pb en un tramo de ADN genómico.

La Figura 107 muestra oligonucleótidos marcados en fase específicos de diana en mosaico a través de dianas génicas contiguas de 160 pb en un tramo de ADN genómico.

La Figura 108 representa un método para generar construcciones de ácido nucleico monocatenarias quiméricas circulares que comprenden una copia de secuencia desoxirribonucleica de una molécula de ácido ribonucleico diana. Las construcciones circulares son adecuadas para RCA y secuenciación de acuerdo con los métodos de la presente divulgación.

La Figura 109 representa un método para generar construcciones de ácido nucleico monocatenarias quiméricas circulares que comprenden una copia de secuencia desoxirribonucleica de una molécula de ácido ribonucleico diana que contiene supuestas fusiones génicas. Las construcciones circulares son adecuadas para RCA y secuenciación de acuerdo con los métodos de la presente invención.

La Figura 110 representa un método para generar construcciones de ácido nucleico monocatenarias quiméricas circulares que comprenden una copia de secuencia desoxirribonucleica de una molécula de ácido ribonucleico diana que contiene supuestas fusiones génicas. Las construcciones circulares son adecuadas para RCA y secuenciación de acuerdo con los métodos de la presente invención.

La Figura 111 representa un método para generar construcciones de ácido nucleico monocatenarias quiméricas circulares que comprenden una copia de secuencia desoxirribonucleica de una molécula de ácido ribonucleico diana que contiene exones específicos. Las construcciones circulares son adecuadas para RCA y secuenciación de acuerdo con los métodos de la presente invención.

La Figura 112 representa un método para generar construcciones de ácido nucleico monocatenarias quiméricas circulares que comprenden una copia de secuencia desoxirribonucleica de una molécula de ácido ribonucleico diana que contiene exones específicos. Las construcciones circulares son adecuadas para RCA y secuenciación de acuerdo con los métodos de la presente invención.

La Figura 113 representa un método para generar construcciones de ácido nucleico monocatenarias quiméricas circulares que comprenden un segmento de ADN que contiene polimorfismos. Las construcciones circulares son adecuadas para ^rC^ay secuenciación de acuerdo con los métodos de la presente invención.

La Figura 114 representa un método para generar construcciones de ácido nucleico monocatenarias quiméricas circulares que comprenden una secuencia desoxirribonucleica que es complementaria a una secuencia de miARN diana. Las construcciones circulares son adecuadas para RCA y secuenciación de acuerdo con los métodos de la presente invención.

La Figura 115 representa un método para generar construcciones de ácido nucleico monocatenarias quiméricas circulares que comprenden una secuencia desoxirribonucleica que es complementaria a una secuencia de miARN diana. Las construcciones circulares son adecuadas para RCA y secuenciación de acuerdo con los métodos de la presente invención.

La Figura 116 representa un método para generar construcciones de ácido nucleico monocatenarias quiméricas circulares que comprenden una secuencia desoxirribonucleica que es complementaria a una secuencia de miARN diana. Las construcciones circulares son adecuadas para RCA y secuenciación de acuerdo con los métodos de la presente invención.

La Figura 117 representa un método para generar construcciones de ácido nucleico monocatenarias quiméricas circulares que comprenden una secuencia desoxirribonucleica que es complementaria a una secuencia de miARN diana. Las construcciones circulares son adecuadas para RCA y secuenciación de acuerdo con los métodos de la presente invención.

DESCRIPCIÓN DETALLADA DE LA INVENCIÓN

En el presente documento se desvela una colección de diferentes construcciones de ácido nucleico monocatenarias quiméricas circulares. Cada construcción de la colección comprende un primer segmento monocatenario de ADN genómico original de un organismo hospedador y un segundo segmento de ácido nucleico sintético monocatenario que está unido al primer segmento monocatenario y comprende una secuencia nucleotídica que es exógena al organismo hospedador. El segundo segmento de ácido nucleico sintético monocatenario comprende una parte de identificador único, en donde la secuencia nucleotídica tanto de la parte de identificador único como del segmento de ADN genómico original distingue una construcción de ácido nucleico monocatenaria quimérica en la colección de otra construcción de ácido nucleico monocatenaria quimérica en la colección. Las construcciones de ácido nucleico monocatenarias quiméricas de la colección están circularizadas y son adecuadas para amplificación por círculo rodante y/o secuenciación.

La colección contiene generalmente entre 1.000 y 4.000.000.000 de construcciones de ácido nucleico monocatenarias quiméricas circulares. Los métodos para preparar las construcciones de ácido nucleico monocatenarias quiméricas circulares de la colección se describen con detalle posteriormente.

El primer segmento monocatenario de la construcción de ácido nucleico quimérica comprende un segmento de ADN genómico original de un hospedador. Este segmento de ADN genómico original puede ser un fragmento de ácido nucleico que sea un producto directo de la fragmentación del ADN genómico (es decir, sin adición de una o más partes conectoras a los extremos del fragmento), o un fragmento de ácido nucleico de ADN genómico al que se han añadido conectores. El segmento de ADN genómico original puede obtenerse a partir de cualquier genoma, por ejemplo, un genoma de animal, vegetal, protozoo, hongo, bacteria, o virus tal como el genoma de un ser humano, manzano, giardia, levadura, Staphylococcus aureus, o virus del papiloma. El segmento de ADN puede aislarse a partir de cualquier fuente biológica recién preparada, congelada o fijada (por ejemplo, fijada con formalina o embebida en parafina), que incluye, pero no se limita a, tejido, célula, suero, plasma, sangre, o exosomas.

El segundo segmento de ácido nucleico sintético monocatenario de las construcciones de ácido nucleico de la colección está unido covalentemente al primer segmento monocatenario, por ejemplo, mediante un enlace fosfodiéster. El segundo segmento de ácido nucleico sintético monocatenario contiene una secuencia de identificador. En un caso, la secuencia de identificador es un código de barras. El código de barras es generalmente una secuencia de 8-12 bases nucleotídicas que se usa en conjunto con la secuencia del segmento de ADN genómico original para distinguir cada construcción de ácido nucleico de otra en la colección. Cuando los fragmentos de ADN genómico tienen una secuencia similar, es importante que la secuencia de identificador o del código de barras sea suficientemente divergente, de modo que no haya dos construcciones de ácido nucleico iguales. Para colecciones que comprenden aproximadamente 10.000 equivalentes genómicos (los genomas aproximados en 1 ml de ADN no asociado a células), las secuencias de identificador único de 8 nucleótidos contienen una diversidad suficiente (65.536) para garantizar que cada construcción circular sea única. Para colecciones que comprenden aproximadamente 1.000.000 de equivalentes genómicos (los genomas aproximados de células totales en 10 ml de sangre), las secuencias de identificador único de 12 nucleótidos contienen una diversidad suficiente (16.777.216) para garantizar que cada construcción circular sea única. Además, cuando el ADN genómico está fragmentado aleatoriamente, o está fragmentado biológicamente (es decir, como en el ADN no asociado a células), las uniones entre el ADN genómico y el ácido nucleico sintético proporcionarán secuencias únicas adicionales para ayudar a distinguir cada construcción circular.

En algunos casos, la secuencia de identificador comprende uno o más sitios de unión de cebador y/o secuencias de identificador de paciente como se describe posteriormente. Los sitios de unión de cebador se usan no solo para facilitar la amplificación, sino que pueden servir, solos o en combinación con la secuencia de identificador de paciente, como un segmento de secuencia de identificador con la finalidad de distinguir construcciones circulares individuales dentro de la colección. Por consiguiente, la secuencia de identificador del segundo segmento monocatenario de las construcciones de ácido nucleico de la colección puede comprender una secuencia de código de barras, una o más secuencias de cebador, una secuencia de identificador de paciente, o cualquier combinación de las mismas.

Las construcciones de ácido nucleico quiméricas de la colección están circularizadas, es decir, son moléculas de ácido nucleico circularizadas cerradas. En algunos casos, las construcciones circularizadas son completamente monocatenarias. En otros casos, las construcciones circularizadas pueden ser parcialmente bicatenarias o completamente bicatenarias.

En el presente documento también se desvela un método para amplificar moléculas de ácido nucleico. Este método implica proporcionar la colección de diferentes construcciones de ácido nucleico monocatenarias quiméricas circulares como se ha descrito anteriormente, y mezclar la colección con una polimerasa y una pluralidad de cebadores cortos (de 6 a 10 nucleótidos, en donde una parte de dicha secuencia comprende bases aleatorias y/o análogos nucleotídicos; por ejemplo, hexámeros, heptámeros, octámeros aleatorios), para formar una reacción de amplificación. Los uno o más de los cebadores cortos son complementarios a una parte de una o más construcciones de ácido nucleico monocatenarias quiméricas circulares de la colección. La mezcla de reacción de amplificación se somete a uno o más tratamientos de hibridación y extensión, en donde los uno o más cebadores cortos se hibridan con las construcciones de ácido nucleico monocatenarias quiméricas circulares y la polimerasa extiende los cebadores hibridados para producir una pluralidad de productos de extensión. Cada producto de extensión comprende dos o más secuencias lineales en tándem que son complementarias a una construcción de ácido nucleico monocatenaria quimérica de la colección.

La Figura 1 (etapas A-D) proporciona una ilustración a modo de ejemplo del método que se ha descrito anteriormente para amplificar moléculas de ácido nucleico. La Figura 1, etapa A, muestra una construcción de ácido nucleico monocatenaria quimérica circular de una colección y una pluralidad de cebadores hexámeros aleatorios. El primer segmento monocatenario del ADN genómico original de la construcción circular se muestra como una única y fina línea de color negro. Una mutación dentro del segmento de ADN genómico original se indica con (*). La secuencia de identificador único de la construcción circular se muestra como una línea doble. La extensión continua de un cebador hexámero hibridado para amplificar la diana circular se consigue usando una polimerasa capaz de realizar desplazamiento de cadena, por ejemplo, ADN polimerasa Phi29 o similar (representada como un diamante en la Figura 1). Como se muestra en la Figura 1, etapa B, la extensión con polimerasa de un cebador hibridado desplazará opcionalmente al cebador original, creando una cola monocaternaria. Posteriormente uno o más de los cebadores hexámeros pueden hibridarse con la cola monocatenaria, y la extensión mediada por polimerasa de esos cebadores continúa como se muestra en la Figura 1, etapas C y 1D, para formar productos de extensión bicatenarios de longitud variable, conteniendo cada producto de extensión dos o más secuencias lineales en tándem que son complementarias a la construcción circular.

La colección de productos de extensión bicatenarios formados mediante este método de amplificación es adecuada para cualquiera de una amplia gama de protocolos de secuenciación de nueva generación (NGS) (por ejemplo, Pirosecuenciación 454, secuenciación por síntesis Ion Torrent™, secuenciación por ligamiento SOLiD™ o secuenciación mediante los sistemas de síntesis MiSeq™ o HiSeq™). De acuerdo con los protocolos de NGS, los productos de extensión bicatenarios están fragmentados de modo que una o más copias complementarias en tándem del ADN diana se encuentren dentro de un solo fragmento. Los conectores se añaden a los extremos 5' y 3' del ADN fragmentado para permitir la preparación de una genoteca convencional y la generación de moldes usando amplificación por agrupamiento o con perlas. Durante la secuenciación se genera una secuencia de consenso de todas las copias complementarias unidas físicamente de la molécula de ADN original dentro de la diana circular. Dado que estarán presentes mutaciones verdaderas (*) 2 o 3 veces dentro de un fragmento, son fácilmente distinguibles de un error de polimerasa.

De acuerdo con todos los aspectos de la presente invención, la secuenciación de las construcciones de ácido nucleico quiméricas circulares descritas en el presente documento y los productos de extensión de las mismas puede llevarse a cabo usando cualquier método de secuenciación conocido en la técnica, que incluye, pero no se limita a, secuenciación por hibridación con cebador fluorescente, hibridación con balizas moleculares, extensión de cebadores, reacción de detección de ligasa, reacción en cadena de ligasa, pirosecuenciación, secuenciación basada en exonucleasa, secuenciación por síntesis basada en fluorescencia, secuenciación por ligamiento basada en fluorescencia, secuenciación basada en nanoporos y nanotubos, secuenciación por síntesis basada en iones y secuenciación por ligamiento basada en iones. Como se usa en el presente documento, "secuenciación" incluye un método mediante el cual se obtiene la identidad de al menos 10 nucleótidos consecutivos de una diana o molde polinucleotídico.

En algunas divulgaciones, cada construcción de ácido nucleico circular de la colección comprende un primer segmento monocatenario de ADN genómico original de un organismo hospedador y un segundo segmento de ácido nucleico sintético monocatenario que está unido al primer segmento monocatenario y comprende una secuencia nucleotídica que es exógena al organismo hospedador. El segundo segmento de ácido nucleico sintético monocatenario comprende una parte de identificador único y un sitio de unión de cebador primario, en donde la secuencia nucleotídica de la parte de identificador único, el sitio de unión de cebador primario y el segmento de ADN genómico original distinguen una construcción de ácido nucleico monocatenaria quimérica en la colección de otra construcción de ácido nucleico monocatenaria quimérica en la colección. Las construcciones de ácido nucleico monocatenarias quiméricas de la colección están circularizadas y son adecuadas para amplificación por círculo rodante y/o secuenciación.

En el presente documento también se desvela un método para generar copias lineales en tándem de moléculas de ácido nucleico que son adecuadas para secuenciación. Este método implica proporcionar la colección de diferentes construcciones de ácido nucleico monocatenarias quiméricas circulares de la presente divulgación como se ha descrito anteriormente, y mezclar la colección con una polimerasa con actividad de desplazamiento de cadena, y uno o más cebadores primarios, para formar una reacción de extensión por círculo rodante. Los uno o más cebadores primarios son complementarios a una parte de una o más construcciones de ácido nucleico monocatenarias quiméricas circulares de la colección. La mezcla de reacción de extensión por círculo rodante se somete a uno o más tratamientos de hibridación y extensión, en donde los uno o más cebadores se hibridan con las construcciones de ácido nucleico monocatenarias quiméricas circulares, y la polimerasa extiende los cebadores hibridados para producir una pluralidad de productos de extensión. Cada producto de extensión comprende dos o más secuencias lineales en tándem que son complementarias a una construcción de ácido nucleico monocatenaria quimérica de la colección.

La Figura 2, etapas A-C, proporciona una ilustración a modo de ejemplo del método que se ha descrito anteriormente para amplificar moléculas de ácido nucleico. La Figura 2, etapa A, muestra una construcción de ácido nucleico monocatenaria quimérica circular de una colección y un cebador primario hibridado. El primer segmento monocatenario del ADN genómico original de la construcción circular se muestra como una única y fina línea de color negro. Una mutación dentro del segmento de ADN genómico original se indica con (*). La secuencia de identificador único y el sitio de unión de cebador primario de la construcción circular se muestran como una línea ligeramente más gruesa. La extensión continua de un cebador hibridado para amplificar la diana circular se consiguió usando una polimerasa capaz de realizar desplazamiento de cadena, por ejemplo, ADN polimerasa Phi29 o Bst o similares (representada como un diamante en la Figura 2). Como se muestra en la Figura 2, etapa B, la extensión con polimerasa de un cebador hibridado desplazará opcionalmente el cebador original, creando una cola monocaternaria. El producto de extensión se desnaturaliza desde el círculo (véase la Figura 2, etapa C). Se proporcionan uno o más conjuntos de cebador secundarios, en donde cada conjunto de cebador comprende (a) un primer cebador secundario sin metilar que tiene una secuencia nucleotídica que es complementaria a una primera parte del producto de extensión monocatenario formado a partir del cebador primario, y (b) un segundo cebador secundario metilado que tiene una secuencia nucleotídica que es complementaria a una segunda parte del producto de extensión monocatenario. Los productos de extensión monocatenarios se mezclan con los conjuntos de cebador secundarios, una polimerasa que carece de actividad de desplazamiento de cadena, una ligasa y una endonucleasa que escinde tanto el producto de extensión monocatenario como el primer cebador secundario cuando están hibridados entre sí (es decir, la endonucleasa escinde en una secuencia de reconocimiento bicatenaria sin metilar).

El primer y el segundo cebadores secundarios se hibridan con regiones complementarias de los productos de extensión monocatenarios como se muestra en la Figura 2, etapa C. Una polimerasa extiende los cebadores hibridados para formar uniones de ligamiento con cebadores secundarios hibridados corriente abajo. Una ligasa une los cebadores secundarios extendidos entre sí para formar productos de extensión bicatenarios como se muestra en la Figura 2, etapa C. La endonucleasa escinde tanto el producto de extensión como el primer cebador secundario, donde se hibridan para formar fragmentos bicatenarios que contienen copias lineales en tándem de secuencias de ADN genómico diana. El número de secuencias lineales en tándem en los fragmentos de productos de extensión bicatenarios refleja la proporción entre el primer y el segundo cebadores secundarios utilizada en el método que se ha mencionado anteriormente. Estos fragmentos de copia en tándem son adecuados para la secuenciación usando cualquier método de secuenciación conocido en la técnica como se ha descrito anteriormente. Para la secuenciación NGS se añaden conectores para permitir la amplificación convencional por agrupamiento o con perlas y las lecturas de extremos emparejados. La mutación verdadera (*) estará presente 2 o 3 veces y, de ese modo, se distinguirá de un error de la polimerasa.

En el presente documento también se desvela un método para generar copias lineales en tándem de moléculas de ácido nucleico, si la diana estuviera metilada en el ADN genómico original (la base metilada se representa como "m", véase la Figura 3). El proceso es esencialmente el mismo que el que se ha descrito anteriormente, usando Bst polimerasa para la extensión continua del cebador primario hibridado en presencia de endonucleasa de restricción BstUl (CGACG) (Figura 3, etapa B). BstUl escindirá el ADN bicatenario si no está metilado, pero no el ADN híbrido metilado/sin metilar ni el ADN monocatenario sin metilar (Figura 3, etapa B). (Véase Zierhut y Diffley, "Break Dosage, Cell Cycle Stage and DNA Replication Influence DNA Double Strand Break Response", EMBO J. 27(13): 1875-85 (2008)). Dado que la polimerasa genera varias copias de la diana durante la amplificación por círculo rodante, y dado que los sitios CGCG sin metilar son escindidos por BstUl en forma bicatenaria, este proceso selecciona específicamente los fragmentos que están metilados en todos los sitios de BstUl en el ADN diana inicial. Aunque la Figura 3 ilustra este método con la endonucleasa de restricción BstUl, pueden usarse otras endonucleasas que escindan el ADN bicatenario si no está metilado, pero no el ADN híbrido metilado/ sin metilar ni el ADN monocatenario sin metilar para amplificar selectivamente el ADN genómico metilado. Estas endonucleasas incluyen, pero no se limitan a, las enzimas termófilas BstHHI (reconoce GCGC; un isoesquizómero de HhaI), BsiSI (reconoce CCGG; un isoesquizómero de HpaII) y Tail (reconoce ACGT; un isoesquizómero de MaeII). Todas estas enzimas son sensibles a la metilación de la secuencia interna de CpG. La última enzima de esta serie, la enzima de restricción TaqI, es insensible a la metilación en el sitio CpG, de modo que no sería adecuada para la técnica mencionada anteriormente.

En algunos casos, cada construcción de ácido nucleico circular de la colección comprende un primer segmento monocatenario de ADN genómico original de un organismo hospedador unido al segundo segmento de ácido nucleico sintético monocatenario, en donde el segundo segmento monocatenario comprende una o más secuencias específicas de cebador (por ejemplo, una primera y/o segunda partes específicas de cebador de soporte sólido), y opcionalmente, una secuencia de identificador de paciente. En algunos casos, el segundo segmento monocatenario puede contener o no una parte de identificador único. Las construcciones de ácido nucleico monocatenarias quiméricas de la colección están circularizadas y son adecuadas para amplificación por círculo rodante y/o secuenciación como se describe en el presente documento.

La secuencia de identificador de paciente del segundo segmento monocatenario sirve para identificar la fuente del paciente del ADN genómico original. La secuencia de identificador de paciente comprende generalmente de aproximadamente 5 a 8 nucleótidos de longitud y está diseñada para distinguir secuencias que se obtienen a partir de diferentes pacientes. En un caso, las secuencias de identificador de paciente se diferencian entre sí en al menos 3 posiciones, de modo que un error en una sola base en la secuenciación aún permite la identificación positiva de la secuencia de identificador de paciente correcta. En la práctica de laboratorio clínico actual, el procesamiento de muestras por lotes está diseñado generalmente para que sea compatible con formatos de placa de 96 y 384 pocillos, de modo que se procesan 8, 16, 24, 48, 96 o 384 muestras simultáneamente.

También se desvela un sistema que comprende una colección de diferentes construcciones de ácido nucleico monocatenarias quiméricas circulares. Cada construcción de la colección comprende un primer segmento monocatenario de ADN genómico original de un organismo hospedador y un segundo segmento de ácido nucleico monocatenario que está unido al primer segmento monocatenario y comprende una secuencia nucleotídica que es exógena al organismo hospedador. La secuencia nucleotídica del segundo segmento de ácido nucleico monocatenario comprende una primera parte específica de cebador de soporte sólido, una segunda parte específica de cebador de soporte sólido, y una secuencia de identificador de paciente. Las construcciones de ácido nucleico monocatenarias quiméricas de la colección están circularizadas y son adecuadas para amplificación por círculo rodante y/o secuenciación. El sistema comprende además una colección de productos de extensión, comprendiendo cada producto de extensión dos o más secuencias lineales en tándem que son complementarias a la construcción de ácido nucleico monocatenaria quimérica de la colección. Cada producto de extensión en la colección se hibrida con su construcción de ácido nucleico monocatenaria quimérica circular complementaria de la colección. La Figura 4 en la etapa B proporciona una representación a modo de ejemplo de este sistema de la presente divulgación.

Este sistema descrito en el presente documento puede comprender además un soporte sólido que tiene una pluralidad de primeros cebadores oligonucleotídicos inmovilizados. Cada primer cebador oligonucleotídico sobre el soporte sólido tiene una secuencia nucleotídica que es la misma que la secuencia nucleotídica de la primera parte específica de cebador de soporte sólido de las construcciones de ácido nucleico monocatenarias quiméricas de la colección, y que es complementaria a la primera parte específica de cebador de soporte sólido de los productos de extensión. Por consiguiente, uno o más de los primeros cebadores oligonucleotídicos sobre el soporte sólido pueden hibridarse con un producto de extensión de la colección de productos de extensión mediante las primeras partes específicas de cebador de soporte sólido. La Figura 4, etapa C, proporciona una representación a modo de ejemplo de este sistema de la presente divulgación.

El soporte sólido puede prepararse a partir de una amplia variedad de materiales. El sustrato puede ser biológico, no biológico, orgánico, inorgánico o una combinación de cualquiera de éstos, existiendo en forma de partículas, cadenas, precipitados, geles, láminas, tubos, esferas, perlas, recipientes, capilares, almohadillas, cortes, películas, placas, portaobjetos, discos, membranas, etc. El sustrato puede tener cualquier forma conveniente, tal como un disco, cuadrado, círculo, etc. El sustrato es preferentemente plano pero puede adoptar una diversidad de configuraciones superficiales alternativas. Por ejemplo, el sustrato puede contener regiones elevadas o deprimidas en las que se produce la hibridación. El sustrato y su superficie forman preferentemente un soporte rígido sobre el que llevar a cabo las reacciones de secuenciación que se describen en el presente documento.

Las plataformas de soporte sólido para secuenciación de nueva generación disponibles en el mercado usadas para la preparación de moldes pueden usarse en los sistemas y los métodos de la presente invención. Por ejemplo, la celda de flujo Illumina® Flow Cell, Life Technologies® lonSphere™ y perlas para PCR en emulsión, y perlas para PCR en emulsión 454 pueden usarse en el sistema y los métodos de la presente invención. Por consiguiente, la primera parte específica de cebador de soporte sólido de las construcciones de ácido nucleico monocatenarias quiméricas circulares se diseña para que sea la misma que la de los cebadores inmovilizados sobre un soporte sólido de NGS disponible en el mercado. Por lo tanto, los productos de extensión que contienen el complemento de la primera parte específica de cebador de soporte sólido son capaces de hibridarse con cebadores sobre la superficie del soporte sólido de NGS.

Este sistema puede comprender además una colección de oligonucleótidos de reticulación como se muestra en la Figura 5, etapa A. Un oligonucleótido de reticulación es un oligonucleótido que tiene dos o más repeticiones de una secuencia nucleotídica, en donde la secuencia nucleotídica repetida tiene la misma secuencia que al menos una parte del segundo segmento de ácido nucleico monocatenario de las construcciones de ácido nucleico monocatenarias quiméricas en la colección. Por consiguiente, la secuencia nucleotídica repetida del oligonucleótido de reticulación es complementaria a al menos una parte de la secuencia nucleotídica del producto de extensión de la construcción de ácido nucleico quimérica (es decir, una parte del producto de extensión que corresponde al segundo segmento monocatenario). La secuencia nucleotídica repetida puede tener una longitud de aproximadamente 10-25 nucleótidos. Una o más de las repeticiones de la secuencia nucleotídica de cada oligonucleótido de reticulación se hibrida con una secuencia lineal en tándem de un producto de extensión de la colección de productos de extensión como se representa en la Figura 5, etapas B-D, para formar una estructura condensada.

Como se muestra en la Figura 5, etapas E-H, el producto de extensión condensado, unido a uno o más oligonucleótidos de reticulación, puede capturarse sobre un soporte sólido que tiene una pluralidad de primeros cebadores oligonucleotídicos inmovilizados. Como se ha descrito anteriormente, los primeros cebadores oligonucleotídicos sobre el soporte sólido tienen una secuencia nucleotídica que es complementaria a la primera parte específica de cebador de soporte sólido de los productos de extensión (es decir, una secuencia nucleotídica que es la misma que la secuencia nucleotídica de la primera parte específica de cebador de soporte sólido de las construcciones de ácido nucleico monocatenarias quiméricas). Como se muestra en la Figura 5, etapa E, una o más secuencias lineales en tándem de una estructura de producto de extensión condensada puede hibridarse con uno o más primeros cebadores oligonucleotídicos sobre el soporte sólido, inmovilizando de ese modo la estructura condensada. Los oligonucleótidos de reticulación pueden diseñarse para que contengan uniones escindibles que se escindan por vía enzimática (representado como triángulos en la Figura 5, etapas E y F). Las uniones escindibles adecuadas incluyen, pero no se limitan a, ribonucleótidos, desoxiuracilo, un sitio apurínico, y 8-oxoguanina. Por ejemplo, el oligonucleótido de reticulación puede contener un sitio apurínico que se extiende mediante APE 1 endonucleasa, Endo III, Endo IV, Endo VIII, Fpg, o hOGG1. La escisión de los oligonucleótidos de reticulación permite que la estructura condensada se desmorone y las secuencias en tándem individuales del producto de extensión sean capturadas localmente por hibridación con cebadores adyacentes sobre la superficie del soporte sólido, creando una estructura similar a una alfombra (Figura 5, etapa F). Como se muestra en la Figura 5, etapa G, este enfoque garantiza que los cientos a miles de copias complementarias en tándem de la secuencia de ADN genómico diana original se capturen próximas entre sí, y sean adecuadas para secuenciación posterior.

También se desvela un sistema que comprende una colección de diferentes construcciones de ácido nucleico monocatenarias quiméricas circulares. Cada construcción comprende un primer segmento monocatenario de ADN genómico original de un organismo hospedador y un segundo segmento de ácido nucleico monocatenario que está unido al primer segmento monocatenario y comprende una secuencia nucleotídica que es exógena al organismo hospedador. La secuencia nucleotídica del segundo segmento de ácido nucleico monocatenario comprende una primera parte específica de cebador de soporte sólido, una segunda parte específica de cebador de soporte sólido, y una secuencia de identificador de paciente. Las construcciones de ácido nucleico monocatenarias quiméricas de la colección son adecuadas para amplificación por círculo rodante y/o secuenciación. El sistema comprende además uno o más cebadores de amplificación oligonucleotídicos, cada cebador comprende al menos una primera parte de secuencia nucleotídica que es complementaria a la primera parte específica de cebador de soporte sólido o la segunda parte específica de cebador de soporte sólido de las construcciones de ácido nucleico monocatenarias quiméricas de la colección. Por último, este sistema también tiene una polimerasa adecuada para amplificación por círculo rodante.

En la Figura 4, etapa A, se muestran realizaciones a modo de ejemplo de este sistema de la presente divulgación. Las construcciones de ácido nucleico quiméricas circularizadas contienen el segmento de ADN genómico original (línea fina de color negro), una sustitución o mutación de una sola base de interés dentro del segmento de ADN original se indica con un asterisco (*). El segundo segmento monocatenario de las construcciones contiene una primera parte específica de cebador de soporte sólido de la construcción quimérica (representada como una línea gruesa de color negro) y una segunda parte específica de cebador de soporte sólido (representada como una línea doble de color negro). Los cebadores de amplificación adecuados para cebar la amplificación por círculo rodante de las construcciones quiméricas pueden ser complementarios a un segmento de la primera parte específica de cebador de soporte sólido de la construcción, como se muestra en el panel de la izquierda de la Figura 4, etapa A; complementarios a un segmento tanto de la primera como de la segunda partes específicas de cebador de soporte sólido de la construcción quimérica, como se muestra en los paneles de la parte media y de la derecha de la Figura 4, etapa A; o complementarios a una parte de la segunda parte específica de cebador de soporte sólido de la construcción, como se muestra en la Figura 9, etapa A. En este caso, el cebador de amplificación complementario a la segunda parte específica de cebador de soporte sólido de la construcción quimérica se inmoviliza sobre un soporte sólido, que ancla del producto de extensión formado durante la amplificación por círculo rodante directamente al soporte sólido. En otros casos, los cebadores de amplificación pueden comprender una parte adicional que es capaz de anclarse a un soporte sólido, como se muestra en la Figura 4, etapa D, y en la Figura 10, etapa A. La parte adicional puede comprender una secuencia nucleotídica única que sea complementaria a la secuencia nucleotídica de un oligonucleótido de captura inmovilizado sobre el soporte sólido. La parte adicional puede comprender una secuencia nucleotídica que sea complementaria a un primer o segundo cebador oligonucleotídico sólido inmovilizado sobre el soporte sólido. La parte adicional puede ser un resto de captura que quede capturado por un ligando de captura inmovilizado sobre el soporte sólido. No es necesario que el resto de captura y el ligando de captura sean ácidos nucleicos en cuanto a su naturaleza. Por ejemplo, el resto de captura puede ser un grupo biotina o una marca de His, que podría ser capturado por estreptavidina o una matriz de NTA inmovilizadas, respectivamente.

Los uno o más cebadores de amplificación oligonucleotídicos pueden comprender (i) una primera secuencia nucleotídica que sea complementaria al segmento de ADN genómico original de las construcciones de ácido nucleico monocatenarias quiméricas de la colección, (ii) una parte 3' que comprenda un nucleótido o análogo de nucleótido escindible y un grupo de bloqueo que bloquee la extensión mediante polimerasa 3' de dicho cebador de amplificación oligonucleotídico, y (iii) una parte 5' que comprenda un nucleótido o análogo de nucleótido escindible y un grupo de captura, en donde el grupo de captura es capaz de inmovilizarse en un soporte sólido.

Los uno o más cebadores de amplificación oligonucleotídicos pueden comprender (a) un primer cebador de amplificación de oligonucleótidos que tenga (i) una primera secuencia nucleotídica que sea complementaria a una primera parte del segmento de ADN genómico original de las construcciones de ácido nucleico monocatenarias quiméricas de la colección, y (ii) una parte 3' que comprenda un nucleótido o análogo de nucleótido escindible y un grupo de bloqueo que bloquee la extensión mediante polimerasa 3' de dicho primer cebador de amplificación oligonucleotídico, y (b) un segundo cebador de amplificación oligonucleotídico que tenga (i) una primera secuencia nucleotídica que sea complementaria a una segunda parte del segmento de ADN genómico original de las construcciones de ácido nucleico monocatenarias quiméricas de la colección, y (ii) una parte 5' que comprenda un nucleótido o análogo de nucleótido escindible y un grupo de captura, en donde el grupo de captura es capaz de inmovilizarse en un soporte sólido.

El sistema desvelado en el presente documento puede comprender además un soporte sólido que tenga una pluralidad de primeros cebadores oligonucleotídicos inmovilizados. Los primeros cebadores oligonucleotídicos sobre el soporte sólido tienen una secuencia nucleotídica que es la misma que la de la secuencia nucleotídica de la primera parte específica de cebador de soporte sólido de las construcciones de ácido nucleico monocatenarias quiméricas de la colección (véase, por ejemplo, la Figura 6, etapa B). El soporte sólido de este sistema puede comprender además una pluralidad de segundos cebadores oligonucleotídicos inmovilizados que tengan una secuencia nucleotídica que sea complementaria a la secuencia nucleotídica de la segunda parte específica de cebador de soporte sólido de las construcciones de ácido nucleico monocatenarias quiméricas de la colección (véase, por ejemplo, la Figura 5, etapa B). Como se ha descrito anteriormente, las plataformas de soporte sólido de NGS disponibles en el mercado usadas para la preparación de moldes (por ejemplo, celda de flujo Illumina® Flow Cell, Life Technologies IonSphere®, etc.) son adecuadas para los sistemas desvelados en el presente documento.

El sistema descrito en el presente documento también puede comprender una colección de oligonucleótidos de reticulación como se ha descrito anteriormente (es decir, un oligonucleótido que tiene dos o más repeticiones de una secuencia nucleotídica, en donde la secuencia nucleotídica repetida tiene la misma secuencia que al menos una parte del segundo segmento de ácido nucleico monocatenario de las construcciones de ácido nucleico monocatenarias quiméricas en la colección).

La polimerasa de este sistema puede ser una polimerasa de desplazamiento de cadena que sea adecuada para amplificación por círculo rodante. Algunas polimerasas de desplazamiento de cadena a modo de ejemplo incluyen, pero no se limitan a, ADN polimerasa phi29, ADN polimerasa Bst (fragmento grande o 5 '^3 ' exo-), ADN polimerasa Bsu (fragmento grande o 5 '^3 ' exo-), DeepVentR® (exo-) polimerasa, fragmento Klenow (3 '^5 ' exo-), ADN polimerasa I (5 '^3 ' exo-), Transcriptasa inversa M-MuLV, ADN polimerasa VentR® (exo-), y ADN polimerasa PyroPhage 3173. Otras polimerasas de desplazamiento de cadena a modo de ejemplo incluyen las que tienen termoestabilidad y actividad de desplazamiento de cadena, tales como ADN polimerasa SD (una ADN polimerasa Taq mutante) (véase el documento de Publicación de Solicitud de Patente de Estados Unidos n.° 2012/0115145 de Fu, el documento de Patente WO2014/161712 de Ignatov et al., e Ignatov et al., "A Strong Stand Displacement Activity of Thermostable DNA Polymerase Markedly Improves the Results of DNA Amplification", BioTechniques 57:81087 (2014)); polimerasa AptaHotTaq (actividad de polimerasa 5 '^3 ' termoestable con una actividad de endonucleasa de aleta 5'); polimerasas obtenidas a partir de virus y microbios termófilos (véase el documento de Publicación de Solicitud de Patente de Estados Unidos n.° 2012/0083018 de Schoenfeld et al., y el documento de Patente de Estados Unidos n.° 8.093.030 de Schoenfeld et al.); polimerasas obtenidas a partir de Thermus antranikianii y Thermus brockianus tal como se desvela en el documento de Patente WO2006/030455 de Hjorleifsdottir et al., y en el documento de Publicación de Solicitud de Patente de Estados Unidos n.° 2008/0311626 de Hjorleifsdottir et al.; la polimerasa termoestable obtenida a partir de Thermus scotoductus (véase el documento de Patente WO2007/076461 de Rech et al.); y la ADN polimerasa de tipo I obtenida a partir de Bacillus pallidus (véase el documento de Patente de Estados Unidos n.° 5.736.373 de Hamilton). Otras polimerasas de desplazamiento de cadena conocidas en la técnica también son adecuadas para este sistema y los métodos relacionados.

También se desvela en el presente documento un método para secuenciar una pluralidad de moléculas de ácido nucleico usando este sistema. De acuerdo con este método, los cebadores de amplificación oligonucleotídicos hibridados con construcciones de ácido nucleico monocatenarias quiméricas circulares complementarias de la colección se mezclan con la polimerasa para formar una mezcla de reacción de amplificación por círculo rodante. La mezcla de reacción de amplificación por círculo rodante se somete a un tratamiento de extensión, en donde la polimerasa extiende los uno o más cebadores de amplificación oligonucleotídicos hibridados para producir una pluralidad de productos de extensión primarios. Cada producto de extensión primario comprende una o más secuencias lineales en tándem, siendo cada secuencia lineal en tándem complementaria a una construcción de ácido nucleico monocatenaria quimérica circular en la colección. Las construcciones de ácido nucleico monocatenarias quiméricas circulares pueden secuenciarse directamente, por ejemplo, la construcción quimérica circular es el molde para la secuenciación por síntesis. Alternativamente, los productos de extensión primarios formados a partir de la reacción de amplificación por círculo rodante son los moldes usados para la secuenciación. Como se ha indicado anteriormente, para secuenciar las construcciones de ácido nucleico circulares o los productos de extensión primarios de las mismas puede usarse cualquier método de secuenciación conocido en la técnica.

Los productos de extensión primarios pueden estar inmovilizados sobre un soporte sólido antes de la secuenciación. Un soporte sólido adecuado comprende al menos una pluralidad de primeros cebadores oligonucleotídicos que tienen cada uno una secuencia nucleotídica que es la misma que la de la secuencia nucleotídica de la primera parte específica de cebador de soporte sólido de las construcciones de ácido nucleico monocatenarias quiméricas de la colección (es decir, que tienen una secuencia complementaria a la primera parte específica de cebador de soporte sólido de los productos de extensión primarios). Los soportes sólidos adecuados incluyen, pero no se limitan a, los que están disponibles en el mercado y se usan para la preparación de moldes en plataformas de secuenciación de nueva generación, por ejemplo, celda de flujo Illumina®, Life Technologies™ Ion Sphere™. Los productos de extensión primarios se hibridan con los primeros cebadores oligonucleotídicos sobre el soporte sólido y se secuencian sobre el soporte, como se describe con mayor detalle posteriormente.

El soporte sólido puede comprender además una pluralidad de segundos cebadores oligonucleotídicos. Los segundos cebadores tienen una secuencia nucleotídica que es complementaria a la segunda parte de cebador específico de cebador de soporte sólido de las construcciones de ácido nucleico monocatenarias quiméricas. Como se representa en la Figura 9, etapa B, y como se describe con mayor detalle en el presente documento, la amplificación por círculo rodante de la construcción de ácido nucleico quimérica puede cebarse mediante un segundo cebador oligonucleotídico sobre el soporte sólido. Este enfoque puede usarse para anclar el producto de extensión primario directamente al soporte sólido.

Como se representa en la Figura 5, etapas A-G, los oligonucleótidos de reticulación pueden utilizarse para condensar el producto de extensión primario en crecimiento formado a partir de una reacción de amplificación por círculo rodante. Como se muestra en la Figura 5, etapa A, la ADN polimerasa (diamantes rellenos) extiende un cebador de amplificación alrededor de la construcción circular que contiene el segmento genómico original. A medida que la polimerasa continúa la extensión, el producto de extensión primario en crecimiento se condensa por hibridación con regiones repetidas complementarias de oligonucleótidos de reticulación, como se muestra en la Figura 5, etapa B. El proceso continúa como se muestra en la Figura 5, etapas C y D, para generar de cientos a miles de copias complementarias en tándem de ADN diana en una estructura condensada. Mediante la variación del número de oligonucleótidos con diferentes secuencias complementarias, y del número de repeticiones en tándem dentro de un oligonucleótido dado, puede variar el número de bucles o "nodos de reticulación", proporcionando la oportunidad de controlar la "compactación" de la estructura. Como se muestra en la Figura 5, etapa E, el producto de extensión primario condensado puede inmovilizarse sobre un soporte sólido mediante la hibridación del producto de extensión primario con primeros cebadores oligonucleotídicos complementarios. Como se muestra en la Figura 5, etapa E, la estructura condensada se hibrida con cebadores complementarios en pocas posiciones. Los oligonucleótidos de reticulación contienen enlaces escindibles y, después de la escisión, la estructura condensada comienza a separarse (Figura 5, etapa F). Los bucles individuales del producto de extensión primario se capturan localmente por hibridación con los primeros cebadores adyacentes sobre la superficie del soporte sólido, creando una estructura similar a una alfombra (Figura 5, etapa G). Este enfoque garantiza que los cientos a miles de copias en tándem de la diana se capturen próximas entre sí, y sean adecuadas para secuenciación posterior.

La Figura 6 representa un método de secuenciación a modo de ejemplo desvelado en el presente documento. Como se muestra en la Figura 6, etapa A, el proceso comienza con la ^aDⁿpolimerasa (por ejemplo, polimerasa Phi29; diamantes rellenos) que extiende un cebador de amplificación hibridado con un molde de construcción de ácido nucleico quimérica circular para generar un producto de extensión primario. El producto de extensión se hibrida con los primeros cebadores oligonucleotídicos sobre un soporte sólido (Figura 6, etapa B). Como se muestra en la Figura 6, etapa C, el producto de extensión en crecimiento formado a partir de la reacción de amplificación por círculo rodante se captura localmente sobre el soporte sólido mediante hibridación con primeros cebadores oligonucleotídicos adyacentes sobre la superficie, creando una estructura similar a una alfombra. Como se muestra en la Figura 6, etapa D, este enfoque garantiza que los cientos a miles de copias complementarias en tándem del segmento de ADN genómico original se capturen próximas entre sí para secuenciación posterior.

Una vez que el producto de extensión primario se inmoviliza sobre el soporte sólido (Figura 6, etapa D), un cebador de secuenciación se hibrida adyacente al extremo 3' del primer cebador oligonucleotídico sobre el soporte sólido, como se muestra en la Figura 6, etapa E. Opcionalmente, un PNA u oligonucleótido de bloqueo puede hibridarse adyacente al extremo 5' del primer cebador oligonucleotídico, como también se representa en la Figura 6, etapa E. El producto de extensión primario es el molde para la reacción de secuenciación por síntesis que se ceba mediante el cebador de secuenciación, como se representa en la Figura 6, etapa F. La secuenciación continúa hasta que el producto de extensión secundario de secuenciación por síntesis que se está formando ya no puede extenderse más debido al PNA u oligonucleótido de bloqueo (Figura 6, etapa G).

Para secuenciar la cadena opuesta (es decir, para obtener la secuencia de los productos de extensión primarios), se desbloquea el primer cebador oligonucleotídico sobre el soporte sólido. Una polimerasa (diamantes rellenos) con actividad de nucleasa 5 '^3 ' extiende el cebador de secuenciación anclado sobre el soporte sólido mientras digiere el producto de la reacción de secuenciación por síntesis, como se muestra en la Figura 6, etapa H. Como se muestra en la Figura 6, etapa I, la polimerasa (diamantes rellenos) extiende las cadenas hasta que no puede avanzar más debido al PNA u oligonucleótido de bloqueo (línea de rayas anchas). Esto genera copias de longitud única del molde, comprendiendo cada molde una copia de la secuencia de ADN genómico original. Como se muestra en la Figura 6, etapa J, el producto de extensión primario original y el molde circular se desnaturalizan y se retiran por lavado. Un segundo cebador de secuenciación se hibrida con cada cadena de molde de longitud única, como se muestra en la Figura 6, etapa K, y la secuenciación por síntesis se usa para obtener la secuencia del molde inmovilizado, como se muestra en la Figura 6, etapas L y M.

La Figura 7 representa otro método de secuenciación a modo de ejemplo. Este método implica la amplificación por círculo rodante de una construcción de ácido nucleico quimérica circular y la captura del producto de extensión primario sobre un soporte sólido que tiene primeros y segundos cebadores oligonucleotídicos. Como se muestra en la Figura 7, etapa A, una ADN polimerasa de desplazamiento de cadena (diamante relleno) extiende un cebador de amplificación en un molde circularizado para generar un producto de extensión primario monocatenario. Los primeros cebadores oligonucleotídicos sobre la superficie del soporte sólido contienen un grupo de bloqueo extraíble en su extremo 3' que hace que sean incapaces de extenderse durante el proceso de amplificación por círculo rodante (Figura 7, etapa B). Un grupo de bloqueo es un resto químico que evita que una polimerasa u otra enzima amplifiquen, extiendan o reaccionen con el oligonucleótido de manera productiva. En este ejemplo, el grupo de bloqueo evita la extensión mediante polimerasa del extremo 3'. Los grupos de bloqueo adecuados incluyen, pero no se limitan a, espaciadores C3, espaciadores C18, nucleótidos finalizadores, derivados de 2'-O-metil-ribonucleótido, fosfato en 3' u otras modificaciones de los restos OH en 3' o 2'. El propio grupo de bloqueo puede escindirse, tal como mediante el uso de nucleótidos finalizadores reversibles, o fosfatos en 3', o el grupo de bloqueo y, opcionalmente, algunos nucleótidos adicionales pueden retirarse escindiendo un enlace escindible que a continuación libera un extremo OH 3' libre. Los enlaces escindibles adecuados incluyen, pero no se limitan a, ribonucleótidos, desoxiuracilo, un sitio apurínico y 8-oxoguanina. Como se muestra en la Figura 7, etapa C, a medida que la amplificación por círculo rodante continúa generando un producto de extensión primario en crecimiento, el producto se captura localmente mediante hibridación con primeros cebadores oligonucleotídicos adyacentes sobre la superficie de soporte sólido creando una estructura similar a una alfombra. Este enfoque garantiza que los cientos a miles de copias en tándem de la diana se capturen próximas entre sí sobre la superficie de soporte sólido (Figura 7, etapa D).

Como se muestra en la Figura 7, etapa E, el grupo de bloqueo se retira de los primeros cebadores oligonucleotídicos hibridados con el producto de extensión primario sobre el soporte sólido. El grupo de bloqueo se puede retirar por escisión de un enlace escindible. Los enlaces escindibles de ribonucleótido pueden escindirse usando RNasaH; los enlaces escindibles de desoxiuracilo pueden escindirse usando UDG y endonucleasa AP, o usando UDG, Endo VIII, y quinasa T4; los enlaces escindibles de sitio apurínico pueden escindirse usando Tth Endo IV, Endo IV, o endonucleasa AP; y los enlaces escindibles de 8-oxoguanina pueden escindirse con Fgp. Una vez que el cebador está desbloqueado, se extiende copiando de ese modo el producto de extensión primario en cientos a miles de posiciones sobre el soporte sólido usando una polimerasa (diamantes rellenos) que carece de actividad de nucleasa 5 '^3 ' (Figura 7, etapa F). Esto genera productos de extensión secundarios de longitud única del molde circularizado. Como se muestra en la Figura 7, etapa G, el producto de extensión primario y el molde circular se desnaturalizan y se retiran mediante lavado para hacer que los productos de extensión secundarios resultantes del molde sean adecuados para secuenciación posterior, como se representa en la Figura 8, etapas A-I.

La Figura 8 ilustra la secuenciación de diana amplificada por círculo rodante (por ejemplo, productos de extensión secundarios) capturada sobre un soporte sólido que tiene tanto primeros como segundos cebadores oligonucleotídicos. La Figura 8, etapa A, muestra los productos de extensión secundarios de longitud única generados a partir de la extensión mediada por polimerasa de productos de extensión primarios hibridados, como se describe en la Figura 7. El proceso de secuenciación comienza con la hibridación de cebadores de secuenciación con los productos de extensión secundarios, como se muestra en la Figura 8, etapa A. La secuenciación por síntesis se usa para obtener la secuencia de los productos de extensión secundarios inmovilizados (Figura 8, etapa B). La secuenciación continúa hasta que los productos de extensión alcanzan el final de los primeros cebadores oligonucleotídicos anclados (Figura 8, etapa C). Los productos de secuenciación por síntesis se desnaturalizan de los primeros cebadores oligonucleotídicos anclados y los productos de extensión secundarios monocatenarios se hibridan con los segundos cebadores oligonucleotídicos sobre el soporte sólido, como se muestra en la Figura 8, etapa D. Los productos de extensión secundarios se copian extendiendo los segundos cebadores oligonucleotídicos hibridados para generar copias de longitud completa de los productos de extensión secundarios, es decir, productos de extensión terciarios (Figura 8, etapa E). Los productos de extensión secundarios se escinden, se desnaturalizan y se retiran por lavado (Figura 8, etapas E-F), dejando los productos de extensión terciarios anclados, adecuados para secuenciación posterior. Un cebador de secuenciación se hibrida con los productos de extensión terciarios (Figura 8, etapa G) y se lleva a cabo secuenciación por síntesis para obtener la secuencia de los productos terciarios, como se muestra en la Figura 8, etapas H e I.

La secuenciación de los productos de extensión secundarios y terciarios puede conseguirse usando secuenciación por síntesis como se describe y se representa en el presente documento. La secuenciación por síntesis incluye secuenciación por síntesis basada en fluorescencia y secuenciación por síntesis basada en iones. También pueden usarse otros métodos de secuenciación adecuados, incluyendo, por ejemplo y sin limitación, hibridación con cebador fluorescente, hibridación con balizas moleculares, extensión de cebadores, secuenciación basada en exonucleasa, reacción de detección de ligasa, reacción en cadena de ligasa, pirosecuenciación, secuenciación por ligamiento basada en fluorescencia, secuenciación basada en nanoporos y nanotubos y secuenciación por ligamiento basada en iones.

La Figura 9 representa otro método de secuenciación a modo de ejemplo de acuerdo con la presente divulgación. Como se muestra en la Figura 9, etapa A, este caso implica la hibridación directa de la construcción de ácido nucleico quimérica circular con un segundo cebador oligonucleotídico sin bloquear sobre el soporte sólido. El segundo cebador sirve como un cebador de amplificación, cebando la amplificación por círculo rodante de la construcción circular. El producto de extensión primario que se genera está anclado directamente al soporte sólido (Figura 9, etapa A). El producto de extensión primario generado mediante amplificación por círculo rodante se hibrida con primeros cebadores oligonucleotídicos sobre el soporte sólido que contiene un grupo de bloqueo 3' extraíble, como se muestra en la Figura 9, etapas B y C, generando de ese modo múltiples estructuras de "bucle similar a una alfombra". El grupo de bloqueo 3' de los primeros cebadores se retira (Figura 9, etapa D), permitiendo que los primeros cebadores puedan extenderse mediante una polimerasa adecuada (por ejemplo, una polimerasa que carece de actividad de nucleasa 5 '^3 ') para generar una superficie formada por cientos a miles de productos de extensión secundarios de longitud única unidos covalentemente a la superficie del soporte sólido (Figura 9, etapa E). Como se muestra en la Figura 9, etapas E-F, el tratamiento de la superficie con un reactivo o enzima de escisión específico de sitio que escinde el primer cebador, seguido de una etapa de desnaturalización, libera el producto de extensión primario, dejando los productos de extensión secundarios unidos covalentemente, que son adecuados para secuenciación posterior, como se muestra y se describe en la Figura 8, etapas A-I.

La Figura 10 representa otro método de secuenciación a modo de ejemplo. En este caso, el cebador de amplificación comprende una cola monocatenaria corta, es decir, una parte adicional que está capturada sobre el soporte sólido. Como se representa en la Figura 10, etapa A, la parte adicional puede comprender una secuencia nucleotídica que es complementaria a la secuencia nucleotídica de una sonda o cebador de captura sobre la superficie del soporte sólido. La hibridación de la parte adicional con su sonda o cebador de captura complementario ancla directamente el producto de extensión primario formado mediante amplificación por círculo rodante al soporte sólido. A medida que la amplificación por círculo rodante continúa generando un producto de extensión primario en crecimiento que comprende copias complementarias en tándem de la estructura quimérica circular, el producto de extensión primario se captura localmente por hibridación con los primeros cebadores oligonucleotídicos bloqueados 3' sobre la superficie creando múltiples estructuras de bucle similar a una alfombra sobre la superficie (Figura 10, etapas B y C). Los primeros cebadores se desbloquean (Figura 10, etapa D), y se extienden con una polimerasa que carece de actividad de nucleasa 5 '^3 ' para formar múltiples productos de extensión secundarios que tienen una longitud uniforme (Figura 10, etapa E). La desnaturalización libera el producto de extensión primario y deja atrás productos de extensión secundarios unidos covalentemente que tienen el mismo sentido que los moldes circularizados originales y todos terminan con una secuencia de unión de cebador de secuenciación definida en sus extremos 3'. Los productos de extensión secundarios unidos covalentemente son moldes adecuados para secuenciación, como se muestra en la Figura 8.

La Figura 11 ilustra otro método a modo de ejemplo. En la Figura 11, etapa A, una ADN polimerasa Phi29 (diamantes rellenos) extiende el cebador de amplificación en el molde circular quimérico para generar un producto de extensión primario monocatenario corto. La polimerasa y el producto de extensión primario se desnaturalizan del molde circular. Como se muestra en la Figura 11, etapa B, el producto de extensión primario se hibrida con los primeros cebadores sobre un soporte sólido. El producto de extensión primario se copia por extensión con polimerasa de los primeros cebadores oligonucleotídicos inmovilizados en múltiples posiciones (diamantes rellenos). Las polimerasas adecuadas incluyen polimerasa que carece de actividad de proteasa 5 '^3 ', como se ha descrito anteriormente. Esto genera productos de extensión secundarios de longitud única (Figura 11, etapa C). El producto de extensión primario se desnaturaliza y se retira por lavado, como se muestra en la Figura 11, etapa D. Los productos de extensión secundarios monocatenarios restantes se amplifican usando un proceso de amplificación de grupos en donde los productos de extensión secundarios se hibridan con segundos cebadores oligonucleotídicos sobre el soporte sólido como se muestra en la Figura 11, etapa E. Los segundos cebadores se extienden con polimerasa (Figura 11, etapa F) para formar productos extensión terciarios. Después de la desnaturalización (Figura 11, etapa G), los productos de extensión secundarios y terciarios se hibridan con primeros y segundos cebadores sobre el soporte sólido (Figura 11, etapa H). Los cebadores hibridados se extienden con polimerasa para formar copias de los productos de extensión secundarios y terciarios, como se muestra en la Figura 11I. Los productos de extensión se desnaturalizan, y el proceso se repite para generar suficientes moldes para secuenciación (Figura 11, etapa J), usando cada cadena el método que se representa en la Figura 8. Los medios alternativos para formar superficies con copias idénticas unidas covalentemente del amplicón de RCA limitado (corto) incluyen amplificación Sequoia (documento de Patente WO2013/012440 de Barany et al.) y amplificación Wildfire (Ma et al., "Isothermal Amplification Method for Next-Generation Sequencing", Proc Natl Acad Sci USA 10(35):14320-3 (2013)).

La Figura 12 ilustra otro método de secuenciación a modo de ejemplo, similar al presentado en la Figura 11. En la Figura 12, etapa A, una ADN polimerasa Phi29 o Bst (diamantes rellenos) extiende el cebador de amplificación sobre el molde circular quimérico para generar un producto de extensión primario monocatenario largo. La polimerasa y el producto de extensión primario se desnaturalizan del molde circular. Como se muestra en la Figura 12, etapa B, el producto de extensión primario se hibrida con múltiples primeros cebadores en más de un pocillo o área sobre un soporte sólido. Dado que el producto de extensión primario es largo, puede extenderse en múltiples pocillos o áreas específicas sobre la superficie sólida que tiene cebadores. La ventaja de esta propiedad de productos de extensión largos es que se secuenciará la misma diana en múltiples áreas o pocillos vecinales, proporcionando de ese modo una verificación adicional de una mutación de baja abundancia. El producto de extensión primario se copia mediante extensión con polimerasa de los primeros cebadores oligonucleotídicos inmovilizados en múltiples posiciones (diamantes rellenos) como se muestra en la Figura 12, etapa C. Las polimerasas adecuadas incluyen polimerasa que carece de actividad de proteasa 5'^3', como se ha descrito anteriormente. Esto genera productos de extensión secundarios de longitud única, excepto cuando se hace un puente entre pocillos en donde se generan productos de extensión repetidos en tándem (Figura 12, etapas C y D). El producto de extensión primario se desnaturaliza y se retira por lavado, como se muestra en la Figura 12, etapa E. Los productos de extensión secundarios monocatenarios restantes se amplifican usando un proceso de amplificación de grupos, en donde los productos de extensión secundarios se hibridan con segundos cebadores oligonucleotídicos sobre el soporte sólido, como se muestra en la Figura 11, etapas E-I. Los productos de extensión se desnaturalizan, y el proceso se repite para generar suficiente molde para secuenciación (véase la Figura 11, etapa J), usando cada cadena el método que se representa en la Figura 8.

En el presente documento también se desvelan métodos para preparar las construcciones de ácido nucleico monocatenarias quiméricas circulares que son un componente de los sistemas y los métodos que se describen en el presente documento. A continuación se describen diversos métodos a modo de ejemplo y se representan en las figuras adjuntas.

Un método adecuado para preparar las construcciones de ácido nucleico monocatenarias quiméricas circulares implica proporcionar una muestra que contiene uno o más segmentos de ADN genómico diana. Los segmentos de ^aDⁿgenómico diana pueden contener potencialmente una o más diferencias de bases o uno o más restos metilados de interés para detección. El método implica además

la provisión de una o más primeras sondas oligonucleotídicas, comprendiendo cada primera sonda oligonucleotídica (a) una parte específica de diana 5', (b) una parte específica de diana 3', y (c) una parte adicional. La parte adicional es una secuencia nucleotídica que comprende (i) una secuencia de identificador de paciente, (ii) una primera parte específica de cebador de soporte sólido, y (iii) una segunda parte específica de cebador de soporte sólido. La muestra y las una o más primeras sondas oligonucleotídicas se ponen en contacto en condiciones eficaces para que la parte específica de diana 3' de una primera sonda oligonucleotídica se hibride de forma específica de acuerdo con las bases con un extremo 3' complementario de un segmento de ADN genómico diana, y para que la parte específica de diana 5' de la primera sonda oligonucleotídica se hibride de forma específica de acuerdo con las bases con un extremo 5' complementario de un segmento de ADN genómico diana, si estuvieran presentes en la muestra. Después de la hibridación, se generan una o más uniones competentes para ligamiento adecuadas para acoplar los extremos 3' y 5' del segmento de ADN genómico diana hibridado con la primera sonda oligonucleotídica y se liga el segmento de ADN genómico diana junto a las una o más uniones de ligamiento para formar una construcción de ácido nucleico monocatenaria quimérica circular de la colección.

La Figura 13, etapas A-E, muestra un proceso a modo de ejemplo para producir construcciones "diana" de ácido nucleico monocatenarias quiméricas circulares adecuadas para secuenciación como se ha descrito anteriormente. En este caso, los segmentos genómicos originales comprenden segmentos de ADN no asociado a células (ADNcf) que tienen una longitud media de 160 pb, o segmentos de ADN genómico cortados en fragmentos de aproximadamente 160 pb ("oligonucleótido diana" o "segmento de ADN"). El proceso comienza con el ligamiento de conectores cortos a los segmentos de ADN (barras gruesas de color negro, Figura 13, etapa A). Como se muestra en la Figura 13, etapa B, las sondas oligonucleotídicas que contienen secuencias complementarias a los extremos 5' y 3' del segmento de ADN diana y complementarias al conector 3' se hibridan con los segmentos de ADN. La región en bucle cerca del extremo 3' del oligonucleótido de ADN diana en la Figura 13, etapa B, es una región del oligonucleótido diana que no es complementaria a la sonda oligonucleotídica. Como se muestra en esta Figura, las regiones pequeñas de no complementariedad entre el segmento de oligonucleótido diana y la sonda oligonucleotídica no influyen en el proceso de formación de construcciones quiméricas circulares.

La parte adicional de la sonda oligonucleotídica (mostrada como una barra gruesa de color negro) también puede contener una secuencia de identificador único, una secuencia de identificador de paciente, una secuencia de unión de cebador, y/o un enlace escindible (Figura 13, etapa B, panel de la izquierda, el enlace escindible está representado dentro de la barra gruesa marcado como "U"). La sonda oligonucleotídica también puede contener un grupo de bloqueo en un extremo (Figura 13, etapa B, panel de la derecha, la sonda tiene un grupo de bloqueo 5'). Como se muestra en la Figura 13, etapa C, una polimerasa (diamante relleno) extiende el extremo 3' del conector corto hibridado del segmento de ADN para copiar la parte adicional de la sonda oligonucleotídica. La polimerasa usada en este caso puede comprender actividad de exonucleasa, por ejemplo, actividad de exonucleasa de 5' a 3' o actividad de exonucleasa de 3' a 5'. Después de la extensión, una nucleasa 5' provoca la escisión en una base solapante 5' de emparejamiento del ADN diana para retirar la región de conector 5', dejando de ese modo fosfato 5' competente para ligamiento. La polimerasa también extiende el extremo 3' de la sonda oligonucleotídica usando el segmento de ADN diana como molde (Figura 13, etapa C), pero no escinde el grupo de bloqueo (Figura 13, etapa C, lado izquierdo). En la Figura 13, etapa D (panel de la izquierda), una ligasa (círculo relleno) sella covalentemente la unión de ligamiento entre los extremos 3' y 5' del segmento de ADN genómico diana extendido, y los extremos 3' y 5' de la sonda oligonucleotídica extendida para crear productos de ligamiento circulares. Se introduce una mella en el enlace escindible (por ejemplo, escisión con UDG de dU, triángulo relleno) de la sonda oligonucleotídica circularizada, para hacer que la sonda oligonucleotídica sea susceptible de digestiones por exonucleasa (Figura 13, etapa E, panel de la izquierda). Como se muestra en la Figura 13, etapa D, panel de la derecha, una ligasa (círculo relleno) sella covalentemente la unión de ligamiento entre los extremos 3' y 5' del segmento de ADN genómico diana extendido; sin embargo, el grupo de bloqueo 5' en la sonda oligonucleotídica evita la circularización de la sonda oligonucleotídica. Como se muestra en la Figura 13, etapa E, la exonucleasa o exonucleasas digieren todos los productos oligonucleotídicos no ligados o con mellas (es decir, sondas oligonucleotídicas) dejando solo las construcciones de ácido nucleico monocatenarias circulares deseadas que comprenden el segmento de ADN diana original acoplado a la parte adicional que contiene, por ejemplo, una secuencia de identificador único, una secuencia de unión de cebador, o una secuencia de identificador de paciente. Como se ha descrito anteriormente, el producto circularizado resultante es adecuado para amplificación por círculo rodante y secuenciación circular.

El proceso que se representa en la Figura 14, etapas A-E es esencialmente el mismo que el que se muestra en la Figura 13, etapas A-E, aunque, sin embargo, la sonda oligonucleotídica comprende un grupo de bloqueo (3'-Blk) en su extremo 3', uno o más enlaces escindibles ("r"), una secuencia de unión de cebador, y un grupo de captura 5' ("Z") opcional (véase la Figura 14, etapa B). Una polimerasa (diamante relleno) extiende el extremo 3' del conector corto hibridado del segmento de ADN para copiar la parte adicional de la sonda oligonucleotídica. La escisión con nucleasa del extremo 5' del segmento de ADN en una base de emparejamiento solapante genera un fosfato 5' competente para ligamiento (Figura 14, etapa C). En la Figura 14, etapa D, una ligasa (círculo relleno) sella covalentemente el extremo extendido para crear un producto de ligamiento diana circular. El grupo de bloqueo 3' de la sonda oligonucleotídica evita la extensión de la sonda oligonucleotídica. Posteriormente, el grupo de bloqueo se retira por escisión en el enlace escindible, por ejemplo, escisión con RNasa (triángulo relleno) de ribonucleótido "r" (Figura 14, etapa D). Como se muestra en la Figura 14, etapa E, la polimerasa (diamante relleno) con actividad de desplazamiento de cadena extiende el extremo 3' liberado de la sonda oligonucleotídica para iniciar la amplificación por círculo rodante. El producto de extensión primario formado mediante amplificación por círculo rodante es adecuado para secuenciación. El grupo Z 5' opcional puede capturarse sobre un soporte sólido antes o después de la amplificación por círculo rodante. Una vez capturado, el producto de ligamiento circular unido a cebador o la extensión del mismo pueden liberarse del soporte sólido mediante escisión en el enlace escindible, ya sea antes o después de la amplificación por círculo rodante.

La Figura 15 y la Figura 17 muestran un proceso similar al que se representa en la Figura 13 para producir construcciones "diana" de ácido nucleico monocatenarias quiméricas circulares adecuadas para secuenciación. El ADN genómico diana se obtiene a partir de ADNcf con una longitud media de 160 pb o ADN genómico cortado en fragmentos de aproximadamente 160 pb. El proceso comienza con el ligamiento de conectores cortos a los segmentos de ADN (barras gruesas de color negro, Figura 15, etapa A, y Figura 17, etapa A). Como se muestra en la Figura 15, etapa B, y en la Figura 17, etapa B, las sondas oligonucleotídicas que contienen secuencias complementarias a los extremos 5' y 3' del segmento de ADN y complementarias al conector 3' del segmento de ADN se hibridan con los segmentos de ADN diana. En el caso representado en la Figura 15, etapa B, la sonda oligonucleotídica contiene una región, es decir, una parte de secuencia nucleotídica, que no es complementaria al extremo 3' del oligonucleótido diana (parte en bucle cerca del extremo 3' de la sonda oligonucleotídica en la Figura 15, etapa B). Además, el extremo 5' del oligonucleótido diana, incluyendo el conector, no es complementario a la sonda oligonucleotídica, formando de ese modo una aleta. En la divulgación de la Figura 17, etapa B, tanto la sonda oligonucleotídica como el oligonucleótido diana contienen partes de secuencia nucleotídica que no son complementarias al oligonucleótido diana o de la sonda, respectivamente. Estas regiones no complementarias se representan como una región en bucle cerca del extremo 3' de la sonda oligonucleotídica y una región en bucle cerca del extremo 5' del oligonucleótido diana (Figura 17, etapa B). Estas regiones no influyen en el proceso general de formación de las construcciones de ácido nucleico circularizadas.

La parte adicional de las sondas oligonucleotídicas (mostrada como una barra gruesa de color negro) puede contener una secuencia de identificador único, una secuencia de identificador de paciente, una secuencia de unión de cebador, y/o un enlace escindible (representado dentro de la barra gruesa como "U" (Figuras 15, etapa B y 17, etapa B, panel de la izquierda). Las sondas oligonucleotídicas también puede contener un grupo de bloqueo en un extremo (Figura 15, etapa B y Figura 17, etapa B, panel de la derecha; grupo de bloqueo en el extremo 5' de la sonda oligonucleotídica). Como se muestra en las Figuras 15, etapa C, y 17, etapa C, la polimerasa (diamante relleno) extiende el extremo 3' del conector corto hibridado del segmento de ADN para copiar la parte adicional de la sonda oligonucleotídica. La polimerasa usada en este caso puede comprender actividad de exonucleasa, por ejemplo, actividad de exonucleasa de 5' a 3' o actividad de exonucleasa de 3' a 5'. Después de la extensión, una nucleasa 5' provoca la escisión en una base solapante 5' de emparejamiento del ADN diana para retirar la región del conector en el extremo, dejando de ese modo fosfato 5' competente para ligamiento (Figura 15, etapa C, y Figura 17, etapa C). La polimerasa también extiende el extremo 3' de la sonda oligonucleotídica usando el segmento de ADN diana como molde (Figura 15, etapa C, y Figura 17, etapa C). El grupo de bloqueo en el extremo 5' de la sonda (Figuras 15, etapa C, y 17, etapa C, lado izquierdo) no está escindido. En la Figura 15, etapa D, y en la Figura 17, etapa D (panel de la izquierda), una ligasa (círculo relleno) sella covalentemente la unión de ligamiento entre los extremos 3' y 5' del segmento de ADN genómico diana extendido, y los extremos 3' y 5' de la sonda oligonucleotídica extendida para crear productos de ligamiento circulares. Se introduce una mella en el enlace escindible (por ejemplo, escisión con UDG de dU, triángulo relleno) de la sonda oligonucleotídica circularizada, para hacer que la sonda oligonucleotídica sea susceptible de digestiones con exonucleasa (Figura 15, etapa E, y Figura 17, etapa E, panel de la izquierda). Como se muestra en las Figuras 15, etapa D, y 17, etapa D, panel de la derecha, una ligasa (círculo relleno) sella covalentemente la unión de ligamiento entre los extremos 3' y 5' del segmento de ADN genómico diana extendido; sin embargo, el grupo de bloqueo 5' en la sonda oligonucleotídica evita la circularización de la sonda oligonucleotídica. Como se muestra en la Figura 15, etapa E, y en la Figura 17, etapa E, la exonucleasa o exonucleasas digieren todos los productos oligonucleotídicos no ligados o con mellas (es decir, sondas oligonucleotídicas) dejando solo las construcciones de ácido nucleico monocatenarias circulares deseadas que comprenden el segmento de ADN diana original acoplado a la parte adicional que contiene, por ejemplo, una secuencia de identificador único, una secuencia de unión de cebador, o una secuencia de identificador de paciente. Como se ha descrito anteriormente, el producto circularizado resultante es adecuado para amplificación por círculo rodante y secuenciación circular.

El proceso representado en las Figuras 16 y 18 es esencialmente el mismo que el que se muestra en las Figuras 15 y 17, respectivamente, aunque, sin embargo, la sonda oligonucleotídica comprende un grupo de bloqueo (3'-Blk) en su extremo 3', uno o más enlaces escindibles, una secuencia de unión de cebador, y un grupo de captura 5' ("Z") opcional (véase la Figura 16, etapa B, y la Figura 18, etapa B). Una polimerasa (diamante relleno) extiende el extremo 3' del conector corto hibridado del segmento de ADN para copiar la parte adicional de la sonda oligonucleotídica. La escisión con nucleasa del extremo 5' del segmento de ADN en una base de emparejamiento solapante genera un fosfato 5' competente para ligamiento (Figura 16, etapa C, y Figura 18, etapa C). En la Figura 16, etapa D, y en la Figura 18, etapa D, una ligasa (círculo relleno) sella covalentemente el extremo extendido para crear un producto de ligamiento circular. El grupo de bloqueo 3' de la sonda oligonucleotídica evita la extensión de la sonda oligonucleotídica. Posteriormente, el grupo de bloqueo se retira por escisión en el enlace escindible, por ejemplo, escisión con RNasa (triángulo relleno) de ribonucleótido "r". Como se muestra en las Figuras 16, etapa E, y 18, etapa E, la polimerasa (diamante relleno) con actividad de desplazamiento de cadena extiende el extremo 3' liberado de la sonda oligonucleotídica para iniciar la amplificación por círculo rodante. El producto de extensión primario formado mediante amplificación por círculo rodante es adecuado para secuenciación. El grupo Z 5' opcional puede capturarse sobre un soporte sólido antes o después de la amplificación por círculo rodante. Una vez capturado, el producto de ligamiento circular unido a cebador o la extensión del mismo pueden liberarse del soporte sólido mediante escisión en el enlace escindible, ya sea antes o después de la amplificación por círculo rodante.

Las Figuras 19 y 21 muestran un proceso similar para producir construcciones "diana" de ácido nucleico monocatenarias quiméricas circulares adecuadas para secuenciación como se describe con referencia a las Figuras 13, 15, y 17 mencionadas anteriormente. El ADN genómico diana se obtiene a partir de ADNcf con una longitud media de 160 pb o ADN genómico cortado en fragmentos de aproximadamente 160 pb. En este caso, el proceso comienza con la adición mediada por transferasa terminal de colas de secuencia nucleotídica corta al extremo 3' de las cadenas de oligonucleótidos diana (barras gruesas de color negro en los extremos 3' de los oligonucleótidos diana, Figuras 19, etapa A, y 21, etapa A). Como se muestra en la Figura 19, etapa B, y en la Figura 21, etapa B, las sondas oligonucleotídicas que contienen secuencias complementarias a los extremos 5' y 3' del segmento de ADN y complementarias al conector 3' del segmento de ADN se hibridan con los segmentos de ADN diana. En el caso representado en la Figura 19, etapa B, el oligonucleótido de ADN contiene una región, es decir, una parte de secuencia nucleotídica, en su extremo 3' que no es complementaria al oligonucleótido de la sonda (parte en bucle cerca del extremo 3' del oligonucleótido diana en la Figura 19, etapa B). Además, el extremo 5' del oligonucleótido diana no es complementario a la sonda oligonucleotídica, formando de ese modo una aleta. En el caso de la Figura 21, etapa B, la sonda oligonucleotídica contiene una parte de secuencia nucleotídica que no es complementaria al oligonucleótido diana. Esta región no complementaria se representa como una región en bucle cerca del extremo 3' de la sonda oligonucleotídica. El extremo 5' del oligonucleótido diana en la Figura 21, etapa B, no es complementario a la sonda oligonucleotídica, formando una aleta adecuada para la escisión con nucleasa. Estas regiones de no complementariedad entre el oligonucleótido diana y el oligonucleótido de la sonda no influyen en el proceso general de formación de construcciones de ácido nucleico circularizadas.

La parte adicional de las sondas oligonucleotídicas (mostrada como una barra gruesa de color negro) puede contener una secuencia de identificador único, una secuencia de identificador de paciente, una secuencia de unión de cebador, y/o un enlace escindible (dentro de la barra gruesa marcado como "U") (Figuras 19, etapa B, y 21, etapa B, panel de la izquierda). Las sondas oligonucleotídicas también puede contener un grupo de bloqueo en un extremo (por ejemplo, las Figuras 19, etapa B, y 21, etapa B, panel de la derecha, muestran un grupo de bloqueo en el extremo 5' de la sonda oligonucleotídica). Como se muestra en la Figura 19, etapa C, y en la Figura 21, etapa C, la polimerasa (diamante relleno) extiende el extremo 3' del conector corto hibridado del segmento de ADN para copiar la parte adicional de la sonda oligonucleotídica. La polimerasa usada en este caso puede comprender actividad de exonucleasa, por ejemplo, actividad de exonucleasa de 5' a 3' o actividad de exonucleasa de 3' a 5'. Después de la extensión, una nucleasa 5' provoca la escisión en una base solapante 5' de emparejamiento del ADN diana para retirar la región del conector en el extremo, dejando de ese modo fosfato 5' competente para ligamiento. La polimerasa también extiende el extremo 3' de la sonda oligonucleotídica usando el segmento de ADN diana como molde (Figuras 19, etapa C, y 21, etapa C). El grupo de bloqueo en el extremo 5' de la sonda (Figuras 19, etapa C, y 21, etapa C, lado de la derecha) no está escindido. En la Figura 19, etapa D, y en la Figura 21, etapa D (panel de la izquierda), una ligasa (círculo relleno) sella covalentemente la unión de ligamiento entre los extremos 3' y 5' del segmento de ADN genómico diana extendido, y los extremos 3' y 5' de la sonda oligonucleotídica extendida para crear productos de ligamiento circulares. Se introduce una mella en el enlace escindible (por ejemplo, escisión con UDG de dU, triángulo relleno) de la sonda oligonucleotídica circularizada para hacer que la sonda oligonucleotídica sea susceptible de digestión con exonucleasa (Figuras 19, etapa E, y 21, etapa E, panel de la izquierda). Como se muestra en las Figuras 19, etapa D, y 21, etapa D, panel de la derecha, una ligasa (círculo relleno) sella covalentemente la unión de ligamiento entre los extremos 3' y 5' del segmento de ADN genómico diana extendido; sin embargo, el grupo de bloqueo 5' en la sonda oligonucleotídica evita la circularización de la sonda oligonucleotídica. Como se muestra en las Figuras 19, etapa E, y 21, etapa E, la exonucleasa o exonucleasas digieren todos los productos oligonucleotídicos no ligados o con mellas (es decir, sondas oligonucleotídicas) dejando solo las construcciones de ácido nucleico monocatenarias circulares deseadas que comprenden el segmento de ADN diana original acoplado a la parte adicional que contiene, por ejemplo, una secuencia de identificador único, una secuencia de unión de cebador, o una secuencia de identificador de paciente. Como se ha descrito anteriormente, el producto circularizado resultante es adecuado para amplificación por círculo rodante y secuenciación circular.

El proceso representado en las Figuras 20 y 22 es esencialmente el mismo que el que se muestra en las Figuras 19 y 21, respectivamente, aunque, sin embargo, la sonda oligonucleotídica comprende un grupo de bloqueo (3'-Blk) en su extremo 3', uno o más enlaces escindibles ("r"), una secuencia de unión de cebador, y un grupo de captura 5' ("Z") opcional, como se muestra en la Figura 20, etapa B, y en la Figura 22, etapa B). Una polimerasa (diamante relleno) extiende el extremo 3' del conector corto hibridado del segmento de ADN para copiar la parte adicional de la sonda oligonucleotídica. La escisión con nucleasa del extremo 5' del segmento de ADN en una base de emparejamiento solapante genera un fosfato 5' competente para ligamiento (Figura 20, etapa C, y Figura 22, etapa C). En la Figura 20, etapa D, y en la Figura 22, etapa D, una ligasa (círculo relleno) sella covalentemente el extremo 3' extendido de la diana a su extremo 5' para crear un producto de ligamiento circular. El grupo de bloqueo 3' de la sonda oligonucleotídica evita la extensión de la sonda oligonucleotídica. Posteriormente, el grupo de bloqueo se retira por escisión en el enlace escindible, por ejemplo, escisión con RNasa (triángulo relleno) de ribonucleótido "r". Como se muestra en las Figuras 20, etapa E, y 22, etapa E, la polimerasa (diamante relleno) con actividad de desplazamiento de cadena extiende el extremo 3' liberado de la sonda oligonucleotídica para iniciar la amplificación por círculo rodante. El producto de extensión primario formado mediante amplificación por círculo rodante es adecuado para secuenciación. El grupo Z 5' opcional puede capturarse sobre un soporte sólido antes o después de la amplificación por círculo rodante. Una vez capturado, el producto de ligamiento circular unido a cebador o la extensión del mismo pueden liberarse del soporte sólido mediante escisión en el enlace escindible, ya sea antes o después de la amplificación por círculo rodante.

La Figura 23 y la Figura 25 muestran un proceso similar para producir construcciones de "diana" de ácido nucleico monocatenarias quiméricas circulares adecuado para la secuenciación como se describe con referencia a las Figuras 13, 15, 17, 19 y 21 mencionadas anteriormente. El ADN genómico diana se obtiene a partir de ADNcf con una longitud media de 160 pb o ADN genómico cortado en fragmentos de aproximadamente 160 pb. En los casos de las Figuras 23 y 25, no se añaden conectores ni colas 3' o 5' a los segmentos de ADN genómico. Como se muestra en la Figura 23, etapa B, y en la Figura 25, etapa B, las sondas oligonucleotídicas que contienen secuencias complementarias a los extremos 5' y 3' del segmento de ADN se hibridan con los segmentos de ADN diana. En el caso representado en la Figura 23, etapa B, los extremos 3' y 5' del oligonucleótido de ADN no son complementarios a la sonda oligonucleotídica, formando dos aletas no hibridadas. En el caso de la Figura 25, etapa B, los extremos 3' y 5' del oligonucleótido de ADN son complementarios a la sonda oligonucleotídica.

La parte adicional de las sondas oligonucleotídicas (mostrada como una barra gruesa de color negro) puede contener una secuencia de identificador único, una secuencia de identificador de paciente, una secuencia de unión de cebador, y/o un enlace escindible (dentro de la barra gruesa marcado como "U") (Figuras 23, etapa B, y 25, etapa B, panel de la izquierda). Las sondas oligonucleotídicas también puede contener un grupo de bloqueo en un extremo (por ejemplo, Figuras 23, etapa B, y 25, etapa B, panel de la derecha; grupo de bloqueo en el extremo 5' de la sonda oligonucleotídica). Como se muestra en la Figura 23, etapa C, una polimerasa (diamante relleno) que tiene actividad de nucleasa 3' retira el extremo 3' monocatenario del oligonucleótido diana y a continuación extiende el extremo 3' del segmento de ADN para copiar la parte adicional de la sonda oligonucleotídica. La extensión mediada por polimerasa del extremo 3' del oligonucleótido diana también se produce en el proceso de la Figura 25, etapa B. Después de la extensión en los procesos de la Figura 23, etapa C, y de la Figura 25, etapa C, una nucleasa 5' provoca la escisión en una base solapante 5' de emparejamiento del a Dn diana para retirar la región del conector en el extremo 5' dejando de ese modo fosfato 5' competente para ligamiento. La polimerasa también extiende el extremo 3' de la sonda oligonucleotídica usando el segmento de ADN diana como molde (Figuras 23, etapa C, y 25, etapa C). El grupo de bloqueo en el extremo 5' de la sonda (Figuras 23, etapa C, y 25, etapa C, lado de la derecha) no está escindido. En las Figuras 23, etapa D, y 25, etapa D (panel de la izquierda), una ligasa (círculo relleno) sella covalentemente la unión de ligamiento entre los extremos 3' y 5' del segmento de ADN genómico diana extendido, y los extremos 3' y 5' de la sonda oligonucleotídica extendida para crear productos de ligamiento circulares. Se introduce una mella en el enlace escindible (por ejemplo, escisión con UDG de dU, triángulo relleno) de la sonda oligonucleotídica circularizada, para hacer que la sonda oligonucleotídica sea susceptible de digestiones con exonucleasa (Figuras 23, etapa E y 25, etapa E, panel de la izquierda). Como se muestra en las Figuras 23, etapa D, y 25, etapa D, panel de la derecha, una ligasa (círculo relleno) sella covalentemente la unión de ligamiento entre los extremos 3' y 5' del segmento de ADN genómico diana extendido; sin embargo, el grupo de bloqueo 5' en la sonda oligonucleotídica evita la circularización de la sonda oligonucleotídica. Como se muestra en las Figuras 23, etapa E, y 25, etapa E, la exonucleasa o exonucleasas digieren todos los productos oligonucleotídicos no ligados o con mellas (es decir, sondas oligonucleotídicas) dejando solo las construcciones de ácido nucleico monocatenarias circulares deseadas que comprenden el segmento de ADN diana original acoplado a la parte adicional que contiene, por ejemplo, una secuencia de identificador único, una secuencia de unión de cebador, o una secuencia de identificador de paciente. Como se ha descrito anteriormente, el producto circularizado resultante es adecuado para amplificación por círculo rodante y secuenciación circular.

Las partes específicas de diana 3' y 5' de las sondas oligonucleotídicas, por ejemplo, las sondas oligonucleotídicas usadas en el proceso que se representa en la Figura 25, pueden estar diseñadas para que contengan uno o más desemparejamientos de nucleótidos con el segmento de ADN genómico diana. Esta característica de diseño garantiza que el segmento de ADN genómico diana de la construcción de ácido nucleico circularizada ligada pueda distinguirse de la parte extendida con polimerasa de la construcción de ácido nucleico circularizada ligada (es decir, la línea sólida de la construcción circularizada puede distinguirse de la línea discontinua de la construcción en las Figuras 25E).

El proceso representado en las Figuras 24 y 26 es esencialmente el mismo que el que se muestra en las Figuras 23 y 25, respectivamente, aunque, sin embargo, la sonda oligonucleotídica comprende un grupo de bloqueo (3'-Blk) en su extremo 3', uno o más enlaces escindibles, una secuencia de unión de cebador, y un grupo de captura 5' ("Z") opcional (Figuras 24, etapa B, y 26, etapa B). Una polimerasa (diamante relleno) extiende el extremo 3' hibridado del segmento de ADN para copiar la parte adicional de la sonda oligonucleotídica. En la divulgación de la Figura 24, etapa C, la polimerasa escinde la aleta no complementaria 3' del oligonucleótido diana antes de la extensión. La escisión con nucleasa del extremo 5' del segmento de ADN en una base solapante de emparejamiento genera un fosfato 5' competente para ligamiento (Figuras 24, etapa C, y 26, etapa C). En las Figuras 24, etapa D, y 26, etapa D, una ligasa (círculo relleno) sella covalentemente el extremo 3' extendido del segmento de ADN a su extremo 5' para crear un producto de ligamiento circular. El grupo de bloqueo 3' de la sonda oligonucleotídica evita la extensión de la sonda oligonucleotídica. Posteriormente, el grupo de bloqueo se retira por escisión en el enlace escindible, por ejemplo, escisión con RNasa (triángulo relleno) de ribonucleótido "r". Como se muestra en las Figuras 24, etapa E, y 26, etapa E, la polimerasa (diamante relleno) con actividad de desplazamiento de cadena extiende el extremo 3' liberado de la sonda oligonucleotídica para iniciar la amplificación por círculo rodante. El producto de extensión primario formado mediante amplificación por círculo rodante es adecuado para secuenciación. El grupo Z 5' opcional puede capturarse sobre un soporte sólido antes o después de la amplificación por círculo rodante. Una vez capturado, el producto de ligamiento circular unido a cebador o la extensión del mismo pueden liberarse del soporte sólido mediante escisión en el enlace escindible, ya sea antes o después de la amplificación por círculo rodante.

La Figura 27 muestra un proceso para formar construcciones de ácido nucleico monocatenario circularizadas que contienen sitios de HinPlI metilados adyacentes (GCGC). Las construcciones de ácido nucleico circularizadas son adecuadas para la detección y/o secuenciación de los sitios de HinPlI metilados. Como se muestra en la Figura 27, etapa A, el proceso comienza con la escisión de ADNcf o ADN genómico con HinPlI en sitios de reconocimiento de HinPlI sin metilar para formar segmentos de ADN genómico de aproximadamente 160 pb. Los sitios de HinPlI metilados dentro de los fragmentos de oligonucleótido diana se indican como 'm'. Como se muestra en la Figura 27, etapa B, las sondas oligonucleotídicas con secuencia de identificador único (línea gruesa de color negro) y secuencias de HinPlI sin metilar cerca de ambos extremos 3' y 5' de la sonda oligonucleotídica (es decir, complementarios a los sitios de HinPlI del ADNcf) se hibridan con oligonucleótidos de ADNcf que tienen sitios de HinPlI metilados (panel de la izquierda) o sitios de HinPlI sin metilar (panel de la derecha). El extremo 5' de la sonda oligonucleotídica contiene un grupo de bloqueo y el extremo 3' está desemparejado con el oligonucleótido diana para evitar la extensión con polimerasa. En la Figura 27, etapa C, la sonda oligonucleotídica hibridada con el segmento diana genómico se somete a escisión con HinPlI (triángulos rellenos). Si los oligonucleótidos tanto de la sonda como diana no contienen sitios de HinPlI metilados, HinPlI escinde los oligonucleótidos tanto diana y como de la sonda, retirando de ese modo las secuencias diana sin metilar de un análisis adicional. Si el oligonucleótido diana contiene sitios de HinPlI metilados, pero el oligonucleótido de la sonda no contiene sitios de HinPlI metilados como se muestra en la Figura 27, etapa C, panel de la izquierda, HinPlI escinde solo el oligonucleótido de la sonda, generando de ese modo un O^h3' competente para extensión y un fosfato 5' competente para ligamiento en la sonda. Una polimerasa (diamante relleno) extiende el extremo 3' liberado de la sonda oligonucleotídica, y una ligasa (círculo relleno) sella covalentemente el extremo 3' y el extremo 5' de la sonda oligonucleotídica para crear un producto de ligamiento cerrado covalentemente (Figura 27, etapa D). La inactivación térmica de HinPlI, o la incorporación por polimerasa de nucleótidos modificados evita una nueva escisión con HinPlI. Como se muestra en la Figura 27, etapa E, la digestión con exonucleasa retira todos los productos no ligados o escindidos, dejando de este modo solo las construcciones de ADN circulares monocatenarias deseadas que comprenden el complemento del ADN diana con una secuencia de identificador único. Este producto de ligamiento circularizado es adecuado para amplificación por círculo rodante y secuenciación posterior.

La Figura 28 muestra un proceso para descubrir la metilación en sitios de HinPlI adyacentes (GCGC) en todo el genoma. Este proceso implica escisión del ADN genómico con HinPlI y ligamiento en conectores cortos (líneas gruesas de color negro) con extremos 5' bloqueados en los fragmentos genómicos escindidos, como se muestra en la Figura 28, etapa A. "m" indica sitios de HinPlI metilados. En la Figura 28, etapa B, la amplificación por PCR limitada con cebadores bloqueados 5' genera productos sin metilar. Solo los sitios de HinPlI adyacentes (GCGG) metilados en la diana original generan fragmentos sin bloquear cuando se escinden con HinPlI (triángulos rellenos). Como se muestra en la Figura 28, etapa C, el ligamiento (círculos rellenos) en conectores (líneas dobles) que contienen una secuencia de identificador único opcional (líneas dobles rellenas de color gris), una secuencia de identificador de paciente opcional (líneas dobles rellenas de color gris), con el extremo 3' bloqueado o cadena principal que contiene tiofosfato (****), inhibe la digestión posterior con exonucleasa 3' (triángulos rellenos). Solo los fragmentos con conectores ligados a ambos lados permanecerán bicatenarios. En la Figura 28, etapa D, el extremo libre de los conectores se vuelve competente para ligamiento, ya sea por (i) fosforilación del extremo 5', (ii) retirada del grupo 3' bloqueado, o (iii) uso de la actividad de nucleasa 5' para retirar por escisión la base solapante 5' de emparejamiento o la aleta, dejando un fosfato 5' competente para ligamiento, o cualquier combinación de los mismos. En la Figura 28, etapa E, las condiciones de ligamiento están diseñadas para favorecer la oligomerización. Los productos ligados comprenden secuencias de HinPlI adyacentes metiladas originalmente en el ADN diana con una secuencia de identificador único y/o una secuencia de identificador de paciente opcional. El producto final es adecuado para etapas adicionales opcionales y secuenciación posterior.

La Figura 29 muestra un proceso para producir construcciones de ácido nucleico monocatenarias quiméricas circulares adecuado para detectar metilación en sitios de AciI adyacentes (GCGG) en regiones genómicas conocidas comenzando a partir de ADNcf con una longitud media de 160 pb o ADN genómico cortado en fragmentos de aproximadamente 160 pb ("oligonucleótido diana" o "segmento de ADN"). Como se muestra en la Figura 29, etapa A, el proceso comienza añadiendo conectores resistentes a bisulfito (líneas gruesas de color negro) en los extremos 3' y 5' de los segmentos de ADN genómico (por ejemplo, mediante ligamiento). El tratamiento con bisulfito del ADN genómico convierte las citosinas sin metilar en uracilos, lo que da como resultado productos monocatenarios ("m" en la Figura 29, etapa A, representa sitios de AciI metilados). Para generar productos bicatenarios se realiza una PCR limitada, y el producto de PCR resultante se escinde con AciI (triángulos rellenos). Solo los sitios metilados en el segmento diana original permanecen como GCGG y se someten a escisión con AciI para generar extremos competentes para ligamiento. Como se muestra en la Figura 29, etapa B, las sondas oligonucleotídicas que contienen secuencias complementarias a los lados 5' y 3' del oligonucleótido diana escindido y, opcionalmente, un grupo de bloqueo 5', se hibridan con sus respectivos oligonucleótidos diana complementarios. Además de las partes específicas de diana, las sondas oligonucleotídicas también contienen una parte adicional. Esta parte adicional es una parte de secuencia nucleotídica que puede contener una secuencia de identificador único, una secuencia de identificador de paciente, y uno o más sitios de unión de cebador. Como se muestra en la Figura 29, etapa C, la polimerasa que carece de actividad 5 '^3 ' (diamantes rellenos) extiende el extremo 3' del oligonucleótido diana, copiando la parte adicional de la sonda y generando una unión competente para ligamiento con el extremo 5' del oligonucleótido diana. La polimerasa también extiende la sonda oligonucleotídica usando el oligonucleótido diana como molde, pero no escinde el grupo de bloqueo 5' de la sonda, si estuviera presente. En la Figura 29, etapa D, una ligasa (círculo relleno) sella covalentemente los extremos 3' y 5' del oligonucleótido diana para crear un producto de ligamiento circular que contiene el segmento de ADN diana (tratado con bisulfito y copiado). El grupo de bloqueo 5' en la sonda oligonucleotídica evita la circularización de la cadena de la sonda oligonucleotídica. Como se muestra en la Figura 29, etapa E, la exonucleasa o exonucleasas digieren todos los productos no ligados o con mellas dejando solo el ADN circular monocatenario deseado que comprende el complemento de ADN diana convertido con bisulfito con una secuencia de identificador único. El producto final es adecuado para secuenciación circular usando cualquiera de los métodos que se han descrito anteriormente.

La Figura 30 muestra un proceso para producir construcciones de ácido nucleico monocatenarias quiméricas circulares adecuado para detectar metilación en sitios de AciI adyacentes (GCGG) en regiones genómicas conocidas comenzando a partir de ADNcf con una longitud media de 160 pb o ADN genómico cortado en fragmentos de aproximadamente 160 pb. Como se muestra en la Figura 30A, el proceso comienza añadiendo conectores resistentes a bisulfito (líneas gruesas de color negro) a los extremos 3' y 5' de los segmentos de ADN genómico (por ejemplo, mediante ligamiento). "m" en los segmentos de ADN genómico representa sitios de Acil metilados. El tratamiento con bisulfito de los segmentos de ADNcf y/o ADN genómico convierte las C sin metilar en U para generar productos monocatenarios. Para generar productos bicatenarios se realiza una PCR limitada, y los productos de PCR resultantes se escinden con AciI (triángulos rellenos, solo los sitios metilados en la diana original permanecen como GCGG) para generar extremos competentes para ligamiento. Como se muestra en la Figura 30, etapa B, las sondas oligonucleotídicas que contienen secuencias complementarias a los lados 5' y 3' de los productos de PCR diana escindidos se hibridan con sus respectivos oligonucleótidos diana complementarios. La sonda oligonucleotídica puede tener un grupo de bloqueo (3'-Blk) en su extremo 3', uno o más enlaces escindibles, y/o un grupo de captura 5' ("Z") opcional. Además de las partes específicas de diana, las sondas oligonucleotídicas también contienen una parte adicional. Esta parte adicional es una parte de secuencia nucleotídica que puede contener una secuencia de identificador único, una secuencia de identificador de paciente, y uno o más sitios de unión de cebador. Como se muestra en la Figura 30, etapa C, una polimerasa que carece de actividad 5 '^3 ' (diamantes rellenos) extiende el extremo 3' del oligonucleótido diana, copiando la parte adicional de la sonda y generando una unión competente para ligamiento con el extremo 5' del oligonucleótido diana. En la Figura 30, etapa D, una ligasa (círculo relleno) sella covalentemente los extremos 3' y 5' del oligonucleótido diana para crear un producto de ligamiento circular que contiene el segmento de ADN diana (tratado con bisulfito, copiado). El grupo de bloqueo 3' en la sonda oligonucleotídica evita la extensión y la circularización de la cadena de la sonda oligonucleotídica. La retirada posterior del grupo de bloqueo 3' mediante mellado del enlace escindible (por ejemplo, escisión con RNasa de ribonucleótido r) permite la extensión mediada por polimerasa de la sonda oligonucleotídica (Figura 30, etapa D). Como se muestra en la Figura 30, etapa E, la polimerasa (diamante relleno) con actividad de desplazamiento de cadena extiende el extremo 3' liberado para amplificación por círculo rodante. Este producto de extensión es adecuado para secuenciación usando cualquiera de los métodos que se describen en el presente documento. El grupo Z 5' opcional puede capturarse sobre un soporte sólido antes o después de la amplificación por círculo rodante. Una vez capturado, el producto de ligamiento circular unido a cebador o la extensión del mismo pueden liberarse del soporte sólido mediante escisión en el enlace escindible, ya sea antes o después de la amplificación por círculo rodante.

La Figura 31 muestra un proceso para producir construcciones de ácido nucleico monocatenarias quiméricas circulares adecuado para detectar metilación en sitios de AciI adyacentes (GCGG) en regiones genómicas conocidas comenzando a partir de ADNcf con una longitud media de 160 pb o ADN genómico cortado en fragmentos de aproximadamente 160 pb (m representa sitios de AciI metilados). Como se muestra en la Figura 31, etapa A, el proceso comienza añadiendo conectores resistentes a bisulfito (líneas gruesas de color negro) en los extremos 3' y 5' de los segmentos de ADN genómico (por ejemplo, mediante ligamiento). El tratamiento con bisulfito de los segmentos de ADNcf y/o ADN genómico convierte las C sin metilar en U para generar productos monocatenarios. Para generar productos bicatenarios se realiza una PCR limitada, y los productos de ^pC^rresultantes se escinden con AciI (triángulos rellenos). Solo los sitios metilados en la diana original permanecen como GCGG y se someten a escisión con AciI para generar extremos competentes para ligamiento. Como se muestra en la Figura 31, etapa B, se hibridan sondas oligonucleotídicas dúplex con los segmentos de ADN diana escindidos. Las sondas dúplex comprenden una primera cadena de la sonda oligonucleotídica que contiene secuencias nucleotídicas complementarias a los lados 5' y 3' de los segmentos de ADN diana, que están separadas entre sí por una parte adicional. La parte adicional comprende una parte de identificador único, y/o una parte de identificador de paciente, y/o una o más secuencias de unión de cebador. La segunda sonda oligonucleotídica de la sonda oligonucleotídica dúplex (línea gruesa de color negro con bucle) contiene una secuencia que es complementaria a la parte adicional de la primera sonda oligonucleotídica. La región en bucle de la segunda sonda oligonucleotídica representa una región no complementaria. Como se muestra en la Figura 31, etapa C, la hibridación de las sondas dúplex con los segmentos de ADN genómico escindidos crea dos uniones competentes para ligamiento, entre el extremo 3' del segmento de ADN y el extremo 5' de la segunda sonda oligonucleotídica y entre el extremo 3' de la segunda sonda oligonucleotídica y el extremo 5' del segmento genómico escindido. Una ligasa (círculos rellenos) sella covalentemente las uniones de ligamiento para crear productos de ligamiento circulares que contienen el segmento de ADN diana (tratado con bisulfito, copiado) (Figura 31, etapa C). Como se muestra en la Figura 31, etapa D, la digestión con exonucleasa retira todos los productos sin ligar o con mellas dejando solo los productos de ligamiento circulares monocatenarios deseados que son adecuados para secuenciación circular usando cualquiera de los métodos que se describen en el presente documento.

La Figura 32 muestra esencialmente el mismo proceso para producir construcciones de ácido nucleico monocatenarias quiméricas circulares adecuado para detectar metilación en sitios de AciI adyacentes como se muestra y se describe en la Figura 31. En la divulgación representada en la Figura 32, la primera sonda oligonucleotídica del conjunto de sondas dúplex tiene un grupo de captura 5' ("Z") opcional (Figura 32, etapa B). Después de ligamiento de la segunda sonda oligonucleotídica y el segmento de ADN diana (tratado con bisulfito, copiado) para formar un producto de ligamiento circularizado (Figura 32, etapa C), el extremo 3' de la primera sonda oligonucleotídica se extiende usando una polimerasa de desplazamiento de cadena. La amplificación por círculo rodante genera un primer producto de extensión primario, que contiene secuencias lineales en tándem que son complementarias al producto de ligamiento circularizado (Figura 32, etapa D) y son adecuadas para secuenciación usando los métodos que se describen en el presente documento.

La Figura 33 muestra un proceso para el descubrimiento de metilación en sitios de AciI adyacentes (GCGG) en todo el genoma comenzando a partir de ADN genómico que se ha cortado a un tamaño medio de 150 pb o a partir de ADNcf con un tamaño medio de 160 pb. Como se muestra en la Figura 33, etapa A, el proceso comienza añadiendo, por ejemplo, mediante ligamiento, conectores cortos en los extremos 3' y 5' de los segmentos de ADN (líneas gruesas de color negro). El conector 5' contiene un grupo de bloqueo. El tratamiento con bisulfito del ADN genómico convierte las C sin metilar en U para dar como resultado productos monocatenarios. Como se muestra en la Figura 33, etapa B, la amplificación por PCR limitada con cebadores bloqueados 5' genera productos sin metilar. Solo los sitios de AciI adyacentes (GCGG) metilados en la diana original generan fragmentos no bloqueados cuando se escinden con AciI (triángulos rellenos). Como se muestra en la Figura 33, etapa C, se añaden conectores (líneas dobles de color gris) que contienen una secuencia de identificador único y/o una secuencia de identificador de paciente (por ejemplo, mediante ligamiento a productos de escisión con AciI). Los conectores contienen un grupo de bloqueo 3' o una cadena principal que contiene tiofosfato (****) para inhibir la digestión posterior con exonucleasa 3' (triángulos rellenos). Solo los fragmentos con conectores añadidos a ambos lados permanecen bicatenarios (Figura 33, etapa C, panel inferior). Como se muestra en la Figura 33, etapa D, los extremos del conector se hacen competentes para ligamiento (círculos rellenos), ya sea mediante (i) fosforilación de los extremos 5', (ii) retirada de los grupos 3' bloqueados, o (iii) uso de la actividad de nucleasa 5' para retirar por escisión la base solapante 5' de emparejamiento o la aleta para generar fosfato 5' competente para ligamiento, o (iv) cualquier combinación de estas técnicas. Las condiciones de ligamiento se diseñan para favorecer la oligomerización. La Figura 33, etapa E, muestra productos ligados formados por el complemento de ADN diana convertido con bisulfito (que procede principalmente de las islas CpG) con un identificador único y/o una secuencia de identificador de paciente opcionales. El producto final es adecuado para etapas adicionales y secuenciación posterior.

La Figura 34 muestra un proceso para producir construcciones de ácido nucleico monocatenarias quiméricas circulares adecuado para detectar sitios de HinPlI adyacentes sin metilar en regiones definidas del genoma comenzando a partir de ADNcf con una longitud media de 160 pb o ADN genómico cortado en fragmentos de aproximadamente 160 pb. Como se muestra en la Figura 34, etapa A, el proceso comienza con la escisión con HinPlI del ADN genómico en sitios de reconocimiento de GCGC (triángulos rellenos) para generar extremos 3' y 5' competentes para ligamiento. Como se muestra en la Figura 34, etapa B, las sondas oligonucleotídicas que contienen secuencias complementarias a los lados 5' y 3' de los segmentos de ADN diana escindidos se hibridan con sus respectivos segmentos de ADN diana escindidos. Las sondas oligonucleotídicas también contienen una parte nucleotídica adicional que contiene una secuencia de identificador único y, opcionalmente, una secuencia de identificador de paciente. En la divulgación de la Figura 34, la sonda oligonucleotídica también tiene un grupo de bloqueo en un extremo, por ejemplo, en el extremo 5'. Una polimerasa (diamantes rellenos) que carece de actividad 5 '^3 ' extiende el extremo 3' del segmento de ADN diana hibridado, copiando la parte adicional de la sonda y creando una unión de ligamiento con el fosfato competente para ligamiento en el extremo 5' de la diana (Figura 34, etapa C). La polimerasa también extiende la sonda oligonucleotídica usando el segmento de ADN diana como molde, pero no escinde el grupo de bloqueo en su extremo 5'. En la Figura 34, etapa D, una ligasa (círculo relleno) sella covalentemente la unión entre el extremo 3' extendido y el extremo 5' del segmento de ADN para crear productos de ligamiento circulares. El grupo de bloqueo 5' en la sonda oligonucleotídica evita la circularización de la sonda oligonucleotídica. Alternativamente, se introduce una mella en un enlace escindible contenido en la parte adicional, por ejemplo, la parte adicional contiene un nucleótido uracilo que se escinde usando UDG. Como se muestra en la Figura 34, etapa E, la digestión con exonucleasa de todos los productos sin ligar o con mellas deja solo el ADN circular monocatenario que comprende el segmento de ADN diana original acoplado a una secuencia nucleotídica de identificación adicional, por ejemplo, una secuencia de identificador único. El producto final es adecuado para amplificación por círculo rodante y secuenciación circular.

La Figura 35 muestra esencialmente el mismo proceso para producir construcciones de ácido nucleico monocatenarias quiméricas circulares adecuado para detectar sitios de HinPlI adyacentes sin metilar en regiones definidas del genoma, como se muestra y se describe en la Figura 34. En la divulgación representada en la Figura 35, la sonda oligonucleotídica contiene secuencias complementarias a los lados 5' y 3' del segmento de ADN diana que están separadas por la parte nucleotídica adicional. Además, la sonda oligonucleotídica también tiene un grupo de bloqueo (3'-Blk) en su extremo 3', uno o más enlaces escindibles, en donde el enlace escindible se representa como "r", y un grupo de captura 5' ("Z") opcional (Figura 35, etapa B). El extremo 3' del segmento de ADN diana hibridado se extiende con polimerasa creando una unión de ligamiento con el fosfato competente para ligamiento en el extremo 5' del segmento de ADN diana. Después del ligamiento del extremo 3' extendido y el extremo 5' del segmento de ADN diana para formar un producto de ligamiento circularizado (Figura 35, etapa C), el grupo de bloqueo 3' en la sonda oligonucleotídica se retira (por ejemplo, por escisión con RNasa H del enlace ribonucleotídico) (Figura 35, etapa D), y una polimerasa (diamantes rellenos) que carece de actividad 5 '^3 ' extiende la sonda oligonucleotídica usando el producto de ligamiento de ADN circularizado como molde (Figura 35, etapa E). La amplificación por círculo rodante genera un producto de extensión primario que contienen secuencias lineales en tándem que son complementarias al producto de ligamiento circularizado (Figuras 35, etapa E). El producto de extensión primario es adecuado para secuenciación usando los métodos que se describen en el presente documento. El grupo Z 5' opcional puede capturarse sobre un soporte sólido antes o después de la amplificación por círculo rodante. Una vez capturado, el producto de ligamiento circular unido a cebador o la extensión del mismo pueden liberarse del soporte sólido mediante escisión en el enlace escindible, ya sea antes o después de la amplificación por círculo rodante.

Las Figuras 36 y 37 muestran un proceso para producir construcciones de ácido nucleico monocatenarias quiméricas circulares adecuado para detectar sitios de AciI metilados entre sitios de HaeIII en regiones genómicas de ADNcf o ADN genómico total cortado. El ADN genómico se escinde con AciI (triángulos rellenos, GCGG) y HaeIII (triángulos rellenos, GGCC) para generar extremos 3' y 5' competentes para ligamiento; m representa sitios metilados dentro de los segmentos escindidos (Figuras 36, etapa A, y 37, etapa A). En la divulgación de la Figura 36, las sondas oligonucleotídicas que contienen secuencias en los extremos 5' y 3' complementarias a los lados 5' y 3' del segmento de ADN diana se hibridan con los segmentos de ADN escindidos (Figura 36, etapa B). Las sondas oligonucleotídicas también contienen una parte nucleotídica adicional que contiene una o más de una secuencia de identificador único, una secuencia de identificador de paciente, y/o uno o más sitios de unión de cebador. Las sondas oligonucleotídicas también pueden tener un grupo de bloqueo en un extremo (por ejemplo, un grupo de bloqueo 5' como se muestra en la Figura 36, etapa B). Una polimerasa (diamantes rellenos) que carece de actividad 5 '^3 ' extiende el extremo 3' del segmento de ADN diana hibridado, copiando la parte adicional de la sonda y creando una unión de ligamiento con el fosfato competente para ligamiento en el extremo 5' de la diana (Figura 36, etapa C). La polimerasa también extiende la sonda oligonucleotídica usando el segmento de ADN diana como molde, pero no escinde el grupo de bloqueo en su extremo 5'. En la Figura 36, etapa D, una ligasa (círculo relleno) sella covalentemente la unión entre el extremo 3' extendido y el extremo 5' del segmento de ADN para crear productos de ligamiento circulares. El grupo de bloqueo 5' en la sonda oligonucleotídica evita la circularización de la sonda oligonucleotídica. Alternativamente, se introduce una mella en un enlace escindible contenido en la parte adicional, por ejemplo, la parte adicional contiene un nucleótido uracilo que se escinde usando UDG. Como se muestra en la Figura 36, etapa E, la digestión con exonucleasa de todos los productos sin ligar o con mellas deja solo el ADN circular monocatenario que comprende el segmento de ADN diana original acoplado a una secuencia nucleotídica de identificación adicional, por ejemplo, una secuencia de identificador único. El producto final es adecuado para amplificación por círculo rodante y secuenciación circular.

En el caso representado en la Figura 37, la sonda oligonucleotídica contiene secuencias complementarias a los lados 5' y 3' del segmento de ADN diana que están separadas por la parte nucleotídica adicional. Además, la sonda oligonucleotídica también tiene un grupo de bloqueo (3'-Blk) en su extremo 3', uno o más enlaces escindibles, en donde el enlace escindible se representa como "r", y un grupo de captura 5' ("Z") opcional (Figura 37, etapa B). Después del ligamiento del extremo 3' extendido y el extremo 5' del segmento de ADN diana para formar un producto de ligamiento circularizado (Figura 37, etapa C), el grupo de bloqueo 3' en la sonda oligonucleotídica se retira (por ejemplo, por escisión con RNasa H del enlace ribonucleotídico) (Figura 37, etapa D), y una polimerasa (diamantes rellenos) que carece de actividad 5 '^3 ' extiende la sonda oligonucleotídica usando el producto de ligamiento de ADN circularizado como molde (Figura 37, etapa E). La amplificación por círculo rodante genera un producto de extensión primario que contiene secuencias lineales en tándem que son complementarias al producto de ligamiento circularizado (Figuras 37, etapa E). El producto de extensión primario es adecuado para secuenciación usando los métodos que se describen en el presente documento. El grupo Z 5' opcional puede capturarse sobre un soporte sólido antes o después de la amplificación por círculo rodante. Una vez capturado, el producto de ligamiento circular unido a cebador o la extensión del mismo pueden liberarse del soporte sólido mediante escisión en el enlace escindible, ya sea antes o después de la amplificación por círculo rodante.

La Figura 38 muestra un proceso para producir construcciones de ácido nucleico monocatenarias quiméricas circulares adecuado para detectar sitios de Bsh1236I metilados entre sitios de HaeIII en regiones genómicas de ADNcf o ADN genómico total cortado. El ADN genómico se escinde con Bsh1236I (CGCG) y HaeIII (triángulos rellenos, GGCC) para generar extremos 3' y 5' competentes para ligamiento; m representa sitios metilados dentro de los segmentos escindidos (Figura 38, etapa A). En la divulgación de la Figura 38, las sondas oligonucleotídicas que contienen secuencias en los extremos 5' y 3' complementarias a los lados 5' y 3' del segmento de ADN diana se hibridan con los segmentos de ADN escindidos (Figura 38, etapa B). Las sondas oligonucleotídicas también contienen una parte nucleotídica adicional que contiene una o más de una secuencia de identificador único, una secuencia de identificador de paciente, y/o uno o más sitios de unión de cebador. Las sondas oligonucleotídicas también pueden tener un grupo de bloqueo en un extremo (por ejemplo, un grupo de bloqueo 5' como se muestra en la Figura 38, etapa B). Una polimerasa (diamantes rellenos) que carece de actividad 5^-3' extiende el extremo 3' del segmento de ADN diana hibridado, copiando la parte adicional de la sonda y creando una unión de ligamiento con el fosfato competente para ligamiento en el extremo 5' de la diana (Figura 38, etapa C). La polimerasa también extiende la sonda oligonucleotídica usando el segmento de ADN diana como molde, pero no escinde el grupo de bloqueo en su extremo 5'. En la Figura 38, etapa D, una ligasa (círculo relleno) sella covalentemente la unión entre el extremo 3' extendido y el extremo 5' del segmento de ADN para crear productos de ligamiento circulares. El grupo de bloqueo 5' en la sonda oligonucleotídica evita la circularización de la sonda oligonucleotídica. Alternativamente, se introduce una mella en un enlace escindible contenido en la parte adicional, por ejemplo, la parte adicional contiene un nucleótido uracilo que se escinde usando UDG. Como se muestra en la Figura 38, etapa E, la digestión con exonucleasa de todos los productos sin ligar o con mellas deja solo el ADN circular monocatenario que comprende el segmento de ADN diana original acoplado a una secuencia nucleotídica de identificación adicional, por ejemplo, una secuencia de identificador único. El producto final es adecuado para amplificación por círculo rodante usando polimerasa Bst en presencia de BstUI (CGCG) para garantizar que los sitios que estaban metilados en la diana original no se escindan, y posteriormente se identifiquen mediante secuenciación. Este ejemplo muestra el uso de la endonucleasa de restricción BstUI. Sin embargo, en este método también pueden usarse otras endonucleasas que escinden el ADN bicatenario si no está metilado, pero no el ADN híbrido metilado/sin metilar, ni el ADN monocatenario sin metilar. Estas incluyen, pero no se limitan a, las enzimas termófilas BstHHI (reconoce GCGC; un isoesquizómero de HhaI), BsiSI (reconoce CCGG; un isoesquizómero de HpaII), y Tail (reconoce ACGT; un isoesquizómero de MaeII).

La Figura 39 y la Figura 36 muestran un proceso para producir construcciones de ácido nucleico monocatenarias quiméricas circulares adecuado para detectar sitios de AciI metilados cerca de un sitio de HaeIII 5' en regiones conocidas de ADN genómico. El método es adecuado para detectar sitios de AciI metilados en el ADN genómico cortado a un tamaño medio de 160 pb o ADNcf que tiene un tamaño medio de 160 pb. El ADN genómico se escinde con AciI (GCGG) y HaeIII (GGCC) para generar extremos 5' competentes para ligamiento (Figuras 39, etapa A y 40, etapa A). En la divulgación representada en la Figura 39, las sondas oligonucleotídicas que contienen secuencias en los extremos 5' y 3' complementarias a los lados 5' y 3' de los segmentos de ADN genómico diana se hibridan con los segmentos de ADN escindidos (Figura 39, etapa B). Las sondas oligonucleotídicas también contienen una parte nucleotídica adicional que comprende una o más de una secuencia de identificador único, una secuencia de identificador de paciente, y uno o más sitios de unión de cebador. Las sondas oligonucleotídicas también pueden tener un grupo de bloqueo en un extremo (por ejemplo, un grupo de bloqueo 5' como se muestra en la Figura 39, etapa B). Una polimerasa con actividad de nucleasa 3^-5' (diamantes rellenos), pero que carece de actividad 5 '^ 3 ', retira el extremo 3' monocatenario y, a continuación, extiende el extremo 3' del segmento de ADN diana hibridado, copiando la parte adicional de la sonda y creando una unión de ligamiento con el fosfato competente para ligamiento en el extremo 5' de la diana (Figura 39, etapa C). La polimerasa también extiende la sonda oligonucleotídica usando el segmento de ADN diana como molde, pero no escinde el grupo de bloqueo en su extremo 5'. En la Figura 39, etapa D, una ligasa (círculo relleno) sella covalentemente la unión entre el extremo 3' extendido y el extremo 5' del segmento de ADN para crear productos de ligamiento circulares. El grupo de bloqueo 5' en la sonda oligonucleotídica evita la circularización de la sonda oligonucleotídica. Alternativamente, se introduce una mella en un enlace escindible contenido en la parte adicional, por ejemplo, la parte adicional contiene un nucleótido uracilo que se escinde usando UDG. Como se muestra en la Figura 39, etapa E, la digestión con exonucleasa de todos los productos sin ligar o con mellas deja solo el ADN circular monocatenario que comprende el segmento de ADN diana original acoplado a una secuencia nucleotídica de identificación adicional, por ejemplo, una secuencia de identificador único. El producto final es adecuado para amplificación por círculo rodante y secuenciación circular.

En el caso representado en la Figura 40 las sondas oligonucleotídicas contienen secuencias en los extremos 5' y 3' complementarias a los lados 5' y 3' del segmento de ADN diana escindido que están separadas por la parte nucleotídica adicional. Además, las sondas oligonucleotídicas también tienen un grupo de bloqueo (3'-Blk) en su extremo 3', uno o más enlaces escindibles, en donde el enlace escindible se representa como "r", y un grupo de captura 5' ("Z") opcional (Figura 40, etapa A). Después del ligamiento del extremo 3' extendido y el extremo 5' del segmento de ADN diana para formar un producto de ligamiento circularizado (Figura 40, etapa C), se retira el grupo de bloqueo 3' en la sonda oligonucleotídica (por ejemplo, por escisión con RNasa H del enlace ribonucleotídico) (Figura 40, etapa D), y una polimerasa (diamantes rellenos) que carece de actividad 5 '^3 ' extiende la sonda oligonucleotídica usando el producto de ligamiento de ADN circularizado como molde (Figura 40, etapa E). La amplificación por círculo rodante genera un producto de extensión primario que contiene secuencias lineales en tándem que son complementarias al producto de ligamiento circularizado (Figuras 40, etapa E). El producto de extensión primario es adecuado para secuenciación usando los métodos que se describen en el presente documento. El grupo Z 5' opcional puede capturarse sobre un soporte sólido antes o después de la amplificación por círculo rodante. Una vez capturado, el producto de ligamiento circular unido a cebador o la extensión del mismo pueden liberarse del soporte sólido mediante escisión en el enlace escindible, ya sea antes o después de la amplificación por círculo rodante.

La Figura 41 muestra un proceso para producir construcciones de ácido nucleico monocatenarias quiméricas circulares adecuado para detectar sitios de Bsh1236I metilados cerca de un sitio de HaeIII 5' en regiones conocidas de ADN genómico. El método es adecuado para detectar sitios de Bsh1236I metilados en el ADN genómico cortado a un tamaño medio de 150 pb o ADNcf que tiene un tamaño medio de 160 pb. El ADN genómico se escinde con Bsh1236I (CGCG) y HaeIII (GGCC) para generar extremos 5' competentes para ligamiento (Figura 41, etapa A). En la divulgación representada en la Figura 41, las sondas oligonucleotídicas que contienen secuencias en los extremos 5' y 3' complementarias a los lados 5' y 3' de los segmentos de ADN genómico diana se hibridan con los segmentos de ADN escindidos (Figura 41, etapa B). Las sondas oligonucleotídicas también contienen una parte nucleotídica adicional que comprende una o más de una secuencia de identificador único, una secuencia de identificador de paciente, y uno o más sitios de unión de cebador. Las sondas oligonucleotídicas también pueden tener un grupo de bloqueo en un extremo (por ejemplo, un grupo de bloqueo 5' como se muestra en la Figura 41, etapa B). Una polimerasa con actividad de nucleasa 3 '^5 ' (diamantes rellenos), pero que carece de actividad 5 '^3 ', retira el extremo 3' monocatenario del segmento de ADN diana y, a continuación, extiende el extremo 3' escindido del segmento de ADN diana hibridado, copiando la parte adicional de la sonda y creando una unión de ligamiento con el fosfato competente para ligamiento en el extremo 5' de la diana (Figura 41, etapa C). La polimerasa también extiende la sonda oligonucleotídica usando el segmento de ADN diana como molde, pero no escinde el grupo de bloqueo en su extremo 5'. En la Figura 41, etapa D, una ligasa (círculo relleno) sella covalentemente la unión entre el extremo 3' extendido y el extremo 5' del segmento de ADN para crear productos de ligamiento circulares. El grupo de bloqueo 5' en la sonda oligonucleotídica evita la circularización de la sonda oligonucleotídica. Alternativamente, se introduce una mella en un enlace escindible contenido en la parte adicional, por ejemplo, la parte adicional contiene un nucleótido uracilo que se escinde usando UDG. Como se muestra en la Figura 41, etapa E, la digestión con exonucleasa de todos los productos sin ligar o con mellas deja solo el ADN circular monocatenario que comprende el segmento de ADN diana original acoplado a una secuencia nucleotídica de identificación adicional, por ejemplo, una secuencia de identificador único. El producto final es adecuado para amplificación por círculo rodante usando polimerasa Bst en presencia de BstUI (CGCG) para garantizar que los sitios que estaban metilados en la diana original se identifiquen posteriormente mediante secuenciación. Este ejemplo muestra el uso de la endonucleasa de restricción BstUI. Sin embargo, alternativamente, pueden usarse otras endonucleasas que escinden el ADN bicatenario si no está metilado, pero no el ADN híbrido metilado/sin metilar, ni el ADN monocatenario sin metilar. Estas incluyen, pero no se limitan a, las enzimas termófilas BstHHI (reconoce GCGC; un isoesquizómero de HhaI), BsiSI (reconoce CCGG; un isoesquizómero de HpaII), y Tail (reconoce ACGT; un isoesquizómero de MaeII).

La Figura 42 y la Figura 43 muestran un proceso para producir construcciones de ácido nucleico monocatenarias quiméricas circulares adecuado para detectar sitios de AciI metilados cerca de un sitio de HaeIII 3' en regiones genómicas de ADNcf o ADN genómico total cortado. El ADN genómico se escinde con AciI (GCGG) y HaeIII (GGCC) para generar extremos 3' competentes para extensión (Figuras 42, etapa A, y 43, etapa A). En la divulgación de la Figura 42, las sondas oligonucleotídicas que contienen secuencias en los extremos 5' y 3' complementarias a los lados 5' y 3' del segmento de ADN diana se hibridan con los segmentos de ADN escindidos (Figura 42, etapa B). Las sondas oligonucleotídicas también contienen una parte nucleotídica adicional que contiene una o más de una secuencia de identificador único, una secuencia de identificador de paciente, y/o uno o más sitios de unión de cebador. Las sondas oligonucleotídicas también pueden tener un grupo de bloqueo en un extremo (por ejemplo, un grupo de bloqueo 5' como se muestra en la Figura 42B). Una polimerasa (diamantes rellenos) que carece de actividad 5 '^3 ' extiende el extremo 3' del segmento de ADN diana hibridado, copiando la parte a dicional de la sonda. La actividad de nucleasa 5' de la polimerasa escinde una base solapante 5' de emparejamiento del segmento de ADN diana generando de ese modo un fosfato 5' competente para ligamiento (Figura 42, etapa C). La polimerasa también extiende la sonda oligonucleotídica usando el segmento de ADN diana como molde, pero no escinde el grupo de bloqueo en su extremo 5'. En la Figura 42, etapa D, una ligasa (círculo relleno) sella covalentemente la unión entre el extremo 3' extendido y el extremo 5' del segmento de ADN para crear productos de ligamiento circulares que contienen un segmento de ADN genómico original. El grupo de bloqueo 5' en la sonda oligonucleotídica evita la circularización de la sonda oligonucleotídica. Alternativamente, se introduce una mella en un enlace escindible contenido en la parte adicional, por ejemplo, la parte adicional contiene un nucleótido uracilo que se escinde usando UDG. Como se muestra en la Figura 42, etapa E, la digestión con exonucleasa de todos los productos sin ligar o con mellas deja solo el ADN circular monocatenario que comprende el segmento de ADN diana original acoplado a una secuencia nucleotídica de identificación adicional, por ejemplo, una secuencia de identificador único. El producto final es adecuado para amplificación por círculo rodante y secuenciación circular.

En la divulgación de la Figura 43, las sondas oligonucleotídicas contienen secuencias complementarias a los lados 5' y 3' del segmento de ADN diana que están separados por la parte nucleotídica adicional. Además, las sondas oligonucleotídicas también tienen un grupo de bloqueo (3'-Blk) en el extremo 3', uno o más enlaces escindibles, en donde el enlace escindible se representa como "r", y un grupo de captura 5' ("Z") opcional (Figura 43, etapa B). Después del ligamiento del extremo 3' extendido y del extremo 5' del segmento de ADN diana para formar un producto de ligamiento circularizado (Figura 43, etapa C), el grupo de bloqueo 3' en la sonda oligonucleotídica se retira (por ejemplo, por escisión con RNasa H del enlace ribonucleotídico) (Figura 43, etapa D), y una polimerasa (diamantes rellenos) que carece de actividad 5 '^3 ' extiende la sonda oligonucleotídica usando el producto de ligamiento de ADN circularizado como molde (Figura 43, etapa E). La amplificación por círculo rodante genera un producto de extensión primario que contiene secuencias lineales en tándem que son complementarias al producto de ligamiento circularizado (Figuras 43, etapa E). El producto de extensión primario es adecuado para secuenciación usando los métodos que se describen en el presente documento. El grupo Z 5' opcional puede capturarse sobre un soporte sólido antes o después de la amplificación por círculo rodante. Una vez capturado, el producto de ligamiento circular unido a cebador o la extensión del mismo pueden liberarse del soporte sólido mediante escisión en el enlace escindible, ya sea antes o después de la amplificación por círculo rodante.

La Figura 44 muestra un proceso para producir construcciones de ácido nucleico monocatenarias quiméricas circulares adecuado para detectar sitios de Bsh1236I metilados cerca de un sitio de HaeIII 3' en regiones genómicas de ADNcf o ADN genómico total cortado. El ADN genómico se escinde con Bsh1236I (CGCG) y HaeIII (GGCC) para generar extremos 3' competentes para extensión (Figura 44, etapa A). En la divulgación de la Figura 44, las sondas oligonucleotídicas que contienen secuencias en los extremos 5' y 3' complementarias a los lados 5' y 3' del segmento de ADN diana se hibridan con los segmentos de ADN escindidos (Figura 44, etapa B). Las sondas oligonucleotídicas también contienen una parte nucleotídica adicional que contiene una o más de una secuencia de identificador único, una secuencia de identificador de paciente, y/o uno o más sitios de unión de cebador. Las sondas oligonucleotídicas también pueden tener un grupo de bloqueo en un extremo (por ejemplo, un grupo de bloqueo 5' como se muestra en la Figura 44, etapa B). Una polimerasa (diamantes rellenos) que carece de actividad 5 '^3 ' extiende el extremo 3' del segmento de ADN diana hibridado, copiando la parte adicional de la sonda. La actividad de nucleasa 5' de la polimerasa escinde una base solapante 5' de emparejamiento del segmento de ADN diana generando de ese modo un fosfato 5' competente para ligamiento (Figura 44, etapa C). La polimerasa también extiende la sonda oligonucleotídica usando el segmento de ADN diana como molde, pero no escinde el grupo de bloqueo en su extremo 5'. En la Figura 44, etapa D, una ligasa (círculo relleno) sella covalentemente la unión entre el extremo 3' extendido y el extremo 5' del segmento de ADN para crear productos de ligamiento circulares que contienen un segmento de ADN genómico original. El grupo de bloqueo 5' en la sonda oligonucleotídica evita la circularización de la sonda oligonucleotídica. Alternativamente, se introduce una mella en un enlace escindible contenido en la parte adicional, por ejemplo, la parte adicional contiene un nucleótido uracilo que se escinde usando UDG. Como se muestra en la Figura 44, etapa E, la digestión con exonucleasa de todos los productos sin ligar o con mellas deja solo el ADN circular monocatenario que comprende el segmento de ADN diana original acoplado a una secuencia nucleotídica de identificación adicional, por ejemplo, una secuencia de identificador único. El producto final es adecuado para amplificación por círculo rodante usando polimerasa Bst en presencia de BstUI (CGCG) para garantizar que los sitios que estaban metilados en la diana original se identifiquen posteriormente mediante secuenciación. Este ejemplo muestra el uso de la endonucleasa de restricción BstUI. Sin embargo, pueden usarse otras endonucleasas que escinden el ADN bicatenario si no está metilado, pero no el ADN híbrido metilado/sin metilar, ni el ADN monocatenario sin metilar. Estas incluyen, pero no se limitan a, las enzimas termófilas BstHHI (reconoce GCGC; un isoesquizómero de HhaI), BsiSI (reconoce CCGG; un isoesquizómero de HpaII), y Tail (reconoce ACGT; un isoesquizómero de MaeII).

La Figura 45 muestra un proceso para producir construcciones de ácido nucleico monocatenarias quiméricas circulares adecuado para detectar sitios de Bsh1236I metilados adyacentes en regiones conocidas de ADN genómico. El método es adecuado para detectar sitios de Bsh1236I metilados en el ADN genómico cortado a un tamaño medio de 150 pb o ADNcf que tiene un tamaño medio de 160 pb. El ADN genómico se escinde con Bsh1236I (CGCG) en sitios de reconocimiento sin metilar en el ADN diana (Figura 45, etapa A). En la divulgación representada en la Figura 45, las sondas oligonucleotídicas que contienen secuencias en los extremos 5' y 3' complementarias a los lados 5' y 3' de los segmentos de ADN genómico diana están hibridadas con los segmentos de ADN (Figura 45, etapa B). Las sondas oligonucleotídicas también contienen una parte nucleotídica adicional que comprende una o más de una secuencia de identificador único, una secuencia de identificador de paciente, y uno o más sitios de unión de cebador. Las sondas oligonucleotídicas también pueden tener un grupo de bloqueo en un extremo (por ejemplo, un grupo de bloqueo 5' como se muestra en la Figura 44, etapa B). Una polimerasa (diamantes rellenos) con actividad 3'-5 retira el extremo 3' monocatenario de la diana, y a continuación extiende el extremo 3' del segmento de ADN diana hibridado, copiando la parte adicional de la sonda. La actividad de nucleasa 5 '^3 ' de la polimerasa escinde una base solapante 5' de emparejamiento del segmento de ADN diana generando de ese modo un fosfato 5' competente para ligamiento (Figura 45, etapa C). La polimerasa también extiende la sonda oligonucleotídica usando el segmento de ADN diana como molde, pero no escinde el grupo de bloqueo en su extremo 5'. En la Figura 45, etapa D, una ligasa (círculo relleno) sella covalentemente la unión entre el extremo 3' extendido y el extremo 5' del segmento de ADN para crear productos de ligamiento circulares. El grupo de bloqueo 5' en la sonda oligonucleotídica evita la circularización de la sonda oligonucleotídica. Alternativamente, se introduce una mella en un enlace escindible contenido en la parte adicional, por ejemplo, la parte adicional contiene un nucleótido uracilo que se escinde usando UDG. Como se muestra en la Figura 45, etapa E, la digestión con exonucleasa de todos los productos sin ligar o con mellas deja solo el ADN circular monocatenario que comprende el segmento de ADN diana original acoplado a una secuencia nucleotídica de identificación adicional, por ejemplo, una secuencia de identificador único. El producto final es adecuado para amplificación por círculo rodante usando polimerasa Bst en presencia de BstUI (CGCG). De ese modo, los sitios que estaban metilados en la diana original se amplifican y posteriormente se identifican mediante secuenciación. Este ejemplo muestra el uso de la endonucleasa de restricción BstUI. Sin embargo, pueden usarse otras endonucleasas que escinden el ADN bicatenario si no está metilado, pero no el ADN híbrido metilado/sin metilar, ni el ADN monocatenario sin metilar. Estas incluyen, pero no se limitan a, las enzimas termófilas BstHHI (reconoce GCGC; un isoesquizómero de HhaI), BsiSI (reconoce CCGG; un isoesquizómero de HpaII), y Tail (reconoce ACGT; un isoesquizómero de MaeII).

La Figura 46 muestra un proceso para producir construcciones de ácido nucleico monocatenarias quiméricas circulares adecuado para detectar todos los sitios CpG metilados cerca de los sitios de Bsh1236I en regiones conocidas de ADN genómico. El método es adecuado para detectar todos los sitios CpG metilados cerca de los sitios de Bsh1236I metilados en el ADN genómico cortado a un tamaño medio de 150 pb o ADNcf que tiene un tamaño medio de 160 pb. El ADN genómico se escinde con Bsh1236I (CGCG) en sitios de reconocimiento sin metilar (Figura 46, etapa A). El tratamiento con bisulfito convierte las C sin metilar en U y hace que las cadenas no sean complementarias. En la divulgación representada en la Figura 46, las sondas oligonucleotídicas que contienen secuencias en los extremos 5' y 3' complementarias a los lados 5' y 3' de los segmentos de ADN genómico diana metilados tratados con bisulfito se hibridan con los segmentos de ADN (Figura 46, etapa B). Las sondas oligonucleotídicas también contienen una parte nucleotídica adicional que comprende una o más de una secuencia de identificador único, una secuencia de identificador de paciente, y uno o más sitios de unión de cebador. Las sondas oligonucleotídicas también pueden tener un grupo de bloqueo en un extremo (por ejemplo, un grupo de bloqueo 5' como se muestra en la Figura 46, etapa B). Una polimerasa (diamantes rellenos) con actividad 3 '^5 ' retira el extremo 3' monocatenario de la diana tratada con bisulfito, y a continuación extiende el extremo 3' del segmento de ADN diana hibridado para copiar la parte adicional de la sonda. La actividad de nucleasa 5 '^3 ' de la polimerasa escinde una base solapante 5' de emparejamiento del segmento de ADN diana tratado con bisulfito generando de ese modo un fosfato 5' competente para ligamiento (Figura 46, etapa C). La polimerasa también extiende la sonda oligonucleotídica usando el segmento de ADN diana tratado con bisulfito como molde, pero no escinde el grupo de bloqueo en su extremo 5'. En la Figura 46, etapa D, una ligasa (círculo relleno) sella covalentemente la unión entre el extremo 3' extendido y el extremo 5' del segmento de ADN para crear productos de ligamiento circulares. El grupo de bloqueo 5' en la sonda oligonucleotídica evita la circularización de la sonda oligonucleotídica. Como se muestra en la Figura 46, etapa E, la digestión con exonucleasa de todos los productos sin ligar o con mellas deja solo el ADN circular monocatenario que comprende el segmento de ADN diana tratado con bisulfito original acoplado a una secuencia nucleotídica de identificación adicional, por ejemplo, una secuencia de identificador único. El producto final es adecuado para amplificación por círculo rodante usando polimerasa Bst en presencia de BstUI (CGCG) para garantizar que los sitios no convertidos por bisulfito que estaban metilados en la diana original, y todos los demás sitios CpG metilados se identifiquen por secuenciación. Este ejemplo muestra el uso de la endonucleasa de restricción BstUI. Sin embargo, pueden usarse otras endonucleasas que escinden el ADN bicatenario si no está metilado, pero no el ADN híbrido metilado/sin metilar, o el ADN monocatenario sin metilar, y que retienen el reconocimiento de restricción de los sitios metilados después del tratamiento con bisulfito. Esto incluye, pero no se limita a, la enzima termófila Tail (reconoce ACGT; un isoesquizómero de MaeII).

La Figura 47 y la Figura 48 muestran un proceso para producir construcciones de ácido nucleico monocatenarias quiméricas circulares adecuado para detectar sitios de HinPlI adyacentes sin metilar en regiones genómicas de ADNcf o ADN genómico total cortado. El ADN genómico se escinde con HinPlI (GCGC) (triángulos rellenos) para generar extremos 3' y 5' competentes para ligamiento (Figuras 47, etapa A y 48, etapa A). Como se muestra en la Figura 47, etapa B, las sondas oligonucleotídicas dúplex se hibridan con los segmentos de ADN diana escindidos. Las sondas dúplex comprenden una primera cadena de la sonda oligonucleotídica que contiene secuencias nucleotídicas complementarias a los lados 5' y 3' del segmento de ADN diana, que están separadas por una parte adicional. La parte adicional comprende una parte de identificador único, y/o una parte de identificador de paciente, y/o una o más secuencias de unión de cebador. La segunda sonda oligonucleotídica de las sondas oligonucleotídicas dúplex (línea gruesa de color negro con bucle) contiene una secuencia que es complementaria a la parte adicional de la primera sonda oligonucleotídica. La región en bucle de la segunda sonda oligonucleotídica representa una región no complementaria. Como se muestra en la Figura 47, etapa C, la hibridación de las sondas dúplex con los segmentos de ADN genómico escindidos crea dos uniones competentes para ligamiento, es decir, entre el extremo 3' del segmento de ADN y el extremo 5' de la segunda sonda oligonucleotídica, y entre el extremo 3' de la segunda sonda oligonucleotídica y el extremo 5' del segmento genómico escindido. Una ligasa (círculos rellenos) sella covalentemente las uniones de ligamiento para crear productos de ligamiento circulares que contienen segmentos de ADN genómico (Figura 47, etapa C). Como se muestra en la Figura 47, etapa D, la digestión con exonucleasa retira todos los productos sin ligar o con mellas dejando solo los productos de ligamiento circulares monocatenarios deseados que son adecuados para secuenciación circular usando cualquiera de los métodos que se describen en el presente documento.

En el caso representado en la Figura 48, la primera sonda oligonucleotídica de la sonda dúplex contiene secuencias complementarias a los lados 5' y 3' del segmento de ADN diana que están separadas por la parte nucleotídica adicional. Además, la primera sonda oligonucleotídica también tiene un grupo de captura 5' ("Z") opcional (Figura 48, etapa B). Después de ligamiento en las dos uniones de ligamiento entre el segmento de ADN diana y la segunda sonda oligonucleotídica para formar el producto de ligamiento circularizado de la Figura 48, etapa C, una polimerasa (diamantes rellenos) que tiene actividad de desplazamiento de cadena extiende la primera sonda oligonucleotídica usando el ADN circularizado que contiene producto de ligamiento como molde (Figura 48, etapa D). La amplificación por círculo rodante genera un producto de extensión primario que contiene secuencias lineales en tándem que son complementarias al producto de ligamiento circularizado (Figuras 48, etapa D). El producto de extensión primario es adecuado para secuenciación usando los métodos que se describen en el presente documento. El grupo Z 5' opcional puede capturarse sobre un soporte sólido antes o después de la amplificación por círculo rodante. Una vez capturado, el producto de ligamiento circular unido a cebador o la extensión del mismo pueden liberarse del soporte sólido mediante escisión en el enlace escindible, ya sea antes o después de la amplificación por círculo rodante.

La Figura 49 y la Figura 50 muestran un proceso para producir construcciones de ácido nucleico monocatenarias quiméricas circulares adecuado para detectar sitios de AciI ("m") metilados localizados entre sitios de HaeIII en regiones genómicas de ADNcf o ADN genómico total cortado. El ADN genómico se escinde con AciI (triángulos rellenos, GCGG) y HaeIII (triángulos rellenos, GGCC) para generar extremos 3' y 5' competentes para ligamiento (Figuras 49, etapa A, y 50, etapa A). Como se muestra en las Figuras 49, etapa B, y 50, etapa B, las sondas oligonucleotídicas dúplex se hibridan con los segmentos de ADN diana escindidos. En la divulgación representada en la Figura 49, las sondas dúplex comprenden una primera cadena de la sonda oligonucleotídica que contiene secuencias nucleotídicas complementarias a los lados 5' y 3' del segmento de ADN diana, que están separadas por una parte adicional. La parte adicional comprende una parte de identificador único, y/o una parte de identificador de paciente, y/o una o más secuencias de unión de cebador (Figura 49, etapa B). La segunda sonda oligonucleotídica de las sondas oligonucleotídicas dúplex (línea gruesa de color negro con bucle) contiene una secuencia que es complementaria a la parte adicional de la primera sonda oligonucleotídica (Figura 49, etapa B). La región en bucle de la segunda sonda oligonucleotídica representa una región no complementaria. Como se muestra en la Figura 49, etapa C, la hibridación de las sondas dúplex con los segmentos de ADN genómico escindidos crea dos uniones competentes para ligamiento, es decir, entre el extremo 3' del segmento de ADN y el extremo 5' de la segunda sonda oligonucleotídica, y entre el extremo 3' de la segunda sonda oligonucleotídica y el extremo 5' del segmento genómico escindido. Una ligasa (círculos rellenos) sella covalentemente las uniones de ligamiento para crear productos de ligamiento circulares que contienen segmentos de ADN genómico metilados (Figura 49, etapa C).

Como se muestra en la Figura 49, etapa D, la digestión con exonucleasa retira todos los productos sin ligar o con mellas dejando solo los productos de ligamiento circulares monocatenarios deseados que son adecuados para secuenciación circular usando cualquiera de los métodos que se describen en el presente documento.

En la divulgación representada en la Figura 50, la primera sonda oligonucleotídica de la sonda dúplex contiene secuencias complementarias a los lados 5' y 3' del segmento de ADN diana que están separadas por la parte nucleotídica adicional. Además, la primera sonda oligonucleotídica también tiene un grupo de captura 5' ("Z") opcional (Figura 50, etapa B). Después del ligamiento en las dos uniones de ligamiento entre el segmento de ADN diana y la segunda sonda oligonucleotídica para formar un producto de ligamiento metilado circularizado (Figura 50, etapa C), una polimerasa (diamantes rellenos) que tiene actividad de desplazamiento de cadena extiende la primera sonda oligonucleotídica usando el ADN circularizado que contiene producto de ligamiento como molde (Figura 50, etapa D). La amplificación por círculo rodante genera un producto de extensión primario que contiene secuencias lineales en tándem que son complementarias al producto de ligamiento circularizado (Figuras 50, etapa D). El producto de extensión primario es adecuado para secuenciación usando los métodos que se describen en el presente documento. El grupo Z 5' opcional puede capturarse sobre un soporte sólido antes o después de la amplificación por círculo rodante. Una vez capturado, el producto de ligamiento circular unido a cebador o la extensión del mismo pueden liberarse del soporte sólido mediante escisión en el enlace escindible, ya sea antes o después de la amplificación por círculo rodante.

La Figura 51 muestra un proceso para descubrir sitios de HinPlI adyacentes sin metilar (GCGC) en regiones conocidas de ADN genómico. El ADN genómico, ya sea aislado de células completas, o como ADNcf en el plasma, contiene extremos a través de procesos enzimáticos naturales o de corte. Estos deben ser bloqueados para las etapas posteriores añadiendo conectores cortos a los extremos 3' y 5' de los extremos del ADN (por ejemplo, añadiendo conectores mediante ligamiento). Los conectores de extremo 5' contienen un grupo de bloqueo (líneas gruesas de color negro), como se muestra en la Figura 51, etapa A. Escinden el ADN con conector añadido con HinPlI (GCGC) (triángulos rellenos) (Figura 51, etapa A). Solo los sitios de HinPlI adyacentes (GCGG) sin metilar en el ADN genómico original generan fragmentos no bloqueados cuando se escinden con HinPlI. Como se muestra en la Figura 51, etapa B, los conectores largos (líneas dobles parcialmente grises) que contienen una secuencia de identificador único y/o una secuencia de identificador de paciente se añaden a los fragmentos de ADN escindidos con HinPlI. Los conectores largos contienen un grupo de bloqueo de extremo 3' o una cadena principal que contiene tiofosfato (****) para inhibir la digestión posterior con exonucleasa 3' (triángulos rellenos). Solo los fragmentos con conectores añadidos a ambos lados permanecerán bicatenarios. Como se muestra en la Figura 51, etapa C, el extremo libre de los conectores se vuelve competente para ligamiento, ya sea mediante (i) fosforilación del extremo 5', (ii) retirada del grupo de bloqueo 3', (iii) uso de la actividad de nucleasa 5' para retirar por escisión la base solapante 5' de emparejamiento o la aleta para generar fosfato 5' competente para ligamiento, o (iv) cualquier combinación de (i), (ii), (iii). Las condiciones de ligamiento (círculos rellenos) se diseñan para favorecer la oligomerización. Como se muestra en la Figura 51, etapa D, los productos ligados están formados por secuencias de HinPlI adyacentes originalmente sin metilar en ADN genómico acopladas a una secuencia de identificador único y/o una secuencia de identificador de paciente. El producto final es adecuado para secuenciación posterior.

La Figura 52 muestra un proceso para descubrir sitios de AciI adyacentes metilados (GCGG) en regiones conocidas en todo el genoma. El ADN genómico se escinde con AciI (triángulos rellenos); m representa sitios metilados. Como se muestra en la Figura 52, etapa A, se añaden conectores cortos con un grupo de bloqueo 5' (líneas gruesas de color negro), por ejemplo, mediante ligamiento, al ADN digerido con AciI. El ADN con conector añadido se escinde con HaeIII (GGCC). Solo los sitios de HaeIII adyacentes (GGCC) con sitios de AciI metilados en el ADN genómico original generan fragmentos no bloqueados cuando se escinden con HaeIII. En la Figura 52, etapa B, los conectores largos (líneas dobles parcialmente grises) que contienen una secuencia de identificador único y/o una secuencia de identificador de paciente se añaden a los fragmentos de ADN escindidos con HaeIII. Los conectores largos contienen un grupo de bloqueo de extremo 3' o una cadena principal que contiene tiofosfato (****) para inhibir la digestión posterior con exonucleasa 3' (triángulos rellenos). Solo los fragmentos con conector añadido a ambos lados permanecerán bicatenarios. Como se muestra en la Figura 52, etapa C, el extremo libre de los conectores se vuelve competente para ligamiento, ya sea mediante (i) fosforilación del extremo 5', (ii) retirada del grupo de bloqueo 3', (iii) uso de la actividad de nucleasa 5' para retirar por escisión la base solapante 5' de emparejamiento o la aleta para generar fosfato 5' competente para ligamiento, o (iv) cualquier combinación de (i), (ii), (iii). Las condiciones de ligamiento (círculos rellenos) se diseñan para favorecer la oligomerización. Como se muestra en la Figura 52, etapa D, los productos ligados están formados por secuencias de HaeIII adyacentes metiladas originalmente en sitios de AciI en ADN genómico acopladas a una secuencia de identificador único y/o una secuencia de identificador de paciente. El producto final es adecuado para secuenciación posterior.

La Figura 53 y la Figura 54 muestran un proceso para producir construcciones de ácido nucleico monocatenarias quiméricas circulares adecuado para detectar sitios de HinPlI adyacentes sin metilar en regiones genómicas de ADNcf o ADN genómico total cortado. El ADN genómico se escinde con HinPlI (GCGC) para generar extremos 3' y 5' competentes para ligamiento, como se muestra en las Figuras 53, etapa A, y 54, etapa A. El tratamiento con bisulfito del ADN digerido con HinPlI convierte las C sin metilar en U. En la divulgación de la Figura 53, las sondas oligonucleotídicas que contienen secuencias en los extremos 5' y 3' complementarias a los lados 5' y 3' del segmento de ADN diana se hibridan con los segmentos de ADN escindidos (Figura 53, etapa B). Los oligonucleótidos contienen una secuencia de identificador único, una secuencia de identificador de paciente opcional, y un grupo de bloqueo opcional en un extremo. Una polimerasa (diamantes rellenos) que carece de actividad 5 '^3 ' extiende el extremo 3' del segmento de ADN diana, para dejarlo a nivel del fosfato competente para ligamiento en el extremo 5' de la diana, Figura 53, etapa C. La polimerasa también extiende la sonda oligonucleotídica en la diana, pero no escinde el grupo de bloqueo 5'. En la Figura 53, etapa D, una ligasa (círculos rellenos) sella covalentemente los extremos del segmento de ADN diana extendido para crear productos de ligamiento circulares. El grupo de bloqueo evita la circularización de la sonda oligonucleotídica. Como se muestra en la Figura 53, etapa E, la digestión con exonucleasa retira todos los productos sin ligar o con mellas dejando solo el ADN circular monocatenario deseado que comprende ADN diana original convertido con bisulfito con una secuencia de identificador único. El producto final es adecuado para amplificación por círculo rodante y secuenciación circular.

En el caso de la Figura 54, las sondas oligonucleotídicas contienen secuencias complementarias a los lados 5' y 3' del segmento de ADN diana que están separadas por la parte nucleotídica adicional. Además, las sondas oligonucleotídicas también tienen un grupo de bloqueo (3'-Blk) en el extremo 3', uno o más enlaces escindibles, en donde el enlace escindible se representa como "r", y un grupo de captura 5' ("Z") opcional (Figura 54, etapa B). Después del ligamiento del extremo 3' extendido y el extremo 5' del segmento de ADN diana para formar un producto de ligamiento circularizado (Figura 54, etapa C), el grupo de bloqueo 3' en la sonda oligonucleotídica se retira (por ejemplo, por escisión con RNasa H del enlace ribonucleotídico) (Figura 54, etapa D), y una polimerasa (diamantes rellenos) que carece de actividad 5 '^3 ' extiende la sonda oligonucleotídica usando el producto de ligamiento de ADN circularizado como molde (Figura 54, etapa E). La amplificación por círculo rodante genera un producto de extensión primario que contiene secuencias lineales en tándem que son complementarias al producto de ligamiento circularizado (Figuras 54, etapa E). El producto de extensión primario es adecuado para secuenciación usando los métodos que se describen en el presente documento. El grupo Z 5' opcional puede capturarse sobre un soporte sólido antes o después de la amplificación por círculo rodante. Una vez capturado, el producto de ligamiento circular unido a cebador o la extensión del mismo pueden liberarse del soporte sólido mediante escisión en el enlace escindible, ya sea antes o después de la amplificación por círculo rodante.

Las Figuras 55 y 56 muestran un proceso para producir construcciones de ácido nucleico monocatenarias quiméricas circulares adecuado para detectar sitios de HinPlI adyacentes sin metilar en regiones genómicas de ADNcf o ADN genómico total cortado. Como se muestra en las Figuras 55, etapa A, y 56, etapa A, el ADN genómico se escinde con HinPlI (GCGC) (triángulos rellenos) para generar extremos 3' y 5' competentes para ligamiento. El tratamiento con bisulfito del ADN digerido con HinPlI convierte las C sin metilar en U (Figuras 55, etapa A, y 56, etapa A). Como se muestra en las Figuras 55, etapa B, y 56, etapa B, las sondas oligonucleotídicas dúplex se hibridan con los segmentos de ADN diana escindidos. En la divulgación representada en la Figura 55, las sondas dúplex comprenden una primera cadena de la sonda oligonucleotídica que contiene secuencias nucleotídicas complementarias a los lados 5' y 3' del segmento de ADN diana, que están separadas por una parte adicional. La parte adicional comprende una parte de identificador único, y/o una parte de identificador de paciente, y/o una o más secuencias de unión de cebador (Figura 55, etapa B). La segunda sonda oligonucleotídica de las sondas oligonucleotídicas dúplex (línea gruesa de color negro con bucle) contiene una secuencia que es complementaria a la parte adicional de la primera sonda oligonucleotídica (Figura 55, etapa B). La región en bucle de la segunda sonda oligonucleotídica representa una región no complementaria. Como se muestra en la Figura 55, etapa C, la hibridación de las sondas dúplex con el ADN genómico digerido con HinPlI y tratado con bisulfito crea dos uniones competentes para ligamiento, es decir, entre el extremo 3' del segmento de ADN y el extremo 5' de la segunda sonda oligonucleotídica, y entre el extremo 3' de la segunda sonda oligonucleotídica y el extremo 5' del segmento de ADN. Una ligasa (círculos rellenos) sella covalentemente las uniones de ligamiento para crear productos de ligamiento circulares que contienen los segmentos de ADN genómico tratados con bisulfito (Figura 55, etapa C). Como se muestra en la Figura 55, etapa D, la digestión con exonucleasa retira todos los productos sin ligar o con mellas dejando solo los productos de ligamiento circulares monocatenarios deseados que son adecuados para secuenciación circular usando cualquiera de los métodos que se describen en el presente documento.

En la divulgación representada en la Figura 56, la primera sonda oligonucleotídica de la sonda dúplex contiene secuencias complementarias a los lados 5' y 3' del segmento de ADN diana que están separadas por la parte nucleotídica adicional. Además, la primera sonda oligonucleotídica también tiene un grupo de captura 5' ("Z") opcional (Figura 56, etapa B). Después del ligamiento en las dos uniones de ligamiento entre el segmento de ADN diana y la segunda sonda oligonucleotídica para formar un producto de ligamiento circularizado (Figura 56, etapa C), una polimerasa (diamantes rellenos) que tiene actividad de desplazamiento de cadena extiende la primera sonda oligonucleotídica usando el ADN circularizado que contiene producto de ligamiento como molde (Figura 56, etapa D). La amplificación por círculo rodante genera un producto de extensión primario que contiene secuencias lineales en tándem que son complementarias al producto de ligamiento circularizado (Figuras 56, etapa D). El producto de extensión primario es adecuado para secuenciación usando los métodos que se describen en el presente documento. El grupo Z 5' opcional puede capturarse sobre un soporte sólido antes o después de la amplificación por círculo rodante. Una vez capturado, el producto de ligamiento circular unido a cebador o la extensión del mismo pueden liberarse del soporte sólido mediante escisión en el enlace escindible, ya sea antes o después de la amplificación por círculo rodante.

La F igu ra 57 m ue s tra un p ro ceso para el d e scu b rim ie n to de s itio s de H inP lI a d ya ce n te s sin m e tila r (G C G C ) en regiones genómicas de ADNcf o ADN genómico total cortado. El ADN genómico, ya sea aislado de células completas, o como ADNcf en el plasma, contiene extremos a través de procesos enzimáticos naturales o de corte. Estos deben ser bloqueados para las etapas posteriores añadiendo conectores cortos a los extremos 3' y 5' de los extremos del ADN (por ejemplo, añadiendo conectores mediante ligamiento). Los conectores del extremo 5' contienen un grupo de bloqueo (líneas gruesas de color negro) como se muestra en la Figura 57, etapa A. Escinden el ADN con conector añadido con HinPlI (GCGC) (triángulos rellenos) (Figura 57, etapa A). Solo los sitios de HinPlI adyacentes (GCGG) sin metilar en el ADN genómico original generan fragmentos no bloqueados cuando se escinden con HinPlI. Como se muestra en la Figura 57, etapa B, se añaden conectores largos (líneas dobles parcialmente grises) que contienen una secuencia de identificador único y/o una secuencia de identificador de paciente a los fragmentos de ADN escindidos con HinPlI. Los conectores largos contienen un grupo de bloqueo de extremo 3' o una cadena principal que contiene tiofosfato (****) para inhibir la digestión posterior con exonucleasa 3' (triángulos rellenos). Solo los fragmentos con conector añadido a ambos lados permanecerán bicatenarios. Como se muestra en la Figura 57, etapa C, el extremo libre de los conectores se vuelve competente para ligamiento ya sea mediante (i) fosforilación del extremo 5', (ii) retirada del grupo de bloqueo 3', (iii) uso de la actividad de nucleasa 5' para retirar por escisión la base solapante 5' de emparejamiento o la aleta para generar fosfato 5' competente para ligamiento, o (iv) cualquier combinación de (i), (ii), (iii). Las condiciones de ligamiento (círculos rellenos) se diseñan para favorecer la oligomerización. Como se muestra en la Figura 57, etapa D, el tratamiento con bisulfito de los productos de ligamiento convierte las C sin metilar en U. Los productos ligados comprenden ADN convertido con bisulfito, dentro de secuencias de HinPlI adyacentes originalmente sin metilar en el ADN diana acoplado a una secuencia de identificador único y/o una secuencia de identificador de paciente. El producto final es adecuado para etapas adicionales y secuenciación posterior.

La Figura 58 y la Figura 59 muestran un proceso para producir construcciones de ácido nucleico monocatenarias quiméricas circulares adecuado para detectar sitios de "HphI" adyacentes sin metilar en regiones genómicas de ADNcf o ADN genómico total cortado. Como se muestra en las Figuras 58, etapa A, y 59, etapa A, se añaden conectores cortos (por ejemplo, mediante ligamiento) a fragmentos de ADNcf o ADN genómico cortado. El ADN con conector añadido se trata con bisulfito para convertir las C sin metilar en U. Se realiza una PCR limitada y los productos de PCR resultantes se escinden con HphI (solo GGCGA sin metilar ^ GGTGA) para generar extremos competentes para ligamiento (Figuras 58, etapa A, y 59, etapa A). En la divulgación de la Figura 58, las sondas oligonucleotídicas que contienen secuencias en los extremos 5' y 3' complementarias a los lados 5' y 3' de los segmentos de PCR diana digeridos se hibridan con los segmentos de ADN escindidos (Figura 58, etapa B). Las sondas oligonucleotídicas también contienen una parte nucleotídica adicional que contiene una o más de una secuencia de identificador único, una secuencia de identificador de paciente, y/o uno o más sitios de unión de cebador. Las sondas oligonucleotídicas también pueden tener un grupo de bloqueo en un extremo (por ejemplo, un grupo de bloqueo 5' como se muestra en la Figura 58, etapa B). Una polimerasa (diamantes rellenos) que carece de actividad 5 '^3 ' extiende el extremo 3' del segmento de ADN diana hibridado, copiando la parte adicional de la sonda y formando una unión para ligamiento con el extremo 5' del segmento de ADN diana hibridado (Figura 58, etapa C). La polimerasa también extiende la sonda oligonucleotídica usando el segmento de ADN diana como molde, pero no escinde el grupo de bloqueo en su extremo 5'. En la Figura 58, etapa D, una ligasa (círculo relleno) sella covalentemente la unión entre el extremo 3' extendido y el extremo 5' del segmento de ADN para crear productos de ligamiento circulares que contienen los segmentos de ADN digeridos con HphI generados por PCR. El grupo de bloqueo 5' en la sonda oligonucleotídica evita la circularización de la sonda oligonucleotídica. Alternativamente, se introduce una mella en un enlace escindible contenido en la parte adicional, por ejemplo, la parte adicional contiene un nucleótido uracilo que se escinde usando UDG. Como se muestra en la Figura 58, etapa E, la digestión con exonucleasa de todos los productos sin ligar o con mellas deja solo el ADN circular monocatenario que comprende el segmento de ADN digerido con HphI generado por PCR acoplado a una secuencia nucleotídica de identificación adicional, por ejemplo, una secuencia de identificador único. El producto final es adecuado para amplificación por círculo rodante y secuenciación circular.

En el caso de la Figura 59, las sondas oligonucleotídicas también contienen secuencias complementarias a los lados 5' y 3' de los segmentos de PCR diana digeridos que están separadas por la parte nucleotídica adicional. Además, las sondas oligonucleotídicas también tienen un grupo de bloqueo (3'-Blk) en su extremo 3', uno o más enlaces escindibles, en donde el enlace escindible se representa como "r", y un grupo de captura 5' ("Z") opcional (Figura 59, etapa B). Después del ligamiento del extremo 3' extendido y el extremo 5' del segmento de PCR diana para formar un producto de ligamiento circularizado (Figura 59, etapa C), el grupo de bloqueo 3' en la sonda oligonucleotídica se retira (por ejemplo, por escisión con RNasa H del enlace ribonucleotídico) (Figura 59, etapa D), y una polimerasa (diamantes rellenos) que carece de actividad 5 '^3 ' extiende la sonda oligonucleotídica usando el producto de ligamiento de ADN circularizado como molde (Figura 59, etapa E). La amplificación por círculo rodante genera un producto de extensión primario que contiene secuencias lineales en tándem que son complementarias al producto de ligamiento circularizado (Figuras 58, etapa E). El producto de extensión primario es adecuado para secuenciación usando los métodos que se describen en el presente documento. El grupo Z 5' opcional puede capturarse sobre un soporte sólido antes o después de la amplificación por círculo rodante. Una vez capturado, el producto de ligamiento circular unido a cebador o la extensión del mismo pueden liberarse del soporte sólido mediante escisión en el enlace escindible, ya sea antes o después de la amplificación por círculo rodante.

Las F igu ras 60 y 61 m uestran un p ro ceso para p ro d u c ir co n s tru cc io n e s de ác ido nu c le ico m on oca te na rias quiméricas circulares adecuado para detectar sitios de "Hphl" adyacentes sin metilar en regiones genómicas de ADNcf o ADN genómico total cortado. Como se muestra en las Figuras 60, etapa A, y 61, etapa A, se añaden conectores cortos (por ejemplo, mediante ligamiento) a fragmentos de ADNcf o ADN genómico cortado. El ADN con conector añadido se trata con bisulfito para convertir las C sin metilar en U. Se realiza una PCR limitada y los productos de PCR resultantes se escinden con HphI (solo GGCGA sin metilar ^ GGTGA) para generar extremos competentes para ligamiento (Figuras 60, etapa A, y 61, etapa A). Como se muestra en las Figuras 60, etapa B, y 61, etapa B, las sondas oligonucleotídicas dúplex se hibridan con los segmentos de ADN diana escindidos. En la divulgación representada en la Figura 60, las sondas dúplex comprenden una primera cadena de la sonda oligonucleotídica que contiene secuencias nucleotídicas complementarias a los lados 5' y 3' de los segmentos de PCR diana. Estas partes específicas de diana de la primera sonda oligonucleotídica están separadas por una parte adicional que comprende una parte de identificador único, y/o una parte de identificador de paciente, y/o una o más secuencias de unión de cebador (Figura 60, etapa B). La segunda sonda oligonucleotídica de las sondas oligonucleotídicas dúplex (línea gruesa de color negro con bucle) contiene una secuencia que es complementaria a la parte adicional de la primera sonda oligonucleotídica (Figura 60, etapa B). La región en bucle de la segunda sonda oligonucleotídica representa una región no complementaria. Como se muestra en la Figura 60, etapa C, la hibridación de las sondas dúplex a los productos de PCR digeridos con HphI crea dos uniones competentes para ligamiento, es decir, entre el extremo 3' del segmento de ADN y el extremo 5' de la segunda sonda oligonucleotídica, y entre el extremo 3' de la segunda sonda oligonucleotídica y el extremo 5' del segmento de ADN. Una ligasa (círculos rellenos) sella covalentemente las uniones de ligamiento para crear productos de ligamiento circulares que contienen los segmentos digeridos con HphI (Figura 60, etapa C). Como se muestra en la Figura 60, etapa D, la digestión con exonucleasa retira todos los productos sin ligar o con mellas dejando solo los productos de ligamiento circulares monocatenarios deseados que son adecuados para secuenciación circular usando cualquiera de los métodos que se describen en el presente documento.

En el caso representado en la Figura 61, la primera sonda oligonucleotídica de la sonda dúplex contiene secuencias complementarias a los lados 5' y 3' del segmento de ADN diana que están separadas por la parte nucleotídica adicional. Además, la primera sonda oligonucleotídica también tiene un grupo de captura 5' ("Z") opcional (Figura 61, etapa B). Después del ligamiento en las dos uniones de ligamiento entre el segmento de PCR digerido con HphI y la segunda sonda oligonucleotídica para formar un producto de ligamiento circularizado (Figura 61, etapa C), una polimerasa (diamantes rellenos) que tiene actividad de desplazamiento de cadena extiende la primera sonda oligonucleotídica usando el producto de ligamiento circularizado como molde (Figura 61, etapa D). La amplificación por círculo rodante genera un producto de extensión primario que contiene secuencias lineales en tándem que son complementarias al producto de ligamiento circularizado (Figuras 61, etapa D). El producto de extensión primario es adecuado para secuenciación usando los métodos que se describen en el presente documento. El grupo Z 5' puede capturarse sobre un soporte sólido antes o después de la amplificación por círculo rodante. Una vez capturado, el producto de ligamiento circular unido a cebador o la extensión del mismo pueden liberarse del soporte sólido mediante escisión en el enlace escindible, ya sea antes o después de la amplificación por círculo rodante.

La Figura 62 muestra un proceso para descubrir sitios de HphI adyacentes sin metilar en regiones genómicas de ADNcf o ADN genómico total cortado. El ADN genómico, ya sea aislado de células completas, o como ADNcf en el plasma, contiene extremos a través de procesos enzimáticos naturales o de corte. Estos deben ser bloqueados para las etapas posteriores añadiendo conectores cortos a los extremos 3' y 5' de los extremos del ADN (por ejemplo, añadiendo conectores mediante ligamiento). Los conectores del extremo 5' contienen un grupo de bloqueo (líneas gruesas de color negro), como se muestra en la Figura 62, etapa A. El ADN con conector añadido se trata con bisulfito para convertir las C sin metilar en U. Como se muestra en la Figura 62, etapa B, la amplificación por PCR limitada con cebadores bloqueados en el extremo 5' genera productos bicatenarios sin metilar. Solo los sitios de HphI adyacentes (GGCGA sin metilar ^ GGTGA) que no estaban metilados en la diana original generan fragmentos no bloqueados cuando se escinden con HphI (triángulos rellenos). Como se muestra en la Figura 62, etapa C, se añaden conectores (líneas dobles rellenas de color gris) que contienen una secuencia de identificador único y/o una secuencia de identificador de paciente a los fragmentos de ADN escindidos con HphI. Los conectores contienen un grupo de bloqueo de extremo 3' o una cadena principal que contiene tiofosfato (****) para inhibir la digestión posterior con exonucleasa 3' (triángulos rellenos). Solo los fragmentos con conectores añadidos a ambos lados permanecerán bicatenarios. Como se muestra en la Figura 62, etapa D, el extremo libre de los conectores se vuelve competente para ligamiento, ya sea mediante (i) fosforilación del extremo 5', (ii) retirada del grupo de bloqueo 3', (iii) uso de la actividad de nucleasa 5' para retirar por escisión la base solapante 5' de emparejamiento o la aleta para generar fosfato 5' competente para ligamiento, o (iv) cualquier combinación de (i), (ii), (iii). Las condiciones de ligamiento (círculos rellenos) se diseñan para favorecer la oligomerización. Como se muestra en la Figura 62, etapa E, los productos ligados comprenden un complemento de ADN convertido con bisulfito, dentro de secuencias de HphI adyacentes originalmente sin metilar en ADN genómico con una secuencia de identificador único y/o una secuencia de identificador de paciente opcional. El producto final es adecuado para etapas adicionales opcionales y secuenciación posterior.

Otro enfoque adecuado para generar las diferentes construcciones de ácido nucleico monocatenarias quiméricas circulares de la colección implica proporcionar una muestra que contiene uno o más segmentos de ADN genómico diana que contienen potencialmente una o más diferencias de bases o uno o más restos metilados y añadir secuencias de conectores nucleotídicos a los extremos 3' y 5' de los segmentos de ADN genómico diana. Los conectores nucleotídicos añadidos comprenden opcionalmente (i) la secuencia de identificador de paciente, (ii) la primera parte específica de cebador de soporte sólido, (iii) la segunda parte específica de cebador de soporte sólido, y/o (iv) la secuencia de identificador único. Se proporcionan una o más primeras sondas oligonucleotídicas, en donde cada primera sonda oligonucleotídica comprende (a) una parte complementaria a una parte del conector 3' del segmento de ADN genómico diana con conector añadido, (b) una parte complementaria a la parte del conector 5' del segmento de ADN genómico diana con conector añadido, y (c) opcionalmente una parte adicional. La parte adicional comprende opcionalmente (i) la secuencia de identificador de paciente, (ii) la primera parte específica de cebador de soporte sólido, (iii) la segunda parte específica de cebador de soporte sólido y/o (iv) la secuencia de identificador único. La muestra y las una o más primeras sondas oligonucleotídicas se ponen en contacto en condiciones eficaces para que las partes en los extremos 3' y 5' de las primeras sondas oligonucleotídicas se hibriden de forma específica de acuerdo con las bases con conectores complementarios de los segmentos de ADN genómico diana con conector añadido, si estuvieran presentes en la muestra. Se generan una o más uniones competentes para ligamiento adecuadas para acoplar los extremos 3' y 5' del segmento de ADN genómico diana con conector añadido hibridado a la primera sonda oligonucleotídica. El ligamiento del segmento de ADN genómico diana con conector añadido de las una o más uniones de ligamiento forma diferentes construcciones de ácido nucleico monocatenarias quiméricas circulares de la colección.

La Figura 63 muestra procesos relacionados a modo de ejemplo para producir construcciones de diana de ácido nucleico monocatenarias quiméricas circulares adecuado para secuenciación, como se ha descrito anteriormente. En estos casos, los segmentos genómicos originales comprenden segmentos de ADNcf (~160 pb) o segmentos de ADN genómico cortado (~160 pb) que contienen, por ejemplo, mutaciones específicas de tumor, SNP, o secuencias repetitivas polimórficas. El proceso comienza con el ligamiento de conectores cortos en los extremos 3' y 5' de los segmentos de ADN (barras gruesas de color negro, Figuras 63, etapa A). Los conectores añadidos del proceso representado en la Figura 63, panel de la derecha, contienen un grupo fosfato 5' competente para ligamiento mientras que los conectores añadidos del proceso representado en la Figura 63, panel de la izquierda, no contienen un grupo fosfato 5' competente para ligamiento. Las sondas oligonucleotídicas (línea gruesa de color negro) que contienen secuencias nucleotídicas complementarias a los conectores en los extremos 5' y 3' del segmento de ADN diana y un grupo de bloqueo 5' se hibridan con sus respectivos segmentos de ADN diana (Figura 63, etapa A). Las partes específicas de conector de la sonda oligonucleotídica están separadas por una parte adicional. Esta parte adicional comprende una parte de identificador único opcional, y/o una parte de identificador de paciente, y/o una o más secuencias de unión de cebador. Una polimerasa (diamante relleno) extiende el extremo del conector 3' del segmento de ADN diana hibridado para formar una unión de ligamiento con el extremo del conector 5' del segmento de ADN diana (Figura 63, etapa B). En la divulgación que se muestra en la Figura 63, etapa C, una polimerasa que tiene actividad de nucleasa 5' escinde una base solapante 5' de emparejamiento en el conector 5' después de la extensión para generar un fosfato 5' competente para ligamiento. En la divulgación representada en la Figura 63, etapa C, panel de la derecha, puede usarse una polimerasa que carece de actividad de nucleasa 5 '^3 ' porque el conector 5' del segmento de ADN diana contiene un extremo 5' competente para ligamiento. La polimerasa también extiende el extremo 3' de la sonda oligonucleotídica, usando el segmento de ADN diana circularizado hibridado como molde hasta que alcanza el grupo de bloqueo 5' de la sonda. Como se muestra en la Figura 63, etapa D, una ligasa (círculo relleno) sella covalentemente el extremo 3' extendido y el extremo 5' de los segmentos de ADN para crear productos de ligamiento circulares. El grupo de bloqueo 5' en la sonda oligonucleotídica evita la circularización de la sonda oligonucleotídica extendida con polimerasa. Como se muestra en la Figura 63, etapa E, la digestión con exonucleasa retira todos los productos sin ligar o con mellas dejando solo los productos de ligamiento de ADN circularizados monocatenarios deseados. Estos productos de ligamiento circularizados son adecuados para la captura opcional con secuencias únicas o repetitivas (por ejemplo, repeticiones de cuatro nucleótidos), o para la extensión por círculo rodante con cebadores dirigidos únicos, y secuenciación posterior.

La Figura 64 muestra otro proceso a modo de ejemplo para producir construcciones de diana de ácido nucleico monocatenarias quiméricas circulares adecuado para secuenciación, como se ha descrito anteriormente. En este caso, el segmento de ADN genómico diana es un segmento de ADN genómico diana bicatenario que tiene extremos 5' y 3' adecuados para ligamiento o extensión (Figuras 64, etapa B). El segmento de ADN genómico diana se añade con secuencias de conector nucleotídico. De acuerdo con esta divulgación, los conectores nucleotídicos comprenden primeros y segundos oligonucleótidos conectores, en donde (i) el primer oligonucleótido conector comprende una parte monocatenaria 5', uno o más nucleótidos o análogos nucleotídicos escindibles, una secuencia de identificador único, un extremo 3' que es complementario al segundo oligonucleótido conector, y un OH 3', y (ii) el segundo oligonucleótido conector comprende un extremo OH 5', una parte 5' que es complementaria al primer oligonucleótido conector, y un extremo bloqueado 3' opcional. El segundo oligonucleótido conector se hibrida con su parte complementaria del primer oligonucleótido conector para formar conectores compuestos adecuados para añadirse al segmento de ADN genómico diana.

Como se muestra en la Figura 64, etapas C-D, el ADN genómico diana bicatenario se mezcla con los conectores compuestos, una ligasa, y una polimerasa en condiciones adecuadas para (i) ligamiento del OH 3' del primer oligonucleótido conector del conector compuesto al extremo 5' de los segmentos de ADN genómico diana bicatenario, (ii) extensión con polimerasa del extremo 3' del segmento de ADN genómico diana bicatenario para crear una copia complementaria del primer oligonucleótido conector del conector compuesto, y (iii) escisión de los uno o más nucleótidos o análogos nucleotídicos para formar los segmentos de ADN genómico diana con conector añadido. Las sondas oligonucleotídicas (línea fina de color negro y doble línea) que contienen secuencias nucleotídicas complementarias a las partes monocatenarias en los extremos 5' y 3' de los conectores del segmento de ADN diana se hibridan con sus respectivos segmentos de ADN diana (Figura 64, etapa F). Las sondas oligonucleotídicas contienen la secuencia de identificador de paciente, sitios de unión de cebador, y una cola con desemparejamientos en el extremo 3'. Una polimerasa (diamante relleno) extiende el extremo del conector 3' del segmento de ADN diana hibridado para formar una unión de ligamiento con el extremo del conector 5' del segmento de ADN diana (Figura 64, etapa G). Como se muestra en la Figura 64, etapa H, una ligasa (círculo relleno) sella covalentemente los extremos 3' y 5' del segmento de ADN con conector añadido para crear productos de ligamiento circulares. Estos productos de ligamiento circularizados son adecuados para la captura opcional con secuencias únicas o repetitivas (por ejemplo, repeticiones de cuatro nucleótidos), o para la extensión por círculo rodante con cebadores dirigidos únicos, y secuenciación posterior.

La Figura 65 muestra procesos relacionados a modo de ejemplo para producir construcciones de diana de ácido nucleico monocatenarias quiméricas circulares adecuados para secuenciación, como se ha descrito anteriormente. En estas divulgaciones, los segmentos genómicos originales comprenden segmentos de ADNcf (~160 pb) o segmentos de ADN genómico cortado (~160 pb) que contienen, por ejemplo, mutaciones específicas de tumor, SNP, o secuencias repetitivas polimórficas. El proceso comienza con el ligamiento de conectores compuestos que comprenden partes tanto monocatenarias (líneas dobles más finas y de color negro) como bicatenarias (barras gruesas de color negro) en los extremos 3' y 5' de los segmentos de ADN (Figura 65, etapa A). Los conectores añadidos del proceso representado en la Figura 65, etapa B, panel de la derecha, contienen un grupo fosfato 5' competente para ligamiento mientras que los conectores añadidos del proceso representado en la Figura 65, etapa B, panel de la izquierda, no contienen un grupo fosfato 5' competente para ligamiento. Las sondas oligonucleotídicas (línea fina de color negro y doble línea) que contienen secuencias nucleotídicas complementarias a las partes monocatenarias en los extremos 5' y 3' de los conectores del segmento de ADN diana se hibridan con sus respectivos segmentos de ADN diana. Una polimerasa (diamante relleno) extiende el extremo del conector 3' del segmento de ADN diana hibridado para formar una unión de ligamiento con el extremo del conector 5' del segmento de ADN diana (Figura 65, etapa C). En la divulgación que se muestra en la Figura 65, etapa C, una polimerasa que tiene actividad de nucleasa 5' escinde una base solapante 5' de emparejamiento en el conector 5' después de la extensión para generar un fosfato 5' competente para ligamiento. Como se muestra en la Figura 65, etapa D, una ligasa (círculo relleno) sella covalentemente los extremos 3' y 5' del segmento de ADN con conector añadido para crear productos de ligamiento circulares. Como se muestra en la Figura 65, etapa E, la digestión con exonucleasa retira todos los productos sin ligar o con mellas dejando solo los productos de ligamiento de ADN circularizados monocatenarios deseados. Estos productos de ligamiento circularizados son adecuados para la captura opcional con secuencias únicas o repetitivas (por ejemplo, repeticiones de cuatro nucleótidos), o para la extensión por círculo rodante con cebadores dirigidos únicos, y secuenciación posterior.

El enfoque convencional para añadir conectores se ilustra en la Figura 66 y es bien conocido por los expertos en la materia. En estas divulgaciones, los segmentos genómicos originales comprenden segmentos de ADNcf (~160 pb) o segmentos de ADN genómico cortado (~160 pb) que contienen, por ejemplo, mutaciones específicas de tumor, SNP, o secuencias repetitivas polimórficas. Los extremos del ADN fragmentado se reparan usando una polimerasa con actividad de exonucleasa 3 '^5 ' tal como polimerasa T4 o ADN polimerasa I, fragmento grande (Klenow), que extiende los extremos 3' rebajados, o degrada los extremos de protuberancia 3' hasta que se dejan al nivel del extremo 5' (Figura 66, etapa A). Los extremos 5' se fosforilan con quinasa T4, y se añade una base A adicional al extremo 3' usando ADN polimerasa I, fragmento grande (Klenow), que carece de actividad de nucleasa 3 '^5 ' (Figura 66, etapas B y C). El ligamiento en conectores con protuberancias T 3' se realiza usando ligasa T4 (Figura 66, etapa D). En esta figura, las partes de cebador 1 y 3 de los conectores se usan para determinar las secuencias de identificador de paciente y las secuencias de identificador único 1 y 2 opcionales, respectivamente. Las partes de cebador 2 y 3' se usan para secuenciar el ADN diana directo e inverso, respectivamente. Este producto es adecuado para la circularización de la cadena diana original superior o inferior, como se ilustra en las Figuras 63 y 65 mencionadas anteriormente.

Aunque el enfoque convencional proporciona la oportunidad de introducir secuencias únicas en las partes monocatenarias de los conectores, estas secuencias no permiten la correspondencia inequívoca de una secuencia de cadena superior con una secuencia de cadena inferior. Para conseguir este tipo de construcción, el enfoque convencional se modifica como se ilustra en la Figura 67. En estas divulgaciones, los segmentos genómicos originales comprenden segmentos de ADNcf (~160 pb) o segmentos de ADN genómico cortado (~160 pb) que contienen, por ejemplo, mutaciones específicas de tumor, SNP, o secuencias repetitivas polimórficas. Los extremos del ADN fragmentado se reparan usando una polimerasa con actividad de exonucleasa 3 '^5 ' tal como polimerasa T4 o ADN polimerasa I, fragmento grande (Klenow), que extiende los extremos 3' rebajados, o degrada los extremos de protuberancia 3' hasta que se dejan al nivel del extremo 5' (Figura 67, etapa A). Los extremos 5' se fosforilan opcionalmente con quinasa T4 (Figura 67, etapa B), y se añade una protuberancia de base A a los extremos 3' usando ADN polimerasa I, fragmento grande (Klenow), que carece de actividad de nucleasa 3'^5'.

En esta divulgación, la secuencia del conector comprende un primer, un segundo y un tercer oligonucleótidos. El primer oligonucleótido comprende la primera parte específica de cebador de soporte sólido, una o más primeras secuencias de identificador de paciente, un primer sitio de unión de cebador de secuenciación, y un extremo 3' que es complementario al tercer oligonucleótido. El segundo oligonucleótido comprende una región complementaria al extremo 5' del tercer oligonucleótido, y el tercer oligonucleótido comprende un extremo 5' que es complementario al segundo oligonucleótido, un segundo sitio de unión de cebador de secuenciación, una parte complementaria al extremo 3' del primer oligonucleótido, una segunda secuencia de identificador de paciente, y la segunda parte específica de cebador de soporte sólido. El tercer oligonucleótido se hibrida con partes complementarias del primer y segundo oligonucleótidos para formar conectores compuestos. Como se muestra en la Figura 67, etapa D, los segmentos de ADN genómico diana bicatenario se mezclan con los conectores compuestos, una ligasa, y una polimerasa en condiciones adecuadas para ligamiento del segundo y tercer oligonucleótidos de los conectores compuestos a los extremos 5' y 3', respectivamente, de los segmentos de ADN genómico diana bicatenario. Una polimerasa extiende el extremo 3' del primer oligonucleótido del conector compuesto para crear una unión de ligamiento con el segundo oligonucleótido del conector compuesto en su extremo 5' (Figura 67, etapa E). Si el extremo 5' del segundo oligonucleótido del conector compuesto no está fosforilado, la polimerasa debería tener actividad de nucleasa 5 '^3 ' para liberar un fosfato 5' adecuado para ligamiento. Si el segundo oligonucleótido está fosforilado en el extremo 5', la polimerasa debería carecer de actividad de nucleasa 5'^3', permitiendo la extensión hasta el conector, seguido del sellado de la mella por ligasa. Como se muestra en la Figura 67, etapa E, la ligasa sella covalentemente el primer y el segundo oligonucleótidos del conector compuesto en dicha unión de ligamiento para formar ADN genómico diana bicatenario con conector añadido. En esta divulgación, las partes de cebador 1 y 3 de los conectores se usan para determinar secuencias de identificador de paciente 1 y 2 opcionales, respectivamente (véase la Figura 67, etapa F). Las partes de cebador 2 y 3' de los conectores se usan para secuenciar el ADN diana directo e inverso, así como las secuencias de identificador único 1 y 2, respectivamente. Este producto es adecuado para la circularización de cada una de las cadenas diana originales como se ilustra en las Figuras 63 y 65 mencionadas anteriormente. Después de determinar las secuencias de estas cadenas, las secuencias de identificador único 1 y 2 permitirán la correspondencia inequívoca de una secuencia de cadena superior con una secuencia de cadena inferior, permitiendo de ese modo la verificación independiente de la mutación de baja abundancia en ambas cadenas de la molécula diana original.

La Figura 68 usa a modo de ejemplo otro enfoque para añadir secuencias de cebador a los extremos del ADN diana, de modo que sea adecuado para producir construcciones de diana de ácido nucleico monocatenarias quiméricas circulares, y permitir la correspondencia inequívoca de una secuencia de cadena superior con una secuencia de cadena inferior. En estas divulgaciones, los segmentos genómicos originales comprenden segmentos de ADNcf (~160 pb) o segmentos de ADN genómico cortado (~160 pb) que contienen, por ejemplo, mutaciones específicas de tumor, SNP, o secuencias repetitivas polimórficas. Los extremos del ADN fragmentado se reparan usando una polimerasa con actividad de exonucleasa 3 '^5 ' tal como polimerasa T4 o ADN polimerasa I, fragmento grande (Klenow), que extiende los extremos 3' rebajados, o degrada los extremos de protuberancia 3' hasta que se dejan al nivel del extremo 5' (Figura 68, etapa A). Los extremos 5' están fosforilados opcionalmente con quinasa T4 (Figura 68, etapa B). Una transcriptasa inversa, tal como transcriptasa inversa del virus de la leucemia murina de Moloney (M-MLV RT, New England Biolabs), o transcriptasa inversa Superscript II o III (Life Technologies), añade tres bases C al extremo 3' de cada diana (Figura 68, etapa C).

En esta divulgación, las secuencias de conector comprenden (i) un primer oligonucleótido conector que comprende la primera parte específica de cebador de soporte sólido, una o más primeras secuencias de identificador de paciente, un primer sitio de unión de cebador de secuenciación, y bases de riboguanosina en el extremo 3', y (ii) un segundo oligonucleótido conector que comprende un segundo sitio de unión de cebador de secuenciación, una segunda secuencia de identificador de paciente, la segunda parte específica de cebador de soporte sólido, y una parte 5' que es complementaria al primer oligonucleótido. Los segmentos de ADN genómico diana bicatenario se mezclan con las secuencias de conector, una transcriptasa inversa, y una ligasa para formar una mezcla de reacción de transcripción inversa-ligamiento. Las bases de riboguanosina del primer oligonucleótido conector se hibridan con la protuberancia de citosina 3' del segmento de ADN genómico diana bicatenario (Figura 68, etapa D). La transcripta inversa experimenta un cambio de cadena y el extremo hibridado 3' del segmento de ^aDⁿgenómico diana bicatenario se extiende para generar una secuencia complementaria a la primera secuencia de identificador de paciente del primer oligonucleótido conector y una unión de ligamiento con el extremo 5' del segundo oligonucleótido conector (Figura 68, etapa D). Los extremos 3' extendidos de los segmentos de ADN genómico diana bicatenario se ligan al extremo 5' del segundo oligonucleótido en la unión de ligamiento. La RNasaH2 escinde las bases de riboguanosina del primer oligonucleótido conector, liberando un OH 3' adecuado para la extensión mediada por polimerasa (Figura 68, etapa E). El extremo 3' del primer oligonucleótido conector se extiende y se liga al extremo 5' del ADN genómico diana bicatenario (Figura 68, etapa F). Si el segundo conector o el ADN diana no están fosforilados en el extremo 5', la polimerasa debería tener actividad de nucleasa 5 '^3 ' para liberar un fosfato 5' adecuado para ligamiento. Si el segundo conector y la diana están fosforilados, como se muestra en la Figura 68, la polimerasa debería carecer de actividad de nucleasa 5'^3', permitiendo la extensión hasta el extremo 5' del segundo cebador o diana respectivamente, seguido del sellado de la mella por ligasa. Como se muestra en la Figura 68, etapa G, las posiciones del cebador 1 y 3 de los conectores se usaron para determinar secuencias de identificador de paciente 1 y 2 opcionales, respectivamente. Las partes de cebador 2 y 3' de los conectores se usan para secuenciar el ADN diana directo e inverso, así como las secuencias de identificador único 1 y 2, respectivamente. Este producto es adecuado para la circularización de cada una de las cadenas diana originales, como se ilustra en las Figuras 63 y 65 mencionadas anteriormente. Después de determinar las secuencias de estas cadenas, las secuencias de identificador único 1 y 2 permitirán la correspondencia inequívoca de una secuencia de cadena superior con una secuencia de cadena inferior, permitiendo de ese modo la verificación independiente de la mutación de baja abundancia en ambas cadenas de la molécula diana original.

La Figura 69 usa a modo de ejemplo otro enfoque para añadir secuencias de cebador a los extremos del ADN diana, de modo que sea adecuado para producir construcciones de diana de ácido nucleico monocatenarias quiméricas circulares. En esta divulgación, los segmentos genómicos originales comprenden segmentos de ADNcf (~160 pb) o segmentos de ADN genómico cortado (~160 pb) que contienen, por ejemplo, mutaciones específicas de tumor, SNP, o secuencias repetitivas polimórficas. Los fragmentos se desnaturalizan para hacer que las dianas sean monocatenarias (Figura 69, etapa A). Los extremos 3' se terminan con transferasa terminal usando una mezcla de dATP y ATP, de modo que se añada una media de 50-100 bases y haya al menos una incorporación de rATP escindible en las primeras 30 bases (Figura 69, etapa B). De acuerdo con esta divulgación, se proporcionan uno o más conjuntos de oligonucleótidos, en donde cada conjunto comprende i) un oligonucleótido cebador que comprende la segunda parte específica de cebador de soporte sólido, una o más secuencias de identificador de paciente, un sitio de unión de cebador de secuenciación, y una región de repetición mononucleotídica que comprende uno o más nucleótidos escindibles que es complementaria a la región de extensión del segmento de ADN genómico diana, y (ii) un primer oligonucleótido conector que comprende la primera parte específica de cebador de soporte sólido, una o más secuencias de identificador de paciente, un sitio de unión de cebador de secuenciación. El primer oligonucleótido conector tiene dos bases riboguanosina y una base guanosina con ácido nucleico bloqueado en su extremo 3' (rGrG+G). Como se representa en la Figura 69, etapa B, el proceso implica la hibridación del oligonucleótido cebador que contiene sitios de unión de cebador 5' (3 y 4) con un identificador de paciente y un identificador único opcionales (2), una secuencia VN (T,dU)30 en el extremo 3', y enlaces escindibles (dU) con la región de extensión de la transferasa terminal del ADN genómico diana (Figura 69, etapa B). Una transcriptasa inversa, tal como la transcriptasa inversa del virus de la leucemia murina de Moloney (M-MLV RT, New England Biolabs), o la transcriptasa inversa Superscript II o III (Life Technologies), extiende el cebador para hacer una copia de longitud completa de la diana, y añade tres bases C al extremo 3' de la secuencia diana extendida (Figura 68, etapa C). El primer oligonucleótido conector que tiene rGrG+G 3' se hibrida con las tres bases C de la secuencia diana extendida, como se muestra en la Figura 68, etapa C. La transcripta inversa experimenta un cambio de cadena y copia el primer oligonucleótido conector (Figura 69, etapa D). La RNasaH2 escinde las bases de ADN, liberando el OH 3' de ADN en la cola A, así como adyacente al rGrG+G del primer oligonucleótido conector (Figura 69, etapa D). Una polimerasa con actividad de nucleasa 5 '^3 ' replica las regiones del oligonucleótido cebador, extiende el primer oligonucleótido conector, y libera el fosfato 5' en el ADN diana (Figura 69, etapa F). Una ligasa sella la mella del primer oligonucleótido conector para ligar el primer conector a la cadena diana original (Figura 69, etapa G). Posteriormente, se introducen mellas en los enlaces escindibles del oligonucleótido cebador (por ejemplo, escisión con UDG de dU), de modo que la copia de la diana no sufra más amplificación, ya que carece de la primera región de unión de cebador. En esta figura, las partes de cebador 1 y 3 se usan para determinar secuencias de identificador de paciente y secuencias de identificador único opcionales 1 y 2, respectivamente (Figura 69, etapa H). Las partes de cebador 2 y 3' se usan para secuenciar el ADN diana directo e inverso, respectivamente. Cuando se usa el cebador 3', para el ciclo inicial se usa TTP sin finalizador, de modo que el instrumento no pierda tiempo secuenciando la región T30. Este producto es adecuado para la circularización de la cadena diana original superior o inferior, como se ilustra en las Figuras 63 y 65 mencionadas anteriormente.

La Figura 70 muestra otro proceso a modo de ejemplo para producir construcciones de diana de ácido nucleico monocatenarias quiméricas circulares adecuado para secuenciación, como se ha descrito anteriormente. En estas divulgaciones, los segmentos genómicos originales comprenden segmentos de ADNcf (~160 pb) o segmentos de ADN genómico cortado (~160 pb) que contienen, por ejemplo, mutaciones específicas de tumor, SNP, o secuencias repetitivas polimórficas. El proceso comienza con el ligamiento de conectores cortos en los extremos 3' y 5' de los segmentos de ADN (barras gruesas de color negro, Figura 70, etapa A). El extremo 5' de los conectores añadidos contiene opcionalmente un fosfato competente para ligamiento. Las sondas oligonucleotídicas que contienen secuencias complementarias a una parte única o repetitiva (es decir, repetición de AGAT) del segmento de ADN diana, y los lados 5' y 3' de los conectores se hibridan con sus respectivos segmentos de ADN diana como se muestra en la Figura 70, etapa B. Las sondas oligonucleotídicas también contienen una parte adicional que contiene una o más de una secuencia de identificador único, una secuencia de identificador de paciente, un fosfato 5' competente para ligamiento, y un enlace escindible (dU). Una polimerasa (diamantes rellenos) extiende los extremos 3' hibridados del segmento de ADN diana y la sonda oligonucleotídica (Figura 70, etapa C) para crear uniones de ligamiento con el extremo 5' correspondiente del segmento de ADN diana y la sonda, respectivamente. En ausencia de un fosfato 5' competente para ligamiento en el segmento diana o la sonda, la actividad de nucleasa 5' de la polimerasa escinde una base solapante 5' de emparejamiento para generar un fosfato 5' competente para ligamiento. Como se muestra en la Figura 70, etapa D, una ligasa (círculos rellenos) sella covalentemente los extremos adyacentes de la sonda oligonucleotídica y el segmento diana para crear productos de ligamiento interconectados circulares. Posteriormente, se introduce una mella en el enlace escindible de la sonda oligonucleotídica (por ejemplo, escisión con UDG de dU, triángulos rellenos). Como se muestra en la Figura 70, etapa E, la digestión con exonucleasa retira todos los productos sin ligar o con mellas dejando solo la construcción circular monocatenaria deseada que comprende un segmento de ADN diana original acoplado a una secuencia de identificador único. El producto final es adecuado para etapas adicionales opcionales y secuenciación posterior.

La F igu ra 71 m ue s tra o tro p ro ceso a m odo de e jem p lo para p ro d u c ir co n s tru cc io n e s de d ian a de ác ido nu c le ico monocatenarias quiméricas circulares adecuado para secuenciación, como se ha descrito anteriormente. En estas realizaciones, los segmentos genómicos originales comprenden segmentos de ADNcf (~160 pb) o segmentos de ADN genómico cortado (~160 pb) que contienen, por ejemplo, mutaciones específicas de tumor, SNP, o secuencias únicas. El proceso comienza con el ligamiento de conectores cortos en los extremos 3' y 5' de los segmentos de ADN (barras gruesas de color negro/blanco, Figura 71, etapa A). El extremo 5' de los conectores añadidos contiene opcionalmente un fosfato competente para ligamiento. Las sondas que contienen secuencias complementarias a una secuencia única del segmento de ADN diana y los lados 5' y 3' de los conectores se hibridan con sus respectivos segmentos de ADN diana, como se muestra en la Figura 71, etapa B. Las sondas oligonucleotídicas también contienen una parte adicional que contiene una o más de una secuencia de identificador único, una secuencia de identificador de paciente, un fosfato 5' competente para ligamiento opcional, y un enlace escindible (dU) opcional. En una divulgación, el extremo 3' de la sonda oligonucleotídica comprende además unas pocas bases adicionales y un grupo de bloqueo, que se libera para formar un OH 3' libre mediante escisión con una nucleasa solo cuando se hibrida con la diana, por ejemplo, una base de ribonucleótido como el grupo de bloqueo y RNasa H2 (estrella) como la nucleasa de escisión (Figura 71, etapa C). Una polimerasa (diamantes rellenos) extiende los extremos 3' hibridados del segmento de ADN diana y la sonda oligonucleotídica (Figura 71, etapa C) para crear uniones de ligamiento con el extremo 5' correspondiente del segmento de ADN diana y la sonda, respectivamente. En ausencia de un fosfato 5' competente para ligamiento en el segmento diana o la sonda, la actividad de nucleasa 5' de la polimerasa escinde una base solapante 5' de emparejamiento para generar un fosfato 5' competente para ligamiento. Como se muestra en la Figura 71, etapa D, una ligasa (círculos rellenos) sella covalentemente los extremos adyacentes de la sonda oligonucleotídica y el segmento diana para crear productos de ligamiento interconectados circulares. Posteriormente, se introduce una mella en el enlace escindible de la sonda oligonucleotídica (por ejemplo, escisión con UDG de dU, triángulos rellenos). Como se muestra en la Figura 71, etapa E, la digestión con exonucleasa retira todos los productos sin ligar o con mellas dejando solo la construcción circular monocatenaria deseada que comprende un segmento de ADN diana original acoplado a una secuencia de identificador de paciente o una secuencia de identificador único opcionales. El producto final es adecuado para etapas adicionales opcionales y secuenciación posterior.

La Figura 72 muestra otro proceso a modo de ejemplo para producir construcciones de diana de ácido nucleico monocatenarias quiméricas circulares adecuado para secuenciación, como se ha descrito anteriormente. En estas divulgaciones, los segmentos genómicos originales comprenden segmentos de ADNcf (~160 pb) o segmentos de ADN genómico cortado (~160 pb) que contienen, por ejemplo, mutaciones específicas de tumor, SNP, o secuencias únicas. El proceso comienza con el ligamiento de conectores cortos en los extremos 3' y 5' de los segmentos de ADN (barras gruesas de color negro/blanco, Figura 72, etapa A). El extremo 5' de los conectores añadidos contiene opcionalmente un fosfato competente para ligamiento. Las sondas que contienen secuencias complementarias a una secuencia única del segmento de ADN diana y los lados 5' y 3' de los conectores se hibridan con sus respectivos segmentos de ADN diana, como se muestra en la Figura 71, etapa B. Las sondas oligonucleotídicas también contienen una parte adicional que contiene una o más de una secuencia de identificador único, una secuencia de identificador de paciente, un fosfato 5' competente para ligamiento, y un enlace escindible (dU) opcional. En una divulgación, el extremo 3' de la sonda oligonucleotídica comprende además unas pocas bases adicionales y un grupo de bloqueo, que se libera para formar un OH 3' libre mediante escisión con una nucleasa solo cuando se hibrida con la diana, por ejemplo, una base de ribonucleótido como el grupo de bloqueo y RNasa H2 (estrella) como la nucleasa de escisión. El extremo OH 3' liberado es ahora adecuado para ligamiento directo al extremo fosforilado 5' cuando la sonda oligonucleotídica se hibrida en la diana (Figura 72, etapa C). Una polimerasa (diamantes rellenos) extiende los extremos 3' hibridados del segmento de ADN diana (Figura 72, etapa C) para crear uniones de ligamiento con el extremo 5' correspondiente del segmento de ADN diana. En ausencia de un fosfato 5' competente para ligamiento en el conector del segmento diana, la actividad de nucleasa 5' de la polimerasa escinde una base solapante 5' de emparejamiento para generar un fosfato 5' competente para ligamiento. Como se muestra en la Figura 72, etapa D, una ligasa (círculos rellenos) sella covalentemente los extremos adyacentes del segmento diana para crear productos de ligamiento interconectados circulares. Posteriormente, se introduce una mella en el enlace escindible de la sonda oligonucleotídica (por ejemplo, escisión con UDG de dU, triángulos rellenos). Como se muestra en la Figura 72, etapa E, la digestión con exonucleasa retira todos los productos sin ligar o con mellas dejando solo la construcción circular monocatenaria deseada que comprende un segmento de ADN diana original acoplado a una secuencia de identificador de paciente o una secuencia de identificador único opcionales. El producto final es adecuado para etapas adicionales opcionales y secuenciación posterior.

La Figura 73 muestra un proceso a modo de ejemplo para producir construcciones de diana de ácido nucleico monocatenarias quiméricas circulares con un oligonucleótido específico de diana hibridado que es adecuado para cebar la amplificación por círculo rodante y la secuenciación, como se ha descrito anteriormente. En estas divulgaciones, los segmentos genómicos originales comprenden segmentos de ADNcf (~160 pb) o segmentos de ADN genómico cortado (~160 pb) que contienen, por ejemplo, mutaciones específicas de tumor, SNP, o secuencias únicas. El proceso comienza con el ligamiento de conectores compuestos que comprenden partes tanto monocatenarias (líneas dobles más finas y de color negro) como bicatenarias (barras gruesas de color negro) en los extremos 3' y 5' de los segmentos de ADN (Figura 73, etapa A). Los conectores añadidos del proceso representado en la Figura 73, panel de la izquierda, contienen un grupo fosfato 5' competente para ligamiento, mientras que los conectores añadidos del proceso representado en la Figura 73, panel de la derecha, no contienen un grupo fosfato 5' competente para ligamiento. Las sondas oligonucleotídicas que contienen secuencias nucleotídicas complementarias a una secuencia única del segmento de ADN diana (líneas de color negro más gruesas), y a las partes monocatenarias en los extremos 5' y 3' de los conectores (línea fina de color negro y doble línea) añadidos a los segmentos de ADN diana se hibridan con sus respectivos segmentos de ADN diana, como se muestra en la Figura 73, etapa B. Las sondas oligonucleotídicas también contienen una secuencia de identificador único opcional, una secuencia de identificador de paciente opcional, un fosfato opcional en el extremo 5', y uno o más enlaces escindibles (dU). En una divulgación, el extremo 3' de la sonda oligonucleotídica comprende además unas pocas bases adicionales y un grupo de bloqueo, que se libera para formar un OH 3' libre mediante escisión con una nucleasa solo cuando se hibrida con la diana, por ejemplo, una base de ribonucleótido como el grupo de bloqueo y RNasa H2 (estrella) como la nucleasa de escisión. Una polimerasa (diamantes rellenos) extiende los extremos 3' hibridados del segmento de ADN diana y la sonda oligonucleotídica (Figura 73, etapa C) para crear uniones de ligamiento con el extremo 5' correspondiente del segmento de ADN diana y la sonda, respectivamente. En ausencia de un fosfato 5' competente para ligamiento en el segmento diana o la sonda, la actividad de nucleasa 5' de la polimerasa escinde una base solapante 5' de emparejamiento para generar un fosfato 5' competente para ligamiento. Como se muestra en la Figura 73, etapa D, una ligasa (círculos rellenos) sella covalentemente los extremos adyacentes de la sonda oligonucleotídica y el segmento diana para crear productos de ligamiento interconectados circulares. Posteriormente, se introducen una o más mellas en los enlaces escindibles de la sonda oligonucleotídica (por ejemplo, escisión con UDG de dU, triángulos rellenos). Como se muestra en la Figura 73, etapa E, los fragmentos oligonucleotídicos escindidos se eliminan del ADN diana, dejando solo la construcción circular monocatenaria deseada que comprende un segmento de ADN diana original que tiene un cebador hibridado específico de diana. El producto final es adecuado para amplificación por círculo rodante, etapas adicionales opcionales, y secuenciación posterior.

La Figura 74 representa otro proceso a modo de ejemplo para producir construcciones de diana de ácido nucleico monocatenarias quiméricas circulares con un oligonucleótido específico de diana hibridado que es adecuado para cebar la amplificación por círculo rodante y la secuenciación, como se ha descrito anteriormente. Las etapas de esta divulgación son similares a las de la divulgación que se muestra en la Figura 73, etapas A-E. Sin embargo, en esta divulgación las sondas oligonucleotídicas también comprenden un grupo de captura (Z) (es decir, biotina) adecuado para captura de productos sobre un soporte sólido (es decir, con soporte sólido revestido con estreptavidina). Como se muestra en la Figura 74, etapa E, los fragmentos oligonucleotídicos escindidos se eliminan del ADN diana, dejando solo la construcción circular monocatenaria deseada que comprende un segmento de ADN diana original que tiene un cebador hibridado específico de diana que también contiene un grupo de captura (Z) para un etapa de captura posterior. El producto final es adecuado para amplificación por círculo rodante, etapas adicionales opcionales, y secuenciación posterior.

La Figura 75 muestra otro proceso a modo de ejemplo para producir construcciones de diana de ácido nucleico monocatenarias quiméricas circulares con un oligonucleótido específico de diana hibridado que es adecuado para cebar la amplificación por círculo rodante y la secuenciación, como se ha descrito anteriormente. En estas divulgaciones, los segmentos genómicos originales comprenden segmentos de ADNcf (~160 pb) o segmentos de ADN genómico cortado (~160 pb) que contienen, por ejemplo, mutaciones específicas de tumor, SNP, o secuencias únicas. El proceso comienza con el ligamiento de conectores compuestos que comprenden partes tanto monocatenarias (líneas dobles más finas y de color negro) como bicatenarias (barras gruesas de color negro) en los extremos 3' y 5' de los segmentos de ADN (Figura 75, etapa A). Los conectores añadidos del proceso representado en la Figura 75, parte izquierda, contienen un grupo fosfato 5' competente para ligamiento, mientras que los conectores añadidos del proceso representado en la Figura 75, parte derecha, no contienen un grupo fosfato 5' competente para ligamiento. Las sondas oligonucleotídicas que contienen secuencias nucleotídicas complementarias a una secuencia única del segmento de ADN diana (líneas de color negro más gruesas), y a las partes monocatenarias en los extremos 5' y 3' de los conectores añadidos (línea fina de color negro y doble línea) del segmento de ADN diana se hibridan con sus respectivos segmentos de ADN diana, como se muestra en la Figura 75, etapa B. Las sondas oligonucleotídicas también contienen opcionalmente una secuencia de identificador único, una secuencia de identificador de paciente opcional, un fosfato 5', y uno o más enlaces escindibles (dU). En una divulgación, el extremo 3' de la sonda oligonucleotídica comprende además unas pocas bases adicionales y un grupo de bloqueo, que se libera para formar un OH 3' libre mediante escisión con una nucleasa solo cuando se hibrida con la diana, por ejemplo, una base de ribonucleótido como el grupo de bloqueo y RNasa H2 (estrella) como la nucleasa de escisión. Como los extremos de las sondas oligonucleotídicas son adyacentes entre sí después de la escisión con RNasaH2, son adecuados para sellado con una ligasa (Figura 75, etapa C). Una polimerasa (diamantes rellenos) extiende los extremos 3' hibridados del segmento de ADN diana (Figura 75, etapa C, derecha) para crear uniones de ligamiento con el extremo 5' correspondiente del segmento de ADN diana. En ausencia de un fosfato 5' competente para ligamiento en el segmento diana, la actividad de nucleasa 5' de la polimerasa escinde una base solapante 5' de emparejamiento para generar un fosfato 5' competente para ligamiento. Como se muestra en la Figura 75, etapa D, una ligasa (círculos rellenos) sella covalentemente los extremos adyacentes del segmento diana para crear productos de ligamiento interconectados circulares. Posteriormente, se introducen una o más mellas en los enlaces escindibles de la sonda oligonucleotídica (por ejemplo, escisión con UDG de dU, triángulos rellenos). Como se muestra en la Figura 75, etapa E, los fragmentos oligonucleotídicos escindidos se eliminan del ADN diana, dejando solo la construcción circular monocatenaria deseada que comprende un segmento de ADN diana original con un cebador hibridado específico de diana. El producto final es adecuado para amplificación por círculo rodante, etapas adicionales opcionales, y secuenciación posterior.

La Figura 76 es otro proceso a modo de ejemplo para producir construcciones de diana de ácido nucleico monocatenarias quiméricas circulares con un oligonucleótido específico de diana hibridado adecuado para la amplificación por círculo rodante y la secuenciación, como se ha descrito anteriormente. Las etapas de esta divulgación son similares a las representadas en la Figura 75, etapas A-E. Sin embargo, en esta divulgación, la sonda oligonucleotídica también comprende un grupo de captura (Z) (es decir, biotina) adecuado para captura de productos sobre un soporte sólido (es decir, con soporte sólido revestido con estreptavidina). Como se muestra en la Figura 76, etapa E, los fragmentos oligonucleotídicos escindidos se eliminan del ADN diana, dejando solo la construcción circular monocatenaria deseada que comprende un segmento de ADN diana original con un cebador hibridado específico de diana que también contiene un grupo de captura (Z) para un etapa de captura posterior. El producto final es adecuado para amplificación por círculo rodante, etapas adicionales opcionales, y secuenciación posterior.

La Figura 77 muestra otro proceso a modo de ejemplo para producir construcciones de diana de ácido nucleico monocatenarias quiméricas circulares adecuado para secuenciación, como se ha descrito anteriormente. En estas divulgaciones, los segmentos genómicos originales comprenden segmentos de ADNcf (~160 pb) o segmentos de ADN genómico cortado (~160 pb) que contienen, por ejemplo, mutaciones específicas de tumor, SNP, o secuencias repetitivas polimórficas. El proceso comienza con el ligamiento de conectores cortos en los extremos 3' y 5' de los segmentos de ADN (barras gruesas de color negro, Figura 77, etapa A). El extremo 5' de los conectores añadidos contiene opcionalmente un fosfato competente para ligamiento (Figura 77, etapa B, panel de la izquierda). Las sondas oligonucleotídicas que contienen secuencias complementarias a una parte única o repetitiva (es decir, repetición de AGAT) del segmento de ADN diana, y los lados 5' y 3' de los conectores añadidos se hibridan con sus respectivos segmentos de ADN diana, como se muestra en la Figura 77, etapa B. Las sondas oligonucleotídicas también contienen una parte adicional que contiene una o más de una secuencia de identificador único, una secuencia de identificador de paciente, un fosfato 5' competente para ligamiento, y un enlace escindible (dU). La Figura 77, etapa C, muestra el uso de los 3 dNTP (es decir, dTTP, dCTP, dATP) para la extensión mediada por polimerasa (diamantes rellenos) de los extremos 3' hibridados del segmento de ADN diana y la sonda oligonucleotídica. La extensión del extremo 3' del segmento de ADN diana crea una unión de ligamiento con el extremo 5' correspondiente del segmento de ADN diana. En ausencia de un fosfato 5' competente para ligamiento en el segmento de ADN diana (Figura 77, etapa C), la actividad de nucleasa 5' de la polimerasa escinde una base solapante 5' de emparejamiento para generar un fosfato 5' competente para ligamiento. En la Figura 77, etapa D, una ligasa (círculos rellenos) sella covalentemente los extremos adyacentes del segmento de ADN diana para crear un producto de ligamiento circular. La digestión con exonucleasa retira todos los productos no ligados o con mellas dejando solo la construcción circular monocatenaria deseada que comprende el segmento de ADN diana original acoplado a una secuencia de identificador único. El producto final es adecuado para etapas adicionales opcionales y secuenciación posterior.

La Figura 78 muestra otro proceso a modo de ejemplo para producir construcciones de diana de ácido nucleico monocatenarias quiméricas circulares adecuado para secuenciación, como se ha descrito anteriormente. En estas divulgaciones, los segmentos genómicos originales comprenden segmentos de ADNcf (~160 pb) o segmentos de ADN genómico cortado (~160 pb) que contienen, por ejemplo, mutaciones específicas de tumor, SNP, o secuencias repetitivas polimórficas. El proceso comienza con el ligamiento de conectores cortos en los extremos 3' y 5' de los segmentos de ADN (barras gruesas de color negro, Figuras 78, etapa A). Los conectores añadidos del proceso contienen una secuencia de identificador único y, opcionalmente, una secuencia de identificador de paciente y un grupo fosfato 5' competente para ligamiento. Como se muestra en la Figura 78, etapa B, las sondas oligonucleotídicas que contienen secuencias complementarias a una parte única o repetitiva (es decir, repetición de AGAT) del segmento de ADN diana y los lados 5' y 3' de los conectores añadidos se hibridan con sus respectivos segmentos de ADN diana. Las sondas oligonucleotídicas también contienen un enlace escindible (dU) opcional y un grupo fosfato competente para ligamiento en el extremo 5'. Cuando el extremo 5' del segmento de ADN diana con conector añadido y/o el extremo 5' de la sonda oligonucleotídica no contienen un extremo 5' competente para ligamiento (Figura 78, panel de la izquierda), sino que en su lugar contienen una aleta o una base solapante (Figura 78, etapa B, panel de la derecha), la actividad de nucleasa 5' (diamantes rellenos) escinde la base solapante 5' de emparejamiento o la aleta, dejando un fosfato 5' competente para ligamiento (Figura 78, etapa C). Como se muestra en la Figura 78, etapa D, una ligasa (círculos rellenos) sella covalentemente los extremos adyacentes de las sondas oligonucleotídicas y los segmentos de ADN diana para crear productos de ligamiento interconectados circulares. Posteriormente, se introduce una mella en el enlace escindible de la sonda oligonucleotídica (por ejemplo, escisión con UDG de dU, triángulos rellenos), y la digestión con exonucleasa retira todos los productos sin ligar o con mellas, dejando solo el ADN circular monocatenario deseado que comprende ADN genómico original acoplado a una secuencia de identificador único. El producto final es adecuado para etapas adicionales opcionales y secuenciación posterior.

Los procedimientos usados a modo de ejemplo en las Figuras 63, 65, y 70-78 para producir construcciones de diana de ácido nucleico monocatenarias quiméricas circulares adecuados para secuenciación, así como los procedimientos usados a modo de ejemplo en las Figuras 66, 67, 68, y 69 para añadir conectores al ADN diana en el proceso para producir construcciones de diana de ácido nucleico monocatenarias quiméricas circulares, tienen en común la captura del ADN diana original en círculos monocatenarios. En algunas divulgaciones, la sonda oligonucleotídica proporciona cierta selectividad por la diana (Figuras 70-78), y en algunos casos el producto comprende tanto el ADN diana original en un círculo monocatenario con un cebador hibridado específico de diana adecuado para la amplificación por círculo rodante o la captura directa y la secuenciación posterior (Figuras 73-76). Para los enfoques donde el producto final es una diana de ácido nucleico monocatenaria quimérica circular sin un cebador hibridado, las Figuras 79-81 son un ejemplo de tres enfoques diferentes para hibridar un cebador específico de diana con una especificidad muy elevada, seguido de captura, retirada por lavado de los ácidos nucleicos no diana, y posterior amplificación por círculo rodante.

La Figura 79 muestra un proceso a modo de ejemplo para enriquecer las construcciones de diana de ácido nucleico monocatenarias quiméricas circulares específicas de diana deseadas adecuado para secuenciación, como se ha descrito anteriormente. Se diseña un cebador oligonucleotídico específico de diana para que contenga un grupo 3' bloqueado que se libere mediante escisión con RNasaH2 de un enlace de ribonucleótido escindible si y solo si está hibridado con la diana (Dobosy et al., "RNase H-Dependent PCR (rhPCR): Improved Specificity and Single Nucleotide Polymorphism Detection Using Blocked Cleavable Primers", BMC Biotechnol. 11:80 (2011)), así como un grupo de captura 5' opcional (por ejemplo, un resto de biotina) (véase la Figura 79, etapa B). El ADN circular que comprende las dianas deseadas se enriquece capturando la construcción de cebador hibridado/circular sobre un soporte sólido a través del grupo de captura en el cebador, por ejemplo, captura con estreptavidina del resto de biotina. Los círculos que no contienen la diana se retiran mediante lavado. Se introducen mellas en los enlaces escindibles (por ejemplo, escisión por RNasa de ribonucleótido r) para liberar los círculos que contienen la diana del soporte sólido, y generar un grupo OH 3' en el cebador. Una polimerasa con actividad de desplazamiento de cadena extiende el extremo 3' liberado del cebador para la amplificación por círculo rodante (véase la Figura 80, etapa B). Este producto de extensión es adecuado para secuenciación posterior.

La Figura 80 muestra otro proceso a modo de ejemplo para enriquecer las construcciones de diana de ácido nucleico monocatenarias quiméricas circulares específicas de diana deseadas adecuado para secuenciación, como se ha descrito anteriormente. En esta divulgación, se diseña un cebador oligonucleotídico específico de diana para que contenga una secuencia de anclaje de 15-20 bases en el extremo 5', 3-5 bases desemparejadas, 6-10 bases emparejadas, complementaria a la diana (Chun et al., "Dual Priming Oligonucleotide System for the Multiplex Detection of Respiratory Viruses and SNP Genotyping of CYP2C19 Gene", Nucleic Acids Res. 35(6):e40 (2007)). Como en la Figura 79, el cebador oligonucleotídico también contiene un grupo 3' bloqueado que se libera mediante la escisión con RNasaH2 en un enlace de ribonucleótido escindible si y solo si está hibridado con la diana, así como un grupo de captura 5' opcional (es decir, un resto de biotina) (véase la Figura 80, etapa B). El ADN circular que comprende las dianas deseadas se enriquece capturando la construcción de cebador hibridado/circular sobre un soporte sólido a través del grupo de captura, por ejemplo, captura con estreptavidina del resto de biotina. Los círculos que no contienen la diana se retiran mediante lavado. Se introducen mellas en los enlaces escindibles (por ejemplo, escisión por RNasa de ribonucleótido r) para liberar los círculos que contienen la diana del soporte sólido, y generar un grupo OH 3' en el cebador (Figura 80, etapa C). Una polimerasa con actividad de desplazamiento de cadena extiende el extremo 3' liberado del cebador para la amplificación por círculo rodante (Figura 80, etapa D). Este producto de extensión es adecuado para secuenciación posterior.

La Figura 81 muestra otro proceso a modo de ejemplo para enriquecer las construcciones de diana de ácido nucleico monocatenarias quiméricas circulares específicas de diana deseadas adecuado para secuenciación, como se ha descrito anteriormente. En esta divulgación, dos oligonucleótidos adyacentes se hibridan con la parte específica de diana de la construcción circular. El cebador oligonucleotídico corriente arriba comprende un grupo de captura 5' opcional (por ejemplo, un resto de biotina). El cebador oligonucleotídico corriente abajo está diseñado para contener un fosfato 5' y un grupo 3' bloqueado que se libera mediante la escisión con RNasaH2 en un enlace de ribonucleótido escindible si y solo si está hibridado con la diana (Figura 81, etapa B). En presencia de la diana, la ligasa une covalentemente los dos oligonucleótidos entre sí (Figura 81, etapa B). El ADN circular que comprende las dianas deseadas puede enriquecerse capturando las construcciones de cebador/circulares hibridadas sobre un soporte sólido a través del grupo de captura, por ejemplo, captura con estreptavidina del resto de biotina. Los círculos que no contienen la diana se retiran mediante lavado. Se introducen mellas en los enlaces escindibles (por ejemplo, escisión por RNasa de ribonucleótido r) para liberar los círculos que contienen la diana del soporte sólido, y generar un grupo OH 3' en el oligonucleótido corriente abajo (Figura 81, etapa C). Una polimerasa con actividad de desplazamiento de cadena extiende el extremo 3' liberado para la amplificación por círculo rodante (Figura 81, etapa D). Este producto de extensión es adecuado para secuenciación posterior.

De ese modo, los procedimientos usados a modo de ejemplo en las Figuras 55, 56, 65, 70, y 71-78 para producir construcciones de diana de ácido nucleico monocatenarias quiméricas circulares adecuados para secuenciación, más los procedimientos usados a modo de ejemplo en las Figuras 79-81, proporcionan ejemplos para generar construcciones de diana de ácido nucleico monocatenarias quiméricas circulares con cebadores específicos de diana o cebadores de sitio de unión de cebador hibridados, y son adecuados para amplificación por círculo rodante, seguida de secuenciación posterior. Las Figuras 82-89 usan a modo de ejemplo diferentes estrategias para capturar o enriquecer adicionalmente las dianas deseadas.

La Figura 82 muestra un proceso a modo de ejemplo para enriquecimiento de dianas. En esta divulgación, un cebador específico de diana hibridado con construcciones de diana de ácido nucleico monocatenarias quiméricas circulares se extiende usando polimerasa de desplazamiento de cadena para generar un producto de extensión monocatenario que comprende dos o más copias en tándem de la construcción monocatenaria quimérica circular de copias en tándem (Figura 82, etapa B). Los oligonucleótidos complementarios al producto de extensión se hibridan. Estos oligonucleótidos contienen opcionalmente un extremo 3' bloqueado o desemparejado y contienen un grupo de captura Z (por ejemplo, un resto de biotina) en el extremo 5' (Figura 82, etapa C). El producto de extensión de repetición en tándem específico de diana se captura sobre un soporte sólido y los otros ácidos nucleicos se retiran mediante lavado. El producto de extensión de repetición en tándem se desnaturaliza a partir de oligonucleótidos de captura sobre el soporte sólido (Figura 82, etapa C). Este producto de extensión es adecuado para secuenciación.

La Figura 83 muestra otro proceso a modo de ejemplo para enriquecimiento específico de diana. En esta divulgación, el cebador oligonucleotídico específico de diana se hibrida con la diana de ácido nucleico monocatenaria quimérica circular y contiene un grupo de captura Z (es decir, un resto de biotina) en el extremo 5'. La construcción de diana de ácido nucleico monocatenaria quimérica circular se captura sobre un soporte sólido y los otros ácidos nucleicos se retiran mediante lavado (Figura 83, etapa A). El cebador hibridado original se extiende usando polimerasa con actividad de nucleasa 5 '^3 ' para generar círculos con mellas que se liberan del soporte sólido a medida que la polimerasa escinde la parte 5' del oligonucleótido hibridado que contiene el grupo de captura (Figura 83, etapa B). La polimerasa original se inactiva mediante calor o mediante proteasa. El extremo 3' del círculo con mellas se extiende con polimerasa de desplazamiento de cadena para generar cadenas simples de copias en tándem de ADN diana (Figura 83, etapa C). Este producto de extensión es adecuado para secuenciación.

La Figura 84 muestra otro proceso a modo de ejemplo para enriquecimiento específico de diana. En esta divulgación, dos oligonucleótidos específicos de diana se hibridan con la diana de ácido nucleico monocatenaria quimérica circular, como se muestra en la Figura 84, etapa B. Los oligonucleótidos están opcionalmente bloqueados o presentan desemparejamientos en el extremo 3' y contienen un grupo de captura Z (es decir, un resto de biotina) en el extremo 5'. La construcción de diana de ácido nucleico monocatenaria quimérica circular se captura sobre un soporte sólido y los otros ácidos nucleicos se retiran mediante lavado. Uno de los cebadores hibridados se extiende usando polimerasa con actividad de desplazamiento de cadena para generar cadenas simples de copias en tándem de ADN diana, y liberar el producto de extensión del soporte sólido, como se muestra en la Figura 84, etapa C. Este producto de extensión es adecuado para secuenciación.

La Figura 85 muestra otro proceso a modo de ejemplo para enriquecimiento específico de diana. En esta realización, un primer oligonucleótido específico de diana se hibrida con una diana de ácido nucleico monocatenaria quimérica circular. Este oligonucleótido está opcionalmente bloqueado o presenta desemparejamientos en el extremo 3' y contiene un grupo de captura Z (es decir, un resto de biotina) en el extremo 5'. La construcción de diana de ácido nucleico monocatenaria quimérica circular se captura sobre un soporte sólido y los otros ácidos nucleicos se retiran mediante lavado. Un segundo cebador específico de diana se hibrida con las construcciones circulares capturadas (Figura 85, etapa B). Una polimerasa con actividad de desplazamiento de cadena se introduce para extender el segundo cebador para generar un producto de extensión monocatenario que contiene copias en tándem del ADN diana y liberar el producto de extensión del soporte sólido (Figura 85, etapa C). Este producto de extensión es adecuado para secuenciación.

Las Figuras 86 y 87 muestran procesos a modo de ejemplo para enriquecimiento específico de diana. En estas divulgaciones, un cebador del sitio de unión de cebador se hibrida con una diana de ácido nucleico monocatenaria quimérica circular y se extiende usando polimerasa de desplazamiento de cadena para generar un producto de extensión monocatenario que contiene copias en tándem de ADN diana (Figura 86, etapas A-B, y Figura 87, etapas A-B). Los oligonucleótidos específicos de diana complementarios al producto de extensión se hibridan. Los oligonucleótidos hibridados están opcionalmente bloqueados o presentan desemparejamientos en el extremo 3' y contienen un grupo de captura Z (es decir, un resto de biotina) en el extremo 5'. El producto de extensión de repetición en tándem específico de diana se captura sobre un soporte sólido y los otros ácidos nucleicos se retiran mediante lavado (Figura 86, etapa C, y la Figura 87, etapa C). En la Figura 86, el producto de extensión de repetición en tándem se desnaturaliza a partir de oligonucleótidos de captura sobre el soporte sólido (Figura 86, etapa D). Este producto de extensión es adecuado para secuenciación. En la Figura 87, se hibridan cebadores específicos de diana adicionales complementarios al producto de extensión. La extensión con polimerasa de desplazamiento de cadena libera el producto de extensión original del soporte sólido, mientras se realizan copias adicionales (Figura 87, etapa D). El producto de extensión original y las copias adicionales son adecuados para secuenciación.

La Figura 88 muestra otro proceso a modo de ejemplo para enriquecimiento específico de diana. En esta divulgación, un primer cebador específico de diana y un segundo oligonucleótido específico de sitio de unión de cebador se hibridan con las construcciones de ácido nucleico monocatenarias quiméricas circulares (véase la Figura 88, etapas A-B). El segundo oligonucleótido está opcionalmente bloqueado o presenta desemparejamientos en el extremo 3' y contiene un grupo de captura Z (es decir, un resto de biotina) en el extremo 5'. La construcción de diana de ácido nucleico monocatenaria quimérica circular se captura sobre un soporte sólido y los otros ácidos nucleicos se retiran mediante lavado. El primer cebador hibridado específico de diana se extiende usando polimerasa con actividad de desplazamiento de cadena para generar un producto de extensión monocatenario que contiene copias en tándem de ADN diana y liberar el producto de extensión del soporte sólido. Este producto de extensión es adecuado para secuenciación.

La Figura 89 muestra otro proceso a modo de ejemplo para enriquecimiento específico de diana. En esta divulgación, un oligonucleótido específico de sitio de unión de cebador se hibrida inicialmente con la construcción de diana de ácido nucleico monocatenaria quimérica circular. Este oligonucleótido está opcionalmente bloqueado o presenta desemparejamientos en el extremo 3' y contiene un grupo de captura Z (es decir, un resto de biotina) en el extremo 5'. La construcción de diana de ácido nucleico monocatenaria quimérica circular se captura sobre un soporte sólido y los otros ácidos nucleicos se retiran mediante lavado (Figura 89, etapa A). Un segundo cebador específico de diana se hibrida con las construcciones circulares capturadas. Una polimerasa con actividad de desplazamiento de cadena se usa para generar productos de extensión monocatenarios que contienen copias en tándem de ADN diana, y liberar dicho producto de extensión del soporte sólido. Este producto de extensión es adecuado para secuenciación.

Las Figuras 90-99 muestran el efecto de cobertura de diferentes construcciones de sondas oligonucleotídicas. Las sondas oligonucleotídicas en cada Figura varían en sus partes específicas de diana 5' (corriente arriba), partes específicas de diana 3' (corriente abajo), longitudes de huecos, y extremos de anclaje solo en 3' o en 5' y 3', para conseguir la cobertura de un segmento diana de ADNcf de 160 nucleótidos. El segmento de ADN genómico diana se mueve en incrementos de 10 bases simulando la "familia" de todas las posibles dianas de 160 nucleótidos producidas mediante protección de nucleosomas.

La Figura 90 muestra diseños de sonda oligonucleotídica adecuados para la detección de todos los posibles fragmentos con conector añadido de 160 nucleótidos (barras de color negro) obtenidos a partir de ADNcf. En esta divulgación, la sonda oligonucleotídica está anclada al extremo con conector añadido 3' de la familia de fragmentos de ADNcf que se muestra, y contiene una parte específica de diana corriente arriba o 5' de 60 bases (barra de color gris), una parte específica de diana corriente abajo o 3' de 20 bases (barra de color gris), una parte específica de conector de 10 bases (barra de color negro), y una secuencia de identificador de 20 bases (línea fina entre la parte específica de diana 5' y la parte del conector que se ilustra debajo de las partes específicas corriente arriba y corriente abajo). El uso de 20 bases como secuencia de identificador es con fines ilustrativos; puede contener una secuencia de identificador único de 12 bases y una secuencia de identificador de paciente de 8 bases cuando se amplifica y se secuencia el ADN circular quimérico, como se ilustra en la Figura 1. Alternativamente, la parte del identificador puede estar en el intervalo de 40 a 80 bases cuando se usan identificadores de paciente, primeras y segundas partes específicas de cebador adecuadas para captura sobre fase sólida, y secuenciación de regiones de unión de cebador, como se ilustra en las Figuras 4-12. En la Figura 13 se proporciona una ilustración de las sondas oligonucleotídicas de esta Figura hibridadas con su fragmento de ADNcf diana. La línea muy fina de longitudes variables entre la parte específica de diana 3' y la parte de conector en las sondas oligonucleotídicas que se muestra en la Figura 90 corresponde a la longitud de la región en bucle cerca del extremo 3' del segmento diana que se muestra en las Figuras 13-16. Ilustra que la región de la sonda y la región complementaria a la región de conector están físicamente acopladas entre sí.

El diseño de la sonda oligonucleotídica que se muestra en la Figura 91 es similar al que se muestra en la Figura 90. En esta divulgación, la sonda oligonucleotídica está anclada al extremo con conector añadido 3' de la familia de fragmentos de ADNcf que se muestra, y contiene una parte específica de diana corriente arriba o 5' de 80 bases, una parte específica de diana corriente abajo o 3' de 20 bases, una parte específica de conector de 10 bases (barra gruesa de color negro) y una secuencia de identificador de 20 - 160 bases. En las Figuras 13-16 también se proporciona una ilustración de las sondas oligonucleotídicas de esta Figura hibridadas con su fragmento de ADNcf diana.

La Figura 92 muestra una variación del diseño de la sonda oligonucleotídica adecuada para la detección de todos los posibles fragmentos con conector añadido de 160 nucleótidos (barras de color negro) obtenidos a partir de ADNcf. En esta divulgación, la sonda oligonucleotídica está anclada al extremo con conector añadido 3' de la familia de fragmentos de ADNcf que se muestra, y contiene una parte específica de diana corriente arriba o 5' de 60 bases (barra de color gris), una parte específica de diana corriente abajo o 3' de 50 bases (barra de color gris), una parte específica de conector de 10 bases (barra de color negro) y una secuencia de identificador de 20 - 160 bases (línea fina entre la parte específica de diana 5' y la parte de conector). El uso de 20 bases como secuencia de identificador es solo con fines ilustrativos; también son adecuadas longitudes alternativas, como se ha descrito anteriormente con referencia a la Figura 90. En las Figuras 13 y 15 se proporciona una ilustración de las sondas oligonucleotídicas de esta Figura hibridadas con su fragmento de ADNcf diana. La línea muy fina de longitudes variables entre el conector 3' del segmento de ADNcf y el extremo 3' del ADNcf que se muestra en la Figura 92 corresponde a la longitud de la región en bucle de la sonda oligonucleotídica que se muestra en las Figuras 13-16. Ilustra que la región de la sonda y la región complementaria a la región de conector están físicamente acopladas entre sí.

El diseño de la sonda oligonucleotídica que se muestra en la Figura 93 es similar al que se muestra en la Figura 92. En esta divulgación, la sonda oligonucleotídica está anclada al extremo con conector añadido 3' de la familia de fragmentos de ADNcf que se muestra, y contiene una parte específica de diana corriente arriba o 5' de 80 bases, una parte específica de diana corriente abajo o 3' de 50 bases, una parte específica de conector de 10 bases (barra gruesa de color negro), un segmento de separación de 40 bases y una secuencia de identificador de 20 - 160 bases.

En las Figuras 13-16 se proporciona una ilustración de las sondas oligonucleotídicas de esta Figura hibridadas con su fragmento de ADNcf diana.

La Figura 94 muestra una ligera variación del diseño de la sonda oligonucleotídica adecuada para la detección de todos los posibles fragmentos con conector añadido de 160 nucleótidos (barras de color negro) obtenidos a partir de ADNcf. En esta divulgación, la sonda oligonucleotídica está anclada al extremo con conector añadido 3' de la familia de fragmentos de ADNcf que se muestra, y contiene una parte específica de diana corriente arriba o 5' de 50 bases (barra de color gris), una parte específica de diana corriente abajo o 3' de 50 bases (barra de color gris), una parte específica de conector 3' de 10 bases (barra de color negro), una parte específica de conector 5' de 10 bases (barra de color negro), y una secuencia de identificador de 20-80 bases (línea fina entre las partes específicas de diana 5' y 3', que se ilustra debajo de las barras de color gris y la parte de conector). En la Figura 14 se proporciona una ilustración de una sonda oligonucleotídica de esta Figura hibridada con su fragmento de ADNcf diana. La línea muy fina de longitudes variables en el segmento de ADNcf diana que se muestra en la Figura 94 corresponde a la región en bucle en la sonda oligonucleotídica de la Figura 14, y la línea muy fina de longitud variable en las sondas oligonucleotídicas de la Figura 94 corresponde a la región en bucle del segmento de ADN diana de las Figuras 17 y 18. Ilustra que la región de la sonda y la región complementaria a la región de conector están físicamente acopladas entre sí.

El diseño de sonda oligonucleotídica que se muestra en la Figura 95 es similar al que se muestra en la Figura 94. En esta divulgación, la sonda oligonucleotídica está anclada a dos extremos añadidos con conector 3' y conector 5' de la familia de fragmentos de ADNcf que se muestra. La sonda contiene una parte específica de diana corriente arriba o 5' de 60 bases, una parte específica de diana corriente abajo o 3' de 60 bases, una parte específica de conector 3' de 10 bases, a una parte específica de conector 5' de 10 bases y una secuencia de identificador de 20 - 80 bases. En las Figuras 17 y 18 también se proporciona una ilustración de las sondas oligonucleotídicas de esta Figura hibridadas con su fragmento de ADNcf diana.

La Figura 96 muestra otra variación de diseño de sonda oligonucleotídica adecuado para la detección de todos los posibles fragmentos sin conector añadido de 160 nucleótidos obtenidos a partir de ADNcf (barras de color gris más oscuro). En esta divulgación, la sonda oligonucleotídica contiene una parte específica de diana corriente arriba o 5' de 50 bases (barra de color gris con líneas de color negro), una parte específica de diana corriente abajo o 3' de 50 bases (barra de color gris con líneas de color negro) y una secuencia de identificador de 20-80 bases (línea fina entre partes específicas de diana 5' y 3' y se muestra debajo de las barras de color gris). Las líneas verticales cortas de color negro dentro de las regiones de sonda de color gris simbolizan los desemparejamientos de una sola base con respecto a la diana original, de modo que las regiones de ADN diana auténtico frente a la copia de la sonda se puedan identificar fácilmente. En las Figuras 23-26 se proporciona una ilustración de una sonda oligonucleotídica de esta Figura hibridada con su fragmento de ADNcf diana.

El diseño de sonda oligonucleotídica que se muestra en la Figura 97 es similar al que se muestra en la Figura 96. En esta realización, la sonda oligonucleotídica contiene una parte específica de diana corriente arriba o 5' de 60 bases, una parte específica de diana corriente abajo o 3' de 60 bases y una secuencia de identificador de 20 - 160 bases. En las Figuras 23, 24, 25 y 26 también se proporciona una ilustración de las sondas oligonucleotídicas de esta Figura hibridadas con su fragmento de ADNcf diana.

El diseño de sonda oligonucleotídica que se muestra en la Figura 98 es similar al que se muestra en la Figura 96. En esta divulgación, la sonda oligonucleotídica contiene una parte específica de diana corriente arriba o 5' de 70 bases, una parte específica de diana corriente abajo o 3' de 70 bases y una secuencia de identificador de 20 - 160 bases. En las Figuras 23, 24, 25 y 26 también se proporciona una ilustración de las sondas oligonucleotídicas de esta Figura hibridadas con su fragmento de ADNcf diana.

El diseño de sonda oligonucleotídica que se muestra en la Figura 99 es similar al que se muestra en la Figura 96. En esta divulgación, la sonda oligonucleotídica contiene una parte específica de diana corriente arriba o 5' de 80 bases, una parte específica de diana corriente abajo o 3' de 80 bases y una secuencia de identificador de 20 - 160 bases. En las Figuras 23-26 también se proporciona una ilustración de las sondas oligonucleotídicas de esta Figura hibridadas con su fragmento de ADNcf diana.

Las Figuras 100 a 103 muestran la cobertura de una región diana con sondas oligonucleotídicas específicas de diana que tienen regiones de conector 3' y/o 5' que está dispuestas en mosaico a través de regiones diana adyacentes de 160 pb. Específicamente, la Figura 100 ilustra la forma en la que diseñar sondas oligonucleotídicas con una estrategia de mosaico solapante para secuenciar regiones contiguas más grandes (a modo de ejemplo, se muestran aproximadamente 500 bases). La secuencia de la región diana que se detecta se representa como la parte de color gris oscuro. La secuencia de la región diana que no se detecta se representa como la parte de color gris claro, y los conectores se representan como la parte de color negro. Cada agrupamiento vertical sucesivo en esta Figura ilustra la cobertura de la sonda obtenida desplazando las regiones diana de 160 pb encontradas en fragmentos de ADNcf generados aleatoriamente (o fragmentos cortados aleatoriamente). La región diana se desplaza sucesivamente en incrementos de 10 bases para demostrar la cobertura de la región diana mediante una sola sonda. Cada agrupamiento vertical sucesivo de izquierda a derecha ilustra la cobertura de la región diana y el solapamiento de la sonda con una 2a, 3a y 4a sondas diferentes. La estructura de sonda oligonucleotídica que se muestra aquí (debajo de cada agolpamiento vertical) contiene una parte de sonda específica de diana corriente arriba o 5' de 60 bases, una sonda corriente abajo o 3' de 50 bases, una parte de conector de 10 bases y una región de identificador de 20 - 160 pb (líneas finas).

La Figura 101 muestra una ilustración similar de la forma en la que diseñar sondas oligonucleotídicas con una estrategia de mosaico solapante para secuenciar regiones contiguas más grandes a la que se muestra en la Figura 100. La estructura de la sonda oligonucleotídica que se muestra aquí contiene una parte de sonda específica de diana corriente arriba o 5' de 80 bases, una sonda corriente abajo o 3' de 50 bases, una parte de conector de 10 bases y una región de identificador de 20 - 160 pb (líneas finas).

La Figura 102 muestra una ilustración similar de la forma en la que diseñar sondas oligonucleotídicas con una estrategia de mosaico solapante para secuenciar regiones contiguas más grandes a la que se muestra en la Figura 100. La estructura de sonda oligonucleotídica que se muestra aquí contiene una parte de sonda específica de diana corriente arriba o 5' de 50 bases, una sonda corriente abajo o 3' de 50 bases, partes de conector 5' y 3' de 10 bases y una región de identificador de 20 - 160 pb (líneas finas).

La Figura 103 muestra una ilustración similar de la forma en la que diseñar sondas oligonucleotídicas con una estrategia de mosaico solapante para secuenciar regiones contiguas más grandes a la que se muestra en la Figura 100. La estructura de sonda oligonucleotídica que se muestra aquí contiene una parte de sonda específica de diana corriente arriba o 5' de 60 bases, una sonda corriente abajo o 3' de 60 bases, partes de conector 5' y 3' de 10 bases y una región de identificador de 20 - 160 pb (líneas finas).

Las Figuras 104 a 107 muestran la cobertura de una región diana con oligonucleótidos marcados en fase específicos de diana sin conectores 3' o 5' que está dispuestas en mosaico a través de regiones génicas diana adyacentes de 160 pb (representa el proceso que se muestra en las Figuras 20 y 22). Las sondas oligonucleotídicas que tienen regiones específicas de diana 5' y 3' de 50 bases contienen un desemparejamiento de una sola base cada 10 bases (marcas de almohadilla verticales). Secuencia de región diana que se detecta (color gris oscuro); secuencia de región diana que no se detecta (color gris claro). Específicamente, la Figura 104 muestra oligonucleótidos marcados en fase específicos de diana en mosaico a través de dianas génicas adyacentes de 160 pb (los segmentos diana no llevan conectores añadidos) en un tramo de ADN genómico. Las sondas específicas de diana 5' y 3' tienen un desemparejamiento de una sola base cada 10 bases (marcas de almohadilla verticales). Cada agrupamiento sucesivo en la figura ilustra la simulación de la cobertura de la sonda de regiones diana de 160 pb de desplazamiento encontradas en el ADNcf. La región diana se desplaza sucesivamente en incrementos 10 bases para demostrar la cobertura de la región diana mediante una sola sonda. Cada agrupamiento vertical sucesivo de izquierda a derecha ilustra la cobertura de la región diana y el solapamiento de la sonda con una 2a, 3a y 4a sondas diferentes. La estructura de sonda oligonucleotídica que se muestra en esta figura contiene una parte específica de diana corriente arriba o 5' de 50 bases, una parte específica de diana corriente abajo o 3' de 50 bases, y una parte de identificador de secuencia de 20 - 160 bases.

La Figura 105 muestra un enfoque similar para oligonucleótidos marcados en fase específicos de diana en mosaico a través de dianas génicas adyacentes de 160 pb al que se muestra en la Figura 104. La estructura de sonda oligonucleotídica que se muestra en esta figura contiene una parte específica de diana corriente arriba o 5' de 60 bases, una parte específica de diana corriente abajo o 3' de 60 bases, y una región de identificador de secuencia de 20 - 160 bases.

La Figura 106 muestra un enfoque similar para oligonucleótidos marcados en fase específicos de diana en mosaico a través de dianas génicas adyacentes de 160 pb al que se muestra en la Figura 104. La estructura de sonda oligonucleotídica que se muestra en esta figura contiene una parte específica de diana corriente arriba o 5' de 70 bases, una parte específica de diana corriente abajo o 3' de 70 bases, y una región de identificador de secuencia de 20 - 160 bases.

La Figura 107 muestra un enfoque similar para oligonucleótidos marcados en fase específicos de diana en mosaico a través de dianas génicas adyacentes de 160 pb al que se muestra en la Figura 104. La estructura de sonda oligonucleotídica que se muestra en esta figura contiene una parte específica de diana corriente arriba o 5' de 80 bases, una parte específica de diana corriente abajo o 3' de 80 bases, y una región de identificador de secuencia de 20 - 160 bases.

También se desvela un método para identificar, en una muestra, una o más moléculas de ácido ribonucleico diana que se diferencian de otras moléculas de ácido nucleico en la muestra en una o más bases. Este método implica proporcionar una muestra que contiene una o más moléculas de ácido ribonucleico diana que contienen potencialmente una o más diferencias de bases y generar, en la muestra, ADNc de las una o más moléculas de ácido ribonucleico diana, si estuvieran presentes en la muestra. El método implica además proporcionar una o más primeras sondas oligonucleotídicas, comprendiendo cada primera sonda oligonucleotídica (a) una parte de secuencia específica de diana de ADNc 3', (b) una parte específica de diana de ADNc 5', y una parte adicional, comprendiendo dicha parte adicional (i) una secuencia de identificador único, (ii) una secuencia de identificador de paciente, (iii) una o más secuencias de unión de cebador, o cualquier combinación de (i), (ii), y (iii). La muestra se pone en contacto con las una o más primeras sondas oligonucleotídicas en condiciones eficaces para que las partes específicas de diana 3' y 5' de las primeras sondas oligonucleotídicas se hibriden de forma específica de acuerdo con las bases con regiones complementarias del ADNc. Se generan una o más uniones competentes para ligamiento adecuadas para acoplar los extremos 3' y 5' de una primera sonda oligonucleotídica hibridada con su ADNc complementario y la primera sonda oligonucleotídica, en las una o más uniones de ligamiento, se liga para formar un producto circular ligado que comprende una copia de ácido desoxirribonucleico de la secuencia de ácido ribonucleico diana acoplada a la parte adicional de la primera sonda oligonucleotídica. El método implica además detectar y distinguir los productos ligados circulares en la muestra para identificar la presencia de una o más moléculas de ácido ribonucleico diana que se diferencian de otras moléculas de ácido ribonucleico en la muestra en una o más bases.

La Figura 108 muestra un proceso para la captura específica de diana de transcritos de ARNm o ARNInc para secuenciación. Como se muestra en la Figura 108, etapa A, se realiza la transcripción inversa (transcripción inversa - diamante relleno) de ARNm o ARNInc que contiene las regiones diana deseadas para generar una molécula de ADN complementario (ADNc). Como se muestra en la Figura 108, etapa B, una sonda oligonucleotídica que contiene secuencias 5' y 3' complementarias a la región diana de ADNc se hibrida con la molécula de ADNc. Las partes específicas de diana de la sonda oligonucleotídica están separadas con una parte adicional. La parte adicional comprende una parte de identificador único, opcionalmente una parte de identificador de paciente, y opcionalmente un fosfato 5'. Si fuera necesario, una polimerasa (diamante relleno) extiende el extremo 3' hibridado de la sonda oligonucleotídica para generar un extremo 3' al nivel del extremo 5' de la sonda oligonucleotídica (Figura 108, etapa C). En ausencia de un fosfato competente para ligamiento en el extremo 5', una polimerasa que tiene actividad de nucleasa 5' escinde la base solapante 5' de emparejamiento en el extremo 5' para generar un fosfato 5' (lado izquierdo de la Figura 108, etapa C). Como se muestra en la Figura 108, etapa D, una ligasa (círculos rellenos) sella covalentemente los extremos extendidos o competentes para ligamiento para crear productos de ligamiento circulares. Por último, como se muestra en la Figura 108, etapa E, la digestión con exonucleasa retira todos los productos sin ligar o con mellas dejando solo la construcción circular monocatenaria deseada que comprende una copia de ADNc de la secuencia de ácido ribonucleico diana acoplada a una secuencia de identificador único o secuencia de identificador de paciente. Este producto es adecuado para amplificación por círculo rodante y secuenciación usando cualquiera de los métodos que se describen en el presente documento.

Otro aspecto de la presente invención se refiere a un método para identificar, en una muestra, una o más moléculas de ácido nucleico que comprenden potencialmente primeras y segundas regiones diana distintas acopladas entre sí (por ejemplo, supuestas fusiones génicas). Este método implica proporcionar una muestra que contiene potencialmente una o más moléculas de ácido nucleico que comprenden primeras y segundas regiones diana distintas acopladas entre sí, y proporcionar uno o más conjuntos de sondas oligonucleotídicas, comprendiendo cada conjunto de sondas (i) una primera sonda oligonucleotídica que comprende una primera parte específica de diana 5', una segunda parte específica de diana 3', y una parte adicional, y (ii) una segunda sonda oligonucleotídica que comprende una segunda parte específica de diana 5', una primera parte específica de diana 3', y una parte adicional, en donde la parte adicional de la primera o la segunda sonda oligonucleotídica de un conjunto de sondas comprende (i) una secuencia de identificador único, (ii) una secuencia de identificador de paciente, (iii) una o más secuencias de unión de cebador, o cualquier combinación de (i), (ii), y (iii). Este método implica además poner en contacto la muestra y los uno o más conjuntos de sondas oligonucleotídicas en condiciones eficaces para que la primera y la segunda sondas oligonucleotídicas se hibriden de forma específica de acuerdo con las bases con sus correspondientes primera y segunda regiones diana de la molécula de ácido nucleico, si estuvieran presentes en la muestra, y generar una o más uniones competentes para ligamiento adecuadas acoplar los extremos 3' de las primeras sondas oligonucleotídicas a los extremos 5' de las segundas sondas oligonucleotídicas de un conjunto de sondas y para acoplar los extremos 5' de las primeras sondas oligonucleotídicas a los extremos 3' de las segundas sondas oligonucleotídicas de un conjunto de sondas cuando dichos conjuntos de sondas se hibridan con primeras y segundas regiones diana complementarias de una molécula de ácido nucleico. El primer y el segundo oligonucleótidos de un conjunto de sondas están ligados a las una o más uniones competentes para ligamiento para formar productos ligados circulares que comprenden una secuencia nucleotídica correspondiente a la primera y la segunda regiones diana distintas de una molécula de ácido nucleico acoplada a una parte adicional. Los productos ligados circulares se detectan y se distinguen en la muestra para identificar de ese modo la presencia, si la hubiera, de una o más moléculas de ácido nucleico que comprenden primeras y segundas regiones diana distintas acopladas entre sí en la muestra.

De acuerdo con este aspecto de la presente invención, la Figura 109, etapas A-E muestra un proceso a modo de ejemplo para detectar supuestas fusiones génicas específicas en los ARNm. Se realiza la transcripción inversa del ARNm que contiene la supuesta fusión génica para generar una molécula de ADNc (Figura 109, etapa A). Para cada diana potencial, se proporciona un conjunto de sondas que comprende una primera y una segunda sondas oligonucleotídicas. La primera sonda tiene una primera parte específica de diana 5' y una segunda parte específica de diana 3', mientras que la segunda sonda tiene una segunda parte específica de diana 5' y una primera parte específica de diana 3'. Las partes específicas de diana de cada sonda están separadas por una secuencia nucleotídica que contiene una secuencia de identificador único, una secuencia de identificador de paciente, una o más secuencias de unión de cebador, o cualquier combinación de las mismas. Las sondas oligonucleotídicas se hibridan con sus respectivas partes complementarias de la molécula de ADNc diana, como se muestra en la Figura 109, etapa B. Si las sondas oligonucleotídicas contienen extremos 5' competentes para ligamiento, una ligasa sella covalentemente los extremos adyacentes de los oligonucleótidos hibridados para crear un producto de ligamiento circular, como se muestra en la Figura 109, etapa D (panel de la izquierda). Si las sondas oligonucleotídicas contienen una aleta o una base nucleotídica solapante 5', una nucleasa 5' escinde el extremo 5' para generar un fosfato 5' competente para ligamiento (Figura 109, etapa C) antes del ligamiento (Figura 109, etapa D, panel de la derecha). La digestión con exonucleasa retira todos los productos sin ligar o lineales dejando solo las construcciones de ADN circulares monocatenarias deseadas que comprenden las secuencias corriente arriba y corriente abajo de los productos de fusión génica acopladas a una secuencia de identificador único, una secuencia de identificador de paciente, y/o una secuencia de captura (por ejemplo, una secuencia de unión de cebador). Este producto es adecuado para amplificación por círculo rodante y secuenciación posterior, como se describe en el presente documento.

La Figura 110 muestra una variación del proceso que se representa en la Figura 109 para detectar supuestas fusiones génicas específicas en los ARNm. En esta realización, la primera y la segunda sondas oligonucleotídicas se hibridan con sus respectivas regiones complementarias de la molécula de ADNc, como se muestra en la Figura 110, etapa B. Una polimerasa extiende los extremos 3' hibridados de cada primera y segunda sondas para formar uniones de ligamiento con los extremos 5' hibridados de la segunda y la primera sondas, respectivamente como se muestra en la Figura 110, etapa C. Cuando las sondas oligonucleotídicas tienen un OH 5' (lado derecho de la Figura 110, etapa C), la actividad de nucleasa 5' de la polimerasa escinde la base solapante 5' de emparejamiento, dejando un fosfato 5' competente para ligamiento. Una ligasa (círculos rellenos) sella covalentemente los extremos adyacentes de las primeras y las segundas sondas oligonucleotídicas hibridadas para crear productos de ligamiento circulares (Figura 110, etapa D). La digestión con exonucleasa retira todos los productos sin ligar o lineales dejando solo las construcciones de ADN circulares monocatenarias deseadas que comprenden las secuencias corriente arriba y corriente abajo de los productos de fusión génica acopladas a una secuencia de identificador único, una secuencia de identificador de paciente, y/o una secuencia de captura (es decir, una secuencia de unión de cebador). Este producto es adecuado para amplificación por círculo rodante y secuenciación posterior, como se describe en el presente documento.

La Figura 111 muestra otro proceso de acuerdo con este aspecto de la invención que es adecuado para la detección y cuantificación de exones específicos en ARNm o ARNInc. En esta realización, se realiza la transcripción inversa de ARNm o ARNInc que contiene los exones deseados en ADNc (Figura 111, etapa A). Como se muestra en la Figura 111, etapa B, para cada diana potencial, se proporcionan dos sondas oligonucleotídicas, conteniendo cada sonda secuencias específicas de diana 3' y 5' complementarias a partes únicas de cada exón de la molécula de ADNc. Las partes específicas de diana de cada sonda están separadas por una secuencia nucleotídica que contiene una secuencia de identificador único, una secuencia de identificador de paciente, una o más secuencias de unión de cebador, o cualquier combinación de las mismas. Las sondas se hibridan adyacentes entre sí en el ADNc de la diana, como se muestra en la Figura 111, etapa B. Si las sondas oligonucleotídicas contienen extremos 5' competentes para ligamiento, una ligasa sella covalentemente los extremos adyacentes de los oligonucleótidos hibridados para crear un producto de ligamiento circular, como se muestra en la Figura 111, etapa D (panel de la izquierda). Si las sondas oligonucleotídicas contienen una aleta o una base nucleotídica solapante 5', una nucleasa 5' escinde el extremo 5' para generar un fosfato 5' competente para ligamiento (Figura 111, etapa C) antes del ligamiento (Figura 111, etapa D, panel de la derecha). La digestión con exonucleasa retira todos los productos sin ligar o lineales dejando solo las construcciones de ADN circulares monocatenarias deseadas que comprenden la secuencia de ADNc de los exones deseados acopladas a una secuencia de identificador único, una secuencia de identificador de paciente, y/o una secuencia de captura (por ejemplo, una secuencia de unión de cebador). Este producto es adecuado para amplificación por círculo rodante y secuenciación posterior, como se describe en el presente documento.

La Figura 112 muestra una variación del proceso que se representa en la Figura 111 para detectar y cuantificar exones específicos en ARNm o ARNInc. En esta realización, la primera y la segunda sondas oligonucleotídicas se hibridan con su respectiva región complementaria de la molécula de ADNc, como se muestra en la Figura 112, etapa B. Una polimerasa extiende los extremos 3' hibridados de cada primera y segunda sondas para formar uniones de ligamiento con los extremos 5' hibridados de la segunda y la primera sondas, respectivamente, como se muestra en la Figura 112, etapa C. Cuando las sondas oligonucleotídicas tienen un OH 5' (lado derecho de la Figura 110, etapa C), la actividad de nucleasa 5' de la polimerasa escinde la base solapante 5' de emparejamiento, dejando un fosfato 5' competente para ligamiento. Una ligasa (círculos rellenos) sella covalentemente los extremos adyacentes de las primeras y las segundas sondas oligonucleotídicas hibridadas para crear productos de ligamiento circulares (Figura 112, etapa D). La digestión con exonucleasa retira todos los productos sin ligar o lineales dejando solo las construcciones de ADN circulares monocatenarias deseadas que comprenden la secuencia de ADNc de los exones deseados acopladas a una secuencia de identificador único, una secuencia de identificador de paciente, y/o una secuencia de captura (es decir, una secuencia de unión de cebador). Este producto es adecuado para amplificación por círculo rodante y secuenciación posterior, como se describe en el presente documento.

La Figura 113 muestra otro proceso de acuerdo con este aspecto de la invención que es adecuado para la detección de polimorfismos conocidos en la misma cadena de ADN genómico. Como se muestra en la Figura 113, etapa A, las regiones corriente arriba y corriente abajo del segmento de ADN genómico diana contienen polimorfismos. Como se muestra en la Figura 113, etapa B, para cada diana potencial se proporcionan dos sondas oligonucleotídicas, conteniendo cada sonda secuencias específicas de diana 3' y 5' que son complementarias a las partes corriente arriba y corriente abajo del ADN que contiene polimorfismos. Las partes específicas de diana de cada sonda están separadas por una secuencia nucleotídica que contiene una secuencia de identificador único, una secuencia de identificador de paciente, una o más secuencias de unión de cebador, o cualquier combinación de las mismas. Las sondas se hibridan adyacentes entre sí en las secuencias de ADN genómico diana, como se muestra en la Figura 113, etapa B. Si las sondas oligonucleotídicas contienen extremos 5' competentes para ligamiento, una ligasa sella covalentemente los extremos adyacentes de los oligonucleótidos hibridados para crear un producto de ligamiento circular, como se muestra en la Figura 113, etapa D (panel de la izquierda). Si las sondas oligonucleotídicas contienen una aleta o una base nucleotídica solapante 5', una nucleasa 5' escinde el extremo 5' para generar un fosfato 5' competente para ligamiento (Figura 113, etapa C) antes del ligamiento (Figura 113, etapa D, panel de la derecha). La digestión con exonucleasa retira todos los productos sin ligar o lineales dejando solo las construcciones de ADN circulares monocatenarias deseadas que comprenden las secuencias corriente arriba y corriente abajo del ADN genómico que contiene polimorfismos acopladas a una secuencia de identificador único, una secuencia de identificador de paciente, y/o una secuencia de captura (por ejemplo, una secuencia de unión de cebador). Este producto es adecuado para amplificación por círculo rodante y secuenciación posterior, como se describe en el presente documento.

Otra aspecto de la presente invención se refiere a un método para identificar, en una muestra, una o más moléculas de miARN diana que difieren de otras moléculas de ácido nucleico en la muestra en una o más bases. Este método implica proporcionar una muestra que contiene una o más moléculas de miARN diana que contienen potencialmente una o más diferencias de bases, y añadir conectores nucleotídicos a los extremos 3' y 5' de las moléculas de miARN diana en la muestra. Este método implica además proporcionar una o más sondas oligonucleotídicas, comprendiendo cada sonda oligonucleotídica (a) una parte 3' complementaria al conector nucleotídico 3' de la molécula de miARN diana, (b) una parte 5' complementaria al conector nucleotídico 5' de las moléculas de miARN diana, y (c) una parte adicional, comprendiendo dicha parte adicional (i) una secuencia de identificador único, (ii) una secuencia de identificador de paciente, (iii) una o más secuencias de unión de cebador, o cualquier combinación de (i), (ii), y (iii). La muestra se pone en contacto con las una o más sondas oligonucleotídicas en condiciones eficaces para que las partes 3' y 5' de las sondas oligonucleotídicas se hibriden de forma específica de acuerdo con las bases con conectores nucleótidos complementarios en las moléculas de miARN diana, si estuvieran presentes en la muestra. El extremo 3' de la sonda oligonucleotídica hibridada se extiende para generar un complemento de las una o más moléculas de miARN diana, y el extremo 3' extendido de la sonda oligonucleotídica se liga al extremo 5' de la sonda oligonucleotídica para formar un producto ligado circular que comprende una secuencia complementaria al conector nucleotídico 3' de la molécula de miARN diana, una secuencia complementaria al conector nucleotídico 5' de la molécula de miARN diana, el complemento de las una o más moléculas de miARN diana, y la parte adicional de la sonda oligonucleotídica. Este método implica además detectar y distinguir los productos ligados circulares en la muestra para identificar de ese modo la presencia de una o más moléculas de miARN diana que se diferencian de otras moléculas de ácido nucleico en la muestra en una o más bases.

De acuerdo con este aspecto de la presente invención, la Figura 114 muestra un proceso para detectar poblaciones genéricas de miARN. El material de partida para este proceso es miARN aislado de suero, o plasma, o exosomas (Figura 114, etapa A). Como se muestra en la Figura 114, etapa B, se añaden conectores nucleotídicos a los extremos 3' y 5' de las moléculas de ácido ribonucleico diana en la muestra. Como se muestra en la Figura 114, etapa B, el conector 3' contiene un grupo de bloqueo en su extremo 3' y un grupo fosfato en su extremo 5' para facilitar el ligamiento usando ARN ligasa T4 (círculos rellenos) en el extremo 3' de la molécula de miARN diana. El conector 5', que también contiene un grupo de bloqueo en su extremo 5', se liga del mismo modo al extremo 5' de la molécula de miARN usando ARN ligasa T4. Las sondas oligonucleotídicas, que contienen una parte 3' complementaria al conector nucleotídico 3' del miARN diana y una parte 5' complementaria al conector nucleotídico 5' del miARN diana, se hibridan con su molécula de miARN diana con conector añadido (Figura 114, etapa C). Las sondas oligonucleotídicas también contienen una secuencia nucleotídica que comprende una secuencia de identificador único, una secuencia de identificador de paciente, una o más secuencias de unión de cebador, o cualquier combinación de las mismas. Una transcriptasa inversa que carece de actividad 5 '^3 ' (diamante relleno) extiende el extremo 3' de la sonda oligonucleotídica hibridada, copiando la secuencia de miARN hasta que sea adyacente al extremo 5' competente para ligamiento de la sonda oligonucleotídica (Figura 114, etapa D). Como se muestra en la Figura 114, etapa E, la ADN ligasa T4 (círculos rellenos) sella covalentemente el extremo 3' extendido de la sonda oligonucleotídica para crear un producto de ligamiento circular. La UDG y la endonucleasa AP (triángulos rellenos) realizan mellas en el miARN (Figura 114, etapa E), y la digestión con exonucleasa de todos los productos sin ligar o con mellas deja solo la construcción de ácido nucleico monocatenario circular deseada que comprende una copia de la diana de miARN acoplada a una secuencia de identificador único. Este producto es adecuado para amplificación por círculo rodante y secuenciación circular, como se describe en el presente documento.

Otro aspecto de la presente invención se refiere a un método para identificar, en una muestra, una o más moléculas de miARN diana que se diferencian de otras moléculas de ácido nucleico en la muestra en una o más bases. Este método implica proporcionar una muestra que contiene una o más moléculas de miARN diana que contienen potencialmente una o más diferencias de bases, y ligar conectores nucleotídicos a los extremos 3' y 5' de las moléculas de miARN diana en la muestra. Los conectores nucleotídicos se acoplan entre sí mediante una parte adicional, comprendiendo dicha parte adicional (i) una secuencia de identificador único, (ii) una secuencia de identificador de paciente, (iii) una o más secuencias de unión de cebador, o cualquier combinación de (i), (ii), y (iii), mediante lo cual dicho ligamiento forma un producto de ligamiento circular que comprende la molécula de miARN diana, las secuencias de conector nucleotídico 3' y 5', y la parte adicional. Este método implica además proporcionar uno o más primeros cebadores oligonucleotídicos que comprenden una secuencia nucleotídica que es complementaria a una secuencia de conector nucleotídico 3' o 5' del producto de ligamiento circular, e hibridar los uno o más primeros cebadores oligonucleotídicos con el producto de ligamiento circular de forma específica de acuerdo con las bases. El extremo 3' del primer cebador oligonucleotídico se extiende para generar un complemento del producto de ligamiento circular, y los complementos del producto de ligamiento circular en la muestra se detectan y se distinguen, para identificar de ese modo la presencia de una o más moléculas de miARN diana que se diferencian de otras moléculas de ácido nucleico en la muestra en una o más bases.

De acuerdo con este aspecto de la presente invención, la Figura 115 muestra un proceso para detectar secuencias de miARN específicas. El miARN aislado de suero o exosomas (Figura 115, etapa A) se fosforila en su extremo 5'. Como se muestra en la Figura 115, etapa B, los conectores nucleotídicos acoplados se ligan en los extremos 3' y 5' de las moléculas de ácido ribonucleico diana en la muestra. Los conectores nucleotídicos están acoplados mediante una secuencia nucleotídica que contiene una secuencia de identificador único, un ribonucleótido 3', una secuencia de identificador de paciente, una o más secuencias de unión de cebador, o cualquier combinación de las mismas. El ligamiento de los conectores nucleotídicos acoplados se facilita mediante una sonda oligonucleotídica que tiene una secuencia 3' complementaria al extremo 3' del conector acoplado, una secuencia 5' complementaria al extremo 5' del conector acoplado, y una secuencia complementaria al miARN diana, como se muestra en la Figura 115, etapa B. El ligamiento de los conectores nucleotídicos a la molécula de miARN crea productos de ligamiento circularizados que contienen la molécula de miARN diana. Como se muestra en la Figura 115, etapa C, la digestión con exonucleasa retira todos los productos sin ligar, por ejemplo, la sonda oligonucleotídica, dejando solo la construcción de ácido nucleico monocatenario circularizada deseada que contiene el miARN diana. Como se muestra en la Figura 115, etapa D, un cebador fosforilado 5' se hibrida con la construcción circularizada, y una polimerasa que tiene actividad de transcriptasa inversa (diamante), pero que carece de actividad 5'^3', extiende el cebador hibridado alrededor de la construcción circularizada generando una copia complementaria de la molécula de miARN. Una ligasa (círculo relleno) sella covalentemente el extremo 3' extendido y el extremo 5' fosforilado del cebador para crear un segundo producto de ligamiento circularizado, como se muestra en la Figura 115, etapa E. La UDG y la endonucleasa AP (triángulo relleno) realizan mellas en la molécula de miARN original, y la digestión con exonucleasa retira todos los productos sin ligar o con mellas dejando solo las construcciones de ácido nucleico monocatenario circulares deseadas que comprenden una copia de la diana de miARN acopladas a una secuencia de identificador único. Este producto es adecuado para amplificación por círculo rodante y secuenciación circular, como se describe en el presente documento.

La Figura 116 muestra una variación del proceso que se representa en la Figura 115 para detectar secuencias de miARN específicas. En esta variación, el ligamiento de los conectores nucleotídicos acoplados al miARN diana se facilita usando una sonda oligonucleotídica que tiene un grupo de bloqueo 3' y un espaciador interno ("X") dentro de la secuencia que es complementaria a la secuencia de miARN diana (Figura 116, etapa B, panel de la izquierda). El ligamiento de los conectores nucleotídicos acoplados al miARN diana forma productos de ligamiento circularizados, como se muestra en la Figura 116, etapa B (panel de la izquierda). Un cebador OH 5' que contiene tiofosfatos se hibrida con los productos de ligamiento circularizados, como se muestra en la Figura 116, etapa C. Una polimerasa que tiene actividad de transcriptasa inversa y actividad de nucleasa 5 '^3 ' (diamantes rellenos) extiende el extremo 3' del cebador hibridado para formar una copia complementaria del producto de ligamiento circularizado y la molécula de miARN diana contenida en el mismo (Figuras 116, etapa C, y 116, etapa D, panel de la izquierda). La actividad de nucleasa 5' de la polimerasa escinde la base solapante 5' de emparejamiento del cebador, dejando un fosfato 5' competente para ligamiento (Figura 116, etapa D, panel de la izquierda). Una ligasa (círculo relleno) sella covalentemente el extremo extendido para crear productos de ligamiento circulares, como se muestra en la Figura 116, etapa E. La UDG y la endonucleasa AP (triángulo relleno) realizan mellas en la molécula de miARN original (Figura 116, etapa E, panel de la izquierda), y la digestión con exonucleasa retira todos los productos sin ligar o con mellas dejando solo el ADN circular monocatenario deseado que comprende una copia de la diana de miARN acoplado a una secuencia de identificador único (Figura 116, etapa F, panel de la izquierda). Este producto es adecuado para amplificación por círculo rodante y secuenciación circular, como se describe en el presente documento. En ausencia de un miARN diana, como se muestra en la Figura 116, etapas B-E, panel de la derecha, la extensión del cebador con nucleasa 5 '^3 ' crea un hueco con una rotura bicatenaria. Los productos con huecos no se ligan y permanecen lineales (Figura 116, etapa E, panel de la derecha). Estos productos lineales se retiran del análisis mediante digestión con exonucleasa (Figura 116, etapa F).

Otro aspecto de la presente invención se refiere a un método para identificar, en una muestra, una o más moléculas de miARN diana que se diferencian de otras moléculas de ácido nucleico en la muestra en una o más bases. Este método implica proporcionar una muestra que contiene una o más moléculas de miARN diana que contienen potencialmente una o más diferencias de bases, y proporcionar uno o más conjuntos de sondas oligonucleotídicas, comprendiendo cada conjunto (a) una primera sonda oligonucleotídica que tiene una parte de tallo-bucle 5' y una parte 3' complementaria a una parte 3' de la molécula de miARN diana, (b) una segunda sonda oligonucleotídica que tiene una parte 3' complementaria a una copia del extremo 5' de la molécula de miARN diana, una parte 5' complementaria a la parte de tallo-bucle 5' de la primera sonda oligonucleotídica, y una parte adicional que comprende (i) una secuencia de identificador de diana único, (ii) una secuencia de identificador de paciente, (iii) una secuencia de unión de cebador, o cualquier combinación de (i), (ii), y (iii). El método implica además mezclar la muestra, las una o más primeras sondas oligonucleotídicas de un conjunto de sondas, y una transcriptasa inversa para formar una reacción de transcriptasa inversa, y extender el extremo 3' de la primera sonda oligonucleotídica hibridada con su molécula de miARN diana complementaria para generar un complemento de la molécula de miARN diana, si estuviera presente en la muestra. Las una o más segundas sondas oligonucleotídicas de un conjunto de sondas se hibridan con las primeras sondas oligonucleotídicas extendidas que comprenden un complemento de las secuencias de miARN diana, y se generan una o más uniones competentes para ligamiento entre los extremos 3' y 5' de cada segunda sonda oligonucleotídica hibridada con una primera sonda oligonucleotídica extendida. El método implica además ligar los extremos 3' y 5' de cada segunda sonda oligonucleotídica para formar productos ligados circulares, comprendiendo cada producto una copia de ácido desoxirribonucleico de la secuencia de miARN diana acoplada a la parte adicional de la segunda sonda oligonucleotídica. Los productos ligados circulares en la muestra se detectan y se distinguen, para identificar de ese modo la presencia de una o más moléculas de miARN diana que se diferencian de otras moléculas de ácido nucleico en la muestra en una o más bases.

De acuerdo con este aspecto de la presente invención, la Figura 117 muestra un método para detectar secuencias de miARN específicas. El miARN, aislado de suero, plasma, o exosomas se hibrida con una primera sonda oligonucleotídica que tiene una secuencia que es complementaria al extremo 3' del miARN diana, un tallo-bucle en su extremo 5' (Figura 117, etapa B). La región de tallo-bucle de la primera sonda oligonucleotídica también contiene un enlace escindible (dU). La primera sonda oligonucleotídica se extiende usando una transcriptasa inversa (diamantes rellenos), formando de ese modo una copia complementaria de la molécula de miARN. Como se muestra en la Figura 117, etapa C, una segunda sonda oligonucleotídica que contiene una secuencia 3' que es complementaria al extremo 3' de la primera sonda oligonucleotídica extendida, y una secuencia 5' que es complementaria al tallo-bucle 5' de la primera sonda oligonucleotídica se hibrida con regiones complementarias de la primera sonda oligonucleotídica. Las segundas sondas oligonucleotídicas también pueden contener una secuencia de identificador único, una secuencia de identificador de paciente, una o más secuencias de unión de cebador, un fosfato 5', o cualquier combinación de las mismas. Una polimerasa (diamantes rellenos) extiende el extremo 3' de la segunda sonda oligonucleotídica, produciendo una copia complementaria de la secuencia de miARN y creando un puente en el extremo 3' de la sonda adyacente a su extremo 5' para formar una unión de ligamiento (Figura 117, etapa D). La polimerasa también extiende el extremo 3' de la primera sonda oligonucleotídica (usando la segunda sonda oligonucleotídica hibridada como molde) para crear una unión de ligamiento con su extremo 5' (Figura 117, etapa D). Como se muestra en la Figura 117, etapa E, una ligasa (círculos rellenos) sella covalentemente los extremos 3' y 5' de la primera y la segunda sondas oligonucleotídicas en cada respectiva unión de ligamiento para crear productos de ligamiento circularizados. Se introduce una mella en el enlace escindible de la primera sonda oligonucleotídica (por ejemplo, por escisión con UDG de dU, y endonucleasa AP - triángulo relleno). Como se muestra en la Figura 117, etapa E, la digestión con exonucleasa retira todos los productos sin ligar o con mellas dejando solo la construcción de ácido nucleico monocatenaria circularizada deseada (es decir, la segunda sonda oligonucleotídica) que comprende una copia de la secuencia diana de miARN acoplada a una secuencia de identificador único. Este producto es adecuado para amplificación por círculo rodante y secuenciación circular, como se describe en el presente documento.

Ejemplos

Ejemplo profético comparativo 1 - Marcador de mutación de alta sensibilidad (cuando está presente de un 1 % a un 0,01 %), mutación de una sola base, mutaciones por inserciones pequeñas y deleciones pequeñas en genes conocidos (por ejemplo, Braf, K-ras, p53).

Los cambios mutacionales en los oncogenes se producen normalmente en regiones o posiciones discretas y, a menudo, pueden conducir a la progresión del tumor. Puede encontrarse un listado de estos genes y sus mutaciones en bases de datos públicas tales como la base de datos "COSMIC" del Sanger Genome Center. La presencia de tales mutaciones en el suero es un fuerte indicador de algún tejido tumoral en el organismo. Tradicionalmente, tales mutaciones se han identificado usando amplificación por PCR específica de alelos. Este enfoque es susceptible de una falsa amplificación inicial, seguida de la amplificación del producto falso. Otros investigadores han usado PCR digital para tratar de cuantificar el ADN mutante en el suero. Sin embargo, los cambios mutacionales en genes supresores de tumores, tales como p53 y APC, son demasiado numerosos para abarcarlos usando enfoques de PCR específica de alelos. De ese modo, el enfoque se ha modificado hacia una secuenciación profunda en todos los exones de la proteína. Cuando el ADN entrante es limitante, es importante conseguir una amplificación equitativa de diferentes regiones para garantizar el mismo nivel general de cobertura. Se han realizado intentos de conseguir amplificaciones equitativas usando sondas de inversión molecular (MIP); véanse, por ejemplo, Akhras et al., "Connector Inversion Probe Technology: A Powerful One-Primer Multiplex DNA Amplification System for Numerous Scientific Applications", PLoS One 2(9):e915 (2007); Hiatt et al., "Single Molecule Molecular Inversion Probes for Targeted, High-Accuracy Detection of Low-Frequency Variation", Genome Res. 23(5):843-54 (2013). Sin embargo, estas técnicas dependen de la preparación de una copia de ADN genómico y, de ese modo, corren el riesgo de introducir errores adicionales.

Visión general del enfoque: la idea es capturar fielmente cada fragmento de ADN diana que cubre las regiones o exones de interés, añadir una secuencia de identificador único y un identificador de paciente opcional, y circularizarlos para la secuenciación posterior, tal como secuenciación circular. La cadena de ADN diana original se circulariza y se secuencia. Esto evita los errores inducidos por la polimerasa que surgen de la extensión (y circularización) de oligonucleótidos hibridados, lo que podría conducir a falsos positivos. Este enfoque proporciona la ventaja de obtener a la vez información sobre el número de copias cuando sea necesario (es decir, carga vírica, desequilibrio cromosómico en tumores, detección de aneuploidía en el diagnóstico prenatal no invasivo), y datos mutacionales con la mínima secuenciación requerida.

Variación 1.1: (Figuras 13-16). En esta variación, los conectores cortos se ligan a la diana de ADN (ADNcf con una longitud media de aproximadamente 160 bases). Para capturar las regiones deseadas, las sondas oligonucleotídicas que comprenden una región de sonda 5' complementaria a las secuencias en el lado 5' de la diana, una secuencia de identificador único, una secuencia de identificador de paciente opcional, una secuencia complementaria al extremo 3' del conector, y una región de sonda 3' complementaria a las secuencias en el lado 3' de la diana, se hibridan con la diana. El oligonucleótido puede contener un grupo de bloqueo opcional en un extremo (se muestra el extremo 5'), o un conector escindible opcional. Dependiendo del diseño de la sonda y de las bases de inicio y finalización del fragmento diana, una parte de la diana puede formar un bucle como una región monocatenaria entre el conector 3' y la parte de la diana complementaria a la sonda 3' (Figuras 13 y 14), o una parte del extremo 5' de la secuencia diana puede no hibridarse, o una parte de la secuencia de sonda 5' del oligonucleótido puede formar un bucle (Figuras 15 y 16). La adición de una polimerasa permite la extensión del extremo 3' del oligonucleótido en la diana, así como la extensión del conector del conector en el extremo 3' a través de la secuencia de identificador único, y la secuencia de identificador de paciente opcional.

Las condiciones de hibridación se eligen de modo que la hibridación de la región de sonda 3' complementaria con la secuencia del lado 3' de la diana deje la concentración local del extremo 3' del conector en la diana al nivel de su complemento, de modo que se hibride correctamente y se extienda fácilmente con la polimerasa. Sin embargo, si hay una complementariedad insuficiente entre la sonda oligonucleotídica y el ADN diana, entonces el extremo 3' del conector en la diana no se hibridará con su complemento, y casi nunca se extenderá con la polimerasa. La extensión del extremo 3' del oligonucleótido en la diana potencia la asociación de la sonda a la diana, y, de ese modo, aumenta la capacidad del extremo 3' del conector de hibridarse correctamente con su complemento y extenderse con la polimerasa. La actividad de escisión por nucleasa 5 '^3 ' de la polimerasa (o nucleasa Fen) escinde una base solapante 5' de emparejamiento de la diana en o cerca de la posición en donde el lado 5' de la diana es complementario a la parte 5' de la sonda, dejando un fosfato 5' competente para ligamiento de la diana auténtica. La polimerasa también extiende el oligonucleótido en la diana, y genera un fosfato 5' competente para ligamiento (lado izquierdo de las Figuras 13 y 15, etapa D), o no escinde el grupo de bloqueo en el extremo 5' del oligonucleótido (lado derecho de las Figuras 13 y 15, etapa D).

Una ligasa sella covalentemente los extremos 3' extendidos al fosfato 5' competente para ligamiento para crear productos de ligamiento circulares. El grupo de bloqueo evita la circularización de la sonda oligonucleotídica (Figuras 13 y 15, etapa D, lado derecho) o, alternativamente, se introduce una mella en el enlace escindible (por ejemplo, escisión con UDG de dU, seguida de escisión de la cadena principal apurínica con endonucleasa AP, Figuras 13 y 15, etapa D, lado izquierdo). La adición opcional de Uracil-ADN glicosilasa (UDG) y Formamidopirimidina-ADN glicosilasa (Fpg, también conocida como 8-oxoguanina ADN glicosilasa, que actúa como una N-glicosilasa y como una AP-liasa) puede usarse para realizar mellas en dianas que contienen bases dañadas. A continuación, se añaden una o varias exonucleasas para digerir todos los productos no ligados o con mellas dejando solo el ADN circular monocatenario deseado que comprende el ADN diana original con una secuencia de identificador único. Este producto es adecuado para la amplificación por círculo rodante y secuenciación circular, o para secuenciación SMRT directa.

Este enfoque requiere una enzima con actividad de nucleasa 5 '^3 ' dependiente de diana de modo que el fosfato 5' competente para ligamiento se genere solo cuando haya una hibridación y complementariedad adecuadas entre la región de sonda 5' y la región diana 5'. Cuando se usa polimerasa con actividad de escisión por nucleasa 5'^3', el desafío es evitar que la polimerasa extienda el conector corto a lo largo de la región de sonda 5' de modo que destruya la región diana 5' (es decir, traducción de mellas) sin una etapa de ligamiento. La traducción de mellas que destruye el ADN diana original y lo sustituye por ADN extendido puede introducir sin darse cuenta un error de polimerasa que podría propagarse y podría considerarse erróneamente como una mutación. Esto puede minimizarse usando una mezcla de polimerasas, con y sin actividad de escisión por nucleasa 5 '^3 ' (por ejemplo, en una relación de 1:20) en condiciones de extensión distributiva en presencia de ligasa de modo que la mayor parte de la extensión se realice con polimerasa sin actividad de nucleasa hasta que se requiera polimerasa con actividad de nucleasa para crear la unión competente para ligamiento, seguida de disociación por polimerasa, y un suceso de ligamiento para generar el producto de ligamiento circular deseado.

El ADNcf, con tamaños en el intervalo de 140 a 170 nucleótidos, refleja la escisión del ADN cromosómico alrededor de las unidades de nucleosomas. Tales sucesos de escisión pueden estar de cierta manera en fase, o ser más aleatorios, generando una diversidad de fragmentos que pueden distribuirse de manera uniforme o desigual. De ese modo, existe la necesidad de diseñar sondas oligonucleotídicas que den cobertura independiente de dónde se rompe el fragmento.

Las Figuras 90 a 93 proporcionan algunos ejemplos de diferentes diseños de sonda oligonucleotídica para cubrir fragmentos en una región de 250 bases. En estas figuras, el fragmento diana potencial (desplazado 10 bases en una región) está representado por una barra de color gris oscuro, los conectores por una barra corta de color negro, las regiones de la sonda como barras de color gris claro, el identificador de secuencia único y el identificador de paciente opcional como una línea más gruesa de color negro, y la conexión entre dos secuencias dibujada esquemáticamente como una línea más fina. Las Figuras 100 y 101 ilustran el modo en que podrían diseñarse múltiples sondas para cubrir aproximadamente una región contigua de 500 bases.

En la Figura 90, la región de sonda 5' corriente arriba (60 bases) es complementaria a las bases diana 50-110, mientras que la región de sonda 3' corriente abajo (20 bases) es complementaria a las bases diana 140-160. Para los fines de este ejemplo, el conector tiene 10 bases, y la secuencia de identificador compuesta tiene 20 bases (12 bases para el identificador de secuencia y 8 bases para el identificador de paciente). Cuando la diana va de la posición 1 a la 160, este diseño de sonda permitirá la circularización de un producto de 140 bases, de las cuales 110 bases, es decir, de las posiciones 50 a 160, proporcionan información de la secuencia diana. Cuando la diana va de la posición 11 a la 170, este diseño de sonda permitirá la circularización de un producto de 150 bases, de las cuales 120 bases, es decir, de las posiciones 50 a 170, proporcionan información de la secuencia diana. Con este diseño, las 160 bases máximas de información de secuencia se obtendrán a partir de la diana comenzando en las posiciones 51 a 81 y terminando en las posiciones 210 a 240, respectivamente. En la figura, cuando la diana va de la posición 61 a la 250, no hay formación de producto circular. Sin embargo, podría formarse algún producto, debido a la región de complementariedad más corta entre la región de sonda en el extremo 5' y el lado 5' de la diana, aunque existe la preocupación de que no siempre se hibridarán. Además, con este diseño, existe la preocupación de que la región "en bucle" de la diana de 90 bases en el lado 3' pueda ser demasiado larga para permitir la hibridación eficaz del extremo 3' del conector con su complemento en el oligonucleótido (barras cortas de color negro en el lado derecho de la ilustración).

En la Figura 91, la región de sonda 5' corriente arriba (80 bases) es complementaria a las bases diana 30-110, mientras que la región de sonda 3' corriente abajo (20 bases) es complementaria a las bases diana 140-160. Esta figura es similar a la Figura 90, excepto en que la región de sonda 5' es más larga. Para los primeros 4 ejemplos de dianas, el oligonucleótido más largo permite la captura de más ADN diana, de modo que los círculos resultantes contienen 20 bases adicionales de ADN diana original.

Las Figuras 100 y 101 ilustran el modo en que diseñar sondas oligonucleotídicas con una estrategia de mosaico solapante para secuenciar regiones contiguas más grandes (en el presente documento se muestran aproximadamente 500 bases). La Figura 100 ilustra cuatro sondas "consecutivas" que usan el diseño de la Figura 90, mientras que la Figura 101 ilustra cuatro sondas "consecutivas" que usan el diseño de la Figura 91. Se ilustran fragmentos potenciales de 160 pb que podrían generarse en la región (desplazados 10 bases). Debajo se muestra el oligonucleótido que podría cubrir todos esos fragmentos anteriores. Si el área en la diana está en color gris claro, no proporcionará información de secuencia fiable. Si el área en la diana está en color gris oscuro, podría proporcionar una buena información de secuencia. En este diagrama, las sondas enumeradas se designan secuencialmente como n.° 1, n.° 2, n.° 3, n.° 4, etc. Para las etapas de extensión multiplexada-ligamiento, las sondas impares n.° 1, n.° 3, n.° 5 se agrupan en un primer grupo de oligonucleótidos, y a continuación, las sondas pares n.° 2, n.° 4, n.° 6 se agrupan en un segundo grupo. Este enfoque evita que los oligonucleótidos adyacentes (es decir, n.° 1 y n.° 2) compitan por unirse a la misma cadena diana. Una vez que ha tenido lugar la extensión-circularización, los dos grupos pueden combinarse y puede procederse a las etapas de exonucleasa y las etapas posteriores, tales como amplificación por círculo rodante y secuenciación circular, o secuenciación SMRT directa.

Protocolo detallado (V1.1) para la detección de alta sensibilidad de mutaciones de una sola base, mutaciones por inserciones pequeñas, o deleciones pequeñas (cuando están presentes de un 1 % a un 0,01 %), en genes conocidos (por ejemplo, Braf, K-ras, p53):

1.1. a. Comenzando con ADNcf (o por ejemplo ADN genómico aislado de CTC, cortado a aproximadamente 150 pb), reparar los extremos con polimerasa T4 y quinasa T4, y posteriormente se añade una protuberancia A en el extremo 3' de una sola base con Klenow (exo-) y dATP. Los conectores tienen una protuberancia T en el extremo 3' de una sola base, de modo que el ligamiento usando ligasa T4 añade conectores en ambos extremos del fragmento. Opcionalmente, purificar el ADN diana del conector sin ligar.

1.1. b. Desnaturalizar los conectores que contienen ADN diana en ambos extremos (94 °C, 1 minuto) en presencia de sondas oligonucleotídicas (que comprenden una región de sonda en el extremo 5' complementaria a las secuencias en el lado 5' de las dianas, una secuencia de identificador único, una secuencia de identificador de paciente opcional, una secuencia complementaria al extremo 3' del conector, y una región de sonda en el extremo 3' complementaria a las secuencias en el lado 3' de las dianas), y permitir que los oligonucleótidos se hibriden con sus regiones complementarias en los fragmentos deseados mediante enfriamiento a una temperatura deseada (por ejemplo, 50 °C durante 2 horas). Una polimerasa Taq y una ligasa termoestable (preferentemente de la cepa AK16D), los dNTP y KlenTaq (polimerasa Taq que carece de actividad de nucleasa) opcional se añaden después de la etapa de hibridación, o al comienzo del procedimiento. Permitir la extensión y el ligamiento a la temperatura de hibridación, y, opcionalmente, aumentar la temperatura (por ejemplo, 60 °C) para garantizar la finalización de la extensión y el ligamiento, para generar productos circulares.

1.1.c. Opcionalmente, escindir la cadena de la sonda oligonucleotídica en un enlace escindible (por ejemplo, U escindido usando UDG y endonucleasa AP). Añadir Exonucleasa I (digiere el ADN monocatenario en la dirección 3'^-5'), y Exonucleasa III (digiere el ADN bicatenario en la dirección 3'^-5'), para digerir todos los productos sin ligar o con mellas, dejando solo el ADN monocatenario circular deseado que comprende el ADN diana original, la secuencia del conector, la secuencia de identificador único, y una secuencia de identificador de paciente opcional. Este producto es adecuado para la amplificación por círculo rodante (usando cebadores hexámeros aleatorios con polimerasa phi-29) para crear repeticiones en tándem de la secuencia deseada, y posterior identificación de las dianas usando secuenciación de nueva generación o, alternativamente, secuenciación SMRT directa en el molde cerrado covalentemente, usando la secuencia del conector como un sitio de unión de cebador.

Nota 1: la sonda oligonucleotídica puede contener un grupo de bloqueo opcional en el lado 5' para interferir con la posterior actividad de nucleasa 5 '^3 ' de la polimerasa, de modo que la sonda oligonucleotídica no se circularice. Alternativamente, en la sonda oligonucleotídica original puede incluirse un enlace escindible.

Nota 2: para generar el fosfato 5' competente para ligamiento en el lado 5' de la diana puede usarse una nucleasa Fen en lugar de la polimerasa con actividad de nucleasa 5'^3'.

Nota 3: puede usarse una mezcla 1:20 de polimerasa Taq (con actividad de nucleasa 5 '^3 ') y KlenTaq (polimerasa Taq sin actividad de escisión por nucleasa 5 '^3 ' en condiciones de extensión distributiva (es decir, concentración salina más elevada) para minimizar la degradación del ADN diana por traducción de mellas.

Nota 4: el proceso de extensión y ligamiento puede llevarse a cabo en dos o más tubos de reacción, conteniendo un conjunto las sondas con numeración "impar", y conteniendo el segundo conjunto las sondas con numeración "par" para evitar que las sondas compitan por las mismas cadenas de ADN diana. Las reacciones separadas pueden agruparse posteriormente.

Variación 1.2. (Figuras 17-18). En esta variación, el objetivo es capturar toda la secuencia de ADN diana, independientemente del lugar en que se una la sonda a la diana. Como se ha indicado anteriormente, los conectores cortos se ligan a la diana de ADN (ADNcf con una longitud media de aproximadamente 160 bases). Para capturar las regiones deseadas, las sondas oligonucleotídicas que comprenden una región de sonda 5' complementaria a las secuencias en el lado 5' de la diana, una secuencia complementaria al extremo 5' del conector, una secuencia de identificador único, una secuencia de identificador de paciente opcional, una secuencia complementaria al extremo 3' del conector, y una región de sonda 3' complementaria a las secuencias en el lado 3' de la diana, se hibridan con la diana. La sonda oligonucleotídica puede contener un grupo de bloqueo opcional en un extremo (se muestra el extremo 5'), o un conector escindible opcional. Dependiendo del diseño de la sonda y de las bases de inicio y finalización del fragmento diana, una parte de la secuencia diana o de la secuencia de la sonda puede formar un bucle como una región monocatenaria entre el conector 3' y la parte de la diana complementaria a la sonda 3', así como el conector 5' y la parte de la diana complementaria a la sonda 5' (Figura 17). La adición de una polimerasa permite la extensión del extremo 3' del oligonucleótido en la diana, así como la extensión del conector del conector en el extremo 3' a través de la secuencia de identificador único, y la secuencia de identificador de paciente opcional hasta que sea adyacente al conector 5' en la diana.

Las condiciones de hibridación se eligen de modo que la hibridación de la región de la sonda 3' complementaria a las secuencias del lado 3' de la diana lleve la concentración local del extremo 3' del conector en la diana, de modo que se hibride correctamente y se extienda fácilmente con la polimerasa. El extremo 5' del conector puede diseñarse para que sea ligeramente más largo, de modo que una vez que la polimerasa extienda el conector en 3', no se extienda a través de la secuencia complementaria del conector 5' hasta que llegue a la parte de la diana 5' que se hibrida con la región de sonda 5'. Sin embargo, el efecto de hibridación "combinada" de las regiones tanto del conector 3' como del conector 5' con sus complementos en la sonda oligonucleotídica debería tener una Tm por debajo de la temperatura de hibridación, de modo que la hibridación aleatoria de la diana incorrecta a la sonda oligonucleotídica en raras ocasiones y, si se produce, de como resultado extensión y ligamiento para dar un producto circular.

Esta variación requiere que la sonda oligonucleotídica contenga secuencias complementarias a ambas cadenas de conector 3' y 5', estando dichas secuencias separadas por solo aproximadamente 20 bases. Dado que las secuencias son complementarias a las cadenas de conector, que a su vez son complementarias entre sí, es necesario evitar el autoemparejamiento de la sonda oligonucleotídica. Una solución es ligar conectores que contienen una burbuja interna, de modo que los dos conectores retengan el carácter bicatenario a la baja temperatura usada para el ligamiento del conector (16 °C o incluso 4 °C con ligasa T4). Además, el conector 5' puede diseñarse para que sea más largo que el conector 3'. Por último, las regiones de complementariedad dentro del conector pueden diseñarse para que tengan desemparejamientos sutiles o un análogo de nucleótido (es decir, G:T y T:G; o I:A) que son más desestabilizadores en la sonda oligonucleotídica complementaria (es decir, C:A y A:C; o C:T) de modo que sea menos probable que la sonda oligonucleotídica forme el autoemparejamiento interno con un bucle a la temperatura de hibridación global (es decir, 50 °C).

Por ejemplo, un desemparejamiento I:A en el medio de un tramo A en un conector podría reducir la Tm en 2,4 °C en comparación con un emparejamiento T:A, mientras que el desemparejamiento complementario en el oligonucleótido, C:T reduce la Tm en 10,1 °C (una diferencia de 7,7 °C). Del mismo modo, un desemparejamiento G:T en el medio de un tramo A en un conector podría reducir la Tm en 10,2 °C en comparación con un emparejamiento G:C, mientras que el desemparejamiento complementario en el oligonucleótido, A:C, reduce la Tm en 18,0 °C (una diferencia de 7,8 °C). Véase Kawase et al., "Studies on nucleic acid interactions. I. Stabilities of mini-duplexes (dG2A4XA4G2-dC2T4YT4C2) and self-complementary d(GGGAAXYTTCCC) containing deoxyinosine and other mismatched bases", Nucleic Acids Res. 14(19):7727-36 (1986)). De ese modo, podría predecirse que la colocación de ambos desemparejamientos dentro del conector disminuirá la Tm del autoemparejamiento de oligonucleótidos en aproximadamente 15,5 °C en comparación con el autoemparejamiento de conectores. El valor exacto puede variar dependiendo del contexto de la secuencia aunque, sin embargo, para los expertos en la materia debería ser evidente que el uso de los desemparejamientos I:A y G:T en un dúplex conector-ADN que permanece bicatenario a la temperatura de ligamiento de 4 °C o 16 °C, podría ser más que suficiente para garantizar que las secuencias complementarias, separadas por aproximadamente 20 bases dentro de un oligonucleótido, no se autoemparejen (es decir, una horquilla con un bucle de 20 bases) a una temperatura de hibridación más elevada de 50 °C.

La extensión del extremo 3' del oligonucleótido en la diana potencia la asociación de la sonda a la diana, y, de ese modo, aumenta la capacidad del extremo 3' del conector de hibridarse correctamente con su complemento y extenderse con la polimerasa. La actividad de escisión por nucleasa 5 '^3 ' de la polimerasa (o nucleasa Fen) escinde una base solapante 5' de emparejamiento del conector 5', dejando fosfato 5' competente para ligamiento en el conector. La polimerasa también extiende el oligonucleótido en la diana, y genera un fosfato 5' competente para ligamiento o no escinde el grupo de bloqueo en el extremo 5' del oligonucleótido.

Una ligasa sella covalentemente los extremos 3' extendidos al fosfato 5' competente para ligamiento para crear productos de ligamiento circulares. El grupo de bloqueo evita la circularización de la sonda oligonucleotídica o, alternativamente, se introduce una mella en el enlace escindible (por ejemplo, escisión con UDG de dU, seguida de escisión de la cadena principal apurínica con endonucleasa AP). La adición opcional de Uracil-ADN glicosilasa (UDG) y Formamidopirimidina-ADN glicosilasa (Fpg, también conocida como 8-oxoguanina ADN glicosilasa, que actúa como una N-glicosilasa o como una AP-liasa) puede usarse para realizar mellas en dianas que contienen bases dañadas. A continuación, se añaden una o varias exonucleasas para digerir todos los productos no ligados o con mellas dejando solo el ADN circular monocatenario deseado que comprende el ADN diana original con una secuencia de identificador único. Este producto es adecuado para la amplificación por círculo rodante y secuenciación circular, o para secuenciación SMRT directa.

El desafío aquí es evitar que la polimerasa extienda el conector 3' de modo que destruya el conector 5' sin una etapa de ligamiento (es decir, traducción de mellas). Esto puede conseguirse incorporando enlaces tiofosfato en las posiciones 2a y 3a desde el extremo fosfato 5', (que se liberarán por la actividad de nucleasa 5 '^3 ' de la polimerasa). Para minimizar el desplazamiento de la polimerasa de esas bases a medida que extiende una base en exceso (lo que podría hacer imposible el ligamiento al conector corriente abajo), las bases de la diana en la unión de ligamiento podrían ser preferentemente ricas en AT en el lado 3', y ricas en GC en el lado 5'.

Un enfoque alternativo es usar un conector 5' que contenga un sitio apurínico (AP) en la posición contigua al fosfato 5' deseado. Este fosfato 5' se libera usando una EndoIII termoestable (tal como Tma EndoIII). Esta enzima escinde los sitios de AP dejando un fosfato 5' cuando el conector está unido a la diana. La endonucleasa también escinde el conector monocatenario, pero con menor eficacia, y, de ese modo, el conector hibridado al molde podría ser el sustrato preferente. Cuando se usa EndoIII termoestable, la polimerasa de PCR usada podría carecer de la actividad de exonucleasa 5'^3'.

Como se ha mencionado anteriormente, el problema de la traducción de mellas también puede minimizarse usando una mezcla de polimerasas, con y sin actividad de escisión por nucleasa 5 '^3 ' (por ejemplo, en una relación de 1:20) en condiciones de extensión distributiva en presencia de ligasa de modo que la mayor parte de la extensión se realice con polimerasa sin actividad de nucleasa hasta que se requiera polimerasa con actividad nucleasa para crear la unión competente para ligamiento, seguida de disociación por polimerasa, y un suceso de ligamiento para generar el producto de ligamiento circular deseado.

Las Figuras 94 y 95 proporcionan algunos ejemplos de diferentes diseños de sonda oligonucleotídica para cubrir fragmentos en una región de 250 bases. En estas figuras, el fragmento diana potencial (desplazado 10 bases en una región) está representado por una barra de color gris oscuro, los conectores por una barra corta de color negro, las regiones de la sonda como barras de color gris claro, el identificador de secuencia único y el identificador de paciente opcional como una línea más gruesa de color negro, y la conexión entre dos secuencias dibujada esquemáticamente como una línea más fina. Las Figuras 102 y 103 ilustran el modo en que podrían diseñarse múltiples sondas para cubrir aproximadamente una región contigua de 500 bases.

En la Figura 94, la región de sonda 5' corriente arriba (50 bases) es complementaria a las bases diana 50-100, mientras que la región de sonda 3' corriente abajo (50 bases) es complementaria a las bases diana 150-200. Para los fines de este ejemplo, el conector 3' tiene 10 bases, y la secuencia de identificador compuesta tiene 20 bases (12 bases para el identificador de secuencia y 8 bases para el identificador de paciente) y el conector 5' se ilustra como 10 bases, aunque en otra divulgación podría ser algo más largo, de aproximadamente 12 a 18 bases. Cuando la diana va de la posición 1 a la 160, este diseño de sonda permitirá la circularización de un producto de 200 bases, de las cuales 160 bases proporcionan información de la secuencia diana. Estas sondas están diseñadas de modo que, independientemente del lugar en donde se encuentre la diana, desde 1 a 160 hasta 91 a 250, aún deberían formar productos de extensión que se circularicen para formar productos de aproximadamente 200 bases.

En la Figura 95, la región de sonda 5' corriente arriba (60 bases) es complementaria a las bases diana 40-100, mientras que la región de sonda 3' corriente abajo (60 bases) es complementaria a las bases diana 140-200. Esta figura es similar a la Figura 94, excepto en que ambas regiones de sonda 3' y 5' son más largas. Este diseño de sonda puede ser más eficaz para capturar dianas en los extremos (es decir, dianas 1 a 160; 11 a 170; 81 a 240; y 91 a 250).

Las Figuras 102 y 103 ilustran el modo en que diseñar sondas oligonucleotídicas con una estrategia de mosaico solapante para secuenciar regiones contiguas más grandes (en el presente documento se muestran aproximadamente 500 bases). La Figura 102 ilustra cuatro sondas "consecutivas" que usan el diseño de la Figura 94, mientras que la Figura 103 ilustra cuatro sondas "consecutivas" que usan el diseño de la Figura 95. Se ilustran fragmentos potenciales de 160 pb que podrían generarse en la región (desplazados 10 bases). Debajo se muestra el oligonucleótido que podría cubrir todos esos fragmentos anteriores. En este diagrama, las sondas enumeradas se designan secuencialmente como n.° 1, n.° 2, n.° 3, n.° 4 etc. Para las etapas de extensión multiplexada-ligamiento, las sondas impares n.° 1, n.° 3, n.° 5 se agrupan en un primer grupo de oligonucleótidos, y a continuación, las sondas pares n.° 2, n.° 4, n.° 6 se agrupan en un segundo grupo. Este enfoque evita que los oligonucleótidos adyacentes (es decir, n.° 1 y n.° 2) compitan por unirse a la misma cadena diana. Una vez que ha tenido lugar la extensión - circularización, los dos grupos pueden combinarse y puede procederse a las etapas de exonucleasa y las etapas posteriores, tales como amplificación por círculo rodante y secuenciación circular, o secuenciación SMRT directa.

Protocolo detallado (V1.2) para la detección de alta sensibilidad de mutaciones de una sola base, mutaciones por inserciones pequeñas, o deleciones pequeñas (cuando están presentes de un 1 % a un 0,01 %), en genes conocidos (por ejemplo, Braf, K-ras, p53):

1.2. a. Comenzando con ADNcf (o por ejemplo ADN genómico aislado de células tumorales circulantes (CTC), cortado a aproximadamente 150 pb), reparar los extremos con polimerasa T4 y quinasa T4, y posteriormente se añade una protuberancia A 3' de una sola base con Klenow (exo-) y dATP. Los conectores tienen una protuberancia T 3' de una sola base, de modo que el ligamiento usando ligasa T4 a 4 °C añade conectores en ambos extremos del fragmento. Opcionalmente, purificar el ADN diana del conector sin ligar.

1.2. b. Desnaturalizar los conectores que contienen ADN diana en ambos extremos (94 °C, 1 minuto) en presencia de sondas oligonucleotídicas (que comprenden una región de sonda 5' complementaria a las secuencias en el lado 5' de las dianas, una secuencia complementaria al extremo 5' del conector, una secuencia de identificador único, una secuencia de identificador de paciente opcional, una secuencia complementaria al extremo 3' del conector, y una región de sonda 3' complementaria a las secuencias en el lado 3' de las dianas), y permitir que los oligonucleótidos se hibriden con sus regiones complementarias en los fragmentos deseados mediante enfriamiento a una temperatura deseada (por ejemplo, 50 °C durante 2 horas). Una polimerasa Taq y/o KlenTaq (polimerasa Taq que carece de actividad nucleasa), y una ligasa termoestable (preferentemente de la cepa AK16D), y los dNTP se añaden después de la etapa de hibridación, o al comienzo del procedimiento. Permitir la extensión y el ligamiento a la temperatura de hibridación, y, opcionalmente, aumentar la temperatura (por ejemplo, 60 °C) para garantizar la finalización de la extensión y el ligamiento, para generar productos circulares.

1.2. c. Opcionalmente, escindir la sonda oligonucleotídica en un enlace escindible (por ejemplo, U escindido usando UDG y endonucleasa AP). Añadir Exonucleasa I (digiere el ADN monocatenario en la dirección 3'^-5'), y Exonucleasa III (digiere el ADN bicatenario en la dirección 3'^5'), para digerir todos los productos sin ligar o con mellas, dejando solo el ADN monocatenario circular deseado que comprende el ADN diana original, la secuencia del conector, la secuencia de identificador único, y una secuencia de identificador de paciente opcional. Este producto es adecuado para la amplificación por círculo rodante (usando cebadores hexámeros aleatorios con polimerasa phi-29) para crear repeticiones en tándem de la secuencia deseada, y posterior identificación de las dianas usando secuenciación de nueva generación o, alternativamente, secuenciación SMRT directa en el molde cerrado covalentemente, usando la secuencia del conector como un sitio de unión de cebador.

Nota 1: el oligonucleótido puede contener un grupo de bloqueo opcional en el lado 5' para interferir con la posterior actividad de nucleasa 5 '^3 ' de la polimerasa, de modo que la sonda oligonucleotídica no se circularice. Alternativamente, puede incluirse un enlace escindible en el oligonucleótido original.

Nota 3: el conector en el extremo 5' puede sintetizarse para que contenga enlaces tiofosfato en las posiciones 2a y 3a desde el extremo fosfato 5' (que se liberarán por la actividad de nucleasa 5 '^3 ' de la polimerasa). Para minimizar el desplazamiento de la polimerasa de esas bases a medida que extiende una base en exceso (lo que podría hacer imposible el ligamiento al conector corriente abajo), las bases de la diana en la unión de ligamiento podrían ser preferentemente ricas en AT en el lado 3', y ricas en GC en el lado 5'.

Nota 4: cuando se usa una polimerasa KlenTaq (polimerasa Taq sin actividad de escisión por nucleasa 5'^-3'), el conector en el extremo 5' puede sintetizarse para que contenga un sitio apurínico (AP) en la posición contigua al fosfato 5' deseado. Este fosfato 5' se libera usando una EndolII termoestable (tal como Tma EndolII). Esta enzima escinde los sitios de AP dejando un fosfato 5' cuando está unida a la diana. La endonucleasa también escinde el oligonucleótido monocatenario, pero con menor eficacia, y, de ese modo, el conector hibridado al molde podría ser el sustrato preferente.

Nota 5: cuando se usa una polimerasa KlenTaq (polimerasa Taq sin actividad de escisión por nucleasa 5'^3'), el conector en el extremo 5' puede sintetizarse para que contenga un fosfato 5'. Alternativamente, el fosfato 5' puede añadirse usando quinasa T4 antes del ligamiento al ADN diana, o después de esa etapa de ligamiento.

Nota 6: puede usarse una mezcla 1:20 de polimerasa Taq (con actividad de nucleasa 5 '^3 ') y KlenTaq (polimerasa Taq sin actividad de escisión por nucleasa 5 '^3 ') en condiciones de extensión distributiva (es decir, concentración salina más elevada) para minimizar la degradación del ADN diana por traducción de mellas.

Nota 7: el proceso de extensión y ligamiento puede llevarse a cabo en dos o más tubos de reacción, conteniendo un conjunto las sondas con numeración "impar", y conteniendo el segundo conjunto las sondas con numeración "par" para evitar que las sondas compitan por las mismas cadenas de ADN diana. Las reacciones separadas pueden agruparse posteriormente.

Nota 8: los oligonucleótidos iSx-003-ShAdT (cadena superior) e iSx-004-pShAdB (cadena inferior) proporcionan ejemplos de conectores que contienen protuberancias "T" 3' de una sola base (véase la Tabla 1). Los oligonucleótidos iSx-006-MdAdT (cadena superior), e iSx-007-pMdAdB (cadena inferior) proporcionan ejemplos de conectores ligeramente más largos, para potenciar la unión a la región del conector (véase la Tabla 1). Los conectores iSx-003-ShAdT e iSx-006-MdAdT (véase la Tabla 1) pueden contener grupos tiofosfato opcionales cerca del extremo 5' para evitar la traducción de mellas y facilitar la circularización de las dianas con los extremos del conector. Los conectores iSx-004-pShAdB e iSx-007-pMdAdB (véase la Tabla 1) pueden contener grupos tiofosfato opcionales cerca de o en el extremo 3' para evitar la degradación si se usa una polimerasa con actividad de corrección de errores, y facilitar la circularización de las dianas con los extremos de conector.

Nota 9: si no se añade una base extra al ADN diana (es decir, omitiendo la etapa de Klenow), entonces se usa un ligamiento de extremo romo. Para evitar el ligamiento de conector a conector, el extremo romo del conector está sin fosforilar. Los oligonucleótidos iSx-003-ShAdT (cadena superior) e iSx-005-ShAdB (cadena inferior) proporcionan ejemplos de conectores que contienen extremos romos (véase la Tabla 1).

Nota 10: cuando se diseñan oligonucleótidos para su uso con secuencias de conector más largas, que comprenden secuencias de "código de barras" o "indexación" para su uso con instrumentos comerciales, puede ser necesario ensamblar el oligonucleótido usando PCR, amplificación de desplazamiento de cadena, o una combinación de las mismas. Durante la PCR, el uso de dUTP en lugar de TTP incorpora uracilo, adecuado para su posterior escisión con UDG. El cebador de cadena inversa puede estar fosforilado, permitiendo su digestión usando exonucleasa lambda o una exonucleasa 5 '^3 ' similar. Puede añadirse una secuencia de dA30 al extremo 5' del cebador directo, lo que permite la amplificación por desplazamiento de cadena. En la Tabla 1 (mostrada posteriormente) se muestran ejemplos de oligonucleótidos adecuados para ensamblaje y amplificación para la secuenciación de regiones de KRAS, BRAF y exones 5-8 de TP53 que contienen mutaciones en puntos calientes (hotspot) e incluyen los siguientes: (i) regiones diana directa e inversa de KRAS (iSx-001-bkA30, iSx-016-bkA30-KRSF11, iSx-017-pKRSF12, iSx-008-701F, iSx-009-501R, iSx-018-pKRSF13, e iSx-018-pKRSR14) e (iSx-015-pKRSF10, iSx-017-pKRSF12, iSx-008-701F, iSx-009-501R, iSx-018-pKRSF13, iSx-019-bkA30-KRSR15, e iSx-001-bkA30); (ii) regiones diana directa e inversa de BRAF (iSx-001-bkA30, iSx-023-bkA30-BRF-F11, iSx-024-pBRF-F12, iSx-008-701F, iSx-009-501R, iSx-025-pBRF-F13, e iSx-026-pBRF-R14) e (iSx-022-pBRF-F10, iSx-024-pBRF-F12, iSx-008-701F, iSx-009-501R, iSx-025-pBRF-F13, iSx-027-bkA30-pBRF-R15, e iSx-001-bkA30); (iii) regiones diana directa e inversa corriente arriba del exón 5 de TP53 (iSx-001-bkA30, iSx-035-bkA30-pTP53e5F11, iSx-036-pTP53e5F12, iSx-008-701F, iSx-009-501R, iSx-037-pTP53e5F13, iSx-038-pTP53e5R14) e (iSx-034-pTP53e5F10, iSx-036-pTP53e5F12, iSx-008-701F, iSx-009-501R, iSx-037-pTP53e5F13, iSx-039-bkA30-TP53e5R15, e iSx-001-bkA30); (iv) regiones diana directa e inversa corriente abajo del exón 5 de TP53 (iSx-001-bkA30, iSx-043-bkA30-TP53e5F21, iSx-044-pTP53e5F22, iSx-008-701F. iSx-009-501R, iSx-045-pTP53e5F23, e iSx-046-pTP53e5R24) e (iSx-042-pTP53e5F20, iSx-044-pTP53e5F22, iSx-008-701F. iSx-009-501R, iSx-045-pTP53e5F23, iSx-047-bkA30-TP53e5R25 e iSx-001-bkA30); (v) regiones diana directa e inversa del exón 6 de ^tP53 (iSx-001-bkA30, iSx-053- bkA30-TP53e6F31, iSx-054-pTP53e6F32, iSx-008-701F, iSx-009-501R, iSx-055-pTP53e6F33, e iSx-056-pTP53e6R34) e (iSx-052-pTP53e6F30, iSx-054-pTP53e6F32, iSx-008-701F, iSx-009-501R, iSx-055-pTP53e6F33, iSx-057-bkA30-TP53e6R35, e iSx-001-bkA30); (vi) regiones diana directa e inversa del exón 7 de TP53 (iSx-001-bkA30, iSx-063-bkA30-TP53e7F41, iSx-064-pTP53e7F42, iSx-008-701F, iSx-009-501R, iSx-065-pTP53e7F43, e iSx-066-pTP53e7R44) e (iSx-062-pTP53e7F40, iSx-064-pTP53e7F42, iSx-008-701F, iSx-009-501R, iSx-065-pTP53e7F43, iSx-067-pTP53e7R45, e iSx-001-bkA30); y (vii) regiones diana directa e inversa del exón 8 de TP53 (iSx-001-bkA30, iSx-073-bkA30-TP53e8F51, iSx-074-pTP53e8F52, iSx-008-701F, iSx-009-501R, iSx-075-pTP53e8F53, e iSx-076-pTP53e8R54) e (iSx-072-pTP53e8F50, iSx-074-pTP53e8F52, iSx-008-701F, iSx-009-501R, iSx-075-pTP53e8F53, iSx-077-bkA30-TP53e8R55, e iSx-001-bkA30).

Nota 11: después de generar los productos circulares que comprenden regiones diana de KRAS, BRAF, y los exones 5-8 de TP53 que contienen mutaciones en puntos calientes, estas regiones pueden someterse a amplificación por círculo rodante usando cebadores específicos de diana para generar productos de repetición en tándem. Estos productos pueden generarse antes o después de la captura de las dianas deseadas con oligonucleótidos específicos de diana sobre un soporte sólido (véase la nota 12 a continuación). Los cebadores pueden contener una base nucleotídica escindible interna o un sitio abásico tal como 1,2'-didesoxirribosa (espaciador d, dSpacer), lo que permite la incorporación de dUTP durante la amplificación por círculo rodante para protección contra la contaminación por arrastre. Algunos ejemplos de tales cebadores se muestran posteriormente en la Tabla 1 e incluyen los siguientes: (i) cebadores directos e inversos de KRAS (iSx-108-KRS-rcF26, iSx-109-KRS-rcR27); (ii) cebadores directos e inversos de BRAF (iSx-118-BRF-rcF26, iSx-119-BRF-rcR27); (iii) cebadores directos e inversos del exón 5 de TP53 (iSx-128-TP53e5-rcF66, iSx-129-TP53e5-rcR67; iSx-130-TP53e5-rcF68, iSx-131-TP53e5-rcR69); (iv) cebadores directos e inversos del exón 6 de TP53 (iSx-138-TP53e6-rcF76, iSx-139-TP53e6-rcR77); (v) cebadores directos e inversos del exón 7 de TP53 (iSx-148-TP53e7-rcF86, iSx-149-TP53e7-rcR87); y (vi) cebadores directos e inversos del exón 8 de TP53 (iSx-158-TP53e8-rcF96, iSx-159-TP53e8-rcR97).

Nota 12: después de generar los productos circulares que comprenden regiones diana de KRAS, BRAF, y los exones 5-8 de TP53 que contienen mutaciones en puntos calientes, y/o generar productos de repetición en tándem, estos productos pueden capturarse mediante hibridación con oligonucleótidos más largos, que contienen un grupo de captura adecuado para la captura posterior sobre un soporte sólido. Algunos ejemplos de tales cebadores, que contienen grupos biotina adecuados para captura a través de superficies sólidas revestidas con estreptavidina, se muestran posteriormente en la Tabla 1 e incluyen los siguientes: (i) oligonucleótidos de captura directa e inversa de KRAS (iSx-013-KRS-bcF1, iSx-014-KRS-bcR2); (ii) oligonucleótidos de captura directa e inversa de BRAF (iSx-020-BRF-bcF1, iSx-021-BRF-bcR2); (iii) oligonucleótidos de captura directa e inversa del exón 5 de TP53 (iSx-030-TP53e5-bcF1, iSx-031-TP53e5-bcR2; iSx-032-TP53e5-bcF3, iSx-033-TP53e5-bcR4); (iv) oligonucleótidos de captura directa e inversa del exón 6 de TP53 (iSx-050-TP53e6-bcF5, iSx-051-TP53e6-bcR6); (v) oligonucleótidos de captura directa e inversa del exón 7 de TP53 (iSx-060-TP53e7-bcF7, iSx-061-TP53e7-bcR8); y (vi) oligonucleótidos de captura directa e inversa del exón 8 de TP53 (iSx-070-TP53e8-bcF9, iSx-071-TP53e8-bcR10).

Nota 13: con los productos mencionados anteriormente generados usando los diseños de cebadores y conectores mencionados anteriormente, después de la amplificación por agrupamiento o con perlas, o captura dentro de un pocillo, dirección, o superficie de una celda de flujo en un instrumento comercial, para iniciar reacciones de secuenciación pueden usarse los siguientes cebadores: (i) iLx-003-PEsqP1, cebador de secuenciación de extremo emparejado 1; (ii) iLx-004-BrCdR1, cebador de indexación, lectura de código de barras 1; (iii) iLx-001-P5-BrCdR2, lectura de código de barras 2; y (iv) iLx-005-PEsqP2, cebador de secuenciación de extremo emparejado 2 (véase la Tabla 1 para secuencias de cebador).

Variación 1.3: (véanse, por ejemplo, las Figuras 19-22). En esta variación, en lugar de ligar conectores cortos a la diana de ADN, se añade una cola de mononucleótido corta usando transferasa terminal (ADNcf con una longitud media de aproximadamente 160 bases). Las etapas restantes son las mismas que en las Figuras 13 y 15. Es difícil controlar cuántas bases añade la transferasa terminal. Por lo tanto, la longitud del tramo de homonucleótido (es decir, poliA) dentro del oligonucleótido determina la Tm de hibridación. Puede ser necesario usar también una polimerasa con actividad de corrección de errores 3 '^5 ' para retirar parte del tramo de homonucleótido en exceso hasta que esté a nivel con su complemento, y sea adecuado para la extensión con polimerasa.

Variación 1.4: (véanse, por ejemplo, las Figuras 23-26). En esta variación, no se añade nada a la diana de ADN (ADNcf con una longitud media de aproximadamente 160 bases). Para capturar las regiones deseadas, los oligonucleótidos que comprenden una región de sonda 5' complementaria a las secuencias en el lado 5' de la diana, una secuencia de identificador único, una secuencia de identificador de paciente opcional, una secuencia de unión de cebador opcional, y una región de sonda 3' complementaria a las secuencias en el lado 3' de la diana, se hibridan con la diana. Las regiones de sonda 5' y 3' contienen desemparejamientos opcionales a intervalos regulares (es decir, 10, 12, o 15 bases). La sonda oligonucleotídica puede contener un grupo de bloqueo opcional en un extremo (se muestra el extremo 5'), o un conector escindible opcional. Dependiendo del diseño de la sonda y de las bases de inicio y finalización del fragmento diana, puede no hibridarse una parte del extremo 5' o 3' de la secuencia diana (Figura 23). La adición de una polimerasa o un conjunto de polimerasas que contienen actividad de nucleasa tanto 3 '^5 ' como 5 '^3 ' permite la extensión del extremo 3' del oligonucleótido en la diana, así como la digestión opcional del extremo 3' monocatenario de la diana hasta que se deja al nivel de la región de la sonda 3' del oligonucleótido (Figura 23), seguido por extensión del extremo 3' de la diana a través de la secuencia de identificador único, y la secuencia de identificador de paciente opcional.

Las condiciones de hibridación se eligen de modo que la hibridación de la región de sonda 3' complementaria a la secuencia del lado 3' de la diana y la hibridación de la región de sonda 5' complementaria a la secuencia del lado 5' de la diana se enriquezcan con respecto a las dianas que se hibridan con un solo lado (y podrían formar un producto de extensión no productivo que podría no circularizarse). La extensión del extremo 3' de la sonda oligonucleotídica en la diana potencia la asociación de la sonda a la diana. La actividad de escisión por nucleasa 5 '^3 ' de la polimerasa (o nucleasa Fen) escinde una base solapante 5' de emparejamiento de la diana en o cerca de la posición en donde el lado 5' de la diana es complementario a la parte 5' de la sonda, dejando un fosfato 5' competente para ligamiento de la diana auténtica. La polimerasa también extiende la sonda oligonucleotídica usando la diana en el molde, y genera un fosfato 5' competente para ligamiento (lado izquierdo de las Figuras 23 y 22), o no escinde el grupo de bloqueo en el extremo 5' del oligonucleótido (lado derecho de las Figuras 23 y 25).

Una ligasa sella covalentemente los extremos 3' extendidos al fosfato 5' competente para ligamiento para crear productos de ligamiento circulares. El grupo de bloqueo evita la circularización de la sonda oligonucleotídica (lado derecho) o, alternativamente, se introduce una mella en el enlace escindible (por ejemplo, escisión con UDG de dU, seguida de escisión de la cadena principal apurínica con endonucleasa AP, lado izquierdo). La adición opcional de Uracil-ADN glicosilasa (UDG) y Formamidopirimidina-ADN glicosilasa (Fpg, también conocida como 8-oxoguanina ADN glicosilasa, que actúa como una N-glicosilasa y como una AP-liasa) puede usarse para realizar mellas en dianas que contienen bases dañadas. A continuación, se añaden una o varias exonucleasas para digerir todos los productos no ligados o con mellas dejando solo el ADN circular monocatenario deseado que comprende el ADN diana original con una secuencia de identificador único. Este producto es adecuado para la amplificación por círculo rodante y secuenciación circular, o para secuenciación SMRT directa.

Este enfoque requiere una enzima o conjunto de enzimas con actividad de nucleasa 5 '^3 ' y 3 '^5 ' dependiente de diana de modo que el fosfato 5' competente para ligamiento se genere solo cuando haya una hibridación y complementariedad adecuadas entre la región de sonda 5' y la región diana 5'. Cuando se usa polimerasa con actividad de escisión por nucleasa 5'^3', el desafío es evitar que la polimerasa extienda el conector corto a lo largo de la región de sonda 5' de modo que destruya la región diana 5' (es decir, traducción de mellas) sin una etapa de ligamiento. La traducción de mellas que destruye el ADN diana original y lo sustituye por ADN extendido puede introducir sin darse cuenta un error de polimerasa que podría propagarse y podría considerarse erróneamente como una mutación. Esto puede minimizarse usando una mezcla de polimerasas, con y sin actividad de escisión por nucleasa 5 '^3 ' (por ejemplo, en una relación de 1:20) en condiciones de extensión distributiva en presencia de ligasa de modo que la mayor parte de la extensión se realice con polimerasa sin actividad de nucleasa hasta que se requiera polimerasa con actividad nucleasa para crear la unión competente para ligamiento, seguida de disociación por polimerasa, y un suceso de ligamiento para generar el producto de ligamiento circular deseado. El uso de diseño de sonda oligonucleotídica como se representa en las Figuras 25 y 26 puede obviar la necesidad de polimerasa con actividad de nucleasa 3'^5'. El uso de quinasa T4 para añadir un fosfato 5' de la diana en una reacción inicial, también puede usarse para crear un fosfato 5' competente para ligamiento, y obviar la necesidad de polimerasa con actividad de nucleasa 5'^3'.

Las Figuras 96-99 proporcionan algunos ejemplos de diferentes diseños de sonda oligonucleotídica para cubrir fragmentos en una región de 250 bases. En estas figuras, el fragmento diana potencial (desplazado 10 bases en una región) está representado por una barra de color gris oscuro, las regiones de la sonda como barras de color gris claro con líneas finas de color negro dentro de las barras de color gris que indican bases con desemparejamientos, y el identificador de secuencia único y el identificador de paciente opcional como una línea más gruesa de color negro. Las Figuras 104-107 ilustran el modo en que podrían diseñarse múltiples sondas para cubrir aproximadamente una región contigua de 500 bases.

En la Figura 96, la región de sonda 5' corriente arriba (50 bases) es complementaria a las bases diana 40-90, mientras que la región de sonda 3' corriente abajo (50 bases) es complementaria a las bases diana 150-200. Para los fines de este ejemplo, existen desemparejamientos cada 10 bases, y la secuencia de identificador compuesta tiene 20 bases (12 bases para el identificador de secuencia y 8 bases para el identificador de paciente). Cuando la diana va de la posición 1 a la 160, este diseño de sonda permitirá la circularización de un producto de 180 bases, de las cuales 110 bases, es decir, de las posiciones 50 a 160, proporcionan información de la secuencia diana. Cuando la diana va de la posición 11 a la 170, este diseño de sonda permitirá la circularización de un producto de 180 bases, de las cuales 120 bases, es decir, de las posiciones 50 a 170, proporcionan información de la secuencia diana. Con este diseño, las 140 bases máximas de información de secuencia se obtendrán con la diana comenzando desde la posición 31 a 51 y terminando en las posiciones 190 a 210 respectivamente. En la figura, cuando la diana va de la posición 81 a la 250, no hay formación de producto circular. Sin embargo, podría formarse algún producto, debido a la región de complementariedad más corta entre la región de sonda 5' y el lado 5' de la diana, aunque existe la preocupación de que no siempre se hibridarían.

En la Figura 97, la región de sonda 5' corriente arriba (60 bases) es complementaria a las bases diana 30-90, mientras que la región de sonda 3' corriente abajo (60 bases) es complementaria a las bases diana 150-210. Esta figura es similar a la Figura 96, excepto en que ambas regiones de sonda 5' y 3' son más largas. Para los 5 primeros ejemplos de dianas, el oligonucleótido más largo permite la captura de más ADN diana, de modo que los círculos resultantes contienen 20 bases adicionales de ADN diana original.

Las Figuras 98 y 99 amplían las tendencias de las Figuras 96 y 97, con regiones de sonda de 70 y 80 bases respectivamente. Como se ha indicado anteriormente, las regiones de sonda más largas garantizan una mayor cobertura de la diana. Los desemparejamientos ayudan a distinguir la diana auténtica de una copia de la sonda por polimerasa. Cuando el ADN en cuestión contiene la base de tipo natural, se originó a partir de la diana, así como la secuencia de ADN adyacente a ella. Cuando el ADN contiene el complemento de la base desemparejada en la sonda, entonces se sabe que la base se generó a partir de la sonda.

Las Figuras 104-107 ilustran el modo en que diseñar sondas oligonucleotídicas con una estrategia de mosaico solapante para secuenciar regiones contiguas más grandes (se muestran aproximadamente 500 bases en las mismas). La Figura 104 ilustra cuatro sondas "consecutivas" que usan el diseño de la Figura 96, mientras que las Figuras 105-107 ilustra cuatro sondas "consecutivas" que usan el diseño de la Figura 97-99, respectivamente. Se ilustran fragmentos potenciales de 160 pb que podrían generarse en la región (desplazados 10 bases). Debajo se muestra el oligonucleótido que podría cubrir todos esos fragmentos anteriores. Si el área en la diana está en color gris claro, no proporcionará información de secuencia fiable. Si el área en la diana está en color gris oscuro, podría proporcionar una buena información de secuencia. En este diagrama, las sondas enumeradas se designan secuencialmente como n.° 1, n.° 2, n.° 3, n.° 4 etc. Para las etapas de extensión multiplexada-ligamiento, las sondas impares n.° 1, n.° 3, n.° 5 se agrupan en un primer grupo de oligonucleótidos, y a continuación, las sondas pares n.° 2, n.° 4, n.° 6 se agrupan en un segundo grupo. Este enfoque evita que los oligonucleótidos adyacentes (es decir, n.° 1 y n.° 2) compitan por unirse a la misma cadena diana. Una vez que ha tenido lugar la extensión -circularización, los dos grupos pueden combinarse y puede procederse a las etapas de exonucleasa y las etapas posteriores tales como amplificación por círculo rodante y secuenciación circular o, alternativamente, secuenciación SMRT directa en el molde cerrado covalentemente, usando la secuencia de unión de cebador opcional como un sitio de unión de cebador.

Protocolo detallado para la detección de alta sensibilidad de mutaciones de una sola base, mutaciones por inserciones pequeñas, o deleciones pequeñas (cuando están presentes de un 1 % a un 0,01 %), en genes conocidos (por ejemplo, Braf, K-ras, p53):

1.4. a. Comenzando con ADNcf (o por ejemplo ADN genómico aislado de CTC, cortado a aproximadamente 150 pb), desnaturalizar el ADN diana (94 °C, 1 minuto) en presencia de oligonucleótidos (que comprenden una región de sonda 5' complementaria a las secuencias en el lado 5' de las dianas, una secuencia de identificador único, una secuencia de identificador de paciente opcional, una secuencia de unión de cebador opcional, y una región de sonda 3' complementaria a las secuencias en el lado 3' de las dianas), y permitir que los oligonucleótidos se hibriden con sus regiones complementarias en los fragmentos deseados mediante enfriamiento a una temperatura deseada (por ejemplo, 40 °C o 45 °C durante 2 horas). La temperatura de la reacción se reduce, y las ADN polimerasas (es decir, una polimerasa T4 tiene una fuerte actividad de corrección de errores en dirección 3'^-5') y una ADN polimerasa 1 (que tiene una actividad de corrección de errores en dirección 3 '^5 ' débil, pero buena actividad 5'^3'), y opcionalmente un fragmento Klenow (sin actividad 5'^-3')), una ADN ligasa (ligasa T4 o ligasa de E. coli), y los dNTP se añaden después de la etapa de hibridación. Permitir la extensión y el ligamiento a 23 °C o 30 °C, y, opcionalmente, aumentar la temperatura (por ejemplo, 37 °C) para garantizar la finalización de la extensión y el ligamiento, para generar productos circulares.

1.4. b. Opcionalmente, escindir la sonda oligonucleotídica en un enlace escindible (por ejemplo, U escindido usando UDG y endonucleasa AP). Añadir Exonucleasa I (digiere el ADN monocatenario en la dirección 3'^5'), y Exonucleasa III (digiere el ADN bicatenario en la dirección 3'^5'), para digerir todos los productos sin ligar o con mellas, dejando solo el ADN monocatenario circular deseado que comprende el ADN diana original, la secuencia del conector, la secuencia de identificador único, y una secuencia de identificador de paciente opcional. Este producto es adecuado para la amplificación por círculo rodante (usando cebadores hexámeros aleatorios con polimerasa phi-29) para crear repeticiones en tándem de la secuencia deseada, y posterior identificación de las dianas usando secuenciación de nueva generación o, alternativamente, secuenciación SMRT directa en el molde cerrado covalentemente, usando la secuencia del conector como un sitio de unión de cebador.

Nota 3: puede usarse una mezcla 1:20 de polimerasa T4 (con actividad de nucleasa 5'^3'), ADN polimerasa I (actividad de corrección de errores en dirección 3 '^5 ' débil, pero buena actividad 5 '^3 ') y Klenow (ADN polimerasa I sin actividad de escisión por nucleasa 5 '^3 ') en condiciones de extensión distributiva (es decir, concentración salina más elevada) para minimizar la degradación del ADN diana por traducción de mellas.

Nota 5: el uso de bases desemparejadas en la secuencia de la sonda a intervalos regulares (es decir, 10, 12, o 15 bases) permite distinguir la secuencia de ADN diana auténtica de la secuencia generada copiando la cadena de la sonda. Los oligonucleótidos enumerados en la Nota 6 que sigue a continuación contienen bases desemparejadas aproximadamente cada 15 bases en las regiones de la secuencia diana.

Nota 6: cuando se diseñan oligonucleótidos para su uso con secuencias de conector más largas, que comprenden secuencias de "código de barras" o "indexación" para su uso con instrumentos comerciales, puede ser necesario ensamblar el oligonucleótido usando PCR, amplificación de desplazamiento de cadena, o una combinación de las mismas. Durante la PCR, el uso de dUTP en lugar de TTP incorpora uracilo, adecuado para su posterior escisión con UDG. El cebador de cadena inversa puede estar fosforilado, permitiendo su digestión usando exonucleasa lambda o una exonucleasa 5 '^3 ' similar. Una secuencia de dA30 puede añadirse al extremo 5' del cebador directo, lo que permite la amplificación por desplazamiento de cadena. En la Tabla 1 (mostrada posteriormente) se muestran ejemplos de oligonucleótidos adecuados para ensamblaje y amplificación para la secuenciación de regiones de KRAS, BRAF y exones 5-8 de TP53 que contienen mutaciones en puntos calientes e incluyen los siguientes: (i) regiones diana directa e inversa de KRAS (iSx-001-bkA30, iSx-103-bkA30-KRSF21, iSx-104-pKRSF22, iSx-100-705F, iSx-101-502R, iSx-105-pKRSF23, e iSx-106-pKRSR24) e (iSx-102-pKRSF20, iSx-104-pKRSF22, iSx-100-705F, iSx-101-502R, iSx-105-pKRSF23, iSx-107-bkA30-KRSR25, e iSx-001-bkA30); (ii) regiones diana directa e inversa de BRAF (iSx-001-bkA30, iSx-113-bkA30-BRF-F21, iSx-114-pBRF-F22, iSx-100-705F, iSx-101-502R, iSx-115-pBRF-F23, e iSx-116-pBRF-R24) e (iSx-112-pBRF-F20, iSx-114-pBRF-F22, iSx-100-705F, iSx-101-502R, iSx-115-pBRF-F23, iSx-117-bkA30-BRF-R25 e iSx-001-bkA30); (iii) regiones diana directa e inversa del exón 5 de TP53 (iSx-001-bkA30, iSx-123-bkA30-TP53e5F61, iSx-124-pTP53e5F62, iSx-100-705F, iSx-101-502R, iSx-125-pTP53e5F63, e iSx-126-pTP53e5R64) e (iSx-122-pTP53e5F60, iSx-124-pTP53e5F62, iSx-100-705F, iSx-101-502R, iSx-125-pTP53e5F63, iSx-127-bkA30-TP53e5F65, e iSx-001-bkA30); (iv) regiones diana directa e inversa del exón 6 de TP53 (iSx-001-bkA30, iSx-133-bkA30-TP53e6F71, iSx-134-pTP53e6F72, iSx-100-705F, iSx-101-502R, iSx-135-pTP53e6F73, e iSx-136-pTP53e6R74) e (iSx-132-pTP53e6F70, iSx-134-pTP53e6F72, iSx-100-705F, iSx-101-502R, iSx-135-pTP53e6F73, iSx-137-bkA30-TP53e6F75, e iSx-001-bkA30); (v) regiones diana directa e inversa del exón 7 de TP53 (iSx-001-bkA30, iSx-143-bkA30-TP53e7F81, iSx-144-pTP53e7F82, iSx-100-705F, iSx-101-502R, iSx-145-pTP53e7F83, e iSx-146-pTP53e7R84) e (iSx-142-pTP53e7F80, iSx-144-pTP53e7F82, iSx-100-705F, iSx-101-502R, iSx-145-pTP53e7F83, iSx-147-bkA30-TP53e7R85, e iSx-001-bkA30); y (vi) regiones diana directa e inversa del exón 8 de TP53 (iSx-001-bkA30, iSx-153-bkA30-TP53e8F91, iSx-154-pTP53e8F92, iSx-100-705F, iSx-101-502R, iSx-155-pTP53e8F93, e iSx-156-pTP53e8R94) e (iSx-152-pTP53e8F90, iSx-154-pTP53e8F92, iSx-100-705F, iSx-101-502R, iSx-155-pTP53e8F93, iSx-157-bkA30-TP53e8R95 e iSx-001-bkA30).

Nota 7: después de generar los productos circulares que comprenden regiones diana de KRAS, BRAF, y los exones 5-8 de TP53 que contienen mutaciones en puntos calientes, estas regiones pueden someterse a amplificación por círculo rodante usando cebadores específicos de diana para generar productos de repetición en tándem. Estos productos pueden generarse antes o después de la captura de las dianas deseadas con oligonucleótidos específicos de diana sobre un soporte sólido (véase la nota 8 que sigue a continuación). Los cebadores pueden contener una base nucleotídica escindible interna o un sitio abásico tal como 1',2'-didesoxirribosa (espaciador d), lo que permite la incorporación de dUTP durante la amplificación por círculo rodante para protección contra la contaminación por arrastre. Algunos ejemplos de tales cebadores se muestran en la Tabla 1 (mostrada posteriormente) e incluyen los siguientes: (i) cebadores directos e inversos de KRAS (iSx-108-KRS-rcF26, iSx-109-KRS-rcR27); (ii) cebadores directos e inversos de BRAF (iSx-118-BRF-rcF26, iSx-119-BRF-rcR27); (iii) cebadores directos e inversos del exón 5 de TP53 (iSx-128-TP53e5-rcF66, iSx-129-TP53e5-rcR67; iSx-130-TP53e5-rcF68, iSx-131-TP53e5-rcR69); (iv) cebadores directos e inversos del exón 6 de TP53 (iSx-138-TP53e6-rcF76, iSx-139-TP53e6-rcR77); (v) cebadores directos e inversos del exón 7 de TP53 (iSx-148-TP53e7-rcF86, iSx-149-TP53e7-rcR87); y (vi) cebadores directos e inversos del exón 8 de TP53 (iSx-158-TP53e8-rcF96, iSx-159-TP53e8-rcR97).

Nota 8: después de generar los productos circulares que comprenden regiones diana de KRAS, BRAF, y los exones 5-8 de TP53 que contienen mutaciones en puntos calientes, y/o generar productos de repetición en tándem, estos productos pueden capturarse mediante hibridación con oligonucleótidos más largos, que contienen un grupo de captura adecuado para la captura posterior sobre un soporte sólido. Algunos ejemplos de tales oligonucleótidos de captura, que contienen grupos biotina adecuados para la captura a través de superficies sólidas revestidas con estreptavidina se muestran en la Tabla 1 (mostrada posteriormente) e incluyen los siguientes: (i) oligonucleótidos de captura directa e inversa de KRAS (iSx-013-KRS-bcF1, iSx-014-KRS-bcR2); (ii) oligonucleótidos de captura directa e inversa de BRAF (iSx-020-BRF-bcF1, iSx-021-BRF-bcR2); (iii) oligonucleótidos de captura directa e inversa del exón 5 de TP53 (iSx-030-TP53e5-bcF1, iSx-031-TP53e5-bcR2; iSx-032-TP53e5-bcF3, iSx-033-TP53e5-bcR4); (iv) oligonucleótidos de captura directa e inversa del exón 6 de TP53 (iSx-050-TP53e6-bcF5, iSx-051-TP53e6-bcR6); (v) oligonucleótidos de captura directa e inversa del exón 7 de TP53 (iSx-060-TP53e7-bcF7, iSx-061-TP53e7- bcR8); y (vi) oligonucleótidos de captura directa e inversa del exón 8 de TP53 (iSx-070-TP53e8-bcF9, iSx-071-TP53e8-bcR10).

Nota 9: con los productos mencionados anteriormente generados usando los diseños de cebadores y conectores mencionados anteriormente, después de amplificación por agrupamiento o con perlas, o captura dentro de un pocillo, dirección, o superficie de una celda de flujo en un instrumento comercial, para iniciar reacciones de secuenciación pueden usarse los siguientes cebadores: (i) iLx-003-PEsqP1, cebador de secuenciación de extremo emparejado 1; (ii) iLx-004-BrCdR1, cebador de indexación, lectura de código de barras 1; (iii) iLx-001-P5-BrCdR2, lectura de código de barras 2; y (iv) iLx-005-PEsqP2, cebador de secuenciación de extremo emparejado 2 (las secuencias de cebador se proporcionan en la Tabla 1 mostrada posteriormente).

Ejemplo profético comparativo 2 - Detección de marcador de metilación de alta sensibilidad para hipermetilación de promotor (cuando está presente de un 1 % a un 0,01 %) en ADN plasmático

La metilación de promotor desempeña un papel importante en la regulación de la expresión génica. Los promotores de los genes a menudo tienen regiones de alto contenido de CpG conocidas como "islas CpG". Cuando se desactivan genes, tales como genes supresores de tumores, con islas CpG de promotor, esto va normalmente acompañado de metilación de la mayoría de las secuencias de CpG dentro del promotor y de las regiones del 1er exón. Ha habido dos enfoques tradicionales para detectar cambios de metilación.

El primero aprovecha las enzimas de restricción sensibles a metilo, en donde el ADN genómico se escinde cuando no está metilado, y esto va seguido de una amplificación por PCR usando cebadores que flanquean el sitio o los sitios. Si el ADN estuviera metilado se debería amplificar, y si no estuviera metilado no se debería amplificar. Esta técnica tiene la desventaja de que las digestiones no siempre se completan y, además, no es una técnica precisa para encontrar niveles bajos de ADN metilado cuando la mayor parte de la misma secuencia no está metilada, como podría ser el caso en la detección en plasma.

El segundo enfoque se conoce como "PCR específica de metilo" y se basa en el tratamiento con bisulfito del ADN, que convierte las C sin metilar en U. Si la base está metilada, entonces no se convierte. La PCR específica de metilo se basa en el uso de cebadores y sondas TaqMan que son específicos para la secuencia convertida resultante, si estuviera metilada, pero no de la secuencia sin metilar. La PCR específica de metilo tiene la ventaja de poder detectar niveles muy bajos de ADN metilado. Una mejora adicional de esta técnica usa un oligonucleótido de bloqueo que se hibrida con la secuencia del ADN no metilado convertido con bisulfito, enriqueciendo de ese modo la amplificación del ADN metilado convertido con bisulfito. La desventaja es que el tratamiento con bisulfito destruye de un 50 % a un 90 % de la integridad del ADN original al producirle mellas. Cuando se comienza con ADN del plasma (con una longitud media de aproximadamente 160 bases), esto puede ser un problema importante. Además, la conversión de las C en U reduce la complejidad de la secuencia de 4 bases a 3 bases. Dado que la secuencia convertida ahora es más rica en A:T, también se requieren cebadores de PCR más largos. De ese modo, pueden producirse amplificaciones no específicas, ya que los cebadores tienen más probabilidades de realizar un cebado erróneo en secuencias estrechamente relacionadas pero incorrectas. Esto requiere normalmente un enfoque de PCR anidada, y se corre el riesgo de contaminación por arrastre y en general no es ideal para amplificaciones multiplexadas.

Visión general del enfoque: la idea es copiar fielmente cada fragmento de ADN diana que contenga metilación en sitios de restricción adyacentes para las regiones de interés, añadir una secuencia de identificador único y un identificador de paciente opcional, y circularizarlos para la secuenciación posterior. La cadena de ADN oligonucleotídica se circulariza y se secuencia. Este enfoque proporciona la ventaja de obtener a la vez información sobre el número de copias cuando sea necesario, y datos de metilación con el mínimo de secuenciación requerido.

Detección de metilación en sitios adyacentes

Variación 2.1: (véase, por ejemplo, la Figura 27). En esta variación, el ADN se escinde inicialmente con HinP1I para reducir significativamente la cantidad de diana no metilada. Para capturar las regiones metiladas deseadas, los oligonucleótidos que comprenden una región de sonda 5' complementaria a las secuencias en el lado 5' de la diana, una secuencia de identificador único, una secuencia de identificador de paciente opcional, y una región de sonda 3' complementaria a las secuencias en el lado 3' de la diana, se hibridan con la diana. El oligonucleótido contiene secuencias de HinP1I sin metilar cerca tanto del extremo 3' de la sonda corriente arriba como de un extremo incompetente para ligamiento o bloqueado en 5' de la sonda corriente abajo. El extremo 3' contiene desemparejamientos con la diana, o está bloqueado para evitar la extensión con polimerasa. HinP1I producirá mellas en las cadenas sin metilar del híbrido diana de la sonda si el ADN diana estuviera metilado, liberando un extremo OH 3' competente para extensión, y un fosfato 5' competente para ligamiento (lado izquierdo de la Figura 27). Si la diana estuviera sin metilar, ambas cadenas se escinden, destruyendo el molde de la diana (lado derecho de la Figura 27). La adición de ligasa y polimerasa que carecen de actividad de desplazamiento de cadena y actividad de nucleasa tanto 3 '^5 ' como 5 '^3 ', permite la extensión del extremo 3' liberado de la sonda en la diana metilada, seguido de ligamiento al extremo 5' liberado de la sonda para formar un producto circular que contiene tanto una secuencia de identificador único como una secuencia de identificador de paciente opcional. Los productos sin ligar se eliminan por digestión con exonucleasa. Este producto circular es adecuado para etapas adicionales opcionales y secuenciación posterior.

Al insistir en que la endonucleasa de restricción genere tanto el OH 3' como el fosfato 5', esto evita una señal falsa, y también debería eliminar cualquier señal de ligamiento no específica. De ese modo, cualquier fragmento raro de ADN genómico que sea monocatenario después de la purificación, o que no se haya escindido no formará un sustrato productivo y será destruido en la etapa de tratamiento con exonucleasa.

Protocolo detallado para la detección altamente sensible de metilación del promotor:

2.1a. Escindir el ADNcf aislado, o el ADN enriquecido con metilo con una o más enzimas sensibles a metilo (AciI, HinP1I, Hpy99I, y HpyCH4IV). En este ejemplo, se usa HinP1I. Inactivar con calor las una o varias endonucleasas (65 °C durante 15 minutos) y desnaturalizar el ADN (94 °C, 1 minuto).

2.1b. Desnaturalizar el ADN diana (94 °C, 1 minuto) en presencia de sondas oligonucleotídicas (que comprenden una región de sonda 5' complementaria a la secuencia del lado 5' de la diana, una secuencia de identificador único, una secuencia de identificador de paciente opcional, un sitio de unión de cebador opcional y una región de sonda 3' complementaria a la secuencia del lado 3' de la diana), y permitir que los oligonucleótidos se hibriden con sus regiones complementarias en los fragmentos deseados mediante enfriamiento a una temperatura deseada (por ejemplo, 40-50 °C durante 2 horas). El oligonucleótido contiene secuencias de HinP1I sin metilar cerca de los extremos tanto 3' como 5' de las sondas, que están diseñadas para que contengan desemparejamientos, grupos de bloqueo, o carezcan de fosforilación, de modo que no sean sustratos para la polimerasa ni para la ligasa. Enfriar a 37 °C y añadir HinP1I, lo que producirá mellas en las cadenas sin metilar del híbrido diana de la sonda si el ADN diana estuviera metilado, liberando un extremo OH 3' competente para extensión, y un fosfato 5' competente para ligamiento. Inactivar con calor las una o varias endonucleasas (65 °C durante 15 minutos). Se añaden KlenTaq (polimerasa Taq que carece de actividad de nucleasa), y ligasa termoestable (preferentemente de la cepa Ak 16D), y los dNTP después de la etapa de hibridación, o después de la etapa de producción de mellas con endonucleasa de restricción. Permitir la extensión y el ligamiento a 50 °C y, opcionalmente, aumentar la temperatura (por ejemplo, 60 °C) para garantizar la finalización de la extensión y el ligamiento, para generar productos circulares.

2.1.c. Añadir Exonucleasa I (digiere el ADN monocatenario en la dirección 3'^-5'), y Exonucleasa III (digiere el ADN bicatenario en la dirección 3'^5'), para digerir todos los productos sin ligar o con mellas, dejando solo el ADN circular monocatenario deseado que comprende una copia del ADN metilado, la secuencia de identificador único, y una secuencia de identificador de paciente opcional. Este producto circular es adecuado para etapas adicionales opcionales y secuenciación posterior.

Nota 1: el oligonucleótido puede carecer de un fosfato 5', o puede contener un grupo de bloqueo opcional en el lado 5', de modo que el extremo 5' del oligonucleótido no sea adecuado para ligamiento. El oligonucleótido puede contener desemparejamientos 3', una horquilla 3', o un grupo de bloqueo opcional en el lado 3', de modo que el extremo 3' del oligonucleótido no sea adecuado para la extensión en la diana. En ambos casos, el bloqueo solo se libera mediante la producción de mellas con enzima de restricción de la sonda cuando se hibrida con la diana metilada.

Nota 2: el ejemplo anterior usa KlenTaq, una polimerasa que carece de actividad de desplazamiento de cadena, así como actividad de nucleasa tanto 3 '^5 ' como 5'^3'. Si el oligonucleótido tiene un grupo de bloqueo en el lado 3', entonces puede usarse polimerasa con actividad de nucleasa 3'^5', mientras que si el grupo de bloqueo está en el lado 5', entonces puede usarse polimerasa con actividad de nucleasa 5'^3'.

Nota 3: en el ejemplo, la endonucleasa de restricción (HinP1I) se inactiva por calor incubando a 65 °C durante 15 minutos. Un enfoque alternativo (o cuando se usa una enzima insensible al calor, tal como BstUI) es realizar la extensión con análogos nucleotídicos (es decir, 5-metil-dCTP o alfa-tiofosfato dCTP) que hacen que un sitio de restricción sea resistente a la nueva escisión con la endonucleasa homóloga. Si el sitio de restricción en el lado 5' del oligonucleótido no se convierte en una forma resistente mediante el uso de análogos nucleotídicos (es decir, HinP1I), entonces este caso puede resolverse usando un oligonucleótido con un grupo de bloqueo en el lado 5', así como una polimerasa que tenga actividad de nucleasa 5'^3'. Inicialmente, el grupo de bloqueo se retira por la actividad de producción de mellas de la endonucleasa de restricción. Posteriormente durante la etapa de extensión usando análogos nucleotídicos, una polimerasa que tiene actividad de nucleasa 5 '^3 ' traduce la mella a través del sitio de reconocimiento, reemplazándolo con nucleótidos que hacen que el sitio sea resistente a una escisión adicional.

Nota 4: en el ejemplo anterior, además de minimizar la traducción de mellas más allá de la secuencia de reconocimiento, la parte del oligonucleótido directamente adyacente al sitio de restricción de la parte de sonda 5' puede sintetizarse para que contenga enlaces tiofosfato. Para minimizar el desplazamiento de la polimerasa de esas bases a medida que extiende una base en exceso (lo que podría hacer imposible el ligamiento al cebador corriente abajo), las bases de la diana en la unión de ligamiento podrían ser preferentemente ricas en AT en el lado 3', y ricas en Gc en el lado 5'.

Nota 5: las partes específicas de diana de la sonda oligonucleotídica están diseñadas de modo que permanezcan hibridadas con la diana incluso después de la liberación de los extremos 3' y 5' no productivos. Si la diana contiene sitios de restricción adicionales que se solapan con las partes de la sonda, entonces la sonda puede sintetizarse con 5-metil-dC en esas posiciones. Si la diana estuviera metilada en esas posiciones, entonces el sitio se metilará tanto en la diana como en la sonda oligonucleotídica, y, de ese modo, será resistente a la producción de mellas. Sin embargo, si la diana no estuviera metilada en esas posiciones, entonces el sitio se mellará en la cadena diana, interfiriendo de ese modo en la hibridación de la sonda con la diana (acortada).

Nota 6. El producto circular es adecuado para la amplificación por círculo rodante (usando cebadores hexámeros aleatorios con polimerasa phi-29) para crear repeticiones en tándem complementarias a la secuencia deseada, y posterior identificación de las dianas usando secuenciación de nueva generación o, alternativamente, secuenciación SMRT directa en el molde cerrado covalentemente, usando la secuencia de unión de cebador como un sitio de unión de cebador.

Nota 7. Si las sondas oligonucleotídicas también comprenden sitios de unión de cebador opcionales (es decir, sitios de unión de cebador universales), para la amplificación por PCR, seguido de la identificación posterior de las dianas, podría ser adecuado el uso de secuenciación de nueva generación, ensayos TaqMan, ensayos UniTaq, ensayos de PCR en tiempo real, PCR digital, micromatriz, hibridación, u otro método de detección.

Base de datos del estado de metilación en sitios de restricción sensibles a metilo adyacentes.

La base de datos de TCGA actual contiene información sobre el estado de metilación de aproximadamente 450.000 sitios CpG en el genoma humano, tanto para tejido normal como para tejido tumoral de muchos sitios tisulares diferentes. Sin embargo, no cubre todo el estado de metilación de sitios de HinP1I adyacentes, ni podría distinguir que ambos sitios estén metilados en el mismo tramo de ADN genómico.

Por lo tanto, para que el método de ensayo mencionado anteriormente sea el más útil, podría ser de ayuda crear una base de datos del estado de metilación en sitios de restricción sensibles a metilo adyacentes. Un enfoque de ese tipo se ilustra en la Figura 28.

Visión general del enfoque: la idea es generar una genoteca de pequeños fragmentos que solo se podrían haber formado si ambos extremos del fragmento contuvieran sitios de restricción que estuvieran metilados en el ADN genómico original. Los fragmentos tienen conectores añadidos con secuencias opcionales de identificador único y de identificador de paciente que ahora son susceptibles de ligamiento para crear multímeros de fragmentos que a continuación serán sustratos para etapas adicionales y secuenciación posterior.

Variación 2.1.1: (véase, por ejemplo, la Figura 28). Este enfoque muestra el modo en que descubrir la metilación en sitios de HinP1I adyacentes (GC*GC) en todo el genoma. El material de partida puede ser ADN genómico intacto o ADNcf con una longitud media de aproximadamente 160 pb. Escindir el ADN genómico con HinP1I para fragmentar el ADN en sitios de HinP1I sin metilar. Los conectores cortos que contienen un extremo 5' bloqueado en el extremo de no ligamiento, se ligan en ambos extremos de extremos escindidos con HinP1I rellenados y extremos reparados de los fragmentos diana. (Estos conectores no recrean un sitio de HinP1I en la unión de ligamiento). Unos pocos ciclos de amplificación por PCR usando los dNTP sin metilar y cebadores bloqueados 5' generan productos que ahora están sin metilar en los sitios de HinP1I restantes. A continuación, estos productos se escinden con HinP1I. Solo los amplicones de PCR que contienen sitios de HinP1I adyacentes (GCGC) que estaban metilados en la diana original generarán fragmentos que están desbloqueados (es decir, competentes para ligamiento con los conectores) en ambos extremos, cuando se escinden con HinP1I. Los conectores que contienen una secuencia de identificador único opcional, y una secuencia de identificador de paciente opcional están ligados a estos extremos escindidos con HinP1I rellenos recién generados. Estos nuevos conectores contienen, en su lado de no ligamiento, el extremo 3' bloqueado, o una cadena principal que contiene tiofosfato (que se muestra como **** en la Figura 28). Después de añadir una exonucleasa 3' bicatenaria (es decir, Exonucleasa III), los fragmentos que contienen el conector corto original en uno o ambos lados se digerirán y se volverán monocatenarios. Solo los fragmentos con el nuevo conector ligado a ambos lados permanecerán bicatenarios, ya que el grupo de bloqueo 3' o los tiofosfatos inhiben la digestión con la exonucleasa 3'. Los extremos libres de los fragmentos restantes que contienen conector se vuelven competentes para ligamiento, ya sea mediante (i) fosforilación del extremo 5', (ii) retirada del grupo 3' bloqueado, o (iii) uso de la actividad de nucleasa 5' para retirar por escisión la base solapante 5' de emparejamiento o la aleta, dejando un fosfato 5' competente para ligamiento, o cualquier combinación de los mismos. Las condiciones de ligamiento se diseñan para favorecer la multimerización, por ejemplo, mediante el uso de agentes de aglomeración (es decir, PEG al 20 %), y/o mediante la mezcla de dos conjuntos de productos de ligamiento, en donde la protuberancia del conector 5' no palindrómico del primer conjunto es complementaria a la protuberancia del conector 5' no palindrómico del segundo conjunto. Los productos de ligamiento comprenden secuencias de HinP1I adyacentes originalmente metiladas en el ADN diana con una secuencia de identificador único y/o una secuencia de identificador de paciente opcionales. Este producto es adecuado para etapas adicionales opcionales y secuenciación posterior.

Protocolo detallado para generar una base de datos de estado de metilación en sitios de restricción sensibles a metilo adyacentes:

2.1.1a. Escindir ADN genómico aislado, o ADN enriquecido con metilo con una o más enzimas sensibles a metilo (Acil, HinP1I, Hpy99I, y HpyCH4IV). En este ejemplo, se usa HinP1I. Opcionalmente, inactivar con calor las una o varias endonucleasas (65 °C durante 15 minutos). Ligar los conectores que están bloqueados en el extremo 5' del extremo de no ligamiento. Los extremos de diana se reparan con polimerasa T4 y quinasa T4, y posteriormente se genera una protuberancia A 3' de una sola base con Klenow (exo-) y dATP. Los conectores tienen una protuberancia T 3' de una sola base, de modo que el ligamiento usando ligasa T4 añade conectores en ambos extremos del fragmento. (Véase posteriormente la Nota 1).

2.1.1b. Añadir cebadores bloqueados 5', polimerasa Taq y los dNTP y realizar algunos ciclos de PCR para generar productos que ahora están sin metilar en los sitios de HinP11 restantes.

2.1.1. c. Añadir HinP1I para escindir los productos que contengan dichos sitios. Solo los amplicones de PCR que contienen sitios de HinP1I adyacentes (GCGC) que estaban metilados en la diana original generarán fragmentos que están desbloqueados (es decir, competentes para ligamiento con los conectores) en ambos extremos, cuando se escinden con HinP1I. Una polimerasa residual de la polimerasa Taq rellenará la protuberancia de 2 bases (opcionalmente, aumentar la temperatura a 60 °C). Retirar los dNTP (a través de una columna de centrifugación) y volver a añadir solo dATP para generar una protuberancia A 3' de una sola base.

2.1.1.d. Usar ligasa T4, añadiendo conectores (que contengan una secuencia de identificador único opcional, y una secuencia de identificador de paciente opcional) con una protuberancia A 3' de una sola base en el extremo de ligamiento a la protuberancia A de una sola base de las secuencias diana escindidas y rellenadas. El lado 5' de no ligamiento del conector contiene una protuberancia 5' y, opcionalmente, no está fosforilado. El lado 3' de no ligamiento del conector contiene un grupo de bloqueo 3' y/o tiofosfatos para inhibir la digestión con la exonucleasa 3'.

2.1.1. e. Añadir una exonucleasa 3' (es decir, Exonucleasa III) y digerir a 37 °C. Los fragmentos que contienen el conector corto original en uno o ambos lados se digerirán y se volverán monocatenarios. Solo los fragmentos con el nuevo conector ligado a ambos lados permanecerán bicatenarios. La exonucleasa también hará que los conectores se vuelvan monocatenarios. Opcionalmente, retirar los productos de digestión de los fragmentos deseados con una columna de centrifugación.

2.1.1. f. Los extremos libres de los fragmentos restantes que contienen conector se vuelven competentes para ligamiento, ya sea mediante (i) fosforilación del extremo 5' usando quinasa T4, (ii) retirada del grupo en el extremo 3' bloqueado, o (iii) uso de la actividad de nucleasa 5 '^3 ' de la polimerasa Taq para retirar por escisión la base solapante 5' de emparejamiento o la aleta, dejando un fosfato 5' competente para ligamiento, o cualquier combinación de los mismos. Las condiciones de ligamiento se diseñan para favorecer la multimerización. Los productos de ligamiento comprenden multímeros de fragmentos diana con secuencias de HinP1I adyacentes originalmente metiladas en el ADN diana con una secuencia de identificador único y/o una secuencia de identificador de paciente opcionales. Este producto es adecuado para etapas adicionales opcionales y secuenciación posterior.

Nota 1: con respecto a los ligamientos de conectores: como alternativa al rellenado, la reparación de extremos, y la formación de cola en A antes del ligamiento de conectores con conectores que contienen una protuberancia T de una sola base, puede aprovecharse la protuberancia de CpG 5' generada por HinP1I. Puede generarse una protuberancia C 3' de una sola base usando Klenow (exo-) y dCTP. Los conectores tienen una protuberancia C 3' de una sola base, de modo que el ligamiento usando ligasa T4 añade conectores en ambos extremos del fragmento. Alternativamente, pueden usarse directamente conectores con una protuberancia de CG, sin rellenado de sitios, pero los conectores se diseñan de modo que si se autoligan, creen un sitio de AclI (AAACGTT). De ese modo, el ADN genómico se escinde con HinplI (GACGC), sitio de AclI (AAACGTT) en presencia tanto de conectores como de ligasa T4 a 37 °C. El ligamiento de los fragmentos entre sí se escinde con Hinp1I, el ligamiento de los conectores entre sí se escinde con AclI y, sin embargo, ninguna enzima escinde el ligamiento de los conectores a los extremos de los fragmentos, de modo que esta mezcla de ligamiento de 3 enzimas sirve como una "selección bioquímica" para enriquecer los productos deseados.

Nota 2: el extremo 3' del conector bloqueado puede sintetizarse para que contenga un uracilo o un sitio apurínico (AP) en una posición interna al bloqueo y, después del tratamiento con UDG y endonucleasa AP, liberar un extremo 3' competente para ligamiento.

Nota 3: para generar el fosfato 5' competente para ligamiento en el lado 5' de la diana puede usarse una nucleasa Fen en lugar de la polimerasa con actividad de nucleasa 5'^3'.

Nota 4: el ligamiento favorecerá la formación de multímeros mediante el uso de agentes de aglomeración (es decir, PEG al 20 %), y/o mediante la mezcla de dos conjuntos de productos de ligamiento, en donde la protuberancia del conector 5' no palindrómico del primer conjunto es complementaria a la protuberancia del conector 5' no palindrómico del segundo conjunto.

Detección de metilación en sitios adyacentes usando tratamiento con bisulfito

El enfoque anterior es ideal para identificar y enumerar fragmentos que contienen sitios de HinPlI metilados adyacentes como sustituto de la metilación dentro de ese fragmento de ADN. Sin embargo, para algunas aplicaciones, es importante identificar el estado de metilación de sitios CpG individuales dentro de una región determinada. De ese modo, puede ser necesario tratar el ADN entrante con bisulfito, que convierte la C regular, pero no la metil-C, en U.

Visión general del enfoque usando bisulfito: la idea es copiar fielmente cada fragmento de ADN diana que está metilado en sitios de restricción de AciI adyacentes de la secuencia (G*CGG) para las regiones de interés, tratar con bisulfito, añadir una secuencia de identificador único, una secuencia de unión de cebador opcional, y un identificador de paciente opcional, y circularizarlos para la secuenciación posterior. La cadena de ADN oligonucleotídica se circulariza y se secuencia. Este enfoque proporciona la ventaja de obtener a la vez información sobre el número de copias cuando sea necesario, y datos de metilación con el mínimo de secuenciación requerido.

La idea aprovecha una propiedad única de la secuencia de reconocimiento para AciI. La enzima escinde la secuencia de reconocimiento de 3,5 bases GACGG en una orientación, y CACGC en la segunda orientación. Si un sitio de AciI metilado se trata con bisulfito en la primera orientación (G*CGG), el sitio permanecerá sin cambios (G*CGG), mientras que en la segunda orientación (C*CGC), cambiará (U*CGU, en donde *C indica 5-meC). Después de algunos ciclos de amplificación por PCR, la 5-metil C se convierte en C, mientras que el U se convierte en T. De ese modo, un sitio de AciI metilado en la primera orientación permanece como GCGG, un sitio de AciI sin metilar en la primera orientación se convierte en GTGG, un sitio de AciI metilado en la segunda orientación se convierte en TCGT, y un sitio de AciI sin metilar en la segunda orientación se convierte en TTGT. Cuando se escinde con AciI, solo los sitios de AciI adyacentes metilados en la diana original crearán fragmentos que son competentes para ligamiento en ambos extremos 3' y 5'.

Una característica única de este enfoque es que la conversión con bisulfito crea dos cadenas no complementarias. De ese modo, la cadena superior tendrá secuencias G*CGG adyacentes, e incluso si interviniera una secuencia C*CGC, no importaría porque se convertiría en U*CGU, que después de la conversión por PCR en TCGT no se reconocería como un sitio de AciI. Además, incluso si interviniera un sitio G*CGG o GCGG (es decir, sin metilar), AciI no produciría mellas en el mismo, ya que estaría en una región que es monocatenaria. Incluso mejor, las secuencias de la cadena superior de la forma C*CGC serán G*CGG en la cadena inferior. La cadena inferior también puede usarse para consultar el estado de metilación y, dado que las dos secuencias ahora son muy diferentes, las sondas oligonucleotídicas para la cadena superior e inferior no se hibridarán entre sí, sino solo con las dianas convertidas. De ese modo, este enfoque permite obtener un estado detallado de metilación en el promotor usando información de las cadenas superior e inferior.

El principio de tratar el ADN con bisulfito para convertir el ADN no metilado en una secuencia que no es escindible por una enzima de restricción pero que, si está metilado, todavía es escindible por esa misma enzima de restricción, puede extenderse a algunos sitios de restricción adicionales. Por ejemplo, un sitio de BstUI (CGACG) conserva su misma secuencia después de la conversión con bisulfito siempre que ambos sitios CG estén metilados (es decir, *CG*CG). Del mismo modo, un sitio de Hpy99I (CGWCGA) también conserva su misma secuencia después de la conversión con bisulfito siempre que ambos sitios CG estén metilados (*CGW*CG). En un tipo diferente de ejemplo, HpyCH2IV (AACGT) escindirá las dos secuencias de la forma A*CGT y A*CGC después de la conversión con bisulfito, ya que ambas se convierten en A*CGT. De ese modo, las variaciones que se consideran posteriormente para AciI son igualmente válidas para, pero sin limitarse a, las endonucleasas de restricción BstUI, Hpy99I, HpyCH2IV y sus isoesquizómeros.

Variación 2.2: (véanse, por ejemplo, las Figuras 29-30). En esta variación, los conectores cortos que contienen 5-metil C se ligan a los extremos del ADN. A continuación, el ADN se trata con bisulfito, lo que hace que las cadenas no sean complementarias para que se vuelvan monocatenarias. Algunos ciclos de amplificación por PCR generan productos que ahora no están metilados en los sitios de AciI restantes. A continuación, estos productos se escinden con AciI. Solo los amplicones de PCR que contienen sitios de AciI adyacentes (GCGG) que estaban metilados en la diana original generarán fragmentos que ahora son competentes para ligamiento en ambos extremos. Para capturar las regiones deseadas, las sondas oligonucleotídicas que comprenden una región de sonda 5' complementaria a la secuencia del lado 5' de la diana, una secuencia de identificador único, una secuencia de unión de cebador opcional, una secuencia de identificador de paciente opcional, y una región de sonda 3' complementaria a la secuencia del lado 3' de la diana, se hibridan con la diana. La adición de ligasa y polimerasa que carecen de actividad de desplazamiento de cadena y actividad de nucleasa tanto 3 '^5 ' como 5'^3', permite la extensión del extremo 3' de la diana sin metilar, seguido de ligamiento al extremo 5' de la diana para formar un producto circular que contiene una secuencia de identificador único, una secuencia de identificador de paciente opcional, y un sitio de unión de cebador opcional. Los productos sin ligar se eliminan por digestión con exonucleasa. Este producto circular es adecuado para etapas adicionales opcionales y secuenciación posterior.

Protocolo detallado para la detección altamente sensible de la metilación de promotor:

2.2. a. Ligar en conectores que contienen 5-metil C para retener la secuencia después de la conversión con bisulfito. Los extremos de diana se reparan con polimerasa T4 y quinasa T4, y posteriormente se genera una protuberancia A 3' de una sola base con Klenow (exo-) y dATP. Los conectores tienen una protuberancia T 3' de una sola base, de modo que el ligamiento usando ligasa T4 añade conectores en ambos extremos del fragmento. Incubar el ADNcf con bisulfito, que convierte la C regular, pero no la metil-C, en U. El tratamiento con bisulfito convierte las cadenas superior e inferior de manera diferente, de modo que después del tratamiento, las cadenas ya no serán complementarias entre sí y se fusionarán por separado.

2.2. b. Añadir cebadores, polimerasa Taq y los dNTP y realizar algunos ciclos de PCR para generar productos que ahora están sin metilar en los sitios de AciI restantes.

2.2. c. Añadir AciI para escindir los productos que contengan tales sitios. Solo los amplicones de PCR que contienen sitios de AciI adyacentes (GCGG) que estaban metilados en la diana original generarán fragmentos que están desbloqueados (es decir, competentes para ligamiento con los conectores) en ambos extremos, cuando se escinden con AciI. Una polimerasa residual de la polimerasa Taq rellenará la protuberancia de 2 bases (opcionalmente, aumentar la temperatura a 60 °C).

2.2. d. Desnaturalizar el ADN diana (94 °C, 1 minuto) en presencia de sondas oligonucleotídicas (que comprenden una región de sonda 5' complementaria a la secuencia del lado 5' de las dianas, una secuencia de identificador único, una secuencia de identificador de paciente opcional, un sitio de unión de cebador opcional y una región de sonda 3' complementaria a la secuencia del lado 3' de las dianas), y permitir que los oligonucleótidos se hibriden con sus regiones complementarias en los fragmentos deseados mediante enfriamiento a una temperatura deseada (por ejemplo, 50 °C-60 °C durante 2 horas). Se añaden KlenTaq (polimerasa Taq que carece de actividad de nucleasa), y ligasa termoestable (preferentemente de la cepa AK16D), y los dNTP para permitir la extensión y el ligamiento a 50 °C y, opcionalmente, aumentar la temperatura (por ejemplo, 60 °C) para garantizar la finalización de la extensión y el ligamiento, para generar productos circulares.

2.2. e. Añadir Exonucleasa I (digiere el ADN monocatenario en la dirección 3'^-5'), y Exonucleasa III (digiere el ADN bicatenario en la dirección 3'^5'), para digerir todos los productos sin ligar o con mellas, dejando solo el ADN circular monocatenario deseado que comprende una copia del ADN metilado, la secuencia de identificador único, y una secuencia de identificador de paciente opcional. Este producto circular es adecuado para etapas adicionales opcionales y secuenciación posterior.

Nota 1. El oligonucleótido puede carecer de un fosfato 5', o puede contener un grupo de bloqueo opcional en el lado 5', de modo que el extremo 5' del oligonucleótido no sea adecuado para ligamiento.

Nota 2. El ejemplo anterior usa KlenTaq, una polimerasa que carece de actividad de desplazamiento de cadena, así como actividad de nucleasa tanto 3 '^5 ' como 5'^3'. Si el oligonucleótido tiene un grupo de bloqueo en el lado 5', entonces puede usarse polimerasa con actividad de nucleasa 5'^3'.

Nota 3. El producto circular es adecuado para la amplificación por círculo rodante (usando cebadores hexámeros aleatorios con polimerasa phi-29) para crear repeticiones en tándem de la secuencia deseada, y posterior identificación de las dianas usando secuenciación de nueva generación o, alternativamente, secuenciación SMRT directa en el molde cerrado covalentemente, usando la secuencia de unión de cebador como un sitio de unión de cebador.

Nota 4. Si el oligonucleótido u oligonucleótidos también comprenden sitios de unión de cebador opcionales (es decir, sitios de unión de cebador universales), para la amplificación por PCR, seguido de la identificación posterior de las dianas, podría ser adecuado el uso de secuenciación de nueva generación, ensayos TaqMan, ensayos UniTaq, ensayos de PCR en tiempo real, PCR digital, micromatriz, hibridación, u otro método de detección.

En la variación 2.2 se usan tanto una polimerasa como una ligasa para formar un círculo cerrado covalentemente que contiene una secuencia de identificador único, una secuencia de identificador de paciente opcional, y un sitio de unión de cebador opcional. Esto también puede conseguirse usando solo una ligasa.

Variación 2.3: (véanse, por ejemplo, las Figuras 31-32). En esta variación, los conectores cortos que contienen 5-metil C se ligan a los extremos del ADN. A continuación el ADN se trata con bisulfito, lo que hace que las cadenas no sean complementarias para que se vuelvan monocatenarias. Algunos ciclos de amplificación por PCR generan productos que ahora no están metilados en los sitios de AciI restantes. A continuación, estos productos se escinden con AciI. Solo los amplicones de PCR que contienen sitios de AciI adyacentes (GCGG) que estaban metilados en la diana original generarán fragmentos que ahora son competentes para ligamiento en ambos extremos. Para capturar las regiones sin metilar deseadas, un par de oligonucleótidos parcialmente bicatenarios que comprende una primera sonda oligonucleotídica con una región de sonda 5' complementaria a la secuencia del lado 5' de la diana, una secuencia de unión de cebador opcional, una secuencia de identificador de paciente opcional, y una región de sonda 3' complementaria a la secuencia del lado 3' de la diana, y una segunda sonda oligonucleotídica que comprende una región en el extremo 5' complementaria a la primera cadena de la sonda oligonucleotídica, una secuencia de identificador único y una región en el extremo 3' complementaria a la primera cadena de la sonda oligonucleotídica, se hibridan con la diana. La adición de ligasa permite el ligamiento del extremo 3' de la diana al extremo 5' de la segunda sonda oligonucleotídica, y el extremo 5' de la diana al extremo 3' de la segunda sonda oligonucleotídica, para formar un producto circular que contiene una secuencia de identificador único, una secuencia de identificador de paciente opcional, y un sitio de unión de cebador opcional. Los productos sin ligar se eliminan por digestión con exonucleasa. Este producto circular es adecuado para etapas adicionales opcionales y secuenciación posterior.

Protocolo detallado para la detección altamente sensible de no metilación de promotor:

2.3. a. Ligar en conectores que contienen 5-metil C para retener la secuencia después de la conversión con bisulfito. Los extremos de diana se reparan con polimerasa T4 y quinasa T4, y posteriormente se genera una protuberancia A 3' de una sola base con Klenow (exo-) y dATP. Los conectores tienen una protuberancia T 3' de una sola base, de modo que el ligamiento usando ligasa T4 añade conectores en ambos extremos del fragmento. Incubar el ADNcf con bisulfito, que convierte la C regular, pero no la metil-C, en U. El tratamiento con bisulfito convierte las cadenas superior e inferior de manera diferente, de modo que después del tratamiento, las cadenas ya no serán complementarias entre sí y se fusionarán por separado.

2.3. b. Añadir cebadores, polimerasa Taq y los dNTP y realizar algunos ciclos de PCR para generar productos que ahora están sin metilar en los sitios de AciI restantes.

2.3. c. Añadir AciI para escindir los productos que contengan tales sitios. Solo los amplicones de PCR que contienen sitios de AciI adyacentes (GCGG) que estaban metilados en la diana original generarán fragmentos que están desbloqueados (es decir, competentes para ligamiento con los conectores) en ambos extremos, cuando se escinden con AciI. Una polimerasa residual de la polimerasa Taq rellenará la protuberancia de 2 bases (opcionalmente, aumentar la temperatura a 60 °C).

2.3. d. Desnaturalizar el ADN diana (94 °C, 1 minuto) en presencia de pares de oligonucleótidos parcialmente bicatenarios (que comprenden una primera sonda oligonucleotídica con una región de sonda 5' complementaria a la secuencia del lado 5' de la diana, una secuencia de unión de cebador opcional, una secuencia de identificador de paciente opcional, y una región de sonda 3' complementaria a la secuencia del lado 3' de la diana, y una segunda sonda oligonucleotídica que comprende una región en el extremo 5' complementaria a la primera sonda oligonucleotídica, una secuencia de identificador único y una región en el extremo 3' complementaria a la primera sonda oligonucleotídica), y permitir que los oligonucleótidos se hibriden con sus regiones complementarias en los fragmentos deseados mediante enfriamiento a una temperatura deseada (por ejemplo, 50 °C-60 °C durante 2 horas). Una ligasa termoestable (preferentemente de la cepa AK16D) se añade para permitir el ligamiento a 60 °C para generar productos circulares.

2.3. e. Añadir Exonucleasa I (digiere el ADN monocatenario en la dirección 3'^-5'), y Exonucleasa III (digiere el ADN bicatenario en la dirección 3'^5'), para digerir todos los productos sin ligar o con mellas, dejando solo el ADN circular monocatenario deseado que comprende una copia del ADN metilado, la secuencia de identificador único, y una secuencia de identificador de paciente opcional. Este producto circular es adecuado para etapas adicionales opcionales y secuenciación posterior.

Nota 1. El producto circular es adecuado para la amplificación por círculo rodante (usando cebadores hexámeros aleatorios con polimerasa phi-29) para crear repeticiones en tándem de la secuencia deseada, y posterior identificación de las dianas usando secuenciación de nueva generación o, alternativamente, secuenciación SMRT directa en el molde cerrado covalentemente, usando la secuencia de unión de cebador como un sitio de unión de cebador.

Nota 2. Si el oligonucleótido u oligonucleótidos también comprenden sitios de unión de cebador opcionales (es decir, sitios de unión de cebador universales), para la amplificación por PCR, seguido de la identificación posterior de las dianas, podría ser adecuado el uso de secuenciación de nueva generación, ensayos TaqMan, ensayos UniTaq, ensayos de PCR en tiempo real, PCR digital, micromatriz, hibridación, u otro método de detección.

Base de datos de estado de metilación en sitios de restricción sensibles a metilo adyacentes (sitios de AciI)

La base de datos de TCGA actual contiene información sobre el estado de metilación de aproximadamente 450.000 sitios CpG en el genoma humano, tanto para tejido normal como para tejido tumoral de muchos sitios tisulares diferentes. Sin embargo, no cubre todos el estado de metilación de sitios de AciI adyacentes, ni podría distinguir que ambos sitios estén metilados en el mismo tramo de ADN genómico.

Por lo tanto, para que el método de ensayo mencionado anteriormente sea el más útil, podría ser útil crear una base de datos del estado de metilación en sitios de restricción de AciI adyacentes de la misma orientación (GCGG). Este enfoque también incluirá sitios de restricción de Acil adyacentes de la otra orientación (CCGC), ya que serán GCGG en la cadena opuesta después de la conversión con bisulfito. Un enfoque de ese tipo se ilustra en la Figura 33.

Visión general del enfoque: la idea es generar una genoteca de pequeños fragmentos que solo se podrían haber formado si ambos extremos del fragmento contuvieran sitios de restricción que estuvieran metilados en el ADN genómico original. Esta idea aprovecha una propiedad única de la secuencia de reconocimiento para AciI. La enzima escinde la secuencia de reconocimiento de 3,5 bases GACGG en una orientación, y CACGC en la otra orientación. Comenzar con un sitio de Acil metilado y tratar con bisulfito. En la primera orientación (G*CGG), el sitio permanecerá sin cambios, mientras que en la segunda orientación cambiará (U*CGU, en donde *C indica 5-meC). Después de algunos ciclos de amplificación por PCR, el primer sitio se convierte en GCGG, que es reconocido por Acil, mientras que el segundo sitio se convierte en TCGT, que no está escindido. De ese modo, Acil puede usarse para identificar secuencias metiladas de forma única después del tratamiento con bisulfito. Los fragmentos tienen conectores añadidos con secuencias de identificador único opcionales y secuencias de identificador de paciente opcionales que ahora son susceptibles de ligamiento para crear multímeros de fragmentos que a continuación serán sustratos para etapas adicionales y secuenciación posterior.

Variación 2.3.1: (véase, por ejemplo, la Figura 33). Este enfoque muestra el modo en que descubrir la metilación en sitios de Acil adyacentes (GC*GG) en todo el genoma. El material de partida puede ser ADN genómico intacto o ADNcf con una longitud media de aproximadamente 160 pb. Los conectores cortos que contienen un extremo 5' bloqueado en el extremo de no ligamiento, se ligan en los extremos del ADN. Tratar el ADN con bisulfito, que convierte la C regular, pero no la metil-C, en U. Unos pocos ciclos de amplificación por PCR usando los dNTP sin metilar y cebadores bloqueados en el extremo 5' generan productos que ahora están sin metilar en los sitios de Acil restantes. A continuación, estos productos se escinden con Acil. Solo los amplicones de PCR que contienen sitios de Acil adyacentes (GCGG) que estaban metilados en la diana original generarán fragmentos que están desbloqueados (es decir, competentes para ligamiento con los conectores) en ambos extremos, cuando se escinden con Acil. Los conectores que contienen una secuencia de identificador único opcional, y una secuencia de identificador de paciente opcional se ligan en estos extremos escindidos con Acil rellenos recién generados. Estos nuevos conectores contienen, en su lado de no ligamiento, el extremo 3' bloqueado, o una cadena principal que contiene tiofosfato (que se muestra como **** en la Figura 33). Después de añadir una exonucleasa 3' bicatenaria (es decir, Exonucleasa lll), los fragmentos que contienen el conector corto original en uno o ambos lados se digerirán y se volverán monocatenarios. Solo los fragmentos con el nuevo conector ligado a ambos lados permanecerán bicatenarios, ya que el grupo de bloqueo 3' o los tiofosfatos inhiben la digestión con la exonucleasa 3'. Los extremos libres de los fragmentos restantes que contienen conector se vuelven competentes para ligamiento, ya sea mediante (i) fosforilación del extremo 5', (ii) retirada del grupo 3' bloqueado, o (iii) uso de la actividad de nucleasa 5' para retirar por escisión la base solapante 5' de emparejamiento o la aleta, dejando un fosfato 5' competente para ligamiento, o cualquier combinación de los mismos. Las condiciones de ligamiento se diseñan para favorecer la multimerización, por ejemplo, mediante el uso de agentes de aglomeración (es decir, PEG al 20 %), y/o mediante la mezcla de dos conjuntos de productos de ligamiento, en donde la protuberancia del conector 5' no palindrómico del primer conjunto es complementaria a la protuberancia del conector 5' no palindrómico del segundo conjunto. Los productos de ligamiento comprenden secuencias de Acil adyacentes en la misma orientación (es decir, GCGG), originalmente metiladas en el ADN diana con una secuencia de identificador único y/o una secuencia de identificador de paciente opcionales. Este producto es adecuado para etapas adicionales opcionales y secuenciación posterior.

Protocolo detallado para generar una base de datos de estado de metilación en sitios de restricción de AciI adyacentes:

2.3.1. a. Ligar los conectores que están bloqueados en el extremo 5' del extremo de no ligamiento. Los extremos de diana se reparan con polimerasa T4 y quinasa T4, y posteriormente se genera una protuberancia A 3' de una sola base con Klenow (exo-) y dATP. Los conectores tienen una protuberancia T 3' de una sola base, de modo que el ligamiento usando ligasa T4 añada conectores en ambos extremos del fragmento. lncubar el ADNcf con bisulfito, que convierte la C regular, pero no la metil-C, en U. El tratamiento con bisulfito convierte las cadenas superior e inferior de manera diferente, de modo que después del tratamiento, las cadenas ya no serán complementarias entre sí y se fusionarán por separado.

2.3.1. b. Añadir cebadores bloqueados en el extremo 5', polimerasa Taq y los dNTP y realizar algunos ciclos de PCR para generar productos que ahora están sin metilar en los sitios de Acil restantes.

2.3.1. c. Añadir Acil para escindir los productos que contengan tales sitios. Solo los amplicones de PCR que contienen sitios de Acil adyacentes (GCGG) que estaban metilados en la diana original generarán fragmentos que están desbloqueados (es decir, competentes para ligamiento con los conectores) en ambos extremos, cuando se escinden con Acil. Una polimerasa residual de la polimerasa Taq rellenará la protuberancia de 2 bases (opcionalmente, aumentar la temperatura a 60 °C). Retirar los dNTP (a través de una columna de centrifugación) y volver a añadir solo dATP para generar una protuberancia A 3' de una sola base.

2.3.1. d. Usar ligasa T4, añadiendo conectores (que contengan una secuencia de identificador único opcional, y una secuencia de identificador de paciente opcional) con una protuberancia A 3' de una sola base en el extremo de ligamiento a la protuberancia A de una sola base de las secuencias diana escindidas y rellenadas. El lado 5' de no ligamiento del conector contiene una protuberancia 5' y, opcionalmente, no está fosforilado. El lado 3' de no ligamiento del conector contiene un grupo de bloqueo 3' y/o tiofosfatos para inhibir la digestión con la exonucleasa 3'.

2.3.1.e. Añadir una exonucleasa 3' (es decir, Exonucleasa III) y digerir a 37 °C. Los fragmentos que contienen el conector corto original en uno o ambos lados se digerirán y se volverán monocatenarios. Solo los fragmentos con el nuevo conector ligado a ambos lados permanecerán bicatenarios. La exonucleasa también hará que los conectores se vuelvan monocatenarios. Opcionalmente, retirar los productos de digestión de los fragmentos deseados con una columna de centrifugación.

2.3.1 f. Los extremos libres de los fragmentos restantes que contienen conector se vuelven competentes para ligamiento, ya sea mediante (i) fosforilación del extremo 5' usando quinasa T4, (ii) retirada del grupo en el extremo 3' bloqueado, o (iii) uso de la actividad de nucleasa 5 '^3 ' de la polimerasa Taq para retirar por escisión la base solapante 5' de emparejamiento o la aleta, dejando un fosfato 5' competente para ligamiento, o cualquier combinación de los mismos. Las condiciones de ligamiento se diseñan para favorecer la multimerización. Los productos de ligamiento comprenden multímeros de fragmentos diana con secuencias de AciI adyacentes originalmente metiladas en el ADN diana con una secuencia de identificador único y/o una secuencia de identificador de paciente opcionales. Este producto es adecuado para etapas adicionales opcionales y secuenciación posterior.

Nota 1: el extremo 3' del conector bloqueado puede sintetizarse para que contenga un uracilo o un sitio apurínico (AP) en una posición interna al bloqueo y, después del tratamiento con UDG y endonucleasa AP, liberar un extremo 3' competente para ligamiento.

Nota 3: el ligamiento favorecerá la formación de multímeros mediante el uso de agentes de aglomeración (es decir, PEG al 20 %), y/o mediante la mezcla de dos conjuntos de productos de ligamiento, en donde la protuberancia del conector 5' no palindrómico del primer conjunto es complementaria a la protuberancia del conector 5' no palindrómico del segundo conjunto.

Ejemplo profético comparativo 3 - Marcador sin metilar de alta sensibilidad para hipometilación de promotor (cuando está presente de un 1 % a un 0,1 %) en ADN plasmático total

La mayoría de los cambios de metilación en los tumores se deben a la hipometilación. Cuando tal hipometilación se produce en una región de promotor que anteriormente estaba metilada, puede causar un aumento de la expresión de un gen, tal como un oncogén. Además, en general, las regiones de elementos repetitivos y los elementos móviles se silencian mediante metilación general, pero dicho silenciamiento se pierde cuando se produce hipometilación en el tumor.

Aunque pueden usarse enzimas de restricción sensibles a metilo para ayudar a amplificar e identificar selectivamente niveles bajos de secuencias metiladas, el enfoque no funciona para identificar niveles bajos de secuencias sin metilar. Puede usarse tratamiento con bisulfito y uso de cebadores de PCR dirigidos a ^aDⁿsin metilar modificado con bisulfito, aunque tales cebadores son muy ricos en AT y puede haber dificultades para amplificar todos los fragmentos deseados, especialmente cuando se intenta la PCR multiplexada.

Visión general del enfoque: la idea es copiar fielmente cada fragmento de ADN diana que está sin metilar en sitios de restricción adyacentes para las regiones de interés, añadir una secuencia de identificador único, una secuencia de unión de cebador opcional, y un identificador de paciente opcional, y circularizarlos para la secuenciación posterior. La cadena de ADN oligonucleotídica se circulariza y se secuencia. Este enfoque proporciona la ventaja de obtener a la vez información sobre el número de copias cuando sea necesario, y datos de no metilación con el mínimo de secuenciación requerido.

Variación 3.1: (véanse, por ejemplo, las Figuras 34 y 35). En esta variación, el ADN se escinde con HinP1I (u otra endonucleasa de restricción sensible a la metilación) para generar extremos 3' y 5' competentes para ligamiento. Para capturar las regiones sin metilar deseadas, las sondas oligonucleotídicas que comprenden una región de sonda 5' complementaria a la secuencia del lado 5' de la diana, una secuencia de identificador único, una secuencia de unión de cebador opcional, una secuencia de identificador de paciente opcional, y una región de sonda 3' complementaria a la secuencia del lado 3' de la diana, se hibridan con la diana. La adición de ligasa y polimerasa que carecen de actividad de desplazamiento de cadena y actividad de nucleasa tanto 3 '^5 ' como 5'^3', permite la extensión del extremo 3' de la diana sin metilar, seguido de ligamiento al extremo 5' de la diana para formar un producto circular que contiene tanto una secuencia de identificador único como una secuencia de identificador de paciente opcional y un sitio de unión de cebador opcional. Los productos sin ligar se eliminan por digestión con exonucleasa. Este producto circular es adecuado para etapas adicionales opcionales y secuenciación posterior.

3.1a. Escindir el ADNcf aislado con una o más enzimas sensibles a metilo (AciI, HinP1I, Hpy99I, y HpyCH4IV). Este ejemplo ilustra el uso de HinP1I. Inactivar con calor las una o varias endonucleasas (65 °C durante 15 minutos) y desnaturalizar el ADN (94 °C, 1 minuto).

3.1b. Desnaturalizar el ADN diana (94 °C, 1 minuto) en presencia de oligonucleótidos (que comprenden una región de sonda 5' complementaria a la secuencia del lado 5' de las dianas, una secuencia de identificador único, una secuencia de identificador de paciente opcional, un sitio de unión de cebador opcional y una región de sonda 3' complementaria a la secuencia del lado 3' de las dianas), y permitir que los oligonucleótidos se hibriden con sus regiones complementarias en los fragmentos deseados mediante enfriamiento a una temperatura deseada (por ejemplo, 50°-60 °C durante 2 horas). Se añaden KlenTaq (polimerasa Taq que carece de actividad de nucleasa), y ligasa termoestable (preferentemente de la cepa AK16D), y los dNTP para permitir la extensión y el ligamiento a 50 °C y, opcionalmente, aumentar la temperatura (por ejemplo, 60 °C) para garantizar la finalización de la extensión y el ligamiento, para generar productos circulares.

3.1.c. Añadir Exonucleasa I (digiere el ADN monocatenario en la dirección 3'^-5'), y Exonucleasa III (digiere el ADN bicatenario en la dirección 3'^5'), para digerir todos los productos sin ligar o con mellas, dejando solo el ADN circular monocatenario deseado que comprende una copia del ADN metilado, la secuencia de identificador único, y una secuencia de identificador de paciente opcional. Este producto circular es adecuado para etapas adicionales opcionales y secuenciación posterior.

Nota 3. El producto circular es adecuado para la amplificación por círculo rodante (usando cebadores hexámeros aleatorios con polimerasa phi-29) para crear repeticiones en tándem de la secuencia deseada, y posterior identificación de las dianas usando secuenciación de nueva generación o, alternativamente, secuenciación SMRT directa en el molde cerrado covalentemente, usando la secuencia de unión de cebador como un sitio de unión de cebador. Cuando se usa la secuenciación SMRT directa, la pérdida del estado de metilación del ADN del molde original puede determinarse directamente.

Nota 5. El mismo enfoque puede usarse para identificar regiones que están metiladas en regiones promotoras (véanse, por ejemplo, las Figuras 36 y 37). Escindir el ADNcf aislado con un cóctel de enzimas sensibles a metilo (AciI, HinP1I, Hpy99I, y HpyCH4IV), así como con enzimas insensibles a metilo (HaeIII y MspI). La figura ilustra esto con sitios de AciI metilados, internos a, y flanqueados por dos sitios de HaeIII. Este enfoque funcionará incluso si solo hay un sitio de restricción insensible a metilo (véanse, por ejemplo, las Figuras 39, 40, 42, 43). Si la endonucleasa de restricción insensible a metilo libera un extremo 3' competente, entonces ese extremo podría extenderse en el oligonucleótido con polimerasa Taq (con actividad de nucleasa 5'^3'), y la polimerasa podría extenderse y escindir la secuencia en el extremo 5' extra en la diana, generando un fosfato 5' competente para ligamiento en la diana que es adecuado para ligamiento para crear el producto circular (Figura 39). Si la endonucleasa de restricción insensible a metilo libera un fosfato 5' competente, entonces el uso de una polimerasa con actividad de nucleasa 3 '^5 ' podría digerir la secuencia 3' extra en la diana (si fuera necesario) y, a continuación, una vez colocada a nivel con la secuencia complementaria en la sonda oligonucleotídica, la polimerasa podría extender la cadena diana hasta el fosfato 5' competente para ligamiento en la diana, y la mella podría sellarse por ligasa para crear el producto circular (Figura 40). Después de digestión con exonucleasa, la supervivencia de la cadena después de la escisión con endonucleasa de restricción sensible a metilo es un marcador de la metilación de esa región. Además, cuando se usa la secuenciación SMRT directa en el molde cerrado covalentemente, puede determinarse el estado de metilación del ADN del molde original.

Nota 6. El mismo enfoque puede usarse para identificar regiones que están metiladas en sitios de Bsh1236I de regiones promotoras (véanse, por ejemplo, las Figuras 38, 41, 44, 45, 46). Escindir el ADNcf aislado con Bsh1236I (CGCG), así como con enzimas insensibles a metilo (HaeIII). La Figura 38 ilustra esto con sitios de Bsh1236I metilados, internos a, y flanqueados por dos sitios de HaeIII. Este enfoque funcionará incluso si solo hay un sitio de restricción insensible a metilo (véanse, por ejemplo, las Figuras 41, 44, 45). Si la endonucleasa de restricción insensible a metilo libera un extremo 3' competente, entonces ese extremo podría extenderse en el oligonucleótido con polimerasa Taq (con actividad de nucleasa 5'^3'), y la polimerasa podría extenderse y escindir la secuencia en el extremo 5' extra en la diana, generando un fosfato 5' competente para ligamiento en la diana que es adecuado para ligamiento para crear el producto circular (Figura 38). Si la endonucleasa de restricción insensible a metilo libera un fosfato 5' competente, entonces el uso de una polimerasa con actividad de nucleasa 3 '^5 ' podría digerir la secuencia 3' extra en la diana (si fuera necesario) y, a continuación, una vez colocada a nivel con la secuencia complementaria en la sonda oligonucleotídica, la polimerasa podría extender la cadena diana hasta el fosfato 5' competente para ligamiento en la diana, y la mella podría sellarse con ligasa para crear el producto circular (Figuras 41 y 45). Después de digestión con exonucleasa, la supervivencia de la cadena después de la escisión con endonucleasa de restricción sensible a metilo es un marcador de la metilación de esa región. La replicación por círculo rodante usando polimerasa Bst en presencia de BstUI (CGCG) garantiza que los sitios estaban metilados en la muestra original.

En la variación 3.1, se usan tanto una polimerasa como una ligasa para formar un círculo cerrado covalentemente que contiene una secuencia de identificador único, una secuencia de identificador de paciente opcional, y un sitio de unión de cebador opcional. Esto también puede conseguirse usando solo una ligasa.

Variación 3.2: (véanse, por ejemplo, las Figuras 47 y 48). En esta variación, el ADN se escinde con HinP1I (u otra endonucleasa de restricción sensible a la metilación) para generar extremos 3' y 5' competentes para ligamiento. Para capturar las regiones sin metilar deseadas, un par de oligonucleótidos parcialmente bicatenarios que comprende una primera sonda oligonucleotídica con una región de sonda 5' complementaria a la secuencia del lado 5' de la diana, una secuencia de unión de cebador opcional, una secuencia de identificador de paciente opcional, y una región de sonda 3' complementaria a la secuencia del lado 3' de la diana, y una segunda sonda oligonucleotídica que comprende una región 5' complementaria a la primera sonda, una secuencia de identificador único y una región en el extremo 3' complementaria a la primera sonda, se hibridan con la diana. La adición de ligasa permite el ligamiento del extremo 3' de la diana al extremo 5' de la segunda sonda oligonucleotídica, y el extremo 5' de la diana al extremo 3' de la segunda sonda oligonucleotídica para formar un producto circular que contiene una secuencia de identificador único, una secuencia de identificador de paciente opcional, y un sitio de unión de cebador opcional. Los productos sin ligar se eliminan por digestión con exonucleasa. Este producto circular es adecuado para etapas adicionales opcionales y secuenciación posterior.

3.2. a. Escindir el ADNcf aislado con una o más enzimas sensibles a metilo (AciI, HinP1I, Hpy99I, y HpyCH4IV). En este ejemplo, se usa HinP1I. Inactivar con calor las una o varias endonucleasas (65 °C durante 15 minutos) y desnaturalizar el ADN (94 °C, 1 minuto).

3.2. b. Desnaturalizar el ADN diana (94 °C, 1 minuto) en presencia de pares de oligonucleótidos parcialmente bicatenarios (que comprenden una primera sonda oligonucleotídica con una región de sonda 5' complementaria a la secuencia del lado 5' de la diana, una secuencia de unión de cebador opcional, una secuencia de identificador de paciente opcional, y una región de sonda 3' complementaria a la secuencia del lado 3' de la diana, y una segunda sonda oligonucleotídica que comprende una región en el extremo 5' complementaria a la primera cadena, una secuencia de identificador único y una región en el extremo 3' complementaria a la primera cadena), y permitir que los oligonucleótidos se hibriden con sus regiones complementarias en los fragmentos deseados mediante enfriamiento a una temperatura deseada (por ejemplo, 50°-60 °C durante 2 horas). Se añade una ligasa termoestable (preferentemente de la cepa AK16D), para permitir el ligamiento a 60 °C para generar productos circulares.

3.2. c. Añadir Exonucleasa I (digiere el ADN monocatenario en la dirección 3'^-5'), y Exonucleasa III (digiere el ADN bicatenario en la dirección 3'^5'), para digerir todos los productos sin ligar o con mellas, dejando solo el ADN circular monocatenario deseado que comprende una copia del ADN metilado, la secuencia de identificador único, y una secuencia de identificador de paciente opcional. Este producto circular es adecuado para etapas adicionales opcionales y secuenciación posterior.

Nota 1. El producto circular es adecuado para la amplificación por círculo rodante (usando cebadores hexámeros aleatorios con polimerasa phi-29) para crear repeticiones en tándem de la secuencia deseada, y posterior identificación de las dianas usando secuenciación de nueva generación o, alternativamente, secuenciación SMRT directa en el molde cerrado covalentemente, usando la secuencia de unión de cebador como un sitio de unión de cebador. Cuando se usa la secuenciación SMRT directa, la pérdida del estado de metilación del ADN del molde original puede determinarse directamente.

Nota 3. El mismo enfoque puede usarse para identificar regiones que están metiladas en regiones promotoras (véanse, por ejemplo, las Figuras 49 y 51). Escindir el ADNcf aislado con un cóctel de enzimas sensibles a metilo (AciI, HinP1I, Hpy99I, y HpyCH4IV), así como con enzimas insensibles a metilo (HaeIII y MspI). Estas figuras ilustran sitios de AciI metilados, internos a, y flanqueados por dos sitios de HaeIII. La supervivencia de la cadena después de la escisión con endonucleasa de restricción sensible a metilo es un marcador de la metilación de esa región. Además, cuando se usa la secuenciación SMRT directa en el molde cerrado covalentemente, puede determinarse el estado de metilación del ADN del molde original.

Base de datos del estado de no metilación en sitios de restricción sensibles a metilo adyacentes

La base de datos de TCGA actual contiene información sobre el estado de metilación de aproximadamente 450.000 sitios CpG en el genoma humano, tanto para tejido normal como para tejido tumoral de muchos sitios tisulares diferentes. Sin embargo, no cubre todo el estado de no metilación de sitios de HinP1I adyacentes, ni podría distinguir que ambos sitios no estén metilados en el mismo tramo de ADN genómico.

Por lo tanto, para que el método de ensayo mencionado anteriormente sea el más útil, podría ser útil crear una base de datos del estado de no metilación de sitios de restricción sensibles a metilo adyacentes. Un enfoque de ese tipo se ilustra en la Figura 51.

Visión general del enfoque: la idea es generar una genoteca de pequeños fragmentos que solo se podrían haber formado si ambos extremos del fragmento contuvieran sitios de restricción que no estaban metilados en el ADN genómico original. Los fragmentos tienen conectores añadidos con secuencias de identificador único opcionales y secuencias de identificador de paciente opcionales que ahora son susceptibles de ligamiento para crear multímeros de fragmentos que a continuación serán sustratos para etapas adicionales y secuenciación posterior.

Variación 3.2.1: (véase, por ejemplo, la Figura 51). Este enfoque muestra el modo en que descubrir la no metilación en sitios de HinP1I adyacentes (GCGC) en todo el genoma. El material de partida puede ser ADN genómico intacto o ADNcf con una longitud media de aproximadamente 160 pb. Se ligan en el ADN diana conectores cortos que contienen un extremo 5' bloqueado en el extremo de no ligamiento. Escindir el ADN genómico con HinP1I para fragmentar el ADN en sitios de HinP1I sin metilar. Los conectores que contienen una secuencia de identificador único opcional, y una secuencia de identificador de paciente opcional están ligados a estos extremos escindidos con HinP1I rellenos recién generados. Estos nuevos conectores contienen, en su lado de no ligamiento, el extremo 3' bloqueado, o una cadena principal que contiene tiofosfato (que se muestra como **** en la Figura 51). Después de añadir una exonucleasa 3' bicatenaria (es decir, Exonucleasa III), los fragmentos que contienen el conector corto original en uno o ambos lados se digerirán y se volverán monocatenarios. Solo los fragmentos con el nuevo conector ligado a ambos lados permanecerán bicatenarios, ya que el grupo de bloqueo 3' o los tiofosfatos inhiben la digestión con exonucleasa 3'. Los extremos libres de los fragmentos restantes que contienen conector se vuelven competentes para ligamiento, ya sea mediante (i) fosforilación del extremo 5', (ii) retirada del grupo 3' bloqueado, o (iii) uso de la actividad de nucleasa 5' para retirar por escisión la base solapante 5' de emparejamiento o la aleta, dejando un fosfato 5' competente para ligamiento, o cualquier combinación de los mismos. Las condiciones de ligamiento se diseñan para favorecer la multimerización, por ejemplo, mediante el uso de agentes de aglomeración (es decir, PEG al 20 %), y/o mediante la mezcla de dos conjuntos de productos de ligamiento, en donde la protuberancia del conector 5' no palindrómico del primer conjunto es complementaria a la protuberancia del conector 5' no palindrómico del segundo conjunto. Los productos de ligamiento comprenden secuencias de HinP1I adyacentes originalmente no metiladas en el ADN diana con una secuencia de identificador único y/o una secuencia de identificador de paciente opcionales. Este producto es adecuado para etapas adicionales opcionales y secuenciación posterior.

3.2.1. a. Ligar los conectores que están bloqueados en el extremo 5' del extremo de no ligamiento. Los extremos de diana se reparan con polimerasa T4 y quinasa T4, y posteriormente se genera una protuberancia A 3' de una sola base con Klenow (exo-) y dATP. Los conectores tienen una protuberancia T 3' de una sola base, de modo que el ligamiento usando ligasa T4 añada conectores en ambos extremos del fragmento. Escindir el ADN genómico aislado, o ADN enriquecido con metilo con una o más enzimas sensibles a metilo (AciI, HinP1I, Hpy99I, y HpyCH4IV). En este ejemplo, se usó HinP1I. Opcionalmente, inactivar con calor las una o varias endonucleasas (65 °C durante 15 minutos).

3.2.1. b. Añadir HinP1I para escindir los productos que contengan dichos sitios. Solo la diana que contiene sitios de HinP1I adyacentes (GCGC) que estaban sin metilar en la diana original generará fragmentos que están sin bloquear (es decir, competentes para ligamiento con los conectores) en ambos extremos, cuando se escinde con HinP1I. Una polimerasa residual de la polimerasa Taq rellenará la protuberancia de 2 bases (opcionalmente, aumentar la temperatura a 60 °C). Retirar los dNTP (a través de una columna de centrifugación) y añadir solo dATP para generar una protuberancia A 3' A de una sola base.

3.2.1. c. Usar ligasa T4, añadiendo conectores (que contengan una secuencia de identificador único opcional, y una secuencia de identificador de paciente opcional) con una protuberancia A 3' de una sola base en el extremo de ligamiento a la protuberancia A de una sola base de las secuencias diana escindidas y rellenadas. El lado 5' de no ligamiento del conector contiene una protuberancia 5' y, opcionalmente, no está fosforilado. El lado 3' de no ligamiento del conector contiene un grupo de bloqueo 3' y/o tiofosfatos para inhibir la digestión con la exonucleasa 3'.

3.2.1. d. Añadir una exonucleasa 3' (es decir, Exonucleasa III) y digerir a 37 °C. Los fragmentos que contienen el conector corto original en uno o ambos lados se digerirán y se volverán monocatenarios. Solo los fragmentos con el nuevo conector ligado a ambos lados permanecerán bicatenarios. La exonucleasa también hará que los conectores se vuelvan monocatenarios. Opcionalmente, retirar los productos de digestión de los fragmentos deseados con una columna de centrifugación.

3.2.1.1. e. Los extremos libres de los fragmentos restantes que contienen conector se vuelven competentes para ligamiento, ya sea mediante (i) fosforilación del extremo 5' usando quinasa T4, (ii) retirada del grupo 3' bloqueado, o (iii) uso de la actividad de nucleasa 5 '^3 ' de la polimerasa Taq para retirar por escisión la base solapante 5' de emparejamiento o la aleta, dejando un fosfato 5' competente para ligamiento, o cualquier combinación de los mismos. Las condiciones de ligamiento se diseñan para favorecer la multimerización. Los productos de ligamiento comprenden multímeros de fragmentos diana con secuencias de HinP1I adyacentes originalmente metiladas en el ADN diana con una secuencia de identificador único y/o una secuencia de identificador de paciente opcionales. Este producto es adecuado para etapas adicionales opcionales y secuenciación posterior.

Nota 4. El mismo enfoque puede usarse para identificar regiones que están metiladas en regiones promotoras (véase, por ejemplo, la Figura 52). Escindir el ADNcf aislado con un cóctel de enzimas sensibles a metilo (AciI, HinP1I, Hpy99I, y HpyCH4IV), y ligar en los conectores cortos con los extremos 5' bloqueados. A continuación, escindir la diana con enzimas insensibles a metilo (HaeIII y MspI). AciI y HaeIII se ilustran en esta figura. La supervivencia de la cadena después de la escisión con endonucleasa de restricción sensible a metilo es un marcador de la metilación de esa región. Solo los sitios de HaeIII adyacentes (GGCC) con sitios de AciI metilados en la diana original generan fragmentos no bloqueados cuando se escinden con HaeIII. El ligamiento posterior de conectores más largos es como se ha descrito anteriormente. Cuando se usa la secuenciación SMRT directa en los productos ligados, puede determinarse el estado de metilación del ADN del molde original.

Detección de sitios adyacentes no metilados en la región de promotor

Puede existir el deseo de determinar el estado de no metilación de las secuencias de CpG entre dos sitios de restricción sensibles a metilo en una región de promotor. Esto es similar a los enfoques mencionados anteriormente, e incluye una etapa extra de tratamiento con bisulfito.

Visión general del enfoque: la idea es copiar fielmente cada fragmento de ADN diana que está sin metilar en sitios de restricción adyacentes para las regiones de interés, tratar con bisulfito, añadir una secuencia de identificador único, una secuencia de unión de cebador opcional, y un identificador de paciente opcional, y circularizarlos para la secuenciación posterior. La cadena de ADN oligonucleotídica se circulariza y se secuencia. Este enfoque proporciona la ventaja de obtener a la vez información sobre el número de copias cuando sea necesario, y datos de no metilación con el mínimo de secuenciación requerido.

Variación 3.3: (véanse, por ejemplo, las Figuras 53 y 54). En esta variación, el ADN se escinde con HinP11 (u otra endonucleasa de restricción sensible a la metilación) para generar extremos 3' y 5' competentes para ligamiento. A continuación, el ADN se trata con bisulfito, lo que hace que las cadenas no sean complementarias para que se vuelvan monocatenarias. Para capturar las regiones sin metilar deseadas, las sondas oligonucleotídicas que comprenden una región de sonda 5' complementaria a la secuencia del lado 5' de la diana, una secuencia de identificador único, una secuencia de unión de cebador opcional, una secuencia de identificador de paciente opcional, y una región de sonda 3' complementaria a la secuencia del lado 3' de la diana, se hibridan con la diana. La adición de ligasa y polimerasa que carecen de actividad de desplazamiento de cadena y actividad de nucleasa tanto 3 '^5 ' como 5'^3', permite la extensión del extremo 3' de la diana sin metilar, seguido de ligamiento al extremo 5' de la diana para formar un producto circular que contiene una secuencia de identificador único, una secuencia de identificador de paciente opcional, y un sitio de unión de cebador opcional. Los productos sin ligar se eliminan por digestión con exonucleasa. Este producto circular es adecuado para etapas adicionales opcionales y secuenciación posterior.

3.3. a. Escindir el ADNcf aislado con una o más enzimas sensibles a metilo (AciI, HinP1I, Hpy99I, y HpyCH4IV). Este ejemplo describe HinP1I. Inactivar con calor las una o varias endonucleasas (65 °C durante 15 minutos) y desnaturalizar el ADN (94 °C, 1 minuto). Incubar el ADNcf con bisulfito, que convierte la C regular, pero no la metil-C, en U. El tratamiento con bisulfito convierte las cadenas superior e inferior de manera diferente, de modo que después del tratamiento, las cadenas ya no serán complementarias entre sí y se fusionarán por separado. 3.3. b. Desnaturalizar el ADN diana (94 °C, 1 minuto, si fuera necesario) en presencia de oligonucleótidos (que comprenden una región de sonda 5' complementaria a las secuencias en el lado 5' de las dianas, una secuencia de identificador único, una secuencia de identificador de paciente opcional, un sitio de unión de cebador opcional, y una región de sonda 3' complementaria a las secuencias en el lado 3' de las dianas), y permitir que los oligonucleótidos se hibriden con sus regiones complementarias en los fragmentos deseados mediante enfriamiento a una temperatura deseada (por ejemplo, 50 °C-60 °C durante 2 horas). Se añaden KlenTaq (polimerasa Taq que carece de actividad de nucleasa), y ligasa termoestable (preferentemente de la cepa AK16D), y los dNTP para permitir la extensión y el ligamiento a 50 °C y, opcionalmente, aumentar la temperatura (por ejemplo, 60 °C) para garantizar la finalización de la extensión y el ligamiento, para generar productos circulares.

3.3. c. Añadir Exonucleasa I (digiere el ADN monocatenario en la dirección 3'^-5'), y Exonucleasa III (digiere el ADN bicatenario en la dirección 3'^5'), para digerir todos los productos sin ligar o con mellas, dejando solo el ADN circular monocatenario deseado que comprende una copia del ADN metilado, la secuencia de identificador único, y una secuencia de identificador de paciente opcional. Este producto circular es adecuado para etapas adicionales opcionales y secuenciación posterior.

En la variación 3.3 se usaron tanto una polimerasa como una ligasa para formar un círculo cerrado covalentemente que contenía una secuencia de identificador único, una secuencia de identificador de paciente opcional, y un sitio de unión de cebador opcional. Esto también puede conseguirse usando solo una ligasa.

Variación 3.4: (véanse, por ejemplo, las Figuras 55 y 56). En esta variación, el ADN se escinde con HinP11 (u otra endonucleasa de restricción sensible a la metilación) para generar extremos 3' y 5' competentes para ligamiento, seguido de tratamiento con bisulfito. Para capturar las regiones sin metilar deseadas, un par de oligonucleótidos parcialmente bicatenarios que comprende una primera sonda oligonucleotídica con una región de sonda 5' complementaria a la secuencia del lado 5' de la diana, una secuencia de unión de cebador opcional, una secuencia de identificador de paciente opcional, y una región de sonda 3' complementaria a la secuencia del lado 3' de la diana, y una segunda sonda oligonucleotídica que comprende una región en el extremo 5' complementaria a la primera sonda, una secuencia de identificador único y una región en el extremo 3' complementaria a la primera sonda, se hibridan con la diana. La adición de ligasa permite el ligamiento al extremo 3' de la diana al extremo 5' de la segunda sonda oligonucleotídica, y el extremo 5' de la diana al extremo 3' de la segunda sonda oligonucleotídica, para formar un producto circular que contiene una secuencia de identificador único, una secuencia de identificador de paciente opcional, y un sitio de unión de cebador opcional. Los productos sin ligar se eliminan por digestión con exonucleasa. Este producto circular es adecuado para etapas adicionales opcionales y secuenciación posterior.

3.4. a. Escindir el ADNcf aislado con una o más enzimas sensibles a metilo (AciI, HinP1I, Hpy99I, y HpyCH4IV). Este ejemplo usa HinP1I. Inactivar con calor las una o varias endonucleasas (65 °C durante 15 minutos) y desnaturalizar el ADN (94 °C, 1 minuto). Incubar el ADNcf con bisulfito, que convierte la C regular, pero no la metil-C, en U. El tratamiento con bisulfito convierte las cadenas superior e inferior de manera diferente, de modo que después del tratamiento, las cadenas ya no serán complementarias entre sí y se fusionarán por separado. 3.4. b. Desnaturalizar el ADN diana (94 °C, 1 minuto) en presencia de pares de oligonucleótidos parcialmente bicatenarios (que comprenden una primera sonda oligonucleotídica con una región de sonda 5' complementaria a las secuencias en el lado 5' de la diana, una secuencia de unión de cebador opcional, una secuencia de identificador de paciente opcional, y una región de sonda 3' complementaria a las secuencias en el lado 3' de la diana, y una segunda sonda oligonucleotídica que comprende una región en el extremo 5' complementaria a la primera cadena, una secuencia de identificador único y una región en el extremo 3' complementaria a la primera cadena), y permitir que los oligonucleótidos se hibriden con sus regiones complementarias en los fragmentos deseados mediante enfriamiento a una temperatura deseada (por ejemplo, 50°-60 °C durante 2 horas). Se añade una ligasa termoestable (preferentemente de la cepa AK16D), para permitir el ligamiento a 60 °C para generar productos circulares.

3.4. c. Añadir Exonucleasa I (digiere el ADN monocatenario en la dirección 3'^-5'), y Exonucleasa III (digiere el ADN bicatenario en la dirección 3'^5'), para digerir todos los productos sin ligar o con mellas, dejando solo el ADN circular monocatenario deseado que comprende una copia del ADN metilado, la secuencia de identificador único, y una secuencia de identificador de paciente opcional. Este producto circular es adecuado para etapas adicionales opcionales y secuenciación posterior.

La base de datos de TCGA actual contiene información sobre el estado de metilación de aproximadamente 450.000 sitios CpG en el genoma humano, tanto para tejido normal como para tejido tumoral de muchos sitios tisulares diferentes. Sin embargo, no cubre todo el estado de no metilación de sitios de HinP1I adyacentes, ni los sitios CpG entre esos sitios, ni podría distinguir que ambos sitios no estén metilados en el mismo tramo de ADN genómico. Por lo tanto, para que el método de ensayo mencionado anteriormente sea el más útil, podría ser útil crear una base de datos del estado de no metilación de sitios de restricción sensibles a metilo adyacentes. Un enfoque de ese tipo se ilustra en la Figura 57.

Visión general del enfoque: la idea es generar una genoteca de pequeños fragmentos que solo se podrían haber formado si ambos extremos del fragmento contuvieran sitios de restricción que no estaban metilados en el ADN genómico original. Los fragmentos tienen conectores añadidos con secuencias de identificador único opcionales y secuencias de identificador de paciente opcionales que ahora son susceptibles de ligamiento para crear multímeros de fragmentos, seguido de tratamiento con bisulfito para revelar las posiciones de metilación o no metilación, que a continuación serán sustratos para etapas adicionales y secuenciación posterior.

Variación 3.4.1: (véase, por ejemplo, la Figura 57). Este enfoque muestra el modo en que descubrir la no metilación en sitios de HinP1I adyacentes (GCGC) en todo el genoma. El material de partida puede ser ADN genómico intacto o ADNcf con una longitud media de aproximadamente 160 pb. Los conectores cortos que contienen un extremo 5' bloqueado en el extremo de no ligamiento, se ligan en el ADN diana. Escindir el ADN genómico con HinP1I para fragmentar el ADN en sitios de HinP1I sin metilar. Los conectores que contienen una secuencia de identificador único opcional, y una secuencia de identificador de paciente opcional están ligados a estos extremos escindidos con HinP1I rellenos recién generados. Estos nuevos conectores contienen, en su lado de no ligamiento, el extremo 3' bloqueado, o una cadena principal que contiene tiofosfato (que se muestra como **** en la Figura 57). Después de añadir una exonucleasa 3' bicatenaria (es decir, Exonucleasa III), los fragmentos que contienen el conector corto original en uno o ambos lados se digerirán y se volverán monocatenarios. Solo los fragmentos con el nuevo conector ligado a ambos lados permanecerán bicatenarios, ya que el grupo de bloqueo en el extremo 3' o los tiofosfatos inhiben la digestión con la exonucleasa 3'. Los extremos libres de los fragmentos restantes que contienen conector se vuelven competentes para ligamiento, ya sea mediante (i) fosforilación del extremo 5', (ii) retirada del grupo 3' bloqueado, o (iii) uso de la actividad de nucleasa 5' para retirar por escisión la base solapante 5' de emparejamiento o la aleta, dejando un fosfato 5' competente para ligamiento, o cualquier combinación de los mismos. Las condiciones de ligamiento se diseñan para favorecer la multimerización, por ejemplo, mediante el uso de agentes de aglomeración (es decir, PEG al 20 %), y/o mediante la mezcla de dos conjuntos de productos de ligamiento, en donde la protuberancia del conector 5' no palindrómico del primer conjunto es complementaria a la protuberancia del conector 5' no palindrómico del segundo conjunto. Los productos de ligamiento comprenden secuencias de HinP1I adyacentes originalmente no metiladas en el ADN diana con una secuencia de identificador único y/o una secuencia de identificador de paciente opcionales. A continuación, el producto se incuba con bisulfito, que convierte la C regular, pero no la metil-C, en U. El tratamiento con bisulfito convierte las cadenas superior e inferior de manera diferente, de modo que, después del tratamiento, las cadenas ya no serán complementarias entre sí y se fusionarán por separado. Estos productos monocatenarios son adecuados para etapas adicionales opcionales y secuenciación posterior.

3.4.1. a. Ligar los conectores que están bloqueados en el extremo 5' del extremo de no ligamiento. Los extremos de diana se reparan con polimerasa T4 y quinasa T4, y posteriormente se genera una protuberancia A 3' de una sola base con Klenow (exo-) y dATP. Los conectores tienen una protuberancia T 3' de una sola base, de modo que el ligamiento usando ligasa T4 añade conectores en ambos extremos del fragmento. Escindir el ADN genómico aislado, o ADN enriquecido con metilo con una o más enzimas sensibles a metilo (AciI, HinP1I, Hpy99I, y HpyCH4IV). En este ejemplo, se usa HinP1I. Opcionalmente, inactivar con calor las una o varias endonucleasas (65 °C durante 15 minutos).

3.4.1. b. Añadir HinP1I para escindir los productos que contengan dichos sitios. Solo la diana que contiene sitios de HinP1I adyacentes (GCGC) que estaban sin metilar en la diana original generarán fragmentos que están sin bloquear (es decir, competentes para ligamiento con los conectores) en ambos extremos, cuando se escinden con HinP1I. Una polimerasa residual de la polimerasa Taq rellenará la protuberancia de 2 bases (opcionalmente, aumentar la temperatura a 60 °C). Retirar los dNTP (a través de una columna de centrifugación) y volver a añadir solo dATP para generar una protuberancia A 3' de una sola base.

3.4.1. c. Usar ligasa T4, añadiendo conectores (que contengan una secuencia de identificador único opcional, y una secuencia de identificador de paciente opcionales) con una protuberancia A 3' de una sola base en el extremo de ligamiento a la protuberancia A de una sola base de las secuencias diana escindidas y rellenadas. El lado 5' de no ligamiento del conector contiene una protuberancia 5', y, opcionalmente, no está fosforilado. El lado 3' de no ligamiento del conector contiene un grupo de bloqueo en el extremo 3' y/o tiofosfatos para inhibir la digestión con la exonucleasa 3'.

3.4.1. d. Añadir una exonucleasa 3' (es decir, Exonucleasa III) y digerir a 37 °C. Los fragmentos que contienen el conector corto original en uno o ambos lados se digerirán y se volverán monocatenarios. Solo los fragmentos con el nuevo conector ligado a ambos lados permanecerán bicatenarios. La exonucleasa también hará que los conectores se vuelvan monocatenarios. Opcionalmente, retirar los productos de digestión de los fragmentos deseados con una columna de centrifugación.

3.4.1.1. e. Los extremos libres de los fragmentos restantes que contienen conector se vuelven competentes para ligamiento, ya sea mediante (i) fosforilación del extremo 5' usando quinasa T4, (ii) retirada del grupo en el extremo 3' bloqueado, o (iii) uso de la actividad de nucleasa 5 '^3 ' de la polimerasa Taq para retirar por escisión la base solapante 5' de emparejamiento o la aleta, dejando un fosfato 5' competente para ligamiento, o cualquier combinación de los mismos. Las condiciones de ligamiento se diseñan para favorecer la multimerización. Los productos de ligamiento comprenden multímeros de fragmentos diana con secuencias de HinP1I adyacentes originalmente metiladas en el ADN diana con una secuencia de identificador único y/o una secuencia de identificador de paciente opcionales. Incubar los productos de ligamiento con bisulfito, que convierte la C regular, pero no la metil-C, en U. El tratamiento con bisulfito convierte las cadenas superior e inferior de manera diferente, de modo que, después del tratamiento, las cadenas ya no serán complementarias entre sí y se fusionarán por separado. Estos productos monocatenarios son adecuados para etapas adicionales opcionales y secuenciación posterior.

Nota 1: el extremo 3' del conector bloqueado más largo puede sintetizarse para que contenga un uracilo o un sitio apurínico (AP) en una posición interna al bloqueo y, después del tratamiento con UDG y endonucleasa AP, liberar un extremo 3' competente para ligamiento. Además, estos conectores pueden sintetizarse con 5-metil C, de modo que después del tratamiento con bisulfito conserven su estado original.

Detección de estado de no metilación de sitios CpG individuales dentro de una región determinada

El enfoque anterior es ideal para identificar y enumerar fragmentos que contienen sitios de HinP1I sin metilar adyacentes como un sustituto de la no metilación dentro de ese fragmento de ADN. Sin embargo, para algunas aplicaciones, es importante identificar el estado de no metilación de sitios CpG individuales dentro de una región determinada. De ese modo, puede ser necesario tratar el ADN entrante con bisulfito, que convierte la C regular, pero no la metil-C, en U.

Visión general del enfoque usando bisulfito: la idea es copiar fielmente cada fragmento de ADN diana que está sin metilar en sitios de restricción de HphI adyacentes de la secuencia (GGTGA) para las regiones de interés, tratar con bisulfito (convertir GGCGA en GGTGA), añadir una secuencia de identificador único, una secuencia de unión de cebador opcional, y un identificador de paciente opcional, y circularizarlos para la secuenciación posterior. La cadena de ADN oligonucleotídica se circulariza y se secuencia. Este enfoque proporciona la ventaja de obtener a la vez información sobre el número de copias cuando sea necesario, y datos de metilación con el mínimo de secuenciación requerido.

La idea aprovecha una propiedad única de la secuencia de reconocimiento para HphI. La enzima escinde la secuencia de reconocimiento de 4,5 bases GGTGA en una orientación, y TCACC en la otra orientación. Si el sitio GGCGA sin metilar se trata con bisulfito, en la primera orientación, el sitio se convertirá en una secuencia de reconocimiento de HphI GGTGA. Después de algunos ciclos de amplificación por PCR, la 5-metil C se convierte en C, mientras que el U se convierte en T. Cuando se escinde con HphI, solo los sitios adyacentes sin metilar en la diana original crearán fragmentos que son competentes para ligamiento en ambos extremos 3' y 5'.

Una característica única de este enfoque es que la conversión con bisulfito crea dos cadenas no complementarias. De ese modo, la cadena superior tendrá secuencias GGCGA o GGTGA adyacentes, e incluso si interviniera una secuencia TCACC, no importaría porque se convertiría en TUAUU, que no se reconocería como un sitio de HphI. Incluso mejor, las secuencias en la cadena superior de la forma TCGCC serán GGCGA en la cadena inferior. La cadena inferior también puede usarse para consultar el estado de metilación y, dado que las dos secuencias ahora son muy diferentes, las sondas oligonucleotídicas para la cadena superior e inferior no se hibridarán entre sí, sino solo con las dianas convertidas. De ese modo, este enfoque permite obtener un estado detallado de metilación en el promotor usando información de las cadenas superior e inferior.

El principio de tratar el ADN con bisulfito para convertir el ADN sin metilar en una secuencia que sea escindible por una enzima de restricción, pero que, si está metilado, no sea escindible por esa misma enzima de restricción, puede extenderse a algunos sitios de restricción adicionales. Por ejemplo, la secuencia CCGTC se convertirá en un sitio de BccI (CCATC), siempre que el CG interno no esté metilado. (Esto es el resultado de la conversión de la cadena opuesta, es decir, gAc g G en la secuencia de reconocimiento de la cadena opuesta de BccI; es decir, GATGG). Del mismo modo, la secuencia GGACG se convertirá en un sitio de FokI (GGATG) siempre que el CG interno no esté metilado. De ese modo, las variaciones que se consideran a continuación para HphI son igualmente válidas para, pero sin limitarse a, las endonucleasas de restricción BccI, FokI, y sus isoesquizómeros.

Variación 3.5: (véanse, por ejemplo, las Figuras 58 y 59). En esta variación, los conectores cortos que contienen 5-metil C se ligan a los extremos del ADN. A continuación, el ADN se trata con bisulfito, lo que hace que las cadenas no sean complementarias para que se vuelvan monocatenarias. Algunos ciclos de amplificación por PCR generan productos que ahora están sin metilar en los sitios de HphI. A continuación estos productos se escinden con HphI. Solo los amplicones de PCR que contienen sitios de "HphI" adyacentes (GGCGA, o GGTGA) que estaban sin metilar en la diana original generarán fragmentos que ahora son competentes para ligamiento en ambos extremos. Para capturar las regiones deseadas, las sondas oligonucleotídicas que comprenden una región de sonda en el extremo 5' complementaria a la secuencia del lado 5' de la diana, una secuencia de identificador único, una secuencia de unión de cebador opcional, una secuencia de identificador de paciente opcional, y una región de sonda en el extremo 3' complementaria a la secuencia del lado 3' de la diana, se hibridan con la diana. La adición de ligasa y polimerasa que carecen de actividad de desplazamiento de cadena y actividad de nucleasa tanto 3 '^5 ' como 5'^3', permite la extensión del extremo 3' de la diana sin metilar, seguido de ligamiento al extremo 5' de la diana para formar un producto circular que contiene una secuencia de identificador único, una secuencia de identificador de paciente opcional, y un sitio de unión de cebador opcional. Los productos sin ligar se eliminan por digestión con exonucleasa. Este producto circular es adecuado para etapas adicionales opcionales y secuenciación posterior.

3.5. a. Ligar en conectores que contienen 5-metil C para retener la secuencia después de la conversión con bisulfito. Los extremos de diana se reparan con polimerasa T4 y quinasa T4, y posteriormente se genera una protuberancia A 3' de una sola base con Klenow (exo-) y dATP. Los conectores tienen una protuberancia T 3' de una sola base, de modo que el ligamiento usando ligasa T4 añada conectores en ambos extremos del fragmento. Incubar el ADNcf con bisulfito, que convierte la C regular, pero no la metil-C, en U. El tratamiento con bisulfito convierte las cadenas superior e inferior de manera diferente, de modo que, después del tratamiento, las cadenas ya no serán complementarias entre sí y se fusionarán por separado.

3.5. b. Añadir cebadores, polimerasa Taq y los dNTP y realizar algunos ciclos de PCR para generar productos que ahora están sin metilar en los sitios de HphI restantes.

3.5. c. Añadir HphI para escindir los productos que contienen tales sitios. Solo los amplicones de PCR que contienen sitios de HphI adyacentes (GGCGA o GGTGA) que estaban sin metilar en la diana original generarán fragmentos que están sin bloquear (es decir, competentes para ligamiento con los conectores) en ambos extremos, cuando se escinden con HphI.

3.5. d. Desnaturalizar el ADN diana (94 °C, 1 minuto) en presencia de oligonucleótidos (que comprenden una región de sonda en el extremo 5' complementaria a las secuencias en el lado 5' de las dianas, una secuencia de identificador único, una secuencia de identificador de paciente opcional, un sitio de unión de cebador opcional, y una región de sonda en el extremo 3' complementaria a las secuencias en el lado 3' de las dianas), y permitir que los oligonucleótidos se hibriden con sus regiones complementarias en los fragmentos deseados mediante enfriamiento a una temperatura deseada (por ejemplo, 50 °C-60 °C durante 2 horas). Se añaden KlenTaq (polimerasa Taq que carece de actividad de nucleasa), y ligasa termoestable (preferentemente de la cepa AK16D), y los dNTP para permitir la extensión y el ligamiento a 50 °C y, opcionalmente, aumentar la temperatura (por ejemplo, 60 °C) para garantizar la finalización de la extensión y el ligamiento, para generar productos circulares.

3.5. e. Añadir Exonucleasa I (digiere el ADN monocatenario en la dirección 3'^5'), y Exonucleasa III (digiere el ADN bicatenario en la dirección 3'^-5'), para digerir todos los productos sin ligar o con mellas, dejando solo el ADN circular monocatenario deseado que comprende una copia del ADN metilado, la secuencia de identificador único, y una secuencia de identificador de paciente opcional. Este producto circular es adecuado para etapas adicionales opcionales y secuenciación posterior.

Nota 4. Si la sonda oligonucleotídica también comprende sitios de unión de cebador opcionales (es decir, sitios de unión de cebador universales), para la amplificación por PCR, seguido de la identificación posterior de las dianas, podría ser adecuado el uso de secuenciación de nueva generación, ensayos TaqMan, ensayos UniTaq, ensayos de PCR en tiempo real, PCR digital, micromatriz, hibridación, u otro método de detección.

En la variación 3.5, se usan una polimerasa y una ligasa para formar un círculo cerrado covalentemente que contiene una secuencia de identificador único, una secuencia de identificador de paciente opcional, y un sitio de unión de cebador opcional. Esto también puede conseguirse usando solo una ligasa.

Variación 3.6: (véanse, por ejemplo, las Figuras 60 y 61). En esta variación, los conectores cortos que contienen 5-metil C se ligan a los extremos del ADN. A continuación el ADN se trata con bisulfito, lo que hace que las cadenas no sean complementarias para que se vuelvan monocatenarias. Algunos ciclos de amplificación por PCR generan productos que ahora están sin metilar en los sitios de HphI. A continuación estos productos se escinden con HphI. Solo los amplicones de PCR que contienen sitios de "HphI" adyacentes (GGCGA, o GGTGA) que estaban sin metilar en la diana original generarán fragmentos que ahora son competentes para ligamiento en ambos extremos. Para capturar las regiones sin metilar deseadas, un par de oligonucleótidos parcialmente bicatenarios que comprende una primera sonda oligonucleotídica con una región de sonda en el extremo 5' complementaria a la secuencia del lado 5' de la diana, una secuencia de unión de cebador opcional, una secuencia de identificador de paciente opcional, y una región de sonda en el extremo 3' complementaria a la secuencia del lado 3' de la diana, y una segunda sonda oligonucleotídica que comprende una región en el extremo 5' complementaria a la primera cadena, una secuencia de identificador único y una región en el extremo 3' complementaria a la primera cadena, se hibridan con la diana. La adición de ligasa permite el ligamiento del extremo 3' de la diana al extremo 5' de la segunda sonda oligonucleotídica, y el extremo 5' de la diana al extremo 3' de la segunda sonda oligonucleotídica, para formar un producto circular que contiene una secuencia de identificador único, una secuencia de identificador de paciente opcional, y un sitio de unión de cebador opcional. Los productos sin ligar se eliminan mediante digestión con exonucleasa. Este producto circular es adecuado para etapas adicionales opcionales y secuenciación posterior. Al insistir en que la endonucleasa de restricción genere tanto el OH 3' como el fosfato 5', esto evita una señal falsa, y también debería eliminar cualquier señal de ligamiento no específica. De ese modo, cualquier fragmento raro de ADN genómico que sea monocatenario después de la purificación, o que no se haya escindido no formará un sustrato productivo y será destruido en la etapa de tratamiento con exonucleasa.

3.6. a. Ligar en conectores que contienen 5-metil C para retener la secuencia después de la conversión con bisulfito. Los extremos de diana se reparan con polimerasa T4 y quinasa T4, y posteriormente se genera una protuberancia A 3' de una sola base con Klenow (exo-) y dATP. Los conectores tienen una protuberancia T 3' de una sola base, de modo que el ligamiento usando ligasa T4 añada conectores en ambos extremos del fragmento. Incubar el ADNcf con bisulfito, que convierte la C regular, pero no la metil-C, en U. El tratamiento con bisulfito convierte las cadenas superior e inferior de manera diferente, de modo que, después del tratamiento, las cadenas ya no serán complementarias entre sí y se fusionarán por separado.

3.6. b. Añadir cebadores, polimerasa Taq y los dNTP y realizar algunos ciclos de PCR para generar productos que ahora están sin metilar en los sitios de HphI restantes.

3.6. c. Añadir HphI para escindir los productos que contienen tales sitios. Solo los amplicones de PCR que contienen sitios de HphI adyacentes (GGCGA o GGTGA) que estaban sin metilar en la diana original generarán fragmentos que están sin bloquear (es decir, competentes para ligamiento con los conectores) en ambos extremos, cuando se escinden con HphI.

3.6. d. Desnaturalizar el ADN diana (94 °C, 1 minuto) en presencia de pares de oligonucleótidos parcialmente bicatenarios (que comprenden una primera sonda oligonucleotídica con una región de sonda en el extremo 5' complementaria a la secuencia del lado 5' de la diana, una secuencia de unión de cebador opcional, una secuencia de identificador de paciente opcional, y una región de sonda en el extremo 3' complementaria a la secuencia del lado 3' de la diana, y una segunda sonda oligonucleotídica que comprende una región en el extremo 5' complementaria a la primera cadena, una secuencia de identificador único y una región en el extremo 3' complementaria a la primera cadena), y permitir que los oligonucleótidos se hibriden con sus regiones complementarias en los fragmentos deseados mediante enfriamiento a una temperatura deseada (por ejemplo, 50°-60 °C durante 2 horas). Se añade una ligasa termoestable (preferentemente de la cepa AK16D) para permitir el ligamiento a 60 °C para generar productos circulares.

3.6. e. Añadir Exonucleasa I (digiere el ADN monocatenario en la dirección 3'^-5'), y Exonucleasa III (digiere el ADN bicatenario en la dirección 3'^5'), para digerir todos los productos sin ligar o con mellas, dejando solo el ADN circular monocatenario deseado que comprende una copia del ADN metilado, la secuencia de identificador único, y una secuencia de identificador de paciente opcional. Este producto circular es adecuado para etapas adicionales opcionales y secuenciación posterior.

Nota 2. Si la sonda oligonucleotídica también comprende sitios de unión de cebador opcionales (es decir, sitios de unión de cebador universales), para la amplificación por PCR, seguido de la identificación posterior de las dianas, podría ser adecuado el uso de secuenciación de nueva generación, ensayos TaqMan, ensayos UniTaq, ensayos de PCR en tiempo real, PCR digital, micromatriz, hibridación, u otro método de detección.

Base de datos de estado de metilación en sitios de restricción de HphI adyacentes

La base de datos de TCGA actual contiene información sobre el estado de metilación de aproximadamente 450.000 sitios CpG en el genoma humano, tanto para tejido normal como para tejido tumoral de muchos sitios tisulares diferentes. Sin embargo, no cubre todo el estado de no metilación de sitios de AciI adyacentes, ni podría distinguir que ambos sitios estén metilados en el mismo tramo de ADN genómico.

Por lo tanto, para que el método de ensayo mencionado anteriormente sea el más útil, podría ser útil crear una base de datos del estado de metilación en sitios de restricción de HphI adyacentes de la misma orientación (GGCGA convertido en GGTGA). Este enfoque también incluirá sitios de restricción de HphI adyacentes de la otra orientación (TCACC y TCGCC), ya que serán GGTGA en la cadena opuesta después de la conversión con bisulfito. Un enfoque de ese tipo se ilustra en la Figura 62.

Visión general del enfoque: la idea es generar una genoteca de pequeños fragmentos que solo se podrían haber formado si ambos extremos del fragmento contuvieran GGCGA convertido (en GGTGA) que no estaban metilados en el ADN genómico original. La idea aprovecha una propiedad única de la secuencia de reconocimiento para HphI. La enzima escinde la secuencia de reconocimiento de 4,5 bases GGTGA en una orientación, y TCACC en la otra orientación. Si un sitio GGCGA sin metilar se trata con bisulfito, en la primera orientación, el sitio se convertirá en una secuencia de reconocimiento de HphI GGTGA. Después de algunos ciclos de amplificación por PCR, la 5-metil C se convierte en C, mientras que el U se convierte en T. Cuando se escinden con HphI, solo los sitios adyacentes sin metilar en la diana original crearán fragmentos que son competentes para ligamiento en ambos extremos 3' y 5'. Los fragmentos tienen conectores añadidos con secuencias de identificador único opcionales y secuencias de identificador de paciente opcionales que ahora son susceptibles de ligamiento para crear multímeros de fragmentos que a continuación serán sustratos para etapas adicionales y secuenciación posterior.

Variación 3.6.1: (véase, por ejemplo, la Figura 62). En esta variación, los conectores cortos que contienen 5-metil C se ligan a los extremos del ADN. A continuación, el ADN se trata con bisulfito, lo que hace que las cadenas no sean complementarias para que se vuelvan monocatenarias. Algunos ciclos de amplificación por PCR generan productos que ahora están sin metilar en los sitios de HphI. A continuación, estos productos se escinden con HphI. Solo los amplicones de PCR que contienen sitios de "HphI" adyacentes (GGCGA, o GGTGA) que estaban sin metilar en la diana original generarán fragmentos que ahora son competentes para ligamiento en ambos extremos. Para capturar las regiones deseadas, los oligonucleótidos que comprenden una región de sonda en el extremo 5' complementaria a la secuencia del lado 5' de la diana, una secuencia de identificador único, una secuencia de unión de cebador opcional, una secuencia de identificador de paciente opcional, y una región de sonda en el extremo 3' complementaria a la secuencia del lado 3' de la diana, se hibridan con la diana. La adición de ligasa y polimerasa que carecen de actividad de desplazamiento de cadena y actividad de nucleasa tanto 3^-5' como 5'^3', permite la extensión del extremo 3' de la diana sin metilar, seguido de ligamiento al extremo 5' de la diana para formar un producto circular que contiene una secuencia de identificador único, una secuencia de identificador de paciente opcional, y un sitio de unión de cebador opcional. Los productos sin ligar se eliminan por digestión con exonucleasa. Este producto circular es adecuado para etapas adicionales opcionales y secuenciación posterior.

Variación 3.6.1: (véase, por ejemplo, la Figura 62). Este enfoque muestra el modo en que descubrir la no metilación en sitios de "HphI" adyacentes (GGCGA o GGTGA) en todo el genoma. El material de partida puede ser ADN genómico intacto o ADNcf con una longitud media de aproximadamente 160 pb. Los conectores cortos que contienen un extremo 5' bloqueado en el extremo de no ligamiento, se ligan en los extremos del ADN. Tratar el a Dn con bisulfito, que convierte la C regular, pero no la metil-C, en U. Unos pocos ciclos de amplificación por PCR usando los dNTP sin metilar y cebadores bloqueados en el extremo 5' generan productos que ahora están sin metilar en los sitios de HphI restantes. A continuación, estos productos se escinden con HphI. Solo los amplicones de PCR que contienen sitios de HphI adyacentes (GGCGA y GGTGA) que estaban sin metilar en la diana original generarán fragmentos que están sin bloquear (es decir, competentes para ligamiento con los conectores) en ambos extremos, cuando se escinden con HphI. Los conectores que contienen una secuencia de identificador único opcional, y una secuencia de identificador de paciente opcional están ligados en estos extremos escindidos con HphI recién generados. Estos nuevos conectores contienen, en su lado de no ligamiento, el extremo 3' bloqueado, o una cadena principal que contiene tiofosfato (que se muestra como **** en la Figura 62). Después de la adición de una exonucleasa 3' bicatenaria (es decir, Exonucleasa III), los fragmentos que contienen el conector corto original en uno o ambos lados se digerirán y se volverán monocatenarios. Solo los fragmentos con el nuevo conector ligado a ambos lados permanecerán bicatenarios, ya que el grupo de bloqueo en el extremo 3' o los tiofosfatos inhiben la digestión con la exonucleasa 3'. Los extremos libres de los fragmentos restantes que contienen conector se vuelven competentes para ligamiento, ya sea mediante (i) fosforilación del extremo 5', (ii) retirada del grupo en el extremo 3' bloqueado, o (iii) uso de nucleasa 5', o cualquier combinación de las mismas. Las condiciones de ligamiento se diseñan para favorecer la multimerización, por ejemplo, mediante el uso de agentes de aglomeración (es decir, PEG al 20 %), y/o mediante la mezcla de dos conjuntos de productos de ligamiento, en donde la protuberancia del conector 5' no palindrómico del primer conjunto es complementaria a la protuberancia del conector 5' no palindrómico del segundo conjunto. Los productos de ligamiento comprenden secuencias de AciI adyacentes en la misma orientación (es decir, GCGG), originalmente metiladas en el ADN diana con una secuencia de identificador único y/o una secuencia de identificador de paciente opcionales. Este producto es adecuado para etapas adicionales opcionales y secuenciación posterior.

Protocolo detallado para la generación de una base de datos de estado de no metilación en sitios de restricción de "HphI" adyacentes:

3.6.1.a. Ligar los conectores que están bloqueados en el extremo 5' del extremo de no ligamiento. Los extremos de diana se reparan con polimerasa T4 y quinasa T4, y posteriormente se genera una protuberancia A 3' de una sola base con Klenow (exo-) y dATP. Los conectores tienen una protuberancia T 3' de una sola base, de modo que el ligamiento usando ligasa T4 añada conectores en ambos extremos del fragmento. Incubar el ADNcf con bisulfito, que convierte la C regular, pero no la metil-C, en U. El tratamiento con bisulfito convierte las cadenas superior e inferior de manera diferente, de modo que, después del tratamiento, las cadenas ya no serán complementarias entre sí y se fusionarán por separado.

3.6.1. b. Añadir cebadores bloqueados en el extremo 5', polimerasa Taq y los dNTP y realizar algunos ciclos de PCR para generar productos que ahora están sin metilar en los sitios de HphI restantes.

3.6.1. c. Añadir HphI para escindir los productos que contienen tales sitios. Solo los amplicones de PCR que contienen sitios de HphI adyacentes (GGCGA o g Gt GA) que estaban sin metilar en la diana original generarán fragmentos que están sin bloquear (es decir, competentes para ligamiento con los conectores) en ambos extremos, cuando se escinden con HphI. Los extremos de diana se reparan con polimerasa T4 y quinasa T4. Retirar los dNTP (a través de una columna de centrifugación) y volver a añadir solo dATP para generar una protuberancia A 3' de una sola base.

3.6.1. d. Usar ligasa T4, añadiendo conectores (que contengan una secuencia de identificador único opcional, y una secuencia de identificador de paciente opcional) con una protuberancia A 3' de una sola base en el extremo de ligamiento a la protuberancia A de una sola base de las secuencias diana escindidas y rellenadas. El lado 5' de no ligamiento del conector contiene una protuberancia 5' y, opcionalmente, no está fosforilado. El lado 3' de no ligamiento del conector contiene un grupo de bloqueo en el extremo 3' y/o tiofosfatos para inhibir la digestión con la exonucleasa 3'.

3.6.1. e. Añadir una exonucleasa 3' (es decir, Exonucleasa III) y digerir a 37 °C. Los fragmentos que contienen el conector corto original en uno o ambos lados se digerirán y se volverán monocatenarios. Solo los fragmentos con el nuevo conector ligado a ambos lados permanecerán bicatenarios. La exonucleasa también hará que los conectores se vuelvan monocatenarios. Opcionalmente, retirar los productos de digestión de los fragmentos deseados con una columna de centrifugación.

3.6.1.f. Los extremos libres de los fragmentos restantes que contienen conector se vuelven competentes para ligamiento, ya sea mediante (i) fosforilación del extremo 5' usando quinasa T4, (ii) retirada del grupo en el extremo 3' bloqueado, o (iii) uso de la actividad de nucleasa 5 '^3 ' de la polimerasa Taq para retirar por escisión la base solapante 5' de emparejamiento o la aleta, dejando un fosfato 5' competente para ligamiento, o cualquier combinación de los mismos. Las condiciones de ligamiento se diseñan para favorecer la multimerización. Los productos de ligamiento comprenden multímeros de fragmentos diana con secuencias de AciI adyacentes originalmente metiladas en el ADN diana con una secuencia de identificador único y/o una secuencia de identificador de paciente opcionales. Este producto es adecuado para etapas adicionales opcionales y secuenciación posterior.

Ejemplo profético comparativo 4 - Cuantificación exacta de cambios en el número de copias específicos de tumor en ADN aislado de células tumorales circulantes

Los cambios en el número de copias de ADN tumoral pueden ser un fuerte indicador de resultados. En los últimos años, la mayoría de los trabajos sobre el número de copias se ha realizado en chips de SNP, en donde los enfoques bioinformáticos hacen un promedio de la señal en una región para determinar el número relativo de copias. Para cantidades bajas de células se usan enfoques de PCR digital para obtener un recuento exacto de las moléculas iniciales.

Visión general del enfoque: en general, los cambios en el número de copias se producen en grandes regiones del ADN, tales como los brazos cromosómicos. Dado que el número de células tumorales es muy bajo, la exactitud de las mediciones podría mejorarse interrogando simultáneamente múltiples regiones de un brazo cromosómico dado y añadiendo o haciendo el promedio de la señal resultante. Del mismo modo, en algunos tumores se amplifican genes específicos (es decir, Her2-neu, IGF2), que pueden predecir el resultado o guiar el tratamiento.

Además de los cambios en el número de copias, la pérdida de heterocigosis puede seguirse no solo mediante el recuento de cromosomas, sino también mediante la búsqueda de la pérdida tradicional de heterocigosis entre los SNP o marcadores polimórficos dentro de la región de interés. Los marcadores más heterogéneos están en secuencias repetitivas. En el presente documento se ilustran los conceptos que usan secuencias repetidas de tetranucleótidos, aunque también pueden considerarse secuencias repetidas de tri y dinucleótidos.

El protocolo detallado para la cuantificación de los cambios en el número de copias específicos de tumor en el ADN aislado de células tumorales circulantes se abordará en la siguiente sección que evalúa las mutaciones de las células tumorales circulantes, ya que el enfoque general es muy similar.

Ejemplo profético comparativo 5 - Detección de mutaciones en ADN aislado de células tumorales circulantes o ADNcf

Las células tumorales circulantes proporcionan la ventaja de concentrar el ADN que contiene las mutaciones, por lo que ya no es necesario encontrar mutaciones de bajo nivel en un exceso de secuencia de tipo natural. Sin embargo, dado que el número de moléculas de ADN de partida es bajo, es importante amplificar todas las regiones con exactitud y verificar que las mutaciones estén realmente presentes.

Visión general del enfoque: aquí, el enfoque es similar al de encontrar mutaciones puntuales comunes conocidas o al de secuenciar múltiples exones, como se ha explicado anteriormente. Sin embargo, cuando se trata de cantidades bajas de ADN entrante, existe la posibilidad de un error de polimerasa. Este problema se soluciona usando secuenciación circular o secuenciación SMRT.

Dado que el ADN se obtiene de unas pocas células tumorales capturadas, si estuviera presente una mutación, debería estar presente en algunas, si no en la mayoría de las células capturadas.

A continuación, se describe un protocolo detallado para la detección de mutaciones en el ADN aislado de las células tumorales circulantes, incluyendo la cuantificación del número de copias, ya que el enfoque es muy similar.

Variación 5.1: (véase, por ejemplo, la Figura 63). Aquí, la idea general es convertir todo el ADNcf o ADN de CTC en círculos monocatenarios, en donde cada fragmento contiene una secuencia de identificador único, una secuencia de identificador de paciente opcional, y una secuencia de unión de cebador opcional. Una vez que se ha producido esa conversión, los círculos son ahora adecuados para secuenciación pura, captura específica de secuencia de las dianas deseadas usando sondas biotinadas o para amplificación por círculo rodante y aumento de la captura de las dianas deseadas usando sondas biotinadas.

En esta variación, el objetivo es capturar toda la secuencia de ADN diana y no diana, sin usar sondas para unirse a la diana. Los conectores se ligan a la diana de ADN (ADNcf con una longitud media de aproximadamente 160 bases). Para capturar todas las secuencias, las sondas oligonucleotídicas que comprenden una secuencia en el extremo 5' complementaria al extremo 5' del conector, una secuencia de identificador único, una secuencia de identificador de paciente opcional, una secuencia de unión de cebador opcional, y una secuencia complementaria al extremo 3' del conector, se hibridan con la diana. El oligonucleótido puede contener un grupo de bloqueo opcional en un extremo (se muestra el extremo 5'). La adición de una polimerasa permite la extensión del extremo 3' del oligonucleótido en la diana, así como la extensión del conector en el extremo 3' a través de la secuencia de identificador único, la secuencia de unión de cebador opcional, y la secuencia de identificador de paciente opcional hasta que sea adyacente al conector en el extremo 5' en la diana.

El extremo 5' del conector puede diseñarse para que sea ligeramente más largo, de modo que una vez que la polimerasa extiende el conector en el extremo 3', no se extienda a través de la secuencia complementaria del conector en el extremo 5' hasta que llegue a la parte de la diana en el extremo 5' que se hibrida con la región de sonda en el extremo 5'.

Esta variación requiere que la sonda oligonucleotídica contenga secuencias complementarias a ambas cadenas del conector en los extremos 3' y 5', estando dichas secuencias separadas solo por aproximadamente 20-40 bases. Dado que las secuencias son complementarias a las cadenas de conector, que a su vez son complementarias entre sí, es importante evitar que las dos secuencias dentro de la sonda oligonucleotídica formen solo una horquilla interna con un bucle de 20-40 bases. Una solución es ligar los conectores que contienen una burbuja interna, de modo que los dos conectores retengan el carácter bicatenario a la baja temperatura usada para el ligamiento del conector (16 °C o incluso 4 °C con ligasa T4). Además el conector en el extremo 5' puede diseñarse para que sea más largo que el conector en el extremo 3'. Por último, las regiones de complementariedad dentro del conector pueden diseñarse para tener desemparejamientos sutiles (es decir, G:T y T:G) que son más desestabilizadores en la sonda oligonucleotídica complementaria (es decir, C:A y A:C), de modo que sea menos probable que la sonda oligonucleotídica forme la horquilla interna a la temperatura de hibridación global (es decir, 40-50 °C).

La extensión del extremo 3' del oligonucleótido en la diana potencia la asociación de la sonda a la diana y, de ese modo, aumenta la capacidad del extremo 3' del conector de hibridarse correctamente con su complemento y extenderse con la polimerasa. La actividad de escisión por nucleasa 5 '^3 ' de la polimerasa (o nucleasa Fen) escinde una base solapante 5' de emparejamiento del conector en el extremo 5', dejando un fosfato 5' competente para ligamiento en el conector. La polimerasa también extiende el oligonucleótido en la diana, y no escinde el grupo de bloqueo en el extremo 5' del oligonucleótido.

Una ligasa sella covalentemente los extremos 3' extendidos al fosfato 5' competente para ligamiento para crear productos de ligamiento circulares. El grupo de bloqueo evita la circularización de la sonda oligonucleotídica. La adición opcional de Uracil-ADN glicosilasa (UDG) y Formamidopirimidina-ADN glicosilasa (Fpg, también conocida como 8-oxoguanina ADN glicosilasa, que actúa como una N-glicosilasa y como una AP-liasa) puede usarse para realizar mellas en dianas que contienen bases dañadas. A continuación, se añaden una o varias exonucleasas para digerir todos los productos no ligados o con mellas dejando solo el ADN circular monocatenario deseado que comprende el ADN diana original con una secuencia de identificador único. Este producto es adecuado para la captura específica de secuencia de las dianas deseadas usando sondas biotinadas, combinado con amplificación por círculo rodante y secuenciación circular, o para secuenciación SMRT directa.

El desafío aquí es evitar que la polimerasa extienda el conector 3' de modo que destruya el conector en el extremo 5' sin una etapa de ligamiento (es decir, traducción de mellas). Esto puede conseguirse incorporando enlaces tiofosfato en las posiciones 2a y 3a desde el extremo fosfato 5' (que se liberarán por la actividad de nucleasa 5 '^3 ' de la polimerasa). Para minimizar el desplazamiento de la polimerasa de esas bases a medida que extiende una base en exceso (lo que podría hacer imposible el ligamiento al cebador corriente abajo), las bases de la diana en la unión de ligamiento podrían ser preferentemente ricas en AT en el lado 3', y ricas en GC en el lado 5'.

Un enfoque alternativo es usar un conector en el extremo 5' que contenga un sitio apurínico (AP) en la posición adyacente al fosfato 5' deseado. Este fosfato 5' se libera usando una EndolII termoestable (tal como Tma EndolII). Esta enzima escinde los sitios de AP dejando un fosfato 5' cuando el cebador está unido a la diana. La endonucleasa también escinde el cebador monocatenario, pero con menor eficacia y, de ese modo, el cebador hibridado con el molde podría ser el sustrato preferente. Cuando se usa EndoIII termoestable, la polimerasa de PCR usada podría carecer de la actividad de exonucleasa 5'^3'.

Como se ha mencionado anteriormente, el problema de la traducción de mellas también puede minimizarse usando una mezcla de polimerasas, con y sin actividad de escisión por nucleasa 5 '^3 ' (por ejemplo, en una relación de 1:20) en condiciones de extensión distributiva en presencia de ligasa, de modo que la mayor parte de la extensión se realice con polimerasa sin actividad de nucleasa hasta que se requiera polimerasa con actividad nucleasa para crear la unión competente para ligamiento, seguida de disociación por polimerasa, y un suceso de ligamiento para generar el producto de ligamiento circular deseado.

Protocolo detallado para la cuantificación exacta de cambios en el número de copias específicos de tumor o la detección de mutaciones en genes conocidos (por ejemplo, Braf, K-ras, p53) en ADN aislado de células tumorales circulantes o ADNcf:

5.1. a. Comenzando con ADNcf o ADN genómico aislado de CTC (cortado a aproximadamente 150 pb), reparar los extremos con polimerasa T4 y quinasa T4, y posteriormente se añade una protuberancia A 3' de una sola base con Klenow (exo-) y dATP. Los conectores tienen una protuberancia T 3' de una sola base, de modo que el ligamiento usando ligasa T4 a 4 °C añade conectores en ambos extremos del fragmento. Opcionalmente, purificar el ADN diana del conector sin ligar.

5.1. b. Desnaturalizar los conectores que contienen ADN diana en ambos extremos (94 °C, 1 minuto) en presencia de sondas oligonucleotídicas (que comprenden una secuencia en el extremo 5' complementaria al extremo 5' del conector, una secuencia de identificador único, una secuencia de identificador de paciente opcional, una secuencia de unión de cebador opcional, y una secuencia complementaria al extremo 3' del conector), y permitir que las sondas oligonucleotídicas se hibriden con sus regiones complementarias en los fragmentos deseados enfriando a una temperatura deseada (por ejemplo, 40-50 °C durante 30 min). Las sondas oligonucleotídicas pueden contener un grupo de bloqueo opcional en el extremo 5'. Se añaden una polimerasa Taq y/o KlenTaq (polimerasa Taq que carece de actividad de nucleasa), y una ligasa termoestable (preferentemente de la cepa AK16D), y los dNTP después de la etapa de hibridación, o al comienzo del procedimiento. Permitir la extensión y el ligamiento a la temperatura de hibridación y, opcionalmente, aumentar la temperatura (por ejemplo, 60 °C) para garantizar la finalización de la extensión y el ligamiento, para generar productos circulares.

5.1. c. Añadir Exonucleasa I (digiere el ADN monocatenario en la dirección 3'^-5'), y Exonucleasa III (digiere el ADN bicatenario en la dirección 3'^5'), para digerir todos los productos sin ligar o con mellas, dejando solo el ADN monocatenario circular deseado que comprende el ADN diana original, la secuencia del conector, la secuencia de identificador único, una secuencia de unión de cebador opcional, y una secuencia de identificador de paciente opcional. Este producto es adecuado para la captura específica de secuencia de las dianas deseadas usando sondas biotinadas, o para la amplificación por círculo rodante (usando un cebador complementario a la secuencia de unión de cebador con la polimerasa phi-29) para crear repeticiones en tándem de la secuencia deseada, seguido de una captura potenciada de las dianas deseadas usando sondas biotinadas. Esto puede ir seguido de la identificación de las dianas usando secuenciación de nueva generación o, alternativamente, secuenciación SMRT directa en el molde cerrado covalentemente, usando la secuencia del conector o la secuencia de unión de cebador opcional como un sitio de unión de cebador.

Nota 1: el oligonucleótido puede contener un grupo de bloqueo opcional en el lado 5' para interferir con la posterior actividad de nucleasa 5 '^3 ' de la polimerasa, de modo que la sonda oligonucleotídica no se circularice.

Nota 3: el conector en el extremo 5' puede sintetizarse para que contenga enlaces tiofosfato en las posiciones 2a y 3a desde el extremo fosfato 5' (que se liberarán por la actividad de nucleasa 5 '^3 ' de la polimerasa). Para minimizar el desplazamiento de la polimerasa de esas bases a medida que extiende una base en exceso (lo que podría hacer imposible el ligamiento al cebador corriente abajo), las bases de la diana en la unión de ligamiento podrían ser preferentemente ricas en AT en el lado 3', y ricas en GC en el lado 5'.

Nota 4: cuando se usa polimerasa KlenTaq (polimerasa Taq sin actividad de escisión por nucleasa 5'^-3'), el conector en el extremo 5' puede sintetizarse para que contenga un sitio apurínico (AP) en la posición adyacente al fosfato 5' deseado. Este fosfato 5' se libera usando una EndoIII termoestable (tal como Tima EndoIII). Esta enzima escinde los sitios de AP dejando un fosfato 5' cuando el cebador está unido a la diana. La endonucleasa también escinde el cebador monocatenario, pero con menor eficacia y, de ese modo, el cebador hibridado con el molde podría ser el sustrato preferente.

Nota 5: cuando se usa polimerasa KlenTaq (polimerasa Taq sin actividad de escisión por nucleasa 5'^3'), el conector en el extremo 5' puede sintetizarse para que contenga un fosfato 5'. Alternativamente, el fosfato 5' puede añadirse usando quinasa T4 antes del ligamiento al ADN diana, o después de esa etapa de ligamiento.

Nota 7: la captura de copias repetidas en tándem de la diana (generadas mediante amplificación por círculo rodante) proporciona la ventaja única de unión multivalente para potenciar la captura de la diana correcta. Esto permite usar condiciones de hibridación/captura más rigurosas, lo que da como resultado mayores eficacias de captura y menos captura de secuencias no deseadas. Este enfoque también puede usarse para capturar todas las dianas que contienen secuencias repetitivas (es decir, repetición de tetranucleótidos AGAT), lo que permite evaluar la pérdida de heterocigosis, la variación en el número de copias, el haplotipado, el establecimiento de paternidad y otras aplicaciones.

Nota 8: el identificador de secuencia único garantiza que, incluso después de la amplificación por círculo rodante u otras etapas de selección/amplificación, cada secuencia diana original pueda evaluarse de manera única, lo que permite una cuantificación exacta del número de copias originales de cada diana.

Nota 9: la secuencia de identificador único puede añadirse a ambos lados del conector. Si no se añade una base extra al ADN diana (es decir, omitiendo la etapa de Klenow), entonces se usa un ligamiento de extremo romo. Para evitar el ligamiento de conector a conector, el extremo romo del conector está sin fosforilar. Algunos ejemplos de conectores que contienen identificadores únicos y extremos romos los proporcionan los oligonucleótidos iSx-201-MdAdT (cadena superior), e iSx-202-MdLgAdB-bk (cadena inferior) (véase la Tabla 1). La cadena superior es más larga, creando una protuberancia monocatenaria en el extremo 5' en el lado de no ligamiento. La cadena inferior tiene un OH 5' y, opcionalmente, contiene un grupo de bloqueo en el extremo 3' para evitar la extensión, así como grupos 5-nitroindol internos para actuar como bases universales cuando se realiza el emparejamiento con las secuencias de identificador único de la cadena superior. Después del ligamiento del conector de extremo romo, añadiendo secuencias únicas a los extremos 5' de la diana de ADN bicatenario, esas secuencias se copian extendiendo el extremo 3' con polimerasa. Opcionalmente, la cadena superior contiene bases dU para la posterior escisión con UDG y FPG para liberar un fosfato 5', adecuado para ligamiento y circularización en etapas posteriores. El conector iSx-201-MdAdT (véase la Tabla 1) pueden contener grupos tiofosfato opcionales adyacentes al fosfato el extremo 5' recién liberado para evitar la traducción de mellas y facilitar la circularización de las dianas con los extremos de conector.

Nota 10: cuando se diseñan oligonucleótidos para su uso con secuencias de conector más largas, que comprenden secuencias de "código de barras" o "indexación" para su uso con instrumentos comerciales, puede ser necesario ensamblar el oligonucleótido usando PCR, amplificación de desplazamiento de cadena, o una combinación de las mismas. Durante la PCR, el uso de dUTP en lugar de TTP incorpora uracilo, adecuado para su posterior escisión con UDG. El cebador de cadena inversa puede estar fosforilado, permitiendo su digestión usando exonucleasa lambda o una exonucleasa 5 '^3 ' similar. Puede añadirse una secuencia de dA30 al extremo 5' del cebador directo, lo que permite la amplificación por desplazamiento de cadena. Algunos ejemplos de oligonucleótidos para el ensamblaje de una secuencia complementaria inversa, que son adecuados para su uso con los conectores mencionados anteriormente, son: iSx-204-bkA30-Lk-F2, iSx-205-r503-F3, iSx-206-d701-R4, e iSx-207-Lk-R5 (véase la Tabla 1).

Nota 11: en otra variación para agregar la secuencia de identificador único que puede añadirse en ambos lados del conector, una cadena también comprende una secuencia de "código de barras" o "índice" para su uso con instrumentos comerciales (véase, por ejemplo, la Figura 64). Al dividir la región larga entre el conector y el oligonucleótido de hibridación, las diferentes secuencias pueden sintetizarse directamente y mantenerse con una longitud de aproximadamente 100 bases. Algunos ejemplos de conectores que contienen secuencias de índice o código de barras, identificadores únicos y extremos romos los proporcionan los oligonucleótidos iSx-211-r702-LgAdT (cadena superior), e iSx-202-MdLgAdB-bk (cadena inferior, igual que anteriormente) (véase la Tabla 1). La cadena superior es considerablemente más larga, creando una protuberancia monocatenaria en el extremo 5' en el lado de no ligamiento. La cadena inferior tiene un OH 5' y, opcionalmente, contiene un grupo de bloqueo en el extremo 3' para evitar la extensión, así como grupos 5-nitroindol internos para actuar como bases universales cuando se realiza el emparejamiento con las secuencias de identificador único de la cadena superior. Después del ligamiento del conector de extremo romo, añadiendo secuencias únicas a los extremos 5' de la diana de ADN bicatenario, esas secuencias se copian extendiendo el extremo 3' con polimerasa. Opcionalmente, la cadena superior contiene bases dU para la posterior escisión con UDG y FPG para liberar un fosfato 5', adecuado para ligamiento y circularización en etapas posteriores. El oligonucleótido puente, iSx-212-r503-R4 (véase la Tabla 1), se hibrida con el conector que contiene fosfato 5' escindido, así como el extremo 3' extendido largo, permitiendo la extensión con polimerasa y la circularización con ligasa.

Nota 12: con los productos mencionados anteriormente generados usando los diseños de cebadores y conectores mencionados anteriormente, después de la amplificación por agrupamiento o con perlas, o captura dentro de un pocillo, dirección, o superficie de una celda de flujo en un instrumento comercial, para iniciar reacciones de secuenciación, pueden usarse los siguientes cebadores: (i) iLx-003-PEsqP1, cebador de secuenciación de extremo emparejado 1; (ii) iLx-004-BrCdR1, cebador de indexación, lectura de código de barras 1; (iii) iLx-001-P5-BrCdR2, lectura de código de barras 2; y (iv) iLx-005-PEsqP2, cebador de secuenciación de extremo emparejado 2 (las secuencias de cebador se proporcionan en la Tabla 1 mostrada posteriormente).

El procedimiento anterior usa conectores con un OH 5'. La variación 5.2 usa conectores con un fosfato 5' para evitar algunos problemas potenciales asociados al uso de polimerasa con una actividad de nucleasa 5— 3' (véase, por ejemplo, la Figura 63).

5.2. a. Comenzando con ADNcf o ADN genómico aislado de las CTC, (cortado a aproximadamente 150 pb), reparar los extremos con polimerasa T4 y quinasa T4, y posteriormente se añade una protuberancia A 3' de una sola base con Klenow (exo-) y dATP. Los conectores tienen una protuberancia T 3' de una sola base, de modo que el ligamiento usando ligasa T4 a 4 °C añade conectores en ambos extremos del fragmento. El conector en el extremo 5' contiene un grupo fosfato (añadido opcionalmente usando quinasa T4).

5.2. b. Desnaturalizar los conectores que contienen ADN diana en ambos extremos (94 °C, 1 minuto) en presencia de sondas oligonucleotídicas (que comprenden una secuencia en el extremo 5' complementaria al extremo 5' del conector, una secuencia de identificador único, una secuencia de identificador de paciente opcional, una secuencia de unión de cebador opcional, y una secuencia complementaria al extremo 3' del conector), y permitir que las sondas oligonucleotídicas se hibriden con sus regiones complementarias en los fragmentos deseados enfriando a una temperatura deseada (por ejemplo, 40-50 °C durante 30 min). La sonda oligonucleotídica puede contener un grupo de bloqueo opcional en el extremo 5'. Se añaden KlenTaq (polimerasa Taq que carece de actividad de nucleasa), y ligasa termoestable (preferentemente de la cepa AK16D), y los dNTP después de la etapa de hibridación, o al comienzo del procedimiento. Permitir la extensión y el ligamiento a la temperatura de hibridación y, opcionalmente, aumentar la temperatura (por ejemplo, 60 °C) para garantizar la finalización de la extensión y el ligamiento, para generar productos circulares.

5.2. c. Añadir Exonucleasa I (digiere el ADN monocatenario en la dirección 3'—^5'), y Exonucleasa III (digiere el ADN bicatenario en la dirección 3— 5'), para digerir todos los productos sin ligar o con mellas, dejando solo el ADN monocatenario circular deseado que comprende el ADN diana original, la secuencia del conector, la secuencia de identificador único, una secuencia de unión de cebador opcional, y una secuencia de identificador de paciente opcional. Este producto es adecuado para la captura específica de secuencia de las dianas deseadas usando sondas biotinadas, o para la amplificación por círculo rodante (usando un cebador complementario a la secuencia de unión de cebador con la polimerasa phi-29) para crear repeticiones en tándem de la secuencia deseada, seguido de una captura potenciada de las dianas deseadas usando sondas biotinadas. Esto puede ir seguido de la identificación de las dianas usando secuenciación de nueva generación o, alternativamente, secuenciación SMRT directa en el molde cerrado covalentemente, usando la secuencia del conector o la secuencia de unión de cebador opcional como un sitio de unión de cebador.

Nota 1: el oligonucleótido puede contener un grupo de bloqueo opcional en el lado 5', o un OH 5', de modo que la sonda oligonucleotídica no se circularice.

Nota 2: los conectores pueden sintetizarse con fosfato 5', o el fosfato puede añadirse usando quinasa T4.

Nota 3: la captura de copias repetidas en tándem de la diana (generadas mediante amplificación por círculo rodante) proporciona la ventaja única de unión multivalente para potenciar la captura de la diana correcta. Esto permite usar condiciones de hibridación/captura más rigurosas, lo que da como resultado mayores eficacias de captura y menos captura de secuencias no deseadas. Este enfoque también puede usarse para capturar todas las dianas que contienen secuencias repetitivas (es decir, repetición de tetranucleótidos AGAT), lo que permite evaluar la pérdida de heterocigosis, la variación en el número de copias, el haplotipado, el establecimiento de paternidad y otras aplicaciones.

Nota 4: el identificador de secuencia único garantiza que, incluso después de la amplificación por círculo rodante u otras etapas de selección/amplificación, cada secuencia diana original pueda evaluarse de manera única, lo que permite una cuantificación exacta del número de copias originales de cada diana.

Nota 5: algunos ejemplos de conectores y oligonucleótidos complementarios para facilitar la circularización son: iSx-220-d503-AdT1, iSx-221-pd707-AdB2, e iSx-222-Lk-uRC1, respectivamente (véase la Tabla 1). El conector iSx-220-d503-AdT1 (véase la Tabla 1) puede contener grupos tiofosfato opcionales en las posiciones 2a y 3a desde el extremo 5' para evitar la traducción de mellas y facilitar la circularización de las dianas con los extremos de conector.

Los enfoques que se describen en las Figuras 64 y 65 usan conectores universales para capturar y circularizar el ADN genómico total y, a continuación, realizar etapas posteriores, tales como captura de las dianas deseadas usando sondas biotinadas para seleccionar las dianas para el análisis de secuencias. Las sondas biotinadas se capturan en perlas antes de la hibridación, o después de la hibridación, por lo que, aunque en el segundo caso la etapa de hibridación puede ser líquida, en última instancia hay un etapa de líquido a sólido, y estas etapas pueden dar como resultado rendimientos menores o pérdidas de fragmentos.

La variación 5.3 describe un enfoque alternativo, en donde la etapa de captura se produce en líquido, usando sondas diseñadas para hibridar cerca de o adyacentes entre sí con la diana, y a continuación se crea una "plataforma de aterrizaje" para que los conectores en los extremos de la diana se hibriden, se extiendan y se liguen para crear la diana o dianas circulares cerradas covalentemente. Este enfoque puede ser particularmente útil cuando se seleccionan dianas que contienen ADN repetitivo.

5.3. a. Comenzando con ADNcf o ADN genómico aislado de CTC (cortado a aproximadamente 150 pb), reparar los extremos con polimerasa T4 y quinasa T4, y posteriormente se añade una protuberancia A 3' de una sola base con Klenow (exo-) y dATP. Los conectores tienen una protuberancia T 3' de una sola base, de modo que el ligamiento usando ligasa T4 a 4 °C añade conectores en ambos extremos del fragmento. Los conectores pueden sintetizarse con fosfato 5', o el fosfato puede añadirse usando quinasa T4. Opcionalmente, purificar el ADN diana del conector sin ligar.

5.3. b. Desnaturalizar los conectores que contienen ADN diana en ambos extremos (94 °C, 1 minuto) en presencia de sondas oligonucleotídicas (que comprenden una secuencia en el extremo 5' complementaria a una parte única o repetitiva (es decir, repetición de AGAT) de la diana, una región espaciadora opcional, una secuencia complementaria al extremo 5' del conector, una secuencia de identificador único, una secuencia de identificador de paciente opcional, una secuencia de unión de cebador opcional, una región espaciadora opcional, una secuencia complementaria al extremo 3' del conector, y una secuencia en el extremo 3' complementaria a una parte única o repetitiva (es decir, repetición de AGAT) de la diana, y adyacente a la secuencia en el extremo 5' complementaria a la diana), y permitir que los oligonucleótidos se hibriden con sus regiones complementarias en los fragmentos deseados mediante enfriamiento a una temperatura deseada (por ejemplo, 50 °C durante 2 horas). El oligonucleótido puede contener un grupo de bloqueo opcional en el lado 5'. Se añaden polimerasa Taq y/o KlenTaq (polimerasa Taq que carece de actividad de nucleasa), y ligasa termoestable (preferentemente de la cepa AK16D), y los dNTP después de la etapa de hibridación, o al comienzo del procedimiento. En el caso en el que la secuencia del conector tenga un fosfato 5', KlenTaq extiende el extremo 3' hasta que sea directamente adyacente al extremo 5' competente para ligamiento (lado izquierdo de la Figura 70). En el caso en el que la secuencia del conector tenga un OH 5', la actividad de nucleasa 5 '^3 ' de la polimerasa escinde la base solapante 5' de emparejamiento para crear un fosfato 5' competente para ligamiento (lado derecho de la Figura 70). Permitir la extensión y el ligamiento a la temperatura de hibridación y, opcionalmente, aumentar la temperatura (por ejemplo, 60 °C) para garantizar la finalización de la extensión y el ligamiento, para generar productos circulares.

5.3. c. Opcionalmente, escindir la sonda oligonucleotídica en un enlace escindible (por ejemplo, U escindido usando UDG y endonucleasa AP). Añadir Exonucleasa I (digiere el ADN monocatenario en la dirección 3'^5'), y Exonucleasa III (digiere el ADN bicatenario en la dirección 3'^5'), para digerir todos los productos sin ligar o con mellas, dejando solo el ADN monocatenario circular deseado que comprende el ADN diana original, la secuencia del conector, la secuencia de identificador único, una secuencia de unión de cebador opcional, y una secuencia de identificador de paciente opcional. Este producto es adecuado para la captura específica de secuencia de las dianas deseadas usando sondas biotinadas, o para la amplificación por círculo rodante (usando un cebador complementario a la secuencia de unión de cebador con la polimerasa phi-29) para crear repeticiones en tándem de la secuencia deseada, seguido de una captura potenciada de las dianas deseadas usando sondas biotinadas. Esto puede ir seguido de la identificación de las dianas usando secuenciación de nueva generación o, alternativamente, secuenciación SMRT directa en el molde cerrado covalentemente, usando la secuencia del conector o la secuencia de unión de cebador opcional como un sitio de unión de cebador.

Nota 4: cuando se usa la polimerasa KlenTaq (polimerasa Taq sin actividad de escisión por nucleasa 5'^-3'), el conector en el extremo 5' puede sintetizarse para que contenga un sitio apurínico (AP) en la posición adyacente al fosfato 5' deseado. Este fosfato 5' se libera usando una EndolII termoestable (tal como Tma EndolII). Esta enzima escinde los sitios de AP dejando un fosfato 5' cuando el cebador está unido a la diana. La endonucleasa también escinde el cebador monocatenario, pero con menor eficacia y, de ese modo, el cebador hibridado con el molde podría ser el sustrato preferente.

Nota 5: cuando se usa la polimerasa KlenTaq (polimerasa Taq sin actividad de escisión por nucleasa 5'^3'), el conector en el extremo 5' puede sintetizarse para que contenga un fosfato 5'. Alternativamente, el fosfato 5' puede añadirse usando quinasa T4 antes del ligamiento al ADN diana, o después de esa etapa de ligamiento.

Nota 9: la secuencia de identificador único puede añadirse a ambos lados de los conectores que comprenden secuencias de "índice" o "código de barras", usando un ligamiento de protuberancia T de una sola base (véase, por ejemplo, la Figura 67). Reparar los extremos de la diana con polimerasa T4, fosforilar el extremo 5' con quinasa T4. Añadir una base A al extremo 3' de la diana usando el fragmento Klenow que carece de actividad de nucleasa 3'^5'. Ligar en conectores de "hueco" de 3 unidades con protuberancia T 3' usando la ligasa T4 a 30 °C. Usar el fragmento Klenow que carece de actividad de nucleasa 3 '^5 ' para llenar el hueco y ligar a una cadena pequeña de conector en presencia de ligasa T4. Opcionalmente, usar ADN polimerasa que carece de actividad de nucleasa 3 '^5 ' para llenar el hueco y ligar a una cadena pequeña de conector en presencia de ligasa T4. Algunos ejemplos de tales oligonucleótidos conectores de 3 unidades son: iSx-223-d504-AdT3, iSx-224-pSmAdT4, e iSx-225-pd708-N6AdB5 (véase la Tabla 1). El conector iSx-223-d504-AdT3 (véase la Tabla 1) puede contener grupos tiofosfato opcionales en las posiciones 2a y 3a desde el extremo 5' para evitar la traducción de mellas y facilitar la circularización de las dianas con los extremos de conector.

Nota 10: la secuencia de identificador único puede añadirse a ambos lados de los conectores que comprenden secuencias de "índice" o "código de barras", usando ligamiento de extremo romo. Reparar los extremos de la diana con polimerasa T4. Ligar en conectores de "hueco" de 3 unidades con fosfato 3' y protuberancia roma usando ligasa T4 a 30 °C. Usar el fragmento Klenow que carece de actividad de nucleasa 3 '^5 ' para llenar el hueco a 37 °C, y calentar a 50 °C para desnaturalizar el conector pequeño. Usar ADN polimerasa Taq (que carece de actividad de nucleasa 3'^5', pero con actividad de nucleasa 5 '^3 ') para llenar el hueco, y ligar a la diana con ligasa termoestable. Algunos ejemplos de tales oligonucleótidos conectores de 3 unidades son: iSx-226-d505-AdT6, iSx-227-SmAdT7p, e iSx-225-pd708-N6AdB5 (igual que anteriormente; véase la Tabla 1). El conector iSx-226-d505-AdT6 (véase la Tabla 1) puede contener grupos tiofosfato opcionales en las posiciones 2a y 3a desde el extremo 5' para evitar la traducción de mellas y facilitar la circularización de las dianas con los extremos de conector.

Nota 11: la secuencia de identificador único puede añadirse a ambos lados de los conectores que comprenden secuencias de "índice" o "código de barras", usando transcripción inversa. Reparar los extremos de la diana con polimerasa T4, y fosforilar el extremo 5' con quinasa T4 (véase, por ejemplo, la Figura 68). Añadir 3 bases C al extremo 3' de la diana usando transcriptasa inversa. Hibridar los pares de conectores en donde el primer conector tiene rGrG+G en el extremo 3' (+G es el símbolo para LNA, rG3), sitios de unión de cebador con identificador de paciente y único y fosfato 5', mientras que el segundo conector tiene sitios de unión de cebador con identificador de paciente. La transcriptasa inversa experimenta un cambio de cadena y copia un identificador único para llenar el hueco. Una ligasa sella covalentemente la diana extendida al segundo conector. Una RNasa H2 escinde las bases de ARN, liberando el OH 3' de rG3 (rGrG+G) en la primera secuencia de conector. Una polimerasa llena los huecos y la ligasa sella covalentemente los extremos extendidos. Algunos ejemplos de tales oligonucleótidos conectores son: iSx-228-d506-AdT83+G, e iSx-229-pd709-AdB6. El conector iSx-228-d506-AdT83+G (véase la Tabla 1) puede contener grupos tiofosfato opcionales en las posiciones 2a y 3a desde el extremo 5' para evitar la traducción de mellas y facilitar la circularización de las dianas con los extremos de conector.

Nota 12: una variación es usar oligonucleótidos que comprenden múltiples enlaces escindibles, de modo que después de la extensión/ligamiento y el tratamiento con el agente de escisión, se genere un cebador único en la cadena diana, adecuado para la amplificación por círculo rodante para generar productos de repetición en tándem. En la Tabla 1 mostrada posteriormente se muestran ejemplos de tales oligonucleótidos adecuados para generar los productos circulares que comprenden regiones diana de KRAS, BRAF, y los exones 5-8 de TP53 que contienen mutaciones en puntos calientes e incluyen: (i) oligonucleótidos de extensión/ligamiento de diana directos e inversos de KRAS (iSx-232-KRS-T32, iSx-233-KRS-B33); (ii) oligonucleótidos de extensión/ligamiento de diana directos e inversos de BRAF (iSx-234-BRF-T34, iSx-235-BRF-B35); (iii) oligonucleótidos de extensión/ligamiento de diana directos e inversos del exón 5 de TP53 (iSx-241-TP53e5-T41, iSx-242-TP53e5-B42, iSx-243-TP53e5-T43, iSx-244-TP53e5-B44); (iv) oligonucleótidos de extensión/ligamiento de diana directos e inversos del exón 6 de TP53 (iSx-245-TP53e6-T45, iSx-246-TP53e6-B46); (v) oligonucleótidos de extensión/ligamiento de diana directos e inversos del exón 7 de TP53 (iSx-247-TP53e7-T47, iSx-248-TP53e7-B48); y (vi) oligonucleótidos de extensión/ligamiento de diana directos e inversos del exón 8 de TP53 (iSx-249-TP53e8-T49, iSx-250-TP53e8-B50). Los oligonucleótidos de extensión/ligamiento mencionados anteriormente pueden contener grupos tiofosfato opcionales en las posiciones 2a y 3a desde el extremo 5' para evitar la traducción de mellas y facilitar la circularización en dianas complementarias.

Nota 13: alternativamente, después de generar los productos circulares que comprenden regiones diana de KRAS, BRAF, y los exones 5-8 de TP53 que contienen mutaciones en puntos calientes, estas regiones pueden someterse a amplificación por círculo rodante usando cebadores específicos de diana recién añadidos para generar productos de repetición en tándem. Estos productos pueden generarse antes o después de la captura de las dianas deseadas con oligonucleótidos específicos de diana sobre un soporte sólido (véase la nota 8 mostrada posteriormente). Los cebadores pueden contener una base nucleotídica escindible interna o un sitio abásico tal como 1',2'-Didesoxirribosa (espaciador d), lo que permite la incorporación de dUTP durante la amplificación por círculo rodante para protección contra la contaminación por arrastre. Algunos ejemplos de tales cebadores se muestran en la Tabla 1 mostrada posteriormente e incluyen los siguientes: (i) cebadores directos e inversos de KRAS (iSx-108-KRS-rcF26, iSx-109-KRS-rcR27); (ii) cebadores directos e inversos de BRAF (iSx-118-BRF-rcF26, iSx-119-BRF-rcR27); (iii) cebadores directos e inversos del exón 5 de TP53 (iSx-128-TP53e5-rcF66, iSx-129-TP53e5-rcR67; iSx-130-TP53e5-rcF68, iSx-131-TP53e5-rcR69); (iv) cebadores directos e inversos del exón 6 de TP53 (iSx-138-TP53e6-rcF76, iSx-139-TP53e6-rcR77); (v) cebadores directos e inversos del exón 7 de TP53 (iSx-148-TP53e7-rcF86, iSx-149-TP53e7-rcR87); y (vi) cebadores directos e inversos del exón 8 de TP53 (iSx-158-TP53e8-rcF96, iSx-159-TP53e8-rcR97).

Nota 14: después de generar los productos circulares que comprenden regiones diana de KRAS, BRAF, y los exones 5-8 de TP53 que contienen mutaciones en puntos calientes, y/o generar productos de repetición en tándem, estos productos pueden capturarse mediante hibridación con oligonucleótidos más largos, que contienen un grupo de captura adecuado para la captura posterior sobre un soporte sólido. Algunos ejemplos de tales oligonucleótidos de captura, que contienen grupos biotina adecuados para la captura a través de superficies sólidas revestidas con estreptavidina, se muestran en la Tabla 1 mostrada posteriormente e incluyen los siguientes: (i) oligonucleótidos de captura directa e inversa de KRAS (iSx-013-KRS-bcF1, iSx-014-KRS-bcR2); (ii) oligonucleótidos de captura directa e inversa de BRAF (iSx-020-BRF-bcF1, iSx-021-BRF-bcR2); (iii) oligonucleótidos de captura directa e inversa del exón 5 de TP53 (iSx-030-TP53e5-bcF1, iSx-031-TP53e5-bcR2; iSx-032-TP53e5-bcF3, iSx-033-TP53e5-bcR4); (iv) oligonucleótidos de captura directa e inversa del exón 6 de TP53 (iSx-050-TP53e6-bcF5, iSx-051-TP53e6-bcR6); (v) oligonucleótidos de captura directa e inversa del exón 7 de TP53 (iSx-060-TP53e7-bcF7, iSx-061-TP53e7-bcR8); y (vi) oligonucleótidos de captura directa e inversa del exón 8 de TP53 (iSx-070-TP53e8-bcF9, iSx-071-TP53e8-bcR10).

Nota 15: con los productos mencionados anteriormente generados usando los diseños de cebadores y conectores mencionados anteriormente, después de la amplificación por agrupamiento o con perlas, o captura dentro de un pocillo, dirección, o superficie de una celda de flujo en un instrumento comercial, para iniciar reacciones de secuenciación pueden usarse los siguientes cebadores: (i) iLx-003-PEsqP1, cebador de secuenciación de extremo emparejado 1; (ii) iLx-004-BrCdR1, cebador de indexación, lectura de código de barras 1; (iii) iLx-001-P5-BrCdR2, lectura de código de barras 2; y (iv) iLx-005-PEsqP2, cebador de secuenciación de extremo emparejado 2 (las secuencias de cebador se proporcionan en la Tabla 1 mostrada posteriormente).

El enfoque que se describe en la Figura 70 usó ligamiento tanto de la sonda oligonucleotídica así como de la diana que contenía conector, dando como resultado productos de ligamiento interconectados circulares. Posteriormente, se introduce una mella en el enlace escindible. Para secuencias repetitivas, el extremo 3' tan solo puede extenderse usando solo 3 dNTP, como se describe posteriormente en la Variación 5.4, véase, por ejemplo, la Figura 77.

5.4. a. Comenzando con ADNcf o ADN genómico aislado de CTC (cortado a aproximadamente 150 pb), reparar los extremos con polimerasa T4 y quinasa T4, y posteriormente se añade una protuberancia A 3' de una sola base con Klenow (exo-) y dATP. Los conectores tienen una protuberancia T 3' de una sola base, de modo que el ligamiento usando ligasa T4 a 4 °C añada conectores en ambos extremos del fragmento. Los conectores pueden sintetizarse con fosfato 5', o el fosfato puede añadirse usando quinasa T4. Opcionalmente, purificar el ADN diana del conector sin ligar.

5.4. b. Desnaturalizar los conectores que contienen ADN diana en ambos extremos (94 °C, 1 minuto) en presencia de sondas oligonucleotídicas (que comprenden una secuencia en el extremo 5' complementaria al extremo 5' del conector, una secuencia de identificador único, una secuencia de identificador de paciente opcional, una secuencia de unión de cebador opcional, una región espaciadora opcional, una secuencia complementaria al extremo 3' del conector, y una secuencia en el extremo 3' complementaria a una parte única o repetitiva (es decir, repetición de AGAT) de la diana), y permitir que las sondas oligonucleotídicas se hibriden con sus regiones complementarias en los fragmentos deseados enfriando a una temperatura deseada (por ejemplo, 50 °C durante 2 horas). Las sondas oligonucleotídicas pueden contener un grupo de bloqueo opcional en el lado 5'. Se añaden polimerasa Taq y/o KlenTaq (polimerasa Taq que carece de actividad de nucleasa), y ligasa termoestable (preferentemente de la cepa AK16D) y, para el ejemplo de repeticiones de AGAT, solo los tres nucleótidos complementarios (es decir, dTTP, dCTP, dATP) después de la etapa de hibridación, o al comienzo del procedimiento. En el caso en el que la secuencia del conector tenga un fosfato 5', KlenTaq extiende el extremo 3' hasta que sea directamente adyacente al extremo 5' competente para ligamiento (lado izquierdo de la Figura 77). En el caso en el que la secuencia del conector tenga un OH 5', la actividad de nucleasa 5'^-3' de la polimerasa escinde la base solapante 5' de emparejamiento para crear un fosfato 5' competente para ligamiento (lado derecho de la Figura 77). Permitir la extensión y el ligamiento a la temperatura de hibridación y, opcionalmente, aumentar la temperatura (por ejemplo, 60 °C) para garantizar la finalización de la extensión y el ligamiento, para generar productos circulares.

5.4. c. Añadir Exonucleasa I (digiere el ADN monocatenario en la dirección 3'^-5'), y Exonucleasa III (digiere el ADN bicatenario en la dirección 3'^5'), para digerir todos los productos sin ligar o con mellas, dejando solo el ADN monocatenario circular deseado que comprende el ADN diana original, la secuencia del conector, la secuencia de identificador único, una secuencia de unión de cebador opcional, y una secuencia de identificador de paciente opcional. Este producto es adecuado para la captura específica de secuencia de las dianas deseadas usando sondas biotinadas, o para la amplificación por círculo rodante (usando un cebador complementario a la secuencia de unión de cebador con la polimerasa phi-29) para crear repeticiones en tándem de la secuencia deseada, seguido de una captura potenciada de las dianas deseadas usando sondas biotinadas. Esto puede ir seguido de la identificación de las dianas usando secuenciación de nueva generación o, alternativamente, secuenciación SMRT directa en el molde cerrado covalentemente, usando la secuencia del conector o la secuencia de unión de cebador opcional como un sitio de unión de cebador.

Nota 4: cuando se usa la polimerasa KlenTaq (polimerasa Taq sin actividad de escisión por nucleasa 5'^3'), el conector en el extremo 5' puede sintetizarse para que contenga un sitio apurínico (AP) en la posición adyacente al fosfato 5' deseado. Este fosfato 5' se libera usando una EndolII termoestable (tal como Tma EndolII). Esta enzima escinde los sitios de AP dejando un fosfato 5' cuando el cebador está unido a la diana. La endonucleasa también escinde el cebador monocatenario, pero con menor eficacia y, de ese modo, el cebador hibridado con el molde podría ser el sustrato preferente.

Nota 6: puede usarse una mezcla 1:20 de polimerasa Taq (con actividad de nucleasa 5'^-3') y KlenTaq (polimerasa Taq sin actividad de escisión por nucleasa 5'^-3') en condiciones de extensión distributiva (es decir, concentración salina más elevada) para minimizar la degradación del ADN diana por traducción de mellas.

Para evitar problemas con la extensión por polimerasa y la traducción de mellas, el procedimiento puede realizarse sin una etapa de extensión por polimerasa, usando solo ligasa o ligasa combinada con la actividad de nucleasa 5 '^3 ' de la polimerasa, como se ilustra en la Figura 78 (v5.5). El truco consiste en añadir la secuencia de identificador único al conector.

5.5. a. Comenzando con ADNcf o ADN genómico aislado de CTC (cortado a aproximadamente 150 pb), reparar los extremos con polimerasa T4 y quinasa T4, y posteriormente se añade una protuberancia A 3' de una sola base con Klenow (exo-) y dATP. Los conectores tienen una protuberancia T 3' de una sola base, de modo que el ligamiento usando ligasa T4 a 4 °C añada conectores en ambos extremos del fragmento. Los conectores contienen una secuencia de identificador único en el lado monocatenario en el extremo 5' del conector, y pueden sintetizarse con fosfato 5', o el fosfato puede añadirse usando quinasa T4. Opcionalmente, purificar el ADN diana del conector sin ligar y/o los dNTP.

5.5. b. Desnaturalizar los conectores que contienen ADN diana en ambos extremos (94 °C, 1 minuto) en presencia de oligonucleótidos (que comprenden una secuencia en el extremo 5' complementaria a una parte única o repetitiva (es decir, repetición de AGAT) de la diana, una región espaciadora opcional, una secuencia complementaria al extremo 5' del conector, una secuencia de identificador de paciente opcional, una secuencia de unión de cebador opcional, una región espaciadora opcional, una secuencia complementaria al extremo 3' del conector, y una secuencia en el extremo 3' complementaria a una parte única o repetitiva (es decir, repetición de AGAT) de la diana, y directamente adyacente a, o solapando mediante una sola base o aleta, la secuencia en el extremo 5' complementaria a la diana), y permitir que los oligonucleótidos se hibriden con sus regiones complementarias en los fragmentos deseados mediante enfriamiento a una temperatura deseada (por ejemplo, 50 °C durante 2 horas). El oligonucleótido puede contener un grupo de bloqueo opcional en el lado 5'. Opcionalmente, se añaden polimerasa Taq y ligasa termoestable (preferentemente de la cepa AK16D), después de la etapa de hibridación, o al comienzo del procedimiento. En el caso en el que la secuencia del conector tenga un fosfato 5', el conector el extremo 3' es directamente adyacente al extremo 5' competente para ligamiento (lado izquierdo de la Figura 78). En el caso en el que la secuencia del conector tenga un OH 5', la actividad de nucleasa 5 '^3 ' de la polimerasa escinde la base solapante 5' de emparejamiento o la aleta para crear un fosfato 5' competente para ligamiento (lado derecho de la Figura 78). Permitir la escisión de la aleta opcional y el ligamiento a la temperatura de hibridación y, opcionalmente, aumentar la temperatura (por ejemplo, 60 °C) para asegurar la finalización del ligamiento, para generar productos circulares.

5.5. c. Opcionalmente, escindir la sonda oligonucleotídica en un enlace escindible (por ejemplo, U escindido usando UDG y endonucleasa AP). Añadir Exonucleasa I (digiere el ADN monocatenario en la dirección 3'^5'), y Exonucleasa III (digiere el ADN bicatenario en la dirección 3'^-5'), para digerir todos los productos sin ligar o con mellas, dejando solo el ADN monocatenario circular deseado que comprende el ADN diana original, la secuencia del conector, la secuencia de identificador único, una secuencia de unión de cebador opcional, y una secuencia de identificador de paciente opcional. Este producto es adecuado para la captura específica de secuencia de las dianas deseadas usando sondas biotinadas, o para la amplificación por círculo rodante (usando un cebador complementario a la secuencia de unión de cebador con la polimerasa phi-29) para crear repeticiones en tándem de la secuencia deseada, seguido de una captura potenciada de las dianas deseadas usando sondas biotinadas. Esto puede ir seguido de la identificación de las dianas usando secuenciación de nueva generación o, alternativamente, secuenciación SMRT directa en el molde cerrado covalentemente, usando la secuencia del conector o la secuencia de unión de cebador opcional como un sitio de unión de cebador.

Alternativamente, puede incluirse un enlace escindible en el oligonucleótido original.

Ejemplo profético 1 -- Cuantificación exacta de ARNm específico de tumor o ARNInc aislado de exosomas, células tumorales circulantes, o células sanguíneas totales que incluyen células tumorales circulantes (por ejemplo, una docena de marcadores de expresión que predicen el resultado o guían el tratamiento)

Los cambios en la expresión de ARNm específico de tumor o ARNlnc son una herramienta potente para clasificar el estado de la enfermedad de una manera histoespecífica. Esto incluye la detección y cuantificación exactas de exones específicos de los ARNm o los ARNlnc (véanse, por ejemplo, las Figuras 108, 111, 112) o la detección y cuantificación de fusiones de genes recurrentes presentes en los ARNm (véanse, por ejemplo, las Figuras 109 y 110). Se aísla ARNm total o poli-A o ARNlnc poli-A de exosomas o de células tumorales circulantes y se convierte en ADNc usando transcriptasa inversa para su uso en el proceso. Los ADNc se generan mediante el uso de cebadores específicos de exones usando reglas de diseño convencional para obtener la máxima especificidad de las regiones, que en general se extienden a los límites exón-intrón de un transcrito específico. Alternativamente, puede usarse cebado aleatorio de hexámeros para copiar todo el transcriptoma, o pueden usarse cebadores poli-dT para enriquecer los extremos 3' de todos los transcritos.

Los oligonucleótidos que contienen secuencias complementarias a regiones adyacentes pero separadas se hibridan con las dianas de ADNc. Las Figuras 108 y 112 muestran un método de detección y cuantificación de exones que usa un hueco (es decir, 10-20 nucleótidos) entre los oligonucleótidos en los extremos 5' y 3' en donde se usa polimerasa para extender el extremo o extremos 3' de las secuencias de unión a diana para copiar parte de la secuencia de la diana y cerrar el hueco para generar una unión competente para ligamiento adecuada para el ligamiento posterior para formar un producto circular. En una realización, el hueco entre los extremos 5' y 3' de las sondas oligonucleotídicas es de 10-20 nucleótidos. Sin embargo, el hueco que se va a copiar se puede adaptar a la longitud de lectura usada en la etapa de secuenciación posterior. La Figura 111 muestra un método de detección y cuantificación de exones en donde las dos secuencias de unión a diana están inmediatamente adyacentes entre sí y no existe ningún hueco.

La enumeración de estos círculos informadores puede llevarse a cabo mediante una diversidad de métodos cuantitativos que incluyen, pero no se limitan a, secuenciación de nueva generación. Además de permitir la detección múltiple simultánea de numerosas secuencias diana mediante la formación de círculos, la secuenciación de nueva generación, a medida que la lectura progresa, proporciona información adicional (dos identificadores únicos) sobre los círculos informadores que distingue fácilmente los productos de ligamiento legítimos de los artefactos de ligamiento, aumentando de ese modo la sensibilidad del ensayo.

Las Figuras 109 y 110 describen dos variantes para la detección y cuantificación de fusiones de genes recurrentes encontradas en ARNm. Dado que las uniones de fusión de dos genes se producen de manera imprecisa con la deleción de secuencia de cientos a miles de bases de longitud entre los dos extremos 5' de un gen y el extremo 3' del otro gen, podría ser difícil diseñar un ensayo que contuviera docenas de pares de sondas corriente arriba y corriente abajo de la unión de fusión indeterminada, de modo que el método que se describe en el presente documento usa dos sondas oligonucleotídicas semicirculares que tienen cada una un extremo en un exón corriente arriba y el otro extremo en un exón corriente abajo. El ligamiento para formar un único producto circular solo puede producirse después de la hibridación de ambas sondas (cuatro extremos) adyacentes con un hueco entre ellas, o inmediatamente adyacentes entre sí en la diana de ADNc. La posterior digestión de las sondas oligonucleotídicas sin ligar (usando exonucleasas) deja un producto circular que en una variación (véase, por ejemplo, la Figura 109) no contiene información de secuencia adicional (sin hueco) del ADNc diana original. En otra variación (véase, por ejemplo, la Figura 110), una polimerasa extiende los extremos 3' de cada una de las sondas cerrando el hueco hasta que encuentra cada uno de los extremos 5' de las sondas cercanas. Estos dos círculos informadores contienen una secuencia de identificador único, una secuencia de identificador de paciente opcional y una de ellas contiene un sitio de unión de cebador opcional. La enumeración de estos círculos informadores puede llevarse a cabo mediante una diversidad de procedimientos cuantitativos que incluyen, pero no se limitan a, secuenciación de nueva generación.

Además de permitir la detección múltiple simultánea de numerosos transcritos de fusión, la secuenciación de nueva generación proporciona información adicional (dos copias de identificadores únicos) sobre los círculos informadores que distingue fácilmente los productos de ligamiento legítimos de los artefactos de ligamiento. Cada una de las dos variaciones (Figuras 109 y 110) también muestra dos enfoques para la generación de extremos 5' competentes para ligamiento. O bien las sondas tienen fosfatos 5' antes de la hibridación (lado izquierdo de las figuras) o usan la actividad de nucleasa 5 '^3 ' de una polimerasa Taq para retirar por escisión la base solapante 5' de emparejamiento o la aleta, generando un fosfato 5' competente para ligamiento (lado derecho de las figuras).

Protocolo detallado para la detección y cuantificación de exones en ARNm o ARNInc aislado de exosomas, células tumorales circulantes, o células sanguíneas totales que incluyen células tumorales circulantes

Variación 6.1, véase, por ejemplo, la Figura 108: 6.1.a. Comenzando con ARNm total o poli-A o ARNInc poli-A aislado de exosomas, células tumorales circulantes, o células sanguíneas totales que incluyen células tumorales circulantes, generar ADNc mediante el uso de transcriptasa inversa y cebadores específicos de exones.

6.1. b. Desnaturalizar el ADNc diana (94 °C, 1 minuto) en presencia de oligonucleótidos (que comprenden una región de sonda en el extremo 5' complementaria a una parte del ADNc hacia el lado 5', una secuencia de identificador único, una secuencia de identificador de paciente opcional, una secuencia de unión de cebador opcional, y una región de sonda en el extremo 3' complementaria a otra parte del ADNc hacia el lado 3'), y permitir que los oligonucleótidos se hibriden con sus regiones complementarias en los fragmentos deseados mediante enfriamiento a una temperatura deseada (por ejemplo, 40-50 °C durante 30 min). Los oligonucleótidos pueden contener un grupo fosfato opcional en el extremo 5' o una aleta o una base solapante 5' de emparejamiento. Opcionalmente, se añaden polimerasa Taq y/o KlenTaq (polimerasa Taq que carece de actividad de nucleasa), y ligasa termoestable (preferentemente de la cepa A^k16D), y opcionalmente los dNTP después de la etapa de hibridación, o al comienzo del procedimiento. En el caso en el que los oligonucleótidos tengan un fosfato 5' directamente adyacente al OH 3' en la unión, los dos extremos pueden unirse directamente usando ligasa (lado derecho de la Figura 108). En el caso en el que los oligonucleótidos tengan un fosfato 5' con un hueco entre los extremos 5' y 3', el OH 3' se extiende con KlenTaq. En el caso en el que los oligonucleótidos tengan un OH 5', la actividad de nucleasa 5 '^3 ' de una Taq polimerasa escinde la base solapante 5' de emparejamiento o la aleta para crear un fosfato 5' competente para ligamiento (lado izquierdo de la Figura 108). Permitir la extensión y el ligamiento a la temperatura de hibridación y, opcionalmente, aumentar la temperatura (por ejemplo, 60 °C) para garantizar la finalización de la extensión y el ligamiento, para generar productos circulares.

6.1. c. Añadir Exonucleasa I (digiere el ADN monocatenario en la dirección 3'^-5'), y Exonucleasa III (digiere el ADN bicatenario en la dirección 3'^5'), para digerir todos los productos sin ligar o con mellas, dejando solo el ADN circular monocatenario deseado que comprende una copia de un tramo corto del ADNc diana original, la secuencia de identificador único, una secuencia de unión de cebador opcional, y una secuencia de identificador de paciente opcional. Este producto es adecuado para amplificación por círculo rodante (usando cebadores hexámeros aleatorios con polimerasa phi-29) para crear repeticiones en tándem de la secuencia deseada, y posterior identificación de las dianas usando secuenciación de nueva generación o, alternativamente, secuenciación SMRT directa en el molde cerrado covalentemente, usando la secuencia de unión de cebador como un sitio de unión de cebador.

Nota 1: para generar el fosfato 5' competente para ligamiento en el lado 5' de la diana puede usarse una nucleasa Fen en lugar de la polimerasa con actividad de nucleasa 5'^3'.

Nota 2: el extremo 5' del cebador oligonucleotídico puede sintetizarse para que contenga enlaces tiofosfato en las posiciones 2a y 3a desde el extremo fosfato 5' (que se liberarán por la actividad de nucleasa 5 '^3 ' de la polimerasa). Para minimizar el desplazamiento de la polimerasa de esas bases a medida que extiende una base en exceso (lo que podría hacer imposible el ligamiento al cebador corriente abajo), las bases de la diana en la unión de ligamiento podrían ser preferentemente ricas en AT en el lado 3', ricas en GC en el lado 5'.

Nota 3: cuando se usa la polimerasa KlenTaq (polimerasa Taq sin actividad de escisión por nucleasa 5'^3'), el conector en el extremo 5' puede sintetizarse para que contenga un sitio apurínico (AP) en la posición adyacente al fosfato 5' deseado. Este fosfato 5' se libera usando una EndolII termoestable (tal como Tma EndolII). Esta enzima escinde los sitios de AP dejando un fosfato 5' cuando el cebador está unido a la diana. La endonucleasa también escinde el cebador monocatenario, pero con menor eficacia y, de ese modo, el cebador hibridado con el molde podría ser el sustrato preferente.

Nota 4: cuando se usa la polimerasa KlenTaq (polimerasa Taq sin actividad de escisión por nucleasa 5'^3'), el conector en el extremo 5' puede sintetizarse para que contenga un fosfato 5'. Alternativamente, el fosfato 5' puede añadirse usando quinasa T4 antes del ligamiento al ADN diana, o después de esa etapa de ligamiento.

Nota 5: puede usarse una mezcla 1:20 de polimerasa Taq (con actividad de nucleasa 5 '^3 ') y KlenTaq (polimerasa Taq sin actividad de escisión por nucleasa 5 '^3 ') en condiciones de extensión distributiva (es decir, concentración salina más elevada) para minimizar la degradación del ADN diana por traducción de mellas.

Nota 6: si el oligonucleótido u oligonucleótidos también comprenden sitios de unión de cebador opcionales (es decir, sitios de unión de cebador universales), para la amplificación por PCR, seguido de la identificación posterior de las dianas, podría ser adecuado el uso de secuenciación de nueva generación, ensayos TaqMan, ensayos UniTaq, ensayos de PCR en tiempo real, PCR digital, micromatriz, hibridación, u otro método de detección.

Nota 7: la transcriptasa inversa MMLV puede manipularse por ingeniería para sintetizar ADNc a 50-60 °C, a partir del ARN entrante total (Invitrogen Superscript III). Alternativamente, las ADN polimerasas Tth o Tima se han manipulado por ingeniería para mejorar su actividad de Transcriptasa inversa (puede requerir la adición de cofactor Mn). Por último, la ADN polimerasa termófila PyroPhage 3173 tiene tanto actividad de desplazamiento de cadena como de transcripción inversa, y también puede usarse.

Protocolo detallado para la detección y cuantificación de fusiones génicas en ARNm aislado de exosomas, células tumorales circulantes, o células sanguíneas totales que incluyen células tumorales circulantes

Variación 6.2 (véase, por ejemplo, la Figura 109): 6.2.a. El ARNm aislado de exosomas o de las CTC se convierte en primer lugar en ADNc mediante una transcriptasa inversa de tal manera que se extienda a las uniones de cualquier posible transcrito de fusión. En el método preferente, se usan cebadores específicos de exón.

6.2. b. Desnaturalizar el ADNc diana (94 °C, 1 minuto) en presencia de dos oligonucleótidos (comprendiendo el primero una secuencia en el extremo 5' complementaria a una parte única del exón diana n.° 1, una secuencia de identificador único, una secuencia de identificador de paciente opcional, una secuencia de unión de cebador opcional, y una secuencia en el extremo 3' complementaria a una parte única del exón diana n.° 2 y comprendiendo el segundo una secuencia en el extremo 5' complementaria a una parte única del exón diana n.° 2, una secuencia de identificador único, una secuencia de identificador de paciente opcional y una secuencia en el extremo 3' complementaria a una parte única del exón diana n.° 1), y permitir que los oligonucleótidos se hibriden con sus regiones complementarias en los fragmentos deseados mediante enfriamiento a una temperatura deseada (por ejemplo, 50 °C durante 2 horas). Se añaden ligasa termoestable (preferentemente de la cepa AK16D), y opcionalmente polimerasa Taq y los dNTP después de la etapa de hibridación, o al comienzo del procedimiento. En el caso en el que ambas secuencias oligonucleotídicas tengan un fosfato 5', no se requiere polimerasa (lado izquierdo de la Figura 109). En el caso en el que ambas secuencias oligonucleotídicas tengan un OH 5', la actividad de nucleasa 5 '^3 ' de la polimerasa escinde la base solapante 5' de emparejamiento para crear un fosfato 5' competente para ligamiento (lado derecho de la Figura 109). Permitir la escisión de la aleta y el ligamiento a la temperatura de hibridación y, opcionalmente, aumentar la temperatura (por ejemplo, 60 °C) para garantizar la finalización de la escisión de la aleta y el ligamiento, para generar productos circulares.

6.2. c. Añadir Exonucleasa I (digiere el ADN monocatenario en la dirección 3'^-5'), y Exonucleasa III (digiere el ADN bicatenario en la dirección 3'^5'), para digerir todos los productos sin ligar o con mellas, dejando solo el ADN monocatenario circular deseado que comprende el ADN diana original, la secuencia del conector, la secuencia de identificador único, una secuencia de unión de cebador opcional, y una secuencia de identificador de paciente opcional. Este producto es adecuado para la amplificación por círculo rodante (usando cebadores hexámeros aleatorios con polimerasa phi-29) para crear repeticiones en tándem de la secuencia deseada, y posterior identificación de las dianas usando secuenciación de nueva generación o, alternativamente, secuenciación SMRT directa en el molde cerrado covalentemente, usando la secuencia de unión de cebador como un sitio de unión de cebador.

Nota 2: si el oligonucleótido u oligonucleótidos también comprenden sitios de unión de cebador opcionales (es decir, sitios de unión de cebador universales), para la amplificación por PCR, seguido de la identificación posterior de las dianas, podría ser adecuado el uso de secuenciación de nueva generación, ensayos TaqMan, ensayos UniTaq, ensayos de PCR en tiempo real, PCR digital, micromatriz, hibridación, u otro método de detección.

Nota 3: en los sistemas que usan dos sondas oligonucleotídicas puente, cada una conteniendo una secuencia de identificador único, una secuencia de identificador de paciente opcional y un sitio de unión de cebador opcional, se recomienda que solo uno y no ambos oligonucleótidos contenga un sitio de unión de cebador (ya sea el oligonucleótido corriente arriba o corriente abajo). Para un nivel adicional de detección de falsos positivos, se recomienda que la secuencia de identificador único sea diferente en las sondas corriente arriba y corriente abajo.

Nota 4: la transcriptasa inversa MMLV puede manipularse por ingeniería para sintetizar ADNc a 50-60 °C, a partir del ARN entrante total (Invitrogen Superscript III). Alternativamente, las ADN polimerasas Tth o Tma se han manipulado por ingeniería para mejorar su actividad de Transcriptasa inversa (puede requerir la adición de cofactor Mn). Por último, la ADN polimerasa termófila PyroPhage 3173 tiene tanto actividad de desplazamiento de cadena como de transcripción inversa, y también puede usarse.

Protocolo detallado para otra variación para la detección y cuantificación de fusiones génicas en ARNm aislado de exosomas, células tumorales circulantes, o células sanguíneas totales que incluyen células tumorales circulantes

Variación 6.3 (véase, por ejemplo, la Figura 110): 6.3.a. El ARNm aislado de exosomas o de las CTC se convierte en primer lugar en ADNc mediante una transcriptasa inversa de tal manera que se extienda a las uniones de cualquier posible transcrito de fusión. En el método preferente, se usan cebadores específicos de exón.

6.3. b. Desnaturalizar el ADNc diana (94 °C, 1 minuto) en presencia de dos oligonucleótidos (comprendiendo el primero una secuencia en el extremo 5' complementaria a una parte única del exón diana n.° 1, una secuencia de identificador único, una secuencia de identificador de paciente opcional, una secuencia de unión de cebador opcional, y una secuencia en el extremo 3' complementaria a una parte única del exón diana n.° 2 y comprendiendo el segundo una secuencia en el extremo 5' complementaria a una parte única del exón diana n.° 2, una secuencia de identificador único, una secuencia de identificador de paciente opcional y una secuencia en el extremo 3' complementaria a una parte única del exón diana n.° 1), y permitir que los oligonucleótidos se hibriden con sus regiones complementarias en los fragmentos deseados mediante enfriamiento a una temperatura deseada (por ejemplo, 50 °C durante 2 horas). Se añaden polimerasa Taq y/o KlenTaq (polimerasa Taq que carece de actividad nucleasa), ligasa termoestable (preferentemente de la cepa AK16D), y los dNTP después de la etapa de hibridación, o al comienzo del procedimiento. En el caso en el que ambas secuencias oligonucleotídicas tengan un fosfato 5', KlenTaq extiende el extremo 3' hasta que sea directamente adyacente al extremo 5' competente para ligamiento (lado izquierdo de la Figura 110). En el caso en el que ambas secuencias oligonucleotídicas tengan un OH 5', la actividad de nucleasa 5 '^3 ' de la polimerasa escinde la base solapante 5' de emparejamiento para crear un fosfato 5' competente para ligamiento (lado derecho de la Figura 110). Permitir la extensión y el ligamiento a la temperatura de hibridación y, opcionalmente, aumentar la temperatura (por ejemplo, 60 °C) para garantizar la finalización de la extensión y el ligamiento, para generar productos circulares.

6.3. c. Añadir Exonucleasa I (digiere el ADN monocatenario en la dirección 3'^-5'), y Exonucleasa III (digiere el ADN bicatenario en la dirección 3'^5'), para digerir todos los productos sin ligar o con mellas, dejando solo el ADN monocatenario circular deseado que comprende el ADN diana original, la secuencia del conector, la secuencia de identificador único, una secuencia de unión de cebador opcional, y una secuencia de identificador de paciente opcional. Este producto es adecuado para la amplificación por círculo rodante (usando cebadores hexámeros aleatorios con polimerasa phi-29) para crear repeticiones en tándem de la secuencia deseada, y posterior identificación de las dianas usando secuenciación de nueva generación o, alternativamente, secuenciación SMRT directa en el molde cerrado covalentemente, usando la secuencia de unión de cebador como un sitio de unión de cebador.

Nota 2: el extremo 5' del cebador oligonucleotídico puede sintetizarse para que contenga en enlaces tiofosfato en las posiciones 2a y 3a desde el extremo fosfato 5' (que se liberarán por la actividad de nucleasa 5 '^3 ' de la polimerasa). Para minimizar el desplazamiento de la polimerasa de esas bases a medida que extiende una base en exceso (lo que podría hacer imposible el ligamiento al cebador corriente abajo), las bases de la diana en la unión de ligamiento podrían ser preferentemente ricas en AT en el lado 3', y ricas en GC en el lado 5'.

Nota 7: en los sistemas que usan dos sondas oligonucleotídicas puente, cada una conteniendo una secuencia de identificador único, una secuencia de identificador de paciente opcional y un sitio de unión de cebador opcional, se recomienda que solo uno y no ambos oligonucleótidos contenga un sitio de unión de cebador (ya sea el oligonucleótido corriente arriba o corriente abajo). Para un nivel adicional de detección de falsos positivos, se recomienda que la secuencia de identificador único sea diferente en las sondas corriente arriba y corriente abajo.

Nota 8: la transcriptasa inversa MMLV puede manipularse por ingeniería para sintetizar ADNc a 50-60 °C, a partir del ARN entrante total (Invitrogen Superscript III). Alternativamente, las ADN polimerasas Tth o Tima se han manipulado por ingeniería para mejorar su actividad de Transcriptasa inversa (puede requerir la adición de cofactor Mn). Por último, la ADN polimerasa termófila PyroPhage 3173 tiene tanto actividad de desplazamiento de cadena como de transcripción inversa, y también puede usarse.

Protocolo detallado para la detección y cuantificación de ARNm que contiene exones específicos (que pueden no ser adyacentes entre sí) en ARNm aislado de exosomas, células tumorales circulantes, o células sanguíneas totales que incluyen células tumorales circulantes

Variación 6.4 (véase, por ejemplo, la Figura 111) 6.4.a. El ARNm aislado de exosomas o de las CTC se convierte en primer lugar en ADNc mediante una transcriptasa inversa de tal manera que incluya ambas regiones del exón. En el método preferente, se usan cebadores específicos de exón.

6.4. b. Desnaturalizar el ADNc diana (94 °C, 1 minuto) en presencia de dos oligonucleótidos (comprendiendo el primero una secuencia en el extremo 5' complementaria a una parte única del exón diana n.° 1, una secuencia de identificador único, una secuencia de identificador de paciente opcional, una secuencia de unión de cebador opcional, y una secuencia en el extremo 3' complementaria a una parte única del exón diana n.° 2 y comprendiendo el segundo una secuencia en el extremo 5' complementaria a una parte única del exón diana n.° 2, una secuencia de identificador único, una secuencia de identificador de paciente opcional y una secuencia en el extremo 3' complementaria a una parte única del exón diana n.° 1), y permitir que los oligonucleótidos se hibriden con sus regiones complementarias en los fragmentos deseados mediante enfriamiento a una temperatura deseada (por ejemplo, 50 °C durante 2 horas). Se añaden ligasa termoestable (preferentemente de la cepa AK16D), y opcionalmente polimerasa Taq y los dNTP después de la etapa de hibridación, o al comienzo del procedimiento. En el caso en el que ambas secuencias oligonucleotídicas tengan un fosfato 5', no se requiere polimerasa (lado izquierdo de la Figura 111). En el caso en el que ambas secuencias oligonucleotídicas tengan un OH 5', la actividad de nucleasa 5 '^3 ' de la polimerasa escinde la base solapante 5' de emparejamiento para crear un fosfato 5' competente para ligamiento (lado derecho de la Figura 111). Permitir la escisión de la aleta y el ligamiento a la temperatura de hibridación y, opcionalmente, aumentar la temperatura (por ejemplo, 60 °C) para garantizar la finalización de la escisión de la aleta y el ligamiento, para generar productos circulares.

6.4. c. Añadir Exonucleasa I (digiere el ADN monocatenario en la dirección 3'^-5'), y Exonucleasa III (digiere el ADN bicatenario en la dirección 3'^5'), para digerir todos los productos sin ligar o con mellas, dejando solo el ADN monocatenario circular deseado que comprende el ADN diana original, la secuencia del conector, la secuencia de identificador único, una secuencia de unión de cebador opcional, y una secuencia de identificador de paciente opcional. Este producto es adecuado para la amplificación por círculo rodante (usando cebadores hexámeros aleatorios con polimerasa phi-29) para crear repeticiones en tándem de la secuencia deseada, y posterior identificación de las dianas usando secuenciación de nueva generación o, alternativamente, secuenciación SMRT directa en el molde cerrado covalentemente, usando la secuencia de unión de cebador como un sitio de unión de cebador.

Variación 6.5 (véase, por ejemplo, la Figura 112): 6.5.a. El ARNm aislado de exosomas o de las CTC se convierte en primer lugar en ADNc mediante una transcriptasa inversa de tal manera que incluya ambas regiones del exón. En el método preferente, se usan cebadores específicos de exón.

6.5. b. Desnaturalizar el ADNc diana (94 °C, 1 minuto) en presencia de dos oligonucleótidos (comprendiendo el primero una secuencia en el extremo 5' complementaria a una parte única del exón diana n.° 1, una secuencia de identificador único, una secuencia de identificador de paciente opcional, una secuencia de unión de cebador opcional, y una secuencia en el extremo 3' complementaria a una parte única del exón diana n.° 2 y comprendiendo el segundo una secuencia en el extremo 5' complementaria a una parte única del exón diana n.° 2, una secuencia de identificador único, una secuencia de identificador de paciente opcional y una secuencia en el extremo 3' complementaria a una parte única del exón diana n.° 1), y permitir que los oligonucleótidos se hibriden con sus regiones complementarias en los fragmentos deseados mediante enfriamiento a una temperatura deseada (por ejemplo, 50 °C durante 2 horas). Se añaden polimerasa Taq y/o KlenTaq (polimerasa Taq que carece de actividad nucleasa), ligasa termoestable (preferentemente de la cepa AK16D), y los dNTP después de la etapa de hibridación, o al comienzo del procedimiento. En el caso en el que ambas secuencias oligonucleotídicas tengan un fosfato 5', KlenTaq extiende el extremo 3' hasta que sea directamente adyacente al extremo 5' competente para ligamiento (lado izquierdo de la Figura 112). En el caso en el que ambas secuencias oligonucleotídicas tengan un OH 5', la actividad de nucleasa 5 '^3 ' de la polimerasa escinde la base solapante 5' de emparejamiento para crear un fosfato 5' competente para ligamiento (lado derecho de la Figura 112). Permitir la extensión y el ligamiento a la temperatura de hibridación y, opcionalmente, aumentar la temperatura (por ejemplo, 60 °C) para garantizar la finalización de la extensión y el ligamiento, para generar productos circulares.

6.5. c. Añadir Exonucleasa I (digiere el ADN monocatenario en la dirección 3'^-5'), y Exonucleasa III (digiere el ADN bicatenario en la dirección 3'^5'), para digerir todos los productos sin ligar o con mellas, dejando solo el ADN monocatenario circular deseado que comprende el ADN diana original, la secuencia del conector, la secuencia de identificador único, una secuencia de unión de cebador opcional, y una secuencia de identificador de paciente opcional. Este producto es adecuado para la amplificación por círculo rodante (usando cebadores hexámeros aleatorios con polimerasa phi-29) para crear repeticiones en tándem de la secuencia deseada, y posterior identificación de las dianas usando secuenciación de nueva generación o, alternativamente, secuenciación SMRT directa en el molde cerrado covalentemente, usando la secuencia de unión de cebador como un sitio de unión de cebador.

Nota 7: en los sistemas que usan dos sondas oligonucleotídicas puente, cada una conteniendo una secuencia de identificador único, una secuencia de identificador de paciente opcional y un sitio de unión de cebador opcional, se recomienda que solo uno y no ambos oligonucleótidos contenga un sitio de unión de cebador (ya sea el oligonucleótido corriente arriba o corriente abajo). Para un nivel adicional de detección de falsos positivos, se recomienda que la secuencia de identificador único sea diferente en las sondas corriente arriba y corriente abajo. Nota 8: la transcriptasa inversa MMLV puede manipularse por ingeniería para sintetizar ADNc a 50-60 °C, a partir del ARN entrante total (Invitrogen Superscript III). Alternativamente, las ADN polimerasas Tth o Tima se han manipulado por ingeniería para mejorar su actividad de Transcriptasa inversa (puede requerir la adición de cofactor Mn). Por último, la ADN polimerasa termófila PyroPhage 3173 tiene tanto actividad de desplazamiento de cadena como de transcripción inversa, y también puede usarse.

Ejemplo profético 2 -- Cuantificación exacta de miARN específico de tumor aislado de exosomas o proteínas Argonaut (por ejemplo, una docena de marcadores de microARN que predicen el resultado o guían el tratamiento)

El microARN (miARN) se ha identificado como marcador potencial histoespecífico de la presencia de tumores, su clasificación y pronóstico. Los miARN existen en suero y plasma como complejos con proteínas Ago2 o por encapsulación como exosomas.

Las Figuras 114 - 117 describen métodos para capturar secuencias de miARN para su posterior enumeración mediante secuenciación de alta precisión. En todos los métodos mostrados, el procedimiento implica preparar una copia de ADNc de la secuencia de miARN diana que se convierte en un ADN circular adecuado.

Protocolo detallado para la captura, identificación y cuantificación de todas las especies de miARN que están presentes en suero, plasma o exosomas sin ninguna selección

Variación 7.1 (véase, por ejemplo, la Figura 114) 7.1.a. Aislar el miARN de los exosomas o las CTC. Ligar un conector universal al extremo 3' del miARN usando un conector de ADN con un fosfato 5' y un extremo 3' bloqueado usando ARN ligasa 1.

7.1. b. Fosforilar el extremo 5' del miARN modificado con quinasa T4. Ligar un conector universal al extremo 5' del conector modificado usando un conector de ADN con un fosfato 5' y un extremo 3' bloqueado.

7.1. c. Después de retirar el exceso de conectores, desnaturalizar los ácidos nucleicos (94 °C, 1 minuto) en presencia de oligonucleótidos (que comprenden secuencias complementarias a los extremos 5' y 3' de los conectores, una secuencia de identificador único, una secuencia de identificador de paciente opcional, una secuencia de unión de cebador opcional, y permitir que los oligonucleótidos se hibriden con sus regiones complementarias en los fragmentos deseados mediante enfriamiento a una temperatura deseada (por ejemplo, 40-50 °C durante 30 min). Añadir una transcriptasa inversa que carece de actividad 5 '^3 ' (es decir, ADN polimerasa Tth usando cofactor Mn2+), una ligasa termoestable (preferentemente de la cepa AK16D) y los dNTP; los componentes se añaden después de la etapa de hibridación, o al comienzo del procedimiento. Permitir la extensión y el ligamiento a la temperatura de hibridación y, opcionalmente, aumentar la temperatura (por ejemplo, 60 °C) para garantizar la finalización de la extensión y el ligamiento, para generar productos circulares.

7.1.d. Añadir UDG y endonucleasas AP para realizar mellas en el miARN en la diana original, añadir Exonucleasa I (digiere el ADN monocatenario en la dirección 3'^-5'), y Exonucleasa III (digiere el ADN bicatenario en la dirección 3'^-5'), para digerir todos los productos sin ligar o con mellas, dejando solo el ADN circular monocatenario deseado que comprende una copia del miARN diana original, la secuencia de identificador único, una secuencia de unión de cebador opcional, y una secuencia de identificador de paciente opcional. Este producto es adecuado para la amplificación por círculo rodante (usando un cebador complementario a la secuencia de unión de cebador con la polimerasa phi-29) para crear repeticiones en tándem de la secuencia deseada. Esto puede ir seguido de la identificación de las dianas usando secuenciación de nueva generación o, alternativamente, secuenciación SMRT directa en el molde cerrado covalentemente, usando la secuencia de unión de cebador opcional como un sitio de unión de cebador.

Nota 1. Si el oligonucleótido u oligonucleótidos también comprenden sitios de unión de cebador opcionales (es decir, sitios de unión de cebador universales), el ADN circular podría ser adecuado para amplificación por PCR, seguido de identificación posterior de las dianas usando secuenciación de nueva generación, ensayos TaqMan, ensayos UniTaq, ensayos de PCR en tiempo real, PCR digital, micromatriz, hibridación u otros métodos de detección.

Las siguientes variantes del método (véanse, por ejemplo, las Figuras 115 - 117) están diseñadas para la captura de secuencias de miARN específicas de miARN total aislado de suero, plasma o exosomas. Estos métodos hacen uso de sondas de captura complementarias a todas o parte de las secuencias de miARN diana, pero posteriormente preparan copias de ADNc de la secuencia de miARN original y, de ese modo, son capaces de detectar variaciones de una sola base en el miARN o de captura debido a una hibridación errónea.

Protocolo detallado para la captura, identificación y cuantificación de especies específicas de miARN que están presentes en suero, plasma o exosomas sin ninguna selección

Variación 7.2 (véase, por ejemplo, la Figura 115) 7.2.a. Aislar el miARN de los exosomas o las CTC. Fosforilar el miARN aislado usando quinasa T4. Hibridar pares oligonucleotídicos, comprendiendo el primero de los cuales una secuencia complementaria a la diana de miARN, flanqueada por secuencias de los conectores 5' y 3' únicos, mientras que el segundo oligonucleótido comprende un extremo fosforilado en el extremo 5' seguido del complemento del conector en el extremo 3' único, una secuencia de identificador único, una secuencia de identificador de paciente opcional, una secuencia de unión de cebador opcional y un complemento del conector en el extremo 5' único, siendo la última base una base ribonucleotídica. Una ARN ligasa T42 está presente para sellar covalentemente los extremos del miARN creando productos de ligamiento circulares.

7.2. b. Añadir Exonucleasa I (digiere el ADN monocatenario en la dirección 3'^-5'), y Exonucleasa III (digiere el ADN bicatenario en la dirección 3'^5'), para digerir todos los oligonucleótidos no ligados, dejando solo las quimeras de miARN y ADN circulares monocatenarias deseadas. Inactivar con calor las exonucleasas a 80 °C durante 20 minutos.

7.2. c. Añadir un cebador universal fosforilado en el extremo 5' a los productos circulares, e hibridar a 37 °C. Añadir transcriptasa inversa que carece de actividad de exonucleasa 5 '^3 ' (ADN polimerasa Tth usando cofactor Mn2+), ligasa termoestable (preferentemente de la cepa AK16D) y los dNTP; los componentes se añaden después de la etapa de hibridación, o al comienzo del procedimiento. Permitir la extensión y el ligamiento a la temperatura de hibridación y, opcionalmente, aumentar la temperatura (por ejemplo, 60 °C) para garantizar la finalización de la extensión y el ligamiento, para generar productos circulares que ahora contienen una copia del miARN diana original.

7.2. d. Añadir UDG y endonucleasas AP para realizar mellas en el miARN en la diana original, añadir Exonucleasa I (digiere el ADN monocatenario en la dirección 3'^5'), y Exonucleasa III (digiere el ADN bicatenario en la dirección 3'^5'), para digerir todos los productos sin ligar o con mellas, dejando solo el ADN circular monocatenario deseado que comprende una copia del miARN diana original, la secuencia de identificador único, una secuencia de unión de cebador opcional, y una secuencia de identificador de paciente opcional. Este producto es adecuado para la amplificación por círculo rodante (usando un cebador complementario a la secuencia de unión de cebador con la polimerasa phi-29) para crear repeticiones en tándem de la secuencia deseada. Esto puede ir seguido de la identificación de las dianas usando secuenciación de nueva generación o, alternativamente, secuenciación SMRT directa en el molde cerrado covalentemente, usando la secuencia de unión de cebador opcional como un sitio de unión de cebador.

La siguiente variación del método hace uso de un espaciador C6 o C18 que permite copiar el miARN diana pero evita completar un producto circular y, de ese modo, elimina la detección de falsos positivos de niveles bajos del miARN deseado. La traducción de mellas de un cebador universal que contiene tiofosfatos en las posiciones 2a y 3a con respecto al extremo 5' no tiene la capacidad de intercalar el espaciador C6 o C18 en el medio de la secuencia del complemento de unión a miARN diana permitiendo la destrucción de cualquier sonda de miARN no ligada.

Variación 7.3 (véase, por ejemplo, la Figura 116): 7.3.a. Aislar el miARN de los exosomas o las CTC. Fosforilar el miARN aislado usando quinasa T4. Hibridar pares oligonucleotídicos, comprendiendo el primero de los cuales una secuencia complementaria secuencia complementaria a la diana de miARN que contiene un único espaciador C6 o C18, flanqueada por secuencias de los conectores 5' y 3' únicos, mientras que el segundo oligonucleótido comprende un extremo fosforilado en 5' seguido del complemento del conector en el extremo 3' único, una secuencia de identificador único, una secuencia de identificador de paciente opcional, una secuencia de unión de cebador opcional y un complemento del conector en el extremo 5' único, siendo la última base una base ribonucleotídica. En la mezcla de hibridación también está presente un cebador universal que contiene enlaces tiofosfato en las posiciones 2a y 3a del extremo 5'. Una ARN ligasa T42 está presente para sellar covalentemente los extremos del miARN creando productos de ligamiento circulares.

7.3. b. Añadir transcriptasa inversa que tiene actividad de exonucleasa 5 '^3 ' (ADN polimerasa Tth usando cofactor Mn2+) y ligasa termoestable (preferentemente de la cepa AK16D), y los dNTP se añaden después de la etapa de hibridación, o al comienzo del procedimiento. Permitir la extensión y el ligamiento a la temperatura de hibridación y, opcionalmente, aumentar la temperatura (por ejemplo, 60 °C) para garantizar la finalización de la extensión y el ligamiento, para generar productos circulares que ahora contienen una copia del miARN diana original.

7.3. c. Añadir UDG y endonucleasas AP para realizar mellas en el miARN en la diana original y, a continuación, añadir Exonucleasa I (digiere el ADN monocatenario en la dirección 3'^-5'), y Exonucleasa III (digiere el ADN bicatenario en la dirección 3'^5'), para digerir todos los productos sin ligar o con mellas, dejando solo el ADN circular monocatenario deseado que comprende una copia del miARN diana original, la secuencia de identificador único, una secuencia de unión de cebador opcional, y una secuencia de identificador de paciente opcional. Este producto es adecuado para la amplificación por círculo rodante (usando un cebador complementario a la secuencia de unión de cebador con la polimerasa phi-29) para crear repeticiones en tándem de la secuencia deseada. Esto puede ir seguido de la identificación de las dianas usando secuenciación de nueva generación o, alternativamente, secuenciación SMRT directa en el molde cerrado covalentemente, usando la secuencia de unión de cebador opcional como un sitio de unión de cebador.

Otra variante (Figura 117) aprovecha una sonda de captura de tallo-bucle complementaria a alguna parte del miARN diana. El protocolo detallado es como se describe a continuación:

Variación 7.4 (véase, por ejemplo, la Figura 117): 7.4.a. Aislar el miARN de los exosomas o las CTC. Hibridar una sonda de tallo-bucle comprendida por un extremo 5' que forma un tallo-bucle, una región en el extremo 3' protuberante complementaria a alguna parte del miARN diana. La parte del bucle contiene una secuencia de identificador único, una secuencia de identificador de paciente opcional, una secuencia de unión de cebador opcional y un enlace escindible opcional. Extender el extremo 3' de la sonda de tallo-bucle con una transcriptasa inversa y los dNTP.

7.4. b. Desnaturalizar los ácidos nucleicos (94 °C, 1 minuto) en presencia de oligonucleótidos (que comprenden secuencias complementarias a la secuencia de tallo-bucle en el extremo 5' y los extremos 3' del ADNc extendido. Además, el extremo 5' está bloqueado para evitar la traducción de mellas) y permitir que los oligonucleótidos se hibriden con sus regiones complementarias en los fragmentos deseados mediante enfriamiento a una temperatura deseada (por ejemplo, 40-50 °C durante 30 min).

7.4. c. Añadir KlenTaq (polimerasa Taq que carece de actividad de nucleasa) y ligasa termoestable (preferentemente de la cepa AK16D), y los dNTP se añaden después de la etapa de hibridación, o al comienzo del procedimiento. KlenTaq extiende el extremo 3' hasta que es directamente adyacente al extremo 5' competente para ligamiento. Permitir la extensión y el ligamiento a la temperatura de hibridación y, opcionalmente, aumentar la temperatura (por ejemplo, 60 °C) para garantizar la finalización de la extensión y el ligamiento, para generar productos circulares.

7.4. d. Escindir la sonda oligonucleotídica en un enlace escindible (por ejemplo, U escindido usando UDG y endonucleasa AP). Añadir Exonucleasa I (digiere el ADN monocatenario en la dirección 3'^5'), y Exonucleasa III (digiere el ADN bicatenario en la dirección 3'^5'), para digerir todos los productos sin ligar y el exceso de sondas, dejando solo el ADN circular monocatenario deseado que comprende una copia de un tramo corto del ADNc diana original, la secuencia de identificador único, una secuencia de unión de cebador opcional, y una secuencia de identificador de paciente opcional. Este producto es adecuado para la amplificación por círculo rodante (usando cebadores hexámeros aleatorios con polimerasa phi-29) para crear repeticiones en tándem de la secuencia deseada, y posterior identificación de las dianas usando secuenciación de nueva generación o, alternativamente, secuenciación SMRT directa en el molde cerrado covalentemente, usando la secuencia de unión de cebador como un sitio de unión de cebador.

Ejemplo profético comparativo 6 -- Necesidad clínica en diagnóstico prenatal de una muestra de plasma materno

En el campo de la atención prenatal existe la necesidad urgente de desarrollar ensayos no invasivos para aneuploidías comunes, tales como la trisomía de los cromosomas 21, 18 o 13, pequeñas deleciones tales como las que se obtienen a partir de deleciones en el gen de la distrofia muscular de Duchenne (DMD), otras pequeñas anomalías en el número de copias tales como las responsables del autismo, translocaciones equilibradas para determinar potenciales manifestaciones clínicas, cambios en la metilación, que pueden dar como resultado enfermedades asociadas a la impronta genómica tales como el síndrome de Angelman o el síndrome de Prader-Willi, cambios en repeticiones triples responsables de enfermedades tales como la enfermedad de Huntington, mutaciones puntuales, tales como las del gen CFTR responsable de la fibrosis quística.

Visión general: un trabajo reciente ha demostrado que el ADN fetal como porcentaje del ADN materno en el plasma es de aproximadamente un 6 %, un 20 % y un 26 % en los trimestres 1°, 2° y 3°, respectivamente. Debido al modo en que se degrada el ADN, el ADN materno tiene en general aproximadamente 160 bases y sigue asociado a la histona HI, mientras que el ADN fetal tiene aproximadamente 140 bases y no está asociado a la histona. Dependiendo de la necesidad clínica, y cuando el conocimiento proporcione la mejor atención, pueden desarrollarse ensayos con suficiente sensibilidad para detectar el ADN fetal en el trimestre apropiado.

Existen aproximadamente 3.500 trastornos genéticos recesivos en donde se conoce el gen responsable. Los trastornos más comunes son el resultado de anomalías en las copias del ADN, ya sea por un cromosoma adicional, tal como en la trisomía del cromosoma 21, o por la eliminación de una parte de un gen, tal como en el gen de la distrofia muscular de Duchenne (DMD). Al considerar la identificación sistemática prenatal, es necesario sopesar la probabilidad de un trastorno genético frente al riesgo del procedimiento. En la actualidad, el procedimiento de diagnóstico habitual recomienda la amniocentesis durante la semana 17 para mujeres embarazadas a partir de los 35 años, ya que el riesgo de trisomía del cromosoma 21 o de otra aneuploidía cromosómica en 1 de cada 200 embarazos coincide ahora con el riesgo de aborto espontáneo después del procedimiento.

Al considerar el uso de los métodos de secuenciación de ácidos nucleicos que se describen en el presente documento para la identificación sistemática prenatal, se recomiendan dos niveles de ensayos. Para la identificación sistemática de bajo coste de todos los embarazos para trisomía de los cromosomas 21, 13 y 18, los métodos de secuenciación de la presente divulgación pueden usarse para identificar rápidamente genes expresados diferencialmente en los cromosomas 21, 13 y 18, por ejemplo, identificar aquellos genes que están desactivados en el feto como consecuencia del silenciamiento de la metilación, pero están presentes en el adulto. Se identifican regiones similares en tres cromosomas de control, es decir, 2, 5, 7. Incluso cuando se aísla el ADN del suero de una madre en el primer trimestre, puede calcularse rápidamente el porcentaje de ADN que procede del feto comparando el ADN metilado con el no metilado entre las regiones cromosómicas de control - en el ejemplo del presente documento, sería de un 6 %. Si existe trisomía en cualquiera de los otros cromosomas, es decir, trisomía del cromosoma 21, entonces los promotores de ese cromosoma mostrarán metilación en aproximadamente un 9 %, en otras palabras, un 50 % más que en el caso de la disomía normal. Se recomienda evaluar 1.000 equivalentes genómicos, de modo que un recuento de 90 copias metiladas para el caso de la trisomía se distinga fácilmente de 60 copias metiladas para la muestra normal.

Como primera etapa en dicho procedimiento, se identifican aquellas regiones promotoras que están metiladas en el ADN fetal durante las primeras etapas de desarrollo, pero que nunca están metiladas en el ADN materno (es decir, WBC). Esto se debe realizar empíricamente, comparando el patrón de metilación del ADNcf aislado de mujeres embarazadas con un feto diploide, un feto que contiene una trisomía y sin embarazo. Para una revisión generalizada sobre el uso de marcadores epigenéticos para NIPD (diagnóstico prenatal no invasivo) véase Patsalis et al., "A New Non-invasive Prenatal Diagnosis of Down syndrome through Epigenetic Markers and Realtime qPCR", Expert Opin Biol Ther. 12 Supl 1:S155-61 (2012). Como ejemplo que detecta el estado de metilación en un único marcador PDE9A, véase Lim et al., "Non-invasive Epigenetic Detection of Fetal Trisomy 21 in First Trimester Maternal Plasma", PLoS One 6(11):e27709 (2011). Los enfoques que se describen en el presente documento podrán identificar tales marcadores mucho más rápidamente. Para identificar la metilación en sitios de HinP1I adyacentes en todo el genoma, podría usarse el enfoque que se destaca en la Figura 28. Alternativamente, al centrarse en genes conocidos en los cromosomas seleccionados, pueden diseñarse sondas para regiones diana específicas y evaluar la metilación como en la Figura 27. Este enfoque también podría usarse en el ensayo de identificación sistemática prenatal final. Para sitios de metilación más abundantes, es decir, en sitios de AciI adyacentes entre sitios de HaeIII, en todo el genoma, podría usarse el enfoque que se destaca en la Figura 36. Cuando se centra la atención en genes conocidos, pueden diseñarse sondas para regiones diana específicas y evaluar la metilación como en las Figuras 36, 37, 39, y 40. Si los enfoques anteriores no proporcionan suficientes marcadores, pueden identificarse sitios de metilación en sitios de AciI adyacentes en todo el genoma usando el enfoque que se destaca en la Figura 33. Para estos sitios, pueden usarse los enfoques más dirigidos que se destacan en las Figuras 29, y 31.

Alternativamente, existen ciertos genes que se activan durante el desarrollo fetal y que están desactivados en el tejido o la sangre de los adultos. En estas condiciones, podría ser importante identificar regiones de promotor sin metilar comparando el patrón de no metilación del ADNcf aislado de mujeres embarazadas con un feto diploide, un feto que contiene una trisomía y sin embarazo. Para identificar patrones de pérdida de metilación en todo el genoma, pueden usarse los métodos que se describen en las Figuras 51, 57 o 62. Para identificar genes conocidos de no metilación en los cromosomas seleccionados, pueden diseñarse sondas para regiones diana específicas y evaluar la metilación como en las Figuras 53, 55, 58, 60. Este enfoque también podría usarse en el ensayo de identificación sistemática prenatal final.

Además, el enfoque anterior podrá cuantificar con exactitud los cambios de metilación en otras posiciones del genoma, que puedan dar como resultado enfermedades asociadas a la impronta genómica, tales como el síndrome de Angelman o el síndrome de Prader-Willi. La capacidad de la presente invención para determinar el estado de metilación y al mismo tiempo determinar si la deleción está en el cromosoma paterno o materno por detección de SNP o polimorfismos de secuencia repetitiva (es decir, detección de los SNP o polimorfismos de secuencia repetitiva de identificación materna o paterna ubicados en cis corriente arriba o corriente abajo), potenciará su discriminación diagnóstica de enfermedades de impronta genómica.

Recientemente se ha informado de un enfoque basado en ligasa para hacer el recuento de fragmentos cromosómicos para el diagnóstico prenatal no invasivo denominado DANSR (Sparks et al., "Selective Analysis of Cell-free DNA in Maternal Blood for Evaluation of Fetal Trisomy", Prenat Diagn. 32(1):3-9 (2012)). Este enfoque se basa en el uso de 3 fragmentos en una reacción de ligamiento en el brazo cromosómico: un fragmento izquierdo que contiene una secuencia universal corriente arriba, un fragmento intermedio y un fragmento derecho que contiene una secuencia universal corriente abajo. Después de una reacción de ligamiento, los productos se separan de los cebadores entrantes, se amplifican por PCR y se secuencian. Los ligamientos falsos (es decir, corriente arriba directamente al cebador corriente abajo incorrecto, sin fragmento intermedio) se distinguen fácilmente por secuenciación y fueron inferiores a un 5 %. La presente invención también puede usar este enfoque, ya sea capturando dianas específicas de los productos ligados de todo el genoma, como se describe en las Figuras 63-69, o usando sondas específicas de diana durante el suceso de ligamiento inicial, como se describe en las Figuras 13-26 o las Figuras 70-78.

Dado que el enfoque mencionado anteriormente depende del recuento de las regiones cromosómicas, la exactitud de la técnica puede mejorarse aprovechando los polimorfismos en tales regiones. Las Figuras 70, 77 y 78 describen un conjunto de técnicas para capturar fragmentos que contienen polimorfismos de secuencia repetitiva. Estos polimorfismos permitirán identificar las diferencias en el número de copias, ya sea en todo el genoma o en lugares definidos, ya sea para ganancias o pérdidas de copias - esto también es relevante para el análisis del genoma del cáncer. La trisomía puede surgir de la no disyunción durante la meiosis inicial o durante la segunda meiosis. Por ejemplo, se puede tomar el caso de la espermatogénesis. Si la no disyunción se produce en la primera división meiótica, entonces los cromosomas homólogos se mueven al mismo polo durante la anafase. Cuando estos se dividen a continuación para formar gametos, dos serán disómicos (conteniendo 1 de cada uno de los cromosomas originales) y dos serán nulosómicos. Si estos gametos fertilizan un ovocito euploide, los cigotos resultantes podrían ser 2 trisómicos (1 1 1) y dos monosómicos. Si, por otra parte, la no disyunción se produce en la segunda división meiótica, entonces las cromátidas hermanas se mueven al mismo polo durante la anafase. Cuando estas se dividen a continuación para formar gametos, una será disómica (conteniendo 2 de los mismos cromosomas parentales) y una será nulosómica, y dos serán euploides (1 cromosoma cada uno). Si estos gametos fertilizan un ovocito euploide, los cigotos resultantes podrían ser 1 trisómico (2 1), y uno monosómico, y dos euploides (disómicos). Lo mismo es cierto para los cromosomas maternos. De ese modo, un feto con trisomía puede tener varias combinaciones diferentes de cromosomas paternos y maternos.

El ejemplo de 1.000 equivalentes genómicos para el ADN materno y 100 equivalentes genómicos para el ADN fetal puede usarse para ilustrar la diferencia en la distinción al evaluar la presencia de copias frente a la presencia de polimorfismos. Cuando se usan marcadores altamente polimórficos tales como las repeticiones de tetranucleótidos, no es inusual que 3 o los 4 polimorfismos sean diferentes. Los resultados se compararán con estos casos, en donde los marcadores para el cromosoma materno o paterno son iguales o diferentes. El cromosoma 2 se usará como control y el 21 como ejemplo para la trisomía.

Caso 1 (solo número de copias)

Materno Feto Total

Crom. 2 2.000 200 2.200

Crom. 21 2.000 300 2.300

Caso 2 (marcadores maternos homocigóticos, no disyunción materna, primera meiosis)

Materno Feto Total Crom. 2M1 1.000 0 Crom. 2M2 1.000 100 2.100* Crom. 2P1 0 100 100 Crom. 2P2 0 0 0 Crom. 21M1 1.000 100 Crom. 21M2 1.000 100 2.200* Crom. 21P1 0 100 100 (continuación)

Materno Feto Total Crom. 21P2 0 0 0 *Nota: Dado que los alelos 2M1 y 2M2 son iguales, total = 2.100. Del mismo modo, dado que los alelos 21M1 y 21M2 son iguales, total = 2.200. Los alelos paternos pueden ser heterocigóticos u homocigóticos

Caso 3 (marcadores maternos homocigóticos, no disyunción materna, segunda meiosis)

Materno Feto Total Crom. 2M1 1.000 0 Crom. 2M2 1.000 100 2.100* Crom. 2P1 0 100 100 Crom. 2P2 0 0 0 Crom. 21M1 1.000 0 Crom. 21M2 1.000 200 2.200* Crom. 21P1 0 100 100 Crom. 21P2 0 0 0 *Nota: Dado que los alelos 2M1 y 2M2 son iguales, total = 2.100. Del mismo modo, dado que los alelos 21M1 y 21M2 son iguales, total = 2.200. Los alelos paternos pueden ser heterocigóticos u homocigóticos

Caso 4 (marcadores maternos heterocigóticos, no disyunción materna, primera meiosis)

Materno Feto Total

Crom. 2M1 1.000 0 1.000

Crom. 2M2 1.000 100 1.100

Crom. 2P1 0 100 100

Crom. 2P2 0 0 0

Crom. 21M1 1.000 100 1.100

Crom. 21M2 1.000 100 1.100

Crom. 21P1 0 100 100

Crom. 21P2 0 0 0

Caso 5 (marcadores maternos heterocigóticos, no disyunción materna, segunda meiosis)

Materno Feto Total Crom. 2M1 1.000 0 1.000 Crom. 2M2 1.000 100 1.100 Crom. 2P1 0 100 100 Crom. 2P2 0 0 0 Crom. 21M1 1.000 0 1.000 Crom. 21M2 1.000 200* 1.200 Crom. 21P1 0 100 100 Crom. 21P2 0 0 0 *Nota: Hay una combinación adicional de trisomía en donde 2 copias del alelo 21M1 están en el ovocito fertilizado.

Caso 6 (marcadores maternos homocigóticos, no disyunción paterna, primera meiosis)

Materno Feto Total Crom. 2M1 1.000 0 Crom. 2M2 1.000 100 2.100* Crom. 2P1 0 100 100 Crom. 2P2 0 0 0 Crom. 21M1 1.000 0 Crom. 21M2 1.000 100 2.100* Crom. 21P1 0 100 100 Crom. 21P2 0 100 100 *Nota: Dado que los alelos 2M1 y 2M2 son iguales, total = 2.100. Del mismo modo, dado que los alelos 21M1 y 21M2 son iguales, total = 2.100. Los alelos paternos pueden ser heterocigóticos u homocigóticos

Caso 7 (marcadores maternos homocigóticos, no disyunción paterna, segunda meiosis)

Materno Feto Total Crom. 2M1 1.000 0 Crom. 2M2 1.000 100 2.100* Crom. 2P1 0 100 100 Crom. 2P2 0 0 0 Crom. 21M1 1.000 0 Crom. 21M2 1.000 100 2.100* Crom. 21P1 0 200 200 Crom. 21P2 0 0 0 *Nota: Dado que los alelos 2M1 y 2M2 son iguales, total = 2.100. Del mismo modo, dado que los alelos 21M1 y 21M2 son iguales, total = 2.100. Los alelos paternos pueden ser heterocigóticos u homocigóticos

Caso 8 (marcadores maternos heterocigóticos, no disyunción paterna, primera meiosis)

Materno Feto Total

Crom. 2M1 1.000 0 1.000

Crom. 2M2 1.000 100 1.100

Crom. 2P1 0 100 100

Crom. 2P2 0 0 0

Crom. 21M1 1.000 0 1.000

Crom. 21M2 1.000 100 1.100

Crom. 21P1 0 100 100

Crom. 21P2 0 100 100

Caso 9 (marcadores maternos heterocigóticos, no disyunción paterna, segunda meiosis)

Materno Feto Total Crom. 2M1 1.000 0 1.000 Crom. 2M2 1.000 100 1.100 Crom. 2P1 0 100 100 Crom. 2P2 0 0 0 Crom. 21M1 1.000 0 1.000 (continuación)

Materno Feto Total Crom. 21M2 1.000 100 1.100 Crom. 21P1 0 200 200 Crom. 21P2 0 0 0 *Nota: Hay una combinación adicional de trisomía en donde 2 copias del alelo 21P2 están en el ovocito fertilizado.

A partir de este análisis, está claro que para distinguir la trisomía, los marcadores más útiles son aquellos en donde los loci maternos son polimórficos y los loci paternos son diferentes a ambos alelos maternos. No es necesario que los loci paternos sean polimórficos. Para deleciones relacionadas con el cromosoma X, tales como las que se encuentran en la distrofia muscular de Duchenne, el enfoque es más simple, ya que la enfermedad se manifiesta principalmente en niños varones. De nuevo, comparar el cromosoma 2 con el cromosoma X en el área de la deleción podría dar como resultado:

Caso 10 (marcadores maternos heterocigóticos, deleción relacionada con el cromosoma X hereditaria)

Materno Feto Total

Crom. 2M1 1.000 0 1.000

Crom. 2M2 1.000 100 1.100

Crom. 2P1 0 100 100

Crom. 2P2 0 0 0

Crom. XM1 1.000 0 1.000

Crom. XM2 0* 0* 0

Crom. XP1 0 0 0

Crom. YP2 0 100 100

*Nota: deleción de región hereditaria

Caso 11 (marcadores maternos heterocigóticos, el feto no contiene deleción relacionada con el cromosoma X)

Materno Feto Total

Crom. 2M1 1.000 0 1.000

Crom. 2M2 1.000 100 1.100

Crom. 2P1 0 100 100

Crom. 2P2 0 0 0

Crom. XM1 1.000 100 1.100

Crom. XM2 0* 0* 0

Crom. XP1 0 0 0

Crom. YP2 0 100 100

*Nota: deleción de región hereditaria

Caso 11 (marcadores maternos heterocigóticos, deleción relacionada con el cromosoma X esporádica)

Materno Feto Total

Crom. 2M1 1.000 0 1.000

Crom. 2M2 1.000 100 1.100

Crom. 2P1 0 100 100

Crom. 2P2 0 0 0

Crom. XM1 1.000 0 1.000

(continuación)

Materno Feto Total

Crom. XM2 1.000 0* 1.000

Crom. XP1 0 0 0

Crom. YP2 0 100 100

*Nota: deleción de región hereditaria

El caso 10 muestra la distrofia muscular de Duchenne hereditaria, en donde la madre es portadora. En estas condiciones, el porcentaje de la cantidad total de dos alelos del cromosoma X parece ser la mitad del de otras posiciones. En el caso 11, el feto no tiene la enfermedad, y en el caso 12 la enfermedad es una mutación esporádica que aparece en el feto. El marcador del cromosoma Y confirma que el feto es varón. Lo anterior muestra el modo en que se podría realizar el genotipado en el locus DMD. Si existe conocimiento previo de que la madre es portadora, entonces puede determinarse la sincronización de la deleción con polimorfismos adyacentes (véase posteriormente) y, a continuación, estos polimorfismos adyacentes también pueden usarse para verificar si el feto también es portador de la deleción, y si el feto es varón y susceptible de enfermedad. Este enfoque puede usarse para encontrar cambios dominantes relacionados con el cromosoma X y autosómicos.

Para determinar si el feto contiene una mutación hereditaria o esporádica en uno de los otros aproximadamente 3.500 trastornos, incluyendo deleciones, mutaciones puntuales o metilación anómala, podría recomendarse un análisis más sofisticado. El análisis de secuencias determina fácilmente la presencia del alelo recesivo en ambos padres. Si la mutación es diferente en los padres, es posible determinar si el niño es un heterocigoto compuesto para la enfermedad evaluando el ADN libre circulante del suero materno. Para obtener la respuesta completa del análisis del ADN fetal en el suero materno este ensayo puede requerir dos partes. La primera es establecer la fase para los SNP o polimorfismos maternos en regiones repetidas que rodean el gen de la enfermedad. Esto puede conseguirse aislando el ADN de alto peso molecular de los glóbulos blancos de la madre o de la saliva del padre.

La determinación exacta de la fase o haplotipo puede conseguirse mediante el uso de una variación de un enfoque desarrollado por Complete Genomics (véase Peters et al., "Accurate Whole-genome Sequencing and Haplotyping from 10 to 20 Human Cells", Nature 487(7406): 190-5 (2012)). Para la presente solicitud, se distribuye ^aDⁿH^mW (de alto peso molecular) en placas de 96 o 384 pocillos de modo que exista menos de un cromosoma por pocillo. Posteriormente, se usa amplificación del genoma completo para determinar los pocillos que contienen el cromosoma y, a continuación, se determina la fase de 96 SNP o polimorfismos de secuencia repetitiva adyacentes al alelo de la enfermedad materna para el gen en cuestión. Una vez conseguido esto, se evalúa la presencia del alelo de la enfermedad a partir del padre (como se describe en el enfoque 4 mencionado anteriormente) y, usando la secuenciación, se verifica que el cromosoma que se hereda de la madre también contiene un alelo de la enfermedad. En el presente documento se describen múltiples enfoques para capturar secuencias repetitivas de ADN en todo el genoma, que pueden usarse para identificar polimorfismos a partir de ADN original o amplificado en el genoma completo.

La capacidad para determinar los haplotipos a partir de genomas diploides sigue siendo una tarea técnicamente compleja y de coste elevado que se basa esencialmente en el aislamiento físico de cromosomas o fragmentos subcromosómicos antes del genotipado por secuenciación o alguna otra tecnología. Lo que sigue a continuación describe un procedimiento rápido y sencillo para capturar dos regiones en la misma cadena de ADN genómico para permitir la determinación de la estructura de haplotipo definida por las dos regiones.

Para cada diana potencial, se hibridan dos oligonucleótidos simultáneamente, conteniendo cada uno secuencias complementarias a las partes corriente arriba y corriente abajo que flanquean cada uno de los dos polimorfismos en la diana. Estos polimorfismos pueden ser repeticiones de tetranucleótidos, trinucleótidos o dinucleótidos o SNP. Los polimorfismos que proporcionan más información son aquellos que son a la vez polimórficos en los cromosomas maternos y polimórficos en el cromosoma del padre que se transfiere al feto. Se usa polimerasa para la extensión desde cada uno de los dos extremos 3' para cerrar el hueco y determinar el genotipo de los polimorfismos ubicados entre los dos pares de secuencias de unión flanqueantes. No es necesario que los dos polimorfismos dirigidos sean necesariamente adyacentes entre sí, y pueden estar separados por otros polimorfismos. La distancia entre los dos polimorfismos de interés está limitada solo por la probabilidad de que se forme un puente con las cuatro secuencias de unión contenidas en los dos oligonucleótidos. Cada uno de los oligonucleótidos contiene una secuencia de identificador único, una secuencia de identificador de paciente opcional, una secuencia de unión de cebador opcional, y un fosfato opcional en el extremo 5'.

Protocolo detallado para la determinación del haplotipo entre dos polimorfismos conocidos:

Variación 8.1 (véase, por ejemplo, la Figura 113): 8.1.a. Se aísla ADN genómico mediante un método que produzca material de alto peso molecular (>15 kb).

8.1. b. Desnaturalizar el ADN diana (94 °C, 1 minuto) en presencia de dos oligonucleótidos (comprendiendo el primero una secuencia en el extremo 5' complementaria a una región única corriente arriba del polimorfismo diana n.° 1, una secuencia de identificador único, una secuencia de identificador de paciente opcional, una secuencia de unión de cebador opcional, y una secuencia en el extremo 3' complementaria a una región única corriente abajo del polimorfismo diana n.° 2 y comprendiendo el segundo una secuencia en el extremo 5' complementaria a una región única corriente arriba del polimorfismo diana n.° 2, una secuencia de identificador único, una secuencia de identificador de paciente opcional y una secuencia en el extremo 3' complementaria a una región única corriente abajo del polimorfismo diana n.° 1), y permitir que los oligonucleótidos se hibriden con sus regiones complementarias en los fragmentos deseados mediante enfriamiento a una temperatura deseada (por ejemplo, 50 °C durante 2 horas). Se añaden polimerasa Taq y/o KlenTaq (polimerasa Taq que carece de actividad de nucleasa), y ligasa termoestable (preferentemente de la cepa AK16D), y los dNTP después de la etapa de hibridación, o al comienzo del procedimiento. En el caso en el que ambas secuencias oligonucleotídicas tengan un fosfato 5', KlenTaq extiende el extremo 3' hasta que sea directamente adyacente al extremo 5' competente para ligamiento (lado izquierdo de la Figura 113). En el caso en el que ambas secuencias oligonucleotídicas tengan un OH 5', la actividad de nucleasa 5— 3' de la polimerasa escinde la base solapante 5' de emparejamiento para crear un fosfato 5' competente para ligamiento (lado derecho de la Figura 113). Permitir la extensión y el ligamiento a la temperatura de hibridación y, opcionalmente, aumentar la temperatura (por ejemplo, 60 °C) para garantizar la finalización de la extensión y el ligamiento, para generar productos circulares.

8.1. c. Añadir Exonucleasa I (digiere el ADN monocatenario en la dirección 3'—»5'), y Exonucleasa III (digiere el ADN bicatenario en la dirección 3— 5'), para digerir todos los productos sin ligar o con mellas, dejando solo el ADN monocatenario circular deseado que comprende el ADN diana original, la secuencia del conector, la secuencia de identificador único, una secuencia de unión de cebador opcional, y una secuencia de identificador de paciente opcional. Este producto es adecuado para la amplificación por círculo rodante (usando cebadores hexámeros aleatorios con polimerasa phi-29) para crear repeticiones en tándem de la secuencia deseada, y posterior identificación de las dianas usando secuenciación de nueva generación o, alternativamente, secuenciación SMRT directa en el molde cerrado covalentemente, usando la secuencia de unión de cebador como un sitio de unión de cebador.

Nota 1: este enfoque también permite establecer fácilmente el haplotipo (es decir, la fase) con la mutación real que causa la enfermedad. Los cebadores se diseñan de modo que uno de los sitios polimórficos sea el gen de la enfermedad real.

Nota 2: en los sistemas que usan dos sondas oligonucleotídicas puente, cada una conteniendo una secuencia de identificador único, una secuencia de identificador de paciente opcional y un sitio de unión de cebador opcional, se recomienda que solo uno y no ambos oligonucleótidos contenga un sitio de unión de cebador (ya sea el oligonucleótido corriente arriba o corriente abajo). Para un nivel adicional de detección de falsos positivos, se recomienda que la secuencia de identificador único sea diferente en las sondas corriente arriba y corriente abajo. Nota 3: es importante maximizar la formación de productos de ligamiento en donde las dos secuencias de unión a oligo están realmente unidas por un tramo contiguo de ADN, y minimizar la formación de productos de productos de ligamiento en donde los fragmentos unidos por puente no son contiguos.

Considerar el siguiente ejemplo con fines ilustrativos. La región corriente arriba se denomina "X" y tiene una repetición del tetranucleótido AGAT, mientras que la región corriente abajo se denomina "Y", y tiene una repetición del dinucleótido CA. La región X corriente arriba se ilustra a continuación como "X-up", el sitio de unión de cebador corriente arriba, AGAT (n) es la región de repetición del tetranucleótido, y "X-dn" es el sitio de unión de cebador corriente abajo. La región Y corriente abajo se ilustra a continuación como "Y-up", el sitio de unión de cebador corriente arriba, CA (n) es la región de repetición del dinucleótido, e "Y-dn" es el sitio de unión de cebador corriente abajo. En este ejemplo, las dos regiones están separadas por 10 kb, y los dos cromosomas maternos tienen la forma:

X-up AGAT(12) X -dn........ (10 kb) ... Y-up CA(23) Y-dn

X-up AGAT(16) X -dn........ (10 kb) ... Y-up CA(18) Y-dn

A continuación, añadir cebadores de ligamiento - extensión que se unen a la cadena inferior (como en la Figura 113). Tendrán la forma:

(Izquierda) 5' X-dn - sitio de cebador - identificador n.° 1 - Y-up 3'

(Derecha) 5' Y-dn - identificador n.° 2 - X-up 3'

(En este ejemplo, el sitio de unión de cebador está solo en el cebador izquierdo).

A continuación, los 2 productos de ligamiento posibles definidos por los haplotipos (linealizados en el sitio de unión de cebador para que sea más fácil de seguir) podrían tener la forma:

sitio de cebador - identificador n.° 1 - Y-up CA(23) Y-dn -identificador n.° 2 - X-up AGAT(12) X-dn sitio de cebador - identificador n.° 1 - Y-up Ca (18) Y-dn -identificador n.° 2 - X-up AGAT(16) X-dn

La formación de los productos correctos que se obtienen a partir de sitios contiguos en los mismos fragmentos cromosómicos puede maximizarse diluyendo la reacción, de modo que la probabilidad de que se obtengan productos que se obtienen a partir de sitios no contiguos se vuelva infinitesimalmente pequeña. Además, dado que el cebador está en un gran exceso con respecto al ADN cromosómico, si dos fragmentos no son contiguos, entonces hay una probabilidad mucho mayor de que cada fragmento tenga ya un sitio de unión de cebador compuesto "izquierdo" y "derecho" (es decir, 4 cebadores que se unen a dos fragmentos separados). Solo cuando los dos fragmentos son contiguos existe una mayor probabilidad de que las dos regiones se unan entre sí por cada uno de los cebadores compuestos "izquierdo" y "derecho". Es un experimento sencillo para optimizar el rendimiento de los productos de ligamiento correctos mediante la generación de una matriz de condiciones de diferentes concentraciones diana frente a diferentes diluciones de los cebadores de ligamiento-extensión.

Si existen productos de ligamiento incorrectos que se obtienen a partir de dos regiones cromosómicas diferentes que se unen, entonces podría crearse erróneamente un producto en donde CA(23) está junto con AGAT(16), y CA(18) está junto con AG^aT(12).

Como ejemplo, considerar el peor de los escenarios, en donde un 80 % del producto de ligamiento se obtiene a partir de fragmentos unidos por puente que no son contiguos. Por cuestiones de simplicidad, suponer 1.000 equivalentes genómicos. Tener en cuenta que si el producto se obtiene a partir de fragmentos unidos por puente, entonces existe la misma posibilidad de que provengan del mismo cromosoma materno que de cromosomas opuestos (es decir, 400 cada uno). Pero los productos que se obtienen a partir de ADN contiguo solo provendrán del mismo cromosoma materno (es decir, 200 cada uno). De ese modo, deberían existir las siguientes combinaciones:

CA(23) y AGAT(12) 600 (= 400 200)

CA(23) y AGAT(16) 400

CA(18) y AGAT(12) 400

CA(18) y AGAT(16) 600 (= 400 200)

Incluso si estos números fluctuaran en 50 en la dirección menos favorable (equivalente a que un 90 % de los productos de ligamiento que surgen a partir de fragmentos unidos por puente, todavía sería sencillo distinguir el haplotipo en cada cromosoma como CA(23) y AGAT(12); así como ^cA(18) y AGAT(16).

CA(23) y AGAT(12) 550 (= 400 - 50 200)

CA(23) y AGAT(16) 450 (= 400 50)

CA(18) y AGAT(12) 450 (= 400 50)

CA(18) y AGAT(16) 550 (= 400 - 50 200)

Alternativamente, en un segundo enfoque, los genes de enfermedades pueden dividirse en las 20 enfermedades hereditarias más comunes, así como en enfermedades autosómicas dominantes, y a continuación dividirse en 17 grupos de secuencias mutadas menos frecuentes que cubren un promedio de 200 genes cada uno. Cada grupo de genes podría estar cubierto por conjuntos de sondas de captura y, a continuación, dependiendo de los resultados del análisis de secuenciación original, la sangre materna podría recibir identificadores de pacientes adecuados y podría evaluarse con uno o más de los 17 conjuntos de sondas de captura especiales.

El primero de los enfoques anteriores identificará mutaciones hereditarias y esporádicas, y también determinará si el feto heredó una región portadora de mutaciones de la madre. Este enfoque también podría ser capaz de determinar la presencia de deleciones para enfermedades hereditarias relacionadas con el cromosoma X, otras deleciones cromosómicas, metilación anómala en el feto, enfermedades que surgen de la repetición de tripletes y enfermedades que surgen de translocaciones cromosómicas u otros reordenamientos.

El segundo enfoque identificará las condiciones de enfermedad para los genes interrogados. La cuestión clave será la importancia que otorga la familia a la obtención de la respuesta correcta. Es sencillo determinar si ambos padres son portadores y si las mutaciones son diferentes, y es relativamente sencillo determinar si el alelo de la enfermedad del padre está presente en el feto. Si está ausente, entonces el feto estará libre de enfermedad o será portador. Si está presente, entonces las posibilidades de heredar el alelo materno y contraer la enfermedad son del 50 %. Si se ha determinado el haplotipo para el alelo materno, entonces pueden usarse marcadores de haplotipo para verificar la presencia o ausencia del alelo materno hereditario. También puede ser prudente realizar una amniocentesis y evaluar directamente la presencia del alelo materno. La recomendación actual es secuenciar el gen como se ha explicado anteriormente y evaluar el alelo de la enfermedad paterna. Si está presente, o si las mutaciones específicas de la enfermedad materna y paterna son idénticas, entonces el médico recomienda la amniocentesis. Los métodos de la presente invención también pueden usarse para el diagnóstico prenatal no invasivo y el diagnóstico genético preimplantatorio (PGD) de translocaciones cromosómicas desequilibradas. Las personas que son portadores de translocaciones cromosómicas tienen un mayor riesgo de infertilidad, aborto espontáneo, muerte fetal y/o tener un hijo con anomalías congénitas. El diagnóstico genético preimplantatorio es susceptible de distinguir entre embriones que tienen la cantidad correcta de material genético (equilibrado/normal) y embriones a los que les falta material genético como resultado de la translocación (desequilibrado). Muchas parejas en las que un miembro es portador de translocaciones han experimentado abortos espontáneos o han tenido que enfrentarse a decisiones difíciles al enterarse de un embarazo con un conjunto desequilibrado de cromosomas. Los métodos de PGD basado en la presente invención podrían reducir la probabilidad de tener que enfrentarse a estas circunstancias particulares sabiendo, antes de la concepción, que los embriones transferidos tienen translocaciones cromosómicas equilibradas.

El enfoque de evaluación de los SNP o polimorfismos de secuencia repetitiva específicos de cromosomas también puede usarse en la identificación sistemática previa al implante. A diferencia del embarazo, en donde solo la trisomía 21, 18 y 13 llegan a término (así como las anomalías relacionadas con el cromosoma X e Y), en la fertilización in vitro aún puede permitirse el crecimiento de otras anomalías cromosómicas en la fase de 16, 32 o un número de células más elevado. Por lo tanto, se necesitarán polimorfismos en todo el genoma para tener en cuenta tanto el número de copias adecuado como la pérdida o ganancia de regiones cromosómicas. Cuanto mayor sea el número de polimorfismos que se interrogan, más exacta podrá ser la determinación de cambios en el número de copias.

Ejemplo profético comparativo 7 -- Prueba de paternidad del feto (por ejemplo, apoyo de atención prenatal)

Visión general: el enfoque básico es buscar la presencia de alelos presentes en el padre, pero ausentes en la madre. Existen dos formas generales de abordar esto. Una puede comenzar con SNP en los que el alelo común tiene una frecuencia de aproximadamente un 70-75 %, de modo que hay aproximadamente un 50 % de posibilidades de que la madre sea homocigótica para el alelo principal. Se comienza con aproximadamente 48 SNP, de los cuales en aproximadamente la mitad de ellos (24) la madre será homocigótica para el alelo común, y existe un 50 % de posibilidades de que el padre sea heterocigótico u homocigótico para el alelo minoritario. Se evalúa simplemente la presencia del alelo minoritario en la sangre materna, de forma similar a la búsqueda de mutaciones, pero también se cuantifica la cantidad presente solo para confirmar que es un alelo minoritario del padre. Un segundo enfoque es comenzar con alelos con una frecuencia de aproximadamente un 50 %, por lo que existe un 50 % de posibilidades de que la madre sea homocigótica para uno de los alelos, y existe un 75 % de posibilidades de que el padre tenga el otro alelo en esa posición. Este enfoque proporciona algo menos de información para diferenciar a los padres, pero el número de posiciones que proporcionarán información será mayor. Un tercer enfoque es usar polimorfismos de secuencia repetitiva, en los que exista un alto grado de polimorfismo, de modo que exista una alta probabilidad de que el alelo del padre sea diferente de cualquiera de los alelos de la madre en una posición determinada. Esto podría requerir la menor cantidad de alelos. En todas estas condiciones, el médico debe asegurarse de respetar la privacidad de la madre en caso de que el esposo no sea el padre del feto (no paternidad).

ı22















Claims

REIVINDICACIONES

1. Un método para identificar, en una muestra, una o más moléculas de ácido nucleico que comprenden potencialmente primeras y segundas regiones diana distintas acopladas entre sí, comprendiendo dicho método:

la generación de una o más uniones competentes para ligamiento adecuadas para acoplar los extremos 3' de las primeras sondas oligonucleotídicas a los extremos 5' de las segundas sondas oligonucleotídicas de un conjunto de sondas y para acoplar los extremos 5' de las primeras sondas oligonucleotídicas a los extremos 3' de las segundas sondas oligonucleotídicas de un conjunto de sondas cuando dichos conjuntos de sondas se hibridan con las primera y segunda regiones diana complementarias de una molécula de ácido nucleico;

2. El método de la reivindicación 1, en donde dicha generación de una o más uniones competentes para ligamiento comprende:

la extensión de los extremos 3' de las primera y/o segunda sondas oligonucleotídicas con una polimerasa para formar uniones de ligamiento con los extremos 5' de las segunda y/o primera sondas oligonucleotídicas, respectivamente.

3. El método de la reivindicación 2, en donde dicha polimerasa comprende actividad de exonucleasa 5' a 3' o actividad de exonucleasa 3' a 5'.

4. El método de la reivindicación 1, en donde dicha generación de una o más uniones competentes para ligamiento comprende:

la liberación de un OH 3' y/o un fosfato 5' en dichas primera y/o segunda sondas oligonucleotídicas adecuados para ligamiento.

5. El método de la reivindicación 1 que comprende además:

la retirada de las primera y segunda sondas oligonucleotídicas sin ligar, y otras moléculas de ácido nucleico no circularizadas de la muestra antes de dicha detección.

6. El método de la reivindicación 1, en donde dicha detección y distinción comprende:

la secuenciación de los productos ligados circulares en la muestra.

7. Un método para identificar, en una muestra, una o más moléculas de ácido ribonucleico diana que difieren de otras moléculas de ácido nucleico en la muestra en una o más bases, comprendiendo dicho método:

8. El método de la reivindicación 7 que comprende además:

la retirada de primeras sondas oligonucleotídicas sin ligar y otras moléculas de ácido nucleico no circularizadas de la muestra después de dicho ligamiento.

9. El método de la reivindicación 7, en donde dicha detección y distinción comprende:

la secuenciación de los productos ligados circulares en la muestra.

10. Un método para identificar, en una muestra, una o más moléculas de ácido ribonucleico diana que difieren de otras moléculas de ácido nucleico en la muestra en una o más bases, comprendiendo dicho método:

11. El método de la reivindicación 10, en donde dicha detección y distinción comprende:

la secuenciación de los productos de ligamiento circulares en la muestra.

12. Un método para identificar, en una muestra, una o más moléculas de ácido ribonucleico diana que difieren de otras moléculas de ácido nucleico en la muestra en una o más bases, comprendiendo dicho método:

el ligamiento de los extremos 3' y 5' de cada segunda sonda oligonucleotídica para formar productos ligados circulares que comprenden una copia de ácido desoxirribonucleico de la secuencia de ácido ribonucleico diana acoplada a la parte adicional de la segunda sonda oligonucleotídica; y

13. El método de la reivindicación 12, en donde dicha detección y distinción comprende:

la secuenciación de las secuencias de producto ligado circular en la muestra.