ES2835101T3 - Detección de ácidos nucleicos - Google Patents

Detección de ácidos nucleicos Download PDF

Info

Publication number
ES2835101T3
ES2835101T3 ES17750678T ES17750678T ES2835101T3 ES 2835101 T3 ES2835101 T3 ES 2835101T3 ES 17750678 T ES17750678 T ES 17750678T ES 17750678 T ES17750678 T ES 17750678T ES 2835101 T3 ES2835101 T3 ES 2835101T3
Authority
ES
Spain
Prior art keywords
nucleic acid
examples
dcas9
stranded
region
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
ES17750678T
Other languages
English (en)
Inventor
Nils Walter
Muneesh Tewari
Alexander Johnson-Buck
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
University of Michigan
Original Assignee
University of Michigan
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by University of Michigan filed Critical University of Michigan
Application granted granted Critical
Publication of ES2835101T3 publication Critical patent/ES2835101T3/es
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/113Non-coding nucleic acids modulating the expression of genes, e.g. antisense oligonucleotides; Antisense DNA or RNA; Triplex- forming oligonucleotides; Catalytic nucleic acids, e.g. ribozymes; Nucleic acids used in co-suppression or gene silencing
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/16Hydrolases (3) acting on ester bonds (3.1)
    • C12N9/22Ribonucleases RNAses, DNAses
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6813Hybridisation assays
    • C12Q1/6816Hybridisation assays characterised by the detection means
    • C12Q1/6818Hybridisation assays characterised by the detection means involving interaction of two or more labels, e.g. resonant energy transfer
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6813Hybridisation assays
    • C12Q1/6832Enhancement of hybridisation reaction
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6813Hybridisation assays
    • C12Q1/6834Enzymatic or biochemical coupling of nucleic acids to a solid phase
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6813Hybridisation assays
    • C12Q1/6834Enzymatic or biochemical coupling of nucleic acids to a solid phase
    • C12Q1/6837Enzymatic or biochemical coupling of nucleic acids to a solid phase using probe arrays or probe chips
    • CCHEMISTRY; METALLURGY
    • C40COMBINATORIAL TECHNOLOGY
    • C40BCOMBINATORIAL CHEMISTRY; LIBRARIES, e.g. CHEMICAL LIBRARIES
    • C40B40/00Libraries per se, e.g. arrays, mixtures
    • C40B40/04Libraries containing only organic compounds
    • C40B40/06Libraries containing nucleotides or polynucleotides, or derivatives thereof
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2310/00Structure or type of the nucleic acid
    • C12N2310/10Type of nucleic acid
    • C12N2310/20Type of nucleic acid involving clustered regularly interspaced short palindromic repeats [CRISPRs]
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2800/00Nucleic acids vectors
    • C12N2800/80Vectors containing sites for inducing double-stranded breaks, e.g. meganuclease restriction sites

Landscapes

  • Chemical & Material Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Organic Chemistry (AREA)
  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Genetics & Genomics (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Molecular Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biotechnology (AREA)
  • General Engineering & Computer Science (AREA)
  • Biochemistry (AREA)
  • Microbiology (AREA)
  • General Health & Medical Sciences (AREA)
  • Biophysics (AREA)
  • Physics & Mathematics (AREA)
  • Analytical Chemistry (AREA)
  • Immunology (AREA)
  • Biomedical Technology (AREA)
  • Medicinal Chemistry (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Plant Pathology (AREA)
  • General Chemical & Material Sciences (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Apparatus Associated With Microorganisms And Enzymes (AREA)
  • Enzymes And Modification Thereof (AREA)

Abstract

Un complejo para proporcionar una señal de firma cinética distintiva detectable de un ácido nucleico diana bicatenario producida mediante una interacción de dicha diana con una sonda de búsqueda, comprendiendo el complejo: a) un ácido nucleico diana bicatenario que comprende una primera región adyacente a una segunda región; b) un componente de fusión inmovilizado que interacciona con la primera región para formar un complejo termodinámicamente estable y proporcionar la segunda región en una forma monocatenaria, en donde dicho componente de fusión comprende un componente que se une a un ácido nucleico específico de secuencia que interacciona con un ácido nucleico bicatenario y disocia dicho ácido nucleico o regiones bicatenarias de dicho ácido nucleico para proporcionar un ácido nucleico monocatenario o regiones monocatena10 rias de dicho ácido nucleico para proporcionar un acceso a las regiones de búsqueda para unir una sonda de búsqueda; y c) una sonda de búsqueda que se hibrida repetidamente con la segunda región con una constante de velocidad cinética kdisociación que es superior a 0,1 min-1 y/o una constante de velocidad cinética kasociación que es superior a 0,1 min-1 para proporcionar una señal de firma cinética distintiva detectable asociada con el ácido nucleico dia na bicatenario.

Description

DESCRIPCIÓN
Detección de ácidos nucleicos
Esta solicitud reivindica la prioridad de la solicitud de patente provisional de los Estados Unidos con número de serie 62/293.589, presentada el 10 de febrero de 2016.
Declaración sobre la investigación o el desarrollo patrocinado federalmente
Esta invención se realizó bajo el apoyo del gobierno con la subvención GM062357 otorgada por los Institutos Nacio­ nales de Salud de EE.UU., y con la subvención W911NF-12-1-0420 otorgada por la Oficina de Investigación Naval de la Marina de EE.UU. El gobierno tiene ciertos derechos sobre la invención.
Campo
En este documento se proporciona una tecnología relacionada con la detección e identificación de ácidos nucleicos y en particular, pero no exclusivamente, con composiciones, métodos, kits y sistemas para detectar, identificar y cuantificar ácidos nucleicos diana con gran seguridad y una resolución de molécula individual.
Antecedentes
Una detección temprana es fundamental para el tratamiento eficaz de muchas enfermedades, especialmente el cáncer. Una investigación relacionada con la identificación de biomarcadores detectables asociados con una enfer­ medad en etapa temprana, ha indicado que los ácidos nucleicos proporcionan biomarcadores altamente específicos del cáncer y de otras enfermedades. Por ejemplo, un ADN bicatenario obtenido a partir de células cancerosas (ADNbc) junto con un ARN largo no codificante de estructura secundaria (ARNInc) han surgido recientemente como biomarcadores sensibles y específicos del cáncer y de otras enfermedades en biofluidos humanos crudos, tales como la sangre, la orina y el esputo.
Sin embargo, a pesar de que son una promesa como biomarcadores de diagnóstico, una detección sensible y espe­ cífica de los biomarcadores de ácidos nucleicos supone un reto. En particular, las técnicas existentes para detectar ácidos nucleicos utilizan sondas que forman un complejo termodinámicamente estable con la molécula diana y, por tanto, están limitadas a una discriminación termodinámica débil y frecuentemente poco fiable frente a una señal de fondo, dianas falsas o ácidos nucleicos mutantes estrechamente relacionados. Además, la presencia de una cadena de ADN o ARN complementaria en la muestra limita gravemente la accesibilidad a la secuencia diana.
Por tanto, se necesita un ensayo sensible y específico para una detección sin amplificación de los ácidos nucleicos en biofluidos naturales mínimamente tratados, para proporcionar una identificación y/o cuantificación rápida y fiable de biomarcadores de ácidos nucleicos.
El documento EP 2800811 A1 describe una serie de sondas de ADN de 8 nucleótidos, complementarias a regiones diana, en donde la unión de sondas de búsqueda cortas y un complejo ternario Cas9-ARNtracr:ARNcr con el ARN diana, se analizó sobre un gel de poliacrilamida. Esto último es diferente de la huella genética de la presente inven­ ción, que es una señal de firma cinética basada en la hibridación repetida de una sonda de búsqueda, tal y como se define en la reivindicación 1 independiente adjunta del complejo y la reivindicación 10 del método.
Compendio
La invención se expone en las reivindicaciones adjuntas. Las realizaciones de la descripción que no entran dentro del alcance de dichas reivindicaciones, se proporcionan únicamente con fines ilustrativos y no forman parte de la presente invención. En consecuencia, en este documento se proporciona una tecnología para la detección y el re­ cuento específicos y ultrasensibles de moléculas individuales de dianas de ácido nucleico (por ejemplo, ADNbc, ARNInc, ADN metilado, etc.), basada en la unión transitoria de sondas cortas marcadas con un ácido nucleico diana. El ácido nucleico diana se detecta mediante una señal cinética de "huella genética" producida por la interacción entre sonda-diana tal y como se define en las reivindicaciones. Esta tecnología de reconocimiento de una molécula individual con muestreo en equilibrio de Poisson (SiMREPS, por sus siglas en inglés “Single-Molecule Recognition with Equilibrium Poisson Sampling”) proporciona una detección sensible tanto de ácidos nucleicos monocatenarios (véase, por ejemplo, el documento US 2016/0046988 A1) como de ácidos nucleicos bicatenarios. La detección de ácidos nucleicos bicatenarios puede comprender el uso de una captura guiada por dCas9 y una fusión (desnaturali­ zación) del ADN. Esta tecnología puede comprender la captura de dianas no marcadas sobre una superficie de vidrio o sílice fundida, utilizando una enzima dCas9 catalíticamente inactiva ("muerta") cargada con ARN guía (ARNg) o enzimas que se unen a uno o varios segmentos del ácido nucleico diana con especificidad elevada. En algunos ejemplos (p. ej., para detectar ARNInc), la tecnología comprende además el uso de un oligonucleótido del motivo adyacente de protoespaciador (PAM) para proporcionar que dCas9 se dirija a dianas de ácido nucleico (p. ej., ARNlnc).
La tecnología puede comprender el uso de una sonda SiMREPS intramolecular, por ejemplo, una sonda de captura y una sonda de búsqueda que están unidas para proporcionar un mecanismo de sondeo intramolecular (véase, por ejemplo, la Fig, 5a y b; véase más abajo).
Más ampliamente, en algunos ejemplos, uno o varios complejos (por ejemplo, uno o varios complejos de dCas9/ARNg) reconocen segmentos específicos (por ejemplo, secuencias de nucleótidos) en un ácido nucleico diana para inmovilizar el ácido nucleico diana en una superficie, Además, los ejemplos proporcionan que estos mis­ mos u otros complejos y/o oligonucleótidos complementarios fusionan regiones bicatenarias del ácido nucleico diana para proporcionar un acceso para la unión de una sonda de búsqueda marcada (por ejemplo, para la unión de la sonda de búsqueda a un segundo segmento, por ejemplo, una región de búsqueda), La captura en la superficie (y, en algunos ejemplos, la fusión de una o varias regiones de doble hebra) va seguida de una observación de la unión transitoria repetida de una sonda de búsqueda de ADN corta marcada con fluorescencia con el segundo segmento (por ejemplo, una región de búsqueda) del ácido nucleico diana que se ha vuelto accesible mediante una fusión mediada por dCas9,
Adicionalmente, además de usar dCas9/ARNg para la inmovilización y/o la exposición de secuencias diana (p, ej,, una o varias regiones de búsqueda), los ejemplos también proporcionan una tecnología en la que un complejo dCas9/ARNg marcado (p, ej,, marcado con fluorescencia) proporciona la detección del ácido nucleico diana, En particular, el complejo dCas9/ARNg proporciona una sonda de búsqueda para SiMREPS, ya que el tiempo de per­ manencia de dCas9/ARNg sobre una secuencia de ADN es sensible al número de pares de bases formadas entre el ARNg y la secuencia de ADN diana, Ejemplos de la tecnología proporcionan que el número de pares de bases for­ madas entre el ARNg y el ADN diana se ajusta para favorecer una disociación rápida de las secuencias mutantes pero una disociación lenta de las secuencias de tipo silvestre o viceversa, Además, las proteínas dCas9 modificadas genéticamente proporcionan la cinética y la especificidad de secuencia adecuadas (véase, por ejemplo, Kleinstiver et al, (2016) "High-fidelity CRISPR-Cas9 nucleases with no detectable genome-wide off-target effects" Nature 529: 490-495; Slaymaker et al, (2015) "Rationally engineered Cas9 nucleases with improved specificity" Science 351: 84­ 8) que se describe en proteínas Cas9 diseñadas genéticamente que interaccionan más débilmente que las Cas9 naturales con la estructura principal del ADN, reduciendo de este modo los efectos fuera de la diana,
En los ejemplos particulares descritos en este documento, las sondas de SiMREPS se unen repetidamente a una secuencia diana (por ejemplo, una región de búsqueda) que se ha vuelto específicamente accesible mediante la unión de dCas9/ARNg a una o varias regiones del ácido nucleico, adyacentes a la región diana (por ejemplo, "regio­ nes adyacentes"), La unión repetida de las sondas de búsqueda a la región de búsqueda proporciona una "huella genética" cinética continua, única, que proporciona un gran número de mediciones independientes para cada molé­ cula diana observada, Este muestreo cinético repetido ofrece dos ventajas principales: (1) una discriminación arbitra­ riamente alta frente a señales de ruido de fondo con mayor tiempo de muestreo, eliminando esencialmente las seña­ les de falsos positivos; y (2) una sensibilidad excepcional frente a diferencias sutiles en la identidad de la diana mo­ lecular, permitiendo una discriminación entre biomarcadores ligeramente diferentes (por ejemplo, que difieren en una sola base del ADN/ARN, de una mutación relacionada con una enfermedad, un patrón de metilación u otras marcas químicas) con una seguridad elevada, Además, como técnica para una molécula individual, este enfoque detecta una pequeña cantidad de molécula diana (como la obtenida a partir de una sola célula) en presencia de un gran exceso de una diana estrechamente relacionada, pero falsa (por ejemplo, mutante), A diferencia de las técnicas que requieren una amplificación mediante PCR (el patrón actual para dianas con poca abundancia), esta técnica no utiliza una amplificación de la diana y, por lo tanto, solo requiere un tratamiento previo de las muestras biológicas con, por ejemplo, dCas9/ARNg a temperatura ambiente, antes de la detección de la diana, evitando la introducción de un sesgo en el muestreo, Además, al ser una técnica de detección directa, no se pierde ninguna marca química sobre la diana, como suele ocurrir con los enfoques de detección basados en una amplificación, La técnica tiene uso, por ejemplo, en el diagnóstico de cáncer a partir de ADN tumoral circulante y ARNInc en suero sanguíneo hu­ mano, La tecnología también tiene uso en la detección de genes de resistencia a fármacos y antibióticos en agentes patógenos y células tumorales humanas, En consecuencia, en esta memoria se proporcionan ejemplos de un com­ plejo para proporcionar una huella genética detectable de un ácido nucleico diana bicatenario, en donde el complejo comprende un ácido nucleico diana bicatenario (por ejemplo, un ADN, un ARN, un híbrido de ADN/ARN) que com­ prende un primera región adyacente a una segunda región; un componente de fusión (por ejemplo, un componente de fusión inmovilizado) que interacciona con la primera región para formar un complejo termodinámicamente estable y proporcionar la segunda región en una forma monocatenaria; y una sonda de búsqueda que se une repetidamente a la segunda región para proporcionar una huella genética detectable asociada con el ácido nucleico diana bicatena­ rio, El ácido nucleico bicatenario puede ser un ácido nucleico monocatenario que comprende una región que tiene una estructura secundaria bicatenaria, El componente de fusión puede comprender una dCas9, El componente de fusión puede comprender una proteína de unión monocatenaria, El componente de fusión puede ser una proteína y, en algunos ejemplos, el componente de fusión es un ácido nucleico, Los ejemplos comprenden el uso de una proteí­ na que se une a ácidos nucleicos bicatenarios (p, ej,, ADN bicatenario, ARN bicatenario, un híbrido bicatenario de ADN/ARN) y/o un componente de fusión (p, ej,, una proteína o un ácido nucleico) para disociar un ácido nucleico bicatenario (por ejemplo, una región de un ácido nucleico) para proporcionar un ácido nucleico monocatenario, En ejemplos particulares, el componente de fusión comprende un complejo dCas9/ARNg que comprende un ARNg hibridado con la primera región, En algunos ejemplos, el componente de fusión comprende un PAMmer, por ejem­ plo, proporcionado en trans en relación con el ácido nucleico diana,
En algunos ejemplos, la sonda de búsqueda se hibrida repetidamente con la segunda región con una constante de velocidad cinética kdisociación, koff, que es superior a 0,1 min-1 y/o una constante de velocidad cinética kasociación ,kon, que es superior a 0,1 min-1. En algunos ejemplos, la sonda de búsqueda se híbrida repetidamente con la segunda región con una constante de velocidad cinética kdisociación que es superior a 1 min-1 y/o una constante de velocidad cinética kasociación que es superior a 1 min-1. En algunos ejemplos, la sonda de búsqueda es un ácido nucleico marcado con fluorescencia que se híbrida repetidamente con la segunda región con una constante de velocidad cinética kdisociación que es superior a 0,1 min-1 y/o una constante de velocidad cinética kasociación que es superior a 0,1 min-1. En algunos ejemplos, la sonda de búsqueda es un ácido nucleico marcado con fluorescencia que se híbrida repetidamente con la segunda región con una constante de velocidad cinética kdisociación que es superior a 1 min-1 y/o una constante de velocidad cinética kasociación que es superior a 1 min-1.
En algunos ejemplos, el componente de fusión comprende una dCas9 que está inmovilizada en un sustrato.
En algunos ejemplos, los datos se analizan, por ejemplo, en algunos ejemplos, la huella genética es detectable me­ diante un análisis de reconocimiento de patrones.
Ejemplos adicionales comprenden un segundo componente de fusión que interacciona con una tercera región del ácido nucleico diana, adyacente a la segunda región del ácido nucleico diana. En algunos ejemplos, el segundo componente de fusión comprende una dCas9. En algunos ejemplos, el segundo componente de fusión comprende una proteína de unión monocatenaria. En algunos ejemplos, el segundo componente de fusión es una proteína y en algunos ejemplos el segundo componente de fusión es un ácido nucleico. En ejemplos particulares, el segundo componente de fusión comprende un complejo de dCas9/ARNg que comprende un ARNg hibridado con la tercera región. En algunos ejemplos, el componente de fusión comprende un PAMmer, por ejemplo, proporcionado en trans en relación con el ácido nucleico diana. En algunos ejemplos, el primer y el segundo componentes de fusión se unen al ácido nucleico diana con una separación entre ellos de aproximadamente 5 a 15 nucleótidos, por ejemplo, para proporcionar un acceso a la región de búsqueda mediante una sonda de búsqueda.
La tecnología tiene uso en la detección, identificación y/o cuantificación de ácidos nucleicos, por ejemplo, en algunos ejemplos, el ácido nucleico diana comprende una mutación, un polimorfismo de un solo nucleótido o una base modi­ ficada.
Ejemplos adicionales proporcionan un método para proporcionar una huella genética detectable de un ácido nucleico diana bicatenario en una muestra, comprendiendo el método inmovilizar un ácido nucleico diana bicatenario en una región separada de un soporte sólido, comprendiendo dicho ácido nucleico diana bicatenario una primera región adyacente a una segunda región y dicha región separada de dicho soporte sólido comprende un componente de fusión inmovilizado que interacciona con la primera región; proporcionar una sonda de búsqueda que se une repeti­ damente a la segunda región para proporcionar una huella genética detectable; y asociar la huella genética detectable con el ácido nucleico bicatenario para identificar el ácido nucleico bicatenario. Algunos ejemplos comprenden analizar datos utilizando el reconocimiento de patrones o un análisis similar (por ejemplo, aprendizaje automático, red neuronal, aprendizaje supervisado y/o no supervisado, etc.) para producir o identificar la huella genética detecta­ ble del ácido nucleico bicatenario.
En algunos métodos, el componente de fusión comprende una dCas9. En algunos métodos, el componente de fu­ sión comprende una proteína de unión monocatenaria. En algunos métodos, el componente de fusión es una proteí­ na y en algunos ejemplos el componente de fusión es un ácido nucleico. En métodos particulares, el componente de fusión comprende un complejo dCas9/ARNg que comprende un ARNg hibridado con la primera región. En algunos métodos, el componente de fusión comprende un PAMmer, por ejemplo, proporcionado en trans en relación con el ácido nucleico diana.
Ejemplos adicionales comprenden proporcionar un segundo componente de fusión que interacciona con una tercera región del ácido nucleico diana, siendo dicha tercera región diana adyacente a la segunda región. Por ejemplo, algu­ nos ejemplos comprenden proporcionar un complejo dCas9/ARNg que comprende un ARNg complementario a una tercera región del ácido nucleico diana, adyacente a la segunda región del ácido nucleico diana. Ejemplos relaciona­ dos comprenden proporcionar condiciones suficientes para que el componente de fusión proporcione la segunda región en una forma de cadena secundaria, por ejemplo, condiciones de pH tamponado, control de temperatura, componentes de la solución (por ejemplo, sales, contraiones, cofactores, etc.), etc.
Algunos ejemplos comprenden detectar una unión repetida de la sonda de búsqueda a la segunda región con una constante de velocidad cinética kdisociación que es superior a 0,1 min-1 y/o una constante de velocidad cinética kasociación que es superior a 0,1 min-1. Algunos ejemplos comprenden detectar una unión repetida de la sonda de búsqueda a la segunda región con una constante de velocidad cinética kdisociación que es superior a 1 min-1 y/o una constante de velocidad cinética kasociación que es superior a 1 min-1. Algunos ejemplos comprenden detectar una unión repetida de un ácido nucleico marcado con fluorescencia a la segunda región con una constante de velocidad cinética kdisociación que es superior a 0,1 min-1 y/o una constante de velocidad cinética kasociación que es superior a 0,1 min-1. Algunos ejemplos comprenden detectar una unión repetida de un ácido nucleico marcado con fluorescencia a la segunda región con una constante de velocidad cinética kdisociación que es superior a 1 min-1 y/o una constante de velocidad cinética kasociación que es superior a 1 min-1.
Algunos ejemplos comprenden calcular una cantidad o una concentración del ácido nucleico diana bicatenario en la muestra a partir de la huella genética deteetable.
Ejemplos de la tecnología proporcionan un sistema para la detección de un ácido nucleico bicatenario, En algunos ejemplos, el sistema comprende un soporte sólido que comprende un componente de fusión inmovilizado, una son­ da de búsqueda marcada de forma detectable que se une repetidamente al ácido nucleico bicatenario, un detector de fluorescencia y un componente de un programa informático configurado para realizar un análisis de reconoci­ miento de patrones de los datos de la unión de la sonda de búsqueda. Los sistemas pueden comprender composi­ ciones descritas en este documento y/o comprender componentes (por ejemplo, un ordenador, procesador, etc.) para implementar los métodos tal y como se describe en este documento.
La tecnología puede tener uso en un método para calcular un factor pronóstico de que un sujeto tiene cáncer o tiene riesgo de padecer un cáncer. Por ejemplo, dichos métodos pueden comprender determinar la presencia de un biomarcador de microARN, determinar la presencia de una mutación y determinar la presencia de una base modificada en el ADN genómico. El factor pronóstico puede ser un valor calculado a partir de variables asociadas con la pre­ sencia de un biomarcador de microARN, la presencia de una mutación y la presencia de una base modificada en el ADN genómico.
Ejemplos relacionados proporcionan un complejo para detectar un ácido nucleico diana, comprendiendo el complejo un ácido nucleico diana que comprende una primera región adyacente a una segunda región; una sonda de captura marcada de forma detectable, hibridada con la primera región; una sonda de búsqueda marcada con un inhibidor de la fluorescencia o un aceptor de la fluorescencia compatible con el marcador de la sonda de captura, en donde la sonda de búsqueda se hibrida repetidamente con la segunda región con una constante de velocidad cinética kdisociación que es superior a 0,1 min-1 y/o una constante de velocidad cinética kasociación que es superior a 0,1 min-1.
Breve descripción de los dibujos
Estas y otras características, aspectos y ventajas de la presente tecnología se comprenderán mejor con respecto a los siguientes dibujos:
La Figura 1a es un dibujo esquemático de un ejemplo de la tecnología de detección de ácidos nucleicos proporcio­ nada en este documento.
La Figura 1b muestra datos de SiMREPS a modo de ejemplo, de sondas de búsqueda marcadas con fluorescencia que se asocian transitoriamente de forma no específica con la superficie de un portaobjetos.
La Figura 1c muestra datos de SiMREPS a modo de ejemplo, de sondas de búsqueda marcadas con fluorescencia que se unen transitoriamente a un ácido nucleico diana. Las huellas genéticas cinéticas de 1c y 1b son diferentes, proporcionando de este modo ejemplos de las diferentes firmas cinéticas para una unión específica y no específica de las sondas de búsqueda.
La Figura 1d es una serie de histogramas que indican el recuento de número de sondas de búsqueda para tener un número determinado de transiciones de intensidad (Nb+d), en ausencia (barras grises gruesas) o en presencia (líneas finas) de ácido nucleico diana 1 pM (por ejemplo, un microARN miR-141). Los cuatro histogramas trazan los datos adquiridos con tiempos de adquisición de 1,2, 5 y 10 minutos.
La Figura 1e muestra gráficos de curvas estándar de ensayos SiMREPS de cinco miARNs, que proporcionan valo­ res R2 > 0,99. La tecnología SiMREPS proporciona una detección de ácidos nucleicos de confianza elevada.
La Figura 2a es un gráfico que muestra que la sonda de búsqueda fluorescente para let-7a muestra una vida útil de unión a let-7a (Ton = 23,3 ± 8,3 s) prolongada, pero una unión mucho más transitoria a let-7c (Ton = 4,7 ± 3,0 s) debido a un único emparejamiento erróneo en la secuencia de let-7c con respecto a let-7a ("G" subrayada).
La Figura 2b es un análisis del tiempo de permanencia que muestra el nivel de discriminación de copia única de alta confianza entre let-7a (círculos negros) y let-7c (círculos blancos).
La Figura 2c es un gráfico de característica operativa del receptor (ROC) construido variando el umbral de Ton para discriminar entre let-7a y let-7c.
La Figura 2d es un histograma de Nb+d para la detección de let-7 en un extracto crudo de células HeLa en presencia o ausencia del inhibidor de let-7 miRCURY. El histograma de Nb+d para hsa-let-7a endógeno mostraba un pico bien definido (línea delgada) que desaparecía en presencia de un inhibidor de let-7 diseñado para unirse y secuestrar miembros de la familia de let-7 (barras grises gruesas).
La Figura 2e muestra los tiempos de permanencia de moléculas detectadas en un extracto crudo de HeLa usando las sondas fluorescentes y de captura para let-7a. Los círculos blancos y negros representan dos grupos de molécu­ las diana clasificadas mediante una agrupación de las medias de k de los valores de Tasociación, Ton, consistentes con las distribuciones de Tasociación esperadas para mutantes de un solo nucleótido hsa-let-7a y hsa-let-7c.
La Figura 2f muestra la cuantificación de miR-141 sintético añadido en suero humano.
La Figura 3 es un diagrama esquemático que muestra un ejemplo de la tecnología que comprende un dCas9/ARNg, El ADN diana genómico se trata previamente de forma breve con dCas9/ARNg. Durante ese tiempo, el ARN guía (ARNg) del complejo dCas9/ARNg se hibrida con el ácido nucleico diana (por ejemplo, un ADN genómico) en una región adyacente a una región de búsqueda (por ejemplo, complementaria a una sonda de búsqueda). El dCas9/ARNg fusiona una secuencia de a Dn específica (por ejemplo, la región de búsqueda) en el ácido nucleico diana. Después de la captura de dCas9 biotinilada sobre una superficie del portaobjetos (por ejemplo, mediante una interacción biotina-avidina), SiMREPS se utiliza para detectar la unión de la sonda de búsqueda a la región de bús­ queda ahora accesible en el ácido nucleico diana, que es adyacente al sitio del ácido nucleico diana hibridado con el ARNg.
La Figura 4 es un diagrama esquemático que muestra un ejemplo de la tecnología que comprende la hibridación de dos complejos flanqueantes de dCas9/ARNg con un ácido nucleico diana. En algunos ejemplos, la hibridación de dos complejos de dCas9/ARNg para flanquear la región de búsqueda mejora aún más la accesibilidad al ácido nu­ cleico diana (por ejemplo, la región de búsqueda) para la sonda de búsqueda en una detección basada en SiMREPS y, en algunos ejemplos, aumenta la especificidad. En el ejemplo que se muestra en la figura, una dCas9 está biotini­ lada para la captura sobre la superficie y la otra dCas9 no está biotinilada, aunque en algunos ejemplos la segunda dCas9 está modificada, por ejemplo, biotinilada.
La Figura 5a es un esquema que muestra un ejemplo de sondeo SiMREPS intramolecular en el que las sondas de búsqueda y de captura, están unidas sobre un oligonucleótido contiguo.
La Figura 5b es un esquema que muestra un ejemplo de sondeo SiMREPS intramolecular en el que las sondas de captura y de búsqueda que no son contiguas, están colocalizadas mediante un oligonucleótido de direccionamiento. Debe entenderse que las figuras no están necesariamente dibujadas a escala, ni los objetos en las figuras están necesariamente dibujados a escala entre sí. Las figuras son representaciones que pretenden aportar claridad y comprensión a diversos ejemplos de aparatos, sistemas y métodos descritos en esta memoria. Siempre que sea posible, se utilizarán los mismos números de referencia en todos los dibujos para hacer referencia a partes iguales o similares.
Descripción detallada
La invención se expone en las reivindicaciones adjuntas. Las realizaciones de la descripción que no caen dentro del alcance de dichas reivindicaciones se proporcionan únicamente con fines ilustrativos y no forman parte de la presen­ te invención. En esta memoria se proporciona una tecnología relacionada con la detección e identificación de ácidos nucleicos y, en particular, pero no exclusivamente, con composiciones, métodos, kits y sistemas para detectar, iden­ tificar y cuantificar ácidos nucleicos diana con gran seguridad y una resolución de molécula individual.
En esta descripción detallada de los diversos ejemplos, con fines explicativos se exponen numerosos detalles espe­ cíficos para proporcionar una comprensión completa de los ejemplos descritos. Un experto en la técnica apreciará, sin embargo, que estos diversos ejemplos se pueden poner en práctica con o sin esos detalles específicos. En otros casos, las estructuras y los dispositivos se muestran en forma de diagrama de bloques. Además, un experto en la técnica puede apreciar fácilmente que las secuencias específicas en las que se presentan y ejecutan los métodos son ilustrativas y se contempla que las secuencias pueden variar.
A menos que se defina de otro modo, todos los términos técnicos y científicos usados en esta memoria tienen el mismo significado que entiende comúnmente un experto en la técnica a la que pertenecen los diversos ejemplos descritos en esta memoria. Cuando las definiciones de los términos en las referencias parecen diferir de las defini­ ciones proporcionadas en las presentes enseñanzas, prevalecerá la definición proporcionada en las presentes en­ señanzas. Los títulos de las secciones que se utilizan en este documento son solo para fines organizativos.
Definiciones
Para facilitar la comprensión de la tecnología presente, a continuación se definen una variedad de términos y expre­ siones. Se establecen definiciones adicionales a lo largo de la descripción detallada.
A lo largo de la memoria descriptiva y las reivindicaciones, a los siguientes términos se otorgan los significados aso­ ciados explícitamente en este documento, a menos que el contexto indique claramente lo contrario. La expresión "en una realización" tal y como se usa en este documento, no se refiere necesariamente a la misma realización, aunque puede hacerlo. Además, la expresión "en otra realización" tal y como se usa en esta memoria, no se refiere necesa­ riamente a una realización diferente, aunque puede hacerlo. Por tanto, tal y como se describe a continuación, se pueden combinar fácilmente varias realizaciones de la invención.
Además, tal y como se usa en este documento, el término "o" es un operador "o" inclusivo y es equivalente al tér­ mino "y/o" a menos que el contexto indique claramente lo contrario. La expresión "basado en" no es exclusiva y permite estar basada en factores adicionales no descritos, a menos que el contexto indique claramente lo contrario. Además, a lo largo de la memoria descriptiva, el significado de "un", "una" y "el" incluyen las referencias en plural. El significado de "en" incluye "en" y "sobre".
Tal y como se usa en este documento, un "ácido nucleico" o una "secuencia de ácido nucleico" se refiere a un polí­ mero o a un oligómero de bases de pirimidina y/o purina, preferiblemente citosina, timina y uracilo, y adenina y gua­ nina, respectivamente (véase, Albert L. Lehninger, Principies of Biochemistry, at 793-800 (Worth Pub. 1982)). La presente tecnología contempla cualquier componente de ácido nucleico de un desoxirribonucleótido, ribonucleótido o péptido, y cualquier variante química de los mismos, tal como formas metiladas, hidroximetiladas o glicosiladas de estas bases y similares. Los polímeros o los oligómeros pueden tener una composición heterogénea u homogénea, y se pueden aislar a partir de fuentes naturales o pueden ser artificiales o producirse de forma artificial o sintética. Además, los ácidos nucleicos pueden ser ADN o ARN, o una mezcla de los mismos, y pueden existir de forma per­ manente o transitoria en forma monocatenaria o bicatenaria, incluyendo los estados de homodúplex, heterodúplex e híbrido. En algunos ejemplos, un ácido nucleico o una secuencia de ácido nucleico comprende otros tipos de estruc­ turas de ácido nucleico, tales como, por ejemplo, una hélice de ADN/ARN, ácido nucleico peptídico (PNA), morfolino, ácido nucleico bloqueado (LNA) y/o una ribozima. Por lo tanto, la expresión "ácido nucleico" o "secuencia de ácido nucleico" también puede incluir una cadena que comprende nucleótidos no naturales, nucleótidos modificados y/o elementos fundamentales no nucleotídicos que pueden mostrar la misma función que los nucleótidos naturales (p. ej., "análogos de nucleótidos"); además, la expresión "secuencia de ácido nucleico" tal y como se usa en este docu­ mento, se refiere a un oligonucleótido, un nucleótido o un polinucleótido, y a fragmentos o porciones de los mismos, y a ADN o ARN de origen genómico o sintético, que puede ser monocatenario o bicatenario, y representa la hebra con sentido o antisentido.
La expresión "análogo de nucleótido", tal y como se usa en este documento, se refiere a nucleótidos modificados o de origen no natural que incluyen, pero no se limitan a, análogos que tienen unas interacciones alteradas del apilamiento tales como purinas 7-desaza (es decir, 7-desaza-dATP y 7-desaza-dGTP); análogos de bases con configura­ ciones alternativas del enlace de hidrógeno (por ejemplo, tales como Iso-C e Iso-G y otros pares de bases no están­ dar descritos en el documento de patente de EE.ÜÜ. n26.001.983 de S. Benner); análogos sin enlaces de hidrógeno (por ejemplo, análogos de nucleósidos aromáticos no polares, tales como 2,4-difluorotolueno, descritos por B. A. Schweitzer y E. T. Kool, J. Org. Chem., 1994, 59, 7238-7242, B. A. Schweitzer y E. T. Kool, J. Am. Chem. Soc., 1995, 117, 1863-1872); bases "universales" tales como 5-nitroindol y 3-nitropirrol; y purinas y pirimidinas universales (tales como nucleótidos "K" y "P", respectivamente; P. Kong et al., Nucleic Acids Res., 1989, 17, 10373-10383, P. Kong et al., Nucleic Acids Res., 1992, 20, 5149-5152). Los análogos de nucleótidos incluyen nucleótidos que tienen modificaciones en el resto de azúcar, tales como didesoxi nucleótidos y 2'-O-metilnucleótidos. Los análogos de nu­ cleótidos incluyen formas modificadas de desoxirribonucleótidos así como ribonucleótidos.
"Ácido nucleico peptídico" significa un imitador de ADN que incorpora una estructura principal de poliamida similar a un péptido.
Tal y como se usa en este documento, la expresión "% de identidad de secuencia" se refiere al porcentaje de nucleótidos o análogos de nucleótidos en una secuencia de ácido nucleico que es idéntico a los nucleótidos corres­ pondientes en una secuencia de referencia, después de alinear las dos secuencias e introducir huecos, si es nece­ sario, para lograr el porcentaje máximo de identidad. Por tanto, en caso de que un ácido nucleico de acuerdo con la tecnología, sea más largo que una secuencia de referencia, los nucleótidos adicionales en el ácido nucleico, que no se alinean con la secuencia de referencia, no se tienen en cuenta para determinar la identidad de la secuencia. Los métodos y programas informáticos para una alineación son bien conocidos en la técnica, incluyendo blastn, Align 2 y FASTA.
El término "homología" y "homólogo" se refiere a un grado de identidad. Puede haber una homología parcial o una homología completa. Üna secuencia parcialmente homóloga es una que tiene menos del 100% de identidad con otra secuencia.
La expresión "variación de secuencia" tal y como se usa en este documento, se refiere a diferencias en la secuencia de ácido nucleico entre dos ácidos nucleicos. Por ejemplo, un gen estructural de tipo silvestre y una forma mutante de ese gen estructural de tipo silvestre pueden variar en la secuencia por la presencia de sustituciones de una sola base y/o deleciones o inserciones de uno o varios nucleótidos. Se dice que esas dos formas del gen estructural varían entre sí en la secuencia. Puede existir una segunda forma mutante del gen estructural. Se dice que esa se­ gunda forma mutante varía en la secuencia en relación tanto del gen de tipo silvestre como de la primera forma mutante del gen.
Tal y como se usa en este documento, los términos "complementario" o "complementariedad" se usan haciendo referencia a polinucleótidos (por ejemplo, una secuencia de nucleótidos tal como un oligonucleótido o un ácido nu­ cleico diana) relacionados por las reglas de emparejamiento de bases. Por ejemplo, la secuencia "5'-A-G-T-3'" es complementaria a la secuencia "3'-T-C-A-5'". La complementariedad puede ser "parcial", en la que solo algunas de las bases de los ácidos nucleicos se emparejan de acuerdo con las reglas de emparejamiento de bases. O puede ser una complementariedad "completa" o "total" entre los ácidos nucleicos. El grado de complementariedad entre las cadenas de ácido nucleico tiene efectos significativos sobre la eficacia y la fuerza de la hibridación entre las cadenas de ácido nucleico. Esto es de particular importancia en las reacciones de amplificación, así como en los métodos de detección que dependen de la unión entre ácidos nucleicos. Cualquiera de los dos términos también se puede usar haciendo referencia a nucleótidos individuales, especialmente dentro del contexto de los polinucleótidos. Por ejem­ plo, un nucleótido particular dentro de un oligonucleótido puede destacar por su complementariedad, o la falta de la misma, con un nueleótido dentro de otra hebra de ácido nucleico, por el contrario o en comparación con la complementariedad entre el resto del oligonucleótido y la hebra de ácido nucleico.
En algunos contextos, el término "complementariedad" y términos relacionados (por ejemplo, "complementario", "complemento"} se refiere a los nucleótidos de una secuencia de ácido nucleico que se pueden unir a otra secuencia de ácido nucleico a través de enlaces de hidrógeno, por ejemplo, los nucleótidos que son capaces de emparejar las bases, por ejemplo, mediante un emparejamiento de bases de Watson-Crick u otro emparejamiento de bases. Los nucleótidos que pueden formar pares de bases, por ejemplo, que son complementarios entre sí, son las parejas: citosina y guanina, timina y adenina, adenina y uracilo, y guanina y uracilo. No es necesario calcular el porcentaje de complementariedad a lo largo de toda la longitud de una secuencia de ácido nucleico. El porcentaje de complementariedad se puede limitar a una región específica cuyas secuencias de ácido nucleico están emparejadas entre las bases, por ejemplo, comenzando a partir de un primer nucleótido con bases emparejadas y terminando en un último nucleótido con bases emparejadas. El complemento de una secuencia de ácido nucleico tal y como se usa en este documento, se refiere a un oligonucleótido que, cuando se alinea con la secuencia de ácido nucleico de manera que el extremo 5' de una secuencia esté emparejado con el extremo 3' de la otra, está en "asociación antiparalela". Cier­ tas bases que no se encuentran comúnmente en los ácidos nucleicos naturales, se pueden incluir en los ácidos nucleicos de la presente invención e incluyen, por ejemplo, inosina y 7-desazaguanina. La complementariedad no tiene que ser perfecta; los dúplex estables pueden contener pares de bases mal emparejadas o bases mal empare­ jadas. Los expertos en los métodos de la tecnología de ácidos nucleicos pueden determinar la estabilidad del dúplex empíricamente, considerando una serie de variables que incluyen, por ejemplo, la longitud del oligonucleótido, la composición de bases y la secuencia del oligonucleótido, la fuerza iónica y la incidencia de pares de bases mal em­ parejadas.
De este modo, en algunos ejemplos, "complementario" se refiere a una primera secuencia de bases nucleicas que es al menos 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 97%, 98% o 99% idéntica al complemento de una segun­ da secuencia de bases nucleicas en una región de 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, l9, 20, 21, 22, 23, 24, 25, 30, 35, 40, 45, 50, 55, 60, 65, 70, 75, 80, 85, 90, 95, 100 o más bases nucleicas, o que las dos secuencias se hibridan en condiciones de hibridación rigurosas. "Completamente complementario" significa que cada base nucleica de un primer ácido nucleico es capaz de emparejarse con cada base nucleica en una posición correspondiente en un segundo ácido nucleico. Por ejemplo, en ciertos ejemplos, un oligonucleótido en el que cada base nucleica tiene complementariedad con un ácido nucleico, tiene una secuencia de bases nucleicas que es idéntica al complemento del ácido nucleico a lo largo de una región de 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 30, 35, 40, 45, 50, 55, 60, 65, 70, 75, 80, 85, 90, 95, 100 o más bases nucleicas.
"Mal emparejamiento" significa una base nucleica de un primer ácido nucleico que no es capaz de emparejarse con una base nucleica en la posición correspondiente de un segundo ácido nucleico.
Tal y como se usa en este documento, el término "hibridación" se usa haciendo referencia al emparejamiento de ácidos nucleicos complementarios. La hibridación y la fuerza de la hibridación (es decir, la fuerza de la asociación entre los ácidos nucleicos} está influenciada por factores tales como el grado de complementariedad entre los ácidos nucleicos, el rigor de las condiciones implicadas y la Tf del híbrido formado. Los métodos de "hibridación" implican la hibridación de un ácido nucleico con otro ácido nucleico complementario, es decir, un ácido nucleico que tiene una secuencia de nucleótidos complementaria. La capacidad de dos polímeros de ácido nucleico que contienen secuen­ cias complementarias para encontrarse entre sí y emparejarse mediante una interacción que empareja las bases, es un fenómeno bien reconocido. Las observaciones iniciales del proceso de "hibridación" de Marmur y Lane, Proc. Natl. Acad. Sci. USA 46:453 (1960} y Doty et al., Proc. Natl. Acad. Sci. USA 46:461 (1960} han venido acompañadas de un refinamiento de este procedimiento hasta convertirlo en una herramienta esencial de la biología moderna.
Tal y como se usa en este documento, el término "Tf" se utiliza haciendo referencia a la "temperatura de fusión". La temperatura de fusión es la temperatura a la que una población de moléculas de ácido nucleico bicatenario se diso­ cia por la mitad en hebras aisladas. Se conocen bien en la técnica diversas ecuaciones para calcular la Tf de ácidos nucleicos. Tal y como indican las referencias convencionales, una estimación simple del valor de la Tf se puede calcular mediante la ecuación: Tf = 81,5 0,41 * (% de G+C), cuando un ácido nucleico está en solución acuosa en NaCI 1 M (véase, por ejemplo, Anderson y Young, Quantitative Filter Hybridization, in Nucleic Acid Hybridization (1985). Otras referencias (por ejemplo, Allawi y SantaLucia, Biochemistry 36:10581-94 (1997), incluyen cálculos más sofisticados que tienen en cuenta las características estructurales, ambientales y de secuencia para calcular la Tf. Por ejemplo, en algunos ejemplos, esos cálculos proporcionan una estimación mejorada de la Tf para sondas y dia­ nas cortas de ácido nucleico (por ejemplo, tal y como se usan en los ejemplos}.
Tal y como se usa en este documento, el término "fusión" cuando se usa haciendo referencia a un ácido nucleico, se refiere a la disociación de un ácido nucleico bicatenario o una región de un ácido nucleico en un ácido nucleico monocatenario o una región de un ácido nucleico.
Tal y como se usa en este documento, la expresión "componente de fusión" se refiere a una sustancia, una molécula (por ejemplo, una biomolécula} o un complejo de más de una molécula (por ejemplo, un complejo de más de una biomolécula) que interacciona con un ácido nucleico y lo fusiona, p. ej., disocia regiones bicatenarias (por ejemplo, la estructura secundaria de un ácido nucleico monocatenario, una estructura dúplex de ADN o de un híbrido ARN/ADN) para proporcionar regiones monocatenarias, por ejemplo, para proporcionar un acceso a las regiones de búsqueda para enlazar una sonda de búsqueda. Un componente de fusión puede ser un complejo dCas9/ARNg (por ejemplo, en algunos ejemplos, que comprende una dCas9 biotinilada y en algunos ejemplos que comprende una dCas9 no biotinilada). Sin embargo, la tecnología no se limita a componentes de fusión que comprenden dCas9. La tecnología comprende el uso de cualquier entidad que proporciona un acceso a una región de búsqueda mediante una sonda de búsqueda y permite un ensayo SiMREPS de un ácido nucleico diana.
Tal y como se usa en este documento, un "ácido nucleico bicatenario" puede ser una porción de un ácido nucleico, una región de un ácido nucleico más largo o un ácido nucleico completo. Un "ácido nucleico bicatenario" puede ser, por ejemplo, sin limitación, un ADN bicatenario, un ARN bicatenario, un híbrido bicatenario de ADN/ARN, etc. Un ácido nucleico monocatenario que tiene una estructura secundaria (p. ej., una estructura secundaria con empareja­ miento de bases) y/o una estructura de orden superior comprende un "ácido nucleico bicatenario". Por ejemplo, las estructuras triples se consideran que son " bicatenarias". En algunos ejemplos, cualquier ácido nucleico con empare­ jamiento de bases es un "ácido nucleico bicatenario".
Tal y como se usa en este documento, un "ARN no codificante" o "ARNnc" es una molécula de ARN funcional que no se traduce en una proteína. Los sinónimos que se utilizan con menos frecuencia son ARN que no codifica proteí­ nas (ARNncp), ARN no mensajero (ARNnm), ARN pequeño no mensajero (ARNpnm) y ARN funcional (ARNf). El término ARN pequeño (ARNp) se usa a menudo para ARNnc bacterianos. La secuencia de ADN a partir de la cual se transcribe un ARN no codificante como producto final, se denomina frecuentemente gen de ARN o gen de ARN no codificante. Los genes de ARN no codificantes incluyen ARNs muy abundantes y funcionalmente importantes, como el ARN de transferencia (ARNt) y el ARN ribosómico (ARNr), así como ARNs tales como ARNpno, microARN, ARNic y ARNpi. Se desconoce el número de ARNnc codificados dentro del genoma humano; sin embargo, estudios transcriptómicos y bioinformáticos recientes sugieren la existencia de miles de ARNnc. Dado que la mayoría de los ARNnc identificados recientemente no han sido validados en cuanto a su función, es posible que muchos no sean funcionales.
Tal y como se usa en esta memoria, la expresión "ARN no codificante largo" o "ARNInc" o "ARNnc largo" se refiere a un ARN que no codifica proteínas de más de aproximadamente 200 nucleótidos. Tal y como se usa en esta memo­ ria, la expresión se usa para distinguir los ARNlnc de los ARN reguladores pequeños, tales como los microARN (miARN), los ARN de interferencia cortos (ARNic), los ARN que interaccionan con Piwi (ARNpi), los ARN nucleolares pequeños (ARNpno) y otros ARNs cortos.
Tal y como se usa en este documento, el término "miARN" se refiere a microARN. Tal y como se usa en este docu­ mento, la expresión "secuencia diana de miARN" se refiere a un miARN que se va a detectar (por ejemplo, en pre­ sencia de otros ácidos nucleicos). En algunos ejemplos, una secuencia diana de miARN es una variante de un miARN.
El término "ARNic" se refiere a ARNs de interferencia cortos. En algunos ejemplos, los ARNic comprenden una re­ gión dúplex o bicatenaria, en la que cada cadena de la región bicatenaria tiene una longitud de aproximadamente 18 a 25 nucleótidos; la región bicatenaria puede tener una longitud tan corta como 16 pares de bases y tan larga como 29, en donde la longitud está determinada por la hebra antisentido. A menudo, los ARNic contienen desde aproxi­ madamente dos hasta cuatro nucleótidos desemparejados en el extremo 3' de cada hebra. Los ARNic parecen fun­ cionar como intermediarios clave para desencadenar una interferencia del ARN en invertebrados y vertebrados, y para desencadenar una degradación del ARN específica de la secuencia durante el silenciamiento génico postranscripcional en las plantas. Al menos una hebra de la región dúplex o bicatenaria de un ARNic es sustancialmente homóloga o sustancialmente complementaria a una molécula de ARN diana. La hebra complementaria de una molé­ cula de ARN diana es la hebra "antisentido"; la hebra homóloga a la molécula de ARN diana es la hebra "sentido" y también es complementaria a la hebra antisentido del ARNic. Una hebra de la región bicatenaria no necesita tener la longitud exacta de la hebra opuesta, por lo tanto, una hebra puede tener al menos un nucleótido menos que la hebra complementaria opuesta, lo que da como resultado una "burbuja" o al menos una base mal emparejada en la hebra opuesta. No es necesario que una hebra de la región bicatenaria sea exactamente complementaria a la hebra opuesta; por tanto, la hebra, preferiblemente la hebra sentido, puede tener al menos un par de bases mal empareja­ das.
Los ARNic también pueden contener secuencias adicionales; ejemplos no limitantes de tales secuencias incluyen secuencias enlazadoras, o bucles, que conectan las dos cadenas de la región dúplex. Esta forma de ARNic puede denominarse "ARN similar a ic", "ARNic de horquilla corta", en donde corta se refiere a la región dúplex del ARNic, o "ARNic de horquilla". Ejemplos adicionales no limitantes de secuencias adicionales presentes en los ARNic incluyen estructura de tallo y otras estructuras plegadas. Las secuencias adicionales pueden tener o no funciones conocidas; ejemplos no limitantes de tales funciones incluyen aumentar la estabilidad de una molécula de ARNic o proporcionar una señal con destino celular.
"Pre-miARN" o "pre-miR" significa un ARN no codificante que tiene una estructura de horquilla, que es el producto de la escisión de un pri-miR por la ribonucleasa específica de ARN de doble hebra conocida como Drosha.
"Secuencia de tallo-bucle" significa un ARN que tiene una estructura de horquilla y que contiene una secuencia de miARN madura. Las secuencias de pre-miARN y las secuencias de tallo-bucle pueden solaparse. Se encuentran ejemplos de secuencias de tallo-bucle en la base de datos de miARN conocida como miRBase (disponible en inter­ net en microma.sanger.ac.uk}.
"Pri-miARN" o "pri-miR" significa un ARN no codificante que tiene una estructura de horquilla que es un sustrato para la ribonucleasa Drosha específica de ARN bicatenario.
"Precursor de miARN" significa un transcrito que se origina a partir de un ADN genómico y que comprende un ARN estructurado no codificante que comprende una o varias secuencias de miARN. Por ejemplo, un precursor de miARN puede ser un pre-miARN. En ciertos ejemplos, un precursor de miARN es un pri-miARN.
El término "gen" se refiere a una secuencia de ADN que comprende secuencias codificantes y de control necesarias para la producción de un ARN que tiene una función no codificante (por ejemplo, un ARN ribosómico o de transfe­ rencia}, un polipéptido o un precursor. El ARN o el polipéptido puede estar codificado por una secuencia codificante de longitud completa o por cualquier porción de la secuencia codificante, siempre que se conserve la actividad o la función deseada.
La expresión "tipo silvestre" se refiere a un gen o un producto génico que tiene las características de ese gen o pro­ ducto génico cuando se aísla a partir de una fuente de origen natural. Un gen de tipo silvestre es aquel que se ob­ serva con mayor frecuencia en una población y, por tanto, se denomina arbitrariamente como la forma "normal" o "de tipo silvestre" del gen. Por el contrario, el término "modificado", "mutante" o "polimórfico" se refiere a un gen o un producto génico que muestra modificaciones en la secuencia o en las propiedades funcionales (es decir, caracterís­ ticas alteradas} cuando se compara con el gen o el producto génico de tipo silvestre. Se observa que se pueden aislar mutantes de origen natural; estos se identifican por el hecho de que tienen características alteradas en compa­ ración con el gen o el producto génico de tipo silvestre.
El término "oligonucleótido" tal y como se usa en este documento, se define como una molécula que comprende dos o más desoxirribonucleótidos o ribonucleótidos, preferiblemente al menos 5 nucleótidos, más preferiblemente al menos aproximadamente 10 a 15 nucleótidos y más preferiblemente al menos aproximadamente 15 a 30 nucleóti­ dos. El tamaño exacto dependerá de muchos factores, que a su vez dependen de la función o uso final del oligonu­ cleótido. El oligonucleótido se puede generar de cualquier manera, incluyendo una síntesis química, una replicación del ADN, una transcripción inversa, una PCR o una combinación de las mismas.
Debido a que los mononucleótidos reaccionan para producir oligonucleótidos de una manera tal que el fosfato 5’ de un anillo de pentosa del mononucleótido se fija al oxígeno 3' de su vecino en una dirección a través de un enlace fosfodiéster, un extremo de un oligonucleótido se denomina el "extremo 5’" si su fosfato 5' no está unido al oxígeno 3’ de un anillo de pentosa de un mononucleótido y se denomina el "extremo 3'" si su oxígeno 3’ no está unido a un fosfato 5' de un anillo de pentosa de un mononucleótido posterior. Tal y como se usa en este documento, también se puede decir que una secuencia de ácido nucleico, incluso si es interna en un oligonucleótido más grande, tiene ex­ tremos 5’ y 3'. Se dice que una primera región a lo largo de una hebra de ácido nucleico está aguas arriba de otra región, si el extremo 3’ de la primera región está antes del extremo 5' de la segunda región cuando se avanza a lo largo de una hebra de ácido nucleico en una dirección 5’ a 3'.
Cuando dos oligonucleótidos diferentes que no se solapan, se aparean con diferentes regiones de la misma secuen­ cia de un ácido nucleico complementario lineal, y el extremo 3’ de un oligonucleótido apunta hacia el extremo 5' del otro, el primero se puede denominar el oligonucleótido "aguas arriba" y el último, el oligonucleótido "aguas abajo". De manera similar, cuando dos oligonucleótidos que se solapan se hibridan con la misma secuencia de un ácido nucleico complementario lineal, con el primer oligonucleótido posicionado de manera que su extremo 5’ está aguas arriba del extremo 5' del segundo oligonucleótido, y el extremo 3' del primer oligonucleótido está aguas arriba del extremo 3’ del segundo oligonucleótido, el primer oligonucleótido se puede denominar el oligonucleótido "aguas arriba" y el segundo oligonucleótido se puede denominar el oligonucleótido "aguas abajo".
Tal y como se usa en esta memoria, los términos "sujeto" y "paciente" se refieren a cualquier organismo, incluyendo plantas, microorganismos y animales (por ejemplo, mamíferos tales como perros, gatos, ganado y seres humanos}. El término "muestra" en la presente memoria descriptiva y las reivindicaciones, se utiliza en su sentido más amplio. Por un lado, se entiende que incluye un espécimen o un cultivo (por ejemplo, cultivos microbiológicos}. Por otro lado, se entiende que incluye muestras tanto biológicas como ambientales. Una muestra puede incluir un espécimen de origen sintético.
Tal y como se usa en este documento, una "muestra biológica" se refiere a una muestra de tejido o fluido biológico. Por ejemplo, una muestra biológica puede ser una muestra obtenida a partir de un animal (incluyendo un ser hu­ mano}; una muestra de un líquido, un sólido o un tejido; así como alimentos y productos para la alimentación líqui­ dos y sólidos e ingredientes, tales como productos lácteos, verduras, carne y subproductos cárnicos y desechos. Se pueden obtener muestras biológicas a partir de todas las diversas familias de animales domésticos, así como de animales asilvestrados o salvajes, incluyendo pero no limitados a, animales tales como los ungulados, osos, peces, lagomorfos, roedores, etc. Ejemplos de muestras biológicas incluyen secciones de tejidos, sangre, fracciones de la sangre, plasma, suero, orina o muestras de otras fuentes periféricas o cultivos celulares, colonias celulares, células individuales o una colección de células individuales. Además, una muestra biológica incluye conjuntos o mezclas de las muestras mencionadas anteriormente. Se puede proporcionar una muestra biológica extrayendo una muestra de células a partir de un sujeto, pero también se puede proporcionar utilizando una muestra previamente aislada. Por ejemplo, se puede extraer una muestra de tejido a partir de un sujeto sospechoso de tener una enfermedad, median­ te técnicas de biopsia convencionales. En algunos ejemplos, se toma una muestra de sangre de un sujeto. Una muestra biológica de un paciente significa una muestra de un sujeto sospechoso de padecer una enfermedad.
Las muestras ambientales incluyen material ambiental como materia de la superficie, suelo, agua y muestras indus­ triales, así como muestras obtenidas a partir de instrumentos, aparatos, equipos, utensilios, artículos desechables y no desechables para el procesamiento de alimentos y de productos lácteos. Estos ejemplos no deben interpretarse como limitantes de los tipos de muestras aplicables a la presente invención.
El término "marcador", tal y como se usa en este documento, se refiere a cualquier átomo o molécula que se puede usar para proporcionar un efecto detectable (preferiblemente cuantificable), y que se puede fijar a un ácido nucleico o proteína. Los marcadores incluyen, pero no se limitan a, colorantes (por ejemplo, colorantes o restos fluorescen­ tes); radiomarcadores como 32P; restos que se unen tales como biotina; haptenos tales como digoxigenina; restos luminógenos, fosforescentes o fluorogénicos; marcadores de masa; y colorantes fluorescentes solos o en combina­ ción con restos que pueden suprimir o desviar los espectros de emisión mediante transferencia de energía por reso­ nancia de fluorescencia (FRET). Los marcadores pueden proporcionar señales detectables mediante fluorescencia, radiactividad, colorimetría, gravimetría, difracción o absorción de rayos X, magnetismo, actividad enzimática, carac­ terísticas de masa o de comportamiento afectado por la masa (p. ej., espectrometría de masas con tiempo de vuelo MALDI; polarización de la fluorescencia), y similares. Un marcador puede ser un resto cargado (carga positiva o negativa) o, alternativamente, puede tener una carga neutra. Los marcadores pueden incluir o consistir en una se­ cuencia de ácido nucleico o de proteína, siempre que la secuencia que comprende el marcador, sea detectable.
"Soporte" o "soporte sólido", tal y como se usa en esta memoria, se refiere a una matriz sobre o en la que se pueden inmovilizar moléculas de ácido nucleico, micropartículas y similares, por ejemplo, a la que se pueden fijar covalente o no covalentemente, o en o sobre la cual pueden estar parcial o totalmente incluidos, de modo que se les impide en gran parte o en su totalidad una difusión libre o desplazarse entre sí.
Tal y como se usa en este documento, "resto" se refiere a una de las dos o más partes en las que se puede dividir algo, como, por ejemplo, las diversas partes de un oligonucleótido, una molécula, un grupo químico, un dominio, una sonda, etc.
Tal y como se usa en este documento, una "sonda de búsqueda" o "sonda lectora" es cualquier entidad (por ejem­ plo, una molécula, una biomolécula, etc.) que reconoce un ácido nucleico (por ejemplo, se une a un ácido nucleico, por ejemplo, se une específicamente a un ácido nucleico). La sonda de búsqueda puede ser una proteína que reco­ noce un ácido nucleico (por ejemplo, una proteína que se une a un ácido nucleico, un anticuerpo, un fragmento de anticuerpo, un factor de transcripción o cualquier otra proteína que se une a una secuencia particular en un ácido nucleico). En algunos otros ejemplos, la sonda de búsqueda es un ácido nucleico (por ejemplo, un ADN, un ARN, un ácido nucleico que comprende ADN y ARN, un ácido nucleico que comprende bases modificadas y/o enlaces modi­ ficados entre las bases; por ejemplo, un ácido nucleico tal y como se ha descrito anteriormente, un aptámero de ácido nucleico o cualquier otro ácido nucleico que se une a una secuencia particular en un ácido nucleico). En algu­ nos ejemplos, la sonda de búsqueda está marcada, por ejemplo, con un marcador detectable tal como, por ejemplo, un resto fluorescente como se ha descrito en este documento. En algunos ejemplos, la sonda de búsqueda com­ prende más de un tipo de molécula (por ejemplo, más de una proteína, un ácido nucleico, un enlazador químico o un resto químico).
Tal y como se usa en este documento, una "sonda de captura" es cualquier entidad (por ejemplo, una molécula, una biomolécula, etc.) que reconoce un ácido nucleico (por ejemplo, se une a un ácido nucleico, por ejemplo, se une específicamente a un ácido nucleico). La sonda de captura puede ser una proteína que reconoce un ácido nucleico (p. ej., una proteína que se une a un ácido nucleico, un anticuerpo, un fragmento de un anticuerpo, un factor de transcripción o cualquier otra proteína que se une a una secuencia particular en un ácido nucleico). En algunos otros ejemplos, una sonda de captura es un ácido nucleico (por ejemplo, un ADN, un ARN, un ácido nucleico que com­ prende ADN y ARN, un ácido nucleico que comprende bases modificadas y/o enlaces modificados entre las bases; por ejemplo, un ácido nucleico tal y como se ha descrito anteriormente). En algunos ejemplos, una sonda de captura está marcada, por ejemplo, con un marcador detectable tal como, por ejemplo, un resto fluorescente como se ha descrito en esta memoria. En algunos ejemplos, la sonda de captura comprende más de un tipo de molécula (por ejemplo, más de una proteína, un ácido nucleico, un enlazador químico o un resto químico).
Descripción
En esta memoria se proporciona una técnica para la detección específica y ultrasensible de ácidos nucleicos indivi­ duales. Como se ha descrito anteriormente (véase, por ejemplo, el documento US 2016/0046988 A1), SiMREPS utiliza microscopía de fluorescencia con reflexión interna total (TIRF), visualización de una molécula individual y análisis cinético de la unión y la liberación de sondas marcadas con fluorescencia a moléculas diana (véase, por ejemplo, la Fig. 1a). Las moléculas diana se cuantifican mediante un recuento directo simple, sin amplificación, des­ pués de una identificación cinética de la huella genética que proporciona una discriminación excepcional entre va­ riantes de un nucleótido individual, como se ha demostrado anteriormente para la detección de microARN (véase, por ejemplo, el documento US 2016/0046988 A1). La tecnología proporcionada en este documento proporciona la detección de formas adicionales de ácidos nucleicos, por ejemplo, ADN, ADN mutante, ADN metilado, por ejemplo, en una señal de fondo de tipo silvestre abundante.
Las técnicas existentes para la detección de ácidos nucleicos utilizan sondas que forman un complejo termodinámicamente estable con la molécula diana y, por tanto, se limitan a una discriminación termodinámica débil y, a menu­ do, poco fiable frente a la señal de fondo o dianas falsas. Por el contrario, la tecnología descrita en este documento utiliza sondas que se unen repetidamente a la molécula diana en la región de búsqueda y métodos relacionados para registrar la gran cantidad de eventos de unión independientes que tienen lugar para cada molécula diana ob­ servada. Este muestreo cinético repetido proporciona una "huella genética" cinética única para la diana y proporcio­ na una detección altamente específica y sensible de los ácidos nucleicos. En algunos ejemplos, la tecnología permi­ te la discriminación entre dos moléculas de ácido nucleico que se diferencian por tan solo un nucleótido. En algunos ejemplos, la tecnología permite la discriminación entre dos moléculas de ácido nucleico cuando una de las dos mo­ léculas de ácido nucleico está presente con un exceso elevado (p. ej., 10x; 100x; 1000x; 10.000x; o 1.000.000x o un exceso superior). Véase, por ejemplo, el documento US 2016/0046988 A1.
En algunos ejemplos, se detecta un ácido nucleico marcado, por ejemplo, usando un instrumento para detectar una señal producida por el marcador. Por ejemplo, algunos ejemplos comprenden el uso de una sonda de búsqueda marcada de forma detectable (por ejemplo, marcada con fluorescencia) y un detector de emisión de fluorescencia, tal como una técnica de microscopía fluorescente. La tecnología se puede emplear como herramienta de diagnóstico para identificar dianas de ácido nucleico mutante o expresado de manera aberrante en muestras biológicas. Véase, por ejemplo, el documento US 2016/0046988 A1.
Este enfoque puede implicar la captura de ácidos nucleicos no marcados a través de un complejo dCas9/ARNg unido a un soporte sólido (p. ej., vidrio o sílice fundida) y la fusión de una región de búsqueda, seguida de una ob­ servación de la unión transitoria repetida de una sonda de búsqueda de un ácido nucleico corto (por ejemplo, ADN) marcado de forma detectable (por ejemplo, marcado con fluorescencia) a la región de búsqueda.
El complejo dCas9/ARNg se puede unir o fijar a un soporte sólido. En algunos ejemplos, el complejo dCas9/ARNg comprende un resto que proporciona la inmovilización del complejo dCas9/ARNg sobre un soporte sólido mediante la interacción del resto con un segundo resto fijado al soporte sólido. El complejo dCas9/ARNg se puede fijar directa o indirectamente a un soporte sólido.
Se puede usar cualquiera entre una variedad de materiales como soporte para el complejo dCas9/ARNg, por ejem­ plo, matrices o partículas elaboradas con nitrocelulosa, nailon, vidrio, poliacrilato, polímeros mixtos, poliestireno, silano polipropileno y materiales que se pueden atraer magnéticamente. Una superficie plana es un soporte preferido para la formación de imágenes mediante microscopía, tal y como se describe en este documento. Un complejo dCas9/ARNg se puede inmovilizar uniéndolo directamente al soporte sólido, por ejemplo, usando cualquiera entre una variedad de enlaces covalentes, quelación o interacción iónica, o se puede inmovilizar uniéndolo indirectamente a través de uno o varios enlazadores conectados con el soporte. En algunos ejemplos, el enlazador es un ácido nucleico; en algunos ejemplos, el enlazador es un ácido nucleico que comprende uno o varios nucleótidos que no están destinados a una hibridación (p. ej., que no se hibridan) con la región de captura del ácido nucleico diana, pero que están destinados a actuar como un espaciador entre el complejo dCas9/ARNg y su soporte sólido.
En algunos ejemplos, el complejo dCas9/ARNg comprende un grupo biotina (p. ej., el complejo dCas9/ARNg está biotinilado) y el soporte sólido comprende un grupo estreptavidina (p. ej., fijado al soporte sólido mediante un resto enlazador, p. ej., un enlazador de polietilenglicol (PEG)). La interacción específica de la biotina y la estreptavidina inmoviliza de este modo la sonda de captura en el soporte sólido (Figs. 1a, 3 y 4).
Se pueden emplear varios otros métodos químicos para la inmovilización de un complejo dCas9/ARNg en un sopor­ te sólido. Un ejemplo de ese tipo de métodos es usar una combinación de un grupo maleimida y un grupo tiol (-SH). En ese método, un grupo tiol (-SH) se une a un complejo dCas9/ARNg, y el soporte sólido comprende un grupo maleimida. Por consiguiente, el grupo tiol del complejo dCas9/ARNg reacciona con el grupo maleimida sobre el soporte sólido para formar un enlace covalente, de modo que se inmoviliza el complejo dCas9/ARNg. La introduc­ ción del grupo maleimida puede utilizar un procedimiento que consiste primero en permitir una reacción entre un sustrato de vidrio y un agente de acoplamiento de aminosilano y luego introducir el grupo maleimida sobre el sustra­ to de vidrio mediante una reacción del grupo amino con un reactivo EMCS (N-(6-maleimidocaproiloxi)succinimida, disponible en Dojindo). La introducción del grupo tiol en un ADN se puede llevar a cabo usando 5'-Thiol-Modifier C6 (disponible en Glen Research) cuando el ADN se sintetiza mediante un sintetizador automático de ADN.
En lugar de la combinación descrita anteriormente de un grupo tiol y un grupo maleimida, en algunos ejemplos se usa una combinación de, por ejemplo, un grupo epoxi (sobre el soporte sólido) y un grupo amino (complejo dCas9/ARNg) como una combinación de grupos funcionales para la inmovilización. Los tratamientos de la superficie que utilizan varios tipos de agentes de acoplamiento de silano, también son eficaces. En la técnica se conocen otros métodos para la fijación de proteínas a soportes sólidos y superficies sólidas.
Procesos de Poisson
Los ejemplos de la tecnología están relacionados con el reconocimiento de una molécula individual, registrando la cinética característica de una sonda (por ejemplo, una sonda de búsqueda) que se une a una diana (por ejemplo, una región de búsqueda). En ejemplos particulares, este proceso es un proceso de Poisson. Un proceso de Poisson es un proceso estocástico continuo en el tiempo que cuenta el número de eventos y el momento en el que tienen lugar los eventos (por ejemplo, la unión transitoria de una sonda de búsqueda marcada de forma detectable (por ejemplo, fluorescente) a una diana inmovilizada) en un intervalo de tiempo determinado. El intervalo de tiempo entre cada pareja de eventos consecutivos tiene una distribución exponencial y se supone que cada intervalo es indepen­ diente de otros intervalos. La distribución de Poisson es una distribución de probabilidad discreta que expresa la probabilidad de que un número dado de eventos tenga lugar en el intervalo de tiempo dado, si esos eventos tienen lugar con una velocidad promedio conocida e independientemente del tiempo desde el último evento. La distribución de Poisson también se puede utilizar para la cantidad de eventos en otros intervalos especificados, como la distan­ cia, el área o el volumen.
Una distribución de Poisson es un caso especial de la distribución binomial general en donde el número de ensayos n es elevado, la probabilidad de éxito p es baja y el producto np = Á es moderado. En un proceso de Poisson, la probabilidad de que un número de eventos N sea j en cualquier momento arbitrario t, sigue la distribución de la pro­ babilidad de Poisson Pj(t):
Figure imgf000013_0001
Es decir, el número N de eventos que tienen lugar hasta el momento t tiene una distribución de Poisson con paráme­ tro Át. Los métodos estadísticos y matemáticos relevantes para los procesos de Poisson y las distribuciones de Pois­ son son conocidos en la técnica. Véase, por ejemplo, "Stochastic Processes (i): Poisson Processes and Markov Chains" en Statistics for Biology and Health - Statistical Methods in Bioinformatics (Ewans y Grant, compiladores), Springer (New York, 2001), página 129 et seq. Los paquetes de programas informáticos, tales como Matlab y R se pueden utilizar para implementar métodos matemáticos y estadísticos asociados con procesos, probabilidades y distribuciones de Poisson.
Cinética de detección
Los ejemplos particulares de la tecnología están relacionados con la detección de un ácido nucleico mediante el análisis de la cinética de la interacción de una sonda de búsqueda con una región de búsqueda de un ácido nucleico diana que se va a detectar. Para la interacción de una sonda de búsqueda Q (p. ej., con una concentración de equi­ librio [Q]) con un ácido nucleico diana T (p. ej., que tiene una concentración de equilibrio [T]), la constante de veloci­ dad cinética kasociación describe la formación dependiente del tiempo del complejo QT que comprende la sonda de búsqueda Q hibridada con la región de búsqueda del ácido nucleico diana T. En ejemplos particulares, aunque la formación del complejo QT está asociada con una constante de velocidad de segundo orden que depende de la concentración de la sonda de búsqueda y que tiene las unidades M-1min-1 (o similares), la formación del complejo QT está suficientemente descrita por una kasociación que es una constante de velocidad de seudoprimer orden, aso­ ciada con la formación del complejo QT. Por lo tanto, tal y como se usa en esta memoria, kasociación es una constante de velocidad aparente de ("seudo")primer orden.
Asimismo, la constante de velocidad cinética kdisociación describe la disociación dependiente del tiempo del complejo QT en la sonda de búsqueda Q y el ácido nucleico diana T. Las velocidades cinéticas se proporcionan típicamente en este documento en unidades de min-1 o s-1. El "tiempo de permanencia" de la sonda de búsqueda Q en estado unido (Tasociación ) es el intervalo de tiempo (p. ej., el período de tiempo) en el que la sonda Q se hibrida con la región de búsqueda del ácido nucleico diana T durante cada ocasión en que la sonda de búsqueda Q se une a la región de búsqueda del ácido nucleico diana T, para formar el complejo QT. El "tiempo de permanencia" de la sonda de bús­ queda Q en estado libre (Tdisociación) es el intervalo de tiempo (p. ej., el periodo de tiempo) en el que la sonda Q no se hibrida con la región de búsqueda del ácido nucleico diana T entre cada ocasión en que la sonda de búsqueda Q se une a la región de búsqueda del ácido nucleico diana T, para formar el complejo QT (por ejemplo, el tiempo durante el cual la sonda de búsqueda Q se disocia del ácido nucleico diana T entre sucesivos eventos de unión de la sonda de búsqueda Q con el ácido nucleico diana T). Los tiempos de permanencia se pueden proporcionar como prome­ dios o promedios ponderados que integran numerosos eventos de unión y de falta de unión.
Además, en algunos ejemplos, la unión estocástica repetida de las sondas de búsqueda (p. ej., sondas de búsqueda marcadas de forma detectable (p. ej., sondas fluorescentes), p. ej., sondas de ácido nucleico tales como sondas de ADN o ARN) a dianas inmovilizadas, se diseña como un proceso de Poisson que se produce con una probabilidad constante por unidad de tiempo y en donde la desviación estándar del número de eventos de unión y disociación por unidad de tiempo (Nb+d), se incrementa como (Nb+d)1/2. Por lo tanto, el ruido estadístico se convierte en una fracción más pequeña de Nb+d a medida que aumenta el tiempo de observación. En consecuencia, la observación se alarga según sea necesario en algunos ejemplos para lograr una discriminación entre la unión de la diana y fuera de la diana. Y, a medida que aumenta el tiempo de adquisición, los picos de la señal y del fondo en el histograma Nb+d se separan cada vez más y el ancho de la distribución de la señal aumenta como la raíz cuadrada de Nb+d, lo que es consistente con las simulaciones cinéticas de Monte Cario, Un tiempo de adquisición de aproximadamente 10 minu­ tos (p. ej,, aproximadamente de 1 a 100 minutos, p, ej,, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 30, 40, 50, 60, 70, 80, 90 o 100 minutos) produce una separación suficiente (por ejemplo, completa) de la señal de las distribuciones de fondo de Nb+d, proporcionando una cuantificación sustancialmente exenta de ruido de fondo de la diana. Véase, por ejemplo, el documento US 2016/0046988 A1.
Además, en algunos ejemplos, la longitud de la sonda se selecciona para proporcionar una separación suficiente de los picos de la señal y del fondo sobre escalas de tiempo experimentales convenientes. En particular, la cinética del intercambio de sonda de búsqueda está relacionada con el número de bases complementarias entre la sonda de búsqueda y el ácido nucleico diana. Por ejemplo, en algunos ejemplos, la interacción de una sonda de búsqueda de ADN corta con su complemento se incrementa como una función aproximadamente exponencial del número de pares de bases formados, mientras que la constante de velocidad de unión se ve afectada solo débilmente para interacciones que comprenden al menos 6 a 7 pares de bases. Por lo tanto, una variación de la longitud de la sonda de búsqueda permite ajustar el comportamiento cinético para mejorar una discriminación entre los eventos de unión de la sonda de búsqueda con la diana y la unión de ruido de fondo. En particular, una longitud de la sonda de bús­ queda (por ejemplo, fluorescente) de 9 nt a 10 nt (que proporciona valores de Tt teóricos de 17,5°C a 25°C), produce una unión rápida a la diana que se distingue de la señal de fondo, como se muestra en los histogramas de transicio­ nes de intensidad para cada molécula candidata, en presencia y ausencia de diana. Véase, por ejemplo, el docu­ mento US 2016/0046988 A1. Además, en algunos ejemplos, las cinéticas de asociación y disociación se correlacio­ nan más estrechamente con la longitud de la sonda que con la temperatura de fusión del dúplex. Si bien algunos ejemplos comprenden el uso de una sonda que tiene una longitud de 9 a 10 nt, la tecnología no está limitada a esa longitud. De hecho, la tecnología contempla el uso de sondas más largas o más cortas que 9 a 10 nt, por ejemplo, como se describe a lo largo de toda la memoria.
Detección de ácidos nucleicos bicatenarios
Los ejemplos de la tecnología proporcionan la detección de ácidos nucleicos bicatenarios. Algunos ejemplos propor­ cionan composiciones, mezclas de reacción y complejos que comprenden una pluralidad de moléculas para detectar uno o varios ácidos nucleicos. Algunos ejemplos de composiciones, mezclas de reacción y complejos comprenden un ácido nucleico (por ejemplo, un ácido nucleico diana) que se va a detectar, identificar, cuantificar y/o caracterizar; un sustrato sólido que comprende un complejo dCas9/ARNg unido a una superficie sólida que se une a una o varias regiones de la diana con especificidad elevada; y una sonda de búsqueda marcada de forma detectable (por ejem­ plo, fluorescente). Algunos ejemplos comprenden además un oligonucleótido de ADN de motivo adyacente de protoespaciador (PAM).
La tecnología SiMREPS aprovecha la unión directa de una sonda de ADN corta (6-12 nucleótidos) marcada con fluorescencia a una diana de ácido nucleico sin marcar (p. ej., miARN) inmovilizado sobre una superficie de vidrio (Fig. 1a) (véase, por ejemplo, el documento US 2016/0046988 A1). Usando microscopía TIRF (Walter et al. (2008) "Do-it-yourself guide: how to use the modern single-molecule toolkit" Nat Methods 5: 475-89), se detecta tanto una unión inespecífica a la superficie (Fig. 1b) como una unión específica a la diana inmovilizada (Fig. 1c). Sin embargo, una unión en equilibrio de la sonda con la diana proporciona una firma cinética distintiva, o huella genética, que puede lograr una discriminación ultra alta frente a una unión de señal de fondo (compárese la Fig. 1b con la Fig. 1c). Dado que la unión transitoria de las sondas con una diana inmovilizada se asemeja a un proceso de Poisson, la
desviación estándar en el número de eventos de unión y disociación (Nb+d) se incrementa como V ^ f+ d -, A medida que aumenta el tiempo de adquisición experimental, los picos de la señal y el fondo en los histogramas de Nb+d se resuelven progresivamente mejor (Fig. 1d) (véase, por ejemplo, Johnson-Bucket al. (2015) "Kinetic fingerprinting to identify and count single nucleic acids" Nat Biotechnol 33: 730-2), lo que permite una discriminación arbitrariamente alta entre la unión de la diana y fuera de la diana.
SiMREPS tiene uso en la cuantificación del ARN (véase, por ejemplo, el documento US 2016/0046988 A1). En parti­ cular, experimentos previos cuantificaron cuatro miARNs humanos que están mal regulados en el cáncer y otras enfermedades. La discriminación (p. ej., especificidad = 1) se logró para todas las parejas de diana-sonda y las cur­ vas estándar mostraron una dependencia lineal de la concentración de la diana (Fig. 1e). Una sola sonda fluorescen­ te discrimina con la mayor especificidad entre dos microARNs que difieren en un solo nucleótido (Fig. 2a-c). SiMREPS detecta dianas en matrices biológicas complejas (Fig. 2d, e). También se detectó el biomarcador de cán­ cer de próstata hsa-miR-1418, en una muestra de suero después de añadir diferentes concentraciones de diana. La concentración medida se correlacionaba fuertemente con la concentración nominal incrementada (Fig. 2f, R >0,999, pendiente = 1,07).
Un desafío al aplicar la tecnología SiMREPS para la detección de ácidos nucleicos bicatenarios es que la unión transitoria de una sonda de búsqueda con el ácido nucleico diana (p. ej., en la región de búsqueda) compite con la asociación de la hebra complementaria a la región de búsqueda (por ejemplo, ADNbc) en el locus diana. Por consi­ guiente, en esta memoria se proporciona una tecnología en la que SiMREPS se emplea para detectar ADN de doble hebra. Para superar este desafío, algunos ejemplos de la tecnología comprenden el uso de una enzima dCas9 cata­ líticamente inactiva ("muerta") cargada con un ARN guía específico (ARNg) para desnaturalizar la estructura del ADNbc localmente de una forma específica de secuencia, proporcionando un acceso para la sonda de SiMREPS (Fig, 3). Los ejemplos relacionados comprenden el uso de una proteína que se une a ácidos nucleicos bicatenarios (p. ej., ADN bicatenario, ARN bicatenario, un híbrido bicatenario de ADN/ARN) y/o un componente de fusión (p. ej., una proteína o un ácido nucleico) para disociar un ácido nucleico bicatenario (por ejemplo, una región de un ácido nucleico) para proporcionar un ácido nucleico monocatenario.
Complejos dCas9/ARNg
La tecnología comprende el uso de un componente que se une a ácido nucleico de forma específica a la secuencia (p. ej., una molécula, una biomolécula o un complejo de una o varias moléculas y/o biomoléculas) para inmovilizar ácidos nucleicos y/o convertir ácidos nucleicos bicatenarios (p. ej., regiones de ácidos nucleicos bicatenarios) en regiones monocatenarias. El componente que se une a ácido nucleico de forma específica a la secuencia puede comprender una proteína Cas9 enzimáticamente inactiva o "muerta" ("dCas9") y un ARN guía ("ARNg"). Aunque las moléculas que se unen a ácido nucleico, tales como el sistema de repeticiones palindrómicas cortas agrupadas regularmente interespaciadas (CRISPR) y las proteínas asociadas a CRISPR (Cas) (CRISPR/Cas), se han utilizado ampliamente para la edición del genoma en células de varios tipos y especies, las proteínas que se unen a ácido nucleico recombinantes y modificadas genéticamente se emplean en la presente tecnología para desnaturalizar ácidos nucleicos bicatenarios y proporcionar ácidos nucleicos monocatenarios para la unión de sondas.
La proteína Cas9 se descubrió como un componente del sistema inmune adaptativo bacteriano (véase, por ejemplo, Barrangou et al. (2007) "CRISPR provides acquired resistance against viruses in prokaryotes" Science 315: 1709­ 1712). Cas9 es una endonucleasa guiada por ARN que se dirige a y destruye un ADN extraño en las bacterias me­ diante un emparejamiento de bases de ARN:ADN entre el ARNg y el ADN extraño, para proporcionar una especifici­ dad de secuencia. Recientemente, los complejos Cas9/ARNg han encontrado uso en la edición del genoma (véase, por ejemplo, Doudna et al. (2014) "The new frontier of genome engineering with CRISPR-Cas9" Science 346: 6213). Por consiguiente, algunos complejos Cas9/ARN comprenden dos moléculas de ARN: (1) un ARN de CRISPR (ARNcr), que posee una secuencia de nucleótidos complementaria a la secuencia de nucleótidos diana; y (2) un ARNcr de activación en trans (ARNtracr). En este modo, Cas9 funciona como una nucleasa guiada por ARN que usa tanto el ARNcr como el ARNtracr para reconocer y escindir una secuencia diana. Recientemente, un único ARN guía quimérico (ARNsg) que imita la estructura del ARNcr/ARNtracr hibridado, se ha utilizado más ampliamente que el ARNcr/ARNtracr porque el enfoque de ARNg proporciona un sistema simplificado con solo dos componentes (por ejemplo, la Cas9 y el sARNg). Por tanto, la unión específica de secuencia a un ácido nucleico puede estar guiada por un complejo de ARN doble natural (por ejemplo, que comprende un ARNcr, un ARNtracr y una Cas9) o un único ARN guía quimérico (por ejemplo, un ARNsg y Cas9). (Véase, por ejemplo, Jinek et al. (2012) "A Programmable Dual-RNA-Guided DnA Endonuclease in Adaptive Bacterial Immunity" Science 337:816-821).
Tal y como se usa en este documento, la región a la que se dirige un ARNcr (sistema de 2-ARN) o un ARNsg (sis­ tema de guía única) se denomina el "ARN guía" (ARNg). En algunos ejemplos, el ARNg comprende, consiste en o consiste esencialmente en 10 a 50 bases, por ejemplo, 15 a 40 bases, por ejemplo, 15 a 30 bases, por ejemplo, 15 a 25 bases (por ejemplo, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21,22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41,42, 43, 44, 45, 46, 47, 48, 49 o 50 bases). Se conocen en la técnica métodos para deter­ minar la longitud del ARNg que proporciona el reconocimiento más eficaz de una diana para una Cas9. Véase, por ejemplo, Lee et al. (2016) "The Neisseria meningitidis CRISPR-Cas9 System Enables Specific Genome Editing in Mammalian Cells" Molecular Therapy, 19 de enero 2016; doi:10.1038/mt.
Por consiguiente, en algunos ejemplos, el ARNg es un ARN sintético corto que comprende una secuencia de "an­ damio" para la unión de Cas9 y una secuencia de "direccionamiento" de aproximadamente 20 nucleótidos definida por el usuario que es complementaria al ácido nucleico diana.
La especificidad del direccionamiento del ADN se puede determinar mediante dos factores: 1) una secuencia de ADN que coincide con la secuencia de direccionamiento del ARNg y un motivo adyacente de protoespaciador (PAM) directamente aguas abajo de la secuencia diana. Algunos complejos de Cas9/ARNg reconocen una secuencia de ADN que comprende una secuencia de motivo adyacente de protoespaciador (PAM) y las aproximadamente 20 bases adyacentes complementarias al ARNg. Las secuencias PAM canónicas son NGG o NAG para Cas9 de Streptococcus pyogenes y NNNNGATT para la Cas9 de Neisseria meningitidis. Después del reconocimiento del ADN mediante la hibridación del ARNg con la secuencia diana de ADN, Cas9 escinde la secuencia de ADN mediante una actividad nucleasa intrínseca. Para la edición del genoma y otros fines, el sistema CRISPR/Cas de S. pyogenes se ha utilizado con mayor frecuencia. Usando ese sistema, se puede alcanzar un ácido nucleico diana dado (por ejem­ plo, para una edición u otra manipulación) diseñando un ARNg que tiene una secuencia de nucleótidos complemen­ taria a una secuencia de ADN de aproximadamente 20 bases, que está adyacente en 5’ al PAM. Se conocen en la técnica métodos para determinar la secuencia de PAM que proporciona el reconocimiento más eficaz de una diana, para una Cas9. Véase, por ejemplo, Zhang et al. (2013) "Processing-independent CRISPR RNAs limit natural transformation in Neisseria meningitidis" Molecular Cell 50: 488-503; Lee et al., supra.
La presente tecnología comprende el uso de una forma catalíticamente inactiva de Cas9 ("Cas9 muerta" o "dCas9"), en la que se introducen mutaciones puntuales que inhabilitan la actividad nucleasa. En algunos ejemplos, la proteína dCas9 procede de S. pyogenes. En algunos ejemplos, la proteína dCas9 comprende mutaciones, por ejemplo, en D10, E762, H983 y/o D986; y en H840 y/o N863, por ejemplo, en D10 y H840, por ejemplo, D10A o D10N y H840A o H840N o H840Y. En algunos ejemplos, la dCas9 se proporciona como una proteína de fusión que comprende un dominio funcional para fijar la dCas9 a una superficie sólida (por ejemplo, un marcador de epítopo, un péptido enlazador, etc.)
El complejo dCas9/ARNg se une a un ácido nucleico diana con una especificidad de secuencia proporcionada por el ARNg, pero no escinde el ácido nucleico. De esta forma, la dCas9/ARNg "funde" la secuencia diana para proporcio­ nar regiones monocatenarias del ácido nucleico diana de una forma específica de secuencia (véase, por ejemplo, Qi et al. (2013) "Repurposing CRISPR as an RNA-guided platform for sequence-specific control of gene expression" Cell 152(5): 1173-83).
Además, aunque el sistema Cas9/ARNg y el sistema dCas9/ARNg inicialmente se dirigían a secuencias adyacentes a un PAM, el sistema dCas9/ARNg tal y como se usa en este documento, ha sido diseñado para dirigirse a cualquier secuencia de nucleótidos para la unión. Además, se conocen ortólogos de Cas9 y dCas9 codificados por genes compactos (por ejemplo, Cas9 de Staphylococcus aureus) (véase, por ejemplo Ran et al. (2015) "In vivo genome editing using Staphylococcus aureus Cas9" Nature 520: 186-191), que mejoran la clonación y manipulación de los componentes de Cas9 in vitro.
Una variedad de bacterias expresan variantes de la proteína Cas9. La Cas9 de Streptococcus pyogenes es actual­ mente la más utilizada; algunas de las otras proteínas Cas9 tienen altos niveles de identidad de secuencia con Cas9 de S. pyogenes y utilizan los mismos ARNs guía. Otras son más diversas, usan diferentes ARNg y también recono­ cen diferentes secuencias de PAM (la secuencia de 2-5 nucleótidos especificada por la proteína que es adyacente a la secuencia especificada por el ARN). Chylinski et al. clasificaron las proteínas Cas9 a partir de un grupo extenso de bacterias (RNA Biology 10:5, 1-12; 2013), y un gran número de proteínas Cas9 se indican en la FIG. 1 comple­ mentaria y su tabla 1 complementaria. Las proteínas Cas9 adicionales se describen en Esvelt et al., Nat Methods.
2013 noviembre; 10(11): 1116-21 y Fonfara et al., "Phylogeny of Cas9 determines functional exchangeability of dual-RNA and Cas9 among orthologous type II CRISPR-Cas systems." Nucleic Acids Res. 2013 Nov. 22. [Publicación electrónica antes de la impresión] doi: 10.1093/nar/gkt1074.
Las moléculas de Cas9, y por tanto de dCas9, de una variedad de especies tienen uso en la tecnología descrita en este documento. Mientras que las moléculas de Cas9 de S. pyogenes y S. thermophilus se usan ampliamente, las moléculas de Cas9 de, obtenidas a partir de o basadas en las proteínas Cas9 de otras especies indicadas en este documento, tienen uso en ejemplos de la tecnología. En consecuencia, la tecnología proporciona la sustitución de las moléculas de Cas9 y dCas9 de S. pyogenes y S. thermophilus por moléculas de Cas9 y dCas9 de otras espe­ cies, que las pueden reemplazar, por ejemplo:
N2 de orden de GenBank Bacteria
303229466 Veillonella atypica ACS-134-V-Col7a
34762592 Fusobacterium nucleatum subsp. vincentii
374307738 Filifactor alocis ATCC 35896
320528778 Solobacterium moorei F0204
291520705 Coprococcus catus GD-7
42525843 Treponema denticola ATCC 35405
304438954 Peptoniphilus duerdenii ATCC BAA-1640
224543312 Catenibacterium mitsuokai DSM 15897
24379809 Streptococcus mutans UA159
15675041 Streptococcus pyogenes SF370
16801805 Listeria innocua Clip11262
116628213 Streptococcus thermophilus LMD-9
323463801 Staphylococcus pseudintermedius ED99
352684361 Acidaminococcus intestini RyC-MR95
302336020 Olsenella uli DSM 7084
366983953 Oenococcus kitaharae DSM 17330
310286728 Bifidobacterium bifidum S17
258509199 Lactobacillus rhamnosus GG
300361537 Lactobacillus gasseri JV-V03
169823755 Finegoldia magna ATCC 29328
Ns de orden de GenBank Bacteria
47458868 Mycoplasma mobile 163K
284931710 Mycoplasma gallisepticum str. F 363542550 Mycoplasma ovipneumoniae SC01 384393286 Mycoplasma canis PG 14
71894592 Mycoplasma synoviae 53
238924075 Eubacterium rectale ATCC 33656 116627542 Streptococcus thermophilus LMD-9 315149830 Enterococcus faecalis TX0012 315659848 Staphylococcus lugdunensis M23590 160915782 Eubacterium dolichum DSM 3991 336393381 Lactobacillus coryniformis subsp. torquens 310780384 llyobacter polytropus DSM 2926 325677756 Ruminococcus albus 8
187736489 Akkermansia muciniphila ATCC BAA-835 117929158 Acidothermus cellulolyticus 11B 189440764 Bifidobacterium longum DJ010A 283456135 Bifidobacterium dentium Bd1
38232678 Corynebacterium diphtheriae NCTC 13129 187250660 Elusimicrobium minutum Pei191 319957206 Nitratifractor salsuginis DSM 16511 325972003 Sphaerochaeta globus str. Buddy 261414553 Fibrobacter succinogenes subsp. succinogenes 60683389 Bacteroides fragilis NCTC 9343 256819408 Capnocytophaga ochracea DSM 7271 90425961 Rhodopseudomonas palustris BisB18 373501184 Prevotella micans F0438
294674019 Prevotella ruminicola 23
365959402 Flavobacterium columnare ATCC 49512 312879015 Aminomonas paucivorans DSM 12260 83591793 Rhodospirillum rubrum ATCC 11170 294086111 Candidatus Puniceispirillum marinum IMCC1322 121608211 Verminephrobacter eiseniae EF01-2 344171927 Ralstonia syzygii R24
159042956 Dinoroseobacter shibae DFL 12 288957741 Azospirillum sp-B510
92109262 Nitrobacter hamburgensis X14 148255343 Bradyrhizobium sp-BTAi1
34557790 Wolinella succinogenes DSM 1740 218563121 Campylobacter jejuni subsp. jejuni 291276265 Helicobacter mustelae 12198
229113166 Bacillus cereus Rock1 -15
222109285 Acidovorax ebreus TPSY
189485225 uncultured Termite group 1
182624245 Clostridium perfringens D str.
220930482 Clostridium cellulolyticum H10
Ns de orden de GenBank Bacteria
154250555 Parvibaculum lavamentivorans DS-1
257413184 Roseburia intestinalis L1-82
218767588 Neisseria meningitidis Z2491
15602992 Pasteurella multocida subsp. multocida
319941583 Sutterella wadsworthensis 31
254447899 gamma proteobacterium HTCC5015
54296138 Legionella pneumophila str. Paris
331001027 Parasutterella excrementihominis YIT 11859
34557932 Wolinella succinogenes DSM 1740
118497352 Francisella novicida U112
La tecnología descrita en este documento incluye el uso de una dCas9 obtenida a partir de cualquier proteína Cas9 (por ejemplo, como se ha indicado anteriormente) y sus correspondientes ARNs guía u otros a RNs guía que sean compatibles. La Cas9 procedente del sistema CRISPR1 LMD-9 de Streptococcus thermophilus, ha mostrado que funciona en células humanas (véase, por ejemplo, Cong et al. (2013) Science 339: 819). Además, Jinek mostró in vitro que los ortólogos de Cas9 procedentes de S. thermophilus y L. innocua, pueden ser guiados por un ARNg do­ ble de S. pyogenes para escindir el ADN plasmídico diana.
La presente tecnología puede comprender la proteína Cas9 procedente de S. pyogenes, ya sea codificada en bacte­ rias o con codones optimizados para una expresión en células de mamífero, que contiene mutaciones en D10, E762, H983 o D986 y H840 o N863, por ejemplo, D10A/D10N y H840A/H840N/H840Y, para hacer que la porción nucleasa de la proteína se vuelva catalíticamente inactiva; sustituciones en esas posiciones son, en algunos ejemplos, alanina (Nishimasu (2014) Cell 156: 935-949) o, en algunos ejemplos, otros residuos, por ejemplo, glutamina, asparagina, tirosina, serina o aspartato, por ejemplo, E762Q, H983N, H983Y, D986N, N863D, N863S o N863H. La secuencia de una proteína dCas9 procedente de S. pyogenes que tiene uso en la tecnología proporcionada en este documento, se describe en el documento US20160010076.
Por ejemplo, la dCas9 utilizada en este documento es al menos aproximadamente 50% idéntica a la secuencia de Cas9 de S. pyogenes, por ejemplo, al menos 50% idéntica a la siguiente secuencia de dCas9 que comprende las sustituciones D10A y H840A (SEQ ID NO: 1).
Met Asp Lys Lys Tyr Ser lie Gly LeuAla lie Gly Thr Asn SerVal
1 5 10 15
Gly Trp Ala Val lie Thr Asp Glu Tyr Lys Val Pro Ser Lys Lys Phe
20 25 30
Lys Val Leu GlyAsn ThrAsp Arg His Ser lie Lys Lys Asn Leu lie
35 40 45
Gly Ala Leu Leu Phe Asp Ser Gly Glu ThrAla Glu Ala Thr Arg Leu
50 55 60
Lys Arg Thr Ala Arg ArgArg Tyr Thr Arg Arg Lys Asn Arg lie Cys
65 70 75 80
Tyr Leu Gln Glu lie Phe SerAsn GluMetAla Lys Val AspAsp Ser
85 90 95
Phe Phe His Arg Leu Glu Glu Ser Phe LeuVal Glu GluAsp Lys Lys
100 105 110
His Glu Arg His Pro lie Phe GlyAsn lie Val Asp GluVal Ala Tyr
115 120 125
His Glu Lys Tyr Pro Thr lie Tyr His LeuArg Lys Lys LeuVal Asp
130 135 140
Ser Thr Asp LysAla Asp LeuArg Leu lie Tyr Leu Ala LeuAla His
145 150 155 160
Met lie Lys PheArg Gly His Phe Leu lie Glu GlyAsp LeuAsn Pro
165 170 175
AspAsn SerAsp Val Asp Lys Leu Phe lie Gln Leu Val Gln Thr Tyr
180 185 190
Asn Gln Leu Phe Glu GluAsn Pro lie AsnAla Ser Gly Val AspAla
195 200 205
Lys Ala lie Leu Ser Ala Arg Leu Ser Lys SerArg Arg Leu GluAsn
210 215 220
Leu lie Ala Gln Leu Pro Gly Glu Lys Lys Asn Gly Leu Phe GlyAsn
225 230 235 240
Leu lie Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn Phe 245 250 255
Asp Leu Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr Asp 260 265 270
Asp Asp Leu Asp Asn Lou Leu Ala Gln Ilc Gly Asp Gln Tyr Ala Asp 275 230 235
Leu Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala lie Leu Leu Ser Asp 290 295 300
lie Leu Arg Val Asn Thr Glu lie Thr Lys Ala Pro Leu Ser Ala Ser 305 310 315 320 Met lie Lys Arg Tyr Asp Glu Ilis Ilis Gln Asp Leu Thr Leu Leu Lys 325 330 335
Ala Leu Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys Glu lie Phe Phe 340 345 350
Asp Gln Ser Lys Asn Gly Tyr Ala Gly Tyr lie Asp Gly Gly Ala Ser 355 360 365
Gln Glu Glu Phe Tyr Lys Phe lie Lys Pro lie Leu Glu Lys Met Asp 370 375 380
Gly Thr Glu Glu Leu Leu Val Lys Leu Asn Arg Glu Asp Leu Leu Arg 385 390 395 400 Lys Gln Arg Thr Phe Asp Asn Gly Ser lie Pro His Gln lie His Leu 405 410 415
Gly Glu Leu His Ala lie Leu Arg Arg Gln Glu Asp P:ie Tyr Pro Phe 420 425 430
Leu Lys Asp Asn Arg Glu Lys lie Glu Lys lie Leu Thr Phe Arg lie 435 440 445
Pro Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe Ala Trp 450 455 460
Met Thr Arg Lys Ser Glu Glu Thr lie Thr Pro Trp Asn Phe Glu Glu 465 470 475 480 Val Val Asp Lys Gly Ala Ser Ala Gln Ser Phe lie Glu Arg Met Thr 485 490 495
Asn Phe Asp Lys Asn Leu Pro Asn Glu Lys Val Leu Pro Lys His Ser 500 505 510
Leu Leu Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys Val Lys 515 520 525
Tyr Val Thr Glu Gly Met Arg Lys Pro Ala Phe Leu Ser Gly Glu Gln 530 535 540
T.ys T,ys Ala TIe Val Asp Leu Leu Phe T.ys Thr Asn Arg T.ys Va1 Thr 345 330 555 360 Val Lys Gln Leu Lys Glu Asp Tyr Phe Lys Lys lie Glu Cys Phe Asp 565 570 575
Ser Val Glu lie Ser Gly Val Glu Asp Arg Phe Asn Ala Ser Leu Gly 580 585 590
Thr Tyr His Asp Leu Leu Lys lie lie Lys Asp Lys Asp Phe Leu Asp 555 600 605
Asn Glu Glu Asn Glu Asp lie Leu Glu Asp lie Val Leu Thr Leu Thr 610 615 620
Leu Phe Glu Asp Arg Glu Met lie Glu Glu Arg Leu Lys Thr Tyr Ala 625 630 635 640 His Leu Phe Asp Asp Lys Val Met Lys Gln leu Lys Arg Arg Arg Tyr 645 650 655
Thr Gly Trp Gly Arg Leu Ser Arg Lys Leu lie Asn Gly lie Arg Asp 660 665 670
Lys Gln Ser Gly Lys Thr lie Leu Asp Phe leu Lys Ser Asp Gly Phe 675 630 635
Ala Asn Arg Asn Phe Met Cln Leu Ilc His Asp Asp Ser Leu Thr Phe 690 695 700
Lys Glu Asp lie GLn Lys Ala Gln Val Ser Gly Gln Gly Asp Ser Leu 705 710 715 720 His Glu His lie Ala Asn Leu Ala Gly Ser Pro Ala lie Lys Lys Gly 725 730 735 lie Leu Gln Thr Val Lys Val Val Asp Glu Leu Val Lys Val Met Gly 740 745 75U
Arg His Lys Pro Glu Asn lie Val lie Glu Met Ala Arg Glu Asn Gln 755 760 765
Thr Thr Gln Lys Gly Gln Lys Asn Ser Arg Glu Arq Met Lys Arq lie 773 775 7D0
Glu Glu Gly' lie Lys Glu Leu Gly Ser Gln lie Leu Lys Glu His Pro 785 790 795 800 Val Glu Asn Thr Gln Leu Gln Asn Glu Lys Leu Tyr Leu Tyr Tyr Leu 805 810 815 Gln Asn Gly Arg Asp Met Tyr Val Asp Gln Glu Leu Asp lie Asn Arg 820 825 830
Leu Ser Asp Tyr Asp Val Asp Ala lie Val Pro Gln Ser Phe Leu Lys 835 840 845
Asp Asp Ser lie Asp Asn Lys Val Leu Thr Arg Ser Asp Lys Asn Arg 853 855 860
Gly Lys Ser Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys Met Lys 865 870 875 880 Asn Tyr Trp Arg Gln Leu Leu Asn Ala Lys Leu lie Thr Gln Arg Lys 885 890 895 Phe Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp 900 905 910
Lys ALa Gly Phe lie Lys Arg Gln Leu Val Glu Thr Arg Gln lie Thr 915 920 925
Lys His Val Ala Gln lie Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp 933 935 940
Glu Asn Asp Lys Leu lie Arg Glu Val Lys Val lie Thr Leu Lys Ser 945 950 S55 960 Lys Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val Arg 965 97ü 975 Glu lie Asn Asn Tyr His His Ala His Asp Ala Tyr Leu Asn Ala Val 980 985 990
Val Gly Thr Ala Leu lie Lys Lys Tyr Pro Lys Leu Glu Ser Glu Ph 995 1000 1005
Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys Met lie .Ala 1010 1015 1020
Lys Ser Glu Gln Glu lie:Gly Lys Ala Thr Ala Lys Tyr Phe Phe 1025 1030 1035
Tyr Ser Asn lie Met. Asn Phe Phe Lys Thr Glu lie Thr Leu Ala 1040 1045 1050
Asn Gly Glu lie Arg Lys Arg Pro Leu lie Glu Thr Asn Gly Glu 1055 1060 1065
Thr Gly Glu lie Val Trp1Asp Lys Gly Arg Asp Phe .Ala Thr Val 1070 1075 1080
Arg Lys Val Leu Ser Met Pro Gln Val Asn Tle Val Lys Lys Thr 1035 1090 1095
Glu Val Gln Thr Gly1Gly■Phe Ser Lys Glu Ser lie Leu Pro Lys 1130 1105 1110
Arg Asn Ser Asp Lys Leu lie Ala Arg Ly's Lys Asp Trp Asp Pro 1115 1120 1125
Lys Lys Tyr Gly Gly Fhe Asp Ser Pro Thr Val Ala Tyr Ser Val 1130 1135 1140
Leu Val Val Ala Lys Val Glu Lys Gly Lys Ser Lys Lys Leu Lys 1145 1150 1155
Ser Val Lys Clu Leu.Leu.Cly Ile Thr lie Mct Clu Arg Ser Ser USO 1165 1170
Phe Glu Lys Asn Pro lie Asp Phe Leu Glu Ala Lys Gly Tyr Lys 1175 1180 1185
Glu Val Lys Lys Asp Leu.lie lie Lys Leu Pro Lys Tyr Ser Leu 1190 1195 1200
Phe Glu Leu GluAsn GlyArg Lys Arg Met LeuAla SerAla Gly
1205 1210 1215
Glu Leu Gln Lys GlyAsn Glu LeuAla Leu Pro Ser Lys Tyr Val
1220 1225 1230
Asn Phe Leu Tyr LeuAla Ser His Tyr Glu Lys Leu Lys Gly Ser
1235 1240 1245
Pro Glu AspAsn Glu Gln Lys Gln Leu PheVal Glu Gln His Lys
1250 1255 1260
His Tyr LeuAsp Glu lie lie Glu Gln lie Ser Glu Phe Ser Lys
1265 1270 1275
Arg Val lie LeuAla Asp Ala Asn LeuAsp Lys Val Leu SerAla
1280 1285 1290
Tyr Asn Lys His Arg Asp Lys Pro lie Arg Glu Gln Ala Glu Asn
1295 1300 1305
lie lie His Leu Phe Thr Leu ThrAsn Leu GlyAla Pro Ala Ala
1310 1315 1320
Phe Lys Tyr PheAsp Thr Thr lie AspArg Lys Arg Tyr Thr Ser
1325 1330 1335
Thr Lys Glu Val Leu AspAla Thr Leu lie His Gln Ser lie Thr
1340 1345 1350
Gly Leu Tyr Glu ThrArg lie Asp Leu Ser Gln Leu Gly GlyAsp
1355 1360 1365
En algunos ejemplos, la tecnología comprende el uso de una secuencia de nuoleótldos que es aproximadamente 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 99% o 100% idéntica a una secuencia de nucleótldos que codifica una proteína descrita mediante SEQ ID NO: 1.
En algunos ejemplos, la dCas9 utilizada en esta memoria, es al menos aproximadamente un 50% idéntica a la se­ cuencia de Cas9 catalíticamente inactiva de S. pyogenes, es decir, al menos un 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 99% o 100% idéntica a SEQ ID NO: 1, en donde se conservan las mutaciones en D10 y H840, por ejemplo, D10A/D10N y H840A/H840N/H840Y.
En algunos ejemplos, cualquier diferencia con SEQ ID NO: 1 se encuentra en regiones no conservadas, identifica­ das mediante una alineación de secuencias de las secuencias expuestas en Chylinski et al., RNA Biology 10:5, 1-12; 2013 (por ejemplo, en la FIG. 1 complementaria y en la tabla 1 complementaria de la misma); Esvelt et al., Nat Methods. 2013 noviembre; 10(11):1116-21 y Fonfara et al., Nucl. Acids Res. (2014) 42 (4): 2577-2590. [Publicación electrónica antes de la impresión del 22 de noviembre de 2013] doi: 10.1093/nar/gkt1074, y en donde se conservan las mutaciones en D10 y H840, por ejemplo, D10A/D10N y H840A/H840N/H840Y.
Para determinar el porcentaje de identidad de dos secuencias, las secuencias se alinean con fines de una compara­ ción óptima (se introducen huecos en una o ambas de una primera y una segunda secuencia de aminoácidos o de ácidos nucleicos según sea necesario, para una alineación óptima, y las secuencias no homólogas se pueden igno­ rar para los fines comparativos). La longitud de una secuencia de referencia alineada con fines comparativos es al menos un 50% (en algunos ejemplos, aproximadamente el 50%, 55%, 60%, 65%, 70%, 75%, 85%, 90%, 95% o 100%) de la longitud de la secuencia de referencia). A continuación, se comparan los nucleótidos o los residuos en las posiciones correspondientes. Cuando una posición en la primera secuencia está ocupada por el mismo nucleótido o residuo que en la posición correspondiente en la segunda secuencia, entonces las moléculas son idénticas en esa posición. El porcentaje de identidad entre las dos secuencias es una función del número de posiciones idénticas compartidas por las secuencias, teniendo en cuenta el número de huecos y la longitud de cada hueco, que se tiene que introducir para una alineación óptima de las dos secuencias.
La comparación de secuencias y la determinación del porcentaje de identidad entre dos secuencias se pueden lo­ grar usando un algoritmo matemático. Para los fines de la presente solicitud, el porcentaje de identidad entre dos secuencias de aminoácidos se determina usando el algoritmo de Needleman y Wunsch ((1970) J. Mol. Biol. 48:444-453) que se ha incorporado al programa GAP en el paquete de programas informáticos GCG, utilizando una matriz de puntuación Blosum 62 con una penalización por hueco de 12, una penalización por extensión de hueco de 4 y una penalización por hueco con cambio de marco de lectura de 5.
Por consiguiente, en esta memoria se proporciona un enfoque basado en dCas9/ARNg para detectar ácidos nuclei­ cos bicatenarios (por ejemplo, ADN genómico bicatenario) usando sondas SiMREPS. Los ejemplos de la tecnología comprenden capturar dianas de ADN genómico sin marcar sobre una superficie de vidrio o sílice fundida, utilizando una enzima dCas9 cargada con ARNg, enzimáticamente muerta o enzimas que se unen a uno o varios segmentos de la diana con alta especificidad y estabilidad (por ejemplo, formando aproximadamente 20 bases pares en el sitio complementario del ARNg; Fig.3). La captura en la superficie de ácidos nucleicos dirigida por dCas9 biotinilada viene acompañada por la observación de una unión transitoria y repetida de la sonda SiMREPS a un segundo segmento de la diana que se ha vuelto accesible por la fusión mediada por dCas9/ARNg.
Por tanto, en algunos ejemplos, una dCas9 biotinilada que comprende un ARN guía (ARNg) que comprende una secuencia apropiada, captura un ácido nucleico diana. Además, dCas9, con la ayuda del ARNg, fusiona el ADN, Io que produce una hebra de ADN complementaria sin molde que es monocatenaria y accesible para la sonda de bús­ queda. En algunos ejemplos, la tecnología comprende el uso de una segunda dCas9 no biotinilada que comprende un segundo ARNg que se une al ácido nucleico diana (Fig. 4). El segundo dCas9/ARNg se une al ácido nucleico diana a una distancia del primer dCas9/ARNg que tiene aproximadamente el tamaño de la sonda de búsqueda, por ejemplo, de 5 a 30 nucleótidos. Es decir, el dCas9/ARNg biotinilado (dCas9/ARNg de captura) y el segundo dCas9/ARNg se unen a regiones adyacentes a la región del ácido nucleico diana a la que se une la sonda de bús­ queda. Los dos complejos de dCas9/ARNg fusionan la región de ácido nucleico entre ellos para proporcionar una región de búsqueda monocatenaria, accesible para unir la sonda de búsqueda. En consecuencia, el espaciamiento entre los dos complejos de dCas9/ARNg es apropiado para la unión de una sonda de búsqueda entre ellos.
Métodos
En algunos ejemplos, la tecnología proporciona un método para detectar un ácido nucleico bicatenario. Por ejemplo, en algunos ejemplos, un ADN diana de ácido nucleico (por ejemplo, un ADN genómico) se trata previamente de forma breve con dCas9/ARNg (por ejemplo, a temperatura ambiente o cerca de la misma ("ambiental")). A continua­ ción, el ARN guía (ARNg) del complejo dCas9/ARNg se hibrida con el ácido nucleico diana (p. ej., un ADN genómi­ co) en una región adyacente a una región de búsqueda (p. ej., una región del ácido nucleico diana que es comple­ mentaria a una sonda de búsqueda). dCas9/ARNg fusiona una secuencia de ADN específica (por ejemplo, la región de búsqueda) en el ácido nucleico diana. Los métodos comprenden capturar la dCas9 (por ejemplo, una dCas9 biotinilada) sobre una superficie de portaobjetos (por ejemplo, mediante una interacción biotina-avidina). Después de la captura e inmovilización de dCas9/ARNg-ácido nucleico diana en la superficie, se emplea SiMREPS para detectar la unión de una sonda de búsqueda a la región de búsqueda en el ácido nucleico diana, que está situado de forma adyacente al sitio del ácido nucleico diana hibridado con el ARNg. Véase, por ejemplo, la Fig.3.
En algunos ejemplos, se utilizan dos complejos de dCas9/ARNg para hacer que la región de búsqueda de un ácido nucleico diana sea accesible a una sonda de búsqueda. En algunos ejemplos, la hibridación de dos complejos de dCas9/ARNg para flanquear la región de búsqueda, mejora la accesibilidad al ácido nucleico diana (por ejemplo, la región de búsqueda) para la sonda de búsqueda para la detección basada en SiMREPS. Se biotinila una dCas9 para la captura sobre la superficie; la otra (por ejemplo, la segunda) dCas9 está opcionalmente biotinilada (en reali­ zaciones preferidas, la segunda dCas9 no está biotinilada). Véase, por ejemplo, la Fig. 4. El espacio entre las regio­ nes unidas por los dos complejos de dCas9/ARNg que se unen al ácido nucleico diana, proporciona un espacio apropiado para la unión de la sonda de búsqueda a la región de búsqueda del ácido nucleico diana.
En algunos ejemplos, la sonda de búsqueda detectable (por ejemplo, fluorescente) produce una señal de emisión de fluorescencia cuando está cerca de la superficie del soporte sólido (por ejemplo, a aproximadamente 100 nm de la superficie del soporte sólido). Cuando no están unidas, las sondas de búsqueda se difunden rápidamente y, por lo tanto, no se detectan individualmente; por consiguiente, cuando están en estado no unido, las sondas de búsqueda producen un nivel bajo de fluorescencia de fondo difusa. En consecuencia, en algunos ejemplos, la detección de las sondas de búsqueda unidas comprende el uso de una microscopía de fluorescencia con reflexión interna total (TIRF), microscopía HiLo (véanse, por ejemplo, los documentos US20090084980, EP2300983 B1, W02014018584 A1, W02014018584 A1), microscopía de barrido confocal u otras tecnologías que comprenden esquemas de ilumi­ nación que iluminan (p. ej., excitan) solo aquellas moléculas de la sonda de búsqueda que están cerca o sobre la superficie del soporte sólido. Por tanto, en algunos ejemplos, solo las sondas de búsqueda que están unidas a una diana inmovilizada cerca o sobre la superficie, producen una señal de emisión de tipo puntual (por ejemplo, un "pun­ to") que se puede confirmar como que es originario de una molécula individual.
En términos generales, la observación comprende hacer un seguimiento de la emisión de fluorescencia en una serie de ubicaciones separadas sobre el soporte sólido, en donde los ácidos nucleicos diana están inmovilizados (por ejemplo, al estar unidos específicamente al dCas9/ARNg fijado a la superficie), por ejemplo, en una serie de "puntos" fluorescentes que parpadean, p. ej., que pueden estar en estado "encendido" y "apagado". La presencia de emisión de fluorescencia (el punto está "encendido") y la ausencia de emisión de fluorescencia (el punto está "apagado") se registra en cada ubicación separada (por ejemplo, en cada "punto" sobre el soporte sólido). Cada punto "parpadea", por ejemplo, un punto alterna entre los estados "encendido" y "apagado", respectivamente, cuando una sonda de búsqueda se une al ácido nucleico diana inmovilizado en ese punto y cuando la sonda de búsqueda se disocia del ácido nucleico diana inmovilizado en ese punto.
Los datos recogidos proporcionan la determinación del número de veces que una sonda de búsqueda se une a cada diana inmovilizada (p. ej., la cantidad de veces que cada punto parpadea "encendido") y una medición de la cantidad de tiempo que una sonda de búsqueda permanece unida (p. ej., el tiempo que un punto permanece "encendido" antes de "apagarse").
En algunos ejemplos, la sonda de búsqueda comprende un marcador fluorescente que tiene una longitud de onda de emisión. La detección de la emisión de fluorescencia a la longitud de onda de emisión del marcador fluorescente indica que la sonda de búsqueda está unida a un ácido nucleico diana inmovilizado. La unión de la sonda de bús­ queda al ácido nucleico diana es un "evento de unión". En algunos ejemplos de la tecnología, un evento de unión tiene una emisión de fluorescencia que tiene una intensidad medida mayor que un umbral definido. Por ejemplo, un evento de unión puede tener una intensidad de la fluorescencia que está por encima de la intensidad de la fluores­ cencia de fondo (por ejemplo, la intensidad de la fluorescencia observada en ausencia de un ácido nucleico diana). En algunos ejemplos, un evento de unión tiene una intensidad de la fluorescencia que es al menos 1, 2, 3, 4 o más desviaciones estándar superior a la intensidad de la fluorescencia de fondo (por ejemplo, la intensidad de la fluores­ cencia observada en ausencia de un ácido nucleico diana). En algunos ejemplos, un evento de unión tiene una in­ tensidad de la fluorescencia que es al menos 2 desviaciones estándar superior a la intensidad de la fluorescencia de fondo (por ejemplo, la intensidad de la fluorescencia observada en ausencia de un ácido nucleico diana). En algunos ejemplos, un evento de unión tiene una intensidad de la fluorescencia que es al menos 1,5, 2, 3, 4 o 5 veces la in­ tensidad de la fluorescencia de fondo (por ejemplo, la intensidad de la fluorescencia media observada en ausencia de un ácido nucleico diana).
En consecuencia, en algunos ejemplos, la detección de fluorescencia con la longitud de onda de emisión de la son­ da fluorescente que tiene una intensidad superior al umbral definido (p. ej., al menos 2 desviaciones estándar supe­ rior a la intensidad de fondo), indica que se ha producido un evento de unión (p. ej., en una ubicación separada so­ bre el soporte sólido en donde se inmoviliza un ácido nucleico diana). Además, en algunos ejemplos, la detección de una fluorescencia en la longitud de onda de emisión de la sonda fluorescente que tiene una intensidad superior a la del umbral definido (por ejemplo, al menos 2 desviaciones estándar superior a la intensidad de fondo), indica que ha comenzado un evento de unión. En consecuencia, en algunos ejemplos, la detección de una ausencia de fluores­ cencia con la longitud de onda de emisión de la sonda fluorescente que tiene una intensidad superior a la del umbral definido (por ejemplo, al menos 2 desviaciones estándar superior a la intensidad de fondo), indica que un evento de unión ha terminado (por ejemplo, la sonda de búsqueda se ha disociado del ácido nucleico diana). El período de tiempo entre el inicio del evento de unión y el final del evento de unión (por ejemplo, el período de tiempo durante el cual se detecta una fluorescencia con la longitud de onda de emisión de la sonda fluorescente que tiene una intensi­ dad superior al umbral definido (por ejemplo, al menos 2 desviaciones estándar superior a la intensidad de fondo), es el tiempo de permanencia del evento de unión. Una "transición" se refiere a la unión y la disociación de una sonda de búsqueda con el ácido nucleico diana (por ejemplo, un evento de encendido/apagado).
Los métodos de acuerdo con la tecnología comprenden hacer un recuento del número de eventos de unión de la sonda de búsqueda que tienen lugar en cada ubicación separada sobre el soporte sólido, durante un intervalo de tiempo definido que es el "tiempo de adquisición" (por ejemplo, un intervalo de tiempo que es de decenas a cientos y a miles de segundos, por ejemplo, 5, 10, 15, 20, 25, 30, 35, 40, 45, 50, 55 o 60 segundos; por ejemplo, 5, 10, 15, 20, 25, 30, 35, 40, 45, 50, 55 o 0 minutos; por ejemplo, 1, 1,5, 2, 2,5 o 3 horas). En algunos ejemplos, el tiempo de ad­ quisición es aproximadamente de 1 a 10 segundos hasta 1 a 10 minutos (por ejemplo, aproximadamente de 1 a 100 segundos, por ejemplo, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 30, 40, 50, 60, 70, 80, 90 o 100 segundos, p. ej., de 1 a 100 minutos, p. ej., 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 30, 40, 50, 60, 70, 80, 90 o 100 minutos).
Además, el período de tiempo durante el cual la sonda de búsqueda permanece unida al ácido nucleico diana duran­ te un evento de unión es el "tiempo de permanencia" del evento de unión. El número de eventos de unión detecta­ dos durante el tiempo de adquisición y/o el periodo de tiempo de permanencia registrados para los eventos de unión, es/son característicos de una sonda de búsqueda que se une a un ácido nucleico diana y, por lo tanto, proporciona una indicación de que el ácido nucleico diana está inmovilizado en dicha ubicación separada y, por tanto, que el ácido nucleico diana esté presente en la muestra.
La unión de la sonda de búsqueda al ácido nucleico diana inmovilizado y/o la disociación de la sonda de búsqueda del ácido nucleico diana inmovilizado, se controla (p. ej., utilizando una fuente de luz para excitar la sonda fluores­ cente y detectar la emisión de fluorescencia desde una sonda de búsqueda unida, por ejemplo, usando un micros­ copio de fluorescencia) y/o se registra durante un intervalo de tiempo definido (por ejemplo, durante el tiempo de adquisición). El número de veces que la sonda de búsqueda se une al ácido nucleico durante el tiempo de adquisi­ ción y/o el periodo de tiempo que la sonda de búsqueda permanece unida al ácido nucleico durante cada evento de unión y el periodo de tiempo en que la sonda de búsqueda permanece sin unirse al ácido nucleico entre cada evento de unión (p. ej., los "tiempos de permanencia" en el estado unido y no unido, respectivamente), se determinan, p. ej., mediante el uso de una computadora y un programa informático (p. ej., para analizar los datos utilizando un modelo de Markov oculto y estadísticas de Poisson).
En algunos ejemplos, se miden muestras de control (por ejemplo, en ausencia de diana). La fluorescencia detectada en una muestra de control es la "fluorescencia de fondo" o "intensidad (fluorescencia) de fondo" o "de referencia".
En algunos ejemplos, los datos que comprenden mediciones de la intensidad de la fluorescencia en la longitud de onda de emisión de la sonda de búsqueda, se registran como una función del tiempo. En algunos ejemplos, el nú­ mero de eventos de unión y los tiempos de permanencia de los eventos de unión (por ejemplo, para cada ácido nucleico inmovilizado) se determinan a partir de los datos (por ejemplo, determinando el número de veces y los pe­ ríodos de tiempo en que la intensidad de la fluorescencia es superior a un umbral de fondo de la intensidad de la fluorescencia). En algunos ejemplos, las transiciones (por ejemplo, la unión y la disociación de una sonda de bús­ queda) se cuentan para cada ubicación separada sobre el soporte sólido en donde se inmoviliza un ácido nucleico diana. En algunos ejemplos, se usa un número umbral de transiciones para discriminar la presencia de un ácido nucleico diana en una ubicación separada sobre el soporte sólido, de la señal de fondo, un ácido nucleico no diana y/o una unión falsa de la sonda de búsqueda. En algunos ejemplos, un número de transiciones superior a 10 regis­ tradas durante el tiempo de adquisición, indica la presencia de un ácido nucleico diana en la ubicación separada del soporte sólido.
En algunos ejemplos, se determina una distribución del número de transiciones para cada diana inmovilizada; por ejemplo, se cuenta el número de transiciones para cada diana de ácido nucleico inmovilizada observada. En algunos ejemplos se produce un histograma. En algunos ejemplos, se determinan los parámetros característicos de la distri­ bución, por ejemplo, se determina la media, la mediana, el pico, la forma, etc. de la distribución. En algunos ejem­ plos, los datos y/o los parámetros (p. ej., los datos de la fluorescencia (p. ej., los datos de la fluorescencia en el do­ minio del tiempo), los datos cinéticos, los parámetros característicos de la distribución, etc.) se analizan mediante algoritmos que reconocen patrones y regularidades en los datos, usando, por ejemplo, inteligencia artificial, recono­ cimiento de patrones, aprendizaje automático, inferencia estadística, redes neuronales, etc. En algunos ejemplos, el análisis comprende el uso de un análisis frecuentista y en algunos ejemplos el análisis comprende el uso de un aná­ lisis bayesiano. En algunos ejemplos, los sistemas de reconocimiento de patrones se preparan usando datos de "entrenamiento" conocidos (por ejemplo, usando un aprendizaje supervisado) y en algunos ejemplos se usan algo­ ritmos para descubrir patrones previamente desconocidos (por ejemplo, un aprendizaje no supervisado). Véase, por ejemplo, Duda, et al. (2001) Pattern classification (2a edición), Wiley, New York; Bishop (2006) Pattern Recognition and Machine Learning, Springer.
El reconocimiento de patrones (p. ej., empleando de conjuntos de entrenamiento, aprendizaje supervisado, aprendi­ zaje no supervisado y análisis de muestras desconocidas) asocia patrones identificados con ácidos nucleicos de manera que los patrones particulares proporcionan una "huella genética" de ácidos nucleicos particulares que se utilizan en la detección, cuantificación e identificación de ácidos nucleicos.
En algunos ejemplos, la distribución producida a partir de un ácido nucleico diana es significativamente diferente de una distribución producida a partir de un ácido nucleico no diana o la distribución producida en ausencia de un ácido nucleico diana. En algunos ejemplos, se determina un número medio de transiciones para la pluralidad de los ácidos nucleicos diana inmovilizados. En algunos ejemplos, el número medio de transiciones observadas para una muestra que comprende un ácido nucleico diana, está relacionado de forma aproximadamente lineal como una función del tiempo y tiene una pendiente positiva (por ejemplo, el número medio de transiciones se incrementa de forma apro­ ximadamente lineal como una función del tiempo).
En algunos ejemplos, los datos se tratan usando estadísticas (por ejemplo, estadísticas de Poisson) para determinar la probabilidad de que tenga lugar una transición como una función del tiempo en cada ubicación separada sobre el soporte sólido. En algunos ejemplos particulares, una probabilidad relativamente constante de que tenga lugar un evento de transición como una función del tiempo en una ubicación separada sobre el soporte sólido, indica la pre­ sencia de un ácido nucleico diana en dicha ubicación separada sobre el soporte sólido. En algunos ejemplos, se calcula un coeficiente de correlación que relaciona el número de eventos y el tiempo transcurrido a partir de la pro­ babilidad de que tenga lugar un evento de transición, como una función del tiempo en una ubicación separada sobre el soporte sólido. En algunos ejemplos, un coeficiente de correlación que relaciona el número de eventos y el tiempo transcurrido que es superior a 0,95 cuando se calcula a partir de la probabilidad de que tenga lugar un evento de transición como una función del tiempo en una ubicación separada sobre el soporte sólido, indica la presencia de un ácido nucleico diana en dicha ubicación separada sobre el soporte sólido.
En algunos ejemplos, los tiempos de permanencia de la sonda de búsqueda unida (Tasociación) y la sonda de búsque­ da no unida (Tdisociación) se utilizan para identificar la presencia de un ácido nucleico diana en una muestra y/o para distinguir una muestra que comprende un ácido nucleico diana de una muestra que comprende un ácido nucleico no diana y/o que no comprende el ácido nucleico diana. Por ejemplo, el Tasociación para un ácido nucleico diana es mayor que el Tasociación para un ácido nucleico no diana; y, el Tdisociación para un ácido nucleico diana es menor que el Tdisociación para un ácido nucleico no diana. En algunos ejemplos, medir el Tasociación y el Tdisociación para un control negativo y para una muestra, indica la presencia o la ausencia del ácido nucleico diana en la muestra. En algunos ejemplos, se de­ termina una pluralidad de valores de Tasociación y Tdisociación para cada uno de una pluralidad de puntos visualizados sobre un soporte sólido, por ejemplo, para un control (por ejemplo, un control positivo y/o negativo) y una muestra que se sospecha que comprende un ácido nucleico diana. En algunos ejemplos, se determina un Tasociación y/o Tdisociación medio para cada uno de una pluralidad de puntos visualizados sobre un soporte sólido, por ejemplo, para un control (por ejemplo, un control positivo y/o negativo) y una muestra que se sospecha que comprende un ácido nu­ cleico diana. En algunos ejemplos, una representación gráfica de Tasociación frente a Tdisociación (por ejemplo, Tasociación y Tdisociación medios, Tasociación y Tdisociación promediados en el tiempo, etc.) para todos los puntos visualizados, indica la presencia o ausencia del ácido nucleico diana en la muestra.
Aplicaciones
La tecnología tiene uso en la detección de ácidos nucleicos, por ejemplo, ácidos nucleicos monocatenarios y bicatenarios. En consecuencia, la tecnología proporciona la detección de diversas formas de ADN (por ejemplo, ADN que comprende bases modificadas, por ejemplo, ADN metilado, ADN no metilado) y ARN (por ejemplo, ARNInc, miARN, etc.), por ejemplo, para proporcionar una detección de múltiples ácidos nucleicos en una plataforma común. En con­ secuencia, la tecnología tiene uso en aplicaciones ejemplares tales como, por ejemplo, la detección de uno o varios microARNs, ARNs, alelos de ADN mutante, alelos de ADN de tipo silvestre y ADNs metllados específicos de un locus, todos sobre la plataforma SIMREPS. La detección de estos tipos de ácidos nucleicos se produce, en algunos ejemplos, en la misma muestra.
Por ejemplo, la tecnología se utiliza para detectar ADN metilado. El ADN metilado es un marcador de muchos esta­ dos de salud y enfermedad, incluyendo, por ejemplo, la identificación de pacientes con un riesgo más elevado de padecer cáncer colorrectal, basándose en la presencia de loci metilados específicos. El ADN metilado también pro­ porciona la base de una prueba de diagnóstico para la detección temprana de un cáncer colorrectal, así como de adenomas precancerosos y lesiones displásicas. La detección de ADN metilado en loci específicos se realiza ac­ tualmente mediante un tratamiento del ADN con bisulfito de sodio, que desamina las citosinas no metiladas para producir uracilo en el ADN, seguido de una PCR que emplea distintos conjuntos de cebadores que amplifican selec­ tivamente fragmentos de ADN metilado (p. ej., 5-mC o 5-hmC, que están protegidos de una conversión mediante el bisulfito de Na) o fragmentos no metilados (en donde los cebadores están diseñados para unirse a la secuencia convertida anticipada que contiene uracilos en lugar de citosinas). Otro enfoque es realizar una secuenciación de nueva generación de ADN tratado con bisulfito y/o sin tratar para inferir las bases metiladas.
Aunque la conversión con bisulfito seguida de una PCR o secuenciación de nueva generación son enfoques usados generalmente, adolecen de limitaciones significativas. Sorprendentemente, algunas de esas limitaciones de las tec­ nologías basadas en bisulfito proporcionan ventajas para la detección de ADN metilado utilizando la tecnología SiMREPS proporcionada en este documento. En primer lugar, el tratamiento con bisulfito no solo desamina las cito­ sinas, sino que también fragmenta aleatoriamente el ADN en fragmentos más cortos, creando un reto para el diseño de cebadores de PCR, especialmente porque la longitud de la secuencia se vuelve muy corta. Además, después de la conversión con bisulfito, las regiones de ADN que se han sometido a una desaminación en las citosinas ya no son complementarias y, por lo tanto, no son de doble hebra, lo que hace que la PCR sea algo más compleja ya que solo se puede amplificar una hebra con cualquier conjunto dado de cebadores de PCR. Un enfoque de SiMREPS, por otro lado, se beneficia fundamentalmente de la conversión de ácidos nucleicos bicatenarios en ácidos nucleicos monocatenarios, así como de la fragmentación de ácidos nucleicos en fragmentos cortos.
En algunos ejemplos, se detecta la presencia o ausencia de modificaciones de ácidos nucleicos (por ejemplo, bases modificadas, análogos de nucleótidos, etc.). Por ejemplo, se pueden detectar modificaciones epigenéticas de ácidos nucleicos que influyen en la expresión génica. En algunos ejemplos, se detecta una metilación del ADN. En algunos ejemplos, la tecnología tiene uso para detectar (por ejemplo, identificar la presencia o ausencia de) análogos de nucleótidos, bases de nucleótidos - o nucleósidos y/o nucleótidos que comprenden bases - distintas de la adenina, timina, guanosina, citosina y uracilo. Por ejemplo, la tecnología puede tener uso para detectar, identificar y/o cuantificar un nucleótido, nucleósido y/o una base, incluyendo, sin estar limitadas a las mismas, 5-metilcitosina (5mC), 5-hidroximetilcitosina (5hmC), 5-formilcitosina (5fC) y 5-carboxitosina (5caC), N(6)-metiladenosina (m(6)A), seudouridina (^), dihidrouridina (D), inosina (I), 7-metilguanosina (m7G), hipoxantina, xantina, 2,6-diaminopurina y 6,8-diaminopurina.
En un ejemplo, la tecnología comprende detectar ADN metilado mediante SiMREPS, comprende analizar muestras que se tratan con bisulfito y muestras que no se han tratado con bisulfito. Los ejemplos proporcionan el uso de son­ das de búsqueda para SiMREPS que distinguen las secuencias esperadas a partir de la conversión de citosinas no metiladas en uracilo, de las secuencias esperadas si la(s) citosina(s) en un locus dado no se convierte(n) en uracilo (debido a una metilación). En algunos ejemplos, ambas sondas de búsqueda se proporcionan en la cámara de la muestras al mismo tiempo y cada sonda comprende un fluoróforo diferente. En algunos ejemplos, el reactivo de bisulfito se proporciona en tiempo real mientras se obtiene una imagen de un experimento SiMREPS con ambas sondas de búsqueda presentes (por ejemplo, una sonda que se une a la secuencia metilada y una segunda sonda que se une a la secuencia convertida en uracilo, cada una con un fluoróforo distinto), en donde los fragmentos de ADN que parpadean en un color cambiarán a parpadear en el otro color basándose en la conversión. Ese ensayo proporciona una mayor exactitud y precisión en las mediciones que comparar una parte alícuota de muestra tratada con bisulfito, con una parte alícuota sin tratar, lo que es necesario para los enfoques actuales basados en la secuenciación de nueva generación o la PCR. En algunos ejemplos, la tecnología es un análisis múltiple que utiliza microfluidos y/o la formación de imágenes multiespectrales, por ejemplo. Además de la modificación con bisulfato, la tec­ nología comprende el uso de otros reactivos que convierten marcadores químicos adicionales sobre ADN o ARN en modificaciones que se detectan fácilmente con SiMREPS.
En algunos ejemplos, la tecnología se utiliza para detectar una combinación de biomarcadores de ADN mutante, ADN metilado y microARN en la misma plataforma. Por ejemplo, esa tecnología tiene uso en la detección de cáncer colorrectal y adenoma avanzado, por ejemplo, analizando una muestra de heces. La tecnología permite la detección de ADN mutante (p. ej., detectar 1 molécula mutante en un fondo de 1.000.000 de moléculas de tipo silvestre; p. ej., detectar ADN mutante KRAS en un fondo de ADN de tipo silvestre). Además, la tecnología también proporciona una tecnología para medir los tres tipos de marcadores (ADN metilado, miARN y/o ADN mutante). La tecnología tiene uso en el análisis de ácidos nucleicos en una solución tampón; la tecnología tiene uso en el análisis de ácidos nu­ cleicos en una matriz extraída a partir de una materia fecal. Una materia fecal promedio pesa 200 g y comprende aproximadamente 10 millones de equivalentes de genoma diploide de ADN humano. Una sensibilidad de 1:1.000.000 proporciona la detección de tan solo 10 moléculas mutantes en el ADN extraído a partir de una materia fecal completa normal. Esto es 10.000 veces más sensible que los ensayos KRAS actuales, usados clínicamente y 100 veces más sensible que Ios métodos de grado de investigación con mejor rendimiento. Véase, por ejemplo, Domagala et al. (2012) "KRAS mutation testing in colorectal cáncer as an example of the pathologist's role in personalized targeted therapy; a practical approach" PoI J Pathol 63(3): 145-64; Gerecke et al. (2013) "Ultrasensitive detection of unknown colon cancer-initiating mutations using the example of the Adenomatous polyposis coli gene" Cáncer Prev Res (Phila). 6(9): 898-907. Este avance espectacular en el rendimiento viene proporcionado por la especificidad arbitraria para una discriminación entre alelos que es inherente a la huella genética cinética de la tec­ nología SiMREPS.
Detección de biomarcadores para el cáncer
La colonoscopia es el método de detección dominante para el cáncer colorrectal (CCR) en los EE.UU., a pesar de su carácter invasivo, costes elevados, bajo cumplimiento del paciente y riesgo de complicaciones. Los nuevos diagnós­ ticos, tales como la detección del cáncer colorrectal en las heces, están limitados por la baja sensibilidad para detec­ tar adenomas avanzados (AA), cuya extirpación previene el CCR. Actualmente, la prueba basada en las heces con mejor rendimiento analiza el ADN de las heces (ADN mutante y metilación) y la sangre oculta, pero es técnicamente compleja, costosa (500 $/prueba) y está restringida por una capacidad limitada para detectar alelos de ADN mutante raros en un fondo elevado de ADN de tipo silvestre.
La tecnología de detección descrita en este documento proporciona una nueva tecnología para una medición rápida y de bajo costo de alelos de ADN mutantes raros en las heces, con una especificidad analítica excelente, con una medición simultánea de la sangre oculta (por ejemplo, utilizando un marcador de microARN de sangre oculta) y ADN metilado en una sola plataforma. La tecnología proporciona una mayor sensibilidad para detectar adenomas avan­ zados con unos costes >10 veces menores que en el estado de la técnica actual.
La tecnología proporciona una cuantificación de alelos de ADN mutantes raros con una especificidad que es órdenes de magnitud superior a la de los métodos actuales, lo que conduce a una detección del AA muy sensibilizada. Se pueden detectar mutaciones que definen el adenoma, como en el gen APC.
La tecnología permite la medición de múltiples tipos de biomarcadores de las heces, todos en una sola plataforma. En algunos ejemplos, además del ADN mutante, los marcadores detectados en la plataforma incluyen microARN (véase, por ejemplo, el documento US 2016/0046988 A1), un marcador de sangre oculta en heces (p. ej., un marca­ dor de microARN de sangre oculta en heces) y ADN metilado.
Detección de ARN
En algunos ejemplos, el ácido nucleico que se va a detectar, caracterizar, cuantificar y/o identificar (p. ej., el ácido nucleico diana) es un ARN (p. ej., un ARNlnc, p. ej., un ARN que no codifica proteínas de más de aproximadamente 200 nucleótidos). Los ejemplos proporcionan que la estructura secundaria de un ácido nucleico (por ejemplo, un ARN, por ejemplo, un ARNlnc) se fusiona para proporcionar un acceso a las regiones de búsqueda mediante sondas de búsqueda para una detección con SiMREPS. Por ejemplo, la tecnología puede comprender el uso de un dCas9/ARNg que reconoce y fusiona una diana de estructura secundaria en un ARN, usando un oligonucleótido auxiliar de PAM (por ejemplo, un PAMmer). En algunos ejemplos, la tecnología comprende el uso de dos complejos de dCas9/ARNg que reconocen y desnaturalizan una diana con estructura secundaria en un ARN, usando un oligo­ nucleótido auxiliar de PAM (por ejemplo, un PAMmer).
En algunos ejemplos, la dCas9 se une a dianas de ARN monocatenario que coinciden con la secuencia del ARNg cuando el PAM se presenta en trans como un oligonucleótido de ADN separado (un "oligonucleótido presentador de PAM" o "PAMmer"). Por consiguiente, en algunos ejemplos, los PAMmer proporcionan una unión específica del sitio para dCas9/ARNg a dianas de ARN monocatenario (por ejemplo, ARNlnc). Además, la tecnología proporciona el uso de PAMmer para dirigir a dCas9 para que se una a dianas de ARNs específicos y fusionar la estructura secundaria para que las regiones de búsqueda estén disponibles para la unión de las sondas de búsqueda en un ensayo SiMREP. Véase, por ejemplo, O'Connell et al. 2014 "Programmable RNA recognition and cleavage by CRISPR/Cas9" Nature 516: 263-6. Por tanto, los ejemplos proporcionan composiciones que comprenden una dCas9, un ARNg (por ejemplo, un complejo dCas9/ARNg) y un PAMmer.
Detección de microARN
En algunos ejemplos, el ácido nucleico que se va a detectar, caracterizar, cuantificar y/o identificar (por ejemplo, el ácido nucleico diana) es un microARN. Los microARNs (miARN o pARN) son moléculas de ARN monocatenarias de aproximadamente 21 a 23 nucleótidos de longitud que regulan la expresión génica. Los miARNs están codificados por genes a partir de cuyo ADN se transcriben, pero los miARNs no se traducen en proteínas (véase, por ejemplo, Carrington et al., 2003). Los genes que codifican los miARNs son mucho más largos que la molécula de miARN madura procesada. Véase, por ejemplo, el documento US 2016/0046988 A1.
Detección de aberraciones genómicas
En algunos ejemplos, la tecnología SiMREPS proporciona la identificación y/o el recuento de aberraciones genómi­ cas (por ejemplo, distintas de simples mutaciones puntuales) en una muestra de ADN, basándose en la detección de regiones no emparejadas después de una hibridación con un genoma comparativo. En algunos ejemplos, S¡MREPS se utiliza para determinar el grado general de inestabilidad genómica en una muestra, por ejemplo, como se de­ muestra por la presencia de deleciones e inserciones en comparación con una muestra de ADN normal de referen­ cia. Ejemplos ejemplares comprenden proporcionar un ADN normal (por ejemplo, ADN de tipo silvestre procedente de células sanguíneas normales de un paciente con un tumor sólido, tal como cáncer de pulmón) y mezclarlo con un ADN tumoral coincidente (o incluso ADN circulante exento de células), con una fragmentación del ADN, de modo que esté presente como fragmentos y se inmovilice sobre una superficie, potencialmente a través de la modificación de un extremo (por ejemplo, biotinilación) u otros enfoques. La mayor parte del ADN formará segmentos de ADN hibridados, pero las áreas de deleción o inserción están presentes como dúplex en donde sobresale una hebra. En algunos ejemplos, el ADN normal y el ADN tumoral se proporcionan en relaciones apropiadas para una detección eficaz. Los ejemplos proporcionan un reactivo de afinidad basado en SiMREPS que se usa para detectar esas re­ giones no emparejadas, y hacer un recuento proporciona una medida de la inestabilidad genómica, que tiene uso, por ejemplo, en algunos ejemplos como un biomarcador del riesgo de cáncer. En algunos ejemplos, la tecnología se utiliza en la detección prenatal de anomalías cromosómicas. En algunos ejemplos, el reactivo de afinidad es un ADN monocatenario que se une a proteínas, recombinasas de uniones Holliday modificadas para no escindir el ácido nucleico, por ejemplo, para la identificación de translocaciones cromosómicas equilibradas, etc.
En algunos ejemplos, la tecnología se utiliza en la detección de aberraciones de repeticiones en los microsatélites en pacientes con cáncer colorrectal con microsatélites inestables, por ejemplo. Por consiguiente, los ejemplos com­ prenden proporcionar un panel de sondas SiMREPS correspondientes a diferentes loci de microsatélites que mues­ tran propiedades de unión cinética diferenciales, dependiendo de si las repeticiones de los microsatélites se han multiplicado o no en una muestra. En algunos ejemplos, la tecnología comprende un enfoque de hibridación compa­ rativa del ADN en donde la hibridación de una secuencia repetida de un microsatélite multiplicada con una sin multi­ plicar genera un segmento no emparejado que se detecta utilizando un enfoque basado en SiMREPS, utilizando una sonda de ADN u otro reactivo lector de SiMREPS con una afinidad eficaz.
Reactivos de afinidad bifuncionales
En algunos ejemplos, la tecnología comprende la detección de proteínas y otros analitos con SiMREPS mediante la incorporación de un reactivo de afinidad bifuncional que se une al analito diana y comprende un ácido nucleico que se puede contar usando una sonda lectora de SiMREPS. A modo de ejemplo, se puede incluir el uso de un anticuer­ po ligado a un oligonucleótido de ADN corto, de modo que si el analito de la proteína diana se inmoviliza sobre la superficie de un portaobjetos (por ejemplo, mediante un simple secado sobre la superficie u otros métodos de captu­ ra no específica o específica), la unión del anticuerpo con el analito de la proteína diana se mide usando una lectura basada en SiMREPS del ADN conjugado. Esto permitiría multiplicar los diversos anticuerpos y distinguirlos con dife­ rentes "códigos de barras" para la secuencia de ADN, ligados a los diversos anticuerpos. Los ejemplos proporcionan que las muestras pertenecen a una gran variedad de tipos que incluyen incluso células o lisados celulares. Los reac­ tivos de afinidad incluyen proteínas que se unen a ADN o ARN, aptámeros, anticuerpos y fragmentos de anticuer­ pos, ligados a un código de barras de ADN.
Sondas SiMREPS que no son de ácido nucleico
Los ejemplos proporcionan sondas que no son ácidos nucleicos. Por ejemplo, se puede proporcionar un anticuerpo u otro reactivo de afinidad que tiene una interacción en la unión con un analito diana que tiene una estabilidad ade­ cuada para SiMREPS, por ejemplo, un elemento transitorio asociado que proporciona una señal "parpadeante" y, en algunos ejemplos, una huella genética ligada a la cinética. En algunos ejemplos, la sonda de búsqueda que no es de ácido nucleico está diseñada para debilitar su unión con respecto a la versión no modificada genéticamente, por ejemplo, para proporcionar una unión y/o asociación que es menos estable termodinámicamente. Además de los anticuerpos, los ejemplos comprenden analitos diana y sondas de búsqueda que son proteínas, por ejemplo, en donde un ligando es el reactivo de afinidad y el otro podría ser el analito diana que se está midiendo. Los ejemplos comprenden el uso de aptámeros que se unen a cualquier ligando, lectinas que se unen a proteínas glicosiladas, proteínas u otras moléculas que se unen a lípidos, etc. La tecnología comprende el uso de cualquier pareja de unión con un comportamiento de unión transitorio, adecuada para la detección en la plataforma SiMREPS, por ejemplo, que produce una huella genética cinética.
Sondeo intramolecular en SiMREPS
En algunos ejemplos, la tecnología proporciona una sonda de captura y una sonda de búsqueda que están ligadas para proporcionar un mecanismo de sondeo intramolecular (véase, por ejemplo, la Fig. 5a y b). La sonda es asimé­ trica, de modo que cuando el ácido nucleico diana se une (por ejemplo, con estabilidad termodinámica, por ejemplo, de forma irreversible) a la secuencia de captura, el ácido nucleico diana experimenta una unión transitoria con la sonda de búsqueda. La unión y disociación transitoria de la sonda de búsqueda produce un cambio dependiente del tiempo en la intensidad de un fluoróforo donante o FRET, cuya cinética es sensible a la secuencia del ácido nucleico diana. En algunos ejemplos, una hebra de direccionamiento une el complejo Búsqueda/Captura a la superficie, para proporcionar una rigidez que ejerce un control sobre la cinética de la unión transitoria y para proporcionar un medio para inmovilizar muchas secuencias diferentes de Búsqueda/Captura en diferentes regiones de la superficie formadora de imágenes (por ejemplo, tal como en una micromatriz de ADN).
En algunos ejemplos, el sondeo Intramolecular en SIMREPS proporciona una adquisición más rápida. En particular, la unión de la sonda de búsqueda es rápida porque la unión es una reacción de hibridación intramolecular después de que el ácido nucleico diana se une a la sonda de captura. Además, en algunos ejemplos, los tiempos de forma­ ción de imágenes se reducen en comparación con los otros ejemplos de la tecnología SiMREPS. Por ejemplo, el mismo número de eventos de unión y disociación tiene lugar en 1 a 10 segundos en algunos ejemplos de experi­ mentos SiMREPS intramoleculares, que los que tienen lugar en 10 minutos en otros ejemplos de la tecnología SiMREPS. La tecnología SiMREPS intramolecular permite hacer experimentos paralelos a través de una segrega­ ción espacial. En algunos ejemplos, la tecnología SiMREPS intramolecular reduce las concentraciones de la sonda de búsqueda que proporcionan una detección eficaz. La tecnología SiMREPS intramolecular proporciona una plata­ forma que, en algunos ejemplos, comprende muchas sondas diferentes de Captura/Búsqueda inmovilizadas dentro de diferentes regiones de la superficie de formación de imágenes, de una manera especificada por la hebra de direccionamiento. A modo de ejemplo, se podría utilizar un chip de micromatrices convencional que contiene miles de secuencias distintas; esas secuencias podrían servir como hebras de direccionamiento para la inmovilización de las sondas de Captura/Búsqueda de SiMREPS, permitiendo ensayos SiMREPS de miles de secuencias diana (micro-ARN, ARNInc, ADN convertido a una forma monocatenaria) en un solo chip.
En particular, en algunos ejemplos, las hebras de direccionamiento no están relacionadas por la secuencia con nin­ guna de las dianas, ya que la interacción se produce indirectamente a través de las sondas de búsqueda y captura. De hecho, no es necesario que las hebras de direccionamiento estén relacionadas con las dianas. Además, los ejemplos proporcionan que las sondas de búsqueda y captura comprenden reactivos de afinidad distintos de las secuencias de ADN, tales como los complejos dCas9/ARNg descritos en otra parte de esta solicitud.
Los ejemplos proporcionan un control de la exposición de los fluoróforos a fuentes de excitación, por ejemplo, para reducir o minimizar un fotoblanqueo antes del análisis. En algunos ejemplos, las firmas cinéticas proporcionan un mecanismo de corrección para identificar y corregir detecciones de falsos positivos resultantes, por ejemplo, de depositar una sonda de Captura/Búsqueda en una parte incorrecta de la superficie de formación de imágenes (fuera de su región de direccionamiento). Los ejemplos también proporcionan una tecnología en la que los falsos positivos se minimizan o reducen al dividir las sondas de búsqueda y captura en dos sondas no contiguas que se localizan conjuntamente al unirse a la secuencia de direccionamiento (véase, por ejemplo, la Fig. 5b).
Restos fluorescentes
En algunos ejemplos, un ácido nucleico comprende un resto fluorescente (por ejemplo, un colorante fluorogénico, también denominado "fluoróforo" o "flúor"). En la técnica se conoce una amplia variedad de restos fluorescentes y se conocen métodos para unir un resto fluorescente a un nucleótido antes de la incorporación del nucleótido en un oligonucleótido y para añadir un resto fluorescente a un oligonucleótido después de la síntesis del oligonucleótido.
Los ejemplos de compuestos que se pueden usar como resto fluorescente incluyen, pero no se limitan a, colorantes de xanteno, antraceno, cianina, porfirina y cumarina. Los ejemplos de colorantes de xanteno que tienen uso en la presente tecnología incluyen, pero no se limitan a, fluoresceína, 6-carboxifluoresceína (6-FAM), 5-carboxifluoresceína (5-FAM), 5- o 6-carboxi-4,7,2',7'-tetracIorofIuoresceína (TET), 5- o 6-carboxi-4',5',2',4',5',7'-hexaclorofluoresceína (HEX), 5' o 6'-carboxi-4',5'-dicIoro-2',7'-dimetoxifIuoresceína (JOE), 5-carboxi-2',4',5',7'-tetraclorofluoresceína (ZOE), rodol, rodamina, tetrametilrodamina (TAMRA), 4,7-dicIorotetrametiI rodamina (DTAM-RA), rodamina X (ROX) y rojo de Texas. Los ejemplos de colorantes de cianina que se pueden emplear en la pre­ sente invención incluyen, pero no se limitan a, Cy 3, Cy 3B, Cy 3.5, Cy 5, Cy 5.5, Cy 7 y Cy 7.5. Otros restos y/o colorantes fluorescentes que tienen uso en la presente tecnología incluyen, pero no se limitan a, colorantes de trans­ ferencia de energía, colorantes compuestos y otros compuestos aromáticos que proporcionan señales fluorescentes. En algunos ejemplos, el resto fluorescente comprende un punto cuántico.
En algunos ejemplos, el resto fluorescente comprende una proteína fluorescente (p. ej., una proteína verde fluores­ cente (GFP), un derivado modificado de GFP (p. ej., una GFP que comprende S65T, una GFP mejorada (p. ej., que comprende F64L)) u otras conocidas en la técnica como, por ejemplo, proteína fluorescente azul (por ejemplo, EBFP, EBFP2, azurita, mKaIama1), proteína fluorescente cian (por ejemplo, ECFP, Cerulean, CyPet, mTurquoise2) y derivados de proteínas fluorescentes amarillas (por ejemplo, YFP, citrina, Venus, YPet). Los ejemplos proporcio­ nan que la proteína fluorescente puede estar unida de forma covalente o no covalente a una o a varias sondas de búsqueda y/o captura.
Los colorantes fluorescentes incluyen, sin limitación, colorantes aceptores de d-rodamina que incluyen Cy 5, dicloro[R110], dicIoro[R6G], dicIoro[TAMRA], dicIoro[ROX] o similares, colorantes donantes de fluoresceína que incluyen fluoresceína, 6-FAM, 5-FAM o similares; acridina que incluye naranja de acridina, amarillo de acridina, proflavina, pH 7 o similares; hidrocarburos aromáticos que incluyen 2-metiIbenzoxazoI, p-dimetilaminobenzoato de etilo, fenol, pirrol, benceno, tolueno o similares; colorantes de arilmetina que incluyen auramina O, violeta cristal, violeta cristal, glicerol, verde malaquita o similares; colorantes de cumarina que incluyen ácido 7-metoxicumarin-4-acético, cumari­ na 1, cumarina 30, cumarina 314, cumarina 343, cumarina 6 o similares; colorantes de cianina que incluyen yoduro de 1,1'-dietiI-2,2'-cianina, criptocianina, colorante de indocarbocianina (C3), colorante de indodicarbocianina (C5), colorante de indotricarbocianina (C7), colorante de oxacarbocianina (C3), colorante de oxadicarbocianina (C5), colo­ rante de oxatricarbocianina (C7), yoduro de pinacianol, todos los tintes, colorante de tiacarbocianina (C3), etanol, colorante de tiaoarbooianina (C3), n-propanol, colorante de tladlcarboclanlna (C5), colorante de tlatrlcarboclanlna
(C7) o similares; colorantes de dipirrina que incluyen N,N'-difluoroboril-1,9-dimetil-5-(4-yodofenil)-dipirrina, N,N'-dlfluoroborll-1,9-dlmetll-5-[(4-(2-trlmetllslllletlnllo), N,N'-difluoroboril-1,9-dlmetll-5-fenldlplrrlna, o similares; meroclanlnas que incluyen 4-(dicianometilen)-2-metil-6-(p-dimetilaminoestiril)-4H-pirano (DCM), acetonitrilo, 4-(dicianometilen)-2-metll-6-(p-dlmetllamlnoestlrll)-4H-plrano (DCM), metanol, 4-dimetilamino-4'-nitroestilbeno, meroclanlna 540, o simi­ lares; colorantes varios que incluyen 4',6-diamidino-2-fenilindol (DAPI), dlmetllsulfóxldo, 7-bencllamlno-4-nltrobenz-2-oxa-1,3-dlazol, dansll glicina, dansll glicina, dioxano, Hoechst 33258, DMF, Hoechst 33258, amarillo Lucifer CH, Piroxicam, sulfato de quinina, sulfato de quinina, colorante escuariliolII, o similares; oligofenilenos que incluyen 2,5-difeniloxazol (PPO), bifenilo, POPOP, p-cuaterfenllo, p-terfenllo o similares; oxazlnas que incluyen perclorato de violeta de cresilo, azul Nilo, metanol, rojo Nilo, etanol, oxazlna 1, oxazlna 170 o similares; hidrocarburos aromáticos policíclicos que incluyen 9,10-bis(feniletinil)antraceno, 9,10-difenilantraceno, antraceno, naftaleno, perileno, plreno o similares; polienos/poliinos que incluyen 1,2-difenilacetileno, 1,4-difenilbutadieno, 1,4-difenilbutadiina, 1,6-difenilhexatrieno, betacaroteno, estilbeno o similares; cromóforos con actividad redox, incluidos antraqulnona, azobenceno, benzoqulnona, ferroceno, riboflavina, tris(2,2'-bipiridiprutenio(ll), tetrapirrol, bilirrubina, clorofila a, éter dietí­ lico, clorofila a, metanol, clorofila b, tetrafenilporfirina dlprotonada, hematlna, octaetilporfirina de magnesio, octaetilporfirina de magnesio (MgOEP), ftalocianina de magnesio (MgPc), PrOH, ftalocianina de magnesio (MgPc), piridina, tetramesitilporfirina de magnesio (MgTMP), tetrafenilporfirina de magnesio (MgTPP), octaetilporfirina, ftalocianina
(Pc), porfina, ROX, TAMRA, tetra-t-butilazaporfina, tetra-t-butllnaftaloclanlna, tetrakls(2,6-dlclorofenll)porflrlna, tetrakls(o-amlnofenll)porflrlna, tetramesitilporfirina (TMP), tetrafenilporfirina (TPP), vitamina B12, octaethiporfirina de zinc (ZnOEP), ftalocianina de zinc (ZnPc), piridina, tetramesitilporfirina de zinc (ZnTMP), catión de radical de tetramesitil­ porfirina de zinc, tetrafenilporfirina de zinc (ZnTPP) o similares; xantenos que incluyen eoslna Y, fluoresceína, etanol básico, fluoresceína, etanol, rodamlna 123, rodamlna 6G, rodamlna B, rosa de Bengala, sulforrodamina 101 o simila­ res; o mezclas o combinaciones de los mismos o derivados sintéticos de los mismos.
Se conocen varias clases de colorantes fluorogénicos y compuestos específicos que son apropiados para ejemplos particulares de la tecnología: derivados de xanteno tales como fluoresceína, rodamlna, verde Oregon, eoslna y rojo de Texas; derivados de cianina tales como cianina, indocarbocianina, oxacarbocianina, tiacarbocianina y merocianina; derivados de naftaleno (derivados de dansilo y prodan); derivados de cumarlna; derivados de oxadlazol tales como piridiloxazol, nitrobenzoxadiazol y benzoxadlazol; derivados de plreno tales como azul cascada; derivados de oxazlna tales como rojo Nilo, azul Nilo, violeta de cresilo y oxazlna 170; derivados de acridina tales como proflavina, naranja de acridina y amarillo de acridina; derivados de arilmetina tales como auramlna, violeta cristal y verde mala­ quita; y derivados de tetrapirrol tales como porfina, ftalocianina, bilirrubina. En algunos ejemplos, el resto fluorescen­ te es un colorante que es xanteno, fluoresceína, rodamlna, BODIPY, cianina, cumarlna, plreno, ftalocianina, ficobiliproteína, ALEXA FLUOR® 350, ALEXA FLUOR® 405, ALEXA FLUOR® 430, ALEXA FLUOR® 488 ® 514, ALEXA FLUOR® 532, ALEXA FLUOR® 546, ALEXA FLUOR® 555, ALEXA FLUOR® 568, ALEXA FLUOR® 568, ALEXA FLUOR® 594, ALEXA FLUOR® 610, ALEXA FLUOR® 633, ALEXA FLUOR® 647, ALEXA FLUOR® 660, ALEXA FLUOR® 680, ALEXA FLUOR® 700, ALEXA FLUOR® 750 o un colorante de escuaraína. En algunos ejemplos, el marcador es un resto detectable por fluorescencia como se describe en, por ejemplo, Haugland (septiembre de
2005) MOLECULAR PROBES HANDBOOK OF FLUORESCENT PROBES AND RESEARCH CHEMICALS (10a ed.).
En algunos ejemplos, el marcador (por ejemplo, un marcador detectable por fluorescencia) es uno disponible en
ATTO-TEC GmbH (Am Eichenhang 50, 57076 Siegen, Alemania), por ejemplo, tal y como se describe en los docu­ mentos de solicitud de patente de EE.UU. n2 20110223677, 20110190486, 20110172420, 20060179585 y 20030003486; y en el documento de patente de EE.UU. n2 7.935.822 (p. ej., ATTO 390, ATTO 425, ATTO 465 ATTO 488, ATTO 495, ATTO 514, ATTO 520, ATTO 532, ATTO Rho6G, ATTO 542, ATTO 550, ATTO 565, ATTO Rho3B, ATTO Rho11, ATTO Rho12, ATTO Thio12, ATTO Rho101, ATTO 590, ATTO 594, ATTO Rho13, ATTO 610,
ATTO 620, ATTO Rho14, ATTO 633, ATTO 647, ATTO 647N, ATTO 655, ATTO Oxa12, ATTO 665, ATTO 680,
ATTO 700, ATTO 725, ATTO740).
Un experto en la técnica reconocerá que también se pueden usar colorantes que tienen máximos de emisión fuera de esos intervalos. En algunos casos, los colorantes que oscilan entre 500 nm y 700 nm tienen la ventaja de estar en el espectro visible y se pueden detectar utilizando tubos fotomultiplicadores existentes. En algunos ejemplos, la amplia gama de colorantes disponibles permite una selección de conjuntos de colorantes que tienen longitudes de onda de emisión que se extienden por todo el intervalo de detección. Se conocen en la técnica sistemas de detecclón capaces de distinguir muchos colorantes.
Muestras
En algunos ejemplos, los ácidos nucleicos (por ejemplo, ADN o ARN) se aíslan a partir de una muestra biológica que contiene una variedad de otros componentes, tales como proteínas, lípidos y ácidos nucleicos que no son moldes.
Las moléculas de moldes de ácido nucleico se pueden obtener a partir de cualquier material (p. ej., material celular
(vivo o muerto), material extracelular, material vírico, muestras ambientales (p. ej., muestras metagenómlcas), mate­ rial sintético (p. ej., amplicones tales como los proporcionados por PCR u otras tecnologías de amplificación)), a partir de un animal, planta, bacteria, arqueón, hongo o cualquier otro organismo. Las muestras biológicas para uso en la presente tecnología incluyen partículas víricas o preparaciones de las mismas. Las moléculas de ácido nuclei­ co se pueden obtener directamente a partir de un organismo o de una muestra biológica obtenida a partir de un organismo, por ejemplo, a partir de sangre, orina, líquido cefalorraquídeo, líquido seminal, saliva, esputo, heces, cabello, sudor, lágrimas, piel y tejido. Muestras ejemplares incluyen, pero no se limitan a, sangre completa, líquido linfático, suero, plasma, células bucales, sudor, lágrimas, saliva, esputo, cabello, piel, biopsia, líquido cefalorraquí­ deo (LCR), líquido amniótico, líquido seminal, excreciones vaginales, líquido seroso, líquido sinovial, líquido pericárdico, líquido peritoneal, líquido pleural, trasudados, exudados, líquido quístico, bilis, orina, fluidos gástricos, fluidos intestinales, muestras fecales y frotis, aspirados (p. ej., médula ósea, aguja fina, etc.), lavados (por ejemplo, orales, nasofaríngeos, bronquiales, bronquialveolares, ópticos, rectales, intestinales, vaginales, epidérmicos, etc.) y/u otras muestras.
Cualquier muestra de tejido o fluido corporal se puede usar como fuente de ácido nucleico para emplear en la tecno­ logía, incluyendo muestras forenses, muestras archivadas, muestras conservadas y/o muestras almacenadas duran­ te largos períodos de tiempo, por ejemplo, muestras y especímenes recién congelados, fijados con metanol/ácido acético o incluidos en parafina fijadas con formol (FFPE). Las moléculas de moldes de ácido nucleico también se pueden aislar a partir de células cultivadas, tales como un cultivo de células primarias o una línea celular. Las célu­ las o tejidos a partir de los cuales se obtienen los ácidos nucleicos molde, se pueden infectar con un virus u otro agente patógeno intracelular. Una muestra también puede ser ARN total extraído a partir de una muestra biológica, una genoteca de ADNc, vírico o ADN genómico. Una muestra también puede ser ADN aislado a partir de un origen no celular, p. ej., ADN amplificado/aislado que se ha almacenado en un congelador.
Las moléculas de ácido nucleico se pueden obtener, por ejemplo, mediante una extracción a partir de una muestra biológica, por ejemplo, mediante una variedad de técnicas tales como las descritas por Maniatis et al. (1982) Molecu­ lar Cloning: A Laboratory Manual, Cold Spring Harbor, N.Y. (véanse, p. ej., las págs. 280-281).
En algunos ejemplos, la tecnología proporciona la selección por el tamaño de los ácidos nucleicos, por ejemplo, para eliminar fragmentos muy cortos o fragmentos muy largos.
En algunos ejemplos, la tecnología se utiliza para identificar un ácido nucleico in situ. En particular, ejemplos de la tecnología proporcionan la identificación de un ácido nucleico directamente en un tejido, célula, etc. (por ejemplo, después de permeabilizar el tejido, célula, etc.) sin extraer el ácido nucleico del tejido, célula, etc. En algunos ejem­ plos de la tecnología relacionados con la detección in situ, la tecnología se aplica in vivo, ex vivo y/o in vitro. En algunos ejemplos, la muestra es una muestra cruda, un lisado de células tratadas mínimamente o un lisado de un fluido biológico. En algunas muestras, el ácido nucleico se detecta en lisados crudos sin una purificación del ácido nucleico.
Kits
Algunos ejemplos están relacionados con kits para la detección de un ácido nucleico. Por ejemplo, en algunos ejem­ plos se proporciona un kit que comprende un soporte sólido (p. ej., un portaobjetos para microscopio, una perla, un cubreobjetos, un portaobjetos o cubreobjetos de microscopio conjugado con avidina (p. ej., estreptavidina), un sopor­ te sólido que comprende una matriz de guía de ondas de modo cero, o similar), un dCas9/ARNg (por ejemplo, que comprende una dCas9 biotinilada) y una sonda de búsqueda como se describe en esta memoria. Algunos ejemplos proporcionan además un dCas9/ARNg no biotinilado.
Algunos ejemplos proporcionan además un programa informático en un formato legible por ordenador o descargable desde internet para la recopilación y el análisis de eventos de unión de sondas de búsqueda y tiempos de perma­ nencia, tal y como se describe en este documento. En algunos ejemplos, los kits para una detección múltiple com­ prenden dos o más sondas de búsqueda, cada una de las cuales comprende una secuencia complementaria a dis­ tintas regiones de búsqueda de uno o varios ácidos nucleicos diana y cada una comprende un resto fluorescente diferente. En algunos ejemplos, las sondas de búsqueda son complementarias a las regiones de búsqueda de una o varias dianas de ácido nucleico. Algunos ejemplos de kits comprenden uno o varios controles positivos y/o uno o varios controles negativos. Algunos ejemplos comprenden una serie de controles que tienen concentraciones cono­ cidas, por ejemplo, para producir una curva estándar de concentraciones.
Sistemas
Algunos ejemplos de la tecnología proporcionan sistemas para la detección y la cuantificación de un ácido nucleico diana. Los sistemas de acuerdo con la tecnología comprenden, p. ej., un soporte sólido (p. ej., un portaobjetos de microscopio, un cubreobjetos, un portaobjetos o cubreobjetos de microscopio conjugado con avidina (p. ej., estrep­ tavidina), un soporte sólido que comprende una matriz de guías de ondas de modo cero, o similar), un dCas9/ARNg (por ejemplo, que comprende una dCas9 biotinilada) y una sonda de búsqueda como se describe en esta memoria. Algunos ejemplos proporcionan además un dCas9/ARNg no biotinilado.
Algunos ejemplos comprenden además un microscopio de fluorescencia que comprende una configuración de ilumi­ nación para excitar sondas de búsqueda unidas (por ejemplo, un microscopio de fluorescencia con reflexión interna total (TIRF) de tipo prisma, un microscopio TIRF de tipo objetivo, un microscopio TIRF cercano o HiLo, un microsco­ pio de barrido con láser confocal, una guía de ondas de modo cero y/o una configuración de la iluminación capaz de controlar en paralelo una gran área del portaobjetos o cubreobjetos (> 100 pm2) mientras restringe la iluminación a una pequeña región del espacio cerca de la superficie). Algunos ejemplos comprenden un detector de fluorescencia, por ejemplo, un detector que comprende un dispositivo de carga acoplada intensificada (ICCD), un dispositivo de carga acoplada de multiplicación de electrones (EM-CCD), un semiconductor de óxido metálico complementario (CMOS), un tubo fotomultiplicador (PMT), un fotodiodo de avalancha (APD) y/u otro detector capaz de detectar una emisión de fluorescencia desde cromóforos individuales. Algunos ejemplos comprenden un ordenador e instruccio­ nes de codificación de un programa informático para que se implementen en el ordenador.
Algunos ejemplos comprenden elementos ópticos, como lentes, espejos, espejos dicroicos, filtros ópticos, etc., por ejemplo, para detectar una fluorescencia de forma selectiva dentro de un intervalo específico de longitudes de onda o intervalos múltiples de longitudes de onda.
Por ejemplo, se puede utilizar un programa informático de análisis basado en un ordenador para traducir los datos sin procesar generados por el ensayo de detección (por ejemplo, la presencia, ausencia o cantidad de uno o varios ácidos nucleicos (por ejemplo, uno o varios biomarcadores)) en datos de valor predictivo para un médico. El médico puede acceder a los datos predictivos utilizando cualquier medio adecuado.
Por ejemplo, se puede incluir un sistema informático sobre el que se pueden implementar ejemplos de la presente tecnología. En varios ejemplos, un sistema informático incluye un bus u otro mecanismo de comunicación, para comunicar una información y un procesador acoplado al bus para procesar una información. En varios ejemplos, el sistema informático incluye una memoria, que puede ser una memoria de acceso aleatorio (RAM) u otro dispositivo de almacenamiento dinámico, acoplado al bus, e instrucciones para que las ejecute el procesador. La memoria tam­ bién se puede utilizar para almacenar variables temporales u otra información intermedia durante la ejecución de las instrucciones que serán ejecutadas por el procesador. En varios ejemplos, el sistema informático puede incluir ade­ más una memoria solo de lectura (ROM) u otro dispositivo de almacenamiento estático, acoplado al bus para alma­ cenar una información estática e instrucciones para el procesador. Se puede proporcionar un dispositivo de almace­ namiento, tal como un disco magnético o un disco óptico, y acoplarlo al bus para almacenar la información y las instrucciones.
En varios ejemplos, el sistema informático está acoplado a través del bus a una pantalla, tal como un tubo de rayos catódicos (CRT) o una pantalla de cristal líquido (LCD), para mostrar la información a un usuario informático. Un dispositivo de entrada, que incluye teclas alfanuméricas y de otro tipo, se puede acoplar al bus para comunicar una información y selecciones de comandos al procesador. Otro tipo de dispositivo de entrada para el usuario es un control de cursor, tal como un ratón, una bola de seguimiento o teclas para dirigir el cursor, para comunicar una información de dirección y selecciones de comandos al procesador y para controlar el movimiento del cursor en la pantalla. Ese dispositivo de entrada normalmente tiene dos grados de libertad en dos ejes, un primer eje (por ejem­ plo, x) y un segundo eje (por ejemplo, y), lo que permite al dispositivo especificar posiciones en un plano.
Un sistema informático puede implementar aspectos de la tecnología actual. De acuerdo con ciertas implementaciones de la presente tecnología, el sistema informático puede proporcionar resultados como respuesta a que el proce­ sador ejecute una o varias secuencias de una o varias instrucciones contenidas en la memoria. Esas instrucciones se pueden leer en la memoria desde otro medio legible por ordenador, tal como un dispositivo de almacenamiento. La ejecución de las secuencias de instrucciones contenidas en la memoria puede hacer que el procesador implemente los métodos descritos en este documento. Alternativamente, se pueden usar circuitos cableados en lugar de o en combinación con instrucciones de un programa informático para implementar las presentes enseñanzas. Por tanto, las implementaciones de la presente tecnología no se limitan a ninguna combinación específica de un sistema de circuitos de equipos informáticos y programas informáticos.
La expresión "medio legible por ordenador" tal y como se usa en este documento, se refiere a cualquier medio que participa en proporcionar instrucciones al procesador para su ejecución. Un medio de este tipo puede adoptar mu­ chas formas, incluyendo, pero sin limitarse a, medios no volátiles, medios volátiles y medios de transmisión. Ejem­ plos de medios no volátiles pueden incluir, entre otros, discos ópticos o magnéticos, tales como un dispositivo de almacenamiento. Ejemplos de medios volátiles pueden incluir, pero no se limitan a, una memoria dinámica. Ejemplos de medios de transmisión pueden incluir, entre otros, cables coaxiales, cables de cobre y fibra óptica, incluyendo los cables que componen el bus.
Las formas comunes de medios legibles por ordenador incluyen, por ejemplo, un disquete, un disco flexible, un disco duro, una cinta magnética o cualquier otro medio magnético, un CD-ROM, cualquier otro medio óptico, tarjetas perfo­ radas, cinta de papel, cualquier otro medio físico con patrones de agujeros, una RAM, PROM y EPROM, una FLASH-EPROM, cualquier otro chip o cartucho de memoria, o cualquier otro medio tangible a partir del cual puede leer una computadora.
Varias formas de medios legibles por ordenador pueden estar implicadas en ser portadoras de una o varias secuen­ cias de una o varias instrucciones al procesador para su ejecución. Por ejemplo, las instrucciones se pueden trans­ portar inicialmente en el disco magnético de un ordenador remoto. El ordenador remoto puede cargar las instruccio­ nes en su memoria dinámica y enviar las instrucciones a través de una conexión de la red (por ejemplo, LAN, WAN, internet, una línea telefónica). Un sistema informático local puede recibir los datos y transmitirlos al bus. El bus pue­ de llevar los datos a la memoria, desde donde el procesador recupera y ejecuta las instrucciones. Las instrucciones recibidas a través de la memoria se pueden almacenar opcionalmente en un dispositivo de almacenamiento antes o después de la ejecución mediante el procesador.
De acuerdo con varios ejemplos, las instrucciones configuradas para ser ejecutadas por un procesador para realizar un método se almacenan en un medio legible por ordenador, El medio legible por ordenador puede ser un dispositi­ vo que almacena una información digital, Por ejemplo, un medio legible por ordenador incluye una memoria solo de lectura en disco compacto (CD-ROM) como se conoce en la técnica para almacenar un programa informático, Al medio legible por ordenador se accede mediante un procesador adecuado para ejecutar unas instrucciones configu­ radas para ser ejecutadas,
De acuerdo con un sistema informático de ese tipo, algunos ejemplos de la tecnología proporcionada en este docu­ mento comprenden además funcionalidades para recopilar, almacenar y/o analizar datos (por ejemplo, presencia, ausencia, concentración de un ácido nucleico), Por ejemplo, algunos ejemplos contemplan un sistema que com­ prende un procesador, una memoria y/o una base de datos para, por ejemplo, almacenar y ejecutar instrucciones, analizar la fluorescencia, datos de imágenes, realizar cálculos utilizando los datos, transformar los datos y almacenar los datos, En algunos ejemplos, un algoritmo aplica un modelo estadístico (por ejemplo, un modelo de Poisson o un modelo de Markov oculto) a los datos,
Muchos diagnósticos implican determinar la presencia de, o una secuencia de nucleótidos de uno o varios ácidos nucleicos (por ejemplo, un biomarcador de ácido nucleico), Por tanto, en algunos ejemplos, una ecuación que com­ prende variables que representan la presencia, ausencia, concentración, cantidad o propiedades de secuencia de múltiples ácidos nucleicos, produce un valor que se utiliza para hacer un diagnóstico o evaluar la presencia o las cualidades de un ácido nucleico, De este modo, en algunos ejemplos ese valor es presentado por un dispositivo, por ejemplo, mediante un indicador relacionado con el resultado (por ejemplo, un LED, un icono en una pantalla, un sonido o algo similar), En algunos ejemplos, un dispositivo almacena el valor, transmite el valor o usa el valor para cálculos adicionales, En algunos ejemplos, una ecuación comprende variables que representan la presencia, ausen­ cia, concentración, cantidad o propiedades de secuencia de uno o varios entre un locus metilado en el ADN genómico, un microARN, un biomarcador de un gen mutante o una aberración cromosómica,
Por lo tanto, en algunos ejemplos, la presente tecnología proporciona el beneficio adicional de que un médico, que probablemente no esté formado en genética o biología molecular, no necesita comprender los datos sin procesar, Los datos se presentan directamente al médico en su forma más útil, Entonces, el médico es capaz de utilizar la información para optimizar los cuidados de un sujeto, Se contempla cualquier método capaz de recibir, procesar y transmitir la información hacia y desde los laboratorios que realizan los ensayos, los proveedores de información, el personal médico y/o los sujetos, Por ejemplo, en algunos ejemplos de la presente tecnología, se obtiene una mues­ tra a partir de un sujeto y se envía a un servicio de elaboración de perfiles (por ejemplo, un laboratorio clínico en un centro médico, una empresa de elaboración de perfiles genómicos, etc,), ubicado en cualquier parte del mundo (por ejemplo, en un país diferente al país en donde reside el sujeto o en donde se utiliza la información en última instan­ cia) para generar datos sin procesar, Si la muestra comprende un tejido u otra muestra biológica, el sujeto puede acudir a un centro médico para tener la muestra obtenida y enviarla al centro de elaboración de perfiles o los sujetos pueden recoger ellos mismos la muestra y enviarla directamente a un centro de elaboración de perfiles, Cuando la muestra comprende una información biológica previamente determinada, la información puede ser enviada directa­ mente por el sujeto al servicio de elaboración de perfiles (por ejemplo, una ficha informativa que contiene la informa­ ción se puede escanear en un ordenador y transmitir los datos a un ordenador del centro de elaboración de perfiles utilizando sistemas de comunicación electrónica), Una vez recibida en el servicio de elaboración de perfiles, la mues­ tra se procesa y se elabora un perfil que es específico para la información de diagnóstico o pronóstico deseada para el sujeto, A continuación, los datos del perfil se preparan en un formato adecuado para que un médico encargado los interprete, Por ejemplo, en lugar de proporcionar datos de expresión sin procesar, el formato preparado puede re­ presentar un diagnóstico o una evaluación de riesgos para el sujeto, junto con recomendaciones para opciones de tratamiento particulares, Los datos se pueden mostrar al médico mediante cualquier método adecuado, Por ejemplo, en algunos ejemplos, el servicio de elaboración de perfiles genera un informe que lo puede imprimir el médico (por ejemplo, en el centro de atención) o se puede mostrar al médico en una pantalla de ordenador, En algunos ejem­ plos, la información se analiza primero en el centro de atención o en un servicio regional, Luego, los datos sin proce­ sar se envían a un servicio de procesamiento central para su posterior análisis y/o para convertir los datos sin proce­ sar en una información útil para un médico o un paciente, El servicio de procesamiento central ofrece la ventaja de la privacidad (todos los datos se almacenan en un servicio central con protocolos de seguridad uniformes), la velocidad y la uniformidad del análisis de datos, El servicio de procesamiento central puede entonces controlar el destino de los datos después del tratamiento del sujeto, Por ejemplo, utilizando un sistema de comunicación electrónica, el servicio central puede proporcionar datos al médico, al sujeto o a los investigadores, En algunos ejemplos, el sujeto puede acceder a los datos utilizando el sistema de comunicación electrónica, El sujeto puede optar por una interven­ ción adicional o un asesoramiento en función de los resultados, En algunos ejemplos, los datos se utilizan para fines investigativos, Por ejemplo, los datos se pueden usar para optimizar aún más la inclusión o eliminación de marcado­ res como indicadores útiles de una afección particular asociada con la enfermedad,

Claims (17)

REIVINDICACIONES
1. Un complejo para proporcionar una señal de firma cinética distintiva detectable de un ácido nucleico diana bicatenario producida mediante una interacción de dicha diana con una sonda de búsqueda, comprendiendo el complejo:
a) un ácido nucleico diana bicatenario que comprende una primera región adyacente a una segunda región; b) un componente de fusión inmovilizado que interacciona con la primera región para formar un complejo termodinámicamente estable y proporcionar la segunda región en una forma monocatenaria,
en donde dicho componente de fusión comprende un componente que se une a un ácido nucleico específico de secuencia que interacciona con un ácido nucleico bicatenario y disocia dicho ácido nucleico o regiones bicatenarias de dicho ácido nucleico para proporcionar un ácido nucleico monocatenario o regiones monocatenarias de dicho ácido nucleico para proporcionar un acceso a las regiones de búsqueda para unir una sonda de búsqueda; y
c) una sonda de búsqueda que se hibrida repetidamente con la segunda región con una constante de velocidad cinética kdisociación que es superior a 0,1 min-1 y/o una constante de velocidad cinética kasociación que es superior a 0,1 min-1 para proporcionar una señal de firma cinética distintiva detectable asociada con el ácido nucleico dia­ na bicatenario.
2. El complejo según la reivindicación 1, en donde dicho componente de fusión que comprende dicho componente de unión de ácido nucleico específico de secuencia es una sustancia, una molécula, preferiblemente una biomolécula, un complejo de más de una molécula, preferiblemente un complejo de más de una biomolécula, y en donde dicho componente de unión de ácido nucleico específico de secuencia se selecciona preferiblemente a partir del grupo que consiste en:
- dCas9 o una variante de la proteína Cas9 enzimáticamente inactiva;
- una proteína, que incluye una proteína de unión monocatenaria o una enzima;
- un ácido nucleico.
3. El complejo según la reivindicación 2, en donde dicha dCas9 o variante de la proteína Cas9 enzimáticamente inactiva comprende al menos uno de los siguientes apartados:
i) la proteína dCas9 procede de S. pyogenes;
ii) la proteína dCas9 comprende mutaciones en D10, E762, H983 y/o D986; y en H840 y/o N863, preferible­ mente en D10 y H840, más preferiblemente D10A o D10N y H840A o H840N o H840Y;
iii) la proteína Cas9 procede de S. pyogenes, ya sea tal y como se codifica en las bacterias o con codones op­ timizados para una expresión en células de mamífero, que contiene mutaciones en D10, E762, H983 o D986 y H840 o N863, preferiblemente D10A/D10N y H840A/H840N/H840Y;
iv) dCas9 es al menos 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 99% o 100% idéntica a la se­ cuencia de Cas9 de S. pyogenes, preferiblemente al menos 50% idéntica a SEQ ID NO: 1;
v) las moléculas Cas9 y dCas9 proceden de una variedad de especies seleccionadas a partir del grupo que consiste en S. pyogenes, S. thermophilus y las siguientes:
N2 de orden de GenBank Bacteria
303229466 Veillonella atypica ACS-134-V-Col7a
34762592 Fusobacterium nucleatum subsp. vincentii
374307738 Filifactor alocis ATCC 35896
320528778 Solobacterium moorei F0204
291520705 Coprococcus catus GD-7
42525843 Treponema denticola ATCC 35405
304438954 Peptoniphilus duerdenii ATCC BAA-1640
224543312 Catenibacterium mitsuokai DSM 15897
24379809 Streptococcus mutans UA159
15675041 Streptococcus pyogenes SF370
16801805 Listeria innocua Clip11262
Ns de orden de GenBank Bacteria
116628213 Streptooooous thermophilus LMD-9 323463801 Staphylococcus pseudintermedius ED99 352684361 Acidaminococcus intestini RyC-MR95 302336020 Olsenella uli DSM 7084
366983953 Oenococcus kitaharae DSM 17330 310286728 Bifidobacterium bifidum S17
258509199 Lactobacillus rhamnosus GG
300361537 Lactobacillus gasseri JV-V03
169823755 Finegoldia magna ATCC 29328 47458868 Mycoplasma mobile 163K
284931710 Mycoplasma gallisepticum str. F 363542550 Mycoplasma ovipneumoniae SC01 384393286 Mycoplasma canis PG 14
71894592 Mycoplasma synoviae 53
238924075 Eubacterium rectale ATCC 33656 116627542 Streptococcus thermophilus LMD-9 315149830 Enterococcus faecalis TX0012 315659848 Staphylococcus lugdunensis M23590 160915782 Eubacterium dolichum DSM 3991 336393381 Lactobacillus coryniformis subsp. torquens 310780384 llyobacter polytropus DSM 2926 325677756 Ruminococcus albus 8
187736489 Akkermansia muciniphila ATCC BAA-835 117929158 Acidothermus cellulolyticus 11B 189440764 Bifidobacterium longum DJO10A 283456135 Bifidobacterium dentium Bd1
38232678 Corynebacterium diphtheriae NCTC 13129 187250660 Elusimicrobium minutum Pei191 319957206 Nitratifractor salsuginis DSM 16511 325972003 Sphaerochaeta globus str. Buddy 261414553 Fibrobacter succinogenes subsp. succinogenes 60683389 Bacteroides fragilis NCTC 9343 256819408 Capnocytophaga ochracea DSM 7271 90425961 Rhodopseudomonas palustris BisB18 373501184 Prevotella micans F0438
294674019 Prevotella ruminicola 23
365959402 Flavobacterium columnare ATCC 49512 312879015 Aminomonas paucivorans DSM 12260 83591793 Rhodospirillum rubrum ATCC 11170 294086111 Candidatus Puniceispirillum marinum IMCC1322 121608211 Verminephrobacter eiseniae EF01-2 344171927 Ralstonia syzygii R24
159042956 Dinoroseobacter shibae DFL 12 288957741 Azospirillum sp-B510
92109262 Nitrobacter hamburgensis X14
N2 de orden de GenBank Bacteria
148255343 Bradyrhizobium sp-BTAi1
34557790 Wolinella succinogenes DSM 1740
218563121 Campylobacter jejuni subsp. jejuni
291276265 Helicobacter mustelae 12198
229113166 Bacillus cereus Rock1-15
222109285 Acidovorax ebreus TPSY
189485225 uncultured Termite group 1
182624245 Clostridium perfringens D str.
220930482 Clostridium cellulolyticum H10
154250555 Parvibaculum lavamentivorans DS-1
257413184 Roseburia intestinalis L1-82
218767588 Neisseria meningitidis Z2491
15602992 Pasteurella multocida subsp. multocida
319941583 Sutterella wadsworthensis 31
254447899 gamma proteobacterium HTCC5015
54296138 Legionella pneumophila str. Paris
331001027 Parasutterella excrementihominis YIT 11859
34557932 Wolinella succinogenes DSM 1740
118497352 Francisella novicida U112
4. El complejo según la reivindicación 1, en el que el componente de fusión comprende un complejo dCas9/ARNg que comprende un ARNg hibridado con la primera región.
5. El complejo según las reivindicaciones 1 -4, en el que el componente de fusión comprende además un PAMmer.
6. El complejo según las reivindicaciones 1-5, en el que la sonda de búsqueda es un ácido nucleico marcado con fluorescencia.
7. El complejo según las reivindicaciones 2-6, en el que la dCas9 está inmovilizada en un sustrato.
8. El complejo según la reivindicación 1, que comprende además un segundo componente de fusión que comprende un componente seleccionado a partir del grupo que consiste en dCas9, proteína de unión monocatenaria, una pro­ teína y un ácido nucleico, en donde dicho segundo componente de fusión interacciona con una tercera región del ácido nucleico diana adyacente a la segunda región del ácido nucleico diana.
9. El complejo según la reivindicación 8, en el que el primer y el segundo componentes de fusión se unen al ácido nucleico diana con una distancia entre ellos de aproximadamente 5 a 15 nucleótidos.
10. Un método para proporcionar una señal de firma cinética distintiva detectable de un ácido nucleico diana bicatenario en una muestra, en donde dicha señal cinética está producida por una interacción de dicha diana con una sonda de búsqueda, comprendiendo el método:
a) inmovilizar un ácido nucleico diana bicatenario en una región discreta de un soporte sólido, en donde dicho ácido nucleico diana bicatenario comprende una primera región adyacente a una segunda región y dicha región discreta de dicho soporte sólido comprende un componente de fusión inmovilizado que interacciona con la primera región,
en donde dicho componente de fusión comprende un componente de unión de ácido nucleico específico de secuen­ cia que interacciona con un ácido nucleico bicatenario y disocia dicho ácido nucleico o regiones bicatenarias de dicho ácido nucleico para proporcionar un ácido nucleico monocatenario o regiones monocatenarias de dicho ácido nucleico para proporcionar un acceso a las regiones de búsqueda para unir una sonda de búsqueda;
b) proporcionar una sonda de búsqueda que se hibrida repetidamente con la segunda región con una constante de velocidad cinética kdisociación que es superior a 0,1 min-1 y/o la constante de velocidad cinética kasociación que es supe­ rior a 0,1 min-1 para proporcionar una señal de firma cinética distintiva detectable; y
c) asociar la señal de firma cinética distintiva detectable con el ácido nucleico bicatenario para identificar el ácido nucleico bicatenario.
11. El método según la reivindicación 10, que comprende analizar datos usando un reconocimiento de patrones para producir o identificar la señal de firma cinética distintiva detectable del ácido nucleico bicatenario.
12. El método según las reivindicaciones 10-11, en donde dicho componente de fusión que comprende dicho com­ ponente de unión de ácido nucleico específico de secuencia es una sustancia, una molécula, preferiblemente una biomolécula, un complejo de más de una molécula, preferiblemente un complejo de más de una biomolécula, y en donde dicho componente de unión de ácido nucleico específico de secuencia se selecciona preferiblemente a partir del grupo que consiste en:
- dCas9 o una variante de la proteína Cas9 enzimáticamente inactiva,
- una proteína que incluye una proteína de unión monocatenaria o una enzima,
- un ácido nucleico.
13. El método según la reivindicación 12, en donde dicha dCas9 o variante de la proteína Cas9 enzimáticamente inactiva comprende al menos uno de los siguientes apartados:
i) la proteína dCas9 procede de S. pyogenes;
ii) la proteína dCas9 comprende mutaciones en D10, E762, H983 y/o D986; y en H840 y/o N863, preferible­ mente en D10 y H840, más preferiblemente D10A o D10N y H840A o H840N o H840Y,
iii) la proteína Cas9 procede de S. pyogenes, ya sea tal y como se codifica en las bacterias o con codones op­ timizados para una expresión en células de mamífero, que contiene mutaciones en D10, E762, H983 o D986 y H840 o N863, preferiblemente D10A/D10N y H840A/H840N/H840Y,
iv) dCas9 es al menos 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 99% o 100% idéntica a la se­ cuencia de Cas9 de S. pyogenes, preferiblemente al menos 50% idéntica a SEQ ID NO: 1;
v) las moléculas Cas9 y dCas9 proceden de una variedad de especies seleccionadas a partir del grupo que consiste en S. pyogenes, S. thermophilus y las siguientes:
N2 de orden de GenBank Bacteria
303229466 Veillonella atypica ACS-134-V-Col7a
34762592 Fusobacterium nucleatum subsp. vincentii
374307738 Filifactor alocis ATCC 35896
320528778 Solobacterium moorei F0204
291520705 Coprococcus catus GD-7
42525843 Treponema denticola ATCC 35405
304438954 Peptoniphilus duerdenii ATCC BAA-1640
224543312 Catenibacterium mitsuokai DSM 15897
24379809 Streptococcus mutans UA159
15675041 Streptococcus pyogenes SF370
16801805 Listeria innocua Clip11262
116628213 Streptococcus thermophilus LMD-9
323463801 Staphylococcus pseudintermedius ED99
352684361 Acidaminococcus intestini RyC-MR95
302336020 Olsenella uli DSM 7084
366983953 Oenococcus kitaharae DSM 17330
310286728 Bifidobacterium bifidum S17
258509199 Lactobacillus rhamnosus GG
300361537 Lactobacillus gasseri JV-V03
169823755 Finegoldia magna ATCC 29328
47458868 Mycoplasma mobile 163K
284931710 Mycoplasma gallisepticum str. F
363542550 Mycoplasma ovipneumoniae SC01
N2 de orden de GenBank Bacteria
384393286 Mycoplasma canis PG 14
71894592 Mycoplasma synoviae 53
238924075 Eubacterium rectale ATCC 33656 116627542 Streptococcus thermophilus LMD-9 315149830 Enterococcus faecalis TX0012 315659848 Staphylococcus lugdunensis M23590 160915782 Eubacterium dolichum DSM 3991 336393381 Lactobacillus coryniformis subsp. torquens 310780384 llyobacter polytropus DSM 2926 325677756 Ruminococcus albus 8
187736489 Akkermansia muciniphila ATCC BAA-835 117929158 Acidothermus cellulolyticus 11B 189440764 Bifidobacterium longum DJ010A 283456135 Bifidobacterium dentium Bd1
38232678 Corynebacterium diphtheriae NCTC 13129 187250660 Elusimicrobium minutum Pei191 319957206 Nitratifractor salsuginis DSM 16511 325972003 Sphaerochaeta globus str. Buddy 261414553 Fibrobacter succinogenes subsp. succinogenes 60683389 Bacteroides fragilis NCTC 9343 256819408 Capnocytophaga ochracea DSM 7271 90425961 Rhodopseudomonas palustris BisB18 373501184 Prevotella micans F0438
294674019 Prevotella ruminicola 23
365959402 Flavobacterium columnare ATCC 49512 312879015 Aminomonas paucivorans DSM 12260 83591793 Rhodospirillum rubrum ATCC 11170 294086111 Candidatus Puniceispirillum marinum IMCC1322 121608211 Verminephrobacter eiseniae EF01-2 344171927 Ralstonia syzygii R24
159042956 Dinoroseobacter shibae DFL 12 288957741 Azospirillum sp-B510
92109262 Nitrobacter hamburgensis X14 148255343 Bradyrhizobium sp-BTAi1
34557790 Wolinella succinogenes DSM 1740 218563121 Campylobacter jejuni subsp. jejuni 291276265 Helicobacter mustelae 12198
229113166 Bacillus cereus Rock1 -15
222109285 Acidovorax ebreus TPSY
189485225 uncultured Termite group 1
182624245 Clostridium perfringens D str.
220930482 Clostridium cellulolyticum H10
154250555 Parvibaculum lavamentivorans DS-1 257413184 Roseburia intestinalis L1-82
218767588 Neisseria meningitidis Z2491
Ns de orden de GenBank Bacteria
15602992 Pasteurella multocida subsp, multocida
319941583 Sutterella wadsworthensis 31
254447899 gamma proteobacterium HTCC5015
54296138 Legionella pneumophila str. Paris
331001027 Parasutterella excrementihominis YIT 11859
34557932 Wolinella succinogenes DSM 1740
118497352 Francisella novicida U112
14. El método según las reivindicaciones 10-13, que comprende proporcionar condiciones suficientes para que el componente de fusión proporcione la segunda región en una forma monocatenaria.
15. El método según las reivindicaciones 10-13, que comprende detectar dicha unión repetida de la sonda de bús­ queda marcada de forma detectable con la segunda región del ácido nucleico diana.
16. El método según las reivindicaciones 10-13, que comprende adicionalmente calcular una cantidad o una concen­ tración del ácido nucleico diana bicatenario en la muestra a partir de la señal de firma cinética distintiva detectable.
17. El uso de un kit en un método según las reivindicaciones 10-16, en donde el kit comprende un soporte sólido, un dCas9/ARNg y una sonda de búsqueda.
ES17750678T 2016-02-10 2017-02-08 Detección de ácidos nucleicos Active ES2835101T3 (es)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US201662293589P 2016-02-10 2016-02-10
PCT/US2017/016977 WO2017139354A1 (en) 2016-02-10 2017-02-08 Detection of nucleic acids

Publications (1)

Publication Number Publication Date
ES2835101T3 true ES2835101T3 (es) 2021-06-21

Family

ID=59563387

Family Applications (1)

Application Number Title Priority Date Filing Date
ES17750678T Active ES2835101T3 (es) 2016-02-10 2017-02-08 Detección de ácidos nucleicos

Country Status (6)

Country Link
US (2) US20190048415A1 (es)
EP (3) EP3414327B1 (es)
JP (3) JP2019513345A (es)
CN (2) CN114196746A (es)
ES (1) ES2835101T3 (es)
WO (1) WO2017139354A1 (es)

Families Citing this family (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP4361609A3 (en) 2012-02-03 2024-07-17 California Institute of Technology Signal encoding and decoding in multiplexed biochemical assays
EP2880184B1 (en) 2012-08-03 2021-03-31 California Institute of Technology Multiplexing and quantification in pcr with reduced hardware and requirements
US10093967B2 (en) 2014-08-12 2018-10-09 The Regents Of The University Of Michigan Detection of nucleic acids
US11111492B2 (en) * 2017-03-06 2021-09-07 Florida State University Research Foundation, Inc. Genome engineering methods using a cytosine-specific Cas9
CA3055565A1 (en) 2017-03-08 2018-09-13 The Regents Of The University Of Michigan Analyte detection
US20190187031A1 (en) * 2017-12-14 2019-06-20 The Regents Of The University Of Michigan Concentration of analytes
US11561221B2 (en) * 2018-05-02 2023-01-24 Trustees Of Boston University Dynamic tracking of captured targets for enhanced digital biosensing
EP3821034A4 (en) * 2018-07-11 2022-04-27 Chromacode, Inc. METHODS FOR QUANTIFYING ANALYTES IN MULTIPLEXED BIOCHEMICAL REACTIONS
WO2020023503A1 (en) * 2018-07-24 2020-01-30 The Regents Of The University Of Michigan Intramolecular kinetic probes
CN111690724B (zh) * 2019-03-15 2022-04-26 北京大学 一种检测双链断裂产生试剂活性的方法
CN110208226B (zh) * 2019-04-15 2020-06-16 北京化工大学 一种高度特异性的单分子荧光检测方法
JP2022540268A (ja) * 2019-07-12 2022-09-15 イルミナ ケンブリッジ リミテッド 固体支持体上で固定化されたcrispr/cas9を使用する核酸シークエンシングライブラリを調製するための組成物及び方法
WO2021155775A1 (zh) * 2020-02-03 2021-08-12 苏州克睿基因生物科技有限公司 一种检测靶核酸的方法和试剂盒
US20210292837A1 (en) * 2020-03-19 2021-09-23 The Regents Of The University Of Michigan Analyte detection
AU2021279039A1 (en) * 2020-05-29 2023-01-19 Mammoth Biosciences, Inc. Programmable nuclease diagnostic device
CN112063604A (zh) * 2020-09-15 2020-12-11 济南国科医工科技发展有限公司 功能化的dCas9修饰蛋白及其在检测核酸中的应用
US20240093168A1 (en) * 2021-01-05 2024-03-21 Kawasaki Gakuen Educational Foundation Transcriptional product in cells of organism including human, transfected rna, and tool for purifying complex thereof
WO2022163770A1 (ja) * 2021-01-28 2022-08-04 国立研究開発法人理化学研究所 ゲノム編集ツールの評価方法
WO2023122427A1 (en) * 2021-12-21 2023-06-29 Foundation Medicine, Inc. Methods and systems for predicting genomic profiling success

Family Cites Families (23)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5432272A (en) 1990-10-09 1995-07-11 Benner; Steven A. Method for incorporating into a DNA or RNA oligonucleotide using nucleotides bearing heterocyclic bases
EP0876510B1 (en) * 1995-12-22 2008-05-07 Dade Behring Marburg GmbH Homogeneous amplification and detection of nucleic acids
US6514768B1 (en) * 1999-01-29 2003-02-04 Surmodics, Inc. Replicable probe array
JP4527338B2 (ja) 1999-11-16 2010-08-18 キアゲン ゲゼルシャフト ミット ベシュレンクテル ハフツング 核酸分子に標識を付けるための染料標識オリゴヌクレオチド
JP2003180374A (ja) * 2001-10-12 2003-07-02 Adgene Co Ltd 核酸溶解曲線を応用した核酸変異検出法
WO2005118853A2 (en) * 2004-06-01 2005-12-15 Asm Scientific, Inc. Recombinase polymerase amplification
DE10259374A1 (de) 2002-12-18 2004-07-08 Atto-Tec Gmbh Carboxamid-substituierte Farbstoffe für analytische Anwendungen
EP1618211A1 (en) * 2003-04-25 2006-01-25 The University of Manchester Exciplexes
DE10329860A1 (de) 2003-07-02 2005-01-20 Atto-Tec Gmbh Sulfonamidderivate polycyclischer Farbstoffe für analytische Anwendungen
US8198604B2 (en) 2007-09-28 2012-06-12 Trustees Of Boston University System and method for providing enhanced background rejection in thick tissue with differential-aberration two-photon microscopy
US8310532B2 (en) 2008-06-05 2012-11-13 Trustees Of Boston University System and method for producing an optically sectioned image using both structured and uniform illumination
GEP20217251B (en) * 2012-05-25 2021-04-26 Charpentier Emmanuelle De Emanuel Methods and compositions for rna-directed target dna modification and for rna-directed modulation of transcription
WO2014018584A1 (en) 2012-07-24 2014-01-30 Trustees Of Boston University Partitioned aperture wavefront imaging method and system
EP3865586A1 (en) 2013-03-15 2021-08-18 The General Hospital Corporation Increasing specificity for rna-guided genome editing
CA2919833A1 (en) * 2013-07-30 2015-02-05 President And Fellows Of Harvard College Quantitative dna-based imaging and super-resolution imaging
WO2015116686A1 (en) * 2014-01-29 2015-08-06 Agilent Technologies, Inc. Cas9-based isothermal method of detection of specific dna sequence
SG11201702066UA (en) * 2014-07-21 2017-04-27 Illumina Inc Polynucleotide enrichment using crispr-cas systems
US10093967B2 (en) * 2014-08-12 2018-10-09 The Regents Of The University Of Michigan Detection of nucleic acids
JP6806668B2 (ja) * 2014-08-19 2021-01-06 プレジデント アンド フェローズ オブ ハーバード カレッジ 核酸をプロービングおよびマッピングするためのrna誘導型システム
US11180792B2 (en) * 2015-01-28 2021-11-23 The Regents Of The University Of California Methods and compositions for labeling a single-stranded target nucleic acid
EP3286571B1 (en) * 2015-04-24 2021-08-18 Editas Medicine, Inc. Evaluation of cas9 molecule/guide rna molecule complexes
KR101710026B1 (ko) * 2016-08-10 2017-02-27 주식회사 무진메디 Cas9 단백질 및 가이드 RNA의 혼성체를 함유하는 나노 리포좀 전달체 조성물
JP6829761B2 (ja) * 2016-09-29 2021-02-10 エフ.ホフマン−ラ ロシュ アーゲーF. Hoffmann−La Roche Aktiengesellschaft 遺伝子編集モジュールおよび遺伝子送達アプローチを解析および最適化するための方法

Also Published As

Publication number Publication date
EP4155397A1 (en) 2023-03-29
EP3414327B1 (en) 2020-09-30
WO2017139354A1 (en) 2017-08-17
CN109072205A (zh) 2018-12-21
JP2023153898A (ja) 2023-10-18
CN114196746A (zh) 2022-03-18
EP4155397B1 (en) 2024-06-26
JP2021129581A (ja) 2021-09-09
US20190048415A1 (en) 2019-02-14
JP7327826B2 (ja) 2023-08-16
EP3800249B1 (en) 2022-06-22
US20210348230A1 (en) 2021-11-11
EP3800249A1 (en) 2021-04-07
EP3414327A1 (en) 2018-12-19
JP2019513345A (ja) 2019-05-30
EP3414327A4 (en) 2019-10-16

Similar Documents

Publication Publication Date Title
ES2835101T3 (es) Detección de ácidos nucleicos
JP7504854B2 (ja) 個別的エピゲノミクスのための天然クロマチンへの転移
US20190032120A1 (en) Detection of nucleic acids
AU2017200433B2 (en) Multivariate diagnostic assays and methods for using same
CN107557455A (zh) 一种基于CRISPR‑Cas13a的特异性核酸片段的检测方法
US20210318296A1 (en) Intramolecular kinetic probes
CN110484602B (zh) 一种单分子计数检测基因组中dna损伤的荧光化学传感器、方法和应用
CN107513568A (zh) 一种检测let‑7a microRNA的荧光化学传感器及其检测方法
Wu et al. Multiplexed discrimination of microRNA single nucleotide variants through triplex molecular beacon sensors
Joo et al. Highly selective FRET-aided single-molecule counting of microRNAs labeled by splinted ligation
Cannon et al. A dual-mode single-molecule fluorescence assay for the detection of expanded CGG repeats in Fragile X syndrome
US20220372577A1 (en) Analyte detection method
CN106754902B (zh) 一种荧光共振探针及其应用和试剂盒
Heimer et al. Using nanobiotechnology to increase the prevalence of epigenotyping assays in precision medicine
CN108646014A (zh) 基于适体构象变化的荧光检测血小板源性生长因子的方法
CN108384852A (zh) 一种用于肺癌egfr基因t790m位点检测的mgb引物和探针序列