ES2908484T3 - Métodos y composiciones para detectar un ARN diana - Google Patents

Métodos y composiciones para detectar un ARN diana Download PDF

Info

Publication number
ES2908484T3
ES2908484T3 ES17813959T ES17813959T ES2908484T3 ES 2908484 T3 ES2908484 T3 ES 2908484T3 ES 17813959 T ES17813959 T ES 17813959T ES 17813959 T ES17813959 T ES 17813959T ES 2908484 T3 ES2908484 T3 ES 2908484T3
Authority
ES
Spain
Prior art keywords
amino acid
rna
cases
acid sequence
seq
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
ES17813959T
Other languages
English (en)
Inventor
Jennifer A Doudna
Mitchell Ray O'connell
Alexandra East-Seletsky
Spencer Charles Knight
Cate James Harrison Doudna
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
University of California
Original Assignee
University of California
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by University of California filed Critical University of California
Application granted granted Critical
Publication of ES2908484T3 publication Critical patent/ES2908484T3/es
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6813Hybridisation assays
    • C12Q1/6816Hybridisation assays characterised by the detection means
    • C12Q1/6823Release of bound markers
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6813Hybridisation assays
    • C12Q1/6816Hybridisation assays characterised by the detection means
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/113Non-coding nucleic acids modulating the expression of genes, e.g. antisense oligonucleotides; Antisense DNA or RNA; Triplex- forming oligonucleotides; Catalytic nucleic acids, e.g. ribozymes; Nucleic acids used in co-suppression or gene silencing
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6813Hybridisation assays
    • C12Q1/6816Hybridisation assays characterised by the detection means
    • C12Q1/6818Hybridisation assays characterised by the detection means involving interaction of two or more labels, e.g. resonant energy transfer
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2319/00Fusion polypeptide
    • C07K2319/20Fusion polypeptide containing a tag with affinity for a non-protein ligand
    • C07K2319/24Fusion polypeptide containing a tag with affinity for a non-protein ligand containing a MBP (maltose binding protein)-tag
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2319/00Fusion polypeptide
    • C07K2319/40Fusion polypeptide containing a tag for immunodetection, or an epitope for immunisation
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2310/00Structure or type of the nucleic acid
    • C12N2310/10Type of nucleic acid
    • C12N2310/20Type of nucleic acid involving clustered regularly interspaced short palindromic repeats [CRISPRs]
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/16Hydrolases (3) acting on ester bonds (3.1)
    • C12N9/22Ribonucleases RNAses, DNAses
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2521/00Reaction characterised by the enzymatic activity
    • C12Q2521/30Phosphoric diester hydrolysing, i.e. nuclease
    • C12Q2521/307Single strand endonuclease
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2537/00Reactions characterised by the reaction format or use of a specific feature
    • C12Q2537/10Reactions characterised by the reaction format or use of a specific feature the purpose or use of
    • C12Q2537/143Multiplexing, i.e. use of multiple primers or probes in a single reaction, usually for simultaneously analyse of multiple analysis
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2563/00Nucleic acid detection characterized by the use of physical, structural and functional properties
    • C12Q2563/107Nucleic acid detection characterized by the use of physical, structural and functional properties fluorescence
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2565/00Nucleic acid analysis characterised by mode or means of detection
    • C12Q2565/10Detection mode being characterised by the assay principle
    • C12Q2565/101Interaction between at least two labels
    • C12Q2565/1015Interaction between at least two labels labels being on the same oligonucleotide
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02ATECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
    • Y02A50/00TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE in human health protection, e.g. against extreme weather
    • Y02A50/30Against vector-borne diseases, e.g. mosquito-borne, fly-borne, tick-borne or waterborne diseases whose impact is exacerbated by climate change

Landscapes

  • Chemical & Material Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Organic Chemistry (AREA)
  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Wood Science & Technology (AREA)
  • Zoology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Genetics & Genomics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Molecular Biology (AREA)
  • General Engineering & Computer Science (AREA)
  • Biotechnology (AREA)
  • Biochemistry (AREA)
  • Microbiology (AREA)
  • General Health & Medical Sciences (AREA)
  • Biophysics (AREA)
  • Physics & Mathematics (AREA)
  • Immunology (AREA)
  • Analytical Chemistry (AREA)
  • Biomedical Technology (AREA)
  • Plant Pathology (AREA)
  • Medicinal Chemistry (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Enzymes And Modification Thereof (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Investigating Or Analysing Biological Materials (AREA)
  • Medicines That Contain Protein Lipid Enzymes And Other Medicines (AREA)

Abstract

Un método para detectar un ARN diana monocatenario en una muestra biológica que comprende una pluralidad de ARN, comprendiendo el método: a) poner en contacto la muestra biológica con: i) un ARN detector marcado; y ii) una proteína C2c2 que escinde el ARN detector marcado; y iii) un ARN guía (gRNA) que hibrida con el ARN diana monocatenario, en donde el gRNA se une a la proteína C2c2; y b) medir una señal detectable producida por la escisión del ARN detector marcado.

Description

DESCRIPCIÓN
Métodos y composiciones para detectar un ARN diana
DECLARACIÓN CON RESPECTO A LA INVESTIGACIÓN CON FONDOS FEDERALES
La presente invención se realizó con apoyo del gobierno con el premio 1244557 otorgado por la Fundación Nacional de Ciencias. El gobierno posee determinados derechos sobre la invención.
INTRODUCCIÓN
Los sistemas inmunitarios adaptativos bacterianos emplean CRISPR (repeticiones palindrómicas cortas agrupadas y regularmente interespaciadas) y proteínas asociadas a CRISPR (Cas) para la escisión de ácido nucleico guiada por ARN. Aunque generalmente se dirigen a sustratos de ADN, los sistemas CRISPR de Tipo III y de Tipo VI se dirigen a complejos de interferencia contra sustratos de ARN monocatenario (ssRNA). En los sistemas CRISPR de Tipo VI, la proteína C2c2 de una sola subunidad funciona como una endonucleasa de ARN guiada por ARN.
Los sistemas CRISPR-Cas confieren inmunidad adaptativa en bacterias y arqueas mediante la interferencia de ácido nucleico guiada por ARN. Entre los diversos tipos de CRISPR, se cree que solo los sistemas CRISPR de Tipo VI relativamente raros se dirigen exclusivamente a sustratos de ARN monocatenario, una actividad conferida por la gran proteína efectora C2c2. Los operones de Tipo VI comparten características comunes de otros locus genómicos de CRISPR-Cas, entre las que se incluyen matrices de secuencias de CRISPR que sirven como depósitos de segmentos cortos de ADN viral. Para proporcionar inmunidad antiviral, los transcritos de matriz CRISPR procesados (crRNA) se ensamblan con complejos de vigilancia que contienen proteína Cas que reconocen los ácidos nucleicos que tienen complementariedad de secuencia con el segmento derivado del virus de los crRNA, conocidos como espaciadores.
El primer paso de la vigilancia inmunitaria requiere el procesamiento de crRNA precursores (pre-crRNA), que consisten en secuencias repetidas que flanquean secuencias espaciadoras virales, en crRNA funcionales individuales que contienen cada uno un único segmento de secuencia derivado de virus. Los sistemas CRISPR emplean diversos mecanismos para producir crRNA maduros, entre los que se incluyen el uso de endonucleasas especializadas (por ejemplo, Cas6 o Cas5d en sistemas de Tipo I y III), el acoplamiento de una endonucleasa hospedadora (p. ej., RNasa III) con un crRNA de transactivación (tracrRNA, sistemas de Tipo II), o una actividad de ribonucleasa endógena a la propia enzima efectora (p. ej., Cpf1, de los sistemas de Tipo V).
Abudayyeh et al. (Science. 5 de agosto de 2016; 353 (6299): aaf5573) informan sobre la caracterización de un efector C2c2 CRISPR-Cas de Clase 2 y Tipo VI-A de la bacteria Leptotrichia shahii y describe su función de RNasa guiada por ARN.
Sumario
La invención se expone en el conjunto de reivindicaciones adjunto.
La presente invención proporciona métodos para detectar un ARN diana monocatenario, como se expone en las reivindicaciones. La presente invención proporciona un kit para detectar un ARN diana en una muestra, como se expone en las reivindicaciones.
La presente invención se refiere a un método para detectar un ARN diana monocatenario en una muestra biológica que comprende una pluralidad de ARN, comprendiendo el método: a) poner en contacto la muestra biológica con: i) un ARN detector marcado; y ii) una proteína C2c2 que escinde el ARN detector marcado; y iii) un ARN guía (gRNA) que hibrida con el ARN diana monocatenario, en donde el gRNA se une a la proteína C2c2; y b) medir una señal detectable producida por la escisión del ARN detector marcado. Una vez que una proteína C2c2 en cuestión se activa por un ARN guía de C2c2, lo cual ocurre cuando la muestra incluye un ARN diana monocatenario con el que hibrida el ARN guía (es decir, la muestra incluye el ARN diana monocatenario objetivo), la proteína C2c2 se convierte en una endorribonucleasa que escinde los ARN de la muestra. Por lo tanto, cuando el ARN diana monocatenario objetivo está presente en la muestra (por ejemplo, en algunos casos por encima de una cantidad umbral), el resultado es la escisión del ARN en la muestra, que se puede detectar usando cualquier método de detección conveniente (por ejemplo, usando un ARN detector marcado).
En algunos casos divulgados pero que no forman parte de la invención, se pueden proporcionar dos o más ARN guía de C2c2 mediante el uso de una matriz de ARN guía de C2c2 precursor, que puede escindirse por la proteína C2c2 en ARN guía individuales, y esto es independiente de si la proteína C2c2 tiene dominios HEPN1 y/o HEPN2 intactos.
Breve descripción de los dibujos
Las FIG. 1A-1E presentan esquemas relacionados con un locus C2c2 endógeno y experimentos que demuestran la expresión heteróloga y la purificación de la proteína C2c2 recombinante.
La FIG. 2 representa resultados de ensayos de escisión que se realizaron utilizando la proteína C2c2.
La FIG. 3 representa resultados que muestran que C2c2 escindía de forma robusta el ARN monocatenario. Las FIG. 4A-4B presentan un diagrama y los resultados de diversos ensayos de escisión en los que se utilizaba la proteína C2c2.
La FIG. 5 muestra los resultados de experimentos realizados con un ARN detector marcado (que utiliza un par de inactivador/flúor) para detectar la escisión del ARN por la proteína C2c2.
La FIG. 6 representa los resultados de experimentos que demuestran el procesamiento de pre-crRNA por la proteína C2c2.
Las FIG. 7A-7B representan un esquema y secuencias de ARN guía de C2c2 ilustrativos.
Las FIG. 8A-8F proporcionan secuencias de aminoácidos de diversos polipéptidos C2c2.
Las FIG.9A-9C representan el procesamiento de la familia C2c2 de transcritos de crRNA precursores para generar crRNA maduros.
Las FIG. 10A-10C representan el efecto de la estructura y la secuencia de repeticiones CRISPR sobre la biogénesis de crRNA mediada por LbuC2c2.
Las FIG. 11A-11C representan la degradación de ssRNA dependiente de la guía de dianas cis y trans por LbuC2c2. Las FIG. 12A-12D representan dos actividades de ribonucleasa distintas de LbuC2c2.
Las FIG. 13A-13D representan la detección visual sensible mediada por C2c2 de transcritos en mezclas complejas. La FIG. 14 proporciona la Tabla 2: diversos sustratos de ADN usados en los estudios descritos en los Ejemplos 8­ 12 y mostrados en las FIG. 12A-12D.
La FIG. 15 proporciona la Tabla 3: diversos sustratos de ARN usados en los estudios descritos en los Ejemplos 8­ 12.
Las FIG. 16A-16F representan datos que muestran que el procesamiento de pre-crRNA por C2c2 es independiente de la secuencia espaciadora, se puede producir en matrices de crRNA en tándem, se ve afectado por mutaciones en la región flanqueante 5' y/o 3' del pre-ARNc y es independiente de metal.
La FIG. 17 proporciona un resumen del efecto de las mutaciones dobles de pre-crRNA en la actividad de procesamiento de pre-crRNA.
Las FIG. 18A-18B representan el mapeo del sitio de escisión del ssRNA de LbuC2c2 diana.
Las FIG. 19A-19C representan la dependencia de la longitud del espaciador de crRNA, de la temperatura de la reacción y de la secuencia del extremo 5' del crRNA de la eficiencia de escisión del ARN diana.
Las FIG. 20A-20C representan los datos de unión de LbuC2c2 a crRNA maduro y ssRNA diana.
La FIG. 21 representa el curso temporal de un ensayo de detección por RNasa de A2-ssRNA.
Las FIG. 22A-22B representan un árbol filogenético de la familia C2c2 y el alineamiento de C2c2.
Las FIG. 23A-23D representan la purificación y producción de C2c2.
Las FIG. 24A-24C representan datos que muestran que las proteínas C2c2 procesan transcritos de crRNA precursores para generar crRNA maduros. a, Árbol filogenético de máxima verosimilitud de proteínas C2c2. Los homólogos utilizados en este estudio están resaltados en amarillo. b, Diagrama de los tres locus de CRISPR de Tipo VI utilizados en este estudio. Los rectángulos negros denotan elementos repetidos, los rombos amarillos indican secuencias espaciadoras. Cas 1 y Cas2 solo se encuentran en la proximidad genómica de LshC2c2. c, escisión mediada por C2c2 de pre-crRNA derivado de los locus de repeticiones CRISPR de LbuC2c2, LseC2c2 y LshC2c2. OH: escalera de hidrólisis alcalina; T1: escalera de hidrólisis de RNasa T1; las reacciones de procesamiento de escisión se realizaron con C2c2 100 nM y pre-crRNA <1 nM. El esquema de escisión se representa a la derecha, y las estructuras secundarias de pre-crRNA predichas se presentan en forma de diagrama debajo, indicando las flechas los sitios de escisión de C2c2 mapeados.
Las FIG. 25A-25C representan datos que muestran que la biogénesis de crRNA mediada por LbuC2c2 depende tanto de la estructura como de la secuencia de las repeticiones CRISPR. a, Ensayo de escisión representativo por LbuC2c2 en pre-crRNA que contienen mutaciones estructurales dentro de las regiones de tallo y bucle de la horquilla. Los porcentajes procesados enumerados a continuación se cuantifican a los 60 min (media ± s.d., n = 3). b , Gráfico de barras que muestra la dependencia del procesamiento de pre-crRNA de la secuencia de repetición CRISPR. La secuencia de repetición de tipo silvestre se muestra en la parte inferior, representando las barras individuales mutaciones de nucleótidos en tándem como se indica en rojo. El sitio de escisión se indica con el dibujo de unas tijeras. El porcentaje procesado se midió después de 60 min (media ± s.d., n = 3). Los diagramas de las horquillas de los mutantes ensayados pueden encontrarse en las Fig. 3-4 c de datos ampliados, La dependencia de iones metálicos divalentes de la reacción de procesamiento de crRNA se ensayó mediante la adición de EDTA y EGTA 10-50 mM a las condiciones de reacción estándar.
Las FIG. 26A-26D representan datos que muestran que LbuC2c2 contiene dos actividades de ribonucleasa distintas. a, Se obtuvieron datos cuantificados de curso de tiempo de escisión de diana de ssRNA en cis (negro) y de pre-crRNA (verde azulado) por LbuC2c2 a 37 °C. Los ajustes exponenciales se muestran como líneas continuas (n = 3) y las constantes de velocidad de pseudoprimer orden calculadas (kobs) (media ± s.d.) son 9,74 ± 1,15 min'1 y 0,12 ± 0,02 min-1 para la escisión de diana de ssRNA cis y de pre-crRNA, respectivamente. b, Arquitectura LbuC2c2 que representa la ubicación de los motivos HEPN y el mutante puntual de procesamiento deficiente c,d Actividad de ribonucleasa de mutantes de LbuC2c2 para el procesamiento de pre-crRNA en c y el direccionamiento a ssRNA en d y datos ampliados Fig. 6d.
Las FIG. 27A-27E muestran que C2c2 proporciona detección sensible de transcritos en mezclas complejas. a, Ilustración del enfoque de detección de A r N de LbuC2c2 utilizando un indicador de ARN fluorescente inactivado. b , Cuantificación de la señal de fluorescencia generada por LbuC2c2 después de 30 min para concentraciones variables de ARN diana en presencia de ARN total humano. La RNasa A se muestra como control positivo de degradación de ARN. (media ± s.d., n = 3) c ,. Cuantificación de la señal de fluorescencia generada por LbuC2c2 cargada con un crRNA que se dirige a p-actina después de 3 h para cantidades variables de ARN total humano o ARN total bacteriano (como un control negativo sin p-actina). (media ± s.d., n = 3) d , El procesamiento de precrRNA en tándem también permite la detección de a Rn . (media ± s.d., n = 3) e , Modelo de la ruta CRISPR de Tipo VI que destaca las dos actividades de ribonucleasa de C2c2.
Las FIG. 28A-28B representan un árbol filogenético completo de la familia C2c2 y el alineamiento de C2c2. a, Reconstrucción filogenética de máxima verosimilitud de proteínas C2c2. Las ramificaciones incluyen el número de proteínas GI y el organismo de origen; para la división interna se presentan valores de soporte del remuestro bootstrap, de 100 remuestreos. La escala está en sustituciones por sitio. b , Alineamiento de múltiples secuencias de los tres homólogos analizados de C2c2; las coordenadas se basan en LbuC2c2.
Las FIG. 29A-29D representan datos relacionados con la purificación y producción de C2c2. Todos los homólogos de C2c2 se expresaron en E. coli como fusiones His-MBP y se purificaron por una combinación de afinidad, cromatografía de intercambio iónico y de exclusión por tamaño. Se retiró la etiqueta de afinidad Ni+ mediante incubación con proteasa TEV. Los geles SDS-PAGE representativos de las fracciones de cromatografía se muestran en (a, b). c , El cromatograma de la columna Superdex 200 (16/60) que demuestra que C2c2 eluye como un solo pico, desprovisto de ácido nucleico. d , Análisis SDS-PAGE delas proteínas purificadas utilizadas en este texto original.
Las FIG. 30A-30I representan el mapeo del procesamiento de pre-crRNA por C2c2 in vitro e in vivo. a, Mapeo del sitio de escisión de la escisión de LseC2c2 y LshCc2c2 de una única matriz de pre-crRNA afín. OH: escalera de hidrólisis alcalina; T1: escalera de hidrólisis de RNasa T1. Las reacciones de escisión se realizaron con C2c2 100 nM y pre-crRNA <1 nM. b-i, Nuevo análisis de experimentos de secuenciación de ARN de matriz CRISPR por LshC2c2 (b-f) y LseC2c2 (g-i) de Shmakov et a l.10 (Fig. S7 y Fig. 5, respectivamente). Todas las lecturas (b,g) y lecturas filtradas (55 nt o menos; según el análisis original de Shmakov et al.; c, h) se alinearon en condiciones rigurosas con cada matriz CRISPR usando Bowtie2 (véase la sección Métodos). Se muestran vistas detalladas de espaciadores de repeticiones CRISPR individuales para Lsh (d-f) y Lse (i). Las diferencias en el procesamiento de pre-crRNA del extremo 5' se indican mediante flechas debajo de cada secuencia. Están disponibles los archivos de alineamiento BAM del análisis. Este mapeo indica claramente que los extremos 5' de las lecturas de secuenciación de ARN pequeños generados a partir de pre-crRNA de Lsh se asignan a una posición a 2 nt de la base de la horquilla predicha, de acuerdo con los datos de procesamiento in vitro (a). Este patrón es válido para todos los crRNA maduros detectados tanto a partir de la expresión nativa en L. shahii como de la expresión heteróloga en E. coli. Desafortunadamente, los datos de secuenciación de crRNA de LseC2c2 (utilizados en g-i) son menos informativos debido a la baja profundidad de lectura, y cada crRNA alineado presenta un extremo 5' ligeramente diferente con poca uniformidad evidente. El mapeo de una de las repeticiones procesadas (repeticiónespaciador 2; i) está de acuerdo con los datos, pero solo con poca confianza debido a la insuficiente profundidad de lectura.
Las FIG. 31A-31D representan que el procesamiento de pre-crRNA por C2c2 es independiente de la secuencia espaciadora, se puede producir en matrices de crRNA en tándem, se ve afectado por mutaciones en la región flanqueante 5' del pre-ARNc y produce un producto con fosfato en posición 3'. a, Mapeo del sitio de escisión de la escisión por LbuCc2c2 de una matriz de pre-crRNA en tándem. OH: escalera de hidrólisis alcalina; T1: escalera de hidrólisis de RNasa T1. Las reacciones de escisión se realizaron con LbuC2c2 100 nM y pre-crRNA <1 nM. A la derecha se representa un esquema de los productos de escisión, indicando las flechas los productos de escisión de C2c2 mapeados. b , Datos de procesamiento de pre-crRNA mutante tetramérico de LbuC2c2 que demuestran la importancia de la región flanqueante monocatenaria 5' para un procesamiento eficaz de pre-crRNA. El porcentaje de procesamiento de pre-crRNA se midió después de 60 minutos (media ± s.d., n = 3). c , Curso temporal representativo de escisión de pre-crRNA por LbuC2c2 que demuestra que se producen tasas similares de procesamiento de pre-crRNA independientemente de la secuencia espaciadora de crRNA. Las constantes de velocidad de pseudoprimer orden (kobs) (media ± s.d.) son 0,07 ± 0,04 min’1 y 0,08 ± 0,04 min’1 para el espaciador A y el espaciador A2, respectivamente. d , Análisis de grupo terminal de ARN escindido mediante tratamiento con polinucleótido quinasa (PNK) T4. Se usaron condiciones de ensayo de procesamiento estándar para generar el producto de escisión, que posteriormente se incubó con PNK durante 1 h para eliminar cualquier 2',3'-fosfato cíclico/3' monofosfato. La migración retardada de la banda indica la eliminación del monofosfato cargado del extremo 3' del producto 5' radiomarcado.
Las FIG. 32A-32C muestran que LbuC2c2 cataliza la degradación de ssRNA dependiente de guía en dianas cis y trans, a, Esquema de los dos modos de degradación de ssRNA dependiente de guía por C2c2. b, Escisión de dos sustratos de ssRNA radiomarcados distintos, A y B, por LbuC2c2. Se formaron previamente complejos de C2c2 100 nM y crRNA 50 nM a 37 °C y la reacción se inició tras la adición de una concentración <1 nM de ARN diana marcado en 5' a 25 °C. Las reacciones de escisión trans contenían concentraciones equimolares (<1 nM) de sustrato complementario no guía radiomarcado, y ssRNA en la diana no marcado. Para múltiples sustratos de ssRNA, se observó que LbuC2c2 catalizaba eficazmente la escisión solo cuando se unía al crRNA complementario, lo que indica que LbuC2c2:crRNA escinde ssRNA de una manera guiada por ARN. En lo sucesivo, esta actividad se denomina escisión en la diana o escisión de la diana en cis. La escisión en cis mediada por LbuC2c2 dio como resultado una escalera de múltiples productos, produciéndose escisión preferentemente antes de los restos de uracilo, de forma análoga a LshC2c29. Las reacciones de escisión no diana se repitieron en presencia de ssRNA en la diana, no marcado (crRNA-complementario). A diferencia de los experimentos de escisión no diana realizados en cis, se observó una rápida degradación del ARN no diana en trans. Las tasas de escisión de ARN similares y los productos de escisión casi idénticos observados tanto para la escisión en cis en la diana como para la escisión en trans no diana implican el mismo centro de nucleasa en las dos actividades. c , Se analizó la actividad de escisión de LbuC2c2 cargada con el espaciador A dirigido a crRNA tanto en condiciones de escisión cis (diana A marcada) como en condiciones de escisión trans (diana B marcada en presencia de diana A no marcado) en presencia de EDTA 25 mM.
Las FIG. 33A-33B muestran el mapeo del sitio de escisión del ssRNA diana de LbuC2c2 a, Ensayo de escisión de ssRNA diana realizado según la sección Métodos, que demuestra la escisión en "cis" mediada por LbuC2c2 de varios sustratos de ssRNA radiomarcados con secuencias complementarias al espaciador idénticas pero secuencias flanqueantes 5' distintas de longitud y composición de nucleótidos variable. Las secuencias de sustratos de ssRNA se muestran a la derecha con secuencias complementarias al espaciador para crRNA-A resaltadas en amarillo. Las flechas indican los sitios de escisión detectados. El gel se recortó para mayor claridad. Cabe señalar que el patrón de productos de escisión producidos en diferentes sustratos (por ejemplo, A.1 frente a A.2 frente a A.3) indica que la elección del sitio de escisión está impulsada principalmente por una preferencia de uracilo y presenta una aparente falta de mecanismo de escisión exclusivo dentro de la secuencia diana complementaria de crRNA, lo que contrasta con lo que se observa para otros complejos de un solo efector de CRISPR de Clase II tales como Cas9 y Cpf11121. Curiosamente, el patrón de escisión observado para el sustrato A.0 sugiere una preferencia secundaria por las secuencias poliG. b, Ensayo de escisión de ssRNA diana por LbuC2c2 según la sección Métodos, utilizando una gama de crRNA que se alinean con la longitud del ssRNA diana. La secuencia de los sustratos de ssRNA utilizados en este experimento se muestra debajo del gel con secuencias complementarias al espaciador para cada crRNA resaltadas en amarillo. Las flechas indican los sitios de escisión previstos. Por encima de cada conjunto de calles, un pequeño diagrama indica la ubicación de la secuencia espaciadora a lo largo de la diana (recuadro amarillo) y los productos de escisión observados (flechas rojas) o ausentes (flechas negras). Análogamente, cabe señalar que para todos los crRNA, la distribución de la longitud del producto de escisión es muy similar, indicando de nuevo una aparente falta de escisión exclusiva dentro de la secuencia unida a crRNA. La ausencia de varios productos de escisión en un subconjunto de las reacciones podría explicarse por la presencia de C2c2:crRNA unido en el ssRNA diana, que podría impedir estéricamente el acceso a los uracilos por cualquier sitio activo de LbuC2c2 cis (intramolecular) o trans (intermolecular). Aunque el análisis adecuado de la preferencia del sitio de flanqueo del protoespaciador (PFS) para LbuC2c2 está más allá del alcance de este estudio, se observó un impacto mínimo del nucleótido flanqueante 3'. La base de PFS esperada se indica en el diagrama junto a cada guía ensayada en rojo.
Las FIG. 34A-34D representan la dependencia del direccionamiento del ARN de variantes de crRNA, de la temperatura y de mutaciones puntuales. a, Ensayo de escisión de ssRNA diana por LbuC2c2 realizado, según la sección de Métodos, con crRNA que poseen espaciadores de 16 nt, 20 nt o 24 nt. b, Curso temporal de escisión de ssRNA diana por LbuC2c2 realizada a 25 °C y 37 °C según la sección de Métodos. c , Curso temporal de escisión de ssRNA diana por LbuC2c2 realizada según la sección Métodos con crRNA que poseen diferentes mutaciones de nucleótidos flanqueantes en 5'. Las mutaciones están resaltadas en rojo. Las extensiones 5' de 1­ 2 nucleótidos afectaban de forma insignificante a las eficacias de escisión. Por el contrario, el acortamiento de la región flanqueante a 3 nt ralentizó las tasas de escisión. d Impacto de mutaciones puntuales en la actividad de ribonucleasa de C2c2 en mutantes de restos conservados dentro de motivos HEPN para el direccionamiento de ssRNA.
Las FIG. 35A-35D representan los datos de unión de LbuC2c2 a CRNcr maduro y ssRNA diana. a, Los ensayos de unión a filtros se realizaron como se describe en la sección de Métodos para determinar la afinidad de unión de crRNA-A_GG maduro a LbuC2c2-WT, LbuC2c2-dHEPN1, LbuC2c2-dHEPN2 o LbuC2c2-dHEPN1/dHEPN2. Los datos cuantificados se ajustaron a isotermas de unión estándar. Las barras de error representan la desviación estándar de tres experimentos independientes. Las constantes de disociación medidas de tres experimentos independientes (media ± sd) fueron 27,1 ± 7,5 nM (LbuC2c2-WT), 15,2 ± 3,2 nM (LbuC2c2-dHEPN1), 11,5 ± 2,5 nM (LbuC2c2-dHEPN2) y 43,3 ± 11,5 nM (LbuC2c2-dHEPN1/dHEPN2). b, Ensayo representativo de cambio de movilidad electroforética para reacciones de unión entre LbuC2c2-dHEPN1/dHEPN2: crRNA-A_GG y ssRNA A "en la diana" o ssRNA B "fuera de la diana", según se indica. Se realizaron tres experimentos independientes como se describe en la sección Métodos. El gel se recortó para mayor claridad, c , Los datos de unión cuantificados de (b) se ajustaron a isoformas de unión estándar. Las barras de error representan la desviación estándar de tres experimentos independientes. Las constantes de disociación medidas de tres experimentos independientes (media ± sd) fueron 1,62 ± 0,43 nM para ssRNA A y N.D (>> 10 nM) para ssRNA B. d, Los ensayos de unión a filtros se realizaron como se describe en la sección de Métodos para determinar la afinidad de unión de crRNA-A_GA maduro a LbuC2c2-WT y LbuC2c2-R1079A. Los datos cuantificados se ajustaron a isotermas de unión estándar. Las barras de error representan la desviación estándar de tres experimentos independientes. Las constantes de disociación medidas de tres experimentos independientes (media ± sd) fueron 4,65 ± 0,6 nM (LbuC2c2-WT) y 2,52 ± 0,5 nM (LbuC2c2-R1079A). Cabe señalar que estas afinidades de unión difieren del panel a. Esta diferencia se explica por una ligera diferencia en la secuencia 5' de la guía con las guías del panel a que comienzan con 5' -GGCCA... y el panel d 5'-GACCA. Mientras que la guía de secuencia nativa (5' -GACCA) se une más estrechamente a LbuC2c2, no se observa ninguna diferencia en las eficacias de direccionamiento del ARN de estas variantes de guía (Datos ampliados en la Fig. 6c).
Las FIG. 36A-36B representan un curso temporal de un ensayo de detección de RNasa A2-ssRNA. a, Se incubó LbuC2c2:crRNA-A2 con sustrato de RNAasa-Alert (Thermo-Fisher) y 100 ng de ARN total de HeLa en presencia de cantidades crecientes de ssRNA A2 (0-1 nM) durante 120 min a 37 °C. Se tomaron medidas de fluorescencia cada 5 min. La reacción de ssRNA A2 1 nM alcanzó la saturación antes de que se pudiera medir el primer punto de tiempo. Las barras de error representan la desviación estándar de tres experimentos independientes, b, se incubó LbuC2c2:crRNA-A4 o apo LbuC2c2 en ARN total de HeLa durante 2 horas en presencia o ausencia de ssRNA A4 activador en la diana. La degradación del ARN pequeño de referencia se resolvió en un chip de ARN pequeño en un Bioanalyzer 2100 según la sección de Métodos. Se observan pequeñas diferencias en el perfil de fragmentos entre apo LbuC2c2 y LbuC2c2:crRNA-A4. Por el contrario, tras la adición del ssRNA en la diana a la reacción, un ensanchamiento y desplazamiento drásticos del pico de tRNA revela una degradación extensa de otros ARN estructurados y no estructurados presentes en la reacción tras la activación de la actividad en trans de LbuC2c2.
La FIG. 37 representa experimentos de escisión que demuestran una escisión gravemente reducida del ARN guía precursor (procesamiento del ARN guía) por LbuC2c2 cuando la proteína incluye una mutación en cualquier posición de aminoácido seleccionada de Rl079 (p. ej., R1079A), R1072 (p. ej., R1072A) y K1082 (p. ej., K1082A). Las FIG. 38A-38C representan la conservación del procesamiento de pre-crRNA dentro de la familia Cas 13a.
Las FIG. 39A-39C representan los locus de CRISPR y la arquitectura de repetición de crRNA para los homólogos de Cas 13a.
Las FIG. 40A-40F representan restos importantes para la escisión de pre-crRNA por LbuCas 13a.
Las FIG. 41A-41B representan alineamientos de los dominios Helicoidal 1 y HEPN de miembros de la familia Cas 13a.
Las FIG. 42A-42D representan las eficacias de ssRNA por miembros de la familia Cas 13a.
Las FIG. 43A-43D representan la escisión de ssRNA en trans por homólogos de Cas 13a.
Las FIG. 44A-44F representan la intercambiabilidad de crRNA dentro de la familia Cas 13a.
Las FIG. 45A-45C representan la validación funcional de las subfamilias ortogonales de Cas 13a para la detección de ARN.
Las FIG. 46A-46D representan el procesamiento de la matriz de crRNA por LbuCas 13a de tipo silvestre (WT) y el doble mutante R1079a /K1080A de LbuCas 13a.
Las FIG. 47A-47C representan la escisión en trans por mutantes puntuales de LbuCas 13a en regiones implicadas en el procesamiento de pre-crRNA.
Las FIG. 48A-48B representan características del doble mutante R1079A/K1080A de LbuCas 13a con respecto a LbuCas 13a de tipo silvestre.
La FIG. 49 proporciona la Tabla 4.
La FIG. 50 proporciona la Tabla 5.
La FIG. 51 proporciona la Tabla 6.
La FIG. 52 proporciona la Tabla 7.
La FIG. 53 proporciona la Tabla 8.
La FIG. 54 proporciona la Tabla 9.
Las FIG. 55A-55B presentan un modelo para la función del sistema CRISPR de Tipo VI-A.
Las FIG. 56A-56K proporcionan secuencias de aminoácidos de diversos polipéptidos Cas 13a.
La FIG. 57 proporciona un alineamiento de secuencias de aminoácidos de varios polipéptidos Cas 13a.
Definiciones
Los términos "polinucleótido" y "ácido nucleico", utilizados indistintamente en el presente documento, se refieren a una forma polimérica de nucleótidos de cualquier longitud, ya sean ribonucleótidos o desoxirribonucleótidos. Por lo tanto, los términos "polinucleótido" y "ácido nucleico" abarcan ADN monocatenario; ADN bicatenario; ADN multicatenario; ARN monocatenario; ARN bicatenario; ARN multicatenario; ADN genómico; ADNc; híbridos de ADN:ARN; y un polímero que comprende bases de purina y pirimidina u otras bases de nucleótidos naturales, modificadas química o bioquímicamente, no naturales o alteradas.
El término "oligonucleótido" se refiere a un polinucleótido de entre 3 y 100 nucleótidos de ácido nucleico mono- o bicatenario (por ejemplo, ADN, ARN o un ácido nucleico modificado). Sin embargo, para los fines de esta divulgación, no hay límite superior para la longitud de un oligonucleótido. Los oligonucleótidos también se conocen como "oligómeros" u "oligos" y se pueden aislar a partir de genes, trancribirse (in vitro y/o in vivo) o sintetizarse químicamente. Debe entenderse que los términos "polinucleótido" y "ácido nucleico" incluyen, según corresponda a las realizaciones que se describen, polinucleótidos monocatenarios (tales como sentido o antisentido) y bicatenarios.
Por "hibridable" o "complementario" o "sustancialmente complementario" se entiende que un ácido nucleico (por ejemplo, ARN, ADN) comprende una secuencia de nucleótidos que le permite unirse de forma no covalente, es decir, formar pares de bases de Watson-Crick y/o pares de bases G/U, "unirse de forma complementaria" o "hibridar", con otro ácido nucleico de una manera específica de secuencia, antiparalela (es decir, un ácido nucleico se une específicamente a un ácido nucleico complementario) en las condiciones apropiadas de temperatura y fuerza iónica de la solución in vitro y/o in vivo. El emparejamiento de bases de Watson-Crick estándar incluye: emparejamiento de adenina/adenosina (A) con timidina/timidina (T), el emparejamiento de A con uracilo/uridina (U) y el emparejamiento de guanina/guanosina (G) con citosina/citidina (C). Además, para la hibridación entre dos moléculas de ARN (p. ej., dsRNA) y para la hibridación de una molécula de ADN con una molécula de ARN (p. ej., cuando una base de ácido nucleico diana de ADN se empareja con un ARN guía de C2c2, etc.): G también puede formar pares de bases con U. Por ejemplo, el emparejamiento de bases G/U es parcialmente responsable de la degeneración (es decir, redundancia) del código genético en el contexto del emparejamiento de bases anticodón de tRNA con codones en el mRNA. Por lo tanto, en el contexto de la presente divulgación, una G (p. ej., de un segmento de unión a proteína (dúplex de dsRNA) de una molécula de ARN guía de C2c2); de un ácido nucleico diana que forma pares de bases con un ARN guía de C2c2) se considera complementaria tanto a U como a C. Por ejemplo, cuando se puede formar un par de bases G/U en una posición de nucleótido determinada de un segmento de unión a proteína (p. ej., dúplex de dsRNA) de una molécula de ARN guía de C2c2, la posición no se considera no complementaria, sino que se considera complementaria.
Las condiciones de hibridación y lavado son bien conocidas y se proporcionan ejemplos en Sambrook, J., Fritsch, E. F. y Maniatis, T. Molecular Cloning: A Laboratory Manual, Segunda edición, Cold Spring Harbor Laboratory Press, Cold Spring Harbor (1989), particularmente el Capítulo 11 y la Tabla 11.1 del mismo; y Sambrook, J. y Russell, W., Molecular Cloning: A Laboratory Manual, Tercera Edición, Cold Spring Harbor Laboratory Press, Cold Spring Harbor (2001). Las condiciones de temperatura y fuerza iónica determinan la "rigurosidad" de la hibridación.
La hibridación requiere que los dos ácidos nucleicos contengan secuencias complementarias, aunque son posibles desacoplamientos entre las bases. Las condiciones apropiadas para la hibridación entre dos ácidos nucleicos dependen de la longitud de los ácidos nucleicos y del grado de complementariedad, variables bien conocidas en la técnica. Cuanto mayor sea el grado de complementariedad entre dos secuencias de nucleótidos, mayor será el valor de la temperatura de fusión (Tm) para los híbridos de ácidos nucleicos que tienen esas secuencias. En las hibridaciones entre ácidos nucleicos con tramos cortos de complementariedad (por ejemplo, complementariedad de más de 35 o menos, 30 o menos, 25 o menos, 22 o menos, 20 o menos, o 18 o menos nucleótidos), la posición de los desacoplamientos puede volverse importante (véase Sambrook et al., mencionado anteriormente, 11,7-11,8). Normalmente, la longitud de un ácido nucleico hibridable es de 8 nucleótidos o más (por ejemplo, 10 nucleótidos o más, 12 nucleótidos o más, 15 nucleótidos o más, 20 nucleótidos o más, 22 nucleótidos o más, 25 nucleótidos o más, o 30 nucleótidos o más). La temperatura y la concentración salina de la solución de lavado se pueden ajustar cuando sea necesario en función de factores tales como la longitud de la región de complementación y el grado de complementación.
Se entiende que no es necesario que la secuencia de un polinucleótido sea un 100 % complementaria a la de su ácido nucleico diana para ser específicamente hibridable o hibridable. Asimismo, un polinucleótido puede hibridar sobre uno o más segmentos de modo que los segmentos intermedios o adyacentes no estén implicados en el suceso de hibridación (por ejemplo, una estructura de bucle o una estructura de horquilla). Un polinucleótido puede comprender un 60 % o más, un 65 % o más, un 70 % o más, un 75 % o más, un 80 % o más, un 85 % o más, un 90 % o más, un 95 % o más, un 98 % o más, un 99 % o más, un 99,5 % o más, o un 100 % de complementariedad de secuencia con una región diana dentro de la secuencia de ácido nucleico diana con la que hibridará. Por ejemplo, un ácido nucleico antisentido en el que 18 de 20 nucleótidos del compuesto antisentido son complementarios a una región diana y, por lo tanto, hibridarían específicamente, representaría el 90 por ciento de complementariedad. En este ejemplo, los nucleótidos no complementarios restantes pueden estar agrupados o intercalados con nucleótidos complementarios y no tienen que ser contiguos entre sí o con nucleótidos complementarios. El porcentaje de complementariedad entre tramos particulares de secuencias de ácido nucleico dentro de los ácidos nucleicos se puede determinar usando cualquier método conveniente. Los métodos ilustrativos incluyen programas BLAST (herramientas básicas de búsqueda de alineamiento local) y programas PowerBLAST (Altschul et al., J. Mol. Biol., 1990, 215, 403-410; Zhang y Madden, Genome Res., 1997, 7, 649-656) o el uso del programa Gap (Wisconsin Sequence Analysis Package, Versión 8 para Unix, Genetics Computer Group, University Research Park, Madison Wis.), el uso de configuraciones predeterminadas, que utiliza el algoritmo de Smith y Waterman (Adv. Appl. Math., 1981, 2, 482-489).
Los términos "péptido", "polipéptido", y "proteína" se usan indistintamente en el presente documento y se refieren a una forma polimérica de aminoácidos de cualquier longitud, que puede incluir aminoácidos codificados y no codificados, aminoácidos modificados o alterados química o bioquímicamente y polipéptidos que tienen cadenas principales peptídicas modificadas.
"Unión", como se usa en el presente documento (por ejemplo, con referencia a un dominio de unión a ARN de un polipéptido, unión a un ácido nucleico diana y similares), se refiere a una interacción no covalente entre macromoléculas (p. ej., entre una proteína y un ácido nucleico; entre un complejo de ARN guía de C2c2 y un ácido nucleico diana; y similares). En un estado de interacción no covalente, se dice que las macromoléculas están "asociadas" o "que interaccionan" o "que se unen" (por ejemplo, cuando se dice que una molécula X interacciona con una molécula Y, significa que la molécula X se une a la molécula Y de manera no covalente). No es necesario que todos los componentes de una interacción de unión sean específicos de secuencia (por ejemplo, contactos con restos de fosfato en una cadena principal de ADN), pero algunas partes de una interacción de unión pueden ser específicas de secuencia. Las interacciones de unión se caracterizan, en general, por una constante de disociación (Kd) de menos de 10'6 M, menos de 10'7 M, menos de 10'8 M, menos de 10'9 M, menos de 10'1° M, menos de 10'11 M, menos de 10' 12 M, menos de 10‘13 M, menos de 10‘14 M o menos de 10‘15 M. "Afinidad" se refiere a la fuerza de unión, correlacionándose una mayor afinidad de unión con una Kd menor.
Por "dominio de unión" se entiende un dominio de proteína que es capaz de unirse de forma no covalente a otra molécula. Un dominio de unión puede unirse a, por ejemplo, una molécula de ARN (un dominio de unión a ARN) y/o una molécula de proteína (un dominio de unión a proteína). En el caso de una proteína que tiene un dominio de unión a proteína, en algunos casos puede unirse a sí misma (para formar homodímeros, homotrímeros, etc.) y/o se puede unir a una o más regiones de una proteína o proteínas diferentes.
La expresión "sustitución de aminoácidos conservativa" se refiere a la intercambiabilidad en las proteínas de restos de aminoácidos que tienen cadenas laterales similares. Por ejemplo, un grupo de aminoácidos que tienen cadenas laterales alifáticas consiste en glicina, alanina, valina, leucina e isoleucina; un grupo de aminoácidos que tienen cadenas laterales alifáticas con hidroxilo consiste en serina y treonina; un grupo de aminoácidos que tienen cadenas laterales que contienen amida consiste en asparagina y glutamina; un grupo de aminoácidos que tienen cadenas laterales aromáticas consiste en fenilalanina, tirosina y triptófano; un grupo de aminoácidos que tienen cadenas laterales básicas consiste en lisina, arginina e histidina; un grupo de aminoácidos que tienen cadenas laterales ácidas consiste en glutamato y aspartato; y un grupo de aminoácidos que tienen cadenas laterales que contienen azufre consiste en cisteína y metionina. Son grupos preferidos de sustitución de aminoácidos conservativa: valina-leucinaisoleucina, fenilalanina-tirosina, lisina-arginina, alanina-valina-glicina y asparagina-glutamina.
Un polinucleótido o polipéptido tiene un cierto porcentaje de "identidad de secuencia" con otro polinucleótido o polipéptido, lo que significa que, cuando se alinean, el porcentaje de bases o aminoácidos es el mismo, y están en la misma posición relativa, cuando se comparan las dos secuencias. La identidad de secuencias se puede determinar de varias maneras diferentes. Para determinar la identidad de secuencias, las secuencias se pueden alinear usando diversos métodos y programas informáticos (por ejemplo, BLAST, T-COFFEE, MUSCLE, MAFFT, Phyre2, etc.), disponibles en la red mundial en sitios entre los que se incluyen ncbi.nlm.nili.gov/BLAST, ebi.ac.uk/Tools/msa/tcoffee/, ebi.ac.uk/Tools/msa/muscle/, mafft.cbrc.jp/alignment/software/, http://www.sbg.bio.ic.ac.uk/~phyre2/. Véase, por ejemplo, Altschul et al. (1990), J. Mol. Biol. 215:403-10.
Una secuencia de ADN que "codifica" un ARN particular es una secuencia de ácido nucleico de ADN que se transcribe en ARN. Un polinucleótido de ADN puede codificar un ARN (mRNA) que se traduce en una proteína, o un polinucleótido de ADN puede codificar un ARN que no se traduce en una proteína (por ejemplo, tRNA, rRNA, microARN (miRNA), un ARN "no codificante" (ncRNA), un ARN guía de C2c2, etc.).
Las expresiones "secuencias reguladoras de ADN", "elementos de control", y "elementos reguladores", utilizados indistintamente en el presente documento, se refieren a secuencias de control de la transcripción y de la traducción, tales como promotores, potenciadores, señales de poliadenilación, terminadores, señales de degradación de proteínas, y similares, que proporcionan y/o regulan la transcripción de una secuencia no codificante (p. ej., ARN guía de Cas9) o una secuencia codificante (p. ej., proteína Cas9) y/o regulan la traducción de un polipéptido codificado.
Como se usa en el presente documento, una "secuencia promotora" es una región reguladora de ADN capaz de unirse a la ARN polimerasa e iniciar la transcripción de una secuencia codificante o no codificante cadena abajo (en dirección 3'). Para los fines de la presente divulgación, la secuencia promotora está limitada en su extremo 3' por el sitio de inicio de la transcripción y se extiende cadena arriba (en dirección 5') para incluir el número mínimo de bases o elementos necesarios para iniciar la transcripción a niveles detectables por encima del nivel de referencia. Dentro de la secuencia promotora se encontrará un sitio de inicio de la transcripción, así como dominios de unión a proteína responsables de la unión de la ARN polimerasa. Los promotores eucarióticos a menudo, pero no siempre, contienen cajas "TATA" y cajas "CAT". Para dirigir los diversos vectores de la presente divulgación pueden usarse diversos promotores, entre los que se incluyen promotores inducibles.
La expresión "de origen natural" o "no modificado" o "de tipo silvestre", como se usa en el presente documento y se aplica a un ácido nucleico, un polipéptido, una célula o un organismo, se refiere a un ácido nucleico, polipéptido, célula u organismo que se encuentra en la naturaleza. Por ejemplo, una secuencia de polipéptido o de polinucleótido que está presente en un organismo (incluyendo a los virus) que se puede aislar de una fuente en la naturaleza y que no se ha modificado intencionadamente por el ser humano en el laboratorio es de tipo silvestre (y de origen natural).
"Recombinante", como se usa en el presente documento, significa que un ácido nucleico particular (ADN o ARN) es el producto de diversas combinaciones de etapas de clonación, restricción, reacción en cadena de la polimerasa (PCR) y/o ligamiento que dan como resultado una construcción que tiene una secuencia estructural codificante o no codificante distinguible de los ácidos nucleicos endógenos que se encuentran en los sistemas naturales. Las secuencias de ADN que codifican polipéptidos se pueden ensamblar a partir de fragmentos de ADNc o de una serie de oligonucleótidos sintéticos, para proporcionar un ácido nucleico sintético que sea capaz de expresarse a partir de una unidad transcripcional recombinante contenida en una célula o en un sistema de transcripción y traducción sin células. El ADN genómico que comprende las secuencias relevantes también puede usarse en la formación de un gen recombinante o una unidad transcripcional. Pueden estar presentes secuencias de ADN no traducido en posición 5' o 3' con respecto al marco de lectura abierto, donde tales secuencias no interfieren con la manipulación o la expresión de las regiones codificantes, y de hecho pueden actuar modulando la producción de un producto deseado por varios mecanismos (véase más adelante el apartado "Secuencias reguladoras de ADN"). Como alternativa, las secuencias de ADN que codifican ARN (p. ej., ARN guía de C2c2) que no se traducen también pueden considerarse recombinantes. Por lo tanto, por ejemplo, el término ácido nucleico "recombinante" se refiere a uno que no se produce de forma natural, por ejemplo, se obtiene por la combinación artificial de dos segmentos de secuencia separados por intervención humana. Esta combinación artificial se consigue a menudo mediante síntesis química o mediante la manipulación artificial de segmentos aislados de ácidos nucleicos, por ejemplo, mediante técnicas de ingeniería genética. Esto generalmente se hace para reemplazar un codón con un codón que codifica el mismo aminoácido, un aminoácido conservativo o un aminoácido no conservativo. Como alternativa, se realiza para unir segmentos de ácido nucleico de funciones deseadas para generar una combinación deseada de funciones. Esta combinación artificial se consigue a menudo mediante síntesis química o mediante la manipulación artificial de segmentos aislados de ácidos nucleicos, por ejemplo, mediante técnicas de ingeniería genética. Cuando un polinucleótido recombinante codifica un polipéptido, la secuencia del polipéptido codificado puede ser de origen natural ("tipo silvestre") o puede ser una variante (p. ej., un mutante) de la secuencia de origen natural. Por lo tanto, el término polipéptido "recombinante" no se refiere necesariamente a un polipéptido cuya secuencia no se produce de forma natural. Un polipéptido "recombinante" está codificado por una secuencia de ADN recombinante, pero la secuencia del polipéptido puede ser natural ("tipo silvestre") o no natural (por ejemplo, una variante, un mutante, etc.). Por lo tanto, un polipéptido "recombinante" es el resultado de la intervención humana, pero puede ser una secuencia de aminoácidos de origen natural.
Un "vector" o "vector de expresión" es un replicón, tal como un plásmido, fago, virus o cósmido, al que puede unirse otro segmento de ADN, es decir, un "inserto", para provocar la replicación del segmento unido en una célula.
Un "casete de expresión" comprende una secuencia codificante de ADN unida operativamente a un promotor. "Unido operativamente" se refiere a una yuxtaposición en donde los componentes descritos están en una relación que les permite funcionar de la manera prevista. Por ejemplo, un promotor está unido operativamente a una secuencia codificante si el promotor afecta a su transcripción o expresión.
Las expresiones "vector de expresión recombinante", o "construcción de ADN" se usan indistintamente en el presente documento para referirse a una molécula de ADN que comprende un vector y un inserto. Los vectores de expresión recombinantes normalmente se generan con el fin de expresar y/o propagar el o los insertos o para la construcción de otras secuencias de nucleótidos recombinantes. El o los insertos pueden estar unidos operativamente o no a una secuencia promotora y pueden estar unidos operativamente o no a secuencias reguladoras de ADN.
Cualquier componente dado, o combinación de componentes, puede estar sin marcar, o puede estar marcado de forma detectable con un resto marcador. En algunos casos, cuando se etiquetan dos o más componentes, se pueden etiquetar con restos marcadores que se pueden distinguir entre sí.
Pueden encontrarse métodos generales de bioquímica molecular y celular en libros de texto estándar tales como Molecular Cloning: A Laboratory Manual, 3a ed. (Sambrook et al., HaRBor Laboratory Press 2001); Short Protocols in Molecular Biology, 4a Ed. (Ausubel et al. eds., John Wiley & Sons 1999); Protein Methods (Bollag et al., John Wiley & Sons 1996); Nonviral Vectors for Gene Therapy (Wagner et al. eds., Academic Press 1999); Viral Vectors (Kaplift & Loewy eds., Academic Press 1995); Immunology Methods Manual (I. Lefkovits ed., Academic Press 1997); y Cell and Tissue Culture: Laboratory Procedures in Biotechnology (Doyle & Griffiths, John Wiley & Sons 1998).
Antes de describir adicionalmente la presente invención, debe entenderse que esta invención no se limita a las realizaciones particulares descritas, sino que está limitada por las reivindicaciones adjuntas. También debe entenderse que la terminología usada en el presente documento únicamente tiene el fin de describir realizaciones particulares, y no debe considerarse limitante, ya que el alcance de la presente invención estará limitado únicamente por las reivindicaciones adjuntas.
Cuando se proporciona un intervalo de valores, se entiende que cada valor intermedio, hasta el décimo de la unidad del límite inferior, a menos que el contexto indique claramente otra cosa, entre el límite superior e inferior de ese intervalo y cualquier otro valor establecido o intermedio en el intervalo indicado, está comprendido dentro de la invención. Los límites superior e inferior de estos intervalos más pequeños pueden estar incluidos independientemente en los intervalos más pequeños, y también están comprendidos dentro de la invención, sujetos a cualquier límite excluido específicamente en el intervalo indicado. Cuando el intervalo establecido incluye uno o ambos límites, también se incluyen en la invención intervalos que excluyen alguno de los límites incluidos o ambos.
A menos que se definan de otra manera, todos los términos técnicos y científicos usados en el presente documento tienen el mismo significado que el entendido comúnmente por un experto en la materia a la cual pertenece la presente invención.
Cabe destacar que, como se usa en el presente documento y en las reivindicaciones adjuntas, las formas en singular "un", "uno/una", y "el/la" incluyen referencias en plural a menos que el contexto indique claramente lo contrario. Por lo tanto, por ejemplo, la referencia a "una proteína" incluye una pluralidad de dichas células y la referencia a "el ARN guía" incluye la referencia a uno o más de estos ARN guía y equivalentes de los mismos conocidos por los expertos en la materia, y así sucesivamente. Debe tenerse en cuenta además que las reivindicaciones pueden redactarse excluyendo cualquier elemento opcional. De este modo, esta afirmación pretende servir como fundamento para el uso de dicha terminología excluyente como "solamente", "solo" y similares en relación con la cita de los elementos de las reivindicaciones o para el uso de una limitación "negativa".
Las publicaciones analizadas en el presente documento se proporcionan únicamente para su divulgación antes de la fecha de presentación de la presente solicitud. No debe interpretarse que nada en el presente documento constituya una admisión de que la presente invención no tiene derecho a anteponer dicha publicación en virtud de una invención anterior. Asimismo, las fechas de publicación proporcionadas pueden ser diferentes de las fechas de publicación reales, que tal vez deban ser confirmadas independientemente.
Descripción detallada
La presente divulgación proporciona métodos para detectar un ARN diana monocatenario. La presente divulgación proporciona un kit para detectar un ARN diana en una muestra. La expresión "ARN guía de C2c2" se usa en el presente documento indistintamente con "ARN guía de Cas13a" y, en algunos casos, un ARN guía se denomina crRNA (por ejemplo, "crRNA de Cas13a"); la expresión "proteína C2c2" (o "polipéptido C2c2") se usa en el presente documento indistintamente con "proteína Cas13a" (o "polipéptido Cas13a").
MÉTODOS DE DETECCIÓN DE ARN MONOCATENARIO
Se proporcionan métodos para detectar un ARN diana monocatenario en una muestra biológica que comprende una pluralidad de ARN, en donde los métodos incluyen (a) poner en contacto la muestra biológica con (i) un a Rn detector marcado; y (ii) una proteína C2c2 que escinde el ARN detector marcado; y (iii) un ARN guía de C2c2 que hibrida con el ARN diana monocatenario, en donde el gRNA se une a la proteína C2c2; y (b) medir una señal detectable producida por la escisión del ARN detector marcado. Una vez que una proteína C2c2 en cuestión se activa por un ARN guía de C2c2, lo cual ocurre cuando la muestra incluye un a Rn diana monocatenario con el que hibrida el ARN guía (es decir, la muestra incluye el ARN diana monocatenario objetivo), la proteína C2c2 se activa y funciona como una endorribonucleasa que escinde de forma no específica los ARN (incluidos los ARN no diana) presentes en la muestra. Por lo tanto, cuando el ARN diana monocatenario objetivo está presente en la muestra (por ejemplo, en algunos casos por encima de una cantidad umbral), el resultado es la escisión del ARN (incluido el ARN no diana) en la muestra, que se detecta utilizando cualquier método de detección conveniente capaz de medir una señal detectable producida por la escisión del ARN detector marcado. La etapa de contacto se lleva a cabo generalmente en una composición que comprende iones metálicos divalentes. La etapa de contacto se puede llevar a cabo en un entorno acelular, por ejemplo, fuera de una célula. La etapa de contacto se puede llevar a cabo dentro de una célula. La etapa de contacto se puede llevar a cabo en una célula in vitro. La etapa de contacto se puede llevar a cabo en una célula ex-vivo. En algunos casos, el ARN guía de C2c2 se proporciona como ARN; y la proteína C2c2 se proporciona como proteína per se. En algunos casos, el ARN guía de C2c2 se proporciona como ADN que codifica el a Rn guía; y la proteína C2c2 se proporciona como proteína per se. En algunos casos, el ARN guía de C2c2 se proporciona como ARN; y la proteína C2c2 se proporciona como ARN que codifica la proteína C2c2. En algunos casos, el ARN guía de C2c2 se proporciona como ADN que codifica el ARN guía; y la proteína C2c2 se proporciona como ARN que codifica la proteína C2c2. En algunos casos, el ARN guía de C2c2 se proporciona como ARN; y la proteína C2c2 se proporciona como ADN que comprende una secuencia de nucleótidos que codifica la proteína C2c2. En algunos casos, el ARN guía de C2c2 se proporciona como ADN que codifica el ARN guía; y la proteína C2c2 se proporciona como ADN que comprende una secuencia de nucleótidos que codifica la proteína C2c2. En algunos casos que no forman parte de la presente invención, un método de la presente divulgación proporciona la detección sustancialmente simultánea de dos ARN diana diferentes (un primer ARN diana monocatenario y un segundo ARN diana monocatenario) en una muestra.
En algunos casos que no forman parte de invención, se pueden proporcionar dos o más (por ejemplo, 3 o más, 4 o más, 5 o más o 6 o más) ARN guía de C2c2 mediante el uso de una matriz de ARN guía de C2c2 precursor, que puede escindirse por la proteína C2c2 en ARN guía individuales ("maduros"); siendo la escisión de un ARN guía de C2c2 precursor independiente de si la proteína C2c2 tiene dominios HEPN1 y/o HEPN2 intactos. Por lo tanto, también se desvelan, pero no forman parte de la invención, métodos para escindir una matriz de ARN guía de C2c2 precursor en dos o más ARN guía de C2c2. Por lo tanto, una matriz de ARN guía de C2c2 puede incluir más de una secuencia guía. En algunos casos divulgados pero que no forman parte de la invención, un ARN guía de C2c2 en cuestión puede incluir un mango de un crRNA precursor pero no necesariamente tiene que incluir múltiples secuencias guía. En algunos casos desvelados, pero que no forman parte de la invención, la proteína C2c2 carece de un dominio HEPN1 catalíticamente activo y/o carece de un dominio HEPN2 catalíticamente activo. La etapa de contacto se puede llevar a cabo en un entorno acelular, por ejemplo, fuera de una célula. La etapa de contacto se puede llevar a cabo dentro de una célula. La etapa de contacto se puede llevar a cabo en una célula in vitro. La etapa de contacto se puede llevar a cabo en una célula ex-vivo.
En algunos casos (p. ej., cuando se contacta con un ARN guía de C2c2 y una proteína C2c2, cuando se pone contacta con una matriz de ARN guía de C2c2 precursor y una proteína C2c2, y similares), la muestra contacta durante 2 horas o menos (por ejemplo, 1,5 horas o menos, 1 hora o menos, 40 minutos o menos, 30 minutos o menos, 20 minutos o menos, 10 minutos o menos, o 5 minutos o menos, o 1 minuto o menos) antes de la etapa de medición. Por ejemplo, en algunos casos, la muestra contacta durante 40 minutos o menos antes de la etapa de medición. En algunos casos, la muestra contacta durante 20 minutos o menos antes de la etapa de medición. En algunos casos, la muestra contacta durante 10 minutos o menos antes de la etapa de medición. En algunos casos, la muestra contacta durante 5 minutos o menos antes de la etapa de medición. En algunos casos, la muestra contacta durante 1 minuto o menos antes de la etapa de medición. En algunos casos, la muestra contacta durante un período de 50 segundos a 60 segundos antes de la etapa de medición. En algunos casos, la muestra contacta durante un período de 40 segundos a 50 segundos antes de la etapa de medición. En algunos casos, la muestra contacta durante un período de 30 segundos a 40 segundos antes de la etapa de medición. En algunos casos, la muestra contacta durante un período de 20 segundos a 30 segundos antes de la etapa de medición. En algunos casos, la muestra contacta durante un período de 10 segundos a 20 segundos antes de la etapa de medición.
Un método de la presente divulgación para detectar un ARN monocatenario (un ARN diana monocatenario) en una muestra que comprende una pluralidad de ARN (incluido el ARN diana monocatenario y una pluralidad de ARN no diana) puede detectar un ARN monocatenario ARN diana monocatenario con un alto grado de sensibilidad. En algunos casos, un método de la presente divulgación se puede utilizar para detectar un ARN diana monocatenario presente en una muestra que comprende una pluralidad de ARN (incluido el ARN diana monocatenario y una pluralidad de ARN no diana), donde el ARN diana monocatenario está presente en una o más copias por cada 107 ARN no diana (p. ej., una o más copias por 106 ARN no diana, una o más copias por cada 105 ARN no diana, una o más copias por cada 104 ARN no diana, una o más copias por cada 103 ARN no diana, una o más copias por cada 102 ARN no diana, una o más copias por cada 50 ARN no diana, una o más copias por cada 20 ARN no diana, una o más copias por cada 10 ARN no diana o una o más copias por cada 5 ARN no diana).
En algunos casos, un método de la presente divulgación puede detectar un ARN diana monocatenario presente en una muestra que comprende una pluralidad de ARN (incluido el ARN diana monocatenario y una pluralidad de ARN no diana), donde el ARN diana monocatenario está presente en una cantidad de una copia por cada 107 ARN no diana a una copia por cada 10 ARN no diana (p. ej., de 1 copia por cada 107 ARN no diana a 1 copia por cada 102 ARN no diana, de 1 copia por cada 107 ARN no diana a 1 copia por cada 103 ARN no diana, de 1 copia por cada 107 ARN no diana a 1 copia por cada 104 ARN no diana, de 1 copia por cada 107 ARN no diana a 1 copia por cada 105 ARN no diana, de 1 copia por cada 107 ARN no diana a 1 copia por cada 106 ARN no diana, de 1 copia por cada 106 ARN no diana a 1 copia por cada 10 ARN no diana, de 1 copia por cada 106 ARN no diana a 1 copia por cada 102 ARN no diana, de 1 copia por cada 106 ARN no diana a 1 copia por cada 103 ARN no diana, de 1 copia por cada 106 ARN no diana a 1 copia por cada 104 ARN no diana, de 1 copia por cada 106 ARN no diana a 1 copia por cada 105 ARN no diana, de 1 copia por cada 105 ARN no diana a 1 copia por cada 10 ARN no diana, de 1 copia por cada 105 ARN no diana a 1 copia por cada 102 ARN no diana, de 1 copia por cada 105 ARN no diana a 1 copia por cada 103 ARN no diana o de 1 copia por cada 105 ARN no diana a 1 copia por cada 104 ARN no diana).
En algunos casos, un método de la presente divulgación puede detectar un ARN diana monocatenario presente en una muestra que comprende una pluralidad de ARN (incluido el ARN diana monocatenario y una pluralidad de ARN no diana), donde el a Rn diana monocatenario está presente en una cantidad de una copia por cada 107 ARN no diana a una copia por cada 100 ARN no diana (p. ej., de 1 copia por cada 107 ARN no diana a 1 copia por cada 102 ARN no diana, de 1 copia por cada 107 ARN no diana a 1 copia por cada 103 ARN no diana, de 1 copia por cada 107 ARN no diana a 1 copia por cada 104 ARN no diana, de 1 copia por cada 107 ARN no diana a 1 copia por cada 105 ARN no diana, de 1 copia por cada 107 ARN no diana a 1 copia por cada 106 ARN no diana, de 1 copia por cada 106 ARN no diana a 1 copia por cada 100 ARN no diana, de 1 copia por cada 106 ARN no diana a 1 copia por cada 102 ARN no diana, de 1 copia por cada 106 ARN no diana a 1 copia por cada 103 ARN no diana, de 1 copia por cada 106 ARN no diana a 1 copia por cada 104 ARN no diana, de 1 copia por cada 106 ARN no diana a 1 copia por cada 105 ARN no diana, de 1 copia por cada 105 ARN no diana a 1 copia por cada 100 ARN no diana, de 1 copia por cada 105 ARN no diana a 1 copia por cada 102 ARN no diana, de 1 copia por cada 105 ARN no diana a 1 copia por cada 103 ARN no diana o de 1 copia por cada 105 ARN no diana a 1 copia por cada 104 ARN no diana).
En algunos casos, el umbral de detección, para un método en cuestión para detectar un ARN diana monocatenario en una muestra, es de 10 nM o menor. La expresión "umbral de detección" se utiliza en el presente documento para describir la cantidad mínima de ARN diana que debe estar presente en una muestra para que se produzca la detección. Por lo tanto, como ejemplo ilustrativo, cuando un umbral de detección es de 10 nM, se puede detectar una señal cuando un ARN diana está presente en la muestra a una concentración de 10 nM o mayor. En algunos casos, un método de la presente divulgación tiene un umbral de detección de 5 nM o menor. En algunos casos, un método de la presente divulgación tiene un umbral de detección de 1 nM o menor. En algunos casos, un método de la presente divulgación tiene un umbral de detección de 0,5 nM o menor. En algunos casos, un método de la presente divulgación tiene un umbral de detección de 0,1 nM o menor. En algunos casos, un método de la presente divulgación tiene un umbral de detección de 0,05 nM o menor. En algunos casos, un método de la presente divulgación tiene un umbral de detección de 0,01 nM o menor. En algunos casos, un método de la presente divulgación tiene un umbral de detección de 0,005 nM o menor. En algunos casos, un método de la presente divulgación tiene un umbral de detección de 0,001 nM o menor. En algunos casos, un método de la presente divulgación tiene un umbral de detección de 0,0005 nM o menor. En algunos casos, un método de la presente divulgación tiene un umbral de detección de 0,0001 nM o menor. En algunos casos, un método de la presente divulgación tiene un umbral de detección de 0,00005 nM o menor. En algunos casos, un método de la presente divulgación tiene un umbral de detección de 0,00001 nM o menor. En algunos casos, un método de la presente divulgación tiene un umbral de detección de 10 pM o menor. En algunos casos, un método de la presente divulgación tiene un umbral de detección de 1 pM o menor. En algunos casos, un método de la presente divulgación tiene un umbral de detección de 500 fM o menor. En algunos casos, un método de la presente divulgación tiene un umbral de detección de 250 fM o menor. En algunos casos, un método de la presente divulgación tiene un umbral de detección de 100 fM o menor. En algunos casos, un método de la presente divulgación tiene un umbral de detección de 50 fM o menor.
En algunos casos, el umbral de detección (para detectar el ARN diana monocatenario en un método en cuestión), está en un intervalo de 500 fM a 1 nM (por ejemplo, de 500 fM a 500 pM, de 500 fM a 200 pM, de 500 fM a 100 pM, de 500 fM a 10 pM, de 500 fM a 1 pM, de 800 fM a 1 nM, de 800 fM a 500 pM, de 800 fM a 200 pM, de 800 fM a 100 pM, de 800 fM a 10 pM, de 800 fM a 1 pM, de 1 pM a 1 nM, de 1 pM a 500 pM, de 1 pM a 200 pM, de 1 pM a 100 pM o de 1 pM a 10 pM) (donde la concentración se refiere a la concentración umbral de ARN diana a la que puede detectarse el ARN diana). En algunos casos, un método de la presente divulgación tiene un umbral de detección en un intervalo de 800 fM a 100 pM. En algunos casos, un método de la presente divulgación tiene un umbral de detección en un intervalo de 1 pM a 10 pM. En algunos casos, un método de la presente divulgación tiene un umbral de detección en un intervalo de 10 fM a 500 fM, por ejemplo, de 10 fM a 50 fM, de 50 fM a 100 fM, de 100 fM a 250 fM o de 250 fM a 500 fM.
En algunos casos, la concentración mínima a la que se puede detectar un ARN diana monocatenario en una muestra está en un intervalo de 500 fM a 1 nM (por ejemplo, de 500 fM a 500 pM, de 500 fM a 200 pM, de 500 fM a 100 pM, de 500 fM a 10 pM, de 500 fM a 1 pM, de 800 fM a 1 nM, de 800 fM a 500 pM, de 800 fM a 200 pM, de 800 fM a 100 pM, de 800 fM a 10 pM, de 800 fM a 1 pM, de 1 pM a 1 nM, de 1 pM a 500 pM, de 1 pM a 200 pM, de 1 pM a 100 pM o de 1 pM a 10 pM). En algunos casos, la concentración mínima a la que se puede detectar un ARN diana monocatenario en una muestra está en un intervalo de 800 fM a 100 pM. En algunos casos, la concentración mínima a la que se puede detectar un ARN diana monocatenario en una muestra está en un intervalo de 1 pM a 10 pM.
En algunos casos, un método de la presente divulgación puede detectar un ARN diana monocatenario presente en una muestra que comprende una pluralidad de ARN (incluido el ARN diana monocatenario y una pluralidad de ARN no diana), donde el a Rn diana monocatenario está presente en una concentración de tan solo 500 fM (por ejemplo, de tan solo 800 fM, de tan solo 1 pM, de tan solo 10 pM o de tan solo 100 pM). En algunos casos, un método de la presente divulgación puede detectar un ARN diana monocatenario presente en una muestra que comprende una pluralidad de ARN (incluido el ARN diana monocatenario y una pluralidad de ARN no diana), donde el ARN diana monocatenario está presente en una concentración de tan solo 1 pM.
En algunos casos, un método de la presente divulgación puede detectar un ARN diana monocatenario presente en una muestra que comprende una pluralidad de ARN (incluido el ARN diana monocatenario y una pluralidad de ARN no diana), donde el a Rn diana monocatenario está presente en una concentración de tan solo 500 fM (por ejemplo, de tan solo 800 fM, de tan solo 1 pM, de tan solo 10 pM o de tan solo 100 pM), y donde la muestra contacta durante 60 minutos o menos antes de la etapa de medición (por ejemplo, en algunos casos 40 minutos o menos). En algunos casos, un método de la presente divulgación puede detectar un ARN diana monocatenario presente en una muestra que comprende una pluralidad de ARN (incluido el ARN diana monocatenario y una pluralidad de ARN no diana), donde el ARN diana monocatenario está presente en una concentración de tal solo 1 pM, y donde la muestra contacta durante 60 minutos o menos antes de la etapa de medición (por ejemplo, en algunos casos, 40 minutos o menos).
Por ejemplo, en algunos casos, un método de la presente divulgación proporciona la detección de un ARN diana presente en una muestra a una concentración de 500 fM o mayor (por ejemplo, 800 fM o mayor, 1 pM o mayor, 5 pM o mayor, 10 pM o mayor). En algunos casos, un método de la presente divulgación proporciona la detección de un ARN diana presente en una muestra a una concentración de 1 pM o mayor (por ejemplo, 2 pM o mayor, 5 pM o mayor u 8 pM o mayor). En algunos casos, un método de la presente divulgación proporciona la detección de un ARN diana presente en una muestra a una concentración de 500 fM o mayor (por ejemplo, 1 pM o mayor, 5 pM o mayor, 10 pM o mayor), donde la muestra contacta durante 60 minutos o menos antes de la etapa de medición (por ejemplo, en algunos casos 40 minutos o menos). En algunos casos, un método de la presente divulgación proporciona la detección de un ARN diana presente en una muestra a una concentración de 1 pM o mayor (p. ej., 2 pM o mayor, 5 pM o mayor u 8 pM o mayor) cuando la muestra contacta durante 60 minutos o menos antes de la etapa de medición (por ejemplo, en algunos casos 40 minutos o menos).
En algunos casos, un método de la presente divulgación proporciona la detección de un ARN diana presente en una muestra a una concentración de 10 nM o menor. En algunos casos, un método de la presente divulgación proporciona la detección de un ARN diana presente en una muestra a una concentración de 5 nM o menor. En algunos casos, un método de la presente divulgación proporciona la detección de un ARN diana presente en una muestra a una concentración de 1 nM o menor. En algunos casos, un método de la presente divulgación proporciona la detección de un ARN diana presente en una muestra a una concentración de 0,5 nM o menor. En algunos casos, un método de la presente divulgación proporciona la detección de un ARN diana presente en una muestra a una concentración de 0,1 nM o menor. En algunos casos, un método de la presente divulgación proporciona la detección de un ARN diana presente en una muestra a una concentración de 0,05 nM o menor. En algunos casos, un método de la presente divulgación proporciona la detección de un ARN diana presente en una muestra a una concentración de 0,01 nM o menor. En algunos casos, un método de la presente divulgación proporciona la detección de un ARN diana presente en una muestra a una concentración de 0,005 nM o menor. En algunos casos, un método de la presente divulgación proporciona la detección de un ARN diana presente en una muestra a una concentración de 0,001 nM o menor. En algunos casos, un método de la presente divulgación proporciona la detección de un ARN diana presente en una muestra a una concentración de 0,0005 nM o menor. En algunos casos, un método de la presente divulgación proporciona la detección de un ARN diana presente en una muestra a una concentración de 0,0001 nM o menor. En algunos casos, un método de la presente divulgación proporciona la detección de un ARN diana presente en una muestra a una concentración de 0,00005 nM o menor. En algunos casos, un método de la presente divulgación proporciona la detección de un ARN diana presente en una muestra a una concentración de 0,00001 nM o menor.
En algunos casos, un método de la presente divulgación proporciona la detección de un ARN diana presente en una muestra a una concentración de 10-6 nM a 1 nM, por ejemplo, de 10-6 nM a 5 x 10-6 nM, de 5 x 10-6 nM a 10-5 nM, de 10-5 nM a 5 x 10-5 nM, de 5 x 10-5 nM a 10-4 nM, de 10-4 nM a 5 x 10-4 nM, de 5 x 10-4 nM a 10-3 nM, de 10-3 nM a 5 x 10-3 nM, de 5 x 10-3 nM a 10-2 nM, de 10-2 nM a 5 x 10-2 nM, de 5 x 10-2 nM a 0,1 nM, de 0,1 nM a 0,5 nM, de 0,5 nM a 1 nM, de 1 nM a 5 nM o de 5 nM a 10 nM.
En algunos casos, un método de la presente divulgación proporciona la detección de un ARN diana presente en una muestra a una concentración menor de 10 nM. En algunos casos, un método de la presente divulgación proporciona la detección de un ARN diana presente en una muestra a una concentración menor de 5 nM. En algunos casos, un método de la presente divulgación proporciona la detección de un ARN diana presente en una muestra a una concentración menor de 1 nM. En algunos casos, un método de la presente divulgación proporciona la detección de un ARN diana presente en una muestra a una concentración menor de 0,5 nM. En algunos casos, un método de la presente divulgación proporciona la detección de un ARN diana presente en una muestra a una concentración menor de 0,1 nM. En algunos casos, un método de la presente divulgación proporciona la detección de un ARN diana presente en una muestra a una concentración menor de 0,05 nM. En algunos casos, un método de la presente divulgación proporciona la detección de un ARN diana presente en una muestra a una concentración menor de 0,01 nM. En algunos casos, un método de la presente divulgación proporciona la detección de un ARN diana presente en una muestra a una concentración menor de 0,005 nM. En algunos casos, un método de la presente divulgación proporciona la detección de un ARN diana presente en una muestra a una concentración menor de 0,001 nM. En algunos casos, un método de la presente divulgación proporciona la detección de un ARN diana presente en una muestra a una concentración menor de 0,0005 nM. En algunos casos, un método de la presente divulgación proporciona la detección de un ARN diana presente en una muestra a una concentración menor de 0,0001 nM. En algunos casos, un método de la presente divulgación proporciona la detección de un ARN diana presente en una muestra a una concentración menor de 0,00005 nM. En algunos casos, un método de la presente divulgación proporciona la detección de un ARN diana presente en una muestra a una concentración menor de 0,00001 nM.
En algunos casos, se puede usar un método de la presente divulgación para determinar la cantidad de un ARN diana en una muestra (p. ej., una muestra que comprende el ARN diana y una pluralidad de ARN no diana). La determinación de la cantidad de un ARN diana en una muestra puede comprender la comparación de la cantidad de señal detectable generada en una muestra de ensayo con la cantidad de señal detectable generada en una muestra de referencia. La determinación de la cantidad de un ARN diana en una muestra puede comprender: la medición de la señal detectable para generar una medición de ensayo; la medición de una señal detectable producida por una muestra de referencia para generar una medición de referencia; y la comparación de la medición de ensayo con la medición de referencia para determinar una cantidad de ARN diana presente en la muestra.
Por ejemplo, en algunos casos, un método divulgado pero que no forma parte de la invención para determinar la cantidad de un ARN diana en una muestra comprende: a) poner en contacto la muestra (p. ej., una muestra que comprende el ARN diana y una pluralidad de ARN no diana) con: (i) un ARN guía de C2c2 que hibrida con el ARN diana monocatenario y (ii) una proteína C2c2 que escinde los ARN presentes en la muestra; b) medir una señal detectable producida por la escisión de ARN mediada por la proteína C2c2, generando una medición de ensayo; c) medir una señal detectable producida por una muestra de referencia para generar una medición de referencia; y d) comparar la medición de ensayo con la medición de referencia para determinar la cantidad de ARN diana presente en la muestra.
Como otro ejemplo, en algunos casos, un método divulgado pero que no forma parte de la invención para determinar la cantidad de un ARN diana en una muestra comprende: a) poner en contacto la muestra (p. ej., una muestra que comprende el ARN diana y una pluralidad de ARN no diana) con: i) una matriz de ARN guía de C2c2 precursor que comprende dos o más ARN guía de C2c2, cada uno de los cuales tiene una secuencia guía diferente; y (ii) una proteína C2c2 que escinde la matriz de ARN guía de C2c2 precursor en ARN guía de C2c2 individuales, y también escinde los ARN de la muestra; b) medir una señal detectable producida por la escisión de ARN mediada por la proteína C2c2, generando una medición de ensayo; c) medir una señal detectable producida por cada una de dos o más muestras de referencia para generar dos o más mediciones de referencia; y d) comparar la medición de ensayo con las mediciones de referencia para determinar la cantidad de ARN diana presente en la muestra.
Muestras
Una muestra en cuestión incluye una pluralidad de ARN diana. El término "pluralidad" se utiliza en el presente documento para referirse a dos o más. Por lo tanto, en algunos casos, una muestra incluye dos o más (p. ej., 3 o más, 5 o más, 10 o más, 20 o más, 50 o más, 100 o más, 500 o más, 1000 o más o 5000 o más) ARN. Un método en cuestión puede usarse como una forma muy sensible de detectar un ARN diana monocatenario presente en una mezcla compleja de ARN. Por lo tanto, en algunos casos, la muestra incluye 5 o más ARN (por ejemplo, 10 o más, 20 o más, 50 o más, 100 o más, 500 o más, 1000 o más o 5000 o más ARN) que difieren entre sí en la secuencia. En algunos casos, la muestra incluye 10 o más, 20 o más, 50 o más, 100 o más, 500 o más, 103 o más, 5 x 103 o más, 104 o más, 5 x 104 o más, 105 o más, 5 x 105 o más, 106 o más, 5 x 106 o más, o 107 o más, ARN que difieren entre sí en la secuencia. En algunos casos, la muestra comprende de 10 a 20, de 20 a 50, de 50 a 100, de 100 a 500, de 500 a 103, de 103 a 5 x 103, de 5 x 103 a 104, de 104 a 5 x 104, de 5 x 104 a 105, de 105 a 5 x 105, de 5 x 105 a 106, de 106 a 5 x 106 o de 5 x 106 a 107, o más de 107, ARN que difieren entre sí en la secuencia. En algunos casos, la muestra comprende de 5 a 107 ARN que difieren entre sí en la secuencia (p. ej., de 5 a 106, de 5 a 105, de 5 a 50.000, de 5 a 30.000, de 10 a 106, de 10 a 105, de 10 a 50.000, de 10 a 30.000, de 20 a 106, de 20 a 105, de 20 a 50.000, o de 20 a 30.000 ARN que difieren entre sí en la secuencia). En algunos casos, la muestra comprende de 5 a 50.000 ARN que difieren entre sí en la secuencia (por ejemplo, de 5 a 30.000, de 10 a 50.000 o de 10 a 30.000) ARN que difieren entre sí en la secuencia). En algunos casos, la muestra incluye 20 o más ARN que difieren entre sí en la secuencia. En algunos casos, la muestra incluye ARN de un lisado de células (p. ej., un lisado de células eucariotas, un lisado de células de mamífero, un lisado de células humanas, un lisado de células procariotas, un lisado de células vegetales, y similares). Por ejemplo, en algunos casos, la muestra incluye ARN expresados de una célula tal como una célula eucariota, por ejemplo, una célula de mamífero tal como una célula humana.
El término "muestra" se usa en el presente documento para referirse a cualquier muestra que incluye ARN monocatenario. La muestra puede derivar de cualquier fuente, por ejemplo, la muestra puede ser una combinación sintética de ARN purificados; la muestra pueden ser un lisado celular, un lisado celular enriquecido con ARN, o ARN aislados y/o purificados a partir de un lisado celular. La muestra puede ser de un paciente (p. ej., con fines de diagnóstico). La muestra puede ser de células permeabilizadas. La muestra puede ser de células reticuladas. La muestra puede estar en secciones de tejido. La muestra puede ser de tejidos preparados mediante entrecruzamiento seguido de deslipidación y ajuste para lograr un índice de refracción uniforme. Se han descrito ejemplos de preparación de tejido por entrecruzamiento seguido de deslipidación y ajuste para lograr un índice de refracción uniforme en, por ejemplo, Shah et al., Development (2016) 143, 2862-2867 doi: 10. 1242/dev. 138560.
Una "muestra" puede incluir un ARN diana monocatenario y una pluralidad de ARN no diana. En algunos casos, el ARN monocatenario diana está presente en la muestra en una copia por cada 10 ARN no diana, una copia por cada 20 ARN no diana, una copia por cada 25 ARN no diana, una copia por cada 50 ARN no diana, una copia por cada 100 ARN no diana, una copia por cada 500 ARN no diana, una copia por cada 103 ARN no diana, una copia por cada 5 x 103 ARN no diana, una copia por cada 104 ARN no diana, una copia por cada 5 x 104 ARN no diana, una copia por cada 105 ARN no diana, una copia por cada 5 x 105 ARN no diana, una copia por cada 106 ARN no diana, o menos de una copia por cada 106 ARN no diana. En algunos casos, el ARN monocatenario diana está presente en la muestra en una cantidad de una copia por 10 ARN no diana a 1 copia por 20 ARN no diana, de 1 copia por 20 ARN no diana a 1 copia por 50 ARN no diana, de 1 copia por 50 ARN no diana a 1 copia por 100 ARN no diana, de 1 copia por 100 ARN no diana a 1 copia por 500 ARN no diana, de 1 copia por 500 ARN no diana a 1 copia por 103 ARN no diana, de 1 copia por 103 ARN no diana a 1 copia por 5 x 103 ARN no diana, de 1 copia por 5 x 103 a Rn no diana a 1 copia por 104 A r N no diana, de 1 copia por cada 104 ARN no diana a 1 copia por cada 105 ARN no diana, de 1 copia por 105 ARN no diana a 1 copia por 106 ARN no diana, o de 1 copia por 106 ARN no diana a 1 copia por 107 ARN no diana.
Las muestras adecuadas incluyen, entre otras, muestras de sangre, suero, plasma, orina, aspirados y biopsia. Por lo tanto, el término "muestra" con respecto a un paciente abarca sangre y otras muestras líquidas de origen biológico, muestras de tejido sólido, tal como una muestra de biopsia o cultivos de tejido o células derivadas de los mismos, y la descendencia de los mismos. La definición también incluye muestras que hayan sido manipuladas de alguna manera después de su obtención, tal como mediante tratamiento con reactivos; lavado; o enriquecimiento en ciertas poblaciones celulares, tales como células cancerosas. La definición también incluye muestras que se han enriquecido en tipos particulares de moléculas, por ejemplo, ARN. El término "muestra" abarca muestras biológicas, tales como una muestra clínica tal como sangre, plasma, suero, aspirado, líquido cefalorraquídeo (LCR), y también incluye tejido obtenido por resección quirúrgica, tejido obtenido por biopsia, células en cultivo, sobrenadantes celulares, lisados celulares, muestras de tejido, órganos, médula ósea y similares. Una "muestra biológica" incluye fluidos biológicos derivados de la misma (p. ej., células cancerosas, células infectadas, etc.), por ejemplo, una muestra que comprende ARN que se obtiene a partir de dichas células (por ejemplo, un lisado celular u otro extracto celular que comprende ARN).
Una muestra puede comprender, o puede obtenerse a partir de, cualquiera de diversas células, tejidos, órganos o fluidos acelulares. Las fuentes de muestras adecuadas incluyen células eucariotas, células bacterianas y células de arqueas. Las fuentes de muestras adecuadas incluyen organismos unicelulares y organismos multicelulares. Las fuentes de muestras adecuadas incluyen organismos eucariotas unicelulares; una planta o una célula vegetal; una célula de alga, por ejemplo, Botryococcus braunii, Chlamydomonas reinhardtii, Nannochloropsis gaditana, Chlorellapyrenoidosa, Sargassumpatens, C. agardh y similares; una célula fúngica (p. ej., una célula de levadura); una célula tejido u órgano de un animal; una célula, tejido u órgano de un animal invertebrado (por ejemplo, mosca de la fruta, cnidario, equinodermo, nematodo, un insecto, un arácnido, etc.); una célula, tejido, líquido u órgano de un animal vertebrado (p. ej., pez, anfibio, reptil, ave, mamífero); una célula, tejido, líquido u órgano de un mamífero (p. ej., un ser humano; un primate no humano; un ungulado; un félido; un bóvido; un óvido; un cáprido; etc.). Las fuentes de muestras adecuadas incluyen nematodos, protozoos y similares. Las fuentes de muestras adecuadas incluyen parásitos tales como helmintos, parásitos maláricos, etc.
Las fuentes de muestra adecuadas incluyen una célula, tejido u organismo de cualquiera de los seis reinos, por ejemplo, Bacteria (p. ej., Eubacteria); Arqueobacteria; Protista; Fungi; Plantae; y Animalia. Las fuentes de muestra adecuadas incluyen miembros similares a plantas del reino Protista, entre los que se incluyen, pero sin limitación, algas (p. ej., algas verdes, algas rojas, glaucofitas, cianobacterias); miembros similares a hongos del reino Protista, por ejemplo, mixomicetos, oomicetos, etc.; miembros similares a animales del reino Protista, por ejemplo, flagelados (p. ej., Euglena), ameboides (p. ej., ameba), esporozoos (p. ej., apicomplejos, mixozoos, microsporidios) y ciliados (p. ej., paramecio). Las fuentes de muestra adecuadas incluyen miembros del reino Fungi, entre los que se incluyen, pero sin limitación, miembros de cualquiera de los filos: Basidiomycota (hongos de club; por ejemplo, miembros de Agaricus, Amanita, Boletus, Cantherellus, etc.); Ascomycota (hongos de saco, entre los que se incluyen, p. ej., Saccharomyces); Mycophycophyta (líquenes); Zygomycota (hongos de conjugación); y Deuteromycota. Las fuentes de muestra adecuadas incluyen miembros del reino Plantae, entre los que se incluyen, pero sin limitación, miembros de cualquiera de las siguientes divisiones: Bryophyta (por ejemplo, musgos), Anthocerotophyta (p. ej., antocerotes), Hepaticophyta (por ejemplo, hepáticas), Lycophyta (por ejemplo, musgos de club), Sphenophyta (por ejemplo, colas de caballo), Psilophyta (por ejemplo, psilotum), Ophioglossophyta, Pterophyta (por ejemplo, helechos), Cycadophyta, Gingkophyta, Pinofita, Gnetophyta y Magnoliophyta (por ejemplo, plantas con flores). Las fuentes de muestra adecuadas incluyen miembros del reino Animalia, entre los que se incluyen, pero sin limitación, miembros de cualquiera de los siguientes filos: Porifera (esponjas); Placozoa; Orthonectida (parásitos de invertebrados marinos); Rhombozoa; Cnidaria (corales, anémonas, medusas, plumas de mar, pensamientos de mar, avispas de mar); Ctenophora (medusas peine); Platyhelminthes (gusanos planos); Nemertina (gusanos cinta); Ngathostomulida (gusanos de mandíbula) y Gastrotricha; Rotifera; Priapulida; Kinorhyncha; Loricifera; Acanthocephala; Entoprocta; Nemotoda; Nematomorpha; Cycliophora; Mollusca (moluscos); Sipuncula (gusanos cacahuete); Annelida (gusanos segmentados); Tardigrada (osos de agua); Onychophora (gusanos de terciopelo); Arthropoda (incluidos los subfilos: Chelicerata, Myriapoda, Hexapoda y Crustacea, donde los Chelicerata incluyen, por ejemplo, arácnidos, Merostomata y Pycnogonida, donde los Myriapoda incluyen, por ejemplo, Chilopoda (cienpiés), Diplopoda (milpiés), Paropoda y Symphyla, donde los Hexapoda incluyen insectos y donde los Crustacea incluyen gambas, krill, percebe, etc.; Phoronida; Ectoprocta (animales musgo); Brachiopoda; Echinodermata (p. ej., estrella de mar, margaritas de mar, estrellas de plumas, erizos de mar, pepinos de mar, estrellas quebradizas, estrellas cesta, etc.); Chaetognatha (gusanos flecha); Hemichordata (gusanos bellota); y Chordata. Los miembros adecuados de Chordata incluyen cualquier miembro de los siguientes subfilos: Urochordata (chorros de mar; incluyendo Ascidiacea, Thaliacea y Larvacea); Cephalochordata (peces lanceta); Myxini (pez mixino); y Vertebrata, donde los miembros de Vertebrata incluyen, por ejemplo, miembros de Petromyzontida (lampreas), Chondrichthyces (peces cartilaginosos), Actinopterygii (pez con aletas radiadas), Actinista (celocantos), Dipnoi (pez pulmonado), Reptilia (reptiles, por ejemplo, serpientes, caimanes, cocodrilos, lagartos, etc.), Aves (pájaros); y Mammalian (mamíferos). Las plantas adecuadas incluyen cualquier monocotiledónea y cualquier dicotiledónea.
Las fuentes adecuadas de una muestra incluyen células, fluidos, tejidos u órganos extraídos de un organismo; de una célula particular o grupo de células aisladas de un organismo; etc. Por ejemplo, cuando el organismo es una planta, las fuentes adecuadas incluyen el xilema, el floema, la capa de cambium, hojas, raíces, etc. Cuando el organismo es un animal, las fuentes adecuadas incluyen tejidos particulares (p. ej., pulmón, hígado, corazón, riñón, cerebro, bazo, piel, tejido fetal, etc.), o un tipo de célula particular (p. ej., células neuronales, células epiteliales, células endoteliales, astrocitos, macrófagos, células gliales, células de islotes, linfocitos T, linfocitos B, etc.). En algunos casos, la fuente de la muestra es una célula enferma, fluido, tejido u órgano. En algunos casos, la fuente de la muestra es una célula normal (no enferma), fluido, tejido u órgano. En algunos casos, la fuente de la muestra es una célula, tejido u órgano infectado por un patógeno. Los patógenos incluyen virus, hongos, helmintos, protozoos, parásitos maláricos, parásitos del género Plasmodium, parásitos de género Toxoplasma, parásitos del género Schistosoma, y similares. Los "helmintos" incluyen gusanos redondos, gusanos del corazón y nematodos fitófagos (Nematoda), trematodos (Tematoda), Acanthocephala y tenias (Cestoda). Las infecciones por protozoos incluyen infecciones por Giardia spp., Trichomonas spp., tripanosomiasis africana, disentería amebiana, babesiosis, disentería balantidiana, enfermedad de Chagas, coccidiosis, malaria y toxoplasmosis. Los ejemplos de patógenos tales como patógenos parásitos/protozoarios incluyen, pero sin limitación: Plasmodium falciparum, Plasmodium vivax, Tripanosoma cruzi y Toxoplasma gondii. Los patógenos fúngicos incluyen, pero sin limitación: Cryptococcus neoformans, Histoplasma capsulatum, Coccidioides immitis, Blastomyces dermatitidis, Chlamydia trachomatis y Candida albicans. Los virus patógenos incluyen, por ejemplo, virus de la inmunodeficiencia (p. ej., VIH); virus de la gripe; dengue; virus del Nilo Occidental; virus del herpes; virus de la fiebre amarilla; virus de la hepatitis C; virus de la hepatitis A; Virus B de la hepatitis B; virus del papiloma; y similares. Los patógenos incluyen, por ejemplo, virus VIH, Mycobacterium tuberculosis, Streptococcus agalactiae, Staphylococcus aureus resistente a meticilina, Legionella pneumophila, Streptococcus pyogenes, Escherichia coli, Neisseria gonorrhoeae, Neisseria meningitidis, neumococo, Cryptococcus neoformans, Histoplasma capsulatum, Hemophilus influenzae B, Treponema pallidum, espiroquetas de la enfermedad de Lyme, Pseudomonas aeruginosa, Mycobacterium leprae, Brucella abortus, virus de la rabia, virus de la gripe, citomegalovirus, virus del herpes simple de tipo I, virus del herpes simple de tipo II, virus de tipo parvo del suero humano, virus respiratorio sincitial, virus de la varicela-zóster, virus de la hepatitis B, virus de la hepatitis C, virus del sarampión, adenovirus, virus de la leucemia de linfocitos T humanos, virus de Epstein-Barr, virus de la leucemia murina, virus de las paperas, virus de la estomatitis vesicular, virus Sindbis, virus de la coriomeningitis linfocítica, virus de las verrugas, virus de la lengua azul, virus Sendai, virus de la leucemia felina, reovirus, virus de la polio, virus de simio 40, virus de tumor mamario de ratón, virus del dengue, virus de la rubéola, virus del Nilo Occidental, Plasmodium falciparum, Plasmodium vivax, Toxoplasma gondii, Trypanosoma rangeli, Trypanosoma cruzi, Trypanosoma rhodesiense, Trypanosoma brucei, Schistosoma mansoni, Schistosoma japonicum, Babesia bovis, Eimeria tenella, Onchocerca volvulus, Leishmania trópica, Mycobacterium tuberculosis, Trichinella spiralis, Theileria parva, Taenia hydatigena, Taenia ovis, Taenia saginata, Echinococcus granulosus, Mesocestoides corti, Mycoplasma arthritidis, M. hyorhinis, M. orale, M. arginini, Acholeplasma laidlawii, M. salivarium y M. pneumoniae.
ARN diana
Un ARN diana puede ser cualquier ARN monocatenario (ssRNA). Los ejemplos incluyen, pero sin limitación, mRNA, rRNA, tRNA, a Rn no codificante (ncRNA), ARN largo no codificante (lncRNA) y microARN (miRNA). En algunos casos, el ssRNA diana es mRNA. En algunos casos, el ácido nucleico diana monocatenario es ssRNA de un virus (p. ej., virus de Zika, virus de la inmunodeficiencia humana, virus de la gripe, y similares). En algunos casos, el ácido nucleico diana monocatenario es ssRNA de un parásito. En algunos casos, el ácido nucleico diana monocatenario es ssRNA de una bacteria, por ejemplo, una bacteria patógena. La fuente del ARN diana puede ser la misma que la fuente de la muestra de ARN, como se ha descrito anteriormente.
Medición de una señal detectable
El método expuesto en las reivindicaciones incluye una etapa de medición de una señal detectable producida por la escisión mediada por la proteína C2c2 de un ARN detector marcado. Otros métodos de detección descritos en el presente documento no forman parte de la invención. Como una proteína C2c2 escinde el ARN no diana una vez activada, lo cual ocurre cuando un ARN guía de C2c2 hibrida con un ARN diana en presencia de una proteína C2c2, una señal detectable puede ser cualquier señal que se produzca cuando se escinde el ARN. Por ejemplo, en algunos casos, la etapa de medición puede incluir una o más de: detección basada en nanopartículas de oro (p. ej., véase Xu et al., Angew Chem Int Ed Engl. 2007;46(19):3468-70; y Xia et. al., Proc Natl Acad Sci USA. 15 de junio de 2010;107(24):10837-41), polarización de fluorescencia, transición/dispersión de fase coloidal (p. ej., Baksh et. al., Nature. 8 de enero de 2004;427(6970):139-41), detección electroquímica, detección basada en semiconductores (p. ej., Rothberg et. al., Nature. 20 de julio de 2011;475(7356):348-52; por ejemplo, se podría usar una fosfatasa para generar un cambio de pH después de las reacciones de escisión del a Rn , mediante la apertura de 2'-3' fosfatos cíclicos y la liberación de fosfato inorgánico en la solución) y detección de un ARN detector marcado (véanse más detalles más adelante). La lectura de estos métodos de detección puede ser cualquier lectura conveniente. Los ejemplos de posibles lecturas incluyen, pero sin limitación: una cantidad medida de señal fluorescente detectable; un análisis visual de bandas en un gel (p. ej., bandas que representan el producto escindido frente al sustrato no escindido), una detección visual o basada en sensores de la presencia o ausencia de un color (es decir, método de detección de color), y la presencia o ausencia de (o una cantidad particular de) una señal eléctrica.
En algunos casos, la medición puede ser cuantitativa, por ejemplo, en el sentido de que la cantidad de señal detectada puede usarse para determinar la cantidad de ARN diana presente en la muestra. En algunos casos, la medición puede ser cualitativa, por ejemplo, en el sentido de que la presencia o ausencia de señal detectable puede indicar la presencia o ausencia de ARN diana. En algunos casos, no estará presente una señal detectable (p. ej., por encima de un nivel umbral dado) a menos que los ARN diana estén presentes por encima de una concentración umbral particular (p. ej., véase la Fig. 5). En algunos casos, el umbral de detección se puede ajustar modificando la cantidad de proteína C2c2, ARN guía, volumen de muestra y/o ARN detector (si se utiliza uno). De este modo, por ejemplo, como comprendería un experto habitual en la materia, si se desea, se pueden utilizar varios controles para configurar una o más reacciones, cada uno configurado para detectar un nivel umbral diferente de ARN diana y, por lo tanto, dicha serie de reacciones podría usarse para determinar la cantidad de ARN diana presente en una muestra (por ejemplo, se podría usar una serie de reacciones para determinar que un ARN diana está presente en la muestra "a una concentración de al menos X").
ARN detector marcado
El método expuesto en las reivindicaciones incluye poner en contacto una muestra biológica con: i) un ARN detector marcado; ii) una proteína C2c2; y iii) un ARN guía de C2c2 (o matriz de ARN guía de C2c2 precursor). Por ejemplo, en algunos casos, un método en cuestión incluye poner en contacto la muestra biológica con un ARN detector marcado que comprende un par de colorantes emisores de fluorescencia; la proteína C2c2 escinde el ARN detector marcado después de activarse (uniéndose al ARN guía de C2c2 en el contexto de la hibridación del ARN guía con un ARN diana); y la señal detectable que se mide se produce por el par de colorantes emisores de fluorescencia. Por ejemplo, en algunos casos, un método en cuestión incluye poner en contacto la muestra biológica con un ARN detector marcado que comprende un par de transferencia de energía por resonancia de fluorescencia (FRET) o un par inactivador/flúor, o ambos. En algunos casos, un método en cuestión incluye poner en contacto la muestra biológica con un ARN detector marcado que comprende un par FRET. En algunos casos, un método en cuestión incluye poner en contacto la muestra biológica con un ARN detector marcado que comprende un par inactivador/flúor. Los pares de colorantes emisores de fluorescencia comprenden un par FRET o un par inactivador/flúor. Tanto en el caso del par FRET como en el caso del inactivador/fluor, el espectro de emisión de uno de los colorantes solapa con una región del espectro de absorción del otro colorante del par. Como se usa en el presente documento, la expresión "par de colorantes emisores de fluorescencia" es un término genérico utilizado para abarcar tanto un "par de transferencia de energía de resonancia de fluorescencia (FRET)" como un "par inactivador/flúor", ambas expresiones se analizan con más detalle a continuación. La expresión "par de colorantes emisores de fluorescencia" se usa indistintamente con la frase "un par FRET y/o un par inactivador/flúor".
En algunos casos (p. ej., cuando el ARN detector incluye un par FRET), el ARN detector marcado produce una cantidad de señal detectable antes de escindirse, y la cantidad de señal detectable que se mide se reduce cuando se escinde el ARN detector marcado. En algunos casos, el ARN detector marcado produce una primera señal detectable antes de escindirse (p. ej., de un par FRET) y una segunda señal detectable cuando se escinde el ARN detector marcado (p. ej., de un par inactivador/flúor). De este modo, en algunos casos, el ARN detector marcado comprende un par FRET y un par inactivador/fluor.
En algunos casos, el ARN detector marcado comprende un par FRET. FRET es un proceso mediante el cual se produce una transferencia de energía sin radiación desde un fluoróforo en estado excitado a un segundo cromóforo en las proximidades. El intervalo en el que puede tener lugar la transferencia de energía está limitado a aproximadamente 10 nanómetros (100 angstroms), y la eficacia de la transferencia es extremadamente sensible a la distancia de separación entre los fluoróforos. Por lo tanto, como se usa en el presente documento, el término "FRET" ("transferencia de energía de resonancia de fluorescencia"); también conocida como "transferencia de energía de resonancia de Forster") se refiere a un fenómeno físico en el que están implicados un fluoróforo donante y un fluoróforo aceptor correspondiente seleccionados de modo que el espectro de emisión del donante solape con el espectro de excitación del aceptor, y además seleccionados de modo que cuando el donante y el aceptor están muy cerca (generalmente a l0 nm o menos) entre sí, la excitación del donante provoque la excitación del aceptor y la emisión desde el mismo, ya que parte de la energía pasa del donante al aceptor a través de un efecto de acoplamiento cuántico. Por lo tanto, una señal FRET sirve como indicador de proximidad del donante y el aceptor; solo cuando están muy cerca entre sí se genera una señal. El resto donante de FRET (p. ej., fluoróforo donante) y el resto aceptor de FRET (p. ej., fluoróforo aceptor) se denominan colectivamente en el presente documento "par FRET".
El par donante-aceptor (un resto donante FRET y un resto aceptor FRET) se denomina en el presente documento "par FRET" o "par FRET de señal". Por lo tanto, en algunos casos, un ARN detector marcado en cuestión incluye dos compañeros de señal (un par de señal), siendo un compañero de señal un resto donante FRET y siendo el otro compañero de señal un resto aceptor FRET. Un ARN detector marcado en cuestión que incluye dicho par FRET (un resto donante FRET y un resto aceptor FRET) presentará, por lo tanto, una señal detectable (una señal de FRET) cuando los compañeros de señal estén muy cerca (p. ej., mientras están en la misma molécula de ARN), pero la señal se reducirá (o desaparecerá) cuando los compañeros estén separados (p. ej., después de la escisión de la molécula de ARN por una proteína C2c2).
Los restos donante y aceptor de FRET (pares FRET) serán conocidos por un experto normal en la materia y se puede utilizar cualquier par FRET conveniente (por ejemplo, cualquier par de restos de donante y aceptor conveniente). Los ejemplos de pares FRET adecuados incluyen, entre otros, los presentados en la Tabla 1. Véase también: Bajar et al. Sensors (Basilea). 14 de septiembre de 2016;16(9); y Abraham et al. PLoS One. 3 de agosto de 2015;10(8):e0134436.
T l 1 E m l r FRET r n n r FRET
Figure imgf000017_0001
Como se expone en las reivindicaciones, se produce una señal detectable cuando se escinde el ARN detector marcado (p. ej., en algunos casos, el ARN detector marcado comprende un par inactivador/flúor. Un compañero de señal de un par de inactivación de señal produce una señal detectable y el otro compañero de señal es un resto inactivador que inactiva la señal detectable del primer compañero de señal (es decir, el resto inactivador inactiva la señal del resto de señal de tal manera que la señal del resto de señal se reduce (inactiva) cuando los compañeros de señal están cerca entre sí, por ejemplo, cuando los compañeros de señal del par de señal están muy cerca).
Por ejemplo, en algunos casos, una cantidad de señal detectable aumenta cuando se escinde el ARN detector marcado. Por ejemplo, en algunos casos, la señal presentada por un compañero de señal (un resto de señal) se inactiva por el otro compañero de señal (un resto de señal inactivador), por ejemplo, cuando ambos están presentes en la misma molécula de ARN antes de la escisión por una proteína C2c2. Dicho par de señal se denomina en el presente documento "par inactivador/fluor", "par de inactivación" o "par de inactivación de señal". Por ejemplo, en algunos casos, un compañero de señal (p. ej., el primer compañero de señal) es un resto de señal que produce una señal detectable que se inactiva por el segundo compañero de señal (p. ej., un resto inactivador). Los compañeros de señal de un par inactivador/flúor producirán, por lo tanto, una señal detectable cuando los compañeros estén separados (p. ej., después de la escisión del ARN detector por una proteína C2c2), pero la señal se inactivará cuando los compañeros estén muy cerca (por ejemplo, antes de la escisión del ARN detector por una proteína C2c2).
Un resto inactivador puede inactivar una señal del resto de señal (p. ej., antes de la escisión del ARN detector por una proteína C2c2) en diversos grados. En algunos casos, un resto inactivador inactiva la señal del resto de señal donde la señal detectada en presencia del resto inactivador (cuando los compañeros de señal están cerca entre sí) es el 95 % o menos de la señal detectada en ausencia del resto inactivador (cuando los compañeros de señal están separados). Por ejemplo, en algunos casos, la señal detectada en presencia del resto inactivador puede ser del 90 % o menos, 80 % o menos, 70 % o menos, 60 % o menos, 50 % o menos, 40 % o menos, 30 % o menos, 20 % o menos, 15 % o menos, 10 % o menos o 5 % o menos de la señal detectada en ausencia del resto inactivador. En algunos casos, no se detecta ninguna señal (p. ej., por encima del nivel de referencia) en presencia del resto inactivador.
En algunos casos, la señal detectada en ausencia del resto inactivador (cuando los compañeros de señal están separados) es al menos 1,2 veces mayor (por ejemplo, al menos 1,3 veces, al menos 1,5 veces, al menos 1,7 veces, al menos 2 veces, al menos 2,5 veces, al menos 3 veces, al menos 3,5 veces, al menos 4 veces, al menos 5 veces, al menos 7 veces, al menos 10 veces, al menos 20 veces o al menos 50 veces mayor) que la señal detectada en presencia del resto inactivador (cuando los compañeros de señal están próximos entre sí).
En algunos casos, el resto de señal es un marcador fluorescente. En algunos de tales casos, el resto inactivador inactiva la señal (la señal de luz) del marcador fluorescente (p. ej., absorbiendo energía en los espectros de emisión del marcador). Por lo tanto, cuando el resto inactivador no está cerca del resto señal, la emisión (la señal) del marcador fluorescente es detectable porque la señal no se ha absorbido por el resto inactivador. Puede usarse cualquier par aceptor donante conveniente (par de resto señal/resto inactivador) y en la técnica se conocen muchos pares adecuados.
En algunos casos, el resto inactivador absorbe energía del resto de señal (también denominado en el presente documento "marcador detectable") y entonces emite una señal (por ejemplo, luz a una longitud de onda diferente). Por lo tanto, en algunos casos, el resto inactivador es en sí mismo un resto señal (p. ej., un resto señal puede ser 6-carboxifluoresceína mientras que el resto inactivador puede ser 6-carboxitetrametilrodamina) y, en algunos de estos casos, el par también podría ser un par FRET. En algunos casos, un resto inactivador es un inactivador oscuro. Un inactivador oscuro puede absorber energía de excitación y disipar la energía de una manera diferente (por ejemplo, en forma de calor). Por lo tanto, un inactivador oscuro tiene una fluorescencia propia mínima o nula (no emite fluorescencia). Se describen ejemplos de inactivadores oscuros con más detalle en las patentes de Estados Unidos números 8.822.673 y 8.586.718; en las publicaciones de patentes de Estados Unidos 20140378330, 20140349295 y 20140194611; y en las solicitudes de patentes internacionales: WO200142505 y WO200186001.
Los ejemplos de marcadores fluorescentes incluyen, pero sin limitación: un colorante Alexa Fluor®, un colorante ATTO (p. ej., ATTO 390, ATTO 425, ATTO 465, ATTO 488, ATTO 495, ATTO 514, ATTO 520, ATTO 532, ATTO Rho6G, ATTO 542, ATTO 550, ATTO 565, ATTO Rho3B, ATTO Rho11, ATTO Rho12, ATTO Thio12, ATTO Rho101, ATTO 590, ATTO 594, ATTO Rho13, ATTO 610, ATTO 620, ATTO Rho14, ATTO 633, ATTO 647, ATTO 647N, ATTO 655, ATTO Oxa12, ATTO 665, ATTO 680, ATTO 700, ATTO 725, ATTO 740), un colorante DyLight, un colorante de cianina (p. ej., Cy2, Cy3, Cy3.5, Cy3b, Cy5, Cy5.5, Cy7, Cy7.5), un colorante FluoProbes, un colorante Sulfo Cy, un colorante Seta, un colorante IRIS, un colorante SeTau, un colorante SRfluor, un colorante Square, isotiocianato de fluoresceína (FITC), tetrametilrodamina (TRITC), Rojo Texas, Oregon Green, Pacific Blue, Pacific Green, Pacific Orange, puntos cuánticos y una proteína fluorescente unida.
En algunos casos, un marcador detectable es un marcador fluorescente seleccionado de: un colorante Alexa Fluor®, un colorante ATTO (p. ej., ATTO 390, ATTO 425, ATTO 465, ATTO 488, ATTO 495, ATTO 514, ATTO 520, ATTO 532, ATTO Rho6G, ATTO 542, ATTO 550, ATTO 565, ATTO Rho3B, ATTO Rho11, ATTO Rho12, ATTO Thio12, ATTO Rho101, ATTO 590, ATTO 594, ATTO Rho13, ATTO 610, ATTO 620, ATTO Rho14, ATTO 633, ATTO 647, ATTO 647N, ATTO 655, ATTO Oxa12, ATTO 665, ATTO 680, ATTO 700, ATTO 725, ATTO 740), un colorante DyLight, un colorante de cianina (p. ej., Cy2, Cy3, Cy3.5, Cy3b, Cy5, Cy5.5, Cy7, Cy7.5), un colorante FluoProbes, un colorante Sulfo Cy, un colorante Seta, un colorante IRIS, un colorante SeTau, un colorante SRfluor, un colorante Square, fluoresceína (FITC), tetrametilrodamina (TRITC), Rojo Texas, Oregon Green, Pacific Blue, Pacific Green y Pacific Orange.
En algunos casos, un marcador detectable es un marcador fluorescente seleccionado de: un colorante Alexa Fluor®, un colorante ATTO (p. ej., ATTO 390, ATTO 425, ATTO 465, ATTO 488, ATTO 495, ATTO 514, ATTO 520, ATTO 532, ATTO Rho6G, ATTO 542, ATTO 550, ATTO 565, ATTO Rho3B, ATTO Rho11, ATTO Rho12, ATTO Thio12, ATTO Rho101, ATTO 590, ATTO 594, ATTO Rho13, ATTO 610, ATTO 620, ATTO Rho14, ATTO 633, ATTO 647, ATTO 647N, ATTO 655, ATTO Oxa12, ATTO 665, ATTO 680, ATTO 700, ATTO 725, ATTO 740), un colorante DyLight, un colorante de cianina (p. ej., Cy2, Cy3, Cy3.5, Cy3b, Cy5, Cy5.5, Cy7, Cy7.5), un colorante FluoProbes, un colorante Sulfo Cy, un colorante Seta, un colorante IRIS, un colorante SeTau, un colorante SRfluor, un colorante Square, fluoresceína (FITC), tetrametilrodamina (TRITC), Rojo Texas, Oregon Green, Pacific Blue, Pacific Green, Pacific Orange, un punto cuántico y una proteína fluorescente unida.
Los ejemplos de colorantes ATTO incluyen, pero sin limitación: ATTO 390, ATTO 425, ATTO 465, ATTO 488, ATTO 495, ATTO 514, ATTO 520, ATTO 532, ATTO Rho6G, ATTO 542, ATTO 550, ATTO 565, ATTO Rho3B, ATTO Rho11, ATTO Rho12, ATTO Thio12, ATTO Rho101, ATTO 590, ATTO 594, ATTO Rho13, ATTO 610, ATTO 620, ATTO Rho14, ATTO 633, ATTO 647, ATTO 647N, ATTO 655, ATTO Oxa12, ATTO 665, ATTO 680, ATTO 700, ATTO 725 y ATTO 740.
Los ejemplos de colorantes AlexaFluor incluyen, pero sin limitación: Alexa Fluor® 350, Alexa Fluor® 405, Alexa Fluor® 430, Alexa Fluor® 488, Alexa Fluor® 500, Alexa Fluor® 514, Alexa Fluor® 532, Alexa Fluor® 546, Alexa Fluor® 555, Alexa Fluor® 568, Alexa Fluor® 594, Alexa Fluor® 610, Alexa Fluor® 633, Alexa Fluor® 635, Alexa Fluor® 647, Alexa Fluor® 660, Alexa Fluor® 680, Alexa Fluor® 700, Alexa Fluor® 750, Alexa Fluor® 790 y similares.
Los ejemplos de restos inactivadores incluyen, pero sin limitación: un inactivador oscuro, un Black Hole Quencher® (BHQ®) (p. ej., BHQ-0, BHQ-1, BHQ-2, BHQ-3), un inactivador Qxl, un inactivador ATTO (p. ej., ATTO 540Q, ATTO 580Q y At t O 612Q), ácido dimetilaminoazobencenosulfónico (Dabsyl), Iowa Black RQ, Iowa Black FQ, IRDye QC-1, un tinte QSY (p. ej., QSY 7, QSY 9, QSY 21), AbsoluteQuencher, Eclipse y agrupamientos metálicos tales como nanopartículas de oro y similares.
En algunos casos, un resto inactivador se selecciona de: un inactivador oscuro, un Black Hole Quencher® (BHQ®) (p. ej., BHQ-0, BHQ-1, BHQ-2, BHQ-3), un inactivador Qxl, un inactivador ATTO (p. ej., ATTO 540Q, ATTO 580Q y a TTo 612Q), ácido dimetilaminoazobencenosulfónico (Dabsyl), Iowa Black RQ, Iowa Black FQ, IRDye QC-1, un tinte QSY (p. ej., QSY 7, QSY 9, QSY 21), AbsoluteQuencher, Eclipse y un agrupamiento metálico.
Los ejemplos de un inactivador ATTO incluyen, pero sin limitación: ATTO 540Q, ATTO 580Q y ATTO 612Q. Los ejemplos de un Black Hole Quencher® (BHQ®) incluyen, pero sin limitación: BHQ-0 (493 nm), Bh Q-1 (534 nm), BHQ-2 (579 nm) y BHQ-3 (672 nm).
Si se desean ejemplos de algunos marcadores detectables (p. ej., tintes fluorescentes) y/o restos inactivadores, véase, por ejemplo, Bao et al., Annu Rev Biomed Eng. 2009;11:25-47; así como las patentes de Estados Unidos número 8.822.673 y 8.586.718; las publicaciones de patentes de Estados Unidos 20140378330, 20140349295, 20140194611, 20130323851, 20130224871, 20110223677, 20110190486, 20110172420, 20060179585 y 20030003486; y en las solicitudes de patentes internacionales: WO200142505 y WO200186001.
En algunos casos, la escisión de un ARN detector marcado puede detectarse midiendo una lectura colorimétrica. Por ejemplo, la liberación de un fluoróforo (por ejemplo, la liberación desde un par FRET, la liberación desde un par inactivador/flúor y similares) puede dar como resultado un cambio de longitud de onda (y, por lo tanto, un cambio de color) de una señal detectable. Por lo tanto, en algunos casos, la escisión de un ARN detector marcado en cuestión puede detectarse mediante un cambio de color. Tal cambio se puede expresar como una pérdida de una cantidad de señal de un color (longitud de onda), un aumento en la cantidad de otro color, un cambio en la proporción entre un color y otro, y similares.
Modificaciones de ácido nucleico
En algunos casos, un ARN detector marcado comprende una o más modificaciones, por ejemplo, una modificación de base, una modificación de la cadena principal, una modificación de azúcar, etc., para proporcionar al ácido nucleico una característica nueva o potenciada (p. ej., mayor estabilidad). Sin embargo, en el método y el kit de la presente invención solo se utilizan ARN detectores marcados que sean escindibles por la proteína C2C2. Como es sabido en la técnica, un nucleósido es una combinación de base y azúcar. La porción de base del nucleósido normalmente es una base heterocíclica. Las dos clases más comunes de tales bases heterocíclicas son las purinas y las pirimidinas. Los nucleótidos son nucleósidos que además incluyen un grupo fosfato unido covalentemente a la porción de azúcar del nucleósido. Para aquellos nucleósidos que incluyen un azúcar pentofuranosilo, el grupo fosfato se puede unir al resto hidroxilo 2', 3' o 5' del azúcar. En la formación de oligonucleótidos, los grupos fosfato unen covalentemente nucleósidos adyacentes entre sí para formar un compuesto polimérico lineal. A su vez, los extremos correspondientes de este compuesto polimérico lineal se pueden unir adicionalmente para formar un compuesto circular, sin embargo, generalmente son adecuados los compuestos lineales. Además, los compuestos lineales pueden tener complementariedad interna de bases nucleotídicas y, por lo tanto, pueden plegarse de manera que se produzca un compuesto total o parcialmente bicatenario. Dentro de los oligonucleótidos, los grupos fosfato generalmente se conocen como grupos que forman la cadena principal internucleosídica del oligonucleótido. El enlace normal o cadena principal del ARN y el ADN es un enlace fosfodiéster 3' a 5'.
Cadenas principales modificadas y enlaces internudeosídicos modificados
Los ejemplos de modificaciones adecuadas incluyen cadenas principales de ácidos nucleicos modificadas y enlaces internucleosídicos no naturales. Los ácidos nucleicos que tienen cadenas principales modificadas incluyen los que conservan un átomo de fósforo en la cadena principal y los que no tienen un átomo de fósforo en la cadena principal.
Las cadenas principales de oligonucleótidos modificadas adecuadas que contienen un átomo de fósforo incluyen, por ejemplo, fosforotioatos, fosforotioatos quirales, fosforoditioatos, fosfotriésteres, aminoalquilfosfotriésteres, fosfonatos de metilo y otros alquilos entre los que se incluyen fosfonatos de 3'-alquileno, fosfonatos de 5'-alquileno y fosfonatos quirales, fosfinatos, fosforamidatos que incluyen 3'-amino fosforamidato y aminoalquilfosforamidatos, fosforodiamidatos, tionofosforamidatos, tionoalquilfosfonatos, tionoalquilfosfotriésteres, selenofosfatos y boranofosfatos que tienen enlaces 3'-5' normales, análogos 2'-5' enlazados de estos, y los que tienen polaridad invertida en donde uno o más enlaces internucleotídicos son un enlace 3' a 3', 5' a 5' o 2' a 2'. Los oligonucleótidos adecuados que tienen polaridad invertida comprenden un único enlace 3' a 3' en el enlace internucleotídico más 3', es decir, un único resto de nucleósido invertido que puede ser básico (falta la nucleobase o tiene un grupo hidroxilo en su lugar). También se incluyen varias sales (tales como, por ejemplo, potasio o sodio), sales mixtas y formas de ácidos libres.
En algunos casos, un ARN detector marcado comprende uno o más enlaces internucleosídicos de fosforotioato y/o heteroátomo, en particular -CH2-NH-O-CH2-, -CH2-N(CH3)-O-CH2- (conocido como cadena principal de metileno (metilimino) o MMI), -CH2-O-N(CH3)-CH2-, -CH2-N(CH3)-N(CH3)-CH2- y -O-N(CH3)-CH2-CH2- (en donde el enlace internucleotídico fosfodiéster nativo se representa como -O-P(=O)(OH)-O-CH2-). Se desvelan enlaces internucleosídicos de tipo MMI en la patente de Estados Unidos n.° 5.489.677. Se desvelan enlaces internucleosídicos de amida adecuados en la patente de Estados Unidos n.° 5.602.240.
También son adecuados los ácidos nucleicos que tienen estructuras de cadena principal de morfolino, como se describe en, por ejemplo, la patente de Estados Unidos n.° 5.034.506. Por ejemplo, en algunos casos, un ARN detector marcado puede comprender un anillo morfolino de 6 miembros en lugar de un anillo de ribosa. En algunos casos, un enlace internucleosídico fosforodiamidato u otro no fosfodiéster reemplaza a un enlace fosfodiéster.
Las cadenas principales de oligonucleótidos modificadas que no incluyen un átomo de fósforo tienen cadenas principales que se forman mediante enlaces internucleosídicos cicloalquilo o alquilo de cadena corta, enlaces internucleosídicos de heteroátomos mixtos y de alquilo o cicloalquilo o uno o más enlaces internucleosídicos heteroatómicos o heterocíclicos de cadena corta. Estos incluyen los que tienen enlaces morfolino (formados en parte a partir de la porción de azúcar de un nucleósido); cadenas principales de siloxano; sulfuro, cadenas principales de sulfóxido y sulfona; cadenas principales de formacetilo y tioformacetilo; cadenas principales de metilenformacetilo y tioformacetilo; cadenas principales de riboacetilo; cadenas principales que contienen alqueno; cadenas principales de sulfamato; cadenas principales de metilenimino y metilenhidrazino; cadenas principales de sulfonato y sulfonamida; cadenas principales de amida; y otros que tienen partes componentes mixtas de N, O, S y CH2.
Miméticos
Un ARN detector marcado puede ser un mimético de ácido nucleico. El término "mimético", cuando se aplica a polinucleótidos, pretende incluir polinucleótidos en donde solamente el anillo de furanosa o tanto el anillo de furanosa como el enlace internucleotídico se reemplazan por grupos que no son de furanosa, en la técnica también se conoce el reemplazo del anillo de furanosa únicamente como un sustituto del azúcar. El resto de base heterocíclica o un resto de base heterocíclica modificado se mantiene para la hibridación con un ácido nucleico diana apropiado. Uno de estos ácidos nucleicos, un mimético de polinucleótido que se ha demostrado que tiene excelentes propiedades de hibridación, se conoce como ácido peptidonucleico (APN). En el APN, la cadena principal de azúcar de un oligonucleótido se ha reemplazado por una cadena principal que contiene amida, en particular una cadena principal de aminoetilglicina. Los nucleótidos se retienen y están unidos directa o indirectamente a átomos de nitrógeno aza de la porción de amida de la cadena principal.
Un polinucleótido mimético del que se ha informado que tiene excelentes propiedades de hibridación es un ácido peptidonucleico (APN). La cadena principal en los compuestos de APN consta de dos o más unidades de aminoetilglicina unidas que dan al APN una cadena principal que contiene amida. Los restos de base heterocíclica están unidos directa o indirectamente a átomos de nitrógeno aza de la porción amida de la cadena principal. Las patentes de Estados Unidos representativas que describen la preparación de compuestos de APN incluyen, pero sin limitación: las patentes de Estados Unidos n.° 5.539.082; 5.714.331; y 5.719.262.
Otra clase de polinucleótido mimético que se ha estudiado está basada en unidades de morfolino unidas (ácido nucleico de morfolino) que tienen bases heterocíclicas unidas al anillo de morfolino. Se han notificado varios grupos de unión que unen las unidades monoméricas de morfolino en un ácido nucleico de morfolino. Se ha seleccionado una clase de grupos de unión para dar un compuesto oligomérico no iónico. Es menos probable que los compuestos oligoméricos basados en morfolino no iónico tengan interacciones no deseadas con proteínas celulares. Los polinucleótidos basados en morfolino son miméticos no iónicos de oligonucleótidos que tienen menos probabilidades de formar interacciones no deseadas con proteínas celulares (Dwaine A. Braasch y David R. Corey, Biochemistry, 2002, 41(14), 4503-4510). Se desvelan polinucleótidos basados en morfolino en la patente de Estados Unidos n.° 5.034.506. Se han preparado diversos compuestos dentro de la clase de polinucleótidos de morfolino, que tienen diversos grupos de unión diferentes que unen las subunidades monoméricas.
Una clase adicional de miméticos de polinucleótidos recibe el nombre de ácidos nucleicos de ciclohexenilo (CeNA). El anillo de furanosa normalmente presente en una molécula de ADN/ARN se reemplaza por un anillo de ciclohexenilo. Se han preparado monómeros de fosforamidita protegidos con ANCe DMT se han usado para la síntesis de compuestos oligoméricos mediante la química clásica de la fosforamidita. Se han preparado y estudiado compuestos oligoméricos de CeNA completamente modificados y oligonucleótidos que tienen posiciones específicas modificadas con CeNA (véase Wang et al., J. Am. Chem. Soc., 2000, 122, 8595-8602). En general, la incorporación de monómeros de CeNA en una cadena de ADN aumenta la estabilidad de un híbrido ADN/ARN. Los oligoadenilatos de CeNA formaron complejos con complementos de ARN y ADN con una estabilidad similar a la de los complejos nativos. El estudio de la incorporación de estructuras de CeNA en estructuras de ácidos nucleicos naturales mediante RMN y dicroísmo circular demostró que este proceso se realizaba con una fácil adaptación conformacional.
Una modificación adicional incluye ácidos nucleicos bloqueados (ANB) en los que el grupo 2'-hidroxilo está unido al átomo de carbono 4' del anillo de azúcar, formándose, de este modo, un enlace 2'-C,4'-C-oximetileno que forma, de este modo, un resto de azúcar bicíclico. El enlace puede ser un metileno (-CH 2-), grupo que une el átomo de oxígeno 2' y el átomo de carbono 4' en donde n es 1 o 2 (Singh et al., Chem. Commun., 1998, 4, 455-456). Los ANB y los análogos de ANB muestran estabilidades térmicas dúplex muy altas con ADN y ARN complementarios (Tm = 3 a 10 °C), estabilidad frente a la degradación 3'-exonucleolítica y buenas propiedades de solubilidad. Se han descrito oligonucleótidos antisentido potentes y no tóxicos que contienen ANB (Wahlestedt et al., Proc. Natl. Acad. Sci. U.S.A., 2000, 97, 5633-5638).
Se ha descrito la síntesis y preparación de los monómeros de ANB adenina, citosina, guanina, 5-metil-citosina, timina y uracilo, junto con su oligomerización, y se han descrito propiedades de reconocimiento de ácidos nucleicos (Koshkin et al., Tetrahedron, 1998, 54, 3607-3630). También se describen ANB y su preparación en los documentos WO 98/39352 y WO 99/14226.
Restos de azúcar modificados
Un ARN detector marcado también puede incluir uno o más restos de azúcar sustituidos. Los polinucleótidos adecuados comprenden un grupo sustituyente de azúcar seleccionado de: OH; F; O-, S- o N-alquilo; O-, S- o N-alquenilo; O-, S- o N-alquinilo; u O-alquil-O-alquilo, en donde el alquilo, alquenilo y alquinilo pueden ser alquilo C1 a C10, alquilo o alquenilo C2 a C10 y alquinilo sustituidos o sin sustituir. Son particularmente O((CH2)nO)mCH3, O(CH2)nOCHa, O(CH2)nNH2, O(CH2)nCH3, O(CH2)nONH2 y O(CH2),ON((CH2),CH3)2, en donde n y m son de 1 a aproximadamente 10. Otros polinucleótidos adecuados comprenden un grupo sustituyente de azúcar seleccionado de: alquilo inferior C1 a C10, alquilo inferior sustituido, alquenilo, alquinilo, alcarilo, aralquilo, O-alcarilo u O-aralquilo, SH, SCH3, OCN, Cl, Br, CN, CF3, OCF3, SOCH3, SO2CH3, ONO2, NO2, N3, NH2, heterocicloalquilo, heterocicloalcarilo, aminoalquilamino, polialquilamino, sililo sustituido, un grupo de escisión de ARN, un grupo indicador, un intercalante, un grupo para mejorar las propiedades farmacocinéticas de un oligonucleótido, o un grupo para mejorar las propiedades farmacocinéticas de un oligonucleótido y otros sustituyentes que tienen propiedades similares. Una modificación adecuada incluye 2'-metoxietoxi (2 -O-CH2 CH2OCH3, también conocido como 2'-O-(2-metoxietilo) o 2'-MOE) (Martin et al., Helv. Chim. Acta, 1995, 78, 486-504) es decir, un grupo alcoxialcoxi. Una modificación adecuada adicional incluye 2'-dimetilaminooxietoxi, es decir, un grupo O(CH2)2ON(CH3)2, también conocido como 2'-DMAOE, como se describe más adelante en los ejemplos, y 2'-dimetilaminoetoxietoxi (también conocido en la técnica como 2'-O-dimetil-amino-etoxi-etilo o 2 '-DMAEo E), es decir, 2'-O-CH2-O-CH2-N(CH3)2.
Otros grupos sustituyentes de azúcar adecuados incluyen metoxi (-O-CH3), aminopropoxi (--O CH2 CH2 CH2NH2), alilo (-CH2-CH=CH2), -O-alilo (--O-- CH2-CH=CH2) y flúor (F). Los grupos sustituyentes de 2'-azúcar pueden estar en la posición arabino (arriba) o en la posición ribo (abajo). Una modificación 2'-arabino adecuada es 2'-F. También se pueden realizar modificaciones similares en otras posiciones del compuesto oligomérico, particularmente, la posición 3' del azúcar en el nucleósido 3' terminal o en oligonucleótidos enlazados en 2'-5' y la posición 5' del nucleótido 5' terminal. Los compuestos oligoméricos también pueden tener miméticos de azúcar tales como restos ciclobutilo en lugar del azúcar pentofuranosilo.
Modificaciones y sustituciones de bases
Un ARN detector marcado también puede incluir modificaciones o sustituciones de nucleobases (a menudo denominadas en la técnica simplemente "base"). Como se usa en el presente documento, las nucleobases "no modificadas" o "naturales" incluyen las bases púricas adenina (A) y guanina (G) y las bases pirimidínicas timina (T), citosina (C) y uracilo (U). Las nucleobases modificadas incluyen otras nucleobases sintéticas y naturales, tales como 5-metilcitosina (5-me-C), 5-hidroximetil-citosina, xantina, hipoxantina, 2-aminoadenina, 6-metilo y otros derivados de alquilo de adenina y guanina, 2-propilo y otros derivados de alquilo de adenina y guanina, 2-tiouracilo, 2-tiotimina y 2-tiocitosina, 5-halouracilo y citosina, 5-propinil (-C=C-CH3) uracilo y citosina y otros derivados alquinílicos de bases pirimidínicas, 6-azo uracilo, citosina y timina, 5-uracilo (pseudouracilo), 4-tiouracilo, 8-halo, 8-amino, 8-tiol, 8-tioalquilo, 8-hidroxilo y otras adeninas y guaninas 8-sustituidas, 5-halo, particularmente, 5-bromo, 5-trifluorometilo y otros uracilos y citosinas 5-sustituidos, 7-metilguanina y 7-metiladenina, 2-F-adenina, 2-aminoadenina, 8-azaguanina y 8-azaadenina, 7-desazaguanina y 7-desazaadenina y 3-desazaguanina y 3-desazaadenina. Otras nucleobases modificadas incluyen pirimidinas tricíclicas tales como fenoxazina citidina (1H-pirimido(5,4-b)(1,4)benzoxazin-2(3H)-ona), fenotiazina citidina (1H-pirimido(5,4-b)(1,4)benzotiazin-2(3H)-ona), abrazaderas en G tales como una fenoxazina citidina sustituida (p. ej., 9-(2-aminoetoxi)-H-pirimido(5,4-(b) (1,4)benzoxazin-2(3H)-ona), carbazol citidina (2H-pirimido(4,5-b)indol-2-ona), piridoindol citidina (H-pirido(3',2':4,5)pirrolo(2,3-d) pirimidin-2-ona).
Los residuos de bases heterocíclicas también pueden incluir aquellos en los que la base de purina o pirimidina se reemplaza por otros heterociclos, por ejemplo 7-desaza-adenina, 7-desazaguanosina, 2-aminopiridina y 2-piridona. Otras nucleobases incluyen las desveladas en las patentes de Estados Unidos n.° 3.687.808, las desveladas en The Concise Encyclopedia Of Polymer Science And Engineering, páginas 858-859, Kroschwitz, J. I., ed. John Wiley & Sons, 1990, las desveladas por Englisch et al., Angewandte Chemie, Edición Internacional, 1991, 30, 613, y las desveladas por Sanghvi, Y. S., Capítulo 15, Antisense Research and Applications, páginas 289-302, Crooke, S. T. y Lebleu, B., ed., CRC Press, 1993. Algunas de estas nucleobases son útiles para aumentar la afinidad de unión de un compuesto oligomérico. Estas incluyen pirimidinas 5-sustituidas, 6-azapirimidinas y purinas N-2, N-6 y O-6 sustituidas, incluyendo 2-aminopropiladenina, 5-propiniluracilo y 5-propinilcitosina. Se ha demostrado que las sustituciones de 5-metilcitosina aumentan la estabilidad del dúplex de ácido nucleico en 0,6-1,2 °C (Sanghvi et al., ed., Antisense Research and Applications, CRC Press, Boca Raton, 1993, pp. 276-278) y son sustituciones de base adecuadas, por ejemplo, cuando se combina con modificaciones de azúcar 2'-O-metoxietilo.
Detección de dos ARN diana diferentes
Los siguientes métodos desvelados para la detección de dos ARN diana diferentes no forman parte de la invención. Como se ha indicado anteriormente, en algunos casos, un método de la presente divulgación proporciona la detección sustancialmente simultánea de dos ARN diana diferentes (un primer ARN diana monocatenario y un segundo ARN diana monocatenario) en una muestra. En algunos casos, el método comprende: a) poner en contacto una muestra (por ejemplo, una muestra que comprende los dos ARN diana diferentes y una pluralidad de ARN no diana) con: (i) una primera proteína C2c2 que escinde los ARN adenina+ (es decir, ARN que incluyen A, pero no los ARN que carecen de A, tales como un ARN poliU) presentes en la muestra; (ii); una segunda proteína C2c2 que escinde los ARN uracilo+ (es decir, ARN que incluyen U, pero no los ARN que carecen de U, tal como un ARN poliA); (iii) un primer ARN guía de C2c2 que comprende una primera secuencia de nucleótidos que hibrida con el primer ARN diana monocatenario y una segunda secuencia de nucleótidos que se une a la primera proteína C2c2; y (iv) un segundo ARN guía de C2c2 que comprende una primera secuencia de nucleótidos que hibrida con el segundo ARN diana monocatenario y una segunda secuencia de nucleótidos que se une a la segunda proteína C2c2; y b) medir una señal detectable producida por la escisión del ARN mediada por la primera y la segunda proteína C2c2, en donde la primera proteína C2c2 produce una primera señal detectable y la segunda proteína C2c2 produce una segunda señal detectable, donde la primera señal detectable y la segunda señal detectable son distinguibles entre sí. En algunos casos, la primera proteína C2c2 no se activa por el segundo ARN guía de C2c2, y la primera proteína C2c2 escinde el ssRNA que incluye A (p. ej., no escinde el ssRNA que carece de A); y la segunda proteína C2c2 no se activa por el primer ARN guía de C2c2, y la segunda proteína C2c2 escinde el ssRNA que incluye U (p. ej., no escinde el mRNA que carece de U). En algunos casos, la primera proteína C2c2 no se activa por el segundo ARN guía de C2c2, y la primera proteína C2c2 escinde el ssRNA que incluye U (p. ej., no escinde el ssRNA que carece de U); y la segunda proteína C2c2 no se activa por el primer ARN guía de C2c2, y la segunda proteína C2c2 escinde el ssRNA que incluye A (p. ej., no escinde el ssRNA que carece de A).
En algunos casos, el método también comprende poner en contacto la muestra con: i) un primer ARN detector marcado que comprende un primer par FRET y/o un primer par inactivador/flúor (anteriormente se han descrito pares FRET y pares inactivador/flúor ilustrativos); y ii) un segundo ARN detector marcado que comprende un segundo par FRET y/o un segundo par inactivador/fluor (anteriormente se han descrito pares FRET y pares inactivador/fluor ilustrativos). En algunos casos, el primer ARN detector marcado comprende al menos una A y no comprende U; mientras que el segundo ARN detector marcado comprende al menos un U y no comprende A. En algunos casos, el primer ARN detector marcado comprende al menos un U y no comprende A; mientras que el segundo ARN detector marcado comprende al menos una A y no comprende U. La primera proteína C2c2 escinde el primer ARN detector marcado, y la primera señal detectable se produce por el primer par FREt y/o el primer par inactivador/flúor, y la segunda proteína C2c2 escinde el segundo ARN detector marcado, y la segunda señal detectable se produce por el segundo par FRET y/o el segundo par inactivador/fluor. La detección de la primera señal detectable indica la presencia en la muestra del primer ARN diana; y la detección de la segunda señal detectable indica la presencia en la muestra del segundo ARN diana. En algunos casos, las cantidades relativas de la primera y la segunda señal detectadas indican la proporción entre el primer ARN diana y el segundo ARN diana en la muestra.
En algunos casos, el primer ARN detector marcado comprende un marcador que se puede distinguir del marcador del segundo ARN detector marcado. Por ejemplo, el primer ARN detector marcado puede comprender un primer par FRET y/o un primer par inactivador/flúor; y el segundo ARN detector marcado puede comprender un segundo par FRET y/o un segundo par inactivador/flúor. Como ejemplo no limitante, el primer ARN detector marcado puede comprender un donante que comprende triptófano y un aceptor que comprende dansilo; y el segundo ARN detector marcado puede comprender un donante que comprende iA e DANS y un aceptor que comprende DDPM. Como otro ejemplo no limitante, el primer ARN detector marcado comprende un donante que comprende dansilo y un aceptor que comprende FITC; y el segundo ARN detector marcado comprende un donante que comprende Cy3 y un aceptor que comprende Cy5. En algunos casos, el primer ARN detector marcado comprende un par inactivador/flúor de 5' FAM (Fluoresceína) - 3' IBFQ (Iowa Black® FQ) y, en algunos casos, el segundo ARN detector marcado comprende un par inactivador/flúor 5' FAM (fluoresceína) - 3' IBFQ (Iowa Black® FQ).
En algunos casos, el primer y el segundo ARN detector marcado se añaden a la muestra al mismo tiempo (contacto sustancialmente simultáneo). En algunos de tales casos, las señales producidas por el primer y segundo ARN detector marcado se detectan al mismo tiempo (contacto sustancialmente simultáneo), por ejemplo, porque en tales casos el primer y el segundo ARN detector marcado pueden marcarse de forma distinguible.
"Sustancialmente simultáneo" se refiere a un plazo de aproximadamente 5 minutos, un plazo de aproximadamente 3 minutos, un plazo de aproximadamente 2 minutos, un plazo de aproximadamente 1 minuto, un plazo de aproximadamente 30 segundos, un plazo de aproximadamente 15 segundos, un plazo de aproximadamente 10 segundos, un plazo de aproximadamente 5 segundos o un plazo de aproximadamente 1 segundo.
Sin embargo, en algunos casos, las señales producidas por el primer y el segundo ARN detector marcado no se detectan al mismo tiempo y, en cambio, se detectan secuencialmente (una antes que la otra). Por ejemplo, en algunos casos, el primer y el segundo ARN detector marcado no se añaden a la muestra al mismo tiempo, sino que se añaden secuencialmente (por ejemplo, el segundo ARN detector marcado puede añadirse después de añadir el primer ARN detector marcado) y, en algunos de estos casos, el segundo ARN detector marcado no se añade hasta que se detecta la señal producida por el primer ARN detector marcado. Por lo tanto, en algunos casos, no es necesario que el primer y el segundo ARN detector marcado estén marcados de manera distinguible (por ejemplo, en algunos casos, pueden producir la misma señal detectable, por ejemplo, pueden emitir fluorescencia a la misma longitud de onda) porque las señales deben detectarse secuencialmente.
Como ejemplo ilustrativo, en algunos casos: (i) el primer y el segundo ARN detector marcado no están marcados de forma distinguible; (ii) la muestra se pone en contacto con un ARN detector marcado y se detecta (por ejemplo, se mide) la señal producida por ese ARN detector marcado se detecta; y (iii) la muestra luego se pone en contacto con el otro ARN detector marcado y se detecta la señal producida por el segundo ARN detector marcado añadido, por lo tanto, cuando están presentes en la muestra los dos ssRNA diana, la adición del segundo ARN detector marcado puede dar como resultado un refuerzo de la señal (por ejemplo, si la señal aumenta con el aumento de la escisión, por ejemplo, par inactivador/flúor) o puede dar como resultado una disminución detectable en la señal después de la adición del segundo ARN detector marcado (por ejemplo, si la señal disminuye con el aumento de la escisión, p. ej., par FRET).
La primera y la segunda proteínas C2c2 pueden ser ortogonales entre sí con respecto a la unión al ARN guía de C2c2. En estos casos, la primera proteína C2c2 no se une al segundo ARN guía de C2c2; y la segunda proteína C2c2 no se une al primer ARN guía. La primera proteína C2c2 y la segunda proteína C2c2 también pueden diferir entre sí en su preferencia de escisión de ssRNA, de manera que una de las proteínas C2c2 escinde el ssRNA en A y la otra proteína C2c2 escinde el ssRNA en U.
En la FIG. 44E puede encontrarse una guía de pares ortogonales de proteínas C2c2.
Los ejemplos no limitantes de pares ortogonales de proteínas C2c2 adecuados para usar en un método de la presente divulgación incluyen los que se representan a continuación en la Tabla 10. La preferencia de escisión se presenta entre paréntesis después del nombre de la proteína Cas 13a. Por ejemplo, "Lba (A)" se refiere a una proteína Lba Cas 13a, que escinde el ssRNA en A; y "Lbu (U)" se refiere a una proteína Lbu Cas 13a, que escinde el ssRNA en U.
Tabla 10
Figure imgf000023_0001
continuación
Figure imgf000024_0001
El primer y el segundo ARN detector marcado pueden tener, cada uno independientemente, una longitud de 2 a 100 ribonucleótidos (p. ej., de 2 a 80, de 2 a 60, de 2 a 50, de 2 a 40, de 2 a 30, de 2 a 20, de 2 a 15 o de 2 a 10 ribonucleótidos). El primer y el segundo ARN detector marcado pueden tener, cada uno independientemente, una longitud de 2 ribonucleótidos a 100 ribonucleótidos, por ejemplo, de 2 ribonucleótidos a 5 ribonucleótidos, de 5 ribonucleótidos a 7 ribonucleótidos, de 7 ribonucleótidos a 10 ribonucleótidos, de 10 ribonucleótidos a 15 ribonucleótidos, de 15 ribonucleótidos a 20 ribonucleótidos, de 20 ribonucleótidos a 25 ribonucleótidos, de 25 ribonucleótidos a 30 ribonucleótidos, de 30 ribonucleótidos a 35 ribonucleótidos, de 35 ribonucleótidos a 40 ribonucleótidos, de 40 ribonucleótidos a 45 ribonucleótidos o de 45 ribonucleótidos a 50 ribonucleótidos.
En algunos casos, el primer ARN detector marcado comprende al menos una A (por ejemplo, al menos 2, al menos 3 o al menos 4 A) y carece de U; y el segundo ARN detector marcado comprende al menos una U (por ejemplo, al menos 2, al menos 3 o al menos 4 U) y carece de A.
En algunos casos, el primer ARN detector marcado carece de U e incluye un tramo de 2 a 15 A consecutivas (por ejemplo, de 2 a 12, 2 a 10, 2 a 8, 2 a 6, 2 a 4, 3 a 15, 3 a 12, 3 a 10, 3 a 8, 3 a 6, 3 a 5, 4 a 15, 4 a 12, 4 a 10, 4 a 8 o 4 a 6 A consecutivas). En algunos casos, el primer ARN detector marcado carece de U e incluye un tramo de al menos 2 A consecutivas (por ejemplo, al menos 3, al menos 4 o al menos 5 A consecutivas). En algunos casos, el segundo ARN detector marcado carece de A e incluye un tramo de 2 a 15 U consecutivos (por ejemplo, de 2 a 12, 2 a 10, 2 a 8, 2 a 6, 2 a 4, 3 a 15, 3 a 12, 3 a 10, 3 a 8, 3 a 6, 3 a 5, 4 a 15, 4 a 12, 4 a 10, 4 a 8 o 4 a 6 U consecutivos). En algunos casos, el segundo ARN detector marcado carece de A e incluye un tramo de al menos 2 U consecutivos (por ejemplo, al menos 3, al menos 4 o al menos 5 U consecutivos).
En algunos casos, el primer ARN detector marcado carece de A e incluye un tramo de 2 a 15 U consecutivos (por ejemplo, de 2 a 12, 2 a 10, 2 a 8, 2 a 6, 2 a 4, 3 a 15, 3 a 12, 3 a 10, 3 a 8, 3 a 6, 3 a 5, 4 a 15, 4 a 12, 4 a 10, 4 a 8 o 4 a 6 U consecutivos). En algunos casos, el primer ARN detector marcado carece de A e incluye un tramo de al menos 2 U consecutivos (por ejemplo, al menos 3, al menos 4 o al menos 5 U consecutivos). En algunos casos, el segundo ARN detector marcado carece de U e incluye un tramo de 2 a 15 A consecutivas (por ejemplo, de 2 a 12, 2 a 10, 2 a 8, 2 a 6, 2 a 4, 3 a 15, 3 a 12, 3 a 10, 3 a 8, 3 a 6, 3 a 5, 4 a 15, 4 a 12, 4 a 10, 4 a 8 o 4 a 6 A consecutivas). En algunos casos, el segundo ARN detector marcado carece de U e incluye un tramo de al menos 2 A consecutivas (por ejemplo, al menos 3, al menos 4 o al menos 5 A consecutivas).
En algunos casos, el primer ARN detector marcado comprende al menos un U y carece de A; y el segundo ARN detector marcado comprende al menos una A y carece de U.
En algunos casos, el primer ARN detector marcado comprende al menos una A y carece de U. Por ejemplo, en algunos casos, el primer ARN detector marcado es un polímero de homoadenosina (un ARN poliA). Como otro ejemplo, el primer ARN detector marcado: i) comprende al menos una A; ii) carece de U; y iii) comprende una o más C y/o G. En algunos casos, el segundo ARN detector marcado comprende al menos un U y carece de A. Por ejemplo, en algunos casos, el segundo ARN detector marcado es un polímero de homouridina (un ARN poliU). Como otro ejemplo, el segundo ARN detector marcado: i) comprende al menos una U; ii) carece de A; y iii) comprende una o más C y/o G.
En algunos casos, el primer ARN detector marcado comprende al menos una U y carece de A. Por ejemplo, en algunos casos, el primer ARN detector marcado es un polímero de homouridina (ARN poliU). Como otro ejemplo, el segundo ARN detector marcado: i) comprende al menos una U; ii) carece de A; y iii) comprende una o más C y/o G. En algunos casos, el segundo ARN detector marcado comprende al menos una A y carece de U. Por ejemplo, en algunos casos, el segundo ARN detector marcado es un polímero de homoadenosina (ARN poliA). Como otro ejemplo, el segundo ARN detector marcado: i) comprende al menos una A; ii) carece de U; y iii) comprende una o más C y/o G.
Como se ha indicado anteriormente, un método de la presente divulgación puede comprender poner en contacto una muestra con: una primera proteína C2c2; una segunda proteína C2c2; un primer ARN guía de C2c2 que comprende una primera secuencia de nucleótidos que hibrida con el primer ARN diana monocatenario y una segunda secuencia de nucleótidos también denominada en el presente documento "región constante" o "mango" que se une a la primera proteína C2c2; y un segundo ARN guía de C2c2 que comprende una primera secuencia de nucleótidos que hibrida con el segundo ARN diana monocatenario y una segunda secuencia de nucleótidos (un mango) que se une a la segunda proteína C2c2.
Por ejemplo, en algunos casos, la primera proteína C2c2 es un polipéptido Cas 13a que comprende una secuencia de aminoácidos que tiene al menos un 75 %, al menos un 80 %, al menos un 85 %, al menos un 90 %, al menos un 95 %, al menos un 98 %, al menos un 99 % o un 100 %, de identidad de secuencia de aminoácidos con la secuencia de aminoácidos de Lba Cas13a representada en la FIG. 56F; y el primer ARN guía de C2c2 comprende una región constante (un "mango", un tramo de nucleótidos que se une al polipéptido Cas13a) que comprende una secuencia de nucleótidos que no tiene más de 1 nucleótido (nt), no tiene más de 2 nt, no tiene más de 3 nt, no tiene más de 4 nt o no tiene más de 5 nt de diferencia con respecto a la secuencia de nucleótidos AGAUAGCCCAAGAAAGAGGGCAAUAAC (SEQ ID NO: 16), donde el crRNA tiene una longitud de aproximadamente 25 nt, 26 nt, 27 nt, 28 nt, 29 nt o 30 nt. En algunos casos, el crRNA tiene la secuencia de nucleótidos AGAUAGCCCAAGAAAGAGGGCAAUAAC (SEQ ID NO: 16); y tiene una longitud de 27 nt. En algunos casos, la segunda proteína C2c2 humana tiene una secuencia de aminoácidos que tiene al menos un 75 %, al menos un 80 %, al menos un 85 %, al menos un 90 %, al menos un 95 %, al menos un 98 %, al menos un 99 % o un 100 %, de identidad de secuencia de aminoácidos con la secuencia de aminoácidos de Hhe Cas 13a representada en la FIG. 56K; y el segundo ARN guía de C2c2 comprende un mango (un tramo de nucleótidos que se une al polipéptido Cas 13a) que comprende una secuencia de nucleótidos que no tiene más de 1 nucleótido (nt), no tiene más de 2 nt, no tiene más de 3 nt, no tiene más de 4 nt o no tiene más de 5 nt de diferencia con respecto a la secuencia de nucleótidos GUAACAAUCCCCGUAGACAGGGGAACUGCAAC (SEQ ID NO: 17). En algunos casos, la segunda proteína C2c2 humana tiene una secuencia de aminoácidos que tiene al menos un 75 %, al menos un 80 %, al menos un 85 %, al menos un 90 %, al menos un 95 %, al menos un 98 %, al menos un 99 % o un 100 %, de identidad de secuencia de aminoácidos con la secuencia de aminoácidos de Rca Cas13a representada en la FIG. 56G; y el segundo ARN guía de C2c2 comprende un mango (un tramo de nucleótidos que se une al polipéptido Cas 13a) que comprende una secuencia de nucleótidos que no tiene más de 1 nucleótido (nt), no tiene más de 2 nt, no tiene más de 3 nt, no tiene más de 4 nt o no tiene más de 5 nt de diferencia con respecto a la secuencia de nucleótidos CAUCACCGCCAAGACGACGGCGGACUGAACC (SEQ ID NO: 18). En algunos casos, la segunda proteína C2c2 humana tiene una secuencia de aminoácidos que tiene al menos un 75 %, al menos un 80 %, al menos un 85 %, al menos un 90 %, al menos un 95 %, al menos un 98 %, al menos un 99 % o un 100 %, de identidad de secuencia de aminoácidos con la secuencia de aminoácidos de Ppr Cas 13a representada en la FIG. 56B; y el segundo ARN guía de C2c2 comprende un mango (un tramo de nucleótidos que se une al polipéptido Cas 13a) que comprende una secuencia de nucleótidos que no tiene más de 1 nucleótido (nt), no tiene más de 2 nt, no tiene más de 3 nt, no tiene más de 4 nt o no tiene más de 5 nt de diferencia con respecto a la secuencia de nucleótidos AAUUAUCCCAAAAUUGAAGGGAACUACAAC (SEQ ID NO: 19); donde el mango tiene una longitud de aproximadamente 28 nt, 29 nt, 30 nt, 31 nt o 32 nt. En algunos casos, el segundo ARN guía de C2c2 comprende un mango que comprende la secuencia de nucleótidos AAUUAUCCCAAAAUUGAAGGGAACUACAAC (SEQ iD NO: 19); y el mango tiene una longitud de 30 nt. En algunos casos, la segunda proteína C2c2 humana tiene una secuencia de aminoácidos que tiene al menos un 75 %, al menos un 80 %, al menos un 85 %, al menos un 90 %, al menos un 95 %, al menos un 98 %, al menos un 99 % o un 100 %, de identidad de secuencia de aminoácidos con la secuencia de aminoácidos de Lne Cas 13a representada en la FIG. 56I; y el segundo ARN guía de C2c2 comprende un mango (un tramo de nucleótidos que se une al polipéptido Cas 13a) que comprende una secuencia de nucleótidos que no tiene más de 1 nucleótido (nt), no tiene más de 2 nt, no tiene más de 3 nt, no tiene más de 4 nt o no tiene más de 5 nt de diferencia con respecto a la secuencia de nucleótidos GAGUACCUCAAAACAAAAGAGGACUAAAAC (SEQ ID NO: 20) (por ejemplo, que comprende una secuencia de nucleótidos que tiene solo 1 nt, 2 nt, 3 nt, 4 nt o 5 nt, de diferencia con respecto a la secuencia de nucleótidos GAGUACCUCAAAACAAAAGAGGACUAAAAC (SEQ ID NO: 20)); donde el mango tiene una longitud de aproximadamente 28 nt, 29 nt, 30 nt, 31 nt o 32 nt. En algunos casos, el segundo ARN guía comprende un mango que comprende la secuencia de nucleótidos GAGUACCUCAAACAAAAGAGGACUAAAC (SEQ ID NO: 20); donde el mango tiene una longitud de 30 nt. En algunos casos, la segunda proteína C2c2 humana tiene una secuencia de aminoácidos que tiene al menos un 75 %, al menos un 80 %, al menos un 85 %, al menos un 90 %, al menos un 95 %, al menos un 98 %, al menos un 99 % o un 100 %, de identidad de secuencia de aminoácidos con la secuencia de aminoácidos de Lbu Cas13a representada en la FIG. 56C; y el segundo ARN guía de C2c2 comprende un mango (un tramo de nucleótidos que se une al polipéptido Cas 13a) que comprende una secuencia de nucleótidos que no tiene más de 1 nucleótido (nt), no tiene más de 2 nt, no tiene más de 3 nt, no tiene más de 4 nt o no tiene más de 5 nt de diferencia con respecto a la secuencia de nucleótidos GACCACCCCAAAAAUGAAGGGGACUAAAACA (SEQ ID NO: 9) (por ejemplo, que comprende una secuencia de nucleótidos que tiene solo 1 nt, 2 nt, 3 nt, 4 nt o 5 nt, de diferencia con respecto a la secuencia de nucleótidos GACCACCCCAAAAAUGAAGGGGACUAAAACA (SEQ ID NO: 9)); donde el mango tiene una longitud de aproximadamente 28 nt, 29 nt, 30 nt, 31 nt o 32 nt. En algunos casos, el segundo ARN guía comprende un mango que comprende la secuencia de nucleótidos GACCACCCCAAAAAUGAAGGGGACUAAAACA (Se Q ID NO: 9); donde el mango tiene una longitud de 31 nt. En algunos casos, la segunda proteína C2c2 humana tiene una secuencia de aminoácidos que tiene al menos un 75 %, al menos un 80 %, al menos un 85 %, al menos un 90 %, al menos un 95 %, al menos un 98 %, al menos un 99 % o un 100 %, de identidad de secuencia de aminoácidos con la secuencia de aminoácidos de Lwa Cas 13a representada en la FIG. 56E; y el segundo ARN guía de C2c2 comprende un mango (un tramo de nucleótidos que se une al polipéptido Cas 13a) que comprende una secuencia de nucleótidos que no tiene más de 1 nucleótido (nt), no tiene más de 2 nt, no tiene más de 3 nt, no tiene más de 4 nt o no tiene más de 5 nt de diferencia con respecto a la secuencia de nucleótidos GACCACCCCAAUAUCGAAGGGGACUAAAACUU (SEQ ID NO: 21) (por ejemplo, que comprende una secuencia de nucleótidos que tiene solo 1 nt, 2 nt, 3 nt, 4 nt o 5 nt, de diferencia con respecto a la secuencia de nucleótidos GACCACCCCAAUAUCGAAGGGGACUAAAACUU (SEQ ID NO: 21); donde el mango tiene una longitud de aproximadamente 28 nt, 29 nt, 30 nt, 31 nt o 32 nt. En algunos casos, el segundo ARN guía comprende un mango que comprende la secuencia de nucleótidos GACCACCCCAAUAUCGAAGGGGACUAAAACUU (SEQ ID NO: 21); donde el mango tiene una longitud de 32 nt. En algunos casos, la segunda proteína C2c2 humana tiene una secuencia de aminoácidos que tiene al menos un 75 %, al menos un 80 %, al menos un 85 %, al menos un 90 %, al menos un 95 %, al menos un 98 %, al menos un 99 % o un 100 %, de identidad de secuencia de aminoácidos con la secuencia de aminoácidos de Lsh Cas13a representada en la FIG. 56D; y el segundo ARN guía de C2c2 comprende un mango (un tramo de nucleótidos que se une al polipéptido Cas 13a) que comprende una secuencia de nucleótidos que no tiene más de 1 nucleótido (nt), no tiene más de 2 nt, no tiene más de 3 nt, no tiene más de 4 nt o no tiene más de 5 nt de diferencia con respecto a la secuencia de nucleótidos CACCCCAAUAUCGAAGGGGACUAAAAC (SEQ ID NO: 22) (por ejemplo, que comprende una secuencia de nucleótidos que tiene solo 1 nt, 2 nt, 3 nt, 4 nt o 5 nt, de diferencia con respecto a la secuencia de nucleótidos CACCCCAAUAUCGAAGGGGACUAAAAC (SEQ ID NO: 22); donde el mango tiene una longitud de 25 nt, 26 nt, 27 nt, 28 nt o 29 nt. En algunos casos, el segundo ARN guía comprende un mango que comprende la secuencia de nucleótidos CACCCCAAUAUCGAAGGGGACUAAAAC (SEQ ID NO: 22); donde el mango tiene una longitud de 27 nt.
Como otro ejemplo, en algunos casos, la primera proteína C2c2 es un polipéptido Cas 13a que comprende una secuencia de aminoácidos que tiene al menos un 75 %, al menos un 80 %, al menos un 85 %, al menos un 90 %, al menos un 95 %, al menos un 98 %, al menos un 99 % o un 100 %, de identidad de secuencia de aminoácidos con la secuencia de aminoácidos de Ere Cas13a representada en la FIG. 56J; y el primer ARN guía de C2c2 comprende un mango (un tramo de nucleótidos que se une al polipéptido Cas 13a) que comprende una secuencia de nucleótidos que no tiene más de 1 nucleótido (nt), no tiene más de 2 nt, no tiene más de 3 nt, no tiene más de 4 nt o no tiene más de 5 nt de diferencia con respecto a la secuencia de nucleótidos AAGUAGCCCGAUAUAGAGGGCAAUAAC (SEQ ID NO: 23), donde el mango tiene una longitud de aproximadamente 25 nt, 26 nt, 27 nt, 28 nt, 29 nt o 30 nt. En algunos casos, el mango tiene la secuencia de nucleótidos AAGUAGCCCGAUAUAGAGGGCAAUAAC (SEQ ID NO: 23); y tiene una longitud de 27 nt. En algunos casos, la primera proteína C2c2 es un polipéptido Cas 13a que comprende una secuencia de aminoácidos que tiene al menos un 75 %, al menos un 80 %, al menos un 85 %, al menos un 90 %, al menos un 95 %, al menos un 98 %, al menos un 99 % o un 100 %, de identidad de secuencia de aminoácidos con la secuencia de aminoácidos de Ere Cas 13a representada en la FIG. 56J; y el primer ARN guía de C2c2 comprende un mango (un tramo de nucleótidos que se une al polipéptido Cas 13a) que comprende una secuencia de nucleótidos que no tiene más de 1 nucleótido (nt), no tiene más de 2 nt, no tiene más de 3 nt, no tiene más de 4 nt o no tiene más de 5 nt de diferencia con respecto a la secuencia de nucleótidos AUACAGCUCGAUAUAGUGAGCAAUAAG (SEQ ID NO: 24), donde el mango tiene una longitud de aproximadamente 25 nt, 26 nt, 27 nt, 28 nt, 29 nt o 30 nt. En algunos casos, el mango tiene la secuencia de nucleótidos AUACAGCUCGAUAUAGUGAGCAAUAAG (SEQ ID NO: 24); y tiene una longitud de 27 nt. En algunos casos, la segunda proteína C2c2 humana tiene una secuencia de aminoácidos que tiene al menos un 75 %, al menos un 80 %, al menos un 85 %, al menos un 90 %, al menos un 95 %, al menos un 98 %, al menos un 99 % o un 100 %, de identidad de secuencia de aminoácidos con la secuencia de aminoácidos de Hhe Cas13a representada en la FIG. 56J; y el segundo ARN guía de C2c2 comprende un mango (un tramo de nucleótidos que se une al polipéptido Cas 13a) que comprende una secuencia de nucleótidos que no tiene más de 1 nucleótido (nt), no tiene más de 2 nt, no tiene más de 3 nt, no tiene más de 4 nt o no tiene más de 5 nt de diferencia con respecto a la secuencia de nucleótidos GUAACAAUCCCCGUAGACAGGGGAACUGCAAC (SEQ ID NO: 17); donde el mango tiene una longitud de aproximadamente 30 nt, 31 nt, 32 nt, 33 nt, 34 nt o 35 nt. En algunos casos, el segundo ARN guía de C2c2 comprende un mango que comprende la secuencia de nucleótidos GUAACAAUCCCCGUAGACAGGGGAACUGCAAC (SEQ ID NO: 17); y el mango tiene una longitud de 32 nt. En algunos casos, la segunda proteína C2c2 humana tiene una secuencia de aminoácidos que tiene al menos un 75 %, al menos un 80 %, al menos un 85 %, al menos un 90 %, al menos un 95 %, al menos un 98 %, al menos un 99 % o un 100 %, de identidad de secuencia de aminoácidos con la secuencia de aminoácidos de Rca Cas 13a representada en la FIG. 56G; y el segundo ARN guía de C2c2 comprende un mango (un tramo de nucleótidos que se une al polipéptido Cas13a) que comprende una secuencia de nucleótidos que no tiene más de 1 nucleótido (nt), no tiene más de 2 nt, no tiene más de 3 nt, no tiene más de 4 nt o no tiene más de 5 nt de diferencia con respecto a la secuencia de nucleótidos UCACAUCACCGCCAAGACGACGGCGGACUGAACC (SEQ ID NO: 25); donde el mango tiene una longitud de aproximadamente 32 nt, 33 nt, 34 nt, 35 nt, 36 nt o 37 nt. En algunos casos, el segundo ARN guía de C2c2 comprende un mango que comprende la secuencia de nucleótidos UCACAUCACCGCCAAGACGACGGCGGACUGAACC (SEQ ID NO: 25); y el mango tiene una longitud de 34 nt. En algunos casos, la segunda proteína C2c2 humana tiene una secuencia de aminoácidos que tiene al menos un 75 %, al menos un 80 %, al menos un 85 %, al menos un 90 %, al menos un 95 %, al menos un 98 %, al menos un 99 % o un 100 %, de identidad de secuencia de aminoácidos con la secuencia de aminoácidos de Ppr Cas 13a representada en la FIG. 56B; y el segundo ARN guía de C2c2 comprende un mango (un tramo de nucleótidos que se une al polipéptido Cas13a) que comprende una secuencia de nucleótidos que no tiene más de 1 nucleótido (nt), no tiene más de 2 nt, no tiene más de 3 nt, no tiene más de 4 nt o no tiene más de 5 nt de diferencia con respecto a la secuencia de nucleótidos AAUUAUCCCAAAAUUGAAGGGAACUACAAC (SEQ ID NO: 19); donde el mango tiene una longitud de aproximadamente 28 nt, 29 nt, 30 nt, 31 nt o 32 nt. En algunos casos, el segundo ARN guía de C2c2 comprende un mango que comprende la secuencia de nucleótidos AAUUAUCCCAAAAUUGAAGGGAACUACAAC (SEQ ID NO: 19) ; y el mango tiene una longitud de 30 nt. En algunos casos, la segunda proteína C2c2 humana tiene una secuencia de aminoácidos que tiene al menos un 75 %, al menos un 80 %, al menos un 85 %, al menos un 90 %, al menos un 95 %, al menos un 98 %, al menos un 99 % o un 100 %, de identidad de secuencia de aminoácidos con la secuencia de aminoácidos de Lne Cas 13a representada en la FIG. 56I; y el segundo ARN guía de C2c2 comprende un mango (un tramo de nucleótidos que se une al polipéptido Cas 13a) que comprende una secuencia de nucleótidos que no tiene más de 1 nucleótido (nt), no tiene más de 2 nt, no tiene más de 3 nt, no tiene más de 4 nt o no tiene más de 5 nt de diferencia con respecto a la secuencia de nucleótidos GAGUACCUCAAAACAAAAGAGGACUAAAAC (SEQ ID NO: 20) (por ejemplo, que comprende una secuencia de nucleótidos que tiene solo 1 nt, 2 nt, 3 nt, 4 nt o 5 nt, de diferencia con respecto a la secuencia de nucleótidos GAGUACCUCAAAACAAAAGAGGACUAAAAC (SEQ ID NO: 20)); donde el mango tiene una longitud de aproximadamente 28 nt, 29 nt, 30 nt, 31 nt o 32 nt. En algunos casos, el segundo ARN guía comprende un mango que comprende la secuencia de nucleótidos GAGUACCUCAAACAAAAGAGGACUAAAC (SEQ ID NO: 20); donde el mango tiene una longitud de 30 nt. En algunos casos, la segunda proteína C2c2 humana tiene una secuencia de aminoácidos que tiene al menos un 75 %, al menos un 80 %, al menos un 85 %, al menos un 90 %, al menos un 95 %, al menos un 98 %, al menos un 99 % o un 100 %, de identidad de secuencia de aminoácidos con la secuencia de aminoácidos de Lbu Cas13a representada en la FIG. 56C; y el segundo ARN guía de C2c2 comprende un mango (un tramo de nucleótidos que se une al polipéptido Cas 13a) que comprende una secuencia de nucleótidos que no tiene más de 1 nucleótido (nt), no tiene más de 2 nt, no tiene más de 3 nt, no tiene más de 4 nt o no tiene más de 5 nt de diferencia con respecto a la secuencia de nucleótidos GACCACCCCAAAAAUGAAGGGGACUAAAACA (SEQ ID NO: 9) (por ejemplo, que comprende una secuencia de nucleótidos que tiene solo 1 nt, 2 nt, 3 nt, 4 nt o 5 nt, de diferencia con respecto a la secuencia de nucleótidos GACCACCCCAAAAAUGAAGGGGACUAAAACA (SEQ ID NO: 9)); donde el mango tiene una longitud de aproximadamente 28 nt, 29 nt, 30 nt, 31 nt o 32 nt. En algunos casos, el segundo ARN guía comprende un mango que comprende la secuencia de nucleótidos GACCACCCCAAAAAUGAAGGGGACUAAAACA (Se Q ID NO: 9); donde el mango tiene una longitud de 31 nt. En algunos casos, la segunda proteína C2c2 humana tiene una secuencia de aminoácidos que tiene al menos un 75 %, al menos un 80 %, al menos un 85 %, al menos un 90 %, al menos un 95 %, al menos un 98 %, al menos un 99 % o un 100 %, de identidad de secuencia de aminoácidos con la secuencia de aminoácidos de Lwa Cas 13a representada en la FIG. 56E; y el segundo ARN guía de C2c2 comprende un mango (un tramo de nucleótidos que se une al polipéptido Cas 13a) que comprende una secuencia de nucleótidos que no tiene más de 1 nucleótido (nt), no tiene más de 2 nt, no tiene más de 3 nt, no tiene más de 4 nt o no tiene más de 5 nt de diferencia con respecto a la secuencia de nucleótidos GACCACCCCAAUAUCGAAGGGGACUAAAACUU (SEQ ID NO: 21) (por ejemplo, que comprende una secuencia de nucleótidos que tiene solo 1 nt, 2 nt, 3 nt, 4 nt o 5 nt, de diferencia con respecto a la secuencia de nucleótidos GACCACCCCAAUAUCGAAGGGGACUAAAACUU (SEQ ID NO: 21); donde el mango tiene una longitud de aproximadamente 28 nt, 29 nt, 30 nt, 31 nt o 32 nt. En algunos casos, el segundo ARN guía comprende un mango que comprende la secuencia de nucleótidos GACCACCCCAAUAUCGAAGGGGACUAAAACUU (SEQ ID NO: 21); donde el mango tiene una longitud de 32 nt. En algunos casos, la segunda proteína C2c2 humana tiene una secuencia de aminoácidos que tiene al menos un 75 %, al menos un 80 %, al menos un 85 %, al menos un 90 %, al menos un 95 %, al menos un 98 %, al menos un 99 % o un 100 %, de identidad de secuencia de aminoácidos con la secuencia de aminoácidos de Lsh Cas13a representada en la FIG. 56D; y el segundo ARN guía de C2c2 comprende un mango (un tramo de nucleótidos que se une al polipéptido Cas 13a) que comprende una secuencia de nucleótidos que no tiene más de 1 nucleótido (nt), no tiene más de 2 nt, no tiene más de 3 nt, no tiene más de 4 nt o no tiene más de 5 nt de diferencia con respecto a la secuencia de nucleótidos CACCCCAAUAUCGAAGGGGACUAAAAC (SEQ ID NO: 22) (por ejemplo, que comprende una secuencia de nucleótidos que tiene solo 1 nt, 2 nt, 3 nt, 4 nt o 5 nt, de diferencia con respecto a la secuencia de nucleótidos CACCCCAAUAUCGAAGGGGACUAAAAC (SEQ ID NO: 22); donde el mango tiene una longitud de 25 nt, 26 nt, 27 nt, 28 nt o 29 nt. En algunos casos, el segundo ARN guía comprende un mango que comprende la secuencia de nucleótidos CACCCCAAUAUCGAAGGGGACUAAAAC (SEQ ID NO: 22); donde el mango tiene una longitud de 27 nt. En algunos casos, la segunda proteína C2c2 humana tiene una secuencia de aminoácidos que tiene al menos un 75 %, al menos un 80 %, al menos un 85 %, al menos un 90 %, al menos un 95 %, al menos un 98 %, al menos un 99% o un 100%, de identidad de secuencia de aminoácidos con la secuencia de aminoácidos de Lse Cas 13a representada en la FIG. 56A; y el segundo ARN guía de C2c2 comprende un mango (un tramo de nucleótidos que se une al polipéptido Cas13a) que comprende una secuencia de nucleótidos que no tiene más de 1 nucleótido (nt), no tiene más de 2 nt, no tiene más de 3 nt, no tiene más de 4 nt o no tiene más de 5 nt de diferencia con respecto a la secuencia de nucleótidos GACUACCUCUAUAUGAAAGAGGACUAAAAC (SEQ ID NO: 7); donde el mango tiene una longitud de aproximadamente 28 nt, 29 nt, 30 nt, 31 nt o 32 nt. En algunos casos, el segundo ARN guía de C2c2 comprende un mango que comprende la secuencia de nucleótidos GACUACCUCUAUAUGAAAGAGGACUAAAAC (SEQ ID NO: 7); y el mango tiene una longitud de 30 nt.
Como otro ejemplo, en algunos casos, la primera proteína C2c2 es un polipéptido Cas 13a que comprende una secuencia de aminoácidos que tiene al menos un 75 %, al menos un 80 %, al menos un 85 %, al menos un 90 %, al menos un 95 %, al menos un 98 %, al menos un 99 % o un 100 %, de identidad de secuencia de aminoácidos con la secuencia de aminoácidos de Cam Cas13a representada en la FIG. 56H; y el primer ARN guía de C2c2 comprende un mango (un tramo de nucleótidos que se une al polipéptido Cas 13a) que comprende una secuencia de nucleótidos que no tiene más de 1 nucleótido (nt), no tiene más de 2 nt, no tiene más de 3 nt, no tiene más de 4 nt o no tiene más de 5 nt de diferencia con respecto a la secuencia de nucleótidos GAACAGCCCGAUAUAGAGGGCAAUAGAC (SEQ ID NO: 26), donde el mango tiene una longitud de aproximadamente 26 nt, 27 nt, 28 nt, 29 nt o 30 nt. En algunos casos, el mango tiene la secuencia de nucleótidos GAACAGCCCGAUAUAGAGGGCAAUAGAC (SEQ ID NO: 26); y tiene una longitud de 28 nt. En algunos casos, la segunda proteína C2c2 humana tiene una secuencia de aminoácidos que tiene al menos un 75 %, al menos un 80 %, al menos un 85 %, al menos un 90 %, al menos un 95 %, al menos un 98 %, al menos un 99 % o un 100 %, de identidad de secuencia de aminoácidos con la secuencia de aminoácidos de Hhe Cas13a representada en la FIG. 56J; y el segundo ARN guía de C2c2 comprende un mango (un tramo de nucleótidos que se une al polipéptido Cas13a) que comprende una secuencia de nucleótidos que no tiene más de 1 nucleótido (nt), no tiene más de 2 nt, no tiene más de 3 nt, no tiene más de 4 nt o no tiene más de 5 nt de diferencia con respecto a la secuencia de nucleótidos GUAACAAUCCCCGUAGACAGGGGAACUGCAAC (SEQ ID NO: 17); donde el mango tiene una longitud de aproximadamente 30 nt, 31 nt, 32 nt, 33 nt, 34 nt o 35 nt. En algunos casos, el segundo ARN guía de C2c2 comprende un mango que comprende la secuencia de nucleótidos GUAACAAUCCCCGUAGACAGGGGAACUGCAAC (SEQ ID NO: 17); y el mango tiene una longitud de 32 nt. En algunos casos, la segunda proteína C2c2 humana tiene una secuencia de aminoácidos que tiene al menos un 75 %, al menos un 80 %, al menos un 85 %, al menos un 90 %, al menos un 95 %, al menos un 98 %, al menos un 99 % o un 100 %, de identidad de secuencia de aminoácidos con la secuencia de aminoácidos de Rca Cas 13a representada en la FIG. 56G; y el segundo ARN guía de C2c2 comprende un mango (un tramo de nucleótidos que se une al polipéptido Cas 13a) que comprende una secuencia de nucleótidos que no tiene más de 1 nucleótido (nt), no tiene más de 2 nt, no tiene más de 3 nt, no tiene más de 4 nt o no tiene más de 5 nt de diferencia con respecto a la secuencia de nucleótidos UCACAUCACCGCCAAGACGACGGCGGACUGAACC (SEQ ID NO: 25); donde el mango tiene una longitud de aproximadamente 32 nt, 33 nt, 34 nt, 35 nt, 36 nt o 37 nt. En algunos casos, el segundo ARN guía de C2c2 comprende un mango que comprende la secuencia de nucleótidos UCACAUCACCGCCAAGACGACGGCGGACUGAACC (SEQ ID NO: 25); y el mango tiene una longitud de 34 nt. En algunos casos, la segunda proteína C2c2 humana tiene una secuencia de aminoácidos que tiene al menos un 75 %, al menos un 80 %, al menos un 85 %, al menos un 90 %, al menos un 95 %, al menos un 98 %, al menos un 99 % o un 100 %, de identidad de secuencia de aminoácidos con la secuencia de aminoácidos de Ppr Cas 13a representada en la FIG. 56B; y el segundo ARN guía de C2c2 comprende un mango (un tramo de nucleótidos que se une al polipéptido Cas 13a) que comprende una secuencia de nucleótidos que no tiene más de 1 nucleótido (nt), no tiene más de 2 nt, no tiene más de 3 nt, no tiene más de 4 nt o no tiene más de 5 nt de diferencia con respecto a la secuencia de nucleótidos AAUUAUCCCAAAAUUGAAGGGAACUACAAC (SEQ ID NO: 19); donde el mango tiene una longitud de aproximadamente 28 nt, 29 nt, 30 nt, 31 nt o 32 nt. En algunos casos, el segundo ARN guía de C2c2 comprende un mango que comprende la secuencia de nucleótidos AAUUAUCCCAAAAUUGAAGGGAACUACAAC (SEQ ID NO: 19) ; y el mango tiene una longitud de 30 nt. En algunos casos, la segunda proteína C2c2 humana tiene una secuencia de aminoácidos que tiene al menos un 75 %, al menos un 80 %, al menos un 85 %, al menos un 90 %, al menos un 95 %, al menos un 98 %, al menos un 99 % o un 100 %, de identidad de secuencia de aminoácidos con la secuencia de aminoácidos de Lne Cas 13a representada en la FIG. 56I; y el segundo ARN guía de C2c2 comprende un mango (un tramo de nucleótidos que se une al polipéptido Cas13a) que comprende una secuencia de nucleótidos que no tiene más de 1 nucleótido (nt), no tiene más de 2 nt, no tiene más de 3 nt, no tiene más de 4 nt o no tiene más de 5 nt de diferencia con respecto a la secuencia de nucleótidos GAGUACCUCAAAACAAAAGAGGACUAAAAC (SEQ ID NO: 20) (por ejemplo, que comprende una secuencia de nucleótidos que tiene solo 1 nt, 2 nt, 3 nt, 4 nt o 5 nt, de diferencia con respecto a la secuencia de nucleótidos GAGUACCUCAAAACAAAAGAGGACUAAAAC (SEQ ID NO: 20)); donde el mango tiene una longitud de aproximadamente 28 nt, 29 nt, 30 nt, 31 nt o 32 nt. En algunos casos, el segundo ARN guía comprende un mango que comprende la secuencia de nucleótidos GAGUACCUCAAACAAAAGAGGACUAAAC (SEQ ID NO: 20); donde el mango tiene una longitud de 30 nt. En algunos casos, la segunda proteína C2c2 humana tiene una secuencia de aminoácidos que tiene al menos un 75 %, al menos un 80 %, al menos un 85 %, al menos un 90 %, al menos un 95 %, al menos un 98 %, al menos un 99 % o un 100 %, de identidad de secuencia de aminoácidos con la secuencia de aminoácidos de Lbu Cas 13a representada en la FIG. 56C; y el segundo ARN guía de C2c2 comprende un mango (un tramo de nucleótidos que se une al polipéptido Cas 13a) que comprende una secuencia de nucleótidos que no tiene más de 1 nucleótido (nt), no tiene más de 2 nt, no tiene más de 3 nt, no tiene más de 4 nt o no tiene más de 5 nt de diferencia con respecto a la secuencia de nucleótidos GACCACCCCAAAAAUGAAGGGGACUAAAACA (SEQ ID NO: 9) (por ejemplo, que comprende una secuencia de nucleótidos que tiene solo 1 nt, 2 nt, 3 nt, 4 nt o 5 nt, de diferencia con respecto a la secuencia de nucleótidos GACCACCCCAAAAAUGAAGGGGACUAAAACA (SEQ ID NO: 9)); donde el mango tiene una longitud de aproximadamente 28 nt, 29 nt, 30 nt, 31 nt o 32 nt. En algunos casos, el segundo ARN guía comprende un mango que comprende la secuencia de nucleótidos GACCACCCCAAAAAUGAAGGGGACUAAAACA (Se Q ID NO: 9); donde el mango tiene una longitud de 31 nt. En algunos casos, la segunda proteína C2c2 humana tiene una secuencia de aminoácidos que tiene al menos un 75 %, al menos un 80 %, al menos un 85 %, al menos un 90 %, al menos un 95 %, al menos un 98 %, al menos un 99 % o un 100 %, de identidad de secuencia de aminoácidos con la secuencia de aminoácidos de Lwa Cas 13a representada en la FIG. 56E; y el segundo ARN guía de C2c2 comprende un mango (un tramo de nucleótidos que se une al polipéptido Cas 13a) que comprende una secuencia de nucleótidos que no tiene más de 1 nucleótido (nt), no tiene más de 2 nt, no tiene más de 3 nt, no tiene más de 4 nt o no tiene más de 5 nt de diferencia con respecto a la secuencia de nucleótidos GACCACCCCAAUAUCGAAGGGGACUAAAACUU (SEQ ID NO: 21) (por ejemplo, que comprende una secuencia de nucleótidos que tiene solo 1 nt, 2 nt, 3 nt, 4 nt o 5 nt, de diferencia con respecto a la secuencia de nucleótidos GACCACCCCAAUAUCGAAGGGGACUAAAACUU (SEQ ID NO: 21); donde el mango tiene una longitud de aproximadamente 28 nt, 29 nt, 30 nt, 31 nt o 32 nt. En algunos casos, el segundo ARN guía comprende un mango que comprende la secuencia de nucleótidos GACCACCCCAAUAUCGAAGGGGACUAAAACUU (SEQ ID NO: 21); donde el mango tiene una longitud de 32 nt. En algunos casos, la segunda proteína C2c2 humana tiene una secuencia de aminoácidos que tiene al menos un 75 %, al menos un 80 %, al menos un 85 %, al menos un 90 %, al menos un 95 %, al menos un 98 %, al menos un 99 % o un 100 %, de identidad de secuencia de aminoácidos con la secuencia de aminoácidos de Lsh Cas13a representada en la FIG. 56D; y el segundo ARN guía de C2c2 comprende un mango (un tramo de nucleótidos que se une al polipéptido Cas13a) que comprende una secuencia de nucleótidos que no tiene más de 1 nucleótido (nt), no tiene más de 2 nt, no tiene más de 3 nt, no tiene más de 4 nt o no tiene más de 5 nt de diferencia con respecto a la secuencia de nucleótidos CACCCCAAUAUCGAAGGGGACUAAAAC (SEQ ID NO: 22) (por ejemplo, que comprende una secuencia de nucleótidos que tiene solo 1 nt, 2 nt, 3 nt, 4 nt o 5 nt, de diferencia con respecto a la secuencia de nucleótidos CACCCCAAUAUCGAAGGGGACUAAAAC (SEQ ID NO: 22); donde el mango tiene una longitud de 25 nt, 26 nt, 27 nt, 28 nt o 29 nt. En algunos casos, el segundo ARN guía comprende un mango que comprende la secuencia de nucleótidos CACCCCAAUAUCGAAGGGGACUAAAAC (SEQ ID NO: 22); donde el mango tiene una longitud de 27 nt. En algunos casos, la segunda proteína C2c2 humana tiene una secuencia de aminoácidos que tiene al menos un 75 %, al menos un 80 %, al menos un 85 %, al menos un 90 %, al menos un 95 %, al menos un 98 %, al menos un 99% o un 100%, de identidad de secuencia de aminoácidos con la secuencia de aminoácidos de Lse Cas13a representada en la FIG. 56A; y el segundo ARN guía de C2c2 comprende un mango (un tramo de nucleótidos que se une al polipéptido Cas13a) que comprende una secuencia de nucleótidos que no tiene más de 1 nucleótido (nt), no tiene más de 2 nt, no tiene más de 3 nt, no tiene más de 4 nt o no tiene más de 5 nt de diferencia con respecto a la secuencia de nucleótidos GACUACCUCUAUAUGAAAGAGGACUAAAAC (SEQ ID NO: 7); donde el mango tiene una longitud de aproximadamente 28 nt, 29 nt, 30 nt, 31 nt o 32 nt. En algunos casos, el segundo ARN guía de C2c2 comprende un mango que comprende la secuencia de nucleótidos GACUACCUCUAUAUGAAAGAGGACUAAAAC (SEQ ID NO: 7); y el mango tiene una longitud de 30 nt.
Multiplexación
Los siguientes métodos de multiplexación no forman parte de la invención. Como se ha indicado anteriormente, en algunos casos, un método de la presente divulgación comprende: a) poner en contacto una muestra (por ejemplo, una muestra que comprende un ARN diana y una pluralidad de ARN no diana) con: i) una matriz de ARN guía de C2c2 precursor que comprende dos o más ARN guía de C2c2, cada uno de los cuales tiene una secuencia guía diferente; y (ii) una proteína C2c2 que escinde la matriz de ARN guía de C2c2 precursor en ARN guía de C2c2 individuales, y también escinde los ARN de la muestra; y b) medir una señal detectable producida por la escisión de ARN mediada por proteína C2c2.
En algunos casos, pueden estar presentes dos o más ARN guía de C2c2 en una matriz (una matriz de ARN guía de C2c2 precursor). Una proteína C2c2 puede escindir la matriz de ARN guía de C2c2 precursor en ARN guía de C2c2 individuales (p. ej., véase la Fig. 4 y la Fig. 6).
En algunos casos, una matriz de ARN guía de C2c2 en cuestión incluye 2 o más ARN guía de C2c2 (por ejemplo, 3 o más, 4 o más, 5 o más, 6 o más, o 7 o más, ARN guía de C2c2). Los ARN guía de C2c2 de una matriz determinada pueden dirigirse (es decir, pueden incluir secuencias guía que hibridan con) diferentes sitios diana del mismo ARN diana (p. ej., lo que puede aumentar la sensibilidad de detección) y/o pueden dirigirse a diferentes moléculas de ARN diana (p. ej., una familia de transcritos, por ejemplo, basados en variaciones tales como polimorfismos de un solo nucleótido, polimorfismos de un solo nucleótido (SNP), etc. , y esto podría usarse, por ejemplo, para detectar múltiples cepas de un virus, tales como variantes del virus de la gripe, variantes del virus Zika, variantes del VIH y similares).
Proteína C2c2
Una proteína C2c2 se une a un ARN guía de C2c2, se guía a un ARN diana monocatenario por el ARN guía (que hibrida con el ARN diana) y, de este modo, se "activa". Si los dominios HEPN1 y HEPN2 de la proteína C2c2 están intactos, una vez activada, la proteína C2c2 escinde el ARN diana, pero también escinde los ARN no diana.
En la FIG. 8 se representan ejemplos de proteínas C2c2 existentes de forma natural y se exponen como SEQ ID NO: 1-6. En algunos casos, una proteína C2c2 en cuestión incluye una secuencia de aminoácidos que tiene un 80 % o más (por ejemplo, un 85 % o más, un 90 % o más, un 95 % o más, un 98 % o más, un 99 % o más, un 99,5 % o más o un 100 %) de identidad de secuencia de aminoácidos con la secuencia de aminoácidos establecida en una cualquiera de los SEQ ID NO: 1-6. En algunos casos, un polipéptido C2c2 adecuado comprende una secuencia de aminoácidos que tiene al menos un 80 %, al menos un 85 %, al menos un 90 %, al menos un 95 %, al menos un 98 %, al menos un 99 % o un 100 %, de identidad de secuencia de aminoácidos con la secuencia de aminoácidos de C2c2 de Listeria seeligeri expuesta en el SEQ ID NO: 1. En algunos casos, un polipéptido C2c2 adecuado comprende una secuencia de aminoácidos que tiene al menos un 80 %, al menos un 85 %, al menos un 90 %, al menos un 95 %, al menos un 98 %, al menos un 99 % o un 100 %, de identidad de secuencia de aminoácidos con la secuencia de aminoácidos de C2c2 de Leptotrichia buccalis expuesta en el SEQ ID NO: 2. En algunos casos, un polipéptido C2c2 adecuado comprende una secuencia de aminoácidos que tiene al menos un 80 %, al menos un 85 %, al menos un 90 %, al menos un 95 %, al menos un 98 %, al menos un 99 % o un 100 %, de identidad de secuencia de aminoácidos con la secuencia de aminoácidos de C2c2 de Rhodobacter capsulatus expuesta en el SEQ ID NO: 4. En algunos casos, un polipéptido C2c2 adecuado comprende una secuencia de aminoácidos que tiene al menos un 80 %, al menos un 85 %, al menos un 90 %, al menos un 95 %, al menos un 98 %, al menos un 99 % o un 100 %, de identidad de secuencia de aminoácidos con la secuencia de aminoácidos de C2c2 de Carnobacterium gallinarum expuesta en el SEQ ID NO: 5. En algunos casos, un polipéptido C2c2 adecuado comprende una secuencia de aminoácidos que tiene al menos un 80 %, al menos un 85 %, al menos un 90 %, al menos un 95 %, al menos un 98 %, al menos un 99 % o un 100 %, de identidad de secuencia de aminoácidos con la secuencia de aminoácidos de C2c2 de Herbinix hemicellulosilytica expuesta en el SEQ ID NO: 6. En algunos casos, la proteína C2c2 incluye una secuencia de aminoácidos que tiene un 80 % o más de identidad de secuencia de aminoácidos con la Secuencia de aminoácidos de C2c2 de Leptotrichia buccalis (Lbu) expuesta en SEQ ID NO: 2. En algunos casos, la proteína C2c2 es una proteína C2c2 de Leptotrichia buccalis (Lbu) (p. ej., véase el SEQ ID NO: 2). En algunos casos, la proteína C2c2 incluye la secuencia de aminoácidos establecida en una cualquiera de los SEQ ID NO: 1-2 y 4-6.
En algunos casos, una proteína C2c2 utilizada en un método de la presente divulgación no es una proteína C2c2 de Leptotrichia shahii (Lsh). En algunos casos, una proteína C2c2 utilizada en un método de la presente divulgación no es un polipéptido C2c2 que tiene al menos un 80 %, al menos un 85 %, al menos un 90 %, al menos un 95 %, al menos un 98 %, al menos un 99 % o un 100 %, de identidad de secuencia de aminoácidos con el polipéptido Lsh C2c2 expuesto en el SEQ ID NO: 3.
En algunos casos, la proteína C2c2 es más eficaz, en un factor de 1,2 veces o más, que una proteína C2c2 de Leptotrichia shahii (Lsh) en la escisión del ARN que no es la diana de un ARN guía de C2c2 del método. En algunos casos, la proteína C2c2 es más eficaz, en un factor de 1,5 veces o más, que una proteína C2c2 de Leptotrichia shahii (Lsh) en la escisión del ARN que no es la diana de un ARN guía de C2c2 del método. En algunos casos, el polipéptido C2c2 usado en un método de la presente divulgación, cuando se activa, escinde el ARN no diana al menos 1,2 veces, al menos 1,5 veces, al menos 2 veces, al menos 2,5 veces, al menos 3 veces, al menos 4 veces, al menos 5 veces, al menos 6 veces, al menos 7 veces, al menos 8 veces, al menos 9 veces, al menos 10 veces, al menos 15 veces, al menos 20 veces, al menos aproximadamente 30 veces o más de 30 veces, más eficazmente que Lsh C2c2.
En algunos casos, la proteína C2c2 presenta al menos un 50 % de eficacia de escisión de ARN dentro de la hora posterior a dicho contacto (por ejemplo, un 55 % o más, un 60 % o más, un 65 % o más, un 70 % o más o un 75 % o más de eficacia de escisión). En algunos casos, la proteína C2c2 presenta al menos un 50 % de eficacia de escisión de ARN dentro de los 40 minutos posteriores a dicho contacto (por ejemplo, un 55 % o más, un 60 % o más, un 65 % o más, un 70 % o más o un 75 % o más de eficacia de escisión). En algunos casos, la proteína C2c2 presenta al menos un 50 % de eficacia de escisión de ARN dentro de los 30 minutos posteriores a dicho contacto (por ejemplo, un 55 % o más, un 60 % o más, un 65 % o más, un 70 % o más o un 75 % o más de eficacia de escisión).
En algunos casos, una proteína C2c2 adecuada para su uso en un método de la presente divulgación escinde al menos un 50 %, al menos un 60 %, al menos un 70 %, al menos un 80 %, al menos un 90 %, al menos un 95 %, al menos un 98 %, al menos un 99 % o más de un 99 %, del ARN presente en una muestra en un período de tiempo de 30 segundos a 60 minutos, por ejemplo, de 1 minuto a 60 minutos, de 30 segundos a 5 minutos, de 1 minuto a 5 minutos, de 1 minuto a 10 minutos, de 5 minutos a 10 minutos, de 10 minutos a 15 minutos, de 15 minutos a 20 minutos, de 20 minutos a 25 minutos, de 25 minutos a 30 minutos, de 30 minutos a 35 minutos, de 35 minutos a 40 minutos, de 40 minutos a 45 minutos, de 45 minutos a 50 minutos, de 50 minutos a 55 minutos o de 55 minutos a 60 minutos. En algunos casos, una proteína C2c2 adecuada para su uso en un método de la presente divulgación escinde al menos un 50 %, al menos un 60 %, al menos un 70 %, al menos un 80 %, al menos un 90 %, al menos un 95 %, al menos un 98 %, al menos un 99 % o más de un 99 %, del ARN presente en una muestra en un período de tiempo de 30 segundos a 5 minutos (por ejemplo, de 1 minuto a 5 minutos, por ejemplo, en un período de tiempo de 1 minuto, 2 minutos, 3 minutos, 4 minutos o 5 minutos). En algunos casos, una proteína C2c2 adecuada para su uso en un método de la presente divulgación escinde al menos un 50 %, al menos un 60 %, al menos un 70 %, al menos un 80 %, al menos un 90 %, al menos un 95 %, al menos un 98 %, al menos un 99 % o más de un 99 %, del ARN presente en una muestra en un período de tiempo de 5 minutos a 10 minutos (por ejemplo, en un período de tiempo de 5 minutos, 6 minutos, 7 minutos, 8 minutos, 9 minutos o 10 minutos). En algunos casos, una proteína C2c2 adecuada para su uso en un método de la presente divulgación escinde al menos un 50 %, al menos un 60 %, al menos un 70 %, al menos un 80 %, al menos un 90 %, al menos un 95 %, al menos un 98 %, al menos un 99 % o más de un 99 %, del ARN presente en una muestra en un período de tiempo de 10 minutos a 15 minutos (por ejemplo, 10 minutos, 11 minutos, 12 minutos, 13 minutos, 14 minutos o 15 minutos). En algunos casos, una proteína C2c2 adecuada para su uso en un método de la presente divulgación escinde al menos un 50 %, al menos un 60 %, al menos un 70 %, al menos un 80 %, al menos un 90 %, al menos un 95 %, al menos un 98 %, al menos un 99 % o más de un 99 %, del ARN presente en una muestra en un período de tiempo de 15 minutos a 20 minutos. En algunos casos, una proteína C2c2 adecuada para su uso en un método de la presente divulgación escinde al menos un 50 %, al menos un 60 %, al menos un 70 %, al menos un 80 %, al menos un 90 %, al menos un 95 %, al menos un 98 %, al menos un 99 % o más de un 99 %, del ARN presente en una muestra en un período de tiempo de 20 minutos a 25 minutos. En algunos casos, una proteína C2c2 adecuada para su uso en un método de la presente divulgación escinde al menos un 50 %, al menos un 60 %, al menos un 70 %, al menos un 80 %, al menos un 90 %, al menos un 95 %, al menos un 98 %, al menos un 99 % o más de un 99 %, del ARN presente en una muestra en un período de tiempo de 25 minutos a 30 minutos. En algunos casos, una proteína C2c2 adecuada para su uso en un método de la presente divulgación escinde al menos un 50 %, al menos un 60 %, al menos un 70 %, al menos un 80 %, al menos un 90 %, al menos un 95 %, al menos un 98 %, al menos un 99 % o más de un 99 %, del ARN presente en una muestra en un período de tiempo de 30 minutos a 35 minutos. En algunos casos, una proteína C2c2 adecuada para su uso en un método de la presente divulgación escinde al menos un 50 %, al menos un 60 %, al menos un 70 %, al menos un 80 %, al menos un 90 %, al menos un 95 %, al menos un 98 %, al menos un 99 % o más de un 99 %, del ARN presente en una muestra en un período de tiempo de 35 minutos a 40 minutos. En algunos casos, una proteína C2c2 adecuada para su uso en un método de la presente divulgación escinde al menos un 50 %, al menos un 60 %, al menos un 70 %, al menos un 80 %, al menos un 90 %, al menos un 95 %, al menos un 98 %, al menos un 99 % o más de un 99 %, del ARN presente en una muestra en un período de tiempo de 40 minutos a 45 minutos. En algunos casos, una proteína C2c2 adecuada para su uso en un método de la presente divulgación escinde al menos un 50 %, al menos un 60 %, al menos un 70 %, al menos un 80 %, al menos un 90 %, al menos un 95 %, al menos un 98 %, al menos un 99 % o más de un 99 %, del ARN presente en una muestra en un período de tiempo de 45 minutos a 50 minutos. En algunos casos, una proteína C2c2 adecuada para su uso en un método de la presente divulgación escinde al menos un 50 %, al menos un 60 %, al menos un 70 %, al menos un 80 %, al menos un 90 %, al menos un 95 %, al menos un 98 %, al menos un 99 % o más de un 99 %, del ARN presente en una muestra en un período de tiempo de 50 minutos a 55 minutos. En algunos casos, una proteína C2c2 adecuada para su uso en un método de la presente divulgación escinde al menos un 50 %, al menos un 60 %, al menos un 70 %, al menos un 80 %, al menos un 90 %, al menos un 95 %, al menos un 98 %, al menos un 99 % o más de un 99 %, del ARN presente en una muestra en un período de tiempo de 55 minutos a 60 minutos. En algunos casos, una proteína C2c2 adecuada para su uso en un método de la presente divulgación escinde al menos un 50 %, al menos un 60 %, al menos un 70 %, al menos un 80 %, al menos un 90 %, al menos un 95 %, al menos un 98 %, al menos un 99 % o más de un 99 %, del ARN presente en una muestra en un período de tiempo inferior a 1 minuto, por ejemplo, en un período de tiempo de 50 segundos a 59 segundos, de 40 segundos a 49 segundos, de 30 segundos a 39 segundos o de 20 segundos a 29 segundos. En algunos casos, la escisión tiene lugar en condiciones fisiológicas. En algunos casos, la escisión tiene lugar a una temperatura de 15 °C a 20 °C, de 20 °C a 25 °C, de 25 °C a 30 °C, de 30 °C a 35 °C o de 35 °C a 40 °C. En algunos casos, la escisión tiene lugar a aproximadamente 37 °C. En algunos casos, la escisión tiene lugar a aproximadamente 37 °C y las condiciones de reacción incluyen iones metálicos divalentes. En algunos casos, el ion metálico divalente es Mg2+. En algunos casos, el ion metálico divalente es Mn2+. En algunos casos el pH de las condiciones de reacción está comprendido entre pH 5 y pH 6. En algunos casos el pH de las condiciones de reacción está comprendido entre pH 6 y pH 7. En algunos casos el pH de las condiciones de reacción está comprendido entre pH 6,5 y pH 7,5. En algunos casos, el pH de las condiciones de reacción está por encima de pH 7,5.
La expresión "eficacia de escisión" se usa en el presente documento para referirse a la capacidad de la proteína C2c2 para escindir rápidamente el ARN en la muestra una vez que la proteína C2c2 se ha activado por una hibridación apropiada de a Rn guía de C2c2/ARN diana. La "eficacia de escisión" se refiere a la cantidad de ARN que la proteína puede escindir en un período de tiempo determinado. Por ejemplo, una eficiencia de escisión del 50 % indicaría que el 50 % de un ARN determinado se escinde dentro de un período de tiempo específico. Por ejemplo, si un ARN está presente en una muestra a una concentración inicial de 100 pM, se ha logrado una escisión del 50 % cuando se ha escindido una concentración 50 pM del ARN. Como otro ejemplo, si una pluralidad de moléculas de ARN está presente en la muestra, se ha logrado una escisión del 50 % cuando se ha escindido el 50 % de las moléculas de ARN; la eficacia es una expresión de la cantidad de tiempo que se requiere para que se escinda un determinado porcentaje del ARN total. Esto se puede medir por cualquier método conveniente y muchos de estos métodos serán conocidos por un experto en la materia. Por ejemplo, se puede utilizar un ARN detector marcado. En algunos casos, las especies de ARN (las escindidas frente a las no escindidas) se pueden separar en un gel y la cantidad de ARN escindido se puede comparar con la cantidad de ARN no escindido, por ejemplo, véase la Fig. 3.
Cuando se usa la expresión "en donde la proteína C2c2 escinde al menos el X% de los ARN presentes en la muestra" (p. ej., dentro de un período de tiempo específico), se entiende que el X% de los ARN "productores de señal" presentes en la muestra se escinde dentro del período de tiempo específico. Cuales de los ARN son ARN "productores de señal" puede depender del método de detección utilizado. Por ejemplo, cuando se utiliza un ARN detector marcado, el ARN detector marcado podría ser el único "ARN productor de señal". Sin embargo, el ARN detector marcado se utiliza para representar los a Rn de la muestra y, por lo tanto, se supone que lo que se observa para el ARN detector marcado es representativo de lo que sucede con los ARN no diana de la muestra. De este modo, cuando se escinde el 50 % del a Rn detector marcado, por lo general, se supondrá que esto representa cuando se escinde el 50 % de los "ARN presentes en la muestra". En algunos casos, se está midiendo la escisión del ARN en general y, por lo tanto, todos los ARN escindibles de la muestra son "ARN productores de señales". Por lo tanto, cuando se refiere al % de ARN presentes en la muestra que se escinde, este valor se puede medir usando cualquier método conveniente, y cualquiera que sea el método que se use, en el presente documento se entiende generalmente que el valor se refiere a cuando la enzima ha escindido la mitad de las dianas escindibles en la muestra.
En algunos casos, la proteína C2c2 no es una proteína C2c2 de Leptotrichia shahii (Lsh). En algunos casos, la proteína C2c2 es más eficaz que una proteína C2c2 de Leptotrichia shahii (Lsh) (p. ej., en la escisión del ARN no diana) en un factor de 1,2 veces o más (p. ej., 1,5 veces o más, 1,7 veces o más o 2 veces o más). De este modo, en algunos casos, una proteína C2c2 en cuestión es más eficaz, en un factor de 1,2 veces o más (por ejemplo, 1,5 veces o más, 1,7 veces o más o 2 veces o más), que una proteína C2c2 de Leptotrichia shahii (Lsh) en la escisión del ARN que no es la diana del ARN guía de C2c2 del método. En algunos casos, el polipéptido C2c2 usado en un método de la presente divulgación, cuando se activa, escinde el ARN no diana al menos 1,2 veces, al menos 1,5 veces, al menos 2 veces, al menos 2,5 veces, al menos 3 veces, al menos 4 veces, al menos 5 veces, al menos 6 veces, al menos 7 veces, al menos 8 veces, al menos 9 veces, al menos 10 veces, al menos 15 veces, al menos 20 veces, al menos 30 veces o más de 30 veces, más eficazmente que Lsh C2c2.
Polipéptidos C2c2 variantes
Los polipéptidos C2C2 variantes desvelados en el presente documento que no pueden escindir el ARN detector marcado no se usan en el método o el kit de la invención. Los polipéptidos C2c2 variantes incluyen variantes de una cualquiera de los SEQ ID NO: 1, 2 y 4-6, donde el polipéptido C2c2 variante presenta una actividad de nucleasa reducida (o indetectable). Por ejemplo, en algunos casos, una proteína C2c2 variante carece de un dominio HEPN1 catalíticamente activo. Como otro ejemplo, una proteína C2c2 variante carece de un dominio HEPN2 catalíticamente activo. En algunos casos, una proteína C2c2 variante carece de un dominio HEPN1 catalíticamente activo y carece de un dominio HEPN2 catalíticamente activo.
En algunos casos, un polipéptido C2c2 variante comprende sustituciones de aminoácidos de 1, 2, 3 o 4 de los aminoácidos R472, H477, R1048 y H1053 de la secuencia de aminoácidos expuesta en el SEQ ID NO: 2 (C2c2 de Leptotrichia buccalis), o un aminoácido correspondiente de una secuencia de aminoácidos de C2c2 representada en el SEQ ID NO: 1, SEQ ID NO: 4, SEQ ID NO: 5 o SEQ ID NO: 6. Los aminoácidos correspondientes en el SEQ ID NO: 1, SEQ ID NO: 4, SEQ ID NO: 5 y SEQ ID NO: 6 se identifican fácilmente; véase, por ejemplo, la FIG. 22B. Por ejemplo, las posiciones amino en el SEQ ID NO: 1 (C2c2 de Listeria seeligeri) que corresponden a R472, H477, R1048 y H1053 del SEQ ID NO: 2 son R445, H450, R1016 y H1021, respectivamente. Como otro ejemplo, las posiciones de aminoácidos en el SEQ ID NO: 4 (C2c2 de Rhodobacter capsulatus) que corresponden a r 472, H477, R1048 y H1053 del SEQ ID NO: 2 son R464, H469, R1052 y H1057, respectivamente. Como otro ejemplo, las posiciones de aminoácidos en el SEQ ID NO: 5 (C2c2 de Carnobacterium gallinarum) que corresponden a R472, H477, R1048 y H1053 del SEQ ID NO: 2 son R467, H472, R1069 y H1074, respectivamente. Como otro ejemplo, las posiciones de aminoácidos en el SEQ ID NO: 6 (C2c2 de Herbinix hemicellulosilytica) que corresponden a R472, H477, R1048 y H1053 del SEQ ID NO: 2 son R472, H477, R1044 y H1049, respectivamente.
En algunos casos, un polipéptido C2c2 variante comprende sustituciones de aminoácidos de los aminoácidos R472 y H477 de la secuencia de aminoácidos expuesta en el SEQ ID NO: 2, o los aminoácidos correspondientes de una secuencia de aminoácidos de C2c2 representada en el SEQ ID NO: 1, SEQ ID NO: 4, SEQ ID NO: 5 o SEQ ID NO: 6. En algunos casos, un polipéptido C2c2 variante comprende sustituciones de aminoácidos de los aminoácidos R1048 y H1053 de la secuencia de aminoácidos expuesta en el SEQ ID NO: 2, o los aminoácidos correspondientes de una secuencia de aminoácidos de C2c2 representada en el SEQ ID NO: 1, SEQ ID NO: 4, SEQ ID NO: 5 o SEQ ID NO: 6. En algunos casos, un polipéptido C2c2 variante comprende sustituciones de aminoácidos de los aminoácidos R472, H477, R1048 y H1053 de la secuencia de aminoácidos establecida en el SEQ ID NO: 2, o los aminoácidos correspondientes de una secuencia de aminoácidos de C2c2 representada en el SEQ ID NO: 1, SEQ ID NO: 4, SEQ ID NO: 5 o SEQ ID NO: 6.
En algunos casos, un polipéptido C2c2 variante comprende una secuencia de aminoácidos que tiene al menos un 80 %, al menos un 85 %, al menos un 90 %, al menos un 95 %, al menos un 98 % o al menos un 99 %, de identidad de secuencia de aminoácidos con la secuencia de aminoácidos expuesta en el SEQ ID NO: 2, y comprende la sustitución de aminoácidos R472 y H477. En algunos casos, el aminoácido en la posición 472 es cualquier aminoácido distinto de Arg; y el aminoácido en la posición 477 es cualquier aminoácido distinto de His. En algunos casos, las sustituciones son R472A y H477A. En algunos casos, un polipéptido C2c2 variante comprende una secuencia de aminoácidos que tiene al menos un 80 %, al menos un 85 %, al menos un 90 %, al menos un 95 %, al menos un 98 % o al menos un 99 %, de identidad de secuencia de aminoácidos con la secuencia de aminoácidos expuesta en el SEQ ID NO: 2, y comprende la sustitución de aminoácidos R1048 y H1053. En algunos casos, el aminoácido en la posición 1048 es cualquier aminoácido distinto de Arg; y el aminoácido en la posición 1053 es cualquier aminoácido distinto de His. En algunos casos, las sustituciones son R1048A y H1053A. En algunos casos, un polipéptido C2c2 variante comprende una secuencia de aminoácidos que tiene al menos un 80 %, al menos un 85 %, al menos un 90 %, al menos un 95 %, al menos un 98 % o al menos un 99 %, de identidad de secuencia de aminoácidos con la secuencia de aminoácidos expuesta en el SEQ ID NO: 2, y comprende la sustitución de aminoácidos R472, H477, R1048 y H1053. En algunos casos, el aminoácido en las posiciones 472 y 1048 es cualquier aminoácido distinto de Arg; y el aminoácido en las posiciones 477 y 1053 es cualquier aminoácido distinto de His. En algunos casos, las sustituciones son R472A, H477A, R1048A y H1053A. En algunos casos, el polipéptido C2c2 variante tiene una escisión reducida o indetectable del ssRNA (por ejemplo, actividad de escisión guiada por ARN) y conserva la capacidad de unirse al ARN guía de C2c2 y al ssRNA. En algunos casos, el polipéptido C2c2 variante conserva la capacidad de escindir el ARN guía de C2c2 precursor. En algunos casos, el polipéptido C2c2 variante tiene una escisión reducida o indetectable del ssRNA (p. ej., actividad de escisión guiada por a Rn ), pero conserva la capacidad de unirse al ARN guía de C2c2 y al ssRNA, y conserva la capacidad de escindir el ARN guía precursor de C2c2.
En algunos casos, un polipéptido C2c2 variante comprende una secuencia de aminoácidos que tiene al menos un 80 %, al menos un 85 %, al menos un 90 %, al menos un 95 %, al menos un 98 % o al menos un 99 %, de identidad de secuencia de aminoácidos con la secuencia de aminoácidos expuesta en el SEQ ID NO: 1, y comprende la sustitución de aminoácidos R445 y H450. En algunos casos, el aminoácido en la posición 445 es cualquier aminoácido distinto de Arg; y el aminoácido en la posición 450 es cualquier aminoácido distinto de His. En algunos casos, las sustituciones son R445A y H450A. En algunos casos, un polipéptido C2c2 variante comprende una secuencia de aminoácidos que tiene al menos un 80 %, al menos un 85 %, al menos un 90 %, al menos un 95 %, al menos un 98 % o al menos un 99 %, de identidad de secuencia de aminoácidos con la secuencia de aminoácidos expuesta en el SEQ ID NO: 1, y comprende la sustitución de aminoácidos R1016 y H1021. En algunos casos, el aminoácido en la posición 1016 es cualquier aminoácido distinto de Arg; y el aminoácido en la posición 1021 es cualquier aminoácido distinto de His. En algunos casos, las sustituciones son R1016A y H1021A. En algunos casos, un polipéptido C2c2 variante comprende una secuencia de aminoácidos que tiene al menos un 80 %, al menos un 85 %, al menos un 90 %, al menos un 95 %, al menos un 98 % o al menos un 99 %, de identidad de secuencia de aminoácidos con la secuencia de aminoácidos expuesta en el SEQ ID NO: 1, y comprende la sustitución de aminoácidos R445, H450, R1016 y H1021. En algunos casos, el aminoácido en las posiciones 445 y 1016 es cualquier aminoácido distinto de Arg; y el aminoácido en las posiciones 450 y 1016 es cualquier aminoácido distinto de His. En algunos casos, las sustituciones son R445A, H450A, R1016A y H1021A. En algunos casos, el polipéptido C2c2 variante tiene una escisión reducida o indetectable del ssRNA (por ejemplo, actividad de escisión guiada por ARN) y conserva la capacidad de unirse al ARN guía de C2c2 y al ssRNA. En algunos casos, el polipéptido C2c2 variante conserva la capacidad de escindir el ARN guía de C2c2 precursor. En algunos casos, el polipéptido C2c2 variante tiene una escisión reducida o indetectable del ssRNA (p. ej., actividad de escisión guiada por a Rn ), pero conserva la capacidad de unirse al ARN guía de C2c2 y al ssRNA, y conserva la capacidad de escindir el ARN guía precursor de C2c2.
En algunos casos, un polipéptido C2c2 variante comprende una secuencia de aminoácidos que tiene al menos un 80 %, al menos un 85 %, al menos un 90 %, al menos un 95 %, al menos un 98 % o al menos un 99 %, de identidad de secuencia de aminoácidos con la secuencia de aminoácidos expuesta en el SEQ ID NO: 4 (C2c2 de Rhodobacter capsulatus) y comprende la sustitución de aminoácidos R464 y H469. En algunos casos, el aminoácido en la posición 464 es cualquier aminoácido distinto de Arg; y el aminoácido en la posición 469 es cualquier aminoácido distinto de His. En algunos casos, las sustituciones son R464A y H469A. En algunos casos, un polipéptido C2c2 variante comprende una secuencia de aminoácidos que tiene al menos un 80 %, al menos un 85 %, al menos un 90 %, al menos un 95 %, al menos un 98 % o al menos un 99 %, de identidad de secuencia de aminoácidos con la secuencia de aminoácidos expuesta en el SEQ ID NO: 4, y comprende la sustitución de aminoácidos R1052 y H1057. En algunos casos, el aminoácido en la posición 1052 es cualquier aminoácido distinto de Arg; y el aminoácido en la posición 1057 es cualquier aminoácido distinto de His. En algunos casos, las sustituciones son R1052A y H1057A. En algunos casos, un polipéptido C2c2 variante comprende una secuencia de aminoácidos que tiene al menos un 80 %, al menos un 85 %, al menos un 90 %, al menos un 95 %, al menos un 98 % o al menos un 99 %, de identidad de secuencia de aminoácidos con la secuencia de aminoácidos expuesta en el SEQ ID NO: 4, y comprende la sustitución de aminoácidos R464, H469, R1052 y H1057. En algunos casos, el aminoácido en las posiciones 464 y 1052 es cualquier aminoácido distinto de Arg; y el aminoácido en las posiciones 469 y 1057 es cualquier aminoácido distinto de His. En algunos casos, las sustituciones son R464A, H469A, R1052A y H1057A. En algunos casos, el polipéptido C2c2 variante tiene una escisión reducida o indetectable del ssRNA (por ejemplo, actividad de escisión guiada por ARN) y conserva la capacidad de unirse al ARN guía de C2c2 y al ssRNA. En algunos casos, el polipéptido C2c2 variante conserva la capacidad de escindir el ARN guía de C2c2 precursor. En algunos casos, el polipéptido C2c2 variante tiene una escisión reducida o indetectable del ssRNA (p. ej., actividad de escisión guiada por ARN), pero conserva la capacidad de unirse al ARN guía de C2c2 y al ssRNA, y conserva la capacidad de escindir el ARN guía precursor de C2c2.
En algunos casos, un polipéptido C2c2 variante comprende una secuencia de aminoácidos que tiene al menos un 80 %, al menos un 85 %, al menos un 90 %, al menos un 95 %, al menos un 98 % o al menos un 99 %, de identidad de secuencia de aminoácidos con la secuencia de aminoácidos expuesta en el SEQ ID NO: 5 (C2c2 de Carnobacterium gallinarum), y comprende la sustitución de aminoácidos R467 y H472. En algunos casos, el aminoácido en la posición 467 es cualquier aminoácido distinto de Arg; y el aminoácido en la posición 472 es cualquier aminoácido distinto de His. En algunos casos, las sustituciones son R469A y H472A. En algunos casos, un polipéptido C2c2 variante comprende una secuencia de aminoácidos que tiene al menos un 80 %, al menos un 85 %, al menos un 90 %, al menos un 95 %, al menos un 98 % o al menos un 99 %, de identidad de secuencia de aminoácidos con la secuencia de aminoácidos expuesta en el SEQ ID NO: 5, y comprende la sustitución de aminoácidos R1069 y H1074. En algunos casos, el aminoácido en la posición 1069 es cualquier aminoácido distinto de Arg; y el aminoácido en la posición 1074 es cualquier aminoácido distinto de His. En algunos casos, las sustituciones son R1069A y H1074A. En algunos casos, un polipéptido C2c2 variante comprende una secuencia de aminoácidos que tiene al menos un 80 %, al menos un 85 %, al menos un 90 %, al menos un 95 %, al menos un 98 % o al menos un 99 %, de identidad de secuencia de aminoácidos con la secuencia de aminoácidos expuesta en el SEQ ID NO: 5, y comprende la sustitución de aminoácidos R467, H472, R1069 y H1074. En algunos casos, el aminoácido en las posiciones 467 y 1069 es cualquier aminoácido distinto de Arg; y el aminoácido en las posiciones 472 y 1074 es cualquier aminoácido distinto de His. En algunos casos, las sustituciones son R469A, H472A, R1069A y H1074A. En algunos casos, el polipéptido C2c2 variante tiene una escisión reducida o indetectable del ssRNA (por ejemplo, actividad de escisión guiada por ARN) y conserva la capacidad de unirse al ARN guía de C2c2 y al ssRNA. En algunos casos, el polipéptido C2c2 variante conserva la capacidad de escindir el ARN guía de C2c2 precursor. En algunos casos, el polipéptido C2c2 variante tiene una escisión reducida o indetectable del ssRNA (p. ej., actividad de escisión guiada por ARN), pero conserva la capacidad de unirse al ARN guía de C2c2 y al ssRNA, y conserva la capacidad de escindir el ARN guía precursor de C2c2.
En algunos casos, un polipéptido C2c2 variante comprende una secuencia de aminoácidos que tiene al menos un 80 %, al menos un 85 %, al menos un 90 %, al menos un 95 %, al menos un 98 % o al menos un 99 %, de identidad de secuencia de aminoácidos con la secuencia de aminoácidos expuesta en el SEQ ID NO: 6 (C2c2 de Herbinixhemicellulosilytica), y comprende la sustitución de aminoácidos R472 y H477. En algunos casos, el aminoácido en la posición 472 es cualquier aminoácido distinto de Arg; y el aminoácido en la posición 477 es cualquier aminoácido distinto de His. En algunos casos, las sustituciones son R472A y H477A. En algunos casos, un polipéptido C2c2 variante comprende una secuencia de aminoácidos que tiene al menos un 80 %, al menos un 85 %, al menos un 90 %, al menos un 95 %, al menos un 98 % o al menos un 99 %, de identidad de secuencia de aminoácidos con la secuencia de aminoácidos expuesta en el SEQ ID NO: 6 , y comprende la sustitución de aminoácidos R1044 y H1049. En algunos casos, el aminoácido en la posición 1044 es cualquier aminoácido distinto de Arg; y el aminoácido en la posición 1049 es cualquier aminoácido distinto de His. En algunos casos, las sustituciones son R1044A y H1049A. En algunos casos, un polipéptido C2c2 variante comprende una secuencia de aminoácidos que tiene al menos un 80 %, al menos un 85 %, al menos un 90 %, al menos un 95 %, al menos un 98 % o al menos un 99 %, de identidad de secuencia de aminoácidos con la secuencia de aminoácidos expuesta en el SEQ ID NO: 6 , y comprende la sustitución de aminoácidos R472, H477, R1044 y H1049. En algunos casos, el aminoácido en las posiciones 472 y 1044 es cualquier aminoácido distinto de Arg; y el aminoácido en las posiciones 477 y 1049 es cualquier aminoácido distinto de His. En algunos casos, las sustituciones son R472A, H477A, R1044A y H1049A. En algunos casos, el polipéptido C2c2 variante tiene una escisión reducida o indetectable del ssRNA (por ejemplo, actividad de escisión guiada por ARN) y conserva la capacidad de unirse al ARN guía de C2c2 y al ssRNA. En algunos casos, el polipéptido C2c2 variante conserva la capacidad de escindir el ARN guía de C2c2 precursor. En algunos casos, el polipéptido C2c2 variante tiene una escisión reducida o indetectable del ssRNA (p. ej., actividad de escisión guiada por ARN), pero conserva la capacidad de unirse al ARN guía de C2c2 y al ssRNA, y conserva la capacidad de escindir el ARN guía precursor de C2c2.
En algunos casos, un polipéptido C2c2 variante comprende una secuencia de aminoácidos que tiene al menos un 80 %, al menos un 85 %, al menos un 90 %, al menos un 95 %, al menos un 98 % o al menos un 99 %, de identidad de secuencia de aminoácidos con la secuencia de aminoácidos expuesta en el SEQ ID NO: 2, y comprende la sustitución de 1, 2, 3 o 4 aminoácidos R472, H477, R1048 y H1053, de modo que el polipéptido C2c2 variante tiene una escisión reducida o indetectable del ssRNA (por ejemplo, actividad de escisión guiada por ARN) y conserva la capacidad de unirse al ARN guía de C2c2 y al ssRNA. En algunos casos, el polipéptido C2c2 variante conserva la capacidad de escindir el ARN guía de C2c2 precursor. Por ejemplo, en algunos casos, el polipéptido C2c2 variante presenta menos de un 50 %, menos de un 40 %, menos de un 30 %, menos de un 20 %, menos de un 10 %, menos de un 5 %, menos de un 1 % o menos de un 0,1 %, de la escisión guiada por ARN de un ARN no diana presentado por un polipéptido C2c2 que tiene la secuencia de aminoácidos expuesta en el SEQ ID NO: 2. En algunos casos, el polipéptido C2c2 variante tiene una escisión reducida o indetectable del ssRNA (p. ej., actividad de escisión guiada por ARN), pero conserva la capacidad de unirse al ARN guía de C2c2 y al ssRNA, y conserva la capacidad de escindir el ARN guía precursor de C2c2.
Cualquiera de los polipéptidos C2c2 variantes anteriores también puede incluir una mutación (por ejemplo, en una cualquiera de las posiciones R1079, R1072 y K1082, como se describe con más detalle a continuación) que tiene como resultado una capacidad reducida (p. ej., pérdida de capacidad) para escindir el ARN guía de C2c2 precursor.
En algunos casos, un polipéptido C2c2 variante tiene una capacidad reducida para escindir el ARN guía de C2c2 precursor (p. ej., véanse los ejemplos proporcionados más adelante y las Fig. relacionadas 26C-26D, 35D y 37). Por ejemplo, en algunos casos, un polipéptido C2c2 variante comprende sustituciones de aminoácidos de 1, 2 o 3 de los aminoácidos R1079, R1072 y K1082 de la secuencia de aminoácidos expuesta en el SEQ ID NO: 2 (C2c2 de Leptotrichia buccalis), o un aminoácido correspondiente de cualquier secuencia de aminoácidos C2c2 (por ejemplo, la secuencia de aminoácidos de C2c2 representada en el SEQ ID NO: 1, SEQ ID NO: 4, SEQ ID NO: 5 o SEQ iD NO: 6 ). Los aminoácidos correspondientes en el SEQ ID NO: 1, SEQ ID NO: 4, SEQ ID NO: 5 y SEQ ID NO: 6 se identifican fácilmente. Por ejemplo, las posiciones amino en el SEQ ID NO: 1 (C2c2 de Listeria seeligeri) que corresponden a R1079, R1072 y K1082 del SEQ ID NO: 2 son R1048, R1041 y k 1051, respectivamente. Como otro ejemplo, las posiciones de aminoácidos en el SEQ ID NO: 4 (C2c2 de Rhodobacter capsulatus) que corresponden a R1079, R1072 y K1082 del SEQ ID NO: 2 son R1085, R1078 y K1088, respectivamente. Como otro ejemplo, las posiciones de aminoácidos en el SEQ ID NO: 5 (C2c2 de Carnobacterium gallinarum) que corresponden a R1079, R1072 y K1082 del SEQ ID NO: 2 son R1099, R1092 y K1102, respectivamente. Como otro ejemplo, las posiciones de aminoácidos en el SEQ ID NO: 6 (C2c2 de Herbinixhemicellulosilytica) que corresponden a R1079 y R1072 del SEQ ID NO: 2 son R1172 y R1165, respectivamente.
En algunos casos, un polipéptido C2c2 variante comprende una sustitución de aminoácido del aminoácido R1079 (p. ej., R1079A) de la secuencia de aminoácidos expuesta en el SEQ ID NO: 2, o el aminoácido correspondiente de cualquier secuencia de aminoácidos de C2c2 (p. ej., una secuencia de aminoácidos de C2c2 representada en el SEQ ID NO: 1, SEQ ID NO: 4, SEQ ID NO: 5 o SEQ ID NO: 6 ). En algunos casos, un polipéptido C2c2 variante comprende una sustitución de aminoácido del aminoácido R1072 (p. ej., R1072A) de la secuencia de aminoácidos expuesta en el SEQ ID NO: 2, o el aminoácido correspondiente de cualquier secuencia de aminoácidos de C2c2 (p. ej., una secuencia de aminoácidos de C2c2 representada en el SEQ ID NO: 1, SEQ ID NO: 4, SEQ ID NO: 5 o SEQ iD n O: 6 ). En algunos casos, un polipéptido C2c2 variante comprende una sustitución de aminoácido del aminoácido K1082 (p. ej., K1082A) de la secuencia de aminoácidos expuesta en el SEQ ID NO: 2, o el aminoácido correspondiente de cualquier secuencia de aminoácidos de C2c2 (p. ej., una secuencia de aminoácidos de C2c2 representada en el SEQ ID NO: 1, SEQ ID NO: 4, SEQ ID NO: 5 o SEQ ID NO: 6 ). En algunos casos, un polipéptido C2c2 variante comprende una o más (por ejemplo, dos o más, o las tres) sustituciones de aminoácidos en posiciones seleccionadas de R1079 (p. ej., R1079A). R1072 (p. ej., R1072A) y K1082 (p. ej., K1082A) de la secuencia de aminoácidos expuesta en el Se Q ID NO: 2, o el aminoácido correspondiente de cualquier secuencia de aminoácidos de C2c2 (p. ej., una secuencia de aminoácidos C2c2 representada en el SEQ ID NO: 1, SEQ ID NO: 4, SEQ ID NO: 5 o SEQ ID NO: 6 ).
En algunos casos, un polipéptido C2c2 variante comprende una secuencia de aminoácidos que tiene al menos un 80 %, al menos un 85 %, al menos un 90 %, al menos un 95 %, al menos un 98 % o al menos un 99 %, de identidad de secuencia de aminoácidos con la secuencia de aminoácidos expuesta en el SEQ ID NO: 2, y comprende una sustitución de aminoácido de aminoácido del aminoácido R1079 (p. ej., R1079A) de la secuencia de aminoácidos expuesta en el SEQ ID NO: 2, o el aminoácido correspondiente de cualquier secuencia de aminoácidos de C2c2 (por ejemplo, una secuencia de aminoácidos C2c2 representada en el SEQ iD NO: 1, SEQ ID NO: 4, SEQ ID NO: 5 o SEQ iD NO: 6 ). En algunos casos, un polipéptido C2c2 variante comprende una secuencia de aminoácidos que tiene al menos un 80 %, al menos un 85 %, al menos un 90 %, al menos un 95 %, al menos un 98 % o al menos un 99 %, de identidad de secuencia de aminoácidos con la secuencia de aminoácidos expuesta en el SEQ ID NO: 2, y comprende una sustitución de aminoácido de aminoácido del aminoácido R1072 (p. ej., R1072A) de la secuencia de aminoácidos expuesta en el SEQ ID NO: 2, o el aminoácido correspondiente de cualquier secuencia de aminoácidos de C2c2 (por ejemplo, una secuencia de aminoácidos C2c2 representada en el SEQ iD NO: 1, SEQ ID NO: 4, SEQ ID NO: 5 o SEQ ID NO: 6 ). En algunos casos, un polipéptido C2c2 variante comprende una secuencia de aminoácidos que tiene al menos un 80 %, al menos un 85 %, al menos un 90 %, al menos un 95 %, al menos un 98 % o al menos un 99 %, de identidad de secuencia de aminoácidos con la secuencia de aminoácidos expuesta en el SEQ ID NO: 2, y comprende una sustitución de aminoácido de aminoácido del aminoácido K1082 (p. ej., K1082A) de la secuencia de aminoácidos expuesta en el SEQ ID NO: 2, o el aminoácido correspondiente de cualquier secuencia de aminoácidos de C2c2 (por ejemplo, una secuencia de aminoácidos C2c2 representada en el SEQ iD NO: 1, SEQ ID NO: 4, SEQ ID NO: 5 o SEQ ID NO: 6 ). En algunos casos, un polipéptido C2c2 variante comprende una secuencia de aminoácidos que tiene al menos un 80 %, al menos un 85 %, al menos un 90 %, al menos un 95 %, al menos un 98 % o al menos un 99 %, de identidad de secuencia de aminoácidos con la secuencia de aminoácidos expuesta en el SEQ ID NO: 2, y comprende uno o más (por ejemplo, dos o más, o las tres) sustituciones de aminoácidos en posiciones seleccionadas de R1079 (p. ej., R1079A). R1072 (p. ej., R1072A) y K1082 (p. ej., K1082A) de la secuencia de aminoácidos expuesta en el SEQ ID NO: 2, o el aminoácido correspondiente de cualquier secuencia de aminoácidos de C2c2 (p. ej., una secuencia de aminoácidos C2c2 representada en el SEQ ID NO: 1, SEQ ID NO: 4, SEQ ID NO: 5 o SEQ iD n O: 6 ).
En algunos casos, un polipéptido C2c2 variante comprende una secuencia de aminoácidos que tiene al menos un 80 %, al menos un 85 %, al menos un 90 %, al menos un 95 %, al menos un 98 % o al menos un 99 %, de identidad de secuencia de aminoácidos con la secuencia de aminoácidos expuesta en el SEQ ID NO: 1, y comprende una sustitución de aminoácido de aminoácido del aminoácido R1041 (p. ej., R1041A) de la secuencia de aminoácidos expuesta en el SEQ ID NO: 1, o el aminoácido correspondiente de cualquier secuencia de aminoácidos de C2c2 (por ejemplo, una secuencia de aminoácidos C2c2 representada en el SEQ ID NO: 2, SEQ ID NO: 4, SEQ ID NO: 5 o SEQ ID NO: 6 ). En algunos casos, un polipéptido C2c2 variante comprende una secuencia de aminoácidos que tiene al menos un 80 %, al menos un 85 %, al menos un 90 %, al menos un 95 %, al menos un 98 % o al menos un 99 %, de identidad de secuencia de aminoácidos con la secuencia de aminoácidos expuesta en el SEQ ID NO: 1, y comprende una sustitución de aminoácido de aminoácido del aminoácido R1048 (p. ej., R1048A) de la secuencia de aminoácidos expuesta en el SEQ ID NO: 1, o el aminoácido correspondiente de cualquier secuencia de aminoácidos de C2c2 (por ejemplo, una secuencia de aminoácidos C2c2 representada en el SEQ ID NO: 2, SEQ ID NO: 4, SEQ ID NO: 5 o SEQ ID NO: 6 ). En algunos casos, un polipéptido C2c2 variante comprende una secuencia de aminoácidos que tiene al menos un 80 %, al menos un 85 %, al menos un 90 %, al menos un 95 %, al menos un 98 % o al menos un 99 %, de identidad de secuencia de aminoácidos con la secuencia de aminoácidos expuesta en el SEQ ID NO: 1, y comprende una sustitución de aminoácido de aminoácido del aminoácido K1051 (p. ej., K1051A) de la secuencia de aminoácidos expuesta en el SEQ ID NO: 1, o el aminoácido correspondiente de cualquier secuencia de aminoácidos de C2c2 (por ejemplo, una secuencia de aminoácidos C2c2 representada en el SEQ ID NO: 2, SEQ ID NO: 4, SEQ ID NO: 5 o SEQ ID NO: 6 ). En algunos casos, un polipéptido C2c2 variante comprende una secuencia de aminoácidos que tiene al menos un 80 %, al menos un 85 %, al menos un 90 %, al menos un 95 %, al menos un 98 % o al menos un 99 %, de identidad de secuencia de aminoácidos con la secuencia de aminoácidos expuesta en el SEQ ID NO: 1, y comprende uno o más (por ejemplo, dos o más, o las tres) sustituciones de aminoácidos en posiciones seleccionadas de R1048 (p. ej., R1048A). R1041 (p. ej., R1041A) y K1051 (p. ej., K1051A) de la secuencia de aminoácidos expuesta en el SEQ ID NO: 1, o el aminoácido correspondiente de cualquier secuencia de aminoácidos de C2c2 (p. ej., una secuencia de aminoácidos C2c2 representada en el SEQ ID NO: 2, SEQ ID NO: 4, SEQ ID NO: 5 o SEQ iD n O: 6 ).
En algunos casos, un polipéptido C2c2 variante comprende una secuencia de aminoácidos que tiene al menos un 80 %, al menos un 85 %, al menos un 90 %, al menos un 95 %, al menos un 98 % o al menos un 99 %, de identidad de secuencia de aminoácidos con la secuencia de aminoácidos expuesta en el SEQ ID NO: 4, y comprende una sustitución de aminoácido de aminoácido del aminoácido R1085 (p. ej., R1085A) de la secuencia de aminoácidos expuesta en el SEQ ID NO: 4, o el aminoácido correspondiente de cualquier secuencia de aminoácidos de C2c2 (por ejemplo, una secuencia de aminoácidos C2c2 representada en el SEQ iD NO: 1, SEQ ID NO: 2, SEQ ID NO: 5 o SEQ ID NO: 6 ). En algunos casos, un polipéptido C2c2 variante comprende una secuencia de aminoácidos que tiene al menos un 80 %, al menos un 85 %, al menos un 90 %, al menos un 95 %, al menos un 98 % o al menos un 99 %, de identidad de secuencia de aminoácidos con la secuencia de aminoácidos expuesta en el SEQ ID NO: 4, y comprende una sustitución de aminoácido de aminoácido del aminoácido R1078 (p. ej., R1078A) de la secuencia de aminoácidos expuesta en el SEQ ID NO: 4, o el aminoácido correspondiente de cualquier secuencia de aminoácidos de C2c2 (por ejemplo, una secuencia de aminoácidos C2c2 representada en el SEQ iD NO: 1, SEQ ID NO: 2, SEQ ID NO: 5 o SEQ iD NO: 6 ). En algunos casos, un polipéptido C2c2 variante comprende una secuencia de aminoácidos que tiene al menos un 80 %, al menos un 85 %, al menos un 90 %, al menos un 95 %, al menos un 98 % o al menos un 99 %, de identidad de secuencia de aminoácidos con la secuencia de aminoácidos expuesta en el SEQ ID NO: 4, y comprende una sustitución de aminoácido de aminoácido del aminoácido K1088 (p. ej., K1088A) de la secuencia de aminoácidos expuesta en el SEQ ID NO: 4, o el aminoácido correspondiente de cualquier secuencia de aminoácidos de C2c2 (por ejemplo, una secuencia de aminoácidos C2c2 representada en el SEQ iD NO: 1, SEQ ID NO: 2, SEQ ID NO: 5 o SEQ ID NO: 6 ). En algunos casos, un polipéptido C2c2 variante comprende una secuencia de aminoácidos que tiene al menos un 80 %, al menos un 85 %, al menos un 90 %, al menos un 95 %, al menos un 98 % o al menos un 99 %, de identidad de secuencia de aminoácidos con la secuencia de aminoácidos expuesta en el SEQ ID NO: 4, y comprende uno o más (por ejemplo, dos o más, o las tres) sustituciones de aminoácidos en posiciones seleccionadas de R1085 (p. ej., R1085A). R1078 (p. ej., R1078A) y K1088 (p. ej., K1088A) de la secuencia de aminoácidos expuesta en el SEQ ID NO: 4, o el aminoácido correspondiente de cualquier secuencia de aminoácidos de C2c2 (p. ej., una secuencia de aminoácidos C2c2 representada en el SEQ ID NO: 1, SEQ ID NO: 2, SEQ ID NO: 5 o SEQ iD n O: 6 ).
En algunos casos, un polipéptido C2c2 variante comprende una secuencia de aminoácidos que tiene al menos un 80 %, al menos un 85 %, al menos un 90 %, al menos un 95 %, al menos un 98 % o al menos un 99 %, de identidad de secuencia de aminoácidos con la secuencia de aminoácidos expuesta en el SEQ ID NO: 5, y comprende una sustitución de aminoácido de aminoácido del aminoácido R1099 (p. ej., R1099A) de la secuencia de aminoácidos expuesta en el SEQ ID NO: 5, o el aminoácido correspondiente de cualquier secuencia de aminoácidos de C2c2 (por ejemplo, una secuencia de aminoácidos C2c2 representada en el SEQ iD NO: 1, SEQ ID NO: 4, SEQ ID NO: 2 o SEQ iD NO: 6 ). En algunos casos, un polipéptido C2c2 variante comprende una secuencia de aminoácidos que tiene al menos un 80 %, al menos un 85 %, al menos un 90 %, al menos un 95 %, al menos un 98 % o al menos un 99 %, de identidad de secuencia de aminoácidos con la secuencia de aminoácidos expuesta en el SEQ ID NO: 5, y comprende una sustitución de aminoácido de aminoácido del aminoácido R1092 (p. ej., R1092A) de la secuencia de aminoácidos expuesta en el SEQ ID NO: 5, o el aminoácido correspondiente de cualquier secuencia de aminoácidos de C2c2 (por ejemplo, una secuencia de aminoácidos C2c2 representada en el SEQ iD NO: 1, SEQ ID NO: 4, SEQ ID NO: 2 o SEQ iD NO: 6 ). En algunos casos, un polipéptido C2c2 variante comprende una secuencia de aminoácidos que tiene al menos un 80 %, al menos un 85 %, al menos un 90 %, al menos un 95 %, al menos un 98 % o al menos un 99 %, de identidad de secuencia de aminoácidos con la secuencia de aminoácidos expuesta en el SEQ ID NO: 5, y comprende una sustitución de aminoácido de aminoácido del aminoácido K1102 (p. ej., K1102A) de la secuencia de aminoácidos expuesta en el SEQ ID NO: 5, o el aminoácido correspondiente de cualquier secuencia de aminoácidos de C2c2 (por ejemplo, una secuencia de aminoácidos C2c2 representada en el SEQ iD NO: 1, SEQ ID NO: 4, SEQ ID NO: 2 o SEQ ID NO: 6 ). En algunos casos, un polipéptido C2c2 variante comprende una secuencia de aminoácidos que tiene al menos un 80 %, al menos un 85 %, al menos un 90 %, al menos un 95 %, al menos un 98 % o al menos un 99 %, de identidad de secuencia de aminoácidos con la secuencia de aminoácidos expuesta en el SEQ ID NO: 5, y comprende uno o más (por ejemplo, dos o más, o las tres) sustituciones de aminoácidos en posiciones seleccionadas de R1099 (p. ej., R1099A). R1092 (p. ej., R1092A) y K1102 (p. ej., K1102A) de la secuencia de aminoácidos expuesta en el SEQ ID NO: 5, o el aminoácido correspondiente de cualquier secuencia de aminoácidos de C2c2 (p. ej., una secuencia de aminoácidos C2c2 representada en el SEQ ID NO: 1, SEQ ID NO: 4, SEQ ID NO: 2 o SEQ iD n O: 6 ).
En algunos casos, un polipéptido C2c2 variante comprende una secuencia de aminoácidos que tiene al menos un 80 %, al menos un 85 %, al menos un 90 %, al menos un 95 %, al menos un 98 % o al menos un 99 %, de identidad de secuencia de aminoácidos con la secuencia de aminoácidos expuesta en el SEQ ID NO: 6 , y comprende una sustitución de aminoácido de aminoácido del aminoácido R1172 (p. ej., R1172A) de la secuencia de aminoácidos expuesta en el SEQ ID NO: 6 , o el aminoácido correspondiente de cualquier secuencia de aminoácidos de C2c2 (por ejemplo, una secuencia de aminoácidos C2c2 representada en el SEQ iD NO: 1, SEQ ID NO: 4, SEQ ID NO: 5 o SEQ ID NO: 2. En algunos casos, un polipéptido C2c2 variante comprende una secuencia de aminoácidos que tiene al menos un 80 %, al menos un 85 %, al menos un 90 %, al menos un 95 %, al menos un 98 % o al menos un 99 %, de identidad de secuencia de aminoácidos con la secuencia de aminoácidos expuesta en el SEQ ID NO: 6 , y comprende una sustitución de aminoácido de aminoácido del aminoácido R1165 (p. ej., R1165A) de la secuencia de aminoácidos expuesta en el SEQ ID NO: 6 , o el aminoácido correspondiente de cualquier secuencia de aminoácidos de C2c2 (por ejemplo, una secuencia de aminoácidos C2c2 representada en el SEQ iD NO: 1, SEQ ID NO: 4, SEQ ID NO: 5 o SEQ iD NO: 2). En algunos casos, un polipéptido C2c2 variante comprende una secuencia de aminoácidos que tiene al menos un 80 %, al menos un 85 %, al menos un 90 %, al menos un 95 %, al menos un 98 % o al menos un 99 %, de identidad de secuencia de aminoácidos con la secuencia de aminoácidos expuesta en el SEQ ID NO: 6 , y comprende una o más (p. ej., las dos) sustituciones de aminoácidos en posiciones seleccionadas de R1172 (p. ej., R1172A) y R1165 (p. ej., R1165A) de la secuencia de aminoácidos expuesta en el SEQ ID NO: 6 , o el aminoácido correspondiente de cualquier secuencia de aminoácidos de C2c2 (por ejemplo, una secuencia de aminoácidos de C2c2 representada en el SEQ ID NO: 1, SEQ ID NO: 4, SEQ ID NO: 5 o SEQ ID NO: 2).
ARN guía de C2c2
Un ARN guía de C2c2 en cuestión (p. ej., un crRNA de C2c2) incluye una secuencia guía y una región constante (p. ej., una región que está en posición 5' con respecto a la secuencia guía). La región que está en posición 5' con respecto a la secuencia guía se une a la proteína C2c2 (y puede considerarse una región de unión a proteínas) mientras que la secuencia guía hibrida con una secuencia diana del ARN diana.
Secuencia guía
La secuencia guía tiene complementariedad con (hibrida con) una secuencia diana del ARN diana monocatenario. En algunos casos, la base del ARN diana que está inmediatamente en posición 3' con respecto a la secuencia diana (protoespaciador) no es una G. En algunos casos, la secuencia guía tiene 16-28 nucleótidos (nt) de longitud (p. ej., 16-26, 16-24, 16-22, 16-20, 16-18, 17-26, 17-24, 17-22, 17-20, 17-18, 18-26, 18-24 o 18-22 nt de longitud). En algunos casos, la secuencia guía tiene 18-24 nucleótidos de longitud. En algunos casos, la secuencia guía tiene al menos 16 nt de longitud (p. ej., al menos 18, 20 o 22 nt de longitud). En algunos casos, la secuencia guía tiene al menos 17 nt de longitud. En algunos casos, la secuencia guía tiene al menos 18 nt de longitud. En algunos casos, la secuencia guía tiene al menos 20 nt de longitud.
En algunos casos, la secuencia guía tiene un 80 % o más (por ejemplo, un 85 % o más, un 90 % o más, un 95 % o más o un 100 % de complementariedad) con la secuencia diana del ARN diana monocatenario. En algunos casos, la secuencia guía es un 100 % complementaria a la secuencia diana del ARN diana monocatenario.
Región constante
Cada una de las 3 secuencias siguientes es un ejemplo de una región constante de un ARN guía de C2c2 que existe de forma natural (p. ej., una región que está en posición 5' con respecto a la secuencia guía):
GACUACCUCUAUAUGAAAGAGGACUAAAAC (SEQ ID NO: 7)
(Listeria seeligeri) ("Lse")
CCACCCCAAUAUCGAAGGGGACUAAAACA (SEQ ID NO: 8 )
(Leptotrichia shahii) ("Lsh")
GACCACCCCAAAAAUGAAGGGGACUAAAACA (SEQ ID NO: 9)
(Leptotrichia buccalis) ("Lbu")
En algunas realizaciones, un ARN guía de C2c2 en cuestión incluye una secuencia de nucleótidos que tiene un 70 % o más de identidad (por ejemplo, un 80 % o más, un 85 % o más, un 90 % o más, un 95 % o más, un 98 % o más, un 99 % o más o un 100 % de identidad) con la secuencia expuesta en una cualquiera de los SEQ ID NO: 7-9. En algunas realizaciones, un ARN guía de C2c2 en cuestión incluye una secuencia de nucleótidos que tiene un 90 % o más de identidad (por ejemplo, un 95 % o más, un 98 % o más, un 99 % o más o un 100 % de identidad) con la secuencia expuesta en una cualquiera de los SEQ ID NO: 7-9. En algunas realizaciones, un ARN guía de C2c2 en cuestión incluye la secuencia de nucleótidos expuesta en una cualquiera de los SEQ ID NO: 7-9.
En algunas realizaciones, un ARN guía de C2c2 en cuestión incluye una secuencia de nucleótidos que tiene un 70 % o más de identidad (por ejemplo, un 80 % o más, un 85 % o más, un 90 % o más, un 95 % o más, un 98 % o más, un 99 % o más o un 100 % de identidad) con la secuencia expuesta en el SEQ ID NO: 9. En algunas realizaciones, un ARN guía de C2c2 en cuestión incluye una secuencia de nucleótidos que tiene un 90 % o más de identidad (por ejemplo, un 95 % o más, un 98 % o más, un 99 % o más o un 100 % de identidad) con la secuencia expuesta en el SEQ ID NO: 9. En algunas realizaciones, un ARN guía de C2c2 en cuestión incluye la secuencia de nucleótidos expuesta en el SEQ ID NO: 9.
En algunas realizaciones, un ARN guía de C2c2 en cuestión no incluye una secuencia de nucleótidos de un ARN guía de C2c2 de Leptotrichia shahii (LsH). Por ejemplo, en algunos casos, la proteína C2c2 que se utiliza no es una C2c2 de Leptotrichia shahii (p. ej., no es una proteína Lsh C2c2) y, en algunos de estos casos, el ARN guía de C2c2 que se usa tampoco es de Leptotrichia shahii (por ejemplo, el ARN guía utilizado no incluye la región constante de un ARN guía de Lsh C2c2). Por tanto, en algunos casos, un ARN guía de C2c2 en cuestión no incluye la secuencia expuesta en el SEQ ID NO: 8.
En algunos casos, el ARN guía de C2c2 incluye un dúplex de ARN de bicatenario (dúplex de dsRNA). Por ejemplo, véase la Fig. 7A que ilustra un ARN guía de C2c2 de Lbu hibridado con un ARN diana monocatenario, donde el ARN guía de C2c2 incluye un dúplex de dsRNA de 4 pares de bases (pb) de longitud. En algunos casos, un ARN guía de C2c2 incluye un dúplex de dsRNA con una longitud de 2 a 12 pb (por ejemplo, de 2 a 10 pb, de 2 a 8 pb, de 2 a 6 pb, de 2 a 5 pb, de 2 a 4 pb, de 3 a 12 pb, de 3 a 10 pb, de 3 a 8 pb, de 3 a 6 pb, de 3 a 5 pb, de 3 a 4 pb, de 4 a 12 pb, de 4 a 10 pb, de 4 a 8 pb, de 4 a 6 pb o de 4 a 5 pb). En algunos casos, un ARN guía de C2c2 incluye un dúplex de dsRNA de 2 pb o más de longitud (por ejemplo, 3 o más, 4 o más, 5 o más, 6 o más o 7 o más pb de longitud. En algunos casos, un ARN guía de C2c2 incluye un dúplex de dsRNA que es más largo que el dúplex de dsRNA de un ARN guía de C2c2 de tipo silvestre correspondiente. Por ejemplo, véase la Fig. 7A, que ilustra un ARN guía de C2c2 de Lbu hibridado con un ARN diana monocatenario, donde el ARN guía de C2c2 incluye un dúplex de dsRNA de 4 pares de bases (pb) de longitud. De este modo, un ARN guía de C2c2 puede, en algunos casos, incluir un dúplex de dsRNA de 5 pb o más de longitud (por ejemplo, 6 o más, 7 o más u 8 o más pb de longitud. En algunos casos, un ARN guía de C2c2 incluye un dúplex de dsRNA que es más corto que el dúplex de dsRNA de un ARN guía de C2c2 de tipo silvestre correspondiente. De tal manera, en algunos casos, un ARN guía de C2c2 incluye un dúplex de dsRNA de menos de 4 pb de longitud. En algunos casos, un ARN guía de C2c2 incluye un dúplex de dsRNA que tiene una longitud de 2 o 3 pb.
En algunos casos, la región de un ARN guía de C2c2 que está en posición 5' con respecto a la secuencia guía tiene 15 o más nucleótidos (nt) de longitud (por ejemplo, 18 o más, 20 o más, 21 o más, 22 o más, 23 o más, 24 o más, 25 o más, 26 o más, 27 o más, 28 o más, 29 o más, 30 o más, 31 o más nt, 32 o más, 33 o más, 34 o más o 35 o más nt de longitud. En algunos casos, la región de un ARN guía de C2c2 que está en posición 5' con respecto a la secuencia guía tiene 29 o más nt de longitud.
En algunos casos, la región de un ARN guía de C2c2 que está en posición 5' con respecto a la secuencia guía tiene una longitud en un intervalo de 12 a 100 nt (por ejemplo, de 12 a 90, 12 a 80, 12 a 70, 12 a 60, 12 a 50, 12 a 40, 15 a 100, 15 a 90, 15 a 80, 15 a 70, 15 a 60, 15 a 50, 15 a 40, 20 a 100, 20 a 90, 20 a 80, 20 a 70, 20 a 60, 20 a 50, 20 a 40, 25 a 100, 25 a 90, 25 a 80, 25 a 70, 25 a 60, 25 a 50, 25 a 40, 28 a 100, 28 a 90, 28 a 80, 28 a 70, 28 a 60, 28 a 50, 28 a 40, 29 a 100, 29 a 90, 29 a 80, 29 a 70, 29 a 60, 29 a 50 o 29 a 40 nt). En algunos casos, la región de un ARN guía de C2c2 que está en posición 5' con respecto a la secuencia guía tiene una longitud en un intervalo de 28 a 100 nt. En algunos casos, la región de un ARN guía de C2c2 que está en posición 5' con respecto a la secuencia guía tiene una longitud en un intervalo de 28 a 40 nt.
En algunos casos, la región del ARN guía de C2c2 que está en posición 5' con respecto a la secuencia guía está truncada en relación con (es más corta que) la región correspondiente de un ARN guía de C2c2 de tipo silvestre correspondiente. Por ejemplo, el ARN guía de Lse C2c2 maduro incluye una región 5' de la secuencia guía que tiene 30 nucleótidos (nt) de longitud, y un ARN guía de C2c2 truncado en cuestión (en relación con el ARN guía de Lse C2c2) puede, por lo tanto, tener una región 5' de la secuencia guía de menos de 30 nt de longitud (p. ej., menos de 29, 28, 27, 26, 25, 22 o 20 nt de longitud). En algunos casos, un ARN guía de C2c2 truncado incluye una región 5' de la secuencia guía que tiene una longitud en un intervalo de 12 a 29 nt (por ejemplo, de 12 a 28, 12 a 27, 12 a 26, 12 a 25, 12 a 22, 12 a 20, 12 a 18 nt). En algunos casos, el ARN guía de C2c2 truncado está truncado por uno o más nt (por ejemplo, 2 o más, 3 o más, 4 o más, 5 o más o 10 o más nt), por ejemplo, en relación con una guía de C2c2 de tipo silvestre correspondiente).
En algunos casos, la región del ARN guía de C2c2 que está en posición 5' con respecto a la secuencia guía está truncada en relación con (es más larga que) la región correspondiente de un ARN guía de C2c2 de tipo silvestre correspondiente. Por ejemplo, el ARN guía de Lse C2c2 maduro incluye una región 5' de la secuencia guía que tiene 30 nucleótidos (nt) de longitud, y un ARN guía de C2c2 ampliado (en relación con el ARN guía de Lse C2c2) puede, por lo tanto, tener una región 5' de la secuencia guía que es mayor de 30 nt de longitud (p. ej., mayor de 31, mayor de 32, mayor de 33, mayor de 34 o mayor de 35 nt). En algunos casos, un ARN guía de C2c2 ampliado incluye una región 5' de la secuencia guía que tiene una longitud en un intervalo de 30 a 100 nt (por ejemplo, de 30 a 90, 30 a 80, 30 a 70, 30 a 60, 30 a 50 o 30 a 40 nt). En algunos casos, el ARN guía de C2c2 ampliado incluye una región 5' de la secuencia guía que está ampliada (p. ej., en relación con la región correspondiente de un ARN guía de C2 c2 de tipo silvestre correspondiente) en uno o más nt (p. ej., 2 o más, 3 o más, 4 o más, 5 o más o 10 o más nt).
En algunos casos, un ARN guía de C2c2 en cuestión tiene 30 o más nucleótidos (nt) de longitud (por ejemplo, 34 o más, 40 o más, 45 o más, 50 o más, 55 o más, 60 o más, 65 o más, 70 o más u 80 o más nt de longitud. En algunos casos, el ARN guía de C2c2 tiene 35 o más nt de longitud.
En algunos casos, un ARN guía de C2c2 en cuestión tiene una longitud en un intervalo de 30 a 120 nt (por ejemplo, de 30 a 110, 30 a 100, 30 a 90, 30 a 80, 30 a 70, 30 a 60, 35 a 120, 35 a 110, 35 a 100, 35 a 90, 35 a 80, 35 a 70, 35 a 60, 40 a 120, 40 a 110, 40 a 100, 40 a 90, 40 a 80, 40 a 70, 40 a 60, 50 a 120, 50 a 110, 50 a 100, 50 a 90, 50 a 80 o 50 a 70 nt). En algunos casos, el ARN guía de C2c2 tiene una longitud en un intervalo de 33 a 80 nt. En algunos casos, el ARN guía de C2c2 tiene una longitud en un intervalo de 35 a 60 nt.
En algunos casos, un ARN guía de C2c2 en cuestión está truncado en relación con (es más corto que) un ARN guía de C2c2 de tipo silvestre correspondiente. Por ejemplo, un ARN guía de Lse C2c2 maduro puede tener 50 nucleótidos (nt) de longitud, y un ARN guía de C2c2 truncado (en relación con el ARN guía de Lse C2c2) puede, por lo tanto, en algunos casos, tener menos de 50 nt de longitud (por ejemplo, menos de 49, 48, 47, 46, 45, 42 o 40 nt de longitud). En algunos casos, un ARN guía de C2c2 truncado tiene una longitud en un intervalo de 30 a 49 nt (por ejemplo, de 30 a 48, 30 a 47, 30 a 46, 30 a 45, 30 a 42, 30 a 40, 35 a 49, 35 a 48, 35 a 47, 35 a 46, 35 a 45, 35 a 42 o 35 a 40 nt). En algunos casos, el ARN guía de C2c2 truncado está truncado por uno o más nt (por ejemplo, 2 o más, 3 o más, 4 o más, 5 o más o 10 o más nt), por ejemplo, en relación con una guía de C2c2 de tipo silvestre correspondiente).
En algunos casos, un ARN guía de C2c2 en cuestión está ampliado en relación con (es más largo que) un ARN guía de C2c2 de tipo silvestre correspondiente. Por ejemplo, un ARN guía de Lse C2c2 maduro puede tener 50 nucleótidos (nt) de longitud, y un ARN guía de C2c2 ampliado (en relación con el ARN guía de Lse C2c2) puede, por lo tanto, en algunos casos, ser mayor de 50 nt de longitud (por ejemplo, mayor de 51, mayor de 52, mayor de 53, mayor de 54 o mayor de 55 nt). En algunos casos, un ARN guía de C2c2 ampliado tiene una longitud en un intervalo de 51 a 100 nt (por ejemplo, de 51 a 90, 51 a 80, 51 a 70, 51 a 60, 53 a 100, 53 a 90, 53 a 80, 53 a 70, 53 a 60, 55 a 100, 55 a 90, 55 a 80, 55 a 70 o 55 a 60 nt). En algunos casos, el ARN guía de C2c2 ampliado está ampliado (p. ej., en relación con un ARN guía de C2c2 de tipo silvestre correspondiente) en uno o más nt (p. ej., 2 o más, 3 o más, 4 o más, 5 o más o 10 o más nt).
MÉTODOS DE ESCISIÓN DE UNA MATRIZ DE ARN GUÍA DE C2C2 PRECURSOR
Los métodos y productos descritos en esta sección ("Métodos de escisión de una matriz de ARN guía de C2C2 precursor") no forman parte de la invención. En el presente documento se desvela un método de escisión una matriz de ARN guía de C2c2 precursor en dos o más ARN guía de C2c2. El método comprende poner en contacto una matriz de ARN guía de C2c2 precursor con una proteína C2c2. La matriz de ARN guía de C2c2 precursor comprende dos o más (por ejemplo, 2 , 3, 4, 5 o más) ARN guía de C2 c2 , cada uno de los cuales puede tener una secuencia guía diferente. La proteína C2c2 escinde la matriz de ARN guía de C2c2 precursor en a Rn guía de C2c2 individuales. En algunos casos, la región constante (también denominada "mango") de un ARN guía de C2c2 incluye una secuencia de nucleótidos del ARN guía precursor (p. ej., una secuencia que normalmente está presente antes de la escisión de la matriz de ARN guía). En otras palabras, en algunos casos, la región constante de un ARN guía de C2c2 en cuestión incluye un mango de crRNA precursor.
En algunos casos, la etapa de contacto no tiene lugar dentro de una célula, por ejemplo, dentro de una célula viva. En algunos casos, la etapa de contacto tiene lugar dentro de una célula (por ejemplo, una célula in vitro (en cultivo), una célula ex vivo o una célula in vivo). Cualquier célula es adecuada. Los ejemplos de células en las que puede tener lugar el contacto incluyen, entre otras: una célula eucariota; una célula procariota (por ejemplo, una célula bacteriana, una célula de arquea); un organismo eucariota unicelular; una célula vegetal; una célula de alga, por ejemplo, Botryococcus braunii, Chlamydomonas reinhardtii, Nannochloropsis gaditana, Chlorella pyrenoidosa, Sargassum patens, C. agardh, y similares; una célula fúngica (p. ej., una célula de levadura); una célula animal; una célula de invertebrado (por ejemplo, mosca de la fruta, cnidario, equinodermo, nematodo, un insecto, un arácnido, etc.); una célula de vertebrado (por ejemplo, pez, anfibio, reptil, ave, mamífero); una célula de mamífero (p. ej., un ser humano; un primate no humano; un ungulado; un félido; un bóvido; un óvido; un cáprido; una rata; un ratón; un roedor; un cerdo; una oveja; una vaca; etc.); una célula parásita (por ejemplo, helmintos, parásitos maláricos, etc.).
Proteína C2c2
Cuando una proteína C2c2 tiene dominios HEPN intactos, puede escindir el ARN (tanto el ARN diana como el ARN no diana) después de "activarse". Sin embargo, la proteína C2c2 también puede escindir los ARN guía de C2c2 precursores en ARN guía de C2c2 maduros de una manera independiente de HEPN. Por ejemplo, cuando una proteína C2c2 carece de un dominio HEPN1 catalíticamente activo y también carece de un dominio HEPN2 catalíticamente activo, todavía puede escindir el ARN guía precursor produciendo ARN guía maduro. De este modo, cuando se utiliza en un método que incluye un ARN guía de C2c2 precursor y/o una matriz de ARN guía de C2c2 precursor, la proteína C2c2 puede carecer (y lo hará en algunos casos) de un dominio HEPN1 catalíticamente activo y/o un dominio HEPN2 catalíticamente activo. En algunos casos, la proteína C2c2 carece de un dominio HEPN1 catalíticamente activo y carece de un dominio HEPN2 catalíticamente activo.
Una proteína C2c2 que carece de un dominio HEPN1 catalíticamente activo y que carece de un dominio HEPN2 catalíticamente activo puede usarse en algunos casos en métodos de unión (por ejemplo, métodos de obtención de imágenes). Por ejemplo, en algunos casos, un método de unión (y/o de obtención de imágenes) incluye poner en contacto una muestra con una matriz de ARN guía de C2c2 precursor y una proteína C2c2 que carece de un dominio HEPN1 catalíticamente activo y carece de un dominio HEPN2 catalíticamente activo. En estos casos, la proteína C2c2 se puede marcar de forma detectable (p. ej., fusionarse a etiqueta de epítopo, fusionarse a un fluoróforo, fusionarse a una proteína fluorescente tal como una proteína verde fluorescente, etc.).
Una proteína C2c2 adecuada para su uso en un método de la presente divulgación para escindir una matriz de ARN guía de C2c2 precursor puede tener dominios HEPN1 y HEPN2 intactos. Sin embargo, en algunos casos, la proteína C2c2 carece de un dominio HEPN1 catalíticamente activo y/o carece de un dominio HEPN2 catalíticamente activo.
En algunos casos, una proteína C2c2 adecuada para su uso en un método de la presente divulgación para escindir una matriz de ARN guía de C2c2 precursor incluye una secuencia de aminoácidos que tiene un 80 % o más (por ejemplo, un 85 % o más, un 90 % o más, un 95 % o más, un 98 % o más, un 99 % o más, un 99,5 % o más o un 100 %) de identidad de secuencia de aminoácidos con la secuencia de aminoácidos establecida en una cualquiera de los SEQ ID NO: 1-6. En algunos casos, una proteína C2c2 adecuada para su uso en un método de la presente divulgación para escindir una matriz de ARN guía de C2c2 precursor comprende una secuencia de aminoácidos que tiene al menos un 80 %, al menos un 85 %, al menos un 90 %, al menos un 95 %, al menos un 98 %, al menos un
99 % o un 100 %, de identidad de secuencia de aminoácidos con la secuencia de aminoácidos de C2c2 de Listeria seeligeri expuesta en el SEQ ID NO: 1. En algunos casos, una proteína C2c2 adecuada para su uso en un método de la presente divulgación para escindir una matriz de ARN guía de C2c2 precursor comprende una secuencia de aminoácidos que tiene al menos un 80 %, al menos un 85 %, al menos un 90 %, al menos un 95 %, al menos un 98 %, al menos un 99 % o un 100 %, de identidad de secuencia de aminoácidos con la secuencia de aminoácidos de C2c2 de Leptotrichia buccalis expuesta en el SEQ ID NO: 2. En algunos casos, una proteína C2c2 adecuada para su uso en un método de la presente divulgación para escindir una matriz de ARN guía de C2c2 precursor comprende una secuencia de aminoácidos que tiene al menos un 80 %, al menos un 85 %, al menos un 90 %, al menos un 95 %, al menos un 98%, al menos un 99% o un 100%, de identidad de secuencia de aminoácidos con la secuencia de aminoácidos de C2c2 de Rhodobacter capsulatus expuesta en el SEQ ID NO: 4. En algunos casos, una proteína C2c2 adecuada para su uso en un método de la presente divulgación para escindir una matriz de ARN guía de C2c2 precursor comprende una secuencia de aminoácidos que tiene al menos un 80 %, al menos un 85 %, al menos un
90 %, al menos un 95 %, al menos un 98 %, al menos un 99 % o un 100 %, de identidad de secuencia de aminoácidos con la secuencia de aminoácidos de C2c2 de Carnobacterium gallinarum expuesta en el SEQ ID NO: 5. En algunos casos, una proteína C2c2 adecuada para su uso en un método de la presente divulgación para escindir una matriz de ARN guía de C2c2 precursor comprende una secuencia de aminoácidos que tiene al menos un 80 %, al menos un 85 %, al menos un 90 %, al menos un 95 %, al menos un 98 %, al menos un 99 % o un 100 %, de identidad de secuencia de aminoácidos con la secuencia de aminoácidos de C2c2 de Herbinix hemicellulosilytica expuesta en el SEQ ID NO: 6. En algunos casos, una proteína C2c2 adecuada para su uso en un método de la presente divulgación para escindir una matriz de ARN guía de C2c2 precursor incluye una secuencia de aminoácidos que tiene un 80 % o más de identidad de secuencia de aminoácidos con la secuencia de aminoácidos de C2c2 de Leptotrichia buccalis (Lbu) expuesta en el SEQ ID NO: 2. En algunos casos, una proteína C2c2 adecuada para su inclusión en un kit de la presente divulgación es una proteína C2c2 de Leptotrichia buccalis (Lbu) (p. ej., véase el SEQ ID NO: 2). En algunos casos, una proteína C2c2 adecuada para su uso en un método de la presente divulgación para escindir una matriz de ARN guía de C2c2 precursor incluye la secuencia de aminoácidos expuesta en una cualquiera de los SEQ ID NO: 1­
2 y 4-6.
En algunos casos, una proteína C2c2 utilizada en un método de la presente divulgación para escindir una matriz de ARN guía de C2c2 precursor no es una proteína C2c2 de Leptotrichia shahii (Lsh). En algunos casos, una proteína C2c2 utilizada en un método de la presente divulgación para escindir una matriz de ARN guía de C2c2 precursor no es un polipéptido C2c2 que tiene al menos un 80 %, al menos un 85 %, al menos un 90 %, al menos un 95 %, al menos un 98 %, al menos un 99 % o un 100 %, de identidad de secuencia de aminoácidos con el polipéptido Lsh C2c2 expuesto en el SEQ ID NO: 3.
En algunos casos, un polipéptido C2c2 adecuado para su uso en un método de la presente divulgación para escindir una matriz de ARN guía de C2c2 precursor es un polipéptido C2c2 variante. Los polipéptidos C2c2 variantes adecuados para su uso en un método de la presente divulgación para escindir una matriz de ARN guía de C2c2 precursor incluyen variantes de una cualquiera de los SEQ ID NO: 1, 2 y 4-6, donde el polipéptido C2c2 variante presenta una actividad de nucleasa reducida (o indetectable). Por ejemplo, en algunos casos, una proteína C2c2 variante carece de un dominio HEPN1 catalíticamente activo. Como otro ejemplo, una proteína C2c2 variante carece de un dominio HEPN2 catalíticamente activo. En algunos casos, una proteína C2c2 variante carece de un dominio HEPN1 catalíticamente activo y carece de un dominio HEPN2 catalíticamente activo.
En algunos casos, un polipéptido C2c2 variante comprende sustituciones de aminoácidos de 1, 2, 3 o 4 de los aminoácidos R472, H477, R1048 y H1053 de la secuencia de aminoácidos expuesta en el SEQ ID NO: 2 (C2c2 de Leptotrichia buccalis), o un aminoácido correspondiente de una secuencia de aminoácidos de C2c2 representada en el SEQ ID NO: 1, SEQ ID NO: 4, SEQ ID NO: 5 o SEQ ID NO: 6. Los aminoácidos correspondientes en el SEQ ID NO:
1, SEQ ID NO: 4, SEQ ID NO: 5 y SEQ ID NO: 6 se identifican fácilmente; véase, por ejemplo, la FIG. 22B. Por ejemplo, las posiciones amino en el SEQ ID NO: 1 (C2c2 de Listeria seeligeri) que corresponden a R472, H477, R1048 y H1053 del SEQ ID NO: 2 son R445, H450, R1016 y H1021, respectivamente.
En algunos casos, un polipéptido C2c2 variante comprende sustituciones de aminoácidos de los aminoácidos R472 y H477 de la secuencia de aminoácidos expuesta en el SEQ ID NO: 2, o un aminoácido correspondiente de una secuencia de aminoácidos de C2c2 representada en el SEQ ID NO: 1, SEQ ID NO: 4, SEQ ID NO: 5 o SEQ ID NO: 6.
En algunos casos, un polipéptido C2c2 variante comprende sustituciones de aminoácidos de los aminoácidos R1048 y H1053 de la secuencia de aminoácidos expuesta en el SEQ ID NO: 2, o un aminoácido correspondiente de una secuencia de aminoácidos de C2c2 representada en el SEQ ID NO: 1, SEQ ID NO: 4, SEQ ID NO: 5 o SEQ ID NO: 6.
En algunos casos, un polipéptido C2c2 variante comprende sustituciones de aminoácidos de los aminoácidos R472, H477, R1048 y H1053 de la secuencia de aminoácidos expuesta en el SEQ ID NO: 2, o un aminoácido correspondiente de una secuencia de aminoácidos de C2c2 representada en el SEQ ID NO: 1, SEQ ID NO: 4, SEQ ID NO: 5 o SEQ
ID NO: 6.
En algunos casos, un polipéptido C2c2 variante comprende una secuencia de aminoácidos que tiene al menos un 80 %, al menos un 85 %, al menos un 90 %, al menos un 95 %, al menos un 98 % o al menos un 99 %, de identidad de secuencia de aminoácidos con la secuencia de aminoácidos expuesta en el SEQ ID NO: 2, y comprende la sustitución de aminoácidos R472 y H477. En algunos casos, el aminoácido en la posición 472 es cualquier aminoácido distinto de Arg; y el aminoácido en la posición 477 es cualquier aminoácido distinto de His. En algunos casos, las sustituciones son R472A y H477A. En algunos casos, un polipéptido C2c2 variante comprende una secuencia de aminoácidos que tiene al menos un 80 %, al menos un 85 %, al menos un 90 %, al menos un 95 %, al menos un 98 % o al menos un 99 %, de identidad de secuencia de aminoácidos con la secuencia de aminoácidos expuesta en el SEQ ID NO: 2, y comprende la sustitución de aminoácidos R1048 y H1053. En algunos casos, el aminoácido en la posición 1048 es cualquier aminoácido distinto de Arg; y el aminoácido en la posición 1053 es cualquier aminoácido distinto de His. En algunos casos, las sustituciones son R1048A y H1053A. En algunos casos, un polipéptido C2c2 variante comprende una secuencia de aminoácidos que tiene al menos un 80 %, al menos un 85 %, al menos un 90 %, al menos un 95 %, al menos un 98 % o al menos un 99 %, de identidad de secuencia de aminoácidos con la secuencia de aminoácidos expuesta en el SEQ ID NO: 2, y comprende la sustitución de aminoácidos R472, H477, R1048 y H1053. En algunos casos, el aminoácido en las posiciones 472 y 1048 es cualquier aminoácido distinto de Arg; y el aminoácido en las posiciones 477 y 1053 es cualquier aminoácido distinto de His. En algunos casos, las sustituciones son R472A, H477A, R1048A y H1053A. En algunos casos, el polipéptido C2c2 variante tiene una escisión reducida o indetectable del ssRNA (por ejemplo, actividad de escisión guiada por ARN) y conserva la capacidad de unirse al ARN guía de C2c2 y al ssRNA. En algunos casos, el polipéptido C2c2 variante conserva la capacidad de escindir el ARN guía de C2c2 precursor. En algunos casos, el polipéptido C2c2 variante tiene una escisión reducida o indetectable del ssRNA (p. ej., actividad de escisión guiada por a Rn ), pero conserva la capacidad de unirse al ARN guía de C2c2 y al ssRNA, y conserva la capacidad de escindir el ARN guía precursor de C2c2.
En algunos casos, un polipéptido C2c2 variante comprende una secuencia de aminoácidos que tiene al menos un 80 %, al menos un 85 %, al menos un 90 %, al menos un 95 %, al menos un 98 % o al menos un 99 %, de identidad de secuencia de aminoácidos con la secuencia de aminoácidos expuesta en el SEQ ID NO: 1, y comprende la sustitución de aminoácidos R445 y H450. En algunos casos, el aminoácido en la posición 445 es cualquier aminoácido distinto de Arg; y el aminoácido en la posición 450 es cualquier aminoácido distinto de His. En algunos casos, las sustituciones son R445A y H450A. En algunos casos, un polipéptido C2c2 variante comprende una secuencia de aminoácidos que tiene al menos un 80 %, al menos un 85 %, al menos un 90 %, al menos un 95 %, al menos un 98 % o al menos un 99 %, de identidad de secuencia de aminoácidos con la secuencia de aminoácidos expuesta en el SEQ ID NO: 1, y comprende la sustitución de aminoácidos R1016 y H1021. En algunos casos, el aminoácido en la posición 1016 es cualquier aminoácido distinto de Arg; y el aminoácido en la posición 1021 es cualquier aminoácido distinto de His. En algunos casos, las sustituciones son R1016A y H1021A. En algunos casos, un polipéptido C2c2 variante comprende una secuencia de aminoácidos que tiene al menos un 80 %, al menos un 85 %, al menos un 90 %, al menos un 95 %, al menos un 98 % o al menos un 99 %, de identidad de secuencia de aminoácidos con la secuencia de aminoácidos expuesta en el SEQ ID NO: 1, y comprende la sustitución de aminoácidos R445, H450, R1016 y H1021. En algunos casos, el aminoácido en las posiciones 445 y 1016 es cualquier aminoácido distinto de Arg; y el aminoácido en las posiciones 450 y 1016 es cualquier aminoácido distinto de His. En algunos casos, las sustituciones son R445A, H450A, R1016A y H1021A. En algunos casos, el polipéptido C2c2 variante tiene una escisión reducida o indetectable del ssRNA (por ejemplo, actividad de escisión guiada por ARN) y conserva la capacidad de unirse al ARN guía de C2c2 y al ssRNA. En algunos casos, el polipéptido C2c2 variante conserva la capacidad de escindir el ARN guía de C2c2 precursor. En algunos casos, el polipéptido C2c2 variante tiene una escisión reducida o indetectable del ssRNA (p. ej., actividad de escisión guiada por a Rn ), pero conserva la capacidad de unirse al ARN guía de C2c2 y al ssRNA, y conserva la capacidad de escindir el ARN guía precursor de C2c2.
En algunos casos, un polipéptido C2c2 variante comprende una secuencia de aminoácidos que tiene al menos un 80 %, al menos un 85 %, al menos un 90 %, al menos un 95 %, al menos un 98 % o al menos un 99 %, de identidad de secuencia de aminoácidos con la secuencia de aminoácidos expuesta en el SEQ ID NO: 4 (C2c2 de Rhodobacter capsulatus) y comprende la sustitución de aminoácidos R464 y H469. En algunos casos, el aminoácido en la posición 464 es cualquier aminoácido distinto de Arg; y el aminoácido en la posición 469 es cualquier aminoácido distinto de His. En algunos casos, las sustituciones son R464A y H469A. En algunos casos, un polipéptido C2c2 variante comprende una secuencia de aminoácidos que tiene al menos un 80 %, al menos un 85 %, al menos un 90 %, al menos un 95 %, al menos un 98 % o al menos un 99 %, de identidad de secuencia de aminoácidos con la secuencia de aminoácidos expuesta en el SEQ ID NO: 4, y comprende la sustitución de aminoácidos R1052 y H1057. En algunos casos, el aminoácido en la posición 1052 es cualquier aminoácido distinto de Arg; y el aminoácido en la posición 1057 es cualquier aminoácido distinto de His. En algunos casos, las sustituciones son R1052A y H1057A. En algunos casos, un polipéptido C2c2 variante comprende una secuencia de aminoácidos que tiene al menos un 80 %, al menos un 85 %, al menos un 90 %, al menos un 95 %, al menos un 98 % o al menos un 99 %, de identidad de secuencia de aminoácidos con la secuencia de aminoácidos expuesta en el SEQ ID NO: 4, y comprende la sustitución de aminoácidos R464, H469, R1052 y H1057. En algunos casos, el aminoácido en las posiciones 464 y 1052 es cualquier aminoácido distinto de Arg; y el aminoácido en las posiciones 469 y 1057 es cualquier aminoácido distinto de His. En algunos casos, las sustituciones son R464A, H469A, R1052A y H1057A. En algunos casos, el polipéptido C2c2 variante tiene una escisión reducida o indetectable del ssRNA (por ejemplo, actividad de escisión guiada por ARN) y conserva la capacidad de unirse al ARN guía de C2c2 y al ssRNA. En algunos casos, el polipéptido C2c2 variante conserva la capacidad de escindir el ARN guía de C2c2 precursor. En algunos casos, el polipéptido C2c2 variante tiene una escisión reducida o indetectable del ssRNA (p. ej., actividad de escisión guiada por ARN), pero conserva la capacidad de unirse al ARN guía de C2c2 y al ssRNA, y conserva la capacidad de escindir el ARN guía precursor de C2c2.
En algunos casos, un polipéptido C2c2 variante comprende una secuencia de aminoácidos que tiene al menos un 80 %, al menos un 85 %, al menos un 90 %, al menos un 95 %, al menos un 98 % o al menos un 99 %, de identidad de secuencia de aminoácidos con la secuencia de aminoácidos expuesta en el SEQ ID NO: 5 (C2c2 de Carnobacterium gallinarum), y comprende la sustitución de aminoácidos R467 y H472. En algunos casos, el aminoácido en la posición 467 es cualquier aminoácido distinto de Arg; y el aminoácido en la posición 472 es cualquier aminoácido distinto de His. En algunos casos, las sustituciones son R469A y H472A. En algunos casos, un polipéptido C2c2 variante comprende una secuencia de aminoácidos que tiene al menos un 80 %, al menos un 85 %, al menos un 90 %, al menos un 95 %, al menos un 98 % o al menos un 99 %, de identidad de secuencia de aminoácidos con la secuencia de aminoácidos expuesta en el SEQ ID NO: 5, y comprende la sustitución de aminoácidos R1069 y H1074. En algunos casos, el aminoácido en la posición 1069 es cualquier aminoácido distinto de Arg; y el aminoácido en la posición 1074 es cualquier aminoácido distinto de His. En algunos casos, las sustituciones son R1069A y H1074A. En algunos casos, un polipéptido C2c2 variante comprende una secuencia de aminoácidos que tiene al menos un 80 %, al menos un 85 %, al menos un 90 %, al menos un 95 %, al menos un 98 % o al menos un 99 %, de identidad de secuencia de aminoácidos con la secuencia de aminoácidos expuesta en el SEQ ID NO: 5, y comprende la sustitución de aminoácidos R467, H472, R1069 y H1074. En algunos casos, el aminoácido en las posiciones 467 y 1069 es cualquier aminoácido distinto de Arg; y el aminoácido en las posiciones 472 y 1074 es cualquier aminoácido distinto de His. En algunos casos, las sustituciones son R469A, H472A, R1069A y H1074A. En algunos casos, el polipéptido C2c2 variante tiene una escisión reducida o indetectable del ssRNA (por ejemplo, actividad de escisión guiada por ARN) y conserva la capacidad de unirse al ARN guía de C2c2 y al ssRNA. En algunos casos, el polipéptido C2c2 variante conserva la capacidad de escindir el ARN guía de C2c2 precursor. En algunos casos, el polipéptido C2c2 variante tiene una escisión reducida o indetectable del ssRNA (p. ej., actividad de escisión guiada por ARN), pero conserva la capacidad de unirse al ARN guía de C2c2 y al ssRNA, y conserva la capacidad de escindir el ARN guía precursor de C2c2.
En algunos casos, un polipéptido C2c2 variante comprende una secuencia de aminoácidos que tiene al menos un 80 %, al menos un 85 %, al menos un 90 %, al menos un 95 %, al menos un 98 % o al menos un 99 %, de identidad de secuencia de aminoácidos con la secuencia de aminoácidos expuesta en el SEQ ID NO: 6 (C2c2 de Herbinixhemicellulosilytica), y comprende la sustitución de aminoácidos R472 y H477. En algunos casos, el aminoácido en la posición 472 es cualquier aminoácido distinto de Arg; y el aminoácido en la posición 477 es cualquier aminoácido distinto de His. En algunos casos, las sustituciones son R472A y H477A. En algunos casos, un polipéptido C2c2 variante comprende una secuencia de aminoácidos que tiene al menos un 80 %, al menos un 85 %, al menos un 90 %, al menos un 95 %, al menos un 98 % o al menos un 99 %, de identidad de secuencia de aminoácidos con la secuencia de aminoácidos expuesta en el SEQ ID NO: 6 , y comprende la sustitución de aminoácidos R1044 y H1049. En algunos casos, el aminoácido en la posición 1044 es cualquier aminoácido distinto de Arg; y el aminoácido en la posición 1049 es cualquier aminoácido distinto de His. En algunos casos, las sustituciones son R1044A y H1049A. En algunos casos, un polipéptido C2c2 variante comprende una secuencia de aminoácidos que tiene al menos un 80 %, al menos un 85 %, al menos un 90 %, al menos un 95 %, al menos un 98 % o al menos un 99 %, de identidad de secuencia de aminoácidos con la secuencia de aminoácidos expuesta en el SEQ ID NO: 6 , y comprende la sustitución de aminoácidos R472, H477, R1044 y H1049. En algunos casos, el aminoácido en las posiciones 472 y 1044 es cualquier aminoácido distinto de Arg; y el aminoácido en las posiciones 477 y 1049 es cualquier aminoácido distinto de His. En algunos casos, las sustituciones son R472A, H477A, R1044A y H1049A. En algunos casos, el polipéptido C2c2 variante tiene una escisión reducida o indetectable del ssRNA (por ejemplo, actividad de escisión guiada por ARN) y conserva la capacidad de unirse al ARN guía de C2c2 y al ssRNA. En algunos casos, el polipéptido C2c2 variante conserva la capacidad de escindir el ARN guía de C2c2 precursor. En algunos casos, el polipéptido C2c2 variante tiene una escisión reducida o indetectable del ssRNA (p. ej., actividad de escisión guiada por ARN), pero conserva la capacidad de unirse al ARN guía de C2c2 y al ssRNA, y conserva la capacidad de escindir el ARN guía precursor de C2c2.
Matriz de ARN guía precursor de C2c2
Como se demuestra en los ejemplos de trabajo a continuación, una proteína C2c2 puede escindir un ARN guía de C2c2 precursor en un ARN guía maduro, por ejemplo, por escisión endorribonucleolítica del precursor. Como también se demuestra en los ejemplos de trabajo a continuación, una proteína C2c2 puede escindir una matriz de ARN guía de C2c2 precursor (que incluye más de un ARN guía de C2c2 dispuestos en tándem) en dos o más ARN guía de C2c2 individuales. Por lo tanto, en algunos casos, una matriz de ARN guía de C2c2 precursor comprende dos o más (por ejemplo, 3 o más, 4 o más, 5 o más, 2, 3, 4 o 5) ARN guía de C2c2 (p. ej., dispuestos en tándem como moléculas precursoras). En algunos casos, cada ARN guía de una matriz de ARN guía de C2c2 precursor tiene una secuencia guía diferente. En algunos casos, dos o más ARN guía de una matriz de ARN guía de C2c2 precursor tienen la misma secuencia guía.
En algunos casos, la matriz de ARN guía de C2c2 precursor comprende dos o más ARN guía de C2c2 que se dirigen a diferentes sitios diana dentro de la misma molécula de ARN diana. Por ejemplo, este escenario puede, en algunos casos, aumentar la sensibilidad de detección mediante la activación de la proteína C2c2 cuando cualquiera de ellos híbrida con la molécula de ARN diana.
En algunos casos, la matriz de ARN guía de C2c2 precursor comprende dos o más ARN guía de C2c2 que se dirigen a diferentes moléculas de ARN diana. Por ejemplo, este escenario puede dar como resultado una señal positiva cuando está presente uno cualquiera de una familia de posibles ARN diana. Esta matriz podría usarse para establecer como diana una familia de transcripciones, por ejemplo, basándose en la variación, tal los polimorfismos de un solo nucleótido (SNP) (p. ej., con fines de diagnóstico). Esto también podría ser útil para detectar si está presente una cualquiera de varias cepas de virus diferentes (por ejemplo, variantes del virus de la gripe, variantes del virus Zika, variantes del VIH y similares). Esto también podría ser útil para detectar si está presente una cualquiera de varias especies, cepas, aislados o variantes diferentes de una bacteria (por ejemplo, diferentes especies, cepas, aislados o variantes de Mycobacterium, diferentes especies, cepas, aislados o variantes de Neisseria, diferentes especies, cepas, aislados o variantes de Staphylococcus aureus; diferentes especies, cepas, aislados o variantes de E. coli; etc.)
POLIPÉPTIDOS C2C2 VARIANTES
También se describe (pero no forma parte de la invención) un polipéptido C2c2 variante, así como un ácido nucleico (p. ej., un vector de expresión recombinante) que comprende una secuencia de nucleótidos que codifica el polipéptido C2 c2 variante.
En algunos casos, un polipéptido C2c2 variante comprende una secuencia de aminoácidos que tiene al menos un 80 %, al menos un 85 %, al menos un 90 %, al menos un 95 %, al menos un 98 % o al menos un 99 %, de identidad de secuencia de aminoácidos con la secuencia de aminoácidos expuesta en el SEQ ID NO: 2, y comprende la sustitución de aminoácidos R472 y H477. En algunos casos, el aminoácido en la posición 472 es cualquier aminoácido distinto de Arg; y el aminoácido en la posición 477 es cualquier aminoácido distinto de His. En algunos casos, las sustituciones son R472A y H477A. En algunos casos, un polipéptido C2c2 variante comprende una secuencia de aminoácidos que tiene al menos un 80 %, al menos un 85 %, al menos un 90 %, al menos un 95 %, al menos un 98 % o al menos un 99 %, de identidad de secuencia de aminoácidos con la secuencia de aminoácidos expuesta en el SEQ ID NO: 2, y comprende la sustitución de aminoácidos R1048 y H1053. En algunos casos, el aminoácido en la posición 1048 es cualquier aminoácido distinto de Arg; y el aminoácido en la posición 1053 es cualquier aminoácido distinto de His. En algunos casos, las sustituciones son R1048A y H1053A. En algunos casos, un polipéptido C2c2 variante comprende una secuencia de aminoácidos que tiene al menos un 80 %, al menos un 85 %, al menos un 90 %, al menos un 95 %, al menos un 98 % o al menos un 99 %, de identidad de secuencia de aminoácidos con la secuencia de aminoácidos expuesta en el SEQ ID NO: 2, y comprende la sustitución de aminoácidos R472, H477, R1048 y H1053. En algunos casos, el aminoácido en las posiciones 472 y 1048 es cualquier aminoácido distinto de Arg; y el aminoácido en las posiciones 477 y 1053 es cualquier aminoácido distinto de His. En algunos casos, las sustituciones son R472A, H477A, R1048A y H1053A. En algunos casos, el polipéptido C2c2 variante tiene una escisión reducida o indetectable del ssRNA (por ejemplo, actividad de escisión guiada por ARN) y conserva la capacidad de unirse al ARN guía de C2c2 y al ssRNA. En algunos casos, el polipéptido C2c2 variante conserva la capacidad de escindir el ARN guía de C2c2 precursor. En algunos casos, el polipéptido C2c2 variante tiene una escisión reducida o indetectable del ssRNA (p. ej., actividad de escisión guiada por a Rn ), pero conserva la capacidad de unirse al ARN guía de C2c2 y al ssRNA, y conserva la capacidad de escindir el ARN guía precursor de C2c2.
En algunos casos, un polipéptido C2c2 variante comprende una secuencia de aminoácidos que tiene al menos un 80 %, al menos un 85 %, al menos un 90 %, al menos un 95 %, al menos un 98 % o al menos un 99 %, de identidad de secuencia de aminoácidos con la secuencia de aminoácidos expuesta en el SEQ ID NO: 1, y comprende la sustitución de aminoácidos R445 y H450. En algunos casos, el aminoácido en la posición 445 es cualquier aminoácido distinto de Arg; y el aminoácido en la posición 450 es cualquier aminoácido distinto de His. En algunos casos, las sustituciones son R445A y H450A. En algunos casos, un polipéptido C2c2 variante comprende una secuencia de aminoácidos que tiene al menos un 80 %, al menos un 85 %, al menos un 90 %, al menos un 95 %, al menos un 98 % o al menos un 99 %, de identidad de secuencia de aminoácidos con la secuencia de aminoácidos expuesta en el SEQ ID NO: 1, y comprende la sustitución de aminoácidos R1016 y H1021. En algunos casos, el aminoácido en la posición 1016 es cualquier aminoácido distinto de Arg; y el aminoácido en la posición 1021 es cualquier aminoácido distinto de His. En algunos casos, las sustituciones son R1016A y H1021A. En algunos casos, un polipéptido C2c2 variante comprende una secuencia de aminoácidos que tiene al menos un 80 %, al menos un 85 %, al menos un 90 %, al menos un 95 %, al menos un 98 % o al menos un 99 %, de identidad de secuencia de aminoácidos con la secuencia de aminoácidos expuesta en el SEQ ID NO: 1, y comprende la sustitución de aminoácidos R445, H450, R1016 y H1021. En algunos casos, el aminoácido en las posiciones 445 y 1016 es cualquier aminoácido distinto de Arg; y el aminoácido en las posiciones 450 y 1016 es cualquier aminoácido distinto de His. En algunos casos, las sustituciones son R445A, H450A, R1016A y H1021A. En algunos casos, el polipéptido C2c2 variante tiene una escisión reducida o indetectable del ssRNA (por ejemplo, actividad de escisión guiada por ARN) y conserva la capacidad de unirse al ARN guía de C2c2 y al ssRNA. En algunos casos, el polipéptido C2c2 variante conserva la capacidad de escindir el ARN guía de C2c2 precursor. En algunos casos, el polipéptido C2c2 variante tiene una escisión reducida o indetectable del ssRNA (p. ej., actividad de escisión guiada por a Rn ), pero conserva la capacidad de unirse al ARN guía de C2c2 y al ssRNA, y conserva la capacidad de escindir el ARN guía precursor de C2c2.
En algunos casos, un polipéptido C2c2 variante comprende una secuencia de aminoácidos que tiene al menos un 80 %, al menos un 85 %, al menos un 90 %, al menos un 95 %, al menos un 98 % o al menos un 99 %, de identidad de secuencia de aminoácidos con la secuencia de aminoácidos expuesta en el SEQ ID NO: 4 (C2c2 de Rhodobacter capsulatus) y comprende la sustitución de aminoácidos R464 y H469. En algunos casos, el aminoácido en la posición 464 es cualquier aminoácido distinto de Arg; y el aminoácido en la posición 469 es cualquier aminoácido distinto de His. En algunos casos, las sustituciones son R464A y H469A. En algunos casos, un polipéptido C2c2 variante comprende una secuencia de aminoácidos que tiene al menos un 80 %, al menos un 85 %, al menos un 90 %, al menos un 95 %, al menos un 98 % o al menos un 99 %, de identidad de secuencia de aminoácidos con la secuencia de aminoácidos expuesta en el SEQ ID NO: 4, y comprende la sustitución de aminoácidos R1052 y H1057. En algunos casos, el aminoácido en la posición 1052 es cualquier aminoácido distinto de Arg; y el aminoácido en la posición 1057 es cualquier aminoácido distinto de His. En algunos casos, las sustituciones son R1052A y H1057A. En algunos casos, un polipéptido C2c2 variante comprende una secuencia de aminoácidos que tiene al menos un 80 %, al menos un 85 %, al menos un 90 %, al menos un 95 %, al menos un 98 % o al menos un 99 %, de identidad de secuencia de aminoácidos con la secuencia de aminoácidos expuesta en el SEQ ID NO: 4, y comprende la sustitución de aminoácidos R464, H469, R1052 y H1057. En algunos casos, el aminoácido en las posiciones 464 y 1052 es cualquier aminoácido distinto de Arg; y el aminoácido en las posiciones 469 y 1057 es cualquier aminoácido distinto de His. En algunos casos, las sustituciones son R464A, H469A, R1052A y H1057A. En algunos casos, el polipéptido C2c2 variante tiene una escisión reducida o indetectable del ssRNA (por ejemplo, actividad de escisión guiada por ARN) y conserva la capacidad de unirse al ARN guía de C2c2 y al ssRNA. En algunos casos, el polipéptido C2c2 variante conserva la capacidad de escindir el ARN guía de C2c2 precursor. En algunos casos, el polipéptido C2c2 variante tiene una escisión reducida o indetectable del ssRNA (p. ej., actividad de escisión guiada por ARN), pero conserva la capacidad de unirse al ARN guía de C2c2 y al ssRNA, y conserva la capacidad de escindir el ARN guía precursor de C2c2.
En algunos casos, un polipéptido C2c2 variante comprende una secuencia de aminoácidos que tiene al menos un 80 %, al menos un 85 %, al menos un 90 %, al menos un 95 %, al menos un 98 % o al menos un 99 %, de identidad de secuencia de aminoácidos con la secuencia de aminoácidos expuesta en el SEQ ID NO: 5 (C2c2 de Carnobacterium gallinarum), y comprende la sustitución de aminoácidos R467 y H472. En algunos casos, el aminoácido en la posición 467 es cualquier aminoácido distinto de Arg; y el aminoácido en la posición 472 es cualquier aminoácido distinto de His. En algunos casos, las sustituciones son R469A y H472A. En algunos casos, un polipéptido C2c2 variante comprende una secuencia de aminoácidos que tiene al menos un 80 %, al menos un 85 %, al menos un 90 %, al menos un 95 %, al menos un 98 % o al menos un 99 %, de identidad de secuencia de aminoácidos con la secuencia de aminoácidos expuesta en el SEQ ID NO: 5, y comprende la sustitución de aminoácidos R1069 y H1074. En algunos casos, el aminoácido en la posición 1069 es cualquier aminoácido distinto de Arg; y el aminoácido en la posición 1074 es cualquier aminoácido distinto de His. En algunos casos, las sustituciones son R1069A y H1074A. En algunos casos, un polipéptido C2c2 variante comprende una secuencia de aminoácidos que tiene al menos un 80 %, al menos un 85 %, al menos un 90 %, al menos un 95 %, al menos un 98 % o al menos un 99 %, de identidad de secuencia de aminoácidos con la secuencia de aminoácidos expuesta en el SEQ ID NO: 5, y comprende la sustitución de aminoácidos R467, H472, R1069 y H1074. En algunos casos, el aminoácido en las posiciones 467 y 1069 es cualquier aminoácido distinto de Arg; y el aminoácido en las posiciones 472 y 1074 es cualquier aminoácido distinto de His. En algunos casos, las sustituciones son R469A, H472A, R1069A y H1074A. En algunos casos, el polipéptido C2c2 variante tiene una escisión reducida o indetectable del ssRNA (por ejemplo, actividad de escisión guiada por ARN) y conserva la capacidad de unirse al ARN guía de C2c2 y al ssRNA. En algunos casos, el polipéptido C2c2 variante conserva la capacidad de escindir el ARN guía de C2c2 precursor. En algunos casos, el polipéptido C2c2 variante tiene una escisión reducida o indetectable del ssRNA (p. ej., actividad de escisión guiada por ARN), pero conserva la capacidad de unirse al ARN guía de C2c2 y al ssRNA, y conserva la capacidad de escindir el ARN guía precursor de C2c2.
En algunos casos, un polipéptido C2c2 variante comprende una secuencia de aminoácidos que tiene al menos un 80 %, al menos un 85 %, al menos un 90 %, al menos un 95 %, al menos un 98 % o al menos un 99 %, de identidad de secuencia de aminoácidos con la secuencia de aminoácidos expuesta en el SEQ ID NO: 6 (C2c2 de Herbinixhemicellulosilytica), y comprende la sustitución de aminoácidos R472 y H477. En algunos casos, el aminoácido en la posición 472 es cualquier aminoácido distinto de Arg; y el aminoácido en la posición 477 es cualquier aminoácido distinto de His. En algunos casos, las sustituciones son R472A y H477A. En algunos casos, un polipéptido C2c2 variante comprende una secuencia de aminoácidos que tiene al menos un 80 %, al menos un 85 %, al menos un 90 %, al menos un 95 %, al menos un 98 % o al menos un 99 %, de identidad de secuencia de aminoácidos con la secuencia de aminoácidos expuesta en el SEQ ID NO: 6 , y comprende la sustitución de aminoácidos R1044 y H1049. En algunos casos, el aminoácido en la posición 1044 es cualquier aminoácido distinto de Arg; y el aminoácido en la posición 1049 es cualquier aminoácido distinto de His. En algunos casos, las sustituciones son R1044A y H1049A. En algunos casos, un polipéptido C2c2 variante comprende una secuencia de aminoácidos que tiene al menos un 80 %, al menos un 85 %, al menos un 90 %, al menos un 95 %, al menos un 98 % o al menos un 99 %, de identidad de secuencia de aminoácidos con la secuencia de aminoácidos expuesta en el SEQ ID NO: 6 , y comprende la sustitución de aminoácidos R472, H477, R1044 y H1049. En algunos casos, el aminoácido en las posiciones 472 y 1044 es cualquier aminoácido distinto de Arg; y el aminoácido en las posiciones 477 y 1049 es cualquier aminoácido distinto de His. En algunos casos, las sustituciones son R472A, H477A, R1044A y H1049A. En algunos casos, el polipéptido C2c2 variante tiene una escisión reducida o indetectable del ssRNA (por ejemplo, actividad de escisión guiada por ARN) y conserva la capacidad de unirse al ARN guía de C2c2 y al ssRNA. En algunos casos, el polipéptido C2c2 variante conserva la capacidad de escindir el ARN guía de C2c2 precursor. En algunos casos, el polipéptido C2c2 variante tiene una escisión reducida o indetectable del ssRNA (p. ej., actividad de escisión guiada por ARN), pero conserva la capacidad de unirse al ARN guía de C2c2 y al ssRNA, y conserva la capacidad de escindir el ARN guía precursor de C2c2.
En algunos casos, un polipéptido C2c2 variante comprende una secuencia de aminoácidos que tiene al menos un 80 %, al menos un 85 %, al menos un 90 %, al menos un 95 %, al menos un 98 % o al menos un 99 %, de identidad de secuencia de aminoácidos con la secuencia de aminoácidos expuesta en el SEQ ID NO: 2, y comprende la sustitución de 1, 2, 3 o 4 aminoácidos R472, H477, R1048 y H1053, de modo que el polipéptido C2c2 variante tiene una escisión reducida o indetectable del ssRNA (por ejemplo, actividad de escisión guiada por ARN) y conserva la capacidad de unirse al ARN guía de C2c2 y al ssRNA. En algunos casos, el polipéptido C2c2 variante conserva la capacidad de escindir el ARN guía de C2c2 precursor. Por ejemplo, en algunos casos, el polipéptido C2c2 variante presenta menos de un 50 %, menos de un 40 %, menos de un 30 %, menos de un 20 %, menos de un 10 %, menos de un 5 %, menos de un 1 % o menos de un 0,1 %, de la escisión guiada por ARN de un ARN no diana presentado por un polipéptido C2c2 que tiene la secuencia de aminoácidos expuesta en el SEQ ID NO: 2. En algunos casos, el polipéptido C2c2 variante tiene una escisión reducida o indetectable del ssRNA (p. ej., actividad de escisión guiada por ARN), pero conserva la capacidad de unirse al ARN guía de C2c2 y al ssRNA, y conserva la capacidad de escindir el ARN guía precursor de C2c2.
También se desvela (pero no se reivindica explícitamente) un ácido nucleico (p. ej., un ácido nucleico aislado) que comprende una secuencia de nucleótidos que codifica un polipéptido C2c2 variante de la presente divulgación. En algunos casos, la secuencia de nucleótidos está unida operativamente a un elemento de control de la transcripción, por ejemplo, un promotor. En algunos casos, el promotor es un promotor constitutivo. En algunos casos, el promotor es un promotor regulable. En algunos casos, el promotor es un promotor inducible. En algunos casos, el promotor es funcional en una célula eucariota. En algunos casos, el promotor es funcional en una célula procariota.
También se desvela (pero no forma parte de la invención) un vector de expresión recombinante que comprende un ácido nucleico de la presente divulgación, por ejemplo, un ácido nucleico que comprende una secuencia de nucleótidos que codifica un polipéptido C2c2 variante de la presente divulgación.
También se desvela (pero no forma parte de la invención) una célula hospedadora que está modificada genéticamente con un ácido nucleico de la presente divulgación, por ejemplo, un ácido nucleico que comprende una secuencia de nucleótidos que codifica un polipéptido C2c2 variante de la presente divulgación. La presente divulgación proporciona una célula hospedadora modificada genéticamente con un vector de expresión recombinante que comprende un ácido nucleico de la presente divulgación, por ejemplo, un ácido nucleico que comprende una secuencia de nucleótidos que codifica un polipéptido C2 c2 variante de la presente divulgación. En algunos casos, la célula hospedadora es una célula procariota. En algunos casos, la célula hospedadora es una célula eucariota. En algunos casos, la célula hospedadora está in vitro. En algunos casos, la célula hospedadora está ex-vivo. En algunos casos, la célula hospedadora está in vivo. En algunos casos, la célula hospedadora es una célula bacteriana. En algunos casos, la célula hospedadora es una célula de levadura. En algunos casos, la célula hospedadora es una célula vegetal. En algunos casos, la célula hospedadora es una célula de mamífero. En algunos casos, la célula hospedadora es una célula humana. En algunos casos, la célula hospedadora es una célula de mamífero no humano. En algunos casos, la célula hospedadora es una célula de insecto. En algunos casos, la célula hospedadora es una célula de artrópodo. En algunos casos, la célula hospedadora es una célula fúngica. En algunos casos, la célula hospedadora es una célula de alga.
KITS
La presente invención proporciona un kit para detectar un ARN diana en una muestra que comprende una pluralidad de ARN, como se expone en las reivindicaciones. En algunos casos, el kit comprende: (a) una matriz de ARN guía de C2c2 precursor que comprende dos o más ARN guía de C2c2, de los que cada uno tiene una secuencia guía diferente; y (b) una proteína C2c2, e incluye un ARN detector marcado que comprende un par de colorantes emisores de fluorescencia, es decir, un par FRET y/o un par inactivador/flúor. En algunos casos, dos o más ARN guía de C2c2 (p. ej., en algunos casos, cada uno de los ARN guía de C2c2) de una matriz de ARN guía de C2c2 precursor dado incluye la misma secuencia guía.
En algunos casos, dicho kit incluye además (c) un ARN guía de C2c2 (y/o un ácido nucleico que codifica un ARN guía de C2c2) y/o (d) un ARN guía de C2c2 precursor (y/o un ácido nucleico que codifica un ARN guía de C2c2 precursor) y/o (e) una matriz de ARN guía de C2c2 precursor (y/o un ácido nucleico que codifica una matriz de ARN guía de C2c2 precursor, por ejemplo, un ácido nucleico que codifica una matriz de ARN guía de C2c2 precursor que incluye sitios de inserción de secuencias para la inserción de secuencias guía por parte de un usuario).
1) Kit que comprende una matriz de ARN guía de C2c2 precursor y una proteína C2c2
Los kits de esta sección (1) no forman parte de la invención. En algunos casos, el kit comprende: (a) una matriz de ARN guía de C2c2 precursor que comprende dos o más ARN guía de C2c2, de los que cada uno tiene una secuencia guía diferente; y (b) una proteína C2c2, y dicho kit incluye además un ARN detector marcado (por ejemplo, un ARN detector marcado que comprende un par de colorantes emisores de fluorescencia, es decir, un par FRET y/o un par inactivador/flúor).
Proteína C2c2
Una proteína C2c2 adecuada para su inclusión en un kit de la presente divulgación se une a un ARN guía de C2c2, se guía a un ARN diana monocatenario por el ARN guía (que hibrida con el ARN diana) y, de este modo, se "activa". Si los dominios HEPN1 y HEPN2 de la proteína C2c2 están intactos, una vez activada, la proteína C2c2 escinde el ARN diana, pero también escinde los ARN no diana.
En algunos casos, una proteína C2c2 adecuada para su inclusión en un kit de la presente divulgación incluye una secuencia de aminoácidos que tiene un 80 % o más (por ejemplo, un 85 % o más, un 90 % o más, un 95 % o más, un 98 % o más, un 99 % o más, un 99,5 % o más o un 100 %) de identidad de secuencia de aminoácidos con la secuencia de aminoácidos establecida en una cualquiera de los SEQ ID NO: 1-6. En algunos casos, una proteína C2c2 adecuada para su inclusión en un kit de la presente divulgación comprende una secuencia de aminoácidos que tiene al menos un 80 %, al menos un 85 %, al menos un 90 %, al menos un 95 %, al menos un 98 %, al menos un 99 % o un 100 %, de identidad de secuencia de aminoácidos con la secuencia de aminoácidos de C2c2 de Listeria seeligeri expuesta en el SEQ ID NO: 1. En algunos casos, una proteína C2c2 adecuada para su inclusión en un kit de la presente divulgación comprende una secuencia de aminoácidos que tiene al menos un 80 %, al menos un 85 %, al menos un 90 %, al menos un 95 %, al menos un 98 %, al menos un 99 % o un 100 %, de identidad de secuencia de aminoácidos con la secuencia de aminoácidos de C2c2 de Leptotrichia buccalis expuesta en el SEQ ID NO: 2. En algunos casos, una proteína C2c2 adecuada para su inclusión en un kit de la presente divulgación comprende una secuencia de aminoácidos que tiene al menos un 80 %, al menos un 85 %, al menos un 90 %, al menos un 95 %, al menos un 98 %, al menos un 99 % o un 100 %, de identidad de secuencia de aminoácidos con la secuencia de aminoácidos de C2c2 de Rhodobacter capsulatus expuesta en el SEQ ID NO: 4. En algunos casos, una proteína C2c2 adecuada para su inclusión en un kit de la presente divulgación comprende una secuencia de aminoácidos que tiene al menos un 80 %, al menos un 85 %, al menos un 90 %, al menos un 95 %, al menos un 98 %, al menos un 99 % o un 100 %, de identidad de secuencia de aminoácidos con la secuencia de aminoácidos de C2c2 de Carnobacterium gallinarum expuesta en el SEQ ID NO: 5. En algunos casos, una proteína C2c2 adecuada para su inclusión en un kit de la presente divulgación comprende una secuencia de aminoácidos que tiene al menos un 80 %, al menos un 85 %, al menos un 90 %, al menos un 95 %, al menos un 98 %, al menos un 99 % o un 100 %, de identidad de secuencia de aminoácidos con la secuencia de aminoácidos de C2c2 de Herbinix hemicellulosilytica expuesta en el SEQ ID NO: 6. En algunos casos, una proteína C2c2 adecuada para su inclusión en un kit de la presente divulgación incluye una secuencia de aminoácidos que tiene un 80 % o más de identidad de secuencia de aminoácidos con la secuencia de aminoácidos de C2c2 de Leptotrichia buccalis (Lbu) expuesta en el SEQ ID NO: 2. En algunos casos, una proteína C2c2 adecuada para su inclusión en un kit de la presente divulgación es una proteína C2c2 de Leptotrichia buccalis (Lbu) (p. ej., véase el SEQ ID NO: 2). En algunos casos, una proteína C2c2 adecuada para su inclusión en un kit de la presente divulgación incluye la secuencia de aminoácidos expuesta en una cualquiera de los SEQ ID NO: 1-2 y 4­ 6.
En algunos casos, una proteína C2c2 incluida en un kit de la presente divulgación no es una proteína C2c2 de Leptotrichia shahii (Lsh). En algunos casos, una proteína C2c2 incluida en un kit de la presente divulgación no es un polipéptido C2c2 que tiene al menos un 80 %, al menos un 85 %, al menos un 90 %, al menos un 95 %, al menos un 98 %, al menos un 99 % o un 100 %, de identidad de secuencia de aminoácidos con el polipéptido Lsh C2c2 expuesto en el SEQ ID NO: 3.
En algunos casos, un polipéptido C2c2 incluido en un kit de la presente divulgación es un polipéptido C2c2 variante. Los polipéptidos C2c2 variantes adecuados para su inclusión en un kit de la presente divulgación incluyen variantes de una cualquiera de los SEQ ID NO: 1, 2 y 4-6, donde el polipéptido C2c2 variante presenta una actividad de nucleasa reducida (o indetectable). Por ejemplo, en algunos casos, una proteína C2c2 variante carece de un dominio HEPN1 catalíticamente activo. Como otro ejemplo, una proteína C2c2 variante carece de un dominio HEPN2 catalíticamente activo. En algunos casos, una proteína C2c2 variante carece de un dominio HEPN1 catalíticamente activo y carece de un dominio HEPN2 catalíticamente activo.
En algunos casos, un polipéptido C2c2 variante comprende sustituciones de aminoácidos de 1, 2, 3 o 4 de los aminoácidos R472, H477, R1048 y H1053 de la secuencia de aminoácidos expuesta en el SEQ ID NO: 2 (C2c2 de Leptotrichia buccalis), o un aminoácido correspondiente de una secuencia de aminoácidos de C2c2 representada en el SEQ ID NO: 1, SEQ ID NO: 4, SEQ ID NO: 5 o SEQ ID NO: 6. Los aminoácidos correspondientes en el SEQ ID NO: 1, SEQ ID NO: 4, SEQ ID NO: 5 y SEQ ID NO: 6 se identifican fácilmente; véase, por ejemplo, la FIG. 22B. Por ejemplo, las posiciones amino en el SEQ ID NO: 1 (C2c2 de Listeria seeligeri) que corresponden a R472, H477, R1048 y H1053 del SEQ ID NO: 2 son R445, H450, R1016 y H1021, respectivamente.
En algunos casos, un polipéptido C2c2 variante comprende sustituciones de aminoácidos de los aminoácidos R472 y H477 de la secuencia de aminoácidos expuesta en el SEQ ID NO: 2, o los aminoácidos correspondientes de una secuencia de aminoácidos de C2c2 representada en el SEQ ID NO: 1, SEQ ID NO: 4, SEQ ID NO: 5 o SEQ ID NO: 6. En algunos casos, un polipéptido C2c2 variante comprende sustituciones de aminoácidos de los aminoácidos R1048 y H1053 de la secuencia de aminoácidos expuesta en el SEQ ID NO: 2, o los aminoácidos correspondientes de una secuencia de aminoácidos de C2c2 representada en el SEQ ID NO: 1, SEQ ID NO: 4, SEQ ID NO: 5 o SEQ ID NO: 6. En algunos casos, un polipéptido C2c2 variante comprende sustituciones de aminoácidos de los aminoácidos R472, H477, R1048 y H1053 de la secuencia de aminoácidos establecida en el SEQ ID NO: 2, o los aminoácidos correspondientes de una secuencia de aminoácidos de C2c2 representada en el SEQ ID NO: 1, SEQ ID NO: 4, SEQ ID NO: 5 o SEQ ID NO: 6.
En algunos casos, un polipéptido C2c2 variante comprende una secuencia de aminoácidos que tiene al menos un 80 %, al menos un 85 %, al menos un 90 %, al menos un 95 %, al menos un 98 % o al menos un 99 %, de identidad de secuencia de aminoácidos con la secuencia de aminoácidos expuesta en el SEQ ID NO: 2, y comprende la sustitución de aminoácidos R472 y H477. En algunos casos, el aminoácido en la posición 472 es cualquier aminoácido distinto de Arg; y el aminoácido en la posición 477 es cualquier aminoácido distinto de His. En algunos casos, las sustituciones son R472A y H477A. En algunos casos, un polipéptido C2c2 variante comprende una secuencia de aminoácidos que tiene al menos un 80 %, al menos un 85 %, al menos un 90 %, al menos un 95 %, al menos un 98 % o al menos un 99 %, de identidad de secuencia de aminoácidos con la secuencia de aminoácidos expuesta en el SEQ ID NO: 2, y comprende la sustitución de aminoácidos R1048 y H1053. En algunos casos, el aminoácido en la posición 1048 es cualquier aminoácido distinto de Arg; y el aminoácido en la posición 1053 es cualquier aminoácido distinto de His. En algunos casos, las sustituciones son R1048A y H1053A. En algunos casos, un polipéptido C2c2 variante comprende una secuencia de aminoácidos que tiene al menos un 80 %, al menos un 85 %, al menos un 90 %, al menos un 95 %, al menos un 98 % o al menos un 99 %, de identidad de secuencia de aminoácidos con la secuencia de aminoácidos expuesta en el SEQ ID NO: 2, y comprende la sustitución de aminoácidos R472, H477, R1048 y H1053. En algunos casos, el aminoácido en las posiciones 472 y 1048 es cualquier aminoácido distinto de Arg; y el aminoácido en las posiciones 477 y 1053 es cualquier aminoácido distinto de His. En algunos casos, las sustituciones son R472A, H477A, R1048A y H1053A. En algunos casos, el polipéptido C2c2 variante tiene una escisión reducida o indetectable del ssRNA (por ejemplo, actividad de escisión guiada por ARN) y conserva la capacidad de unirse al ARN guía de C2c2 y al ssRNA. En algunos casos, el polipéptido C2c2 variante conserva la capacidad de escindir el ARN guía de C2c2 precursor. En algunos casos, el polipéptido C2c2 variante tiene una escisión reducida o indetectable del ssRNA (p. ej., actividad de escisión guiada por a Rn ), pero conserva la capacidad de unirse al ARN guía de C2c2 y al ssRNA, y conserva la capacidad de escindir el ARN guía precursor de C2c2.
En algunos casos, un polipéptido C2c2 variante comprende una secuencia de aminoácidos que tiene al menos un 80 %, al menos un 85 %, al menos un 90 %, al menos un 95 %, al menos un 98 % o al menos un 99 %, de identidad de secuencia de aminoácidos con la secuencia de aminoácidos expuesta en el SEQ ID NO: 1, y comprende la sustitución de aminoácidos R445 y H450. En algunos casos, el aminoácido en la posición 445 es cualquier aminoácido distinto de Arg; y el aminoácido en la posición 450 es cualquier aminoácido distinto de His. En algunos casos, las sustituciones son R445A y H450A. En algunos casos, un polipéptido C2c2 variante comprende una secuencia de aminoácidos que tiene al menos un 80 %, al menos un 85 %, al menos un 90 %, al menos un 95 %, al menos un 98 % o al menos un 99 %, de identidad de secuencia de aminoácidos con la secuencia de aminoácidos expuesta en el SEQ ID NO: 1, y comprende la sustitución de aminoácidos R1016 y H1021. En algunos casos, el aminoácido en la posición 1016 es cualquier aminoácido distinto de Arg; y el aminoácido en la posición 1021 es cualquier aminoácido distinto de His. En algunos casos, las sustituciones son R1016A y H1021A. En algunos casos, un polipéptido C2c2 variante comprende una secuencia de aminoácidos que tiene al menos un 80 %, al menos un 85 %, al menos un 90 %, al menos un 95 %, al menos un 98 % o al menos un 99 %, de identidad de secuencia de aminoácidos con la secuencia de aminoácidos expuesta en el SEQ ID NO: 1, y comprende la sustitución de aminoácidos R445, H450, R1016 y H1021. En algunos casos, el aminoácido en las posiciones 445 y 1016 es cualquier aminoácido distinto de Arg; y el aminoácido en las posiciones 450 y 1016 es cualquier aminoácido distinto de His. En algunos casos, las sustituciones son R445A, H450A, R1016A y H1021A. En algunos casos, el polipéptido C2c2 variante tiene una escisión reducida o indetectable del ssRNA (por ejemplo, actividad de escisión guiada por ARN) y conserva la capacidad de unirse al ARN guía de C2c2 y al ssRNA. En algunos casos, el polipéptido C2c2 variante conserva la capacidad de escindir el ARN guía de C2c2 precursor. En algunos casos, el polipéptido C2c2 variante tiene una escisión reducida o indetectable del ssRNA (p. ej., actividad de escisión guiada por a Rn ), pero conserva la capacidad de unirse al ARN guía de C2c2 y al ssRNA, y conserva la capacidad de escindir el ARN guía precursor de C2c2.
En algunos casos, un polipéptido C2c2 variante comprende una secuencia de aminoácidos que tiene al menos un 80 %, al menos un 85 %, al menos un 90 %, al menos un 95 %, al menos un 98 % o al menos un 99 %, de identidad de secuencia de aminoácidos con la secuencia de aminoácidos expuesta en el SEQ ID NO: 4 (C2c2 de Rhodobacter capsulatus) y comprende la sustitución de aminoácidos R464 y H469. En algunos casos, el aminoácido en la posición 464 es cualquier aminoácido distinto de Arg; y el aminoácido en la posición 469 es cualquier aminoácido distinto de His. En algunos casos, las sustituciones son R464A y H469A. En algunos casos, un polipéptido C2c2 variante comprende una secuencia de aminoácidos que tiene al menos un 80 %, al menos un 85 %, al menos un 90 %, al menos un 95 %, al menos un 98 % o al menos un 99 %, de identidad de secuencia de aminoácidos con la secuencia de aminoácidos expuesta en el SEQ ID NO: 4, y comprende la sustitución de aminoácidos R1052 y H1057. En algunos casos, el aminoácido en la posición 1052 es cualquier aminoácido distinto de Arg; y el aminoácido en la posición 1057 es cualquier aminoácido distinto de His. En algunos casos, las sustituciones son R1052A y H1057A. En algunos casos, un polipéptido C2c2 variante comprende una secuencia de aminoácidos que tiene al menos un 80 %, al menos un 85 %, al menos un 90 %, al menos un 95 %, al menos un 98 % o al menos un 99 %, de identidad de secuencia de aminoácidos con la secuencia de aminoácidos expuesta en el SEQ ID NO: 4, y comprende la sustitución de aminoácidos R464, H469, R1052 y H1057. En algunos casos, el aminoácido en las posiciones 464 y 1052 es cualquier aminoácido distinto de Arg; y el aminoácido en las posiciones 469 y 1057 es cualquier aminoácido distinto de His. En algunos casos, las sustituciones son R464A, H469A, R1052A y H1057A. En algunos casos, el polipéptido C2c2 variante tiene una escisión reducida o indetectable del ssRNA (por ejemplo, actividad de escisión guiada por ARN) y conserva la capacidad de unirse al ARN guía de C2c2 y al ssRNA. En algunos casos, el polipéptido C2c2 variante conserva la capacidad de escindir el ARN guía de C2c2 precursor. En algunos casos, el polipéptido C2c2 variante tiene una escisión reducida o indetectable del ssRNA (p. ej., actividad de escisión guiada por ARN), pero conserva la capacidad de unirse al ARN guía de C2c2 y al ssRNA, y conserva la capacidad de escindir el ARN guía precursor de C2c2.
En algunos casos, un polipéptido C2c2 variante comprende una secuencia de aminoácidos que tiene al menos un 80 %, al menos un 85 %, al menos un 90 %, al menos un 95 %, al menos un 98 % o al menos un 99 %, de identidad de secuencia de aminoácidos con la secuencia de aminoácidos expuesta en el SEQ ID NO: 5 (C2c2 de Carnobacterium gallinarum), y comprende la sustitución de aminoácidos R467 y H472. En algunos casos, el aminoácido en la posición 467 es cualquier aminoácido distinto de Arg; y el aminoácido en la posición 472 es cualquier aminoácido distinto de His. En algunos casos, las sustituciones son R469A y H472A. En algunos casos, un polipéptido C2c2 variante comprende una secuencia de aminoácidos que tiene al menos un 80 %, al menos un 85 %, al menos un 90 %, al menos un 95 %, al menos un 98 % o al menos un 99 %, de identidad de secuencia de aminoácidos con la secuencia de aminoácidos expuesta en el SEQ ID NO: 5, y comprende la sustitución de aminoácidos R1069 y H1074. En algunos casos, el aminoácido en la posición 1069 es cualquier aminoácido distinto de Arg; y el aminoácido en la posición 1074 es cualquier aminoácido distinto de His. En algunos casos, las sustituciones son R1069A y H1074A. En algunos casos, un polipéptido C2c2 variante comprende una secuencia de aminoácidos que tiene al menos un 80 %, al menos un 85 %, al menos un 90 %, al menos un 95 %, al menos un 98 % o al menos un 99 %, de identidad de secuencia de aminoácidos con la secuencia de aminoácidos expuesta en el SEQ ID NO: 5, y comprende la sustitución de aminoácidos R467, H472, R1069 y H1074. En algunos casos, el aminoácido en las posiciones 467 y 1069 es cualquier aminoácido distinto de Arg; y el aminoácido en las posiciones 472 y 1074 es cualquier aminoácido distinto de His. En algunos casos, las sustituciones son R469A, H472A, R1069A y H1074A. En algunos casos, el polipéptido C2c2 variante tiene una escisión reducida o indetectable del ssRNA (por ejemplo, actividad de escisión guiada por ARN) y conserva la capacidad de unirse al ARN guía de C2c2 y al ssRNA. En algunos casos, el polipéptido C2c2 variante conserva la capacidad de escindir el ARN guía de C2c2 precursor. En algunos casos, el polipéptido C2c2 variante tiene una escisión reducida o indetectable del ssRNA (p. ej., actividad de escisión guiada por ARN), pero conserva la capacidad de unirse al ARN guía de C2c2 y al ssRNA, y conserva la capacidad de escindir el ARN guía precursor de C2c2.
En algunos casos, un polipéptido C2c2 variante comprende una secuencia de aminoácidos que tiene al menos un 80 %, al menos un 85 %, al menos un 90 %, al menos un 95 %, al menos un 98 % o al menos un 99 %, de identidad de secuencia de aminoácidos con la secuencia de aminoácidos expuesta en el SEQ ID NO: 6 (C2c2 de Herbinixhemicellulosilytica), y comprende la sustitución de aminoácidos R472 y H477. En algunos casos, el aminoácido en la posición 472 es cualquier aminoácido distinto de Arg; y el aminoácido en la posición 477 es cualquier aminoácido distinto de His. En algunos casos, las sustituciones son R472A y H477A. En algunos casos, un polipéptido C2c2 variante comprende una secuencia de aminoácidos que tiene al menos un 80 %, al menos un 85 %, al menos un 90 %, al menos un 95 %, al menos un 98 % o al menos un 99 %, de identidad de secuencia de aminoácidos con la secuencia de aminoácidos expuesta en el SEQ ID NO: 6 , y comprende la sustitución de aminoácidos R1044 y H1049. En algunos casos, el aminoácido en la posición 1044 es cualquier aminoácido distinto de Arg; y el aminoácido en la posición 1049 es cualquier aminoácido distinto de His. En algunos casos, las sustituciones son R1044A y H1049A. En algunos casos, un polipéptido C2c2 variante comprende una secuencia de aminoácidos que tiene al menos un 80 %, al menos un 85 %, al menos un 90 %, al menos un 95 %, al menos un 98 % o al menos un 99 %, de identidad de secuencia de aminoácidos con la secuencia de aminoácidos expuesta en el SEQ ID NO: 6 , y comprende la sustitución de aminoácidos R472, H477, R1044 y H1049. En algunos casos, el aminoácido en las posiciones 472 y 1044 es cualquier aminoácido distinto de Arg; y el aminoácido en las posiciones 477 y 1049 es cualquier aminoácido distinto de His. En algunos casos, las sustituciones son R472A, H477A, R1044A y H1049A. En algunos casos, el polipéptido C2c2 variante tiene una escisión reducida o indetectable del ssRNA (por ejemplo, actividad de escisión guiada por ARN) y conserva la capacidad de unirse al ARN guía de C2c2 y al ssRNA. En algunos casos, el polipéptido C2c2 variante conserva la capacidad de escindir el ARN guía de C2c2 precursor. En algunos casos, el polipéptido C2c2 variante tiene una escisión reducida o indetectable del ssRNA (p. ej., actividad de escisión guiada por ARN), pero conserva la capacidad de unirse al ARN guía de C2c2 y al ssRNA, y conserva la capacidad de escindir el ARN guía precursor de C2c2.
2) Kit que comprende un ARN detector marcado y una proteína C2c2
En algunos casos, el kit comprende: (a) un ARN detector marcado que comprende un par de colorantes emisores de fluorescencia, es decir, un par FRET y/o un par inactivador/flúor; y (b) una proteína C2c2. En algunos casos, un kit incluye además un ARN guía de C2c2, matriz de ARN guía de C2c2 precursor y/o un ácido nucleico que codifica una región constante de un ARN guía de C2c2. Como se ha indicado anteriormente, en algunos casos, dicho kit incluye además (c) un ARN guía de C2c2 (y/o un ácido nucleico que codifica un ARN guía de C2c2) y/o (d) un ARN guía de C2c2 precursor (y/o un ácido nucleico que codifica un ARN guía de C2c2 precursor) y/o (e) una matriz de ARN guía de C2c2 precursor (y/o un ácido nucleico que codifica una matriz de ARN guía de C2c2 precursor, por ejemplo, un ácido nucleico que codifica una matriz de ARN guía de C2c2 precursor que incluye sitios de inserción de secuencias para la inserción de secuencias guía por parte de un usuario).
ARN detector marcado
En algunos casos, un kit de la presente divulgación comprende un ARN detector marcado que comprende un par de colorantes emisores de fluorescencia, es decir, un par FRET y/o un par inactivador/flúor. El ARN detector marcado produce una cantidad de señal detectable antes de ser escindido, y la cantidad de señal detectable que se mide se reduce cuando se escinde el ARN detector marcado. En algunos casos, el ARN detector marcado produce una primera señal detectable antes de escindirse (p. ej., de un par FRET) y una segunda señal detectable cuando se escinde el ARN detector marcado (p. ej., de un par inactivador/flúor). De este modo, en algunos casos, el ARN detector marcado comprende un par FRET y un par inactivador/fluor.
En algunos casos, el ARN detector marcado comprende un par FRET. FRET es un proceso mediante el cual se produce una transferencia de energía sin radiación desde un fluoróforo en estado excitado a un segundo cromóforo en las proximidades. El intervalo en el que puede tener lugar la transferencia de energía está limitado a aproximadamente 10 nanómetros ( 100 angstroms), y la eficacia de la transferencia es extremadamente sensible a la distancia de separación entre los fluoróforos. El par donante-aceptor (un resto donante FRET y un resto aceptor FRET) se denomina en el presente documento "par FRET" o "par FRET de señal". Por lo tanto, en algunos casos, un ARN detector marcado en cuestión incluye dos compañeros de señal (un par de señal), siendo un compañero de señal un resto donante FRET y siendo el otro compañero de señal un resto aceptor FRET. Un ARN detector marcado en cuestión que incluye dicho par FRET (un resto donante FRET y un resto aceptor FRET) presentará, por lo tanto, una señal detectable (una señal de FRET) cuando los compañeros de señal estén muy cerca (p. ej., mientras están en la misma molécula de ARN), pero la señal se reducirá (o desaparecerá) cuando los compañeros estén separados (p. ej., después de la escisión de la molécula de ARN por una proteína C2c2).
Los restos donante y aceptor de FRET (pares FRET) serán conocidos por un experto normal en la materia y se puede utilizar cualquier par FRET conveniente (por ejemplo, cualquier par de restos de donante y aceptor conveniente). Los ejemplos de pares FRET adecuados incluyen, entre otros, los presentados en la Tabla 1, mostrada anteriormente.
En algunos casos, se produce una señal detectable cuando se escinde el ARN detector marcado (p. ej., en algunos casos, el ARN detector marcado comprende un par inactivador/flúor. Un compañero de señal de un par de inactivación de señal produce una señal detectable y el otro compañero de señal es un resto inactivador que inactiva la señal detectable del primer compañero de señal (es decir, el resto inactivador inactiva la señal del resto de señal de tal manera que la señal del resto de señal se reduce (inactiva) cuando los compañeros de señal están cerca entre sí, por ejemplo, cuando los compañeros de señal del par de señal están muy cerca).
Por ejemplo, en algunos casos, una cantidad de señal detectable aumenta cuando se escinde el ARN detector marcado. Por ejemplo, en algunos casos, la señal presentada por un compañero de señal (un resto de señal) se inactiva por el otro compañero de señal (un resto de señal inactivador), por ejemplo, cuando ambos están presentes en la misma molécula de ARN antes de la escisión por una proteína C2c2. Dicho par de señal se denomina en el presente documento "par inactivador/fluor", "par de inactivación" o "par de inactivación de señal". Por ejemplo, en algunos casos, un compañero de señal (p. ej., el primer compañero de señal) es un resto de señal que produce una señal detectable que se inactiva por el segundo compañero de señal (p. ej., un resto inactivador). Los compañeros de señal de un par inactivador/flúor producirán, por lo tanto, una señal detectable cuando los compañeros estén separados (p. ej., después de la escisión del ARN detector por una proteína C2c2), pero la señal se inactivará cuando los compañeros estén muy cerca (por ejemplo, antes de la escisión del ARN detector por una proteína C2c2).
Un resto inactivador puede inactivar una señal del resto de señal (p. ej., antes de la escisión del ARN detector por una proteína C2c2) en diversos grados. En algunos casos, un resto inactivador inactiva la señal del resto de señal donde la señal detectada en presencia del resto inactivador (cuando los compañeros de señal están cerca entre sí) es el 95 % o menos de la señal detectada en ausencia del resto inactivador (cuando los compañeros de señal están separados). Por ejemplo, en algunos casos, la señal detectada en presencia del resto inactivador puede ser del 90 % o menos, 80 % o menos, 70 % o menos, 60 % o menos, 50 % o menos, 40 % o menos, 30 % o menos, 20 % o menos, 15 % o menos, 10 % o menos o 5 % o menos de la señal detectada en ausencia del resto inactivador. En algunos casos, no se detecta ninguna señal (p. ej., por encima del nivel de referencia) en presencia del resto inactivador.
En algunos casos, la señal detectada en ausencia del resto inactivador (cuando los compañeros de señal están separados) es al menos 1,2 veces mayor (por ejemplo, al menos 1,3 veces, al menos 1,5 veces, al menos 1,7 veces, al menos 2 veces, al menos 2,5 veces, al menos 3 veces, al menos 3,5 veces, al menos 4 veces, al menos 5 veces, al menos 7 veces, al menos 10 veces, al menos 20 veces o al menos 50 veces mayor) que la señal detectada en presencia del resto inactivador (cuando los compañeros de señal están próximos entre sí).
En algunos casos, el resto de señal es un marcador fluorescente. En algunos de tales casos, el resto inactivador inactiva la señal (la señal de luz) del marcador fluorescente (p. ej., absorbiendo energía en los espectros de emisión del marcador). Por lo tanto, cuando el resto inactivador no está cerca del resto señal, la emisión (la señal) del marcador fluorescente es detectable porque la señal no se ha absorbido por el resto inactivador. Puede usarse cualquier par aceptor donante conveniente (par de resto señal/resto inactivador) y en la técnica se conocen muchos pares adecuados.
En algunos casos, el resto inactivador absorbe energía del resto de señal (también denominado en el presente documento "marcador detectable") y entonces emite una señal (por ejemplo, luz a una longitud de onda diferente). Por lo tanto, en algunos casos, el resto inactivador es en sí mismo un resto señal (p. ej., un resto señal puede ser 6 -carboxifluoresceína mientras que el resto inactivador puede ser 6 -carboxitetrametilrodamina) y, en algunos de estos casos, el par también podría ser un par FRET. En algunos casos, un resto inactivador es un inactivador oscuro. Un inactivador oscuro puede absorber energía de excitación y disipar la energía de una manera diferente (por ejemplo, en forma de calor). Por lo tanto, un inactivador oscuro tiene una fluorescencia propia mínima o nula (no emite fluorescencia). Se describen ejemplos de inactivadores oscuros con más detalle en las patentes de Estados Unidos números 8.822.673 y 8.586.718; en las publicaciones de patentes de Estados Unidos 20140378330, 20140349295 y 20140194611; y en las solicitudes de patentes internacionales: WO200142505 y WO200186001.
Los ejemplos de marcadores fluorescentes incluyen, pero sin limitación: un colorante Alexa Fluor®, un colorante ATTO (p. ej., ATTO 390, ATTO 425, ATTO 465, ATTO 488, ATTO 495, ATTO 514, ATTO 520, ATTO 532, ATTO Rho6 G, ATTO 542, ATTO 550, ATTO 565, ATTO Rho3B, ATTO Rho11, ATTO Rho12, ATTO Thio12, ATTO Rho101, ATTO 590, ATTO 594, ATTO Rho13, ATTO 610, ATTO 620, ATTO Rho14, ATTO 633, ATTO 647, ATTO 647N, ATTO 655, ATTO Oxa12, ATTO 665, ATTO 680, ATTO 700, ATTO 725, ATTO 740), un colorante DyLight, un colorante de cianina (p. ej., Cy2, Cy3, Cy3.5, Cy3b, Cy5, Cy5.5, Cy7, Cy7.5), un colorante FluoProbes, un colorante Sulfo Cy, un colorante Seta, un colorante IRIS, un colorante SeTau, un colorante SRfluor, un colorante Square, fluoresceína (FITC), tetrametilrodamina (TRITC), Rojo Texas, Oregon Green, Pacific Blue, Pacific Green, Pacific Orange, puntos cuánticos y una proteína fluorescente unida.
En algunos casos, un marcador detectable es un marcador fluorescente seleccionado de: un colorante Alexa Fluor®, un colorante ATTO (p. ej., ATTO 390, ATTO 425, ATTO 465, ATTO 488, ATTO 495, ATTO 514, ATTO 520, ATTO 532, ATTO Rho6 G, ATTO 542, ATTO 550, ATTO 565, ATTO Rho3B, ATTO Rho 11, ATTO Rho12, ATTO Thio12, ATTO Rho101, ATTO 590, ATTO 594, ATTO Rho13, ATTO 610, ATTO 620, ATTO Rho14, ATTO 633, ATTO 647, ATTO 647N, ATTO 655, ATTO Oxa12, ATTO 665, ATTO 680, ATTO 700, ATTO 725, ATTO 740), un colorante DyLight, un colorante de cianina (p. ej., Cy2, Cy3, Cy3.5, Cy3b, Cy5, Cy5.5, Cy7, Cy7.5), un colorante FluoProbes, un colorante Sulfo Cy, un colorante Seta, un colorante IRIS, un colorante SeTau, un colorante SRfluor, un colorante Square, fluoresceína (FITC), tetrametilrodamina (TRITC), Rojo Texas, Oregon Green, Pacific Blue, Pacific Green y Pacific Orange.
En algunos casos, un marcador detectable es un marcador fluorescente seleccionado de: un colorante Alexa Fluor®, un colorante ATTO (p. ej., ATTO 390, ATTO 425, ATTO 465, ATTO 488, ATTO 495, ATTO 514, ATTO 520, ATTO 532, ATTO Rho6 G, ATTO 542, ATTO 550, ATTO 565, ATTO Rho3B, ATTO Rho 11, ATTO Rho12, ATTO Thio12, ATTO Rho101, ATTO 590, ATTO 594, ATTO Rho13, ATTO 610, ATTO 620, ATTO Rho14, ATTO 633, ATTO 647, ATTO 647N, ATTO 655, ATTO Oxa12, ATTO 665, ATTO 680, ATTO 700, ATTO 725, ATTO 740), un colorante DyLight, un colorante de cianina (p. ej., Cy2, Cy3, Cy3.5, Cy3b, Cy5, Cy5.5, Cy7, Cy7.5), un colorante FluoProbes, un colorante Sulfo Cy, un colorante Seta, un colorante IRIS, un colorante SeTau, un colorante SRfluor, un colorante Square, fluoresceína (FITC), tetrametilrodamina (TRITC), Rojo Texas, Oregon Green, Pacific Blue, Pacific Green, Pacific Orange, un punto cuántico y una proteína fluorescente unida.
Los ejemplos de colorantes ATTO incluyen, pero sin limitación: ATTO 390, ATTO 425, ATTO 465, ATTO 488, ATTO 495, ATTO 514, ATTO 520, ATTO 532, ATTO Rho6 G, ATTO 542, ATTO 550, ATTO 565, ATTO Rho3B, ATTO Rho11, ATTO Rho12, ATTO Thio12, ATTO Rho101, ATTO 590, ATTO 594, ATTO Rho13, ATTO 610, ATTO 620, ATTO Rho14, ATTO 633, ATTO 647, ATTO 647N, ATTO 655, ATTO Oxa12, ATTO 665, ATTO 680, ATTO 700, ATTO 725 y ATTO 740.
Los ejemplos de colorantes AlexaFluor incluyen, pero sin limitación: Alexa Fluor® 350, Alexa Fluor® 405, Alexa Fluor® 430, Alexa Fluor® 488, Alexa Fluor® 500, Alexa Fluor® 514, Alexa Fluor® 532, Alexa Fluor® 546, Alexa Fluor® 555, Alexa Fluor® 568, Alexa Fluor® 594, Alexa Fluor® 610, Alexa Fluor® 633, Alexa Fluor® 635, Alexa Fluor® 647, Alexa Fluor® 660, Alexa Fluor® 680, Alexa Fluor® 700, Alexa Fluor® 750, Alexa Fluor® 790 y similares.
Los ejemplos de restos inactivadores incluyen, pero sin limitación: un inactivador oscuro, un Black Hole Quencher® (BHQ®) (p. ej., BHQ-0, BHQ-1, BHQ-2, BHQ-3), un inactivador Qxl, un inactivador ATTO (p. ej., ATTO 540Q, ATTO 580Q y At t O 612Q), ácido dimetilaminoazobencenosulfónico (Dabsyl), Iowa Black RQ, Iowa Black FQ, IRDye QC-1, un tinte QSY (p. ej., QSY 7, QSY 9, QSY 21), AbsoluteQuencher, Eclipse y agrupamientos metálicos tales como nanopartículas de oro y similares.
En algunos casos, un resto inactivador se selecciona de: un inactivador oscuro, un Black Hole Quencher® (BHQ®) (p. ej., BHQ-0, BHQ-1, BHQ-2, BHQ-3), un inactivador Qxl, un inactivador ATTO (p. ej., ATTO 540Q, ATTO 580Q y a TTo 612Q), ácido dimetilaminoazobencenosulfónico (Dabsyl), Iowa Black RQ, Iowa Black FQ, IRDye QC-1, un tinte QSY (p. ej., QSY 7, QSY 9, QSY 21), AbsoluteQuencher, Eclipse y un agolpamiento metálico.
Los ejemplos de un inactivador ATTO incluyen, pero sin limitación: ATTO 540Q, ATTO 580Q y ATTO 612Q. Los ejemplos de un Black Hole Quencher® (BHQ®) incluyen, pero sin limitación: BHQ-0 (493 nm), Bh Q-1 (534 nm), BHQ-2 (579 nm) y BHQ-3 (672 nm).
Si se desean ejemplos de algunos marcadores detectables (p. ej., tintes fluorescentes) y/o restos inactivadores, véase, por ejemplo, Bao et al., Annu Rev Biomed Eng. 2009;11:25-47; así como las patentes de Estados Unidos número 8.822.673 y 8.586.718; las publicaciones de patentes de Estados Unidos 20140378330, 20140349295, 20140194611, 20130323851, 20130224871, 20110223677, 20110190486, 20110172420, 20060179585 y 20030003486; y en las solicitudes de patentes internacionales: WO200142505 y WO200186001.
Modificaciones de ácido nucleico
En algunos casos, un ARN detector marcado comprende una o más modificaciones, por ejemplo, una modificación de base, una modificación de la cadena principal, una modificación de azúcar, etc., para proporcionar al ácido nucleico una característica nueva o potenciada (p. ej., estabilidad mejorada). En la invención, el ARN detector marcado modificado se puede escindir por C2C2. Como es sabido en la técnica, un nucleósido es una combinación de base y azúcar. La porción de base del nucleósido normalmente es una base heterocíclica. Las dos clases más comunes de tales bases heterocíclicas son las purinas y las pirimidinas. Los nucleótidos son nucleósidos que además incluyen un grupo fosfato unido covalentemente a la porción de azúcar del nucleósido. Para aquellos nucleósidos que incluyen un azúcar pentofuranosilo, el grupo fosfato se puede unir al resto hidroxilo 2', 3' o 5' del azúcar. En la formación de oligonucleótidos, los grupos fosfato unen covalentemente nucleósidos adyacentes entre sí para formar un compuesto polimérico lineal. A su vez, los extremos correspondientes de este compuesto polimérico lineal se pueden unir adicionalmente para formar un compuesto circular; sin embargo, generalmente son adecuados los compuestos lineales. Además, los compuestos lineales pueden tener complementariedad interna de bases nucleotídicas y, por lo tanto, pueden plegarse de manera que se produzca un compuesto total o parcialmente bicatenario. Dentro de los oligonucleótidos, los grupos fosfato generalmente se conocen como grupos que forman la cadena principal internucleosídica del oligonucleótido. El enlace normal o cadena principal del ARN y el ADN es un enlace fosfodiéster 3' a 5'.
Cadenas principales modificadas y enlaces internudeosídicos modificados
Los ejemplos de modificaciones adecuadas incluyen cadenas principales de ácidos nucleicos modificadas y enlaces internucleosídicos no naturales. Los ácidos nucleicos (que tienen cadenas principales modificadas incluyen los que conservan un átomo de fósforo en la cadena principal y los que no tienen un átomo de fósforo en la cadena principal.
Las cadenas principales de oligonucleótidos modificadas adecuadas que contienen un átomo de fósforo incluyen, por ejemplo, fosforotioatos, fosforotioatos quirales, fosforoditioatos, fosfotriésteres, aminoalquilfosfotriésteres, fosfonatos de metilo y otros alquilos entre los que se incluyen fosfonatos de 3'-alquileno, fosfonatos de 5'-alquileno y fosfonatos quirales, fosfinatos, fosforamidatos que incluyen 3'-amino fosforamidato y aminoalquilfosforamidatos, fosforodiamidatos, tionofosforamidatos, tionoalquilfosfonatos, tionoalquilfosfotriésteres, selenofosfatos y boranofosfatos que tienen enlaces 3'-5' normales, análogos 2'-5' enlazados de estos, y los que tienen polaridad invertida en donde uno o más enlaces internucleotídicos son un enlace 3' a 3', 5' a 5' o 2' a 2'. Los oligonucleótidos adecuados que tienen polaridad invertida comprenden un único enlace 3' a 3' en el enlace internucleotídico más 3', es decir, un único resto de nucleósido invertido que puede ser básico (falta la nucleobase o tiene un grupo hidroxilo en su lugar). También se incluyen varias sales (tales como, por ejemplo, potasio o sodio), sales mixtas y formas de ácidos libres.
En algunos casos, un ARN detector marcado comprende uno o más enlaces internucleosídicos de fosforotioato y/o heteroátomo, en particular -CH2-NH-O-CH2-, -CH2-N(CH3)-O-CH2- (conocido como cadena principal de metileno (metilimino) o MMI), -CH2-O-N(CH3)-CH2-, -CH2-N(CH3)-N(CH3)-CH2- y -O-N(CH3)-CH2-CH2- (en donde el enlace internucleotídico fosfodiéster nativo se representa como -O-P(=O)(OH)-O-CH2-). Se desvelan enlaces internucleosídicos de tipo MMI en la patente de Estados Unidos n.° 5.489.677. Se desvelan enlaces internucleosídicos de amida adecuados en la patente de Estados Unidos n.° 5.602.240.
También son adecuados los ácidos nucleicos que tienen estructuras de cadena principal de morfolino, como se describe en, por ejemplo, la patente de Estados Unidos n.° 5.034.506. Por ejemplo, en algunos casos, un ARN detector marcado puede comprender un anillo morfolino de 6 miembros en lugar de un anillo de ribosa. En algunos casos, un enlace internucleosídico fosforodiamidato u otro no fosfodiéster reemplaza a un enlace fosfodiéster.
Las cadenas principales de oligonucleótidos modificadas que no incluyen un átomo de fósforo tienen cadenas principales que se forman mediante enlaces internucleosídicos cicloalquilo o alquilo de cadena corta, enlaces intemucleosídicos de heteroátomos mixtos y de alquilo o cicloalquilo o uno o más enlaces intemucleosídicos heteroatómicos o heterocíclicos de cadena corta. Estos incluyen los que tienen enlaces morfolino (formados en parte a partir de la porción de azúcar de un nucleósido); cadenas principales de siloxano; sulfuro, cadenas principales de sulfóxido y sulfona; cadenas principales de formacetilo y tioformacetilo; cadenas principales de metilenformacetilo y tioformacetilo; cadenas principales de riboacetilo; cadenas principales que contienen alqueno; cadenas principales de sulfamato; cadenas principales de metilenimino y metilenhidrazino; cadenas principales de sulfonato y sulfonamida; cadenas principales de amida; y otros que tienen partes componentes mixtas de N, O, S y CH2.
Miméticos
Un ARN detector marcado puede ser un mimético de ácido nucleico. El término "mimético", cuando se aplica a polinucleótidos, pretende incluir polinucleótidos en donde solamente el anillo de furanosa o tanto el anillo de furanosa como el enlace internucleotídico se reemplazan por grupos que no son de furanosa, en la técnica también se conoce el reemplazo del anillo de furanosa únicamente como un sustituto del azúcar. El resto de base heterocíclica o un resto de base heterocíclica modificado se mantiene para la hibridación con un ácido nucleico diana apropiado. Uno de estos ácidos nucleicos, un mimético de polinucleótido que se ha demostrado que tiene excelentes propiedades de hibridación, se conoce como ácido peptidonucleico (APN). En el APN, la cadena principal de azúcar de un oligonucleótido se ha reemplazado por una cadena principal que contiene amida, en particular una cadena principal de aminoetilglicina. Los nucleótidos se retienen y están unidos directa o indirectamente a átomos de nitrógeno aza de la porción de amida de la cadena principal.
Un polinucleótido mimético del que se ha informado que tiene excelentes propiedades de hibridación es un ácido peptidonucleico (APN). La cadena principal en los compuestos de APN consta de dos o más unidades de aminoetilglicina unidas que dan al APN una cadena principal que contiene amida. Los restos de base heterocíclica están unidos directa o indirectamente a átomos de nitrógeno aza de la porción amida de la cadena principal. Las patentes de Estados Unidos representativas que describen la preparación de compuestos de APN incluyen, pero sin limitación: las patentes de Estados Unidos n.° 5.539.082; 5.7l4.33l; y 5.719.262.
Otra clase de polinucleótido mimético que se ha estudiado está basada en unidades de morfolino unidas (ácido nucleico de morfolino) que tienen bases heterocíclicas unidas al anillo de morfolino. Se han notificado varios grupos de unión que unen las unidades monoméricas de morfolino en un ácido nucleico de morfolino. Se ha seleccionado una clase de grupos de unión para dar un compuesto oligomérico no iónico. Es menos probable que los compuestos oligoméricos basados en morfolino no iónico tengan interacciones no deseadas con proteínas celulares. Los polinucleótidos basados en morfolino son miméticos no iónicos de oligonucleótidos que tienen menos probabilidades de formar interacciones no deseadas con proteínas celulares (Dwaine A. Braasch y David R. Corey, Biochemistry, 2002, 41(14), 4503-4510). Se desvelan polinucleótidos basados en morfolino en la patente de Estados Unidos n.° 5.034.506. Se han preparado diversos compuestos dentro de la clase de polinucleótidos de morfolino, que tienen diversos grupos de unión diferentes que unen las subunidades monoméricas.
Una clase adicional de miméticos de polinucleótidos recibe el nombre de ácidos nucleicos de ciclohexenilo (CeNA). El anillo de furanosa normalmente presente en una molécula de ADN/ARN se reemplaza por un anillo de ciclohexenilo. Se han preparado monómeros de fosforamidita protegidos con ANCe DMT se han usado para la síntesis de compuestos oligoméricos mediante la química clásica de la fosforamidita. Se han preparado y estudiado compuestos oligoméricos de CeNA completamente modificados y oligonucleótidos que tienen posiciones específicas modificadas con CeNA (véase Wang et al., J. Am. Chem. Soc., 2000, 122, 8595-8602). En general, la incorporación de monómeros de CeNA en una cadena de ADN aumenta la estabilidad de un híbrido ADN/ARN. Los oligoadenilatos de CeNA formaron complejos con complementos de ARN y ADN con una estabilidad similar a la de los complejos nativos. El estudio de la incorporación de estructuras de CeNA en estructuras de ácidos nucleicos naturales mediante RMN y dicroísmo circular demostró que este proceso se realizaba con una fácil adaptación conformacional.
Una modificación adicional incluye ácidos nucleicos bloqueados (ANB) en los que el grupo 2'-hidroxilo está unido al átomo de carbono 4' del anillo de azúcar, formándose, de este modo, un enlace 2'-C,4'-C-oximetileno que forma, de este modo, un resto de azúcar bicíclico. El enlace puede ser un metileno (-CH 2-), grupo que une el átomo de oxígeno 2' y el átomo de carbono 4' en donde n es 1 o 2 (Singh et al., Chem. Commun., 1998, 4, 455-456). Los ANB y los análogos de ANB muestran estabilidades térmicas dúplex muy altas con ADN y ARN complementarios (Tm = 3 a 10 °C), estabilidad frente a la degradación 3'-exonucleolítica y buenas propiedades de solubilidad. Se han descrito oligonucleótidos antisentido potentes y no tóxicos que contienen ANB (Wahlestedt et al., Proc. Natl. Acad. Sci. U.S.A., 2000, 97, 5633-5638).
Se ha descrito la síntesis y preparación de los monómeros de ANB adenina, citosina, guanina, 5-metil-citosina, timina y uracilo, junto con su oligomerización, y se han descrito propiedades de reconocimiento de ácidos nucleicos (Koshkin et al., Tetrahedron, 1998, 54, 3607-3630). También se describen ANB y su preparación en los documentos WO 98/39352 y WO 99/14226.
Restos de azúcar modificados
Un ARN detector marcado también puede incluir uno o más restos de azúcar sustituidos. Los polinucleótidos adecuados comprenden un grupo sustituyente de azúcar seleccionado de: OH; F; O-, S- o N-alquilo; O-, S- o N-alquenilo; O-, S- o N-alquinilo; u O-alquil-O-alquilo, en donde el alquilo, alquenilo y alquinilo pueden ser alquilo C1 a C10, alquilo o alquenilo C2 a C10 y alquinilo sustituidos o sin sustituir. Son particularmente O((CH2)nO)mCH3, O(CH2)nOCH3, O(CH2)nNH2, O(CH2)nCH3, O(CH2)nONH2 y O(CH2),ON((CH2),CH3)2, en donde n y m son de 1 a aproximadamente 10. Otros polinucleótidos adecuados comprenden un grupo sustituyente de azúcar seleccionado de: alquilo inferior C1 a C10, alquilo inferior sustituido, alquenilo, alquinilo, alcarilo, aralquilo, O-alcarilo u O-aralquilo, SH, SCH3, OCN, C1, Br, CN, CF3, OCF3, SOCH3, SO2CH3, ONO2, NO2, N3, NH2, heterocicloalquilo, heterocicloalcarilo, aminoalquilamino, polialquilamino, sililo sustituido, un grupo de escisión de ARN, un grupo indicador, un intercalante, un grupo para mejorar las propiedades farmacocinéticas de un oligonucleótido, o un grupo para mejorar las propiedades farmacocinéticas de un oligonucleótido y otros sustituyentes que tienen propiedades similares. Una modificación adecuada incluye 2'-metoxietoxi (2 -O-CH2 CH2OCH3, también conocido como 2'-O-(2-metoxietilo) o 2'-MOE) (Martin et al., Helv. Chim. Acta, 1995, 78, 486-504) es decir, un grupo alcoxialcoxi. Una modificación adecuada adicional incluye 2'-dimetilaminooxietoxi, es decir, un grupo O(CH2)2ON(CH3)2, también conocido como 2'-DMAOE, como se describe más adelante en los ejemplos, y 2 '-dimetilaminoetoxietoxi (también conocido en la técnica como 2 '-O-dimetil-amino-etoxi-etilo o 2 '-DMAEo E), es decir, 2 '-O-CH2-O-CH2-N(CH3)2.
Otros grupos sustituyentes de azúcar adecuados incluyen metoxi (-O-CH3), aminopropoxi (--O CH2 CH2 CH2NH2), alilo (-CH2-CH=CH2), -O-alilo (--O-- CH2-CH=CH2) y flúor (F). Los grupos sustituyentes de 2'-azúcar pueden estar en la posición arabino (arriba) o en la posición ribo (abajo). Una modificación 2'-arabino adecuada es 2'-F. También se pueden realizar modificaciones similares en otras posiciones del compuesto oligomérico, particularmente, la posición 3' del azúcar en el nucleósido 3' terminal o en oligonucleótidos enlazados en 2'-5' y la posición 5' del nucleótido 5' terminal. Los compuestos oligoméricos también pueden tener miméticos de azúcar tales como restos ciclobutilo en lugar del azúcar pentofuranosilo.
Modificaciones y sustituciones de bases
Un ARN detector marcado también puede incluir modificaciones o sustituciones de nucleobases (a menudo denominadas en la técnica simplemente "base"). Como se usa en el presente documento, las nucleobases "no modificadas" o "naturales" incluyen las bases púricas adenina (A) y guanina (G) y las bases pirimidínicas timina (T), citosina (C) y uracilo (U). Las nucleobases modificadas incluyen otras nucleobases sintéticas y naturales, tales como 5-metilcitosina (5-me-C), 5-hidroximetil-citosina, xantina, hipoxantina, 2-aminoadenina, 6 -metilo y otros derivados de alquilo de adenina y guanina, 2 -propilo y otros derivados de alquilo de adenina y guanina, 2 -tiouracilo, 2 -tiotimina y 2 -tiocitosina, 5-halouracilo y citosina, 5-propinil (-C=C-CH3) uracilo y citosina y otros derivados alquinílicos de bases pirimidínicas, 6 -azo uracilo, citosina y timina, 5-uracilo (pseudouracilo), 4-tiouracilo, 8 -halo, 8 -amino, 8 -tiol, 8 -tioalquilo, 8 -hidroxilo y otras adeninas y guaninas 8 -sustituidas, 5-halo, particularmente, 5-bromo, 5-trifluorometilo y otros uracilos y citosinas 5-sustituidos, 7-metilguanina y 7-metiladenina, 2-F-adenina, 2-aminoadenina, 8 -azaguanina y 8 -azaadenina, 7-desazaguanina y 7-desazaadenina y 3-desazaguanina y 3-desazaadenina. Otras nucleobases modificadas incluyen pirimidinas tricíclicas tales como fenoxazina citidina (1H-pirimido(5,4-b)(1,4)benzoxazin-2(3H)-ona), fenotiazina citidina (1H-pirimido(5,4-b)(1,4)benzotiazin-2(3H)-ona), abrazaderas en G tales como una fenoxazina citidina sustituida (p. ej., 9-(2-aminoetoxi)-H-pirimido(5,4-(b) (1,4)benzoxazin-2(3H)-ona), carbazol citidina (2H-pirimido(4,5-b)indol-2-ona), piridoindol citidina (H-pirido(3',2':4,5)pirrolo(2,3-d) pirimidin-2-ona).
Los residuos de bases heterocíclicas también pueden incluir aquellos en los que la base de purina o pirimidina se reemplaza por otros heterociclos, por ejemplo 7-desaza-adenina, 7-desazaguanosina, 2-aminopiridina y 2-piridona. Otras nucleobases incluyen las desveladas en las patentes de Estados Unidos n.° 3.687.808, las desveladas en The Concise Encyclopedia Of Polymer Science And Engineering, páginas 858-859, Kroschwitz, J. I., ed. John Wiley & Sons, 1990, las desveladas por Englisch et al., Angewandte Chemie, Edición Internacional, 1991, 30, 613, y las desveladas por Sanghvi, Y. S., Capítulo 15, Antisense Research and Applications, páginas 289-302, Crooke, S. T. y Lebleu, B., ed., CRC Press, 1993. Algunas de estas nucleobases son útiles para aumentar la afinidad de unión de un compuesto oligomérico. Estas incluyen pirimidinas 5-sustituidas, 6 -azapirimidinas y purinas N-2, N- 6 y O- 6 sustituidas, incluyendo 2-aminopropiladenina, 5-propiniluracilo y 5-propinilcitosina. Se ha demostrado que las sustituciones de 5-metilcitosina aumentan la estabilidad del dúplex de ácido nucleico en 0,6-1,2 °C (Sanghvi et al., ed., Antisense Research and Applications, CRC Press, Boca Raton, 1993, pp. 276-278) y son sustituciones de base adecuadas, por ejemplo, cuando se combina con modificaciones de azúcar 2'-O-metoxietilo.
3) Kit que comprende dos proteínas C2c2 diferentes y dos ARN detectores marcados diferentes
Los kits de esta sección (3) no forman parte de la invención. En algunos casos, un kit en cuestión comprende: (a) un primer ARN detector marcado que carece de U pero comprende al menos una A (por ejemplo, al menos 2, al menos 3 o al menos 4 A) y comprende un primer par f ReT y/o un primer par inactivador/flúor; (b) un segundo ARN detector marcado que carece de A pero comprende al menos un U (por ejemplo, al menos 2, al menos 3 o al menos 4 U) y comprende un segundo par FRET y/o un segundo par inactivador/flúor; (c) una primera proteína C2c2 y/o un ácido nucleico que codifica dicha primera proteína C2c2, en donde la primera proteína C2c2 escinde ARN adenina+ (ARN que incluyen A) cuando se activa pero no escinde ARN que carecen de A (p. ej., ARN poliU) [p. ej., la primera proteína C2c2 puede escindir el primer ARN detector marcado pero no el segundo ARN detector marcado]; y (d) una segunda proteína C2c2 y/o un ácido nucleico que codifica dicha segunda proteína C2c2, en donde la segunda proteína C2c2 escinde los ARN uracilo+ (ARN que incluyen U) cuando se activa pero no escinde los ARN que carecen de U (p. ej., ARN poliA) (p. ej., la segunda proteína C2c2 puede escindir el segundo ARN detector marcado pero no el primer ARN detector marcado).
En algunos casos, el primer ARN detector marcado carece de U e incluye un tramo de 2 a 15 A consecutivas (por ejemplo, de 2 a 12, 2 a 10, 2 a 8 , 2 a 6 , 2 a 4, 3 a 15, 3 a 12, 3 a 10, 3 a 8 , 3 a 6 , 3 a 5, 4 a 15, 4 a 12, 4 a 10, 4 a 8 o 4 a 6 A consecutivas). En algunos casos, el primer ARN detector marcado carece de U e incluye un tramo de al menos 2 A consecutivas (por ejemplo, al menos 3, al menos 4 o al menos 5 A consecutivas). En algunos casos, el segundo ARN detector marcado carece de A e incluye un tramo de 2 a 15 U consecutivos (por ejemplo, de 2 a 12, 2 a 10, 2 a 8 , 2 a 6 , 2 a 4, 3 a 15, 3 a 12, 3 a 10, 3 a 8 , 3 a 6 , 3 a 5, 4 a 15, 4 a 12, 4 a 10, 4 a 8 o 4 a 6 U consecutivos). En algunos casos, el segundo ARN detector marcado carece de A e incluye un tramo de al menos 2 U consecutivos (por ejemplo, al menos 3, al menos 4 o al menos 5 U consecutivos).
En algunos casos, dicho kit incluye además: (e) un primer ARN guía de C2c2 (y/o un ácido nucleico que codifica el primer ARN guía de C2c2), por ejemplo, un ácido nucleico que comprende una secuencia de nucleótidos que codifica el primer ARN guía de C2c2, en donde el ácido nucleico incluye un sitio de inserción de secuencia para la inserción de una secuencia guía (p. ej., una secuencia de nucleótidos que hibrida con un ARN diana) por parte de un usuario; y (f) un segundo ARN guía de C2c2 (y/o un ácido nucleico que codifica el segundo ARN guía de C2c2), por ejemplo, un ácido nucleico que comprende una secuencia de nucleótidos que codifica el segundo ARN guía de C2c2, en donde el ácido nucleico incluye un sitio de inserción de secuencia para la inserción de una secuencia guía (p. ej., una secuencia de nucleótidos que hibrida con un ARN diana) por parte de un usuario. El primer ARN guía de C2c2 comprende una primera secuencia de nucleótidos que hibrida con un primer ARN diana monocatenario y una segunda secuencia de nucleótidos que se une a la primera proteína C2c2. El segundo ARN guía de C2c2 comprende una primera secuencia de nucleótidos que hibrida con un segundo ARN diana monocatenario y una segunda secuencia de nucleótidos que se une a la segunda proteína C2c2. La primera proteína C2c2 no se activa por el segundo ARN guía de C2c2, y la primera proteína C2c2 escinde el ssRNA que incluye al menos una A (p. ej., no escinde el ssRNA que carece de A). La segunda proteína C2c2 no se activa por el primer ARN guía de C2c2, y la segunda proteína C2c2 escinde el ssRNA que incluye al menos un U (p. ej., no escinde el ARNm que carece de U).
A continuación se proporcionan ejemplos no limitantes (presentados a continuación como a) hasta w)) de una primera y segunda proteínas C2 c2 adecuadas para su inclusión en un kit de la presente divulgación:
a) la primera proteína C2c2 comprende una secuencia de aminoácidos que tiene al menos un 75 %, al menos un 80 %, al menos un 85 %, al menos un 90 %, al menos un 95 %, al menos un 98 %, al menos un 99 % o un 100 %, de identidad de secuencia de aminoácidos con la secuencia de aminoácidos de Lba Cas13a representada en la FIG. 56F; y la segunda proteína C2c2 comprende una secuencia de aminoácidos que tiene al menos un 75 %, al menos un 80 %, al menos un 85 %, al menos un 90 %, al menos un 95 %, al menos un 98 %, al menos un 99 % o un 100%, de identidad de secuencia de aminoácidos con la secuencia de aminoácidos de Hhe Cas13a representada en la FIG. 56J;
b) la primera proteína C2c2 comprende una secuencia de aminoácidos que tiene al menos un 75 %, al menos un 80 %, al menos un 85 %, al menos un 90 %, al menos un 95 %, al menos un 98 %, al menos un 99 % o un 100 %, de identidad de secuencia de aminoácidos con la secuencia de aminoácidos de Lba Cas13a representada en la FIG. 56F; y la segunda proteína C2c2 comprende una secuencia de aminoácidos que tiene al menos un 75 %, al menos un 80 %, al menos un 85 %, al menos un 90 %, al menos un 95 %, al menos un 98 %, al menos un 99 % o un 100%, de identidad de secuencia de aminoácidos con la secuencia de aminoácidos de Rca Cas13a representada en la FIG. 56G;
c) la primera proteína C2c2 comprende una secuencia de aminoácidos que tiene al menos un 75 %, al menos un 80 %, al menos un 85 %, al menos un 90 %, al menos un 95 %, al menos un 98 %, al menos un 99 % o un 100 %, de identidad de secuencia de aminoácidos con la secuencia de aminoácidos de Lba Cas13a representada en la FIG. 56F; y la segunda proteína C2c2 comprende una secuencia de aminoácidos que tiene al menos un 75 %, al menos un 80 %, al menos un 85 %, al menos un 90 %, al menos un 95 %, al menos un 98 %, al menos un 99 % o un 100%, de identidad de secuencia de aminoácidos con la secuencia de aminoácidos de Ppr Cas13a representada en la FIG. 56B;
d) la primera proteína C2c2 comprende una secuencia de aminoácidos que tiene al menos un 75 %, al menos un 80 %, al menos un 85 %, al menos un 90 %, al menos un 95 %, al menos un 98 %, al menos un 99 % o un 100 %, de identidad de secuencia de aminoácidos con la secuencia de aminoácidos de Lba Cas13a representada en la FIG. 56F; y la segunda proteína C2c2 comprende una secuencia de aminoácidos que tiene al menos un 75 %, al menos un 80 %, al menos un 85 %, al menos un 90 %, al menos un 95 %, al menos un 98 %, al menos un 99 % o un 100%, de identidad de secuencia de aminoácidos con la secuencia de aminoácidos de Lne Cas13a representada en la FIG. 56I;
e) la primera proteína C2c2 comprende una secuencia de aminoácidos que tiene al menos un 75 %, al menos un 80 %, al menos un 85 %, al menos un 90 %, al menos un 95 %, al menos un 98 %, al menos un 99 % o un 100 %, de identidad de secuencia de aminoácidos con la secuencia de aminoácidos de Lba Cas13a representada en la FIG. 56F; y la segunda proteína C2c2 comprende una secuencia de aminoácidos que tiene al menos un 75 %, al menos un 80 %, al menos un 85 %, al menos un 90 %, al menos un 95 %, al menos un 98 %, al menos un 99 % o un 100%, de identidad de secuencia de aminoácidos con la secuencia de aminoácidos de Lbu Cas13a representada en la FIG. 56C;
f) la primera proteína C2c2 comprende una secuencia de aminoácidos que tiene al menos un 75 %, al menos un 80 %, al menos un 85 %, al menos un 90 %, al menos un 95 %, al menos un 98 %, al menos un 99 % o un 100 %, de identidad de secuencia de aminoácidos con la secuencia de aminoácidos de Lba Cas13a representada en la FIG. 56F; y la segunda proteína C2c2 comprende una secuencia de aminoácidos que tiene al menos un 75 %, al menos un 80 %, al menos un 85 %, al menos un 90 %, al menos un 95 %, al menos un 98 %, al menos un 99 % o un 100%, de identidad de secuencia de aminoácidos con la secuencia de aminoácidos de Lwa Cas13a representada en la FIG. 56E;
g) la primera proteína C2c2 comprende una secuencia de aminoácidos que tiene al menos un 75 %, al menos un 80 %, al menos un 85 %, al menos un 90 %, al menos un 95 %, al menos un 98 %, al menos un 99 % o un 100 %, de identidad de secuencia de aminoácidos con la secuencia de aminoácidos de Lba Cas13a representada en la FIG. 56F; y la segunda proteína C2c2 comprende una secuencia de aminoácidos que tiene al menos un 75 %, al menos un 80 %, al menos un 85 %, al menos un 90 %, al menos un 95 %, al menos un 98 %, al menos un 99 % o un 100%, de identidad de secuencia de aminoácidos con la secuencia de aminoácidos de Lsh Cas13a representada en la FIG. 56D;
h) la primera proteína C2c2 comprende una secuencia de aminoácidos que tiene al menos un 75 %, al menos un 80 %, al menos un 85 %, al menos un 90 %, al menos un 95 %, al menos un 98 %, al menos un 99 % o un 100 %, de identidad de secuencia de aminoácidos con la secuencia de aminoácidos de Ere Cas13a representada en la FIG. 56J; y la segunda proteína C2c2 comprende una secuencia de aminoácidos que tiene al menos un 75 %, al menos un 80 %, al menos un 85 %, al menos un 90 %, al menos un 95 %, al menos un 98 %, al menos un 99 % o un 100%, de identidad de secuencia de aminoácidos con la secuencia de aminoácidos de Hhe Cas13a representada en la FIG. 56J;
i) la primera proteína C2c2 comprende una secuencia de aminoácidos que tiene al menos un 75 %, al menos un 80 %, al menos un 85 %, al menos un 90 %, al menos un 95 %, al menos un 98 %, al menos un 99 % o un 100 %, de identidad de secuencia de aminoácidos con la secuencia de aminoácidos de Ere Cas13a representada en la FIG. 56J; y la segunda proteína C2c2 comprende una secuencia de aminoácidos que tiene al menos un 75 %, al menos un 80 %, al menos un 85 %, al menos un 90 %, al menos un 95 %, al menos un 98 %, al menos un 99 % o un 100%, de identidad de secuencia de aminoácidos con la secuencia de aminoácidos de Rca Cas13a representada en la FIG. 56G;
j) la primera proteína C2c2 comprende una secuencia de aminoácidos que tiene al menos un 75 %, al menos un 80 %, al menos un 85 %, al menos un 90 %, al menos un 95 %, al menos un 98 %, al menos un 99 % o un 100 %, de identidad de secuencia de aminoácidos con la secuencia de aminoácidos de Ere Cas13a representada en la FIG. 56J; y la segunda proteína C2c2 comprende una secuencia de aminoácidos que tiene al menos un 75 %, al menos un 80 %, al menos un 85 %, al menos un 90 %, al menos un 95 %, al menos un 98 %, al menos un 99 % o un 100%, de identidad de secuencia de aminoácidos con la secuencia de aminoácidos de Ppr Cas13a representada en la FIG. 56B;
k) la primera proteína C2c2 comprende una secuencia de aminoácidos que tiene al menos un 75 %, al menos un 80 %, al menos un 85 %, al menos un 90 %, al menos un 95 %, al menos un 98 %, al menos un 99 % o un 100 %, de identidad de secuencia de aminoácidos con la secuencia de aminoácidos de Ere Cas13a representada en la FIG. 56J; y la segunda proteína C2c2 comprende una secuencia de aminoácidos que tiene al menos un 75 %, al menos un 80 %, al menos un 85 %, al menos un 90 %, al menos un 95 %, al menos un 98 %, al menos un 99 % o un 100%, de identidad de secuencia de aminoácidos con la secuencia de aminoácidos de Lne Cas13a representada en la FIG. 56I;
l) la primera proteína C2c2 comprende una secuencia de aminoácidos que tiene al menos un 75 %, al menos un 80 %, al menos un 85 %, al menos un 90 %, al menos un 95 %, al menos un 98 %, al menos un 99 % o un 100 %, de identidad de secuencia de aminoácidos con la secuencia de aminoácidos de Ere Cas13a representada en la FIG. 56J; y la segunda proteína C2c2 comprende una secuencia de aminoácidos que tiene al menos un 75 %, al menos un 80 %, al menos un 85 %, al menos un 90 %, al menos un 95 %, al menos un 98 %, al menos un 99 % o un 100%, de identidad de secuencia de aminoácidos con la secuencia de aminoácidos de Lbu Cas13a representada en la FIG. 56C;
m) la primera proteína C2c2 comprende una secuencia de aminoácidos que tiene al menos un 75 %, al menos un 80 %, al menos un 85 %, al menos un 90 %, al menos un 95 %, al menos un 98 %, al menos un 99 % o un 100 %, de identidad de secuencia de aminoácidos con la secuencia de aminoácidos de Ere Cas13a representada en la FIG. 56J; y la segunda proteína C2c2 comprende una secuencia de aminoácidos que tiene al menos un 75 %, al menos un 80 %, al menos un 85 %, al menos un 90 %, al menos un 95 %, al menos un 98 %, al menos un 99 % o un 100%, de identidad de secuencia de aminoácidos con la secuencia de aminoácidos de Lwa Cas13a representada en la FIG. 56E;
n) la primera proteína C2c2 comprende una secuencia de aminoácidos que tiene al menos un 75 %, al menos un 80 %, al menos un 85 %, al menos un 90 %, al menos un 95 %, al menos un 98 %, al menos un 99 % o un 100 %, de identidad de secuencia de aminoácidos con la secuencia de aminoácidos de Ere Cas13a representada en la FIG. 56J; y la segunda proteína C2c2 comprende una secuencia de aminoácidos que tiene al menos un 75 %, al menos un 80 %, al menos un 85 %, al menos un 90 %, al menos un 95 %, al menos un 98 %, al menos un 99 % o un 100%, de identidad de secuencia de aminoácidos con la secuencia de aminoácidos de Lsh Cas13a representada en la FIG. 56D;
o) la primera proteína C2c2 comprende una secuencia de aminoácidos que tiene al menos un 75 %, al menos un 80 %, al menos un 85 %, al menos un 90 %, al menos un 95 %, al menos un 98 %, al menos un 99 % o un 100 %, de identidad de secuencia de aminoácidos con la secuencia de aminoácidos de Ere Cas13a representada en la FIG. 56J; y la segunda proteína C2c2 comprende una secuencia de aminoácidos que tiene al menos un 75 %, al menos un 80 %, al menos un 85 %, al menos un 90 %, al menos un 95 %, al menos un 98 %, al menos un 99 % o un 100%, de identidad de secuencia de aminoácidos con la secuencia de aminoácidos de Lse Cas13a representada en la FIG. 56A;
p) la primera proteína C2c2 comprende una secuencia de aminoácidos que tiene al menos un 75 %, al menos un 80 %, al menos un 85 %, al menos un 90 %, al menos un 95 %, al menos un 98 %, al menos un 99 % o un 100 %, de identidad de secuencia de aminoácidos con la secuencia de aminoácidos de Cam Cas13a representada en la FIG. 56H; y la segunda proteína C2c2 comprende una secuencia de aminoácidos que tiene al menos un 75 %, al menos un 80 %, al menos un 85 %, al menos un 90 %, al menos un 95 %, al menos un 98 %, al menos un 99 % o un 100%, de identidad de secuencia de aminoácidos con la secuencia de aminoácidos de Hhe Cas13a representada en la FIG. 56J;
q) la primera proteína C2c2 comprende una secuencia de aminoácidos que tiene al menos un 75 %, al menos un 80 %, al menos un 85 %, al menos un 90 %, al menos un 95 %, al menos un 98 %, al menos un 99 % o un 100 %, de identidad de secuencia de aminoácidos con la secuencia de aminoácidos de Cam Cas13a representada en la FIG. 56H; y la segunda proteína C2c2 comprende una secuencia de aminoácidos que tiene al menos un 75 %, al menos un 80 %, al menos un 85 %, al menos un 90 %, al menos un 95 %, al menos un 98 %, al menos un 99 % o un 100%, de identidad de secuencia de aminoácidos con la secuencia de aminoácidos de Rca Cas13a representada en la FIG. 56G;
r) la primera proteína C2c2 comprende una secuencia de aminoácidos que tiene al menos un 75 %, al menos un 80 %, al menos un 85 %, al menos un 90 %, al menos un 95 %, al menos un 98 %, al menos un 99 % o un 100 %, de identidad de secuencia de aminoácidos con la secuencia de aminoácidos de Cam Cas13a representada en la FIG. 56H; y la segunda proteína C2c2 comprende una secuencia de aminoácidos que tiene al menos un 75 %, al menos un 80 %, al menos un 85 %, al menos un 90 %, al menos un 95 %, al menos un 98 %, al menos un 99 % o un 100%, de identidad de secuencia de aminoácidos con la secuencia de aminoácidos de Ppr Cas13a representada en la FIG. 56B;
s) la primera proteína C2c2 comprende una secuencia de aminoácidos que tiene al menos un 75 %, al menos un 80 %, al menos un 85 %, al menos un 90 %, al menos un 95 %, al menos un 98 %, al menos un 99 % o un 100 %, de identidad de secuencia de aminoácidos con la secuencia de aminoácidos de Cam Cas13a representada en la FIG. 56H; y la segunda proteína C2c2 comprende una secuencia de aminoácidos que tiene al menos un 75 %, al menos un 80 %, al menos un 85 %, al menos un 90 %, al menos un 95 %, al menos un 98 %, al menos un 99 % o un 100%, de identidad de secuencia de aminoácidos con la secuencia de aminoácidos de Lne Cas13a representada en la FIG. 56I;
t) la primera proteína C2c2 comprende una secuencia de aminoácidos que tiene al menos un 75 %, al menos un 80 %, al menos un 85 %, al menos un 90 %, al menos un 95 %, al menos un 98 %, al menos un 99 % o un 100 %, de identidad de secuencia de aminoácidos con la secuencia de aminoácidos de Cam Cas13a representada en la FIG. 56H; y la segunda proteína C2c2 comprende una secuencia de aminoácidos que tiene al menos un 75 %, al menos un 80 %, al menos un 85 %, al menos un 90 %, al menos un 95 %, al menos un 98 %, al menos un 99 % o un 100%, de identidad de secuencia de aminoácidos con la secuencia de aminoácidos de Lbu Cas13a representada en la FIG. 56C;
u) la primera proteína C2c2 comprende una secuencia de aminoácidos que tiene al menos un 75 %, al menos un 80 %, al menos un 85 %, al menos un 90 %, al menos un 95 %, al menos un 98 %, al menos un 99 % o un 100 %, de identidad de secuencia de aminoácidos con la secuencia de aminoácidos de Cam Cas13a representada en la FIG. 56H; y la segunda proteína C2c2 comprende una secuencia de aminoácidos que tiene al menos un 75 %, al menos un 80 %, al menos un 85 %, al menos un 90 %, al menos un 95 %, al menos un 98 %, al menos un 99 % o un 100%, de identidad de secuencia de aminoácidos con la secuencia de aminoácidos de Lwa Cas13a representada en la FIG. 56E;
v) la primera proteína C2c2 comprende una secuencia de aminoácidos que tiene al menos un 75 %, al menos un 80 %, al menos un 85 %, al menos un 90 %, al menos un 95 %, al menos un 98 %, al menos un 99 % o un 100 %, de identidad de secuencia de aminoácidos con la secuencia de aminoácidos de Cam Cas13a representada en la FIG. 56H; y la segunda proteína C2c2 comprende una secuencia de aminoácidos que tiene al menos un 75 %, al menos un 80 %, al menos un 85 %, al menos un 90 %, al menos un 95 %, al menos un 98 %, al menos un 99 % o un 100%, de identidad de secuencia de aminoácidos con la secuencia de aminoácidos de Lsh Cas13a representada en la FIG. 56F; o
w) la primera proteína C2c2 comprende una secuencia de aminoácidos que tiene al menos un 75 %, al menos un 80 %, al menos un 85 %, al menos un 90 %, al menos un 95 %, al menos un 98 %, al menos un 99 % o un 100 %, de identidad de secuencia de aminoácidos con la secuencia de aminoácidos de Cam Cas13a representada en la FIG. 56H; y la segunda proteína C2c2 comprende una secuencia de aminoácidos que tiene al menos un 75 %, al menos un 80 %, al menos un 85 %, al menos un 90 %, al menos un 95 %, al menos un 98 %, al menos un 99 % o un 100%, de identidad de secuencia de aminoácidos con la secuencia de aminoácidos de Lse Cas13a representada en la FIG. 56A.
Proteína C2c2
Una proteína C2c2 adecuada para su inclusión en un kit de la presente divulgación se une a un ARN guía de C2c2, se guía a un ARN diana monocatenario por el ARN guía (que híbrida con el ARN diana) y, de este modo, se "activa". Si los dominios HEPN1 y HEPN2 de la proteína C2c2 están intactos, una vez activada, la proteína C2c2 escinde el ARN diana, pero también escinde los ARN no diana.
En algunos casos, una proteína C2c2 adecuada para su inclusión en un kit de la presente divulgación incluye una secuencia de aminoácidos que tiene un 80 % o más (por ejemplo, un 85 % o más, un 90 % o más, un 95 % o más, un 98 % o más, un 99 % o más, un 99,5 % o más o un 100 %) de identidad de secuencia de aminoácidos con la secuencia de aminoácidos establecida en una cualquiera de los SEQ ID NO: 1-6. En algunos casos, una proteína C2c2 adecuada para su inclusión en un kit de la presente divulgación comprende una secuencia de aminoácidos que tiene al menos un 80 %, al menos un 85 %, al menos un 90 %, al menos un 95 %, al menos un 98 %, al menos un 99 % o un 100 %, de identidad de secuencia de aminoácidos con la secuencia de aminoácidos de C2c2 de Listeria seeligeri expuesta en el SEQ ID NO: 1. En algunos casos, una proteína C2c2 adecuada para su inclusión en un kit de la presente divulgación comprende una secuencia de aminoácidos que tiene al menos un 80 %, al menos un 85 %, al menos un 90 %, al menos un 95 %, al menos un 98 %, al menos un 99 % o un 100 %, de identidad de secuencia de aminoácidos con la secuencia de aminoácidos de C2c2 de Leptotrichia buccalis expuesta en el SEQ ID NO: 2. En algunos casos, una proteína C2c2 adecuada para su inclusión en un kit de la presente divulgación comprende una secuencia de aminoácidos que tiene al menos un 80 %, al menos un 85 %, al menos un 90 %, al menos un 95 %, al menos un 98 %, al menos un 99 % o un 100 %, de identidad de secuencia de aminoácidos con la secuencia de aminoácidos de C2c2 de Rhodobacter capsulatus expuesta en el SEQ ID NO: 4. En algunos casos, una proteína C2c2 adecuada para su inclusión en un kit de la presente divulgación comprende una secuencia de aminoácidos que tiene al menos un 80 %, al menos un 85 %, al menos un 90 %, al menos un 95 %, al menos un 98 %, al menos un 99 % o un 100 %, de identidad de secuencia de aminoácidos con la secuencia de aminoácidos de C2c2 de Carnobacterium gallinarum expuesta en el SEQ ID NO: 5. En algunos casos, una proteína C2c2 adecuada para su inclusión en un kit de la presente divulgación comprende una secuencia de aminoácidos que tiene al menos un 80 %, al menos un 85 %, al menos un 90 %, al menos un 95 %, al menos un 98 %, al menos un 99 % o un 100 %, de identidad de secuencia de aminoácidos con la secuencia de aminoácidos de C2c2 de Herbinix hemicellulosilytica expuesta en el SEQ ID NO: 6. En algunos casos, una proteína C2c2 adecuada para su inclusión en un kit de la presente divulgación incluye una secuencia de aminoácidos que tiene un 80 % o más de identidad de secuencia de aminoácidos con la secuencia de aminoácidos de C2c2 de Leptotrichia buccalis (Lbu) expuesta en el SEQ ID NO: 2. En algunos casos, una proteína C2c2 adecuada para su inclusión en un kit de la presente divulgación es una proteína C2c2 de Leptotrichia buccalis (Lbu) (p. ej., véase el SEQ ID NO: 2). En algunos casos, una proteína C2c2 adecuada para su inclusión en un kit de la presente divulgación incluye la secuencia de aminoácidos expuesta en una cualquiera de los SEQ ID NO: 1-2 y 4­ 6.
En algunos casos, una proteína C2c2 incluida en un kit de la presente divulgación no es una proteína C2c2 de Leptotrichia shahii (Lsh). En algunos casos, una proteína C2c2 incluida en un kit de la presente divulgación no es un polipéptido C2c2 que tiene al menos un 80 %, al menos un 85 %, al menos un 90 %, al menos un 95 %, al menos un 98 %, al menos un 99 % o un 100 %, de identidad de secuencia de aminoácidos con el polipéptido Lsh C2c2 expuesto en el SEQ ID NO: 3.
En algunos casos, una proteína C2c2 adecuada para su inclusión en un kit de la presente divulgación es más eficaz, en un factor de 1,2 veces o más, que una proteína C2c2 de Leptotrichia shahii (Lsh) en la escisión del ARN que no es la diana de un ARN guía de C2c2 del método. En algunos casos, la proteína C2c2 es más eficaz, en un factor de 1,5 veces o más, que una proteína C2c2 de Leptotrichia shahii (Lsh) en la escisión del ARN que no es la diana de un ARN guía de C2c2 del método. En algunos casos, el polipéptido C2c2 usado en un método de la presente divulgación, cuando se activa, escinde el ARN no diana al menos 1,2 veces, al menos 1,5 veces, al menos 2 veces, al menos 2,5 veces, al menos 3 veces, al menos 4 veces, al menos 5 veces, al menos 6 veces, al menos 7 veces, al menos 8 veces, al menos 9 veces, al menos 10 veces, al menos 15 veces, al menos 20 veces, al menos aproximadamente 30 veces o más de 30 veces, más eficazmente que Lsh C2c2.
En algunos casos, una proteína C2c2 adecuada para su inclusión en un kit de la presente divulgación presenta al menos un 50 % de eficacia de escisión de ARN dentro de la hora posterior a dicho contacto (por ejemplo, un 55 % o más, un 60 % o más, un 65 % o más, un 70 % o más o un 75 % o más de eficacia de escisión). En algunos casos, una proteína C2c2 adecuada para su inclusión en un kit de la presente divulgación presenta al menos un 50 % de eficacia de escisión de ARN dentro de los 40 minutos posteriores a dicho contacto (por ejemplo, un 55 % o más, un 60 % o más, un 65 % o más, un 70 % o más o un 75 % o más de eficacia de escisión). En algunos casos, una proteína C2c2 adecuada para su inclusión en un kit de la presente divulgación presenta al menos un 50 % de eficacia de escisión de ARN dentro de los 30 minutos posteriores a dicho contacto (por ejemplo, un 55 % o más, un 60 % o más, un 65 % o más, un 70 % o más o un 75 % o más de eficacia de escisión).
En algunos casos, una proteína C2c2 adecuada para su inclusión en un kit de la presente divulgación escinde al menos un 50 %, al menos un 60 %, al menos un 70 %, al menos un 80 %, al menos un 90 %, al menos un 95 %, al menos un 98 %, al menos un 99 % o más de un 99 %, del ARN presente en una muestra en un período de tiempo de 30 segundos a 60 minutos, por ejemplo, de 1 minuto a 60 minutos, de 30 segundos a 5 minutos, de 1 minuto a 5 minutos, de 1 minuto a 10 minutos, de 5 minutos a 10 minutos, de 10 minutos a 15 minutos, de 15 minutos a 20 minutos, de 20 minutos a 25 minutos, de 25 minutos a 30 minutos, de 30 minutos a 35 minutos, de 35 minutos a 40 minutos, de 40 minutos a 45 minutos, de 45 minutos a 50 minutos, de 50 minutos a 55 minutos o de 55 minutos a 60 minutos. En algunos casos, una proteína C2c2 adecuada para su inclusión en un kit de la presente divulgación escinde al menos un 50 %, al menos un 60 %, al menos un 70 %, al menos un 80 %, al menos un 90 %, al menos un 95 %, al menos un 98 %, al menos un 99 % o más de un 99 %, del ARN presente en una muestra en un período de tiempo de 30 segundos a 5 minutos (por ejemplo, de 1 minuto a 5 minutos, por ejemplo, en un período de tiempo de 1 minuto, 2 minutos, 3 minutos, 4 minutos o 5 minutos). En algunos casos, una proteína C2c2 adecuada para su inclusión en un kit de la presente divulgación escinde al menos un 50 %, al menos un 60 %, al menos un 70 %, al menos un 80 %, al menos un 90 %, al menos un 95 %, al menos un 98 %, al menos un 99 % o más de un 99 %, del ARN presente en una muestra en un período de tiempo de 5 minutos a 10 minutos (por ejemplo, en un período de tiempo de 5 minutos, 6 minutos, 7 minutos, 8 minutos, 9 minutos o 10 minutos). En algunos casos, una proteína C2c2 adecuada para su inclusión en un kit de la presente divulgación escinde al menos un 50 %, al menos un 60 %, al menos un 70 %, al menos un 80 %, al menos un 90 %, al menos un 95 %, al menos un 98 %, al menos un 99 % o más de un 99 %, del ARN presente en una muestra en un período de tiempo de 10 minutos a 15 minutos (por ejemplo, 10 minutos, 11 minutos, 12 minutos, 13 minutos, 14 minutos o 15 minutos). En algunos casos, una proteína C2c2 adecuada para su inclusión en un kit de la presente divulgación escinde al menos un 50 %, al menos un 60 %, al menos un 70 %, al menos un 80 %, al menos un 90 %, al menos un 95 %, al menos un 98 %, al menos un 99 % o más de un 99 %, del ARN presente en una muestra en un período de tiempo de 15 minutos a 20 minutos. En algunos casos, una proteína C2c2 adecuada para su inclusión en un kit de la presente divulgación escinde al menos un 50 %, al menos un 60 %, al menos un 70 %, al menos un 80 %, al menos un 90 %, al menos un 95 %, al menos un 98 %, al menos un 99 % o más de un 99 %, del ARN presente en una muestra en un período de tiempo de 20 minutos a 25 minutos. En algunos casos, una proteína C2c2 adecuada para su inclusión en un kit de la presente divulgación escinde al menos un 50 %, al menos un 60 %, al menos un 70 %, al menos un 80 %, al menos un 90 %, al menos un 95 %, al menos un 98 %, al menos un 99 % o más de un 99 %, del ARN presente en una muestra en un período de tiempo de 25 minutos a 30 minutos. En algunos casos, una proteína C2c2 adecuada para su inclusión en un kit de la presente divulgación escinde al menos un 50 %, al menos un 60 %, al menos un 70 %, al menos un 80 %, al menos un 90 %, al menos un 95 %, al menos un 98 %, al menos un 99 % o más de un 99 %, del ARN presente en una muestra en un período de tiempo de 30 minutos a 35 minutos. En algunos casos, una proteína C2c2 adecuada para su inclusión en un kit de la presente divulgación escinde al menos un 50 %, al menos un 60 %, al menos un 70 %, al menos un 80 %, al menos un 90 %, al menos un 95 %, al menos un 98 %, al menos un 99 % o más de un 99 %, del ARN presente en una muestra en un período de tiempo de 35 minutos a 40 minutos. En algunos casos, una proteína C2c2 adecuada para su inclusión en un kit de la presente divulgación escinde al menos un 50 %, al menos un 60 %, al menos un 70 %, al menos un 80 %, al menos un 90 %, al menos un 95 %, al menos un 98 %, al menos un 99 % o más de un 99 %, del ARN presente en una muestra en un período de tiempo de 40 minutos a 45 minutos. En algunos casos, una proteína C2c2 adecuada para su inclusión en un kit de la presente divulgación escinde al menos un 50 %, al menos un 60 %, al menos un 70 %, al menos un 80 %, al menos un 90 %, al menos un 95 %, al menos un 98 %, al menos un 99 % o más de un 99 %, del ARN presente en una muestra en un período de tiempo de 45 minutos a 50 minutos. En algunos casos, una proteína C2c2 adecuada para su inclusión en un kit de la presente divulgación escinde al menos un 50 %, al menos un 60 %, al menos un 70 %, al menos un 80 %, al menos un 90 %, al menos un 95 %, al menos un 98 %, al menos un 99 % o más de un 99 %, del ARN presente en una muestra en un período de tiempo de 50 minutos a 55 minutos. En algunos casos, una proteína C2c2 adecuada para su inclusión en un kit de la presente divulgación escinde al menos un 50 %, al menos un 60 %, al menos un 70 %, al menos un 80 %, al menos un 90 %, al menos un 95 %, al menos un 98 %, al menos un 99 % o más de un 99 %, del ARN presente en una muestra en un período de tiempo de 55 minutos a 60 minutos.
En algunos casos, la proteína C2c2 incluida en un kit de la presente divulgación no es una proteína C2c2 de Leptotrichia shahii (Lsh). En algunos casos, la proteína C2c2 es más eficaz que una proteína C2c2 de Leptotrichia shahii (Lsh) (p. ej., en la escisión del ARN no diana) en un factor de 1,2 veces o más (p. ej., 1,5 veces o más, 1,7 veces o más o 2 veces o más). De este modo, en algunos casos, una proteína C2c2 adecuada para su inclusión en un kit de la presente divulgación es más eficaz, en un factor de 1,2 veces o más (por ejemplo, 1,5 veces o más, 1,7 veces o más o 2 veces o más), que una proteína C2c2 de Leptotrichia shahii (Lsh) en la escisión del ARN que no es la diana del ARN guía de C2c2 del método. En algunos casos, una proteína C2c2 adecuada para su inclusión en un kit de la presente divulgación, cuando se activa, escinde el ARN no diana al menos 1,2 veces, al menos 1,5 veces, al menos 2 veces, al menos 2,5 veces, al menos 3 veces, al menos 4 veces, al menos 5 veces, al menos 6 veces, al menos 7 veces, al menos 8 veces, al menos 9 veces, al menos 10 veces, al menos 15 veces, al menos 20 veces, al menos aproximadamente 30 veces o más de 30 veces, más eficazmente que Lsh C2c2.
Controles positivos
Un kit de la presente divulgación que comprende un ARN detector marcado y un polipéptido C2c2 también puede incluir un ARN diana de control positivo. En algunos casos, el kit también incluye un ARN guía de control positivo que comprende una secuencia de nucleótidos que hibrida con el ARN diana de control. En algunos casos, el ARN diana de control positivo se proporciona en diversas cantidades, en recipientes separados. En algunos casos, el ARN diana de control positivo se proporciona en diversas concentraciones conocidas, en envases separados, junto con ARN no diana de control.
Ácido nucleico que codifica un ARN guía de C2c2 y/o una matriz de ARN guía de C2c2 precursor y/o una proteína C2c2
Aunque los ARN de la divulgación (p. ej., ARN guía de C2c2 y matrices de ARN guía de C2c2 precursor) se pueden sintetizar usando cualquier método conveniente (p. ej., síntesis química, in vitro utilizando una enzima ARN polimerasa, por ejemplo, polimerasa T7, polimerasa T3, polimerasa SP6 , etc.), también se contemplan ácidos nucleicos que codifican ARN guía de C2c2 y/o matrices de ARN guía de C2c2 precursor. Además, aunque las proteínas C2c2 de la divulgación se pueden proporcionar (por ejemplo, como parte de un kit) en forma de proteína, también se pueden proporcionar ácidos nucleicos (tales como ARNm y/o ADN) que codifican la o las proteínas C2c2.
Por ejemplo, en algunas realizaciones, un kit de la presente divulgación comprende un ácido nucleico (por ejemplo, un a Dn , por ejemplo, un vector de expresión recombinante) que comprende una secuencia de nucleótidos que codifica un ARN guía de C2c2. En algunos casos, la secuencia de nucleótidos codifica un ARN guía de C2c2 sin una secuencia guía. Por ejemplo, en algunos casos, el ácido nucleico comprende una secuencia de nucleótidos que codifica una región constante de un ARN guía de C2c2 (un ARN guía de C2c2 sin una secuencia guía), y comprende un sitio de inserción para un ácido nucleico que codifica una secuencia guía. En algunas realizaciones, un kit de la presente divulgación comprende un ácido nucleico (por ejemplo, un ARNm, un ADN, por ejemplo, un vector de expresión recombinante) que comprende una secuencia de nucleótidos que codifica una proteína C2c2.
En algunas realizaciones, un kit de la presente divulgación comprende un ácido nucleico (por ejemplo, un ADN, por ejemplo, un vector de expresión recombinante) que comprende una secuencia de nucleótidos que codifica una matriz de ARN guía de C2c2 precursor (p. ej., en algunos casos en donde cada ARN guía de la matriz tiene una secuencia guía diferente). En algunos casos, uno o más de los ARN guía codificados de la matriz no tiene una secuencia guía, por ejemplo, el ácido nucleico puede incluir uno o más sitios de inserción para la o las secuencias guía de uno o más de los ARN guía de la matriz. En algunos casos, un ARN guía de C2c2 en cuestión puede incluir un mango de un crRNA precursor pero no necesariamente tiene que incluir múltiples secuencias guía.
En algunos casos, la secuencia de nucleótidos que codifica el ARN guía de C2c2 (y/o la secuencia de nucleótidos que codifica la matriz de ARN guía de C2c2 precursor) está unida operativamente a un promotor, por ejemplo, un promotor que es funcional en una célula procariota, un promotor que es funcional en una célula eucariota, un promotor que es funcional en una célula de mamífero, un promotor que es funcional en una célula humana, y similares. En algunos casos, una secuencia de nucleótidos que codifica una proteína C2c2 está unida operativamente a un promotor, por ejemplo, un promotor que es funcional en una célula procariota, un promotor que es funcional en una célula eucariota, un promotor que es funcional en una célula de mamífero, un promotor que es funcional en una célula humana, un promotor específico del tipo de célula, un promotor regulable, un promotor específico de tejido, y similares.
Ejemplos
Los siguientes ejemplos se exponen a fin de proporcionar a los expertos habituales en la materia una divulgación y descripción completa de cómo producir y usar la presente invención y no pretenden limitar el alcance de lo que los inventores consideran su invención y tampoco pretenden representar que los experimentos presentados a continuación sean todos o los únicos experimentos llevados a cabo. La invención es como se define en las reivindicaciones adjuntas. Se han realizado esfuerzos para garantizar la precisión con respecto a los números utilizados (por ejemplo, cantidades, temperatura, etc.) pero deben tenerse en cuenta algunos errores y desviaciones experimentales. A menos que se indique lo contrario, las partes son partes en peso, el peso molecular es el peso molecular promedio en peso, la temperatura está en grados Celsius y la presión es igual o cercana a la atmosférica. Pueden emplearse abreviaturas convencionales, por ejemplo, pb, par o pares de bases; kb, kilobase o kilobases; pl, picolitro o picolitros; s, segundo o segundos; min, minuto o minutos; h, hora u horas; aa, aminoácido o aminoácidos; kb, kilobase o kilobases; pb, par o pares de bases; nt, nucleótido o nucleótidos; i.m., (por vía) intramuscular; i.p., (por vía) intraperitoneal; s.c., (por vía) subcutánea; y similares.
Los datos descritos en el presente documento muestran que C2c2 posee dos actividades de ribonucleasa distintas responsables del procesamiento del ARN de CRISPR y de la degradación de ssRNA. La maduración de los ARN de CRISPR precursores (pre-crRNA) es un acontecimiento altamente específico y relativamente lento. Por el contrario, al unirse a los ARN diana que tienen complementariedad de secuencia con el segmento guía del crRNA, C2c2 se activa como una RNasa general robusta que escinde el ARN en cis y en trans iniciando la escisión de la cadena en nucleótidos de uracilo. Los datos muestran que esta actividad de escisión en trans se puede aprovechar para la detección de ARN ultrasensible dentro de mezclas complejas.
Ejemplo 1: Purificación de proteína C2c2 recombinante
Fig. 1A-1E. Resumen del locus de C2c2 endógena y expresión heteróloga y purificación de la proteína C2c2 recombinante. Fig. 1A. Diagrama esquemático del locus de C2c2 de Leptotricia buccalis. Sitios activos de HEPN previstos indicados en amarillo con los restos de sitios activos indicados. Fig. 1B. Diagrama esquemático de crRNA maduro de este sistema CRISPR de Tipo VI. Fig. 1C. Análisis de electroforesis en gel de dodecilsulfato de sodiopoliacrilamida (SDS-PAGE) de fracciones de cromatografía de intercambio catiónico. Se recogieron células E. coli que expresan proteína de unión a His-maltosa (MBP)-C2c2 y se lisaron mediante sonicación. Los lisados se aclararon por centrifugación y después se aisló His-MBP-C2c2 mediante cromatografía de afinidad con iones metálicos. Los eluatos de proteína se incubaron con proteasa TEV para escindir la etiqueta His-MBP. La proteína escindida se cargó en una columna de heparina HiTrap y se eluyó con un gradiente lineal de KCl. Las fracciones de elución se cargaron en un gel SDS-PAGE al 10% para su análisis. Fig. 1D. Las fracciones de cromatografía de intercambio catiónico se agruparon, se concentraron y luego se cargaron en una columna de cromatografía de exclusión por tamaño S200. Las fracciones de la cromatografía de intercambio de tamaño se analizaron mediante SDS-PAGE. Fig. 1E. Modelo de trabajo para la actividad enzimática de C2c2.
Ejemplo 2: C2c2 es una endorribonucleasa programable
ARN monocatenario (ssRNA) escindido por C2c2 purificada de una manera dirigida por crRNA que dependía de la presencia de dominios HEPN catalíticamente activos (Fig. 2)
Fig. 2. Los ensayos de escisión se realizaron en Tris-HCl 20 mM, pH 6 ,8 , KCl 50 mM, MgCh 5 mM y glicerol al 5 %. Se preincubó proteína C2c2 100 nM con crRNA en una proporción de 2:1 durante 10 minutos a 37 °C para promover el ensamblaje del complejo. La adición de ssRNA marcado con 5'-32P a una concentración ~1 nM inició la reacción y los puntos de tiempo se tomaron mediante inactivación con tampón de carga de formamida. La formación del producto de escisión se resolvió con urea-PAGE desnaturalizante al 15 % y se visualizó con un phosphorimager. La proteína inactivada (indicada por la notación dC2c2) es un mutante puntual cuádruple (R472A, H477A, R1048A, H1053A) que elimina tanto la arginina como la histidina del motivo RX4-6-H de HEPN en los dos sitios activos predichos. En este gel, las calles de interés están resaltadas por los recuadros rojos. No se detecta actividad de escisión con ssRNA fuera de la diana o cuando los dominios HEPN están inactivados.
Ejemplo 3: La actividad de escisión de C2c2 es específica del ARN monocatenario
C2c2 no presentó escisión de ARN o ADN bicatenario, mostrando una escisión limitada de ADN monocatenario a una tasa mucho más reducida en comparación con el ssRNA (Fig. 3).
Fig. 3. C2c2 escindió de forma robusta el ARN monocatenario y no escindió sustratos bicatenarios. Condiciones del ensayo de escisión según la Fig. 2. Los productos de escisión se resolvieron en un gel de urea-PAGE desnaturalizante al 15 %. Se tomaron muestras a los 5, 10, 30 y 75 min, incubando todas las calles de controles en paralelo durante 75 minutos. Los productos de escisión del intervalo de tamaño esperado solo se pueden detectar en las reacciones de ssRNA y, en menor medida, en las condiciones de ADN monocatenario. El marcaje del extremo 3' de la diana de ARN monocatenario demuestra que la escisión se produce fuera de la región de hibridación dianaespaciador. Las etiquetas en la parte superior de la figura indican si se añadió proteína ("Lbu C2c2") o ARN guía de C2c2 ("crGAPDHl"). Los controles incluían (i) proteína pero no ARN guía, (ii) ARN guía pero sin proteína y (iii) sin proteína y sin ARN guía.
Ejemplo 4: C2c2 procesa los crRNA precursores en crRNA maduros
C2c2 procesó crRNA precursores proporcionando crRNA maduros de una manera independiente del dominio HEPN (Fig. 4A-4B), lo que indica la presencia de un dominio de endonucleasa adicional.
Fig. 4A. Diagrama de la reacción de procesamiento de pre-crRNA catalizada por C2c2. Fig. 4B. Se incubó Lbu C2c2 100 nM en HEPES 20 mM, pH 6 ,8 , KCl 50 mM, MgCh 5 mM, glicerol al 5 % con ssRNA marcado con 5'-32P a una concentración ~5 nM durante 60 minutos antes de inactivar con tampón de carga de formamida. Los productos de reacción se resolvieron en gel de urea-PAGE desnaturalizante al 15 % y se visualizaron con un phosphoimager. La proteína inactivada (indicada por la notación dC2c2) es un mutante puntual cuádruple (R472A, H477A, R1048A, H1053A) que elimina tanto la arginina como la histidina del motivo RX4-6-H de HEPN en los dos sitios activos predichos. Se ensayaron tres pre-crRNA diferentes con secuencias espaciadoras variables para determinar la capacidad de procesamiento de C2c2.
Ejemplo 5: Detección sensible de transcritos en mezclas complejas
C2c2 se usó para detectar transcritos diana en mezclas complejas (Fig. 5).
Fig. 5. Se incubó C2c2:crRNA dirigido a ssRNA de lambda 2 a una concentración 50 nM con una concentración 185 nM de sustrato RNAasa-Alert (un oligonucleótido de ARN pequeño inactivador de la fluorescencia - un ARN detector marcado con un par inactivador/flúor) y 100 ng de ARN total de HEK293T en presencia de cantidades crecientes de ssRNA de lambda2 (0-10 nM) durante 30 minutos a 37 °C. Se observó un aumento en la fluorescencia cuando C2c2 "activada" (C2c2:crRNA:ssRNA de lambda2) escindió el sustrato RNAse-Alert liberando el flúor del resto inactivador.
Ejemplo 6 : procesamiento de crRNA precursor (pre-crRNA) por la proteína C2c2
C2c2 escindió (procesó) el crRNA precursor (pre-crRNA) y esta escisión fue independiente de un dominio HEPN (Fig. 6).
Fig. 6. Se incubó una concentración 300 nM de C2c2 con pre-crRNA marcado con 5'-P-32 a una concentración 1 nM durante 0-60 minutos a 37 °C. Los productos de ARN se separaron en urea-PAGE al 15 % y se obtuvieron imágenes usando un phosphorimager. El procesamiento satisfactorio del pre-crRNA se determina por la presencia de un producto de "ARN escindido" más pequeño.
Ejemplo 7
MATERIALES Y MÉTODOS
Se usaron los siguientes materiales y métodos, y son aplicables a los Ejemplos 8-12.
Selección filogenética y de candidatos de C2c2. Las filogenias de máxima verosimilitud de C2c2 se calcularon utilizando RAxML con el modelo evolutivo PROTGAMMALG y 100 muestreos bootstrap. Las secuencias se alinearon por MAFFT con el método "einsi". Niewoehner, O. & Jinek, M. Structural basis for the endoribonuclease activity of the type III-A CRISPR-associated protein Csm6. RNA 22, 318-329 (2016). Se seleccionaron homólogos candidatos para muestrear los grupos principales de la familia de proteínas.
Producción y purificación de proteína C2c2. Se ensamblaron vectores de expresión para la purificación de proteínas utilizando gBlocks sintéticos pedidos a Integrated DNA Technologies. La secuencia genómica de C2c2 optimizada por codones se marcó en el extremo N con un sitio de escisión His6-MBP-TEV, dirigiéndose la expresión por un promotor T7 (mapa disponible bajo petición). Las proteínas mutantes se clonaron a través de mutagénesis dirigida basada en PCR inversa ("round-the-horn") de construcciones de C2c2 de tipo silvestre. Los vectores de expresión se utilizaron para transformar células E. coli Rosetta2 cultivadas en caldo 2xYT a 37 °C. Las células E. coli se indujeron durante la fase logarítmica con isopropil p-D-1-tiogalatopiranósido (ITPG) 0,5 M, y la temperatura se redujo a 16 °C para la expresión durante la noche de His-MBP-C2c2. Posteriormente se recogieron las células, se resuspenden en tampón de lisis (Tris-HCl 50 mM pH 7,0, NaCl 500 M, glicerol al 5%, tris(2-carboxietil)fosfina (TCEP) 1 mM, fluoruro de fenilmetanosulfonilo (PMSF) 0,5 mM e inhibidor de proteasa libre de ácido etilendiaminotetraacético (EDTA) (Roche) y se lisaron por sonicación, y los lisados se aclararon por centrifugación. Se aisló His-MBP-C2c2 soluble mediante cromatografía de afinidad con iones metálicos, y el eluato que contenía proteína se incubó con proteasa del virus del grabado del tabaco (TEV) a 4 °C durante la noche mientras se dializaba en tampón de intercambio iónico (Tris-HCl 50 mM, pH 7,0, KCl 250 mM, glicerol al 5 %, TCEP 1 mM) con el fin de escindir la etiqueta His6-MBP. La proteína escindida se cargó en una columna HiTrap SP y se eluyó con un gradiente lineal de KCl (0,25-1,5 M). Las fracciones de cromatografía de intercambio catiónico se combinaron y concentraron con concentradores de corte de 30 kD (Thermo Fisher). La proteína C2c2 se purificó adicionalmente mediante cromatografía de exclusión por tamaño en una columna S200 y se almacenó en tampón de filtración en gel (Tris-HCl 20 mM, pH 7,0, KCl 200 mM, glicerol al 5 %, TCEP 1 mM) para los ensayos enzimáticos posteriores.
Generación de ssRNA. Todos los ARN utilizados en este estudio se transcribieron in vitro a excepción del crRNA AES461, del que se pidió la síntesis (Integrated DNA Technologies) [véase la FIG. 15 y la FIG. 19]. Las reacciones de transcripción in vitro se realizaron como se ha descrito anteriormente con las siguientes modificaciones: la concentración de polimerasa T7 se redujo a 10 pg/ml y la concentración de UTP se redujo a 2,5 mM. Las transcripciones se incubaron a 37 °C durante 1-2 horas para reducir la adición de nucleótidos fuera del molde. Todas las reacciones de transcripción se purificaron utilizando geles PAGE desnaturalizantes al 15 %. Todos los ARN se resuspendieron en tampón de escisión (HEPES 20 mM pH 6 ,8 , KCl 50 mM, MgCh 5 mM y glicerol al 5 %). Para los experimentos radiactivos, se retiraron los trifosfatos 5' con fosfato intestinal de ternera (New England Biolabs) antes del radiomarcaje y los sustratos de ssRNA se marcaron en el extremo 5' usando polinucleótido quinasa T4 (New England Biolabs) y [y-12P]-ATP (Perkin Elmer) como se ha descrito anteriormente. Sternberg, S. H., Haurwitz, R. E. & Doudna, J. A. Mechanism of substrate selection by a highly specific CRISPR endoribonuclease. RNA 18, 661-672 (2 0 1 2 ).
Los sustratos de ADN utilizados en este estudio se presentan en la Tabla 2, FIG. 14.
Los sustratos de ARN utilizados en este estudio se presentan en la Tabla 3, FIG. 15.
Ensayos de procesamiento de pre-crRNA. Los ensayos de escisión de pre-crRNA se realizaron a 37 °C en tampón de procesamiento (HEPES 20 mM, pH 6 ,8 , KCl 50 mM, MgCh 5 mM, 10 pg/ml de albúmina de suero bovino (b Sa ), 10 pg/ml de tRNA, Igepal CA-630 al 0,05 % y glicerol al 5 %) con un exceso molar de 100 veces de C2c2 en relación con el pre-crRNA marcado en posición 5' (concentraciones finales de 100 nM y >1 nM, respectivamente). A menos que se indique otra cosa, la reacción se inactivó después de 60 minutos con colorante de carga de ARN 1,5X (formamida al 100 %, azul de bromofenol al 0,025 % p/v y 200 pg ml-1 de heparina). Después de la inactivación, las reacciones se desnaturalizaron a 95 °C durante 5 min antes de resolverse con PAGE desnaturalizante al 12 % o al 15 % (tampón TBE 0,5X). La dependencia del metal de la reacción se ensayó mediante la adición de EDTA o EGTA al tampón de reacción a concentraciones que variaban de 10 a 100 mM. Las bandas se visualizaron mediante imágenes obtenidas con un phosphorimager y se cuantificaron con ImageQuant (GE Healthcare). El porcentaje de escisión se determinó como la relación entre la intensidad de la banda del producto y la intensidad total tanto del producto como de las bandas de pre-crRNA no escindidas y se normalizó con respecto al valor de referencia dentro de cada sustrato medido utilizando el software ImageQuant TL (GE Healthcare) y se ajustó a una asociación en fase exponencial utilizando Prism (GraphPad).
Mapeo del tamaño del producto. La longitud del producto de escisión se determinó bioquímicamente comparando la migración en gel de las bandas del producto con las escaleras de hidrólisis alcalina y digestión con RNasa T1 utilizando el kit RNasa T1 de Ambion. Para la escalera de hidrólisis, se incubaron sustratos de ARN de longitud completa 15 nM se incubaron a 95 °C en tampón de hidrólisis alcalina IX (Ambion) durante 5 minutos. Las reacciones se inactivaron con tampón de carga de ARN 1,5X y se enfriaron a -20 °C para detener inmediatamente la hidrólisis. Para la escalera de RNasa T1, se desplegaron sustratos de ARN de longitud completa 15 nM en tampón de secuenciación de ARN IX (Ambion) a 65 °C. Las reacciones se enfriaron a temperatura ambiente y, posteriormente, se añadió 1 pl de RNasa T1 a la reacción. Después de 15 minutos, las reacciones se detuvieron mediante extracción con fenol-cloroformo y se añadió tampón de carga de ARN 1,5X para el almacenamiento. Las bandas de hidrólisis se resolvieron en paralelo a las muestras de escisión en PAGE desnaturalizante al 15% y se visualizaron mediante imágenes obtenidas con un phosphorimager.
Ensayos de escisión de diana. Los ensayos de escisión de la diana se realizaron a 25 °C y 37 °C en tampón de escisión (HEPES 20 mM pH 6 ,8 , KCl 50 mM, MgCh 5 mM y glicerol al 5 %). Las guías de crRNA se plegaron previamente calentándolas a 65 °C durante 5 min y después enfriándolas lentamente a temperatura ambiente en tampón de escisión. La formación del complejo RNP se realizó en tampón de escisión, generalmente en una relación molar entre proteína y crRNA de 2:1 a 37 °C durante 10 min, antes de añadir la diana marcada en el extremo 5' y/u otros sustratos diana de ARN no radiomarcados. A menos que se indique otra cosa, las concentraciones finales de proteína, guía y dianas fueron 100 nM, 50 nM y >1 nM respectivamente para todas las reacciones. Las reacciones se inactivaron con colorante de carga de ARN 1,5X y se resolvieron mediante PAGE desnaturalizante al 15 % (tampón TBE 0,5X). Las bandas se visualizaron mediante imágenes obtenidas con un phosphorimager y se cuantificaron con ImageQuant (GE Healthcare). El porcentaje de escisión se determinó como la proporción de la intensidad de formación de bandas total para todos los productos más cortos en relación con la banda no escindida y se normalizó para el nivel de referencia dentro de cada sustrato medido mediante el software ImageQuant TL (GE Healthcare) y se ajustó a una asociación exponencial de una fase mediante Prism (GraphPad).
Ensayos de unión a filtro de crRNA. Los ensayos de unión al filtro se llevaron a cabo en tampón de procesamiento de ARN (HEPES 20 mM, pH 6 ,8 , KCl 50 mM, MgCh 5 mM, 10 pg/ml de BSA, 10 pg/ml de tRNA de levadura, Igepal CA-630 al 0,01 % y glicerol al 5 %). LbuC2c2 se incubó con crRNA radiomarcado (<0,1 nM) durante 1 hora a 37 °C. Tufryn, Protran e Hybond-N+ se ensamblaron en un aparato de transferencia puntual en el orden indicado anteriormente. Las membranas se lavaron dos veces con 50 pl de tampón de equilibrio (HEPES 20 mM pH 6 ,8 , KCl 50 mM, MgCl2 5 mM y glicerol al 5 %) antes de aplicar la muestra a las membranas. Las membranas se lavaron de nuevo con 50 pl de tampón de equilibrio, se secaron y se visualizaron mediante formación de imágenes con phosphorimager. Los datos se cuantificaron con el software ImageQuant TL (GE Healthcare) y se ajustaron a una isoterma de unión usando Prism (software GraphPad). Todos los experimentos se realizaron tres veces. Las constantes de disociación y los errores asociados se indican en las leyendas de las figuras.
Ensayos de cambio de movilidad electroforética. Para evitar la disociación del complejo LbuC2c2-dHEPN1/dHEPN2:crRNA a bajas concentraciones durante los experimentos de unión a ssRNA, las reacciones de unión contenían un exceso constante de LbuC22c2-dHEPN1/dHEPN2 (200 nM) y concentraciones crecientes de crRNA-A y una concentración <0,1 nM de ssRNA diana. Los ensayos se llevaron a cabo en tampón de ensayo de cambio de movilidad electroforética (EMSA) de C2c2 (HEPES 20 mM pH 6 ,8 , KCl 50 mM, 10 pg/ml de BSA, 100 pg/ml de tRNA de levadura, Igepal CA-630 al 0,01 % y glicerol al 5 %). Los complejos LbuC2c2-crRNA-A se formaron previamente como se ha descrito anteriormente durante 10 min a 37 °C antes de añadir el sustrato de ssRNA radiomarcado en 5' y una incubación adicional durante 45 min a 37 °C. A continuación, las muestras se resolvieron mediante PAGE nativa al 8 % a 4 °C (tampón TBE 0,5X). Se obtuvieron imágenes de los geles mediante un phosphorimager, se cuantificaron con el software ImageQuant TL (GE Healthcare) y se ajustaron a una isoterma de unión usando Prism (software GraphPad). Todos los experimentos se realizaron tres veces. Las constantes de disociación y los errores asociados se indican en las leyendas de las figuras.
Ensayo de detección de ARN fluorescente. Se preensamblaron complejos LbuC2c2:crRNA mediante incubación de una concentración 1 pM de Lbu-C2c2:C2c2 con 500 nM de crRNA durante 10 min a 37 °C. Estos complejos después se diluyeron a LbuC2c2 100 nM:crRNA-A2 50 nM en tampón de procesamiento de ARN (HEPES 20 mM pH 6 ,8 , KCl 50 mM, MgCl25 mM, 10 pg/ml de BSA, 10 pg/ml de tRNA de levadura, Igepal CA-630 al 0,01 % y glicerol al 5 %) en presencia de una concentración 185 nM de sustrato RNAasa-Alert (ThermoFisher), 100 ng de ARN total de HeLa y cantidades crecientes de ssRNA (0-1 nM). Estas reacciones se incubaron en un lector de placas de fluorescencia durante un máximo de 120 minutos a 37 °C, tomándose las mediciones de fluorescencia cada 5 minutos (Aex: 485 nm; Aem: 535 nm). Los valores de fluorescencia con corrección para el valor de referencia se obtuvieron restando los valores de fluorescencia obtenidos de las reacciones realizadas en ausencia del ssRNA diana. La fluorescencia máxima se midió incubando RNasaA 50 nM con una concentración 185 nM de sustrato de RNAasa-Alert. Para los ensayos de procesamiento de pre-crRNA acoplado y de detección de ARN, se preensamblaron complejos LbuCas9-sgRNA incubando 1 pM de Lbu-C2c2:C2c2 con 500 nM de pre-crRNA-A-A2 durante 20 min a 37 °C y las reacciones se llevaron a cabo como se ha descrito anteriormente en presencia de cantidades crecientes de ssRNA A y ssRNA A2 (0-1 nM cada uno). En todos los casos, las barras de error representan la desviación estándar de tres experimentos independientes.
Ejemplo 8 : La familia C2c2 procesa transcritos de crRNA precursores para generar crRNA maduros
Los locus de CRISPR de Tipo VI carecen de un tracrRNA o endonucleasa Cas6 o Cas5d evidente. Se planteó la cuestión de si la propia C2c2 podría poseer actividad de procesamiento del pre-crRNA. Para analizar esto, se expresaron en Escherichia coli homólogos de C2c2 recombinantes de Leptotrichia buccalis (Lbu), Leptotrichia shahii (Lsh) y Listeria seeligeri (Lse), que proceden de tres grupos distintos de la familia de proteínas C2c2, y se purificaron. FIG. 9A-9B.
Las tres proteínas escindieron sustratos de pre-crRNA radiomarcados en el extremo 5' que consistían en una secuencia de repetición consenso de longitud completa y una secuencia espaciadora de 20 nucleótidos (nt) en 60 minutos. FIG. 9C. El sitio de escisión para todos los homólogos de pre-crRNA se mapeó usando escaleras de hidrólisis de hidróxido y RNasa T1; se demostró que el procesamiento tiene lugar en las posiciones dos o cinco nt aguas arriba de la estructura de horquilla predicha dependiendo del homólogo. FIG. 9C.
Es posible que ciertos factores celulares puedan procesar adicionalmente el crRNA, ya que los datos de secuenciación de la expresión heteróloga de los operones de LseC2c2 y LshC2c2 en E. coli encontraron acontecimientos de procesamiento similares pero no idénticos. Los ensayos de escisión con LbuC2c2 y un pre-crRNA que contenía una matriz de repetición de horquilla en tándem dieron como resultado dos productos correspondientes a dos acontecimientos de escisión sucesivos (FIG. 16A-16F), coherentes con un papel para C2c2 en el procesamiento de transcritos primarios de crRNA. Estos resultados demuestran que dentro de los sistemas CRISPR de Tipo VI, los homólogos de C2c2 catalizan la maduración de sus crRNA asociados.
FIG. 9A-9C. La familia C2c2 procesa transcritos de crRNA precursores para generar crRNA maduros. FIG. 9A, Árbol filogenético de máxima verosimilitud de proteínas C2c2. Todos los detalles, incluidos los accesos, los nombres de los organismos y los valores de remuestreo bootstrap se proporcionan en la FIG. 22A. Los homólogos utilizados en este estudio están resaltados en amarillo. FIG. 9B, Diagrama de los tres locus de CRISPR de Tipo VI diferentes. Los rectángulos negros denotan elementos repetidos, mientras que los rombos amarillos indican secuencias espaciadoras. Cas 1 y Cas2 solo se encuentran en la proximidad genómica de LshC2c2. FIG. 9C, Escisión mediada por CC2c2 de pre-crRNA derivado de LbuC2c2, LseC2c2 y LshC2c2. OH: escalera de hidrólisis alcalina; T1: escalera de hidrólisis de RNasa T1; Las reacciones de procesamiento de escisión se realizaron con C2c2 100 nM y pre-crRNA >1 nM. El esquema de escisión se representa a la derecha, y las estructuras secundarias de pre-crRNA predichas se presentan en forma de diagrama debajo, indicando las flechas el sitio de escisión de C2c2 mapeado.
FIG. 22A-22B. Árbol filogenético completo de la familia C2c2 y alineamiento de C2c2. FIG. 22A, Reconstrucción filogenética de máxima verosimilitud de proteínas C2c2. Las ramificaciones incluyen el número de proteínas GI y el organismo de origen; para la división interna se presentan valores de soporte del remuestro bootstrap, de 100 remuestreos. La escala está en sustituciones por sitio. FIG. 22B, alineamiento de múltiples secuencias de los tres homólogos analizados de C2c2, las coordenadas se basan en LbuC2c2.
FIG. 23A-23D. Purificación y Producción de C2c2. Todos los homólogos de C2c2 se expresaron en E. coli como fusiones His-MBP y se purificaron por una combinación de afinidad, cromatografía de intercambio iónico y de exclusión por tamaño. Se retiró la etiqueta de afinidad Ni+ mediante incubación con proteasa TEV. Los geles SDS-PAGE representativos de las fracciones de cromatografía se muestran arriba en (FIG. 23A-23B). FIG. 23C, El cromatógrafo de la columna Superdex 200 (16/60) que demuestra que C2c2 eluye como un solo pico, desprovisto de ácido nucleico. FIG. 23D, Análisis SDS-PAGE de todas las proteínas purificadas utilizadas en este texto original.
FIG. 16A-16F. El procesamiento de pre-crRNA por C2c2 es independiente de la secuencia espaciadora, se puede producir en matrices de crRNA en tándem, se ve afectado por mutaciones en la región flanqueante 5' del pre-ARNc y es independiente de metal. a, Ensayo representativo de escisión de pre-crRNA a lo largo de un periodo de tiempo que demuestra las tasas similares de procesamiento de pre-crRNA de LbuC2c2, LshC2c2 y LseC2c2. b , Mapeo del sitio de escisión de la escisión de LseC2c2 y LshCC2c2 de una única matriz de pre-crRNA afín. OH: escalera de hidrólisis alcalina; T1: escalera de hidrólisis de RNasa T1. Las reacciones de escisión se realizaron con Lbu C2c2 100 nM y pre-crRNA <1 nM. Se representa un esquema de productos de escisión, indicando las flechas los productos de escisión de C2c2 mapeados. c , Mapeo del sitio de escisión de la escisión por LbuCC2c2 de una matriz de pre-crRNA en tándem. OH: escalera de hidrólisis alcalina; T1: escalera de hidrólisis de RNasa T1. Las reacciones de escisión se realizaron con Lbu C2c2 100 nM y pre-crRNA <1 nM. A la derecha se representa un esquema de los productos de escisión, indicando las flechas los productos de escisión de C2c2 mapeados. d , El periodo de tiempo de escisión de pre-crRNA por LbuC2c2 representativo demuestra que se producen tasas similares de procesamiento de pre-crRNA independientemente de la secuencia espaciadora de crRNA. e, Datos de procesamiento de pre-crRNA mutante tetramérico de LbuC2c2 que demuestran la importancia de la región flanqueante monocatenaria 5' para un procesamiento eficaz de pre-crRNA. El porcentaje de procesamiento de pre-crRNA se midió después de 60 minutos (media ± s.d., n = 3). f , Gel desnaturalizante que ilustra la actividad de procesamiento en un intervalo de diferentes concentraciones de EDTA y EGTA. Las altas concentraciones de quelantes cambian el patrón de migración esperado de los productos
Ejemplo 9: La biogénesis de crRNA mediada por LbuC2c2 depende tanto de la estructura como de la secuencia de las repeticiones CRISPR.
Otras enzimas de procesamiento de pre-crRNA, tales como Cas6 e Cas5d, reconocen la horquilla de su respectiva secuencia de repetición CRISPR de una manera muy específica. Se determinaron los requisitos estructurales y de secuencia para el procesamiento del ARN guía de LbuC2c2. Se realizaron ensayos de escisión con pre-crRNA que albergaban mutaciones en el tallo-bucle o en las regiones flanqueantes monocatenarias de la secuencia de repetición consenso (Fig. 10A-10C). La actividad de escisión del pre-crRNA se atenuó significativamente al alterar la longitud del tallo en la región repetida; mientras que el tallo de 4 pares de bases (pb) consenso repetido dio como resultado un 85 ± 0,7 % de escisión después de 60 minutos, los tallos de -1 pb y de 1 pb dieron como resultado tan solo un 54 ± 1,3 % y 6 ± 3,8 % de escisión, respectivamente (Fig. 10a). De forma análoga, la inversión del tallo-bucle o la reducción de la longitud del bucle redujeron la actividad de procesamiento. Los estudios iniciales con mutaciones contiguas de 4 nt que incluían o casi incluían el enlace escindible anularon por completo la capacidad de LbuC2c2 para procesar los pre-crRNA (FIG. 16D). Un análisis mutacional más amplio de la secuencia repetida completa de crRNA reveló dos regiones distintas a cada lado de la horquilla con notable sensibilidad a los cambios de base (Fig. 10B; FIG. 17). La actividad de procesamiento no se vio afectada en absoluto por la presencia de quelantes de iones metálicos divalentes EDTA o EGTA (Fig. 10C; FIG. 16E). De manera colectiva, estos datos indican que la escisión del pre-crRNA por C2c2 es un proceso independiente de iones metálicos divalentes gobernado por una combinación de reconocimiento estructural y específico de secuencia de horquillas derivadas de repeticiones dentro del transcrito de CRISPR precursor.
FIG. 10A-10C. La biogénesis de crRNA mediada por LbuC2c2 depende tanto de la estructura como de la secuencia de las repeticiones CRISPR. FIG. 10A, Gel representativo del procesamiento por LbuC2c2 de pre-crRNA que contienen mutaciones estructurales dentro de las regiones de tallo y bucle de la horquilla. Los porcentajes procesados presentados a continuación se cuantifican a los 60 min para cada condición (media ± s.d., n = 3). FIG.
10B, Mapa gráfico que muestra la dependencia del procesamiento de pre-crRNA de la secuencia de repetición CRISPR. La secuencia de repetición de tipo silvestre se muestra en la parte inferior, representando las barras individuales mutaciones de 2 nucleótidos como se indica arriba en rojo. El sitio de escisión se indica con el dibujo de unas tijeras. El porcentaje procesado se midió después de 60 minutos (media ± s.d., n = 3). Las horquillas representadas en forma de diagrama de los mutantes ensayados se pueden encontrar en las FIG 16A-16F y en la FIG. 17. FIG. 2C, Se desafió la dependencia de metales divalentes de la reacción de procesamiento mediante la adición de EDTA 10-100 mM a las condiciones de reacción de procesamiento estándar. Se muestra el punto final de la reacción a los 60 min.
FIG. 17. Resumen detallado del efecto de las mutaciones dobles de pre-crRNA sobre la actividad de procesamiento de pre-crRNA. El porcentaje de procesamiento de pre-crRNA se midió después de 60 minutos (media ± s.d., n = 3), según la sección Métodos. Los nucleótidos mutados se resaltan en amarillo. Véase la representación gráfica en la FIG. 10B.
Ejemplo 10: LbuC2c2 cataliza la degradación de ssRNA dependiente de guía en dianas cis y trans
Después de la maduración, los crRNA normalmente se unen con alta afinidad a la proteína o proteínas efectoras Cas para crear complejos de vigilancia guiados por ARN capaces de reconocer ácidos nucleicos de una manera específica de secuencia. Para ensayar la funcionalidad del crRNA procesado por C2c2, se usó la proteína LbuC2c2, que demostró la actividad más robusta en los experimentos de escisión iniciales. Para múltiples sustratos de ssRNA, se observó que LbuC2c2 escindía eficazmente solo cuando se unían al crRNA complementario, lo que indica que LbuC2c2:crRNA escinde el ssRNA de una manera guiada por ARN (Fig. 11b). En lo sucesivo, esta actividad se denomina escisión en la diana o c/s-diana (Fig. 11a). La escisión en cis mediada por LbuC2c2 dio como resultado una escalera de múltiples productos, produciéndose escisión preferentemente antes de los restos de uracilo, de forma análoga a LshC2c2 (FIG. 18A-18B)9, Esta actividad es distinta de la de otros efectores CRISPR de clase II (tales como Cas9 y Cpfl) que catalizan la escisión del ácido nucleico diana solo dentro de una región definida especificada por el emparejamiento de bases con el crRNA. Se ensayó la capacidad de LbuC2c2 para actuar como una endonucleasa de ARN no específica activada por crRNA en trans (es decir, la escisión catalizada por C2c2 de moléculas de ARN que no son la diana del crRNA) (Fig 11A). Esta capacidad se investigó repitiendo reacciones de escisión no diana en presencia de ssRNA no marcado, en la diana (complementario de crRNA). Se observó una rápida degradación de ARN no diana marcado en posición 5' en estas condiciones de escisión trans (Fig. 11B). Este resultado sugiere que el reconocimiento de un ssRNA diana complementario al segmento espaciador del crRNA activa a C2c2 para una degradación rápida y no específica del RNA en trans. Las tasas de escisión de ARN similares y los productos de escisión casi idénticos observados tanto para la escisión cis en la diana como para la escisión trans no diana implican el mismo centro de nucleasa en las dos actividades. Además, estos resultados sugieren que lo que se observa como actividad "cis" es simplemente la actividad trans que se produce cuando solo hay un sustrato disponible (FIG. 18A-18B).
FIG. 11A-11C. LbuC2c2 cataliza la degradación de ssRNA dependiente de guía en dianas cis y trans. FIG. 11A, Esquema de los dos modos de degradación de ssRNA dependiente de guía por C2c2. FIG. 11B, Escisión de dos sustratos de ssRNA radiomarcados distintos, A y B, por LbuC2c2. Se formaron previamente complejos de C2c2 100 nM y crRNA 50 nM a 37 °C y la reacción se inició tras la adición de una concentración >1 nM de ARN diana marcado en 5' a 25 °C. Las reacciones de escisión trans contenían concentraciones molares iguales (> 1 nM) de sustrato complementario no guía radiomarcado, y ssRNA diana en la diana no marcado. FIG. 11C, Se analizó la actividad de escisión de LbuC2c2 cargada con crRNA con espaciador A tanto en condiciones de escisión cis (diana A marcada) como en condiciones de escisión trans (diana B marcada en presencia de diana A no marcado) en presencia de EDTA.
FIG. 18A-18B. Mapeo del sitio de escisión del ssRNA diana por LbuC2c2. a, Ensayo de escisión de ssRNA diana realizado según la sección Métodos, que demuestra la escisión en "cis" mediada por LbuC2c2 de varios sustratos de ssRNA radiomarcados con secuencias complementarias al espaciador idénticas pero secuencias flanqueantes 5' distintas de longitud y composición de nucleótidos variable. Las secuencias de los sustratos de ssRNA se muestran a la derecha y en la parte inferior del gel con las secuencias complementarias de espaciador para crRNA-A y crRNA-B resaltadas en amarillo y rojo, respectivamente. Las flechas indican los sitios de escisión previstos. El gel se recortó para mayor claridad. Cabe señalar que el patrón de productos de escisión producidos en diferentes sustratos (p. ej., A. 1 frente a A.2 frente a A.3) indica que la elección del sitio de escisión está dirigida principalmente por una preferencia de uracilo y presenta una aparente falta de un mecanismo de escisión "basado en reglas de crRNA", lo que contrasta con lo que se observa para otros complejos de un solo efector de CRISPR de Clase II tales como Cas9 y Cpfl <ref?>. Curiosamente, el patrón de escisión observado para el sustrato A.0 sugiere una preferencia secundaria por las secuencias poliG, que posiblemente podrían formar cuádruplex de G o estructuras secundarias similares. b, Ensayo de escisión de ssRNA diana por LbuC2c2 según la sección Métodos, utilizando una gama de crRNA que se alinean con la longitud del ssRNA diana. La secuencia de los sustratos de ssRNA utilizados en este experimento se muestra debajo del gel con secuencias complementarias al espaciador para cada crRNA resaltadas en amarillo. Las flechas indican los sitios de escisión previstos. Análogamente, cabe señalar que para todos los crRNA, la distribución de la longitud del producto de escisión es muy similar, indicando de nuevo una aparente falta de un mecanismo de escisión "basado en reglas de crRNA". La ausencia de varios productos de escisión en un subconjunto de las reacciones podría explicarse por la presencia de C2c2:crRNA unido en el ssRNA diana que impide estéricamente el acceso a los uracilos por cualquier sitio activo de LbuC2c2 cis (intramolecular) o trans (intermolecular). Aunque el análisis adecuado de la preferencia del PFS para LbuC2c2 está más allá del alcance de este estudio, se observó un impacto mínimo de la secuencia flanqueante 3'. La base de PFS esperada se indica en el diagrama junto a cada guía ensayada en rojo.
Ejemplo 11: LbuC2c2 contiene dos actividades de ribonucleasa distintas
La actividad de procesamiento de pre-crRNA se produjo a una velocidad aparente 80 veces más lenta que la escisión mediada por crRNA de ARN diana o un trans-ssRNA no complementario (Fig. 12a). En condiciones enzimáticas de saturación, el procesamiento de pre-crRNA alcanzó solo ~85 % después de 1 h, mientras que la tasa de escisión guiada por ARN de sustratos trans era casi imposible de medir debido a que la reacción se completaba en 1 min a 37 °C (FIG. 19A-19C). También se observó que, en contraste con el procesamiento pre-crRNA, la escisión guiada por ARN se anulaba por completo en presencia de EDTA, lo que indica que esta actividad es dependiente de iones metálicos divalentes (Fig. 11c). Dadas las claras diferencias en la cinética y la dependencia de iones metálicos entre el procesamiento de pre-crRNA y la escisión guiada por ARN, se argumentó que C2c2 podría representar una nueva clase de proteínas efectoras CRISPR que poseían dos actividades de escisión de ARN ortogonales: una para la maduración de crRNA y la otra para la degradación de ARN no específica dirigida a crRNA. Para probar esta hipótesis, se mutaron sistemáticamente varios restos dentro de los dominios HEPN conservados de LbuC2c2, que se predice que contienen sitios activos de escisión de ARN; y se evaluó el procesamiento de pre-crRNA y la actividad de RNasa guiada por ARN de los mutantes (Fig. 12b). Los mutantes dobles y cuádruples de restos de HEPN conservados (R472A, R477A, R1048A y R1053) conservaron una sólida actividad de escisión de pre-crRNA (Fig. 12c). Por el contrario, todos los mutantes de HEPN anularon la actividad de escisión guiada por ARN sin afectar a la capacidad de unión de crRNA o ssRNA (FIG. 20A-20C). Las discrepancias en las tasas de escisión y la sensibilidad diferencial a las mutaciones puntuales y al EDTA muestran que el procesamiento de pre-crRNA y la escisión de ARN dirigida por ARN están mediadas por distintos centros catalíticos dentro de la proteína C2c2, siendo el primero independiente de metal y requiriendo el último dominios HEPN dependientes de metales divalentes.
FIG. 12A-12D. LbuC2c2 contiene dos actividades de ribonucleasa distintas. FIG. 4A, Los datos cuantificados del curso temporal de la escisión de ssRNA diana en cis (negro) y del pre-crRNA (verde azulado) por LbuC2c2 se realizaron a 37 °C. Los ajustes exponenciales se muestran como líneas continuas (n = 3) y las constantes de velocidad de primer orden calculadas (kobs) son 9,74 ± 1,15 y 0,12 ± 0,02 para la escisión de la diana en cis y de pre-crRNA respectivamente. FIG. 12B, Arquitectura de dominio de LbuC2c2 que representa la ubicación de las mutaciones HEPN FIG. 12C y 12D, Actividad de ribonucleasa de mutantes de dominio HEPN dobles y cuádruples para el procesamiento de pre-crRNA en FIG. 12C y direccionamiento a ssRNA en FIG. 12D. Reacciones de escisión en cis y trans realizadas como en la Fig 11c, utilizando el espaciador A dirigido a crRNA para ambas actividades.
FIG. 19A-19C Dependencia de la longitud del espaciador de crRNA, de la temperatura de la reacción y de la secuencia del extremo 5' del crRNA de la eficiencia de escisión del ARN diana. FIG. 19A, Ensayo de escisión de ssRNA diana por LbuC2c2 realizado, según la sección de Métodos, con crRNA que poseen espaciadores de 16 nt, 20 nt o 24 nt. FIG. 19B, Curso temporal de escisión de ssRNA de LbuC2c2 realizada a 25 °C o 37 °C, según la sección Métodos. FIG. 19C, Curso temporal de escisión de ssRNA diana por LbuC2c2 realizada según la sección Métodos con crRNA que poseen diferentes mutaciones de nucleótidos flanqueantes en 5'. Las mutaciones están resaltadas en rojo. Las extensiones 5' de 1-2 nucleótidos afectaban de forma insignificante a las eficacias de escisión. En contraste, el acortamiento de la región flanqueante a 3 nt ralentizó las eficacias de escisión. Los ajustes exponenciales se muestran como líneas continuas para réplicas representativas.
FIG. 20A-20C. Datos de unión de LbuC2c2 a crRNA maduro y ssRNA diana. FIG. 20A, Los ensayos de unión a filtros se realizaron como se describe en la sección de Métodos para determinar la afinidad de unión de crRNA-A maduro a LbuC2c2-WT, LbuC2c2-dHEPN1, LbuC2c2-dHEPN2 o LbuC2c2-dHEPNI/dHEPN2. Los datos cuantificados se ajustaron a isoformas de unión estándar. Las barras de error representan la desviación estándar de tres experimentos independientes. Las constantes de disociación medidas de tres experimentos independientes (media ± sd) fueron 27,1 ± 7,5 nM (LbuC2c2-WT), 15,2 ± 3,2 nM (LbuC2c2-dHEPN1), 11,5 ± 2,5 nM (LbuC2c2-dHEPN2) y 43,3 ± 11,5 nM (LbuC2c2-dHEPN1/dHEPN2). FIG. 20B, Ensayo representativo de cambio de movilidad electroforética para reacciones de unión entre LbuC2c2-dHEPN1/dHEPN2: crRNA-A y ssRNA A "en la diana" o ssRNA B "fuera de la diana", según se indica. Se realizaron tres experimentos independientes como se describe en la sección Métodos. El gel se recortó para mayor claridad. FIG. 20C, Los datos de unión cuantificados de (b) se ajustaron a isoformas de unión estándar. Las barras de error representan la desviación estándar de tres experimentos independientes. Las constantes de disociación medidas de tres experimentos independientes (media ± sd) fueron 1,62 ± 0,43 nM para ssRNA A y N.D (>> 10 nM) para ssRNA B.
Ejemplo 12: C2c2 proporciona detección visual sensible de transcritos en mezclas complejas.
La robusta escisión estimulada por ARN de C2c2 de sustratos en trans se puede emplear como un medio para detectar ARN específicos dentro de un grupo de transcritos. Hasta ahora, las estrategias de detección de ARN más sensibles requieren múltiples rondas de amplificación basada en polimerasa y/o transcriptasa inversa. Como alternativa, se ensayó si la actividad de endonucleasa en trans guiada por ARN de las proteínas C2c2 podría aprovecharse para escindir un sustrato de ARN indicador marcado con un inactivador de fluoróforo, con lo que se obtendría un aumento de la fluorescencia tras la activación de la RNasa desencadenada por el ARN diana (Fig. 13a). En resumen, LbuC2c2 se cargó con crRNA dirigidos al bacteriófago A y se ensayó su capacidad para detectar los ssRNA A diana correspondientes añadidos al ARN total de células HeLa. Si LbuC2c2 detectara con éxito la diana complementaria, la actividad de escisión en trans se activaría para escindir el indicador, liberando el fluoróforo del inactivador. Tras la adición de tan solo 1-10 pM de ARN diana A complementario, se observó un aumento sustancial de la fluorescencia específico de crRNA después de 30 minutos (Fig. 13b y FIG. 21). Los experimentos de control con el complejo C2c2:crRNA solo o en presencia de crRNA y un ARN diana no complementario dieron como resultado aumentos insignificantes en la fluorescencia con respecto a un control positivo de RNasa A (Fig. 13b y FIG. 21). A la concentración de 10 pM de un ARN diana A, se predice que solo ~0,02 % del complejo C2c2:crRNA estará en estado activo, sin embargo, la señal fluorescente observada reflejó ~25-50 % de escisión del sustrato de ARN indicador, dependiendo del ARN diana, lo que sugiere una actividad enzimática de recambio múltiple robusta por LbuC2c2. Por lo tanto, la escisión en trans dirigida por crRNA es potente y detectable incluso a niveles extremadamente bajos de proteína activa.
Dado que C2c2 procesa su propio pre-crRNA, se ensayó si el procesamiento de pre-crRNA y la detección de ARN podían combinarse en una sola reacción. Para probar esta idea, se diseñaron espaciadores que contenían repeticiones de crRNA en tándem complementarios a los ARN diana A y A2, y se ensayó su capacidad para detectar cantidades decrecientes de ARN A y A2 añadidas al ARN total de HeLa. Se observó un aumento significativo en la fluorescencia, similar en magnitud y sensibilidad a los experimentos que utilizan crRNA maduros (Fig. 13b, 13c), lo que sugiere que para el establecimiento de crRNA como diana, C2c2 puede procesar y utilizar con éxito un pre-crRNA en tándem. Estos datos resaltan el potencial para la detección de ARN multiplexado de moléculas de ARN individuales o múltiples en un ensayo utilizando un solo transcrito de pre-crRNA en tándem.
Sin quedar ligados a teoría alguna, se propone que cuando se detectan transcritos invasivos dentro de la célula hospedadora a través del emparejamiento de bases con crRNA, C2c2 se activa para la escisión promiscua del ARN en trans (Fig. 13d).
FIG. 13A-13D. C2c2 proporciona detección visual sensible de transcritos en mezclas complejas. FIG. 13A, Ilustración del enfoque de detección de ARN por C2c2 utilizando un indicador de ARN fluorescente inactivado. Tras la unión del ARN diana complementario, C2c2 cataliza la degradación del ARN indicador dando como resultado la acumulación de señal fluorescente. FIG. 13B, Cuantificación de la señal de fluorescencia después de 30 minutos para concentraciones variables de ARN diana por C2c2 en presencia de 100 ng de ARN total. La RNasa A se muestra como control positivo de degradación de ARN. Datos mostrados como media ± s.d. para n = 3 experimentos independientes. FIG. 13C, El procesamiento de pre-crRNA en tándem también permite la detección de ARN. Datos mostrados como media ± s.d. para n = 3 experimentos independientes. FIG. 13D, Modelo de la ruta CRISPR de Tipo VI que destaca las dos actividades de ribonucleasa de C2c2.
FIG. 21. Curso temporal de ensayo de detección de RNasa A de 2-ssRNA. Se incubó LbuC2c2:crRNA-A2 con sustrato de RNAasa-Alert (Thermo-Fisher) y 100 ng de ARN total de HeLa en presencia de cantidades crecientes de ssRNA A2 (0-1 nM) durante 120 minutos a 37 °C. Se tomaron medidas de fluorescencia cada 5 minutos. La reacción de ssRNA A21 nM alcanzó la saturación antes de que se pudiera medir el primer punto de tiempo. Las barras de error representan la desviación estándar de tres experimentos independientes.
Ejemplo 13
Materiales y métodos
Selección filogenética y de candidatos de MEC2c2. Las filogenias de máxima verosimilitud de C2c2 se calcularon utilizando RAxML con el modelo evolutivo PROTGAMMALG y 100 muestreos bootstrap. Las secuencias se alinearon por MAFFT con el método "einsi".
Producción y purificación de proteína C2c2. Se ensamblaron vectores de expresión para la purificación de proteínas utilizando gBlocks sintéticos pedidos a Integrated DNA Technologies. La secuencia genómica de C2c2 optimizada por codones se marcó en el extremo N con un sitio de escisión His6-MBP-TEV, dirigiéndose la expresión por un promotor T7. Las proteínas mutantes se clonaron a través de mutagénesis dirigida de construcciones de C2c2 de tipo silvestre. Los vectores de expresión se utilizaron para transformar células E. coli Rosetta2 cultivadas en caldo 2xYT a 37 °C. Las células E. coli se indujeron durante la fase logarítmica con ITPG 0,5 M, y la temperatura se redujo a 16 °C para la expresión durante la noche de His-MBP-C2c2. Posteriormente se recogieron las células, se resuspenden en tampón de lisis (Tris-HCl 50 mM pH 7,0, NaCl 500 M, glicerol al 5 %, TCEP 1 mM, PMSF 0,5 mM e inhibidor de proteasa sin EDTA (Roche)) y se lisaron mediante sonicación, y los lisados se aclararon mediante centrifugación. Se aisló His-MBP-C2c2 soluble mediante cromatografía de afinidad con iones metálicos, y el eluato que contenía proteína se incubó con proteasa del TEV a 4 °C durante la noche mientras se dializaba en tampón de intercambio iónico (Tris-HCl 50 mM, pH 7,0, KCl 250 mM, glicerol al 5 %, TCEP 1 mM) con el fin de escindir la etiqueta His6-MBP. La proteína escindida se cargó en una columna HiTrap SP y se eluyó con un gradiente lineal de KCl (0,25-1,5 M). Las fracciones de cromatografía de intercambio catiónico se combinaron y concentraron con concentradores de corte de 30 kD (Thermo Fisher). La proteína C2c2 se purificó adicionalmente mediante cromatografía de exclusión por tamaño en una columna S200 y se almacenó en tampón de filtración en gel (Tris-HCl 20 mM, pH 7,0, KCl 200 mM, glicerol al 5 %, TCEP 1 mM) para los ensayos enzimáticos posteriores. Los plásmidos de expresión se depositan con Addgene.
Generación de ARN. Todos los ARN utilizados en este estudio se transcribieron in vitro a excepción del crRNA AES461, del que se pidió la síntesis a (Integrated DNA Technologies) [véase la Fig. 33]. Las reacciones de transcripción in vitro se realizaron como se ha descrito anteriormente con las siguientes modificaciones: la concentración de polimerasa T7 se redujo a 10 pg/ml y la concentración de UTP se redujo a 2,5 mM. Las transcripciones se incubaron a 37 °C durante 1-2 h para reducir la adición de nucleótidos fuera del molde y se inactivaron mediante tratamiento con DNasa I a 37 °C durante 0,5-1 h. Las reacciones de transcripción se purificaron mediante electroforesis en gel de poliacrilamida desnaturalizante (PAGE) al 15 % y todos los ARN se resuspendieron en tampón de escisión (HEPES 20 mM, pH 6,8, KCl 50 mM, MgCh 5 mM y glicerol al 5 %). Para los experimentos radiactivos, se retiraron los trifosfatos 5' con fosfato intestinal de ternera (New England Biolabs) antes del radiomarcaje y los sustratos de ssRNA se marcaron en el extremo 5' usando polinucleótido quinasa T4 (New England Biolabs) y [y-32P]-ATP (Perkin Elmer) como se ha descrito anteriormente.
Ensayos de procesamiento de pre-crRNA. Los ensayos de escisión de pre-crRNA se realizaron a 37 °C en tampón de procesamiento de ARN (HEPES 20 mM, pH 6,8, KCl 50 mM, MgCh 5 mM, 10 pg/ml de BSA, 10 pg/ml de tRNA, Igepal CA-630 al 0,05 % y glicerol al 5 %) con un exceso molar de 100 veces de C2c2 en relación con el pre-crRNA marcado en posición 5' (concentraciones finales de 100 nM y <1 nM, respectivamente). A menos que se indique otra cosa, la reacción se inactivó después de 60 minutos con colorante de carga de ARN 1,5X (formamida al 100 %, azul de bromofenol al 0,025 % p/v y 200 pg ml-1 de heparina). Después de la inactivación, las reacciones se desnaturalizaron a 95 °C durante 5 min antes de resolverse con PAGE desnaturalizante al 12 % o al 15 % (tampón TBE 0,5X). La dependencia del metal de la reacción se ensayó mediante la adición de EDTA o EGTA al tampón de reacción a concentraciones que variaban de 10 a 100 mM. Las bandas se visualizaron mediante imágenes obtenidas con un phosphorimager y se cuantificaron con ImageQuant (GE Healthcare). El porcentaje de escisión se determinó como la relación entre la intensidad de la banda del producto y la intensidad total tanto del producto como de las bandas de pre-crRNA no escindidas y se normalizó con respecto al valor de referencia dentro de cada sustrato medido utilizando el software ImageQuant TL (GE Healthcare) y se ajustó a una asociación en fase exponencial utilizando Prism (GraphPad).
Mapeo del tamaño del producto e identificación del resto del extremo 3'. La longitud del producto de escisión se determinó bioquímicamente comparando la migración en gel de las bandas del producto con las escaleras de hidrólisis alcalina y digestión con RNasa T1 utilizando el kit RNasa T1 de Ambion. Para la escalera de hidrólisis, se incubaron sustratos de ARN de longitud completa 15 nM a 95 °C en tampón de hidrólisis alcalina IX (Ambion) durante 5 min. Las reacciones se inactivaron con tampón de carga de ARN 1,5X y se enfriaron a -20 °C para detener inmediatamente la hidrólisis. Para la escalera de RNasa T1, se desplegaron sustratos de ARN de longitud completa 15 nM en tampón de secuenciación de ARN IX (Ambion) a 65 °C. Las reacciones se enfriaron a temperatura ambiente y, posteriormente, se añadió 1 U de RNasa T1 (Ambion) a la reacción. Después de 15 min, las reacciones se detuvieron mediante extracción con fenol-cloroformo y se añadió tampón de carga de ARN 1,5X para el almacenamiento. Las bandas de hidrólisis se resolvieron en paralelo a las muestras de escisión en PAGE desnaturalizante al 15 % y se visualizaron mediante imágenes obtenidas con un phosphorimager. Para la identificación del resto del extremo 3', los productos de la reacción de procesamiento se incubaron con 10 U de polinucleótido quinasa T4 (New England Biolabs) durante 1 hora a 37 °C en tampón de procesamiento. Las reacciones se inactivaron con tampón de carga de ARN 1,5X, se resolvieron en PAGE desnaturalizante al 20 % y se visualizaron mediante obtención de imágenes en un phosphorimager.
Análisis de secuenciación de ARN pequeño. Se descargaron lecturas de ARN de Smakov et al. de las ejecuciones de SRA SRR3713697, SRR3713948 y s Rr 3713950. Las lecturas de extremos emparejados se asignaron localmente a las secuencias de referencia utilizando Bowtie2 con las siguientes opciones: "--reorder --very-fast-local --local". Después se filtró el mapeo para conservar solo los alineamientos que no contenían desacoplamientos usando mapped.py con las opciones "-m 0 -p both". Archivo BAM del mapeo resultante disponible. La cobertura de lectura se visualizó utilizando Geneious y se representó con Prism (GraphPad).
Ensayos de escisión de diana. Los ensayos de escisión de la diana se realizaron a 25 °C o 37 °C en tampón de escisión (HEPES 20 mM pH 6,8, KCl 50 mM, MgCh 5 mM y glicerol al 5 %). Las guías de crRNA se plegaron previamente calentándolas a 65 °C durante 5 min y después enfriándolas lentamente a temperatura ambiente en tampón de escisión. La formación del complejo C2c2:crRNA se realizó en tampón de escisión, generalmente en una relación molar entre proteína y crRNA de 2:1 a 37 °C durante 10 min, antes de añadir la diana marcada en el extremo 5' y/u otros sustratos diana de ARN no radiomarcados. A menos que se indique otra cosa, las concentraciones finales de proteína, guía y dianas fueron 100 nM, 50 nM y <1 nM respectivamente para todas las reacciones. Las reacciones se inactivaron con colorante de carga de ARN 1,5X y se resolvieron mediante PAGE desnaturalizante al 15 % (tampón TBE 0,5X). Las bandas se visualizaron mediante imágenes obtenidas con un phosphorimager y se cuantificaron con ImageQuant (GE Healthcare). El porcentaje de escisión se determinó como la proporción de la intensidad de formación de bandas total para todos los productos más cortos en relación con la banda no escindida y se normalizó para el nivel de referencia dentro de cada sustrato medido mediante el software ImageQuant TL (GE Healthcare) y se ajustó a una asociación exponencial de una fase mediante Prism (GraphPad).
Ensayos de unión a filtro de crRNA. Los ensayos de unión al filtro se llevaron a cabo en tampón de procesamiento de ARN (HEPES 20 mM, pH 6,8, KCl 50 mM, MgCh 5 mM, 10 pg/ml de BSA, 10 pg/ml de tRNA de levadura, Igepal CA-630 al 0,01 % y glicerol al 5 %). LbuC2c2 se incubó con crRNA radiomarcado (<0,1 nM) durante 1 hora a 37 °C. Tufryn, Protran e Hybond-N+ se ensamblaron en un aparato de transferencia puntual en el orden indicado anteriormente. Las membranas se lavaron dos veces con 50 pl de tampón de equilibrio (HEPES 20 mM pH 6,8, KCl 50 mM, MgCh 5 mM y glicerol al 5 %) antes de aplicar la muestra a las membranas. Las membranas se lavaron de nuevo con 50 pl de tampón de equilibrio, se secaron y se visualizaron mediante formación de imágenes con phosphorimager. Los datos se cuantificaron con el software ImageQuant TL (GE Healthcare) y se ajustaron a una isoterma de unión usando Prism (software GraphPad). Todos los experimentos se realizaron tres veces. Las constantes de disociación y los errores asociados se indican en las leyendas de las figuras.
Ensayos de cambio de movilidad electroforética. Para evitar la disociación del complejo LbuC2c2-dHEPN1/dHEPN2:crRNA a bajas concentraciones durante los experimentos de unión a ssRNA, las reacciones de unión contenían un exceso constante de LbuC22c2-dHEPN1/dHEPN2 (200 nM) y concentraciones crecientes de crRNA-A y una concentración <0,1 nM de ssRNA diana. Los ensayos se llevaron a cabo en tampón EMSA de C2c2 (HEPES 20 mM pH 6,8, KCl 50 mM, 10 pg/ml de BSA, 100 pg/ml de tRNA de levadura, Igepal CA-630 al 0,01 % y glicerol al 5 %). Los complejos LbuC2c2-crRNA-A se formaron previamente como se ha descrito anteriormente durante 10 min a 37 °C antes de añadir el sustrato de ssRNA radiomarcado en 5' y una incubación adicional durante 45 min a 37 °C. A continuación, las muestras se resolvieron mediante PAGE nativa al 8 % a 4 °C (tampón TBE 0,5X). Se obtuvieron imágenes de los geles mediante un phosphorimager, se cuantificaron con el software ImageQuant TL (GE Healthcare) y se ajustaron a una isoterma de unión usando Prism (software GraphPad). Todos los experimentos se realizaron tres veces. Las constantes de disociación y los errores asociados se indican en las leyendas de las figuras.
Ensayo de detección de ARN fluorescente. Se preensamblaron complejos LbuC2c2:crRNA mediante incubación de una concentración 1 pM de Lbu-C2c2:C2c2 con 500 nM de crRNA durante 10 min a 37 °C. Estos complejos después se diluyeron a LbuC2c2 100 nM:crRNA-A2 50 nM en tampón de procesamiento de ARN (HEPES 20 mM pH 6,8, KCl 50 mM, MgCl25 mM, 10 pg/ml de BSA, 10 pg/ml de tRNA de levadura, Igepal CA-630 al 0,01 % y glicerol al 5 %) en presencia de una concentración 185 nM de sustrato RNAasa-Alert (ThermoFisher), 100 ng de ARN total de HeLa y cantidades crecientes de ssRNA de 60 nt (0-1 nM). Estas reacciones se incubaron en un lector de placas de fluorescencia durante un máximo de 120 min a 37 °C, tomándose las mediciones de fluorescencia cada 5 min (Aex: 485 nm; Aem: 535 nm). Los valores de fluorescencia con corrección para el valor de referencia se obtuvieron restando los valores de fluorescencia obtenidos de las reacciones realizadas en ausencia del ssRNA diana. La fluorescencia máxima se midió incubando RNasaA 50 nM con una concentración 185 nM de sustrato de RNAasa-Alert. Para la medición de la activación de LbuC2c2 mediada por crRNA-ACTB por mRNA de beta-actina en ARN total humano, se preensamblaron complejos LbuCas9:crRNA incubando una concentración 1 pM de LbuC2c2 con una concentración 500 nM de crRNA-ACTB durante 10 min a 37 °C y las reacciones se llevaron a cabo en las condiciones anteriores en presencia de cantidades crecientes (0-1 pg) de ARN total de células HeLa o ARN total de E. Coli (como control negativo). Estas reacciones se incubaron en un lector de placas de fluorescencia durante un máximo de 180 min a 37 °C, tomándose las mediciones de fluorescencia cada 5 min (Aex: 485 nm; Aem: 535 nm). Los valores de fluorescencia con corrección para el valor de referencia se obtuvieron restando los valores de fluorescencia obtenidos de las reacciones realizadas en ausencia del ssRNA diana. Para los ensayos de procesamiento de pre-crRNA acoplado y de detección de ARN, se preensamblaron complejos LbuCas9-crRNA incubando 1 pM de LbuC2c2 con 500 nM de precrRNA-A-A2 durante 20 min a 37 °C y las reacciones se llevaron a cabo como se ha descrito anteriormente en presencia de cantidades crecientes de ssRNA A y ssRNA A 2 (0-1 nM cada uno). En todos los casos, las barras de error representan la desviación estándar de tres experimentos independientes.
Escisión de referencia en el ARN total. Los complejos LbuC2c2:crRNAA4 se ensamblaron como se ha descrito anteriormente para el ensayo de detección de ARN de fluorescencia. Los complejos se incubaron en tampón de procesamiento de ARN en presencia de 3 ug de ARN total con y sin ssRNA diana A410 nM. Después de 2 h, se aisló el ARN mediante extracción con trizol y precipitación con etanol. La distribución del tamaño de los fragmentos de ARN de las muestras resuspendidas se resolvió usando el kit de análisis de ARN pequeño (Agilent) en un Bioanalyzer 2100 (Agilent) usando el protocolo del fabricante. Las curvas de intensidad fluorescente se normalizaron en Prism para la superposición de curvas (Software GraphPad).
Resultados
Los locus de CRISPR de Tipo VI carecen de un tracrRNA o endonucleasa Cas6 o Cas5d evidente. Usando homólogos de proteína C2c2 recombinante purificada de tres grupos distintos de la familia de proteínas C2c2 (Fig. 24a-24b y Fig. 28 y Fig. 29), los datos presentados aquí muestran que las tres enzimas C2c2 escinden sustratos de pre-crRNA radiomarcado en el extremo 5' que consisten en una secuencia repetida consenso de longitud completa y una secuencia espaciadora de 20 nucleótidos (nt) (Fig. 24c). Se mapeó el sitio de escisión para cada par de homólogos pre-crRNA:C2c2, revelando que el procesamiento se produce en una posición de dos o cinco nucleótidos aguas arriba de la estructura de horquilla de secuencia repetida predicha, dependiendo del homólogo de C2c2 (Fig. 24c, Fig. 30A). Sorprendentemente, los sitios de escisión 5' mapeados bioquímicamente no coincidían con los sitios de escisión indicados anteriormente para pre-crRNA de Leptotrichia shahii(LshC2c2) o Listeria seeligeri(LseC2c2). Reanálisis de Shmakov et al. El conjunto de datos de secuenciación de ARN S indicó acuerdo del sitio de escisión in vivo con el sitio in vitro indicado aquí (Fig. 30b-i). Además, los ensayos de escisión usando C2c2 de Leptotricia buccalis (LbuC2c2) y un pre-crRNA más grande que comprendía una matriz de repetición de horquilla en tándem dieron como resultado dos productos resultantes de dos acontecimientos de escisión separados (Fig. 31a), lo cual es coherente con un papel para C2c2 en el procesamiento de transcritos de crRNA precursores generados a partir de locus de CRISPR de Tipo VI.
Para comprender los requisitos del sustrato y el mecanismo del procesamiento del ARN guía de C2c2, se generaron pre-crRNA que albergaban mutaciones en el tallo-bucle o en las regiones flanqueantes monocatenarias de la secuencia de repetición consenso y se probó su capacidad para procesarse por LbuC2c2 (Fig. 25). Los datos mostraron que la escisión catalizada por C2c2 se atenuaba al alterar la longitud del tallo en la región repetida (Fig. 25a). La inversión del tallo-bucle o la reducción de la longitud del bucle también redujo la actividad de procesamiento de C2c2, mientras que las mutaciones contiguas de 4 nt que incluyen o casi incluyen el enlace escindible la anularon por completo (Fig. 31b). Un análisis mutacional más amplio de la secuencia repetida completa de crRNA reveló dos regiones distintas a cada lado de la horquilla con notable sensibilidad a los cambios de base (Fig. 25b). Por el contrario, no hubo dependencia de la secuencia espaciadora para la cinética de procesamiento (Fig. 31c). Esta sensibilidad a ambas regiones flanqueantes de la horquilla recuerda la secuencia y los motivos estructurales requeridos por muchas enzimas Cas6 y Cas5d. Por el contrario, Cpfl no tiene ninguna dependencia de la región flanqueante de horquilla 3', ya que la región del espaciador variable limita con el tallo de la horquilla.
Los estudios del mecanismo de LbuC2c2 revelaron que la actividad de procesamiento no se veía afectada por la presencia de quelantes de iones metálicos divalentes EDTA o EGTA (Fig. 25c), lo que indica un mecanismo hidrolítico de ARN independiente de iones metálicos. La hidrólisis de ARN independiente de iones metálicos se caracteriza por la formación de un 2',3'-fosfato cíclico y un 5'-hidróxido en las mitades 5' y 3' de los productos de escisión de crRNA, respectivamente. Para determinar la identidad química del grupo terminal de sustratos procesados con C2c2, los productos flanqueantes 5' se incubaron adicionalmente con polinucleótido quinasa T4, que elimina los 2',3'-fosfatos cíclicos para dejar un 3'-hidroxilo. Se observó una migración alterada en el gel desnaturalizante del producto flanqueante 5' después del tratamiento con quinasa, coherente con la eliminación de un grupo fosfato 3' (Fig. 31d). La independencia de iones metálicos divalentes de la actividad de procesamiento pre-crRNA de C2c2 está en marcado contraste con la dependencia de iones metálicos divalentes de Cpfl, el único efector CRISPR de una sola proteína distinta que se ha demostrado que realiza el procesamiento de guías. De manera colectiva, estos datos indican que la escisión de pre-crRNA catalizada por C2c2 es un proceso independiente de iones metálicos divalentes que probablemente utiliza un mecanismo general de catálisis ácido-base.
Después de la maduración, los crRNA normalmente se unen con alta afinidad a la proteína o proteínas efectoras Cas para crear complejos de vigilancia guiados por ARN capaces de reconocer ácidos nucleicos de una manera específica de secuencia. De acuerdo con trabajos previos que utilizaron LshC2c2, LbuC2c2 catalizó la escisión eficaz del ARN diana solo cuando dichos sustratos podían formar pares de bases con una secuencia complementaria en el crRNA (Fig. 32-34). Dado el patrón promiscuo de escisión observado para C2c2 (Fig. 33), se ensayó la capacidad de LbuC2c2 para actuar como una endonucleasa de ARN no específica activada por crRNA en trans (Fig. 32b). En marcado contraste con los experimentos de escisión de sustratos no diana realizados en cis y de forma coherente con observaciones previas para LshC2c2, se observó una rápida degradación del ARN no diana en trans (Fig. 32b). Este resultado muestra que el reconocimiento de la diana activa a C2c2 para la degradación general no específica del ARN. Es importante indicar que las tasas de escisión de ARN similares y los productos de escisión casi idénticos observados tanto para la escisión en cis en la diana como para la escisión en trans no diana del mismo sustrato de ARN implica el mismo centro de nucleasa en las dos actividades (Fig. 32b).
De manera destacable, la escisión mediada por crRNA del ssRNA diana se produjo a una velocidad ~ 80 veces más rápida que el procesamiento del pre-crRNA (Fig. 26a) y, en contraste con el procesamiento del pre-crRNA, la escisión guiada por la diana de ARN se redujo severamente en presencia de EDTA, lo que indica que esta actividad depende de iones metálicos divalentes (Fig. 26a, (Fig. 32c, Fig. 34). Dadas estas claras diferencias, se argumentó que C2c2 podría poseer dos actividades de escisión de ARN ortogonales: una para la maduración de crRNA y la otra para la degradación de ARN no específica dirigida a crRNA. Para probar esta hipótesis, varios restos dentro de los motivos de HEPN conservados de LbuC2c2 se mutaron sistemáticamente, y se evaluó el procesamiento de pre-crRNA y la actividad de RNasa guiada por ARN de los mutantes (Fig. 26, Fig. 34d). Los mutantes dobles y cuádruples de restos de HEPN conservados (R472A, R477A, R1048A y R1053) conservaron una sólida actividad de escisión de pre-crRNA (Fig. 26c). Por el contrario, todas las mutaciones de HEPN anularon la actividad de escisión guiada por ARN sin afectar a la capacidad de unión de crRNA o ssRNA (FIG. 34d, 35).
A continuación, se buscaron mutaciones que anularan la actividad de procesamiento de pre-crRNA sin interrumpir la escisión del ARN diana. Dado que no se pudo predecir ningún otro motivo potencial de RNasa más allá de los motivos de HEPN, y que las proteínas C2c2 no tienen homología con Cpfl, se mutaron sistemáticamente los restos cargados a lo largo de LbuC2c2. Se identificó un resto de arginina (R1079A) que tras la mutación dio como resultado una actividad de procesamiento de pre-crRNA gravemente atenuada (Fig. 26c). Esta enzima mutante de C2c2 retuvo la capacidad de unión a crRNA, así como la actividad de escisión de la diana de ARN (Fig. 35d, Fig. 26d,). Tomados en conjunto, los resultados muestran que distintos sitios activos dentro de la proteína C2c2 catalizan el procesamiento del pre-crRNA y la escisión del ARN dirigida por ARN.
A continuación se ensayó si la robusta escisión estimulada por ARN de C2c2 de sustratos en trans se puede emplear como un medio para detectar ARN específicos dentro de un grupo de transcritos. Aunque se han desarrollado muchos métodos basados en polimerasa para la amplificación del ARN y su posterior detección, pocos enfoques pueden detectar directamente el ARN diana sin modificaciones de ingeniería genética significativas o restricciones de diseño estrictas para cada nueva diana de ARN. Como alternativa fácilmente programable, se ensayó si la actividad de endonucleasa en trans guiada por ARN de las proteínas C2c2 podría aprovecharse para escindir un sustrato de ARN indicador marcado con un inactivador de fluoróforo, con lo que se obtendría un aumento de la fluorescencia tras la activación de la RNasa desencadenada por el ARN diana (Fig. 27 a). LbuC2c2 se cargó con crRNA dirigidos al bacteriófago A y se ensayó su capacidad para detectar los ssRNA A diana correspondientes añadidos al ARN total de células HeLa. Tras la adición de tan solo 1-10 pM de ARN diana A complementario, se produjo un aumento sustancial específico de crRNA en la fluorescencia en 30 min (Fig. 27b y Fig. 36a). Los experimentos de control con el complejo C2c2:crRNA solo o en presencia de crRNA y un ARN diana no complementario dieron como resultado aumentos insignificantes en la fluorescencia con respecto a un control positivo de RNasa A (Fig. 27b y FIG 36a). Se observó que a la concentración de 10 pM de un ARN diana A, se predijo que solo ~0,02 % del complejo C2c2:crRNA está en estado activo, sin embargo, la señal fluorescente observada reflejó ~25-50 % de escisión del sustrato de ARN indicador, dependiendo del ARN diana. La resolución del tamaño del fragmento del ARN de referencia en estas reacciones reveló una degradación significativa, incluso en tRNA altamente estructurados (Fig. 36b). Dado que la escisión del ARN indicador se produjo en presencia de un gran exceso de ARN no marcado, se concluyó que LbuC2c2 es una enzima robusta de recambio múltiple capaz de al menos 104 rotaciones por ARN diana reconocido. Por lo tanto, a diferencia de las observaciones anteriores, la escisión en trans dirigida por crRNA es potente y detectable incluso a niveles extremadamente bajos de proteína activada.
Para ampliar este sistema de detección de ARN por LbuC2c2, se diseñó un crRNA para dirigirse al mRNA endógeno de beta-actina. Se observó un aumento medible de la fluorescencia en presencia de ARN total humano con respecto al ARN total de E. coli, demostrando la especificidad de este método (Fig. 27 c). Además, dado que C2c2 procesa su propia guía, el procesamiento de pre-crRNA y la detección de ARN se combinaron en una sola reacción mediante el diseño de espaciadores que contenían repeticiones de crRNA en tándem complementarios a los ARN diana A y A2. LbuC2c2 incubada con este ARN guía en tándem sin procesar en el ensayo de detección generó un aumento significativo en la fluorescencia similar en magnitud y sensibilidad a los experimentos que usan crRNA maduros (Fig. 27b, 27d). Tomados en conjunto, estos datos resaltan la emocionante oportunidad de aprovechar las dos actividades distintas de RNasa de C2c2 para una gama de aplicaciones biotecnológicas (Fig. 27e).
En bacterias, C2c2 probablemente opera como un centinela para los ARN virales. Sin quedar ligados a teoría alguna, se propone que cuando se detectan transcritos invasivos dentro de la célula hospedadora a través del emparejamiento de bases con crRNA, C2c2 se activa para la escisión promiscua del ARN en trans (Figura 27e). Como mecanismo de defensa, esto tiene una sorprendente similitud con los sistemas RNasa L y caspasa en eucariotas, mediante los cuales una señal celular desencadena una degradación ribonucleolítica o proteolítica promiscua dentro de la célula hospedadora, respectivamente, que conduce a la apoptosis. Aunque los mecanismos de direccionamiento del ARN de los sistemas CRISPR de Tipo III generalmente dan como resultado la escisión del ARN dentro del dúplex protoespaciador-guía, ejemplos recientes de nucleasas asociadas Csx1 y Csm6 proporcionan paralelismos convincentes entre los sistemas de Tipo VI y los complejos de inferencia de varios componentes de Tipo III.
Los datos descritos en el presente documento muestran que las proteínas CRISPR-C2c2 representan una nueva clase de enzima capaz de dos actividades separadas de reconocimiento y escisión de ARN. El procesamiento eficaz de precrRNA requiere secuencias y motivos estructurales dentro de la repetición CRISPR que previenen la carga de crRNA no endógeno y ayudan a reducir la toxicidad potencial de esta potente RNasa. Los mecanismos de procesamiento de pre-crRNA completamente diferentes de C2c2 y la proteína efectora CRISPR de Tipo V Cpfl indican que cada familia de proteínas ha convergido en actividades independientes que abarcan las funciones de procesamiento e interferencia de sus respectivas rutas CRISPR. Además, las dos capacidades catalíticas distintas de C2c2 se pueden aprovechar en conjunto para la detección de ARN, ya que la activación de C2c2 para escindir miles de trans-ARN por cada ARN diana detectado permite una potente amplificación de la señal. La capacidad de C2c2 para procesar sus propios ARN guía a partir de matrices permite el uso de promotores Pol II específicos de tejido para la expresión del guía, además de multiplexación de dianas para una amplia gama de aplicaciones. La enzima C2c2 es única dentro de la inmunidad adaptativa bacteriana por sus actividades duales de RNasa y destaca la utilidad de aprovechar las proteínas CRISPR para la manipulación precisa de ácidos nucleicos en células y sistemas sin células.
Ejemplo 14
Se identificaron posiciones de aminoácidos adicionales en LbuC2c2 que, cuando mutan, dan como resultado una actividad de procesamiento de pre-crRNA severamente atenuada (Fig. 37). Las posiciones de aminoácidos incluían R1079 (p. ej., R1079A), R1072 (p. ej., R1072A) y K1082 (p. ej., K1082A).
Ejemplo 15
Las enzimas Cas13a comprenden dos grupos funcionales distintos que reconocen conjuntos ortogonales de crRNA y poseen diferentes especificidades de escisión de ssRNA. El procesamiento de pre-crRNA de Cas13a no es esencial para la escisión de ssRNA, aunque mejora el direccionamiento de ssRNA para crRNA codificados internamente dentro de la matriz CRISPR. Se definieron dos subfamilias de proteínas Cas13a, las cuales pueden operar en paralelo para la detección y destrucción de ARN tanto en bacterias como para aplicaciones de diagnóstico.
MATERIALES Y MÉTODOS
Análisis filogenético y de conservación de repeticiones de Cas13a. Las filogenias de máxima verosimilitud de Cas13a se calcularon utilizando RAxML (Stamatakis, Bioinformatics. 1 de mayo de 2014; 30 (9): 1312-3) con el modelo evolutivo PROTGAMMALG y 100 bootstraps. Los clados de proteínas alfa y beta se definieron como puntos de ramificación con valores de bootstrap superiores a 90, lo que sugiere una alta confianza en tener un ancestro común. Las proteínas restantes se etiquetaron como ancestros ambiguos, ya que las relaciones filogenéticas entre ellos eran de confianza baja, lo cual se refleja en valores de bootstrap inferiores a 90. Las secuencias se alinearon por MAFFT con el método "einsi" (Katoh y Standley, Mol Biol Evol. abril de 2013; 30 (4): 772-80). Se seleccionaron candidatos para representar cada una de las principales ramificaciones del árbol de proteínas Cas13a. Se realizaron alineamientos para todos los homólogos no redundantes (FIG. 41) y proteínas candidatas. La comparación de las repeticiones de CRISPR-RNA (crRNA) se llevó a cabo calculando las puntuaciones de similitud por pares utilizando el algoritmo de Needleman-Wunsch a través de la herramienta Needle en EMBL-EBI (McWilliam et al., Nucleic Acids Res. julio de 2013; 41 (Web Server issue): W597-600). El agrupamiento jerárquico de crRNA CRISPR se realizó en R utilizando la matriz de puntuación de similitud.
Expresión y purificación de la proteína Cas13a. Se ensamblaron vectores de expresión para la purificación de proteínas utilizando gBlocks sintéticos pedidos a Integrated DNA Technologies (IDT). Las secuencias genómicas de Cas13a optimizadas por codones se marcaron en el extremo N con una secuencia de sitio de escisión His6-MBP-TEV, dirigiéndose la expresión por un promotor T7. Las proteínas mutantes se clonaron a través de mutagénesis dirigida de construcciones de Cas13a de tipo silvestre. La purificación de todos los homólogos se llevó a cabo como se describe en los Ejemplos 7 y 13, mostrada anteriormente. En resumen, se utilizaron vectores de expresión para transformar células Rosetta2 DE3 o E. coli BL21 cultivadas en caldo 2xYT a 37 °C, se indujo el crecimiento hasta la mitad de la fase logarítmica de las células con IPTG 0,5 mM y luego se transfirieron a 16 °C para la expresión durante la noche. Los sedimentos celulares se resuspendieron en tampón de lisis (Tris-Cl 50 mM, pH 7,0, NaCl 500 mM, glicerol al 5 %, TCEP 1 mM, PMSF 0,5 mM e inhibidor de proteasa sin EDTA (Roche)), se lisaron por sonicación y se clarificaron por centrifugación a 15.000 g. Se aisló Su6-MBP-TEV-Cas13a soluble mediante cromatografía de afinidad de iones metálicos y, para escindir la etiqueta His6-MBP, el eluato que contenía proteína se incubó con proteasa TEV a 4 °C durante la noche mientras se dializaba en tampón de intercambio iónico (Tris-Cl 50 mM, pH 7,0, KCl 250 mM, glicerol al 5 %, TCEP 1 mM). La proteína escindida se cargó en una columna HiTrap SP (GE Healthcare) y se eluyó con un gradiente lineal de KCl (0,25-1,5 M). Las fracciones que contenían Cas13a se agruparon, se concentraron y se purificaron adicionalmente mediante cromatografía de exclusión por tamaño en una columna S200 (GE Healthcare) en tampón de filtración en gel (Tris-Cl 20 mM, pH 7,0, KCl 200 mM, glicerol al 5 %, TCEP 1 mM) y posteriormente se almacenaron a -80 °C. Todos los homólogos se purificaron con este protocolo, excepto LwaCas13a, que se unió a una columna de heparina HiTrap en lugar de a una columna SP, y se omitió la etapa de cromatografía de exclusión por tamaño debido a la pureza suficiente de la muestra después del intercambio iónico. Todos los plásmidos de expresión se depositan con Addgene.
Transcripción de ARN in -v itro . Todos los pre-crRNA, los crRNA maduros y las dianas se transcribieron in vitro usando métodos descritos previamente (Sternberg et al., RNA. abril de 2012; 18 (4): 661-72) y como se describe en los ejemplos anteriores. En resumen, todos los sustratos se transcribieron a partir de un molde de oligonucleótido de ADN monocatenario (IDT), a excepción de los crRNA maduros que requirieron un extremo 5' que no fuera GR. Para estos crRNA maduros, se generaron moldes de polimerasa T7 que contenían una secuencia de ribozima cabeza de martillo inmediatamente aguas arriba de la secuencia de crRNA madura usando PCR solapante y posteriormente se purificaron para usarse como molde para la transcripción de T7 (véanse las secuencias en la FIG. 50 (Tabla 5)). El molde de transcripción in vitro para la matriz CRISPR de seis unidades Lbu se sintetizó por GeneArt (Thermofisher) como un plásmido. La región de la matriz CRISPR-promotor T7 se amplificó mediante PCR y se purificó antes de usarse como molde para la transcripción de T7. Todos los ARN transcritos se purificaron usando Urea-PAGE al 15 %, a excepción de la matriz que se purificó usando urea-PAGE al 6 %. Todos los ARN se trataron posteriormente con fosfatasa alcalina de ternera para eliminar los fosfatos 5'. El radiomarcaje se realizó como se ha descrito previamente (Sternberg et al., RNA. abril de 2012; 18 (4): 661-72) y como se describe en los ejemplos anteriores. Se sintetizaron mediante IDT homopolímeros A, C, G y U, e indicadores de ARN marcados con fluorescencia para la escisión de ssRNA en trans. Los homopolímeros se purificaron con urea-PAGE al 25 % después del radiomarcaje para reducir la heterogeneidad del sustrato.
Ensayos de nucleasa de ssRNA radiomarcado. Los ensayos de procesamiento de pre-crRNA se realizaron a 37 °C en tampón de procesamiento de ARN (HEPES 20 mM-Na pH 6,8, KCl 50 mM, MgCh 5 mM, 10 jg/m l de BSA, 10 |jg/ml de tRNA, Igepal CA-630 al 0,05 % y glicerol al 5 %) con un exceso molar de 100 veces de Cas13a en relación con el pre-crRNA marcado en posición 5' (concentraciones finales de 100 nM y <1 nM, respectivamente). A menos que se indique otra cosa, las reacciones se inactivaron después de 60 minutos con colorante de carga de ARN 1,5X (formamida al 100%, azul de bromofenol al 0,025 % y 200 jg ml-1 de heparina). Después de la inactivación, las reacciones se desnaturalizaron a 95 °C durante 5 min antes de resolverse con PAGE desnaturalizante al 15 % (tampón TBE 0,5x). Los ensayos de escisión de la diana se realizaron a 37 °C en tampón de escisión (HEPES-Na 20 mM, pH 6,8, KCl 50 mM, MgCh 5 mM y glicerol al 5 %). En general, la formación del complejo Cas13a:crRNA se realizó en tampón de escisión, en una relación molar entre proteína y crRNA de 2:1 a 37 °C durante 60 min, antes de añadir la diana marcada en el extremo 5' y/u otros sustratos diana de ARN no radiomarcados. A menos que se indique otra cosa, las concentraciones finales fueron Cas13a 100 nM, crRNA o pre-crRNA 50 nM, crRNA-ssRNA diana complementario 50 nM (denominado en lo sucesivo "activador") y diana trans-ssRNA <1 nM. Todas las bandas se visualizaron mediante un phosphorimager (Typhoon, GE Healthcare) y se cuantificaron con ImageQuant (GE Healthcare). Para el procesamiento de pre-crRNA, el porcentaje de escisión se determinó como la relación entre la intensidad de la banda del producto y la intensidad total tanto del producto como de las bandas de crRNA sin escindir y se normalizó para el valor de referencia dentro de cada sustrato medido. Para reacciones de escisión trans-ssRNA, el porcentaje de escisión se determinó como la proporción entre todos los fragmentos más pequeños que la diana y la intensidad total dentro de la calle y se normalizó para el valor de referencia dentro de cada sustrato. Estos datos se ajustaron posteriormente a una disminución exponencial simple utilizando Prism7 (GraphPad) y las tasas de escisión se presentan en las leyendas de las figuras.
Ensayos de nucleasa de ssRNA fluorescente. Se ensamblaron complejos Cas13a:crRNA en tampón de escisión, como se ha descrito anteriormente. Se añadió una concentración 150 nM de indicador de RNasa Alert (IDT) y varias concentraciones finales (0-1 jM ) de activador de ssRNA para iniciar la reacción. En particular, estas reacciones son en ausencia de tRNA competidor o ARN total, para medir con mayor precisión la actividad de escisión en trans. Estas reacciones se incubaron en un lector de placas de fluorescencia (Tecan Infinite Pro F2000) durante un máximo de 120 min a 37 °C, tomándose las mediciones de fluorescencia cada 5 min (Aex: 485 nm; Aem: 535 nm). Los valores de fluorescencia con corrección para el valor de referencia se obtuvieron restando los valores de fluorescencia obtenidos de las reacciones realizadas en ausencia del activador de ssRNA diana. Para determinar sensibilidades homólogas y efectos de procesamiento de matriz, los valores de referencia corregidos se ajustaron a una disminución exponencial simple usando Prism7 (GraphPad) y las tasas calculadas se representaron con sus desviaciones estándar asociadas de n = 3. Para comparar la escisión de trans-ssRNA dirigida por crRNA no afín, en cambio, se calcularon las tasas de reacción iniciales debido a las discrepancias en los valores de meseta de fluorescencia en todo el conjunto de datos. Posteriormente se aumentaron a escala las tasas con respecto al crRNA afín para normalizar las tasas entre los homólogos. Véase la FIG. 52, la FIG. 53 y la FIG. 54, que presentan las Tablas 7, 8 y 9, respectivamente, para valores normalizados. Para estudios de indicador de ssRNA de homopolímero fluorescente, se preincubaron complejos Cas13a:crRNA a 37 °C durante 60 minutos en condiciones estándar. Se añadieron ssRNA activador e indicador de ssRNA fluorescente a una concentración 200 nM para iniciar la reacción inmediatamente antes de poner la reacción en el lector de placas. Para muestras que contienen Lbu- y Lba-Cas13a con indicadores de ssRNA de homopolímero fluorescente, se utilizó activador 10 pM y 1 nM, respectivamente. Para experimentos de matriz de pre-crRNA, primero se incubó Cas13a 300 nM con una matriz de pre-crRNA 50 nM durante 1 h en tampón de escisión para permitir la unión y el procesamiento de la matriz. Se añadieron 100 pM de cada activador de ssRNA junto con 150 nM de indicador RNasa Alert (IDT) para iniciar la reacción, en tres réplicas biológicas para cada secuencia espadadora. Las tasas aparentes se calcularon usando una disminución exponencial simple usando Prism7 (GraphPad) y las tasas calculadas se representan con sus desviaciones estándar asociadas.
Ensayos de unión a filtro de crRNA. Los ensayos de unión a filtro se llevaron a cabo como se describe en los Ejemplos anteriores. En resumen, se incubaron Cas13a y crRNA radiomarcado durante 1 hora a 37 °C en tampón de procesamiento de ARN (HEPES-Na 20 mM, pH 6,8, KCl 50 mM, MgCh 5 mM, 10 pg/ml de BSA, 10 pg/ml de tRNA de levadura, Igepal CA-630 al 0,01 % y glicerol al 5 %). Tufryn, Protran e Hybond-N+ se ensamblaron en un aparato de transferencia puntual en el orden indicado anteriormente. Las membranas se lavaron dos veces con 50 pl de tampón de equilibrio (HEPES-Na 20 mM, pH 6,8, KCl 50 mM, MgCh 5 mM y glicerol al 5 %) antes de aplicar la muestra a las membranas. Las membranas se lavaron de nuevo con 50 pl de tampón de equilibrio, se secaron y se visualizaron mediante formación de imágenes con phosphorimager. Los datos se cuantificaron con el software ImageQuant TL (GE Healthcare) y se ajustaron a una isoterma de unión usando Prism (software GraphPad). Todos los experimentos se realizaron tres veces. Las constantes de disociación y los errores asociados se indican en las leyendas de las figuras.
RESULTADOS
La mayoría de los homólogos de Cas13a poseen actividad de procesamiento de pre-crRNA
Para explorar la diversidad funcional de las proteínas Cas13a, se compararon las actividades de procesamiento de pre-crRNA de diez homólogos de todo el árbol genealógico de proteínas en cuanto a su capacidad para producir crRNA maduros a partir de pre-crRNA afines (FIG. 38A; FIG. 39). De forma similar a los tres homólogos analizados anteriormente, siete enzimas Cas13a adicionales poseen actividad de maduración de crRNA (FIG 38B y 38C). Solo una de las once proteínas Cas13a analizadas hasta la fecha no mostró escisión detectable de su pre-crRNA afín en una amplia gama de condiciones de ensayo (HheCas13a) (FIG. 38; FIG. 39A). De los homólogos que procesaron sus crRNA nativos, todos menos LshCas13a escindieron en el enlace fosfodiéster cuatro nucleótidos aguas arriba de la horquilla de repetición de crRNA conservada (FIG. 38B y 38C). Estos resultados muestran una fuerte conservación de la actividad de biogénesis de crRNA mediada por Cas13a dentro de los sistemas CRISPR de Tipo VI-A.
Un centro de maduración de crRNA conservado dentro de la mayoría de las enzimas Cas13a
Ciertos estudios previos han involucrado a dos regiones distintas de Cas13a como responsables del procesamiento de pre-crRNA. La arquitectura general de la proteína Cas13a establecida por la estructura cristalina de LshCas13a consiste en un dominio N-terminal y dos dominios HEPN (unión de nucleótidos de eucariotas superiores y procariotas) separados por dos dominios helicoidales (FIG. 40A) (Liu et al., Cell, 12 de enero de 2017; 168(1-2): 121-134.e12). Para LbuCas13a, la mutación de un solo resto (R1079) dentro del dominio HEPN2 fue suficiente para reducir sustancialmente la actividad de procesamiento de pre-crRNA. Por el contrario, las mutaciones en dos posiciones situadas en el dominio helicoidal 1, R438 y K441, demostraron disminuir la escisión de pre-crRNA por LshCas13a (Liu et al., Cell, 12 de enero de 2017; 168(1-2): 121-134.e12). Aunque ambas regiones pueden estar involucradas en el procesamiento del pre-crRNA, no está claro si el procesamiento por LbuCas13a se inhibe por mutaciones del dominio helicoidal 1, y qué dominio es el principal responsable de la maduración de crRNA en la familia de proteínas Cas13a.
Se examinó la conservación de los dominios helicoidal 1 y HEPN2 en 19 homólogos de Cas13a. Los alineamientos indicados previamente (Liu et al., Cell; 12 de enero de 2017; 168 (1-2):121-134.e12; Shmakov et al., Mol Cell. 5 de noviembre de 2015; 60 (3): 385-97) se contradicen en la región del dominio helicoidal 1, lo que sugiere una alta ambigüedad en la relación entre homólogos en este dominio. Se observó una conservación mínima dentro del alineamiento del dominio helicoidal 1 implicado en el procesamiento de pre-crRNA; por el contrario, dentro del dominio HEPN2 está presente una conservación consistente (FIG. 40B-40C; FIG. 41). El único homólogo defectuoso en el procesamiento de pre-ARNc, HheCas13a, mantiene la mayoría de los restos cargados conservados en ambos dominios, lo que sugiere que otras partes de la proteína o la secuencia repetida pueden estar impidiendo la escisión del pre-crRNA. Entre los homólogos utilizados en este estudio, LshCas13a es el más divergente en el dominio HEPN2, lo que podría explicar el dominio catalítico alternativo y la selección del sitio de escisión atípica por parte de este homólogo.
Se ensayó el efecto de los restos del dominio helicoidal 1 críticos para el procesamiento de pre-crRNA por LshCas13a sobre la actividad de procesamiento de pre-crRNA de LbuCas13a. Se ensayaron cuatro restos (E299, K310, R311 y N314) con respecto a su papel en la escisión de pre-crRNA (FIG. 40B y 40C) (Liu et al., Cell; 12 de enero de 2017; 168 (1-2):121-134.e12; Shmakov et al., Mol Cell. 5 de noviembre de 2015; 60(3):385-97). La mutación de estos restos a alanina reveló varios impactos en las eficacias de procesamiento de pre-crRNA: N314A reducía significativamente la tasa de escisión, R311A perjudicaba mínimamente a la actividad y E299A y K310 no tuvieron efecto sobre el procesamiento de pre-crRNA (FIG. 40D). En paralelo, se realizó mutagénesis dentro del dominio HEPN2 de LbuCas 13a. Las sustituciones de alanina en R1072 y K1082 redujeron significativamente la escisión de pre-crRNA, mientras que otras mutaciones en la misma región (D1078A, K1080A y K1087A) tuvieron impactos mínimos sobre el procesamiento de pre-crRNA (FIG. 40E). Estos resultados sugieren que HEPN2 y, en menor medida, los dominios helicoidales 1, desempeñan papeles importantes en la biogénesis de crRNA para LbuCas13a, aunque los restos directamente responsables para catalizar la hidrólisis siguen siendo desconocidos. La diferencia entre las regiones implicadas en el procesamiento de pre-crRNA en LbuCas13a y LshCas13a (Liu et al., Cell, 12 de enero de 2017; 168(1-2):121-134.e12) no necesariamente se contradicen entre sí, ya que el extremo 5' del crRNA se mantiene entre los dominios HEPN2 y helicoidal 1 en la estructura de LshCas13a (Liu et al., Cell, 12 de enero de 2017; 168(1-2): 121-134.e12). Los restos de ambos dominios podrían desempeñar papeles fundamentales en el procesamiento de precrRNA al estabilizar la unión al sustrato, promover la orientación adecuada del sustrato y/o catalizar la hidrólisis.
La ausencia de conservación dentro del dominio HEPN2 de LshCas 13a, su supuesto sitio activo de procesamiento de pre-crRNA, y el sitio de escisión atípico de pre-crRNA de esta enzima llevó a los presentes solicitantes a plantear la hipótesis de que LshCas13a puede utilizar una región diferente dentro del dominio helicoidal 1 para catalizar el procesamiento de pre-crRNA. En ausencia de una estructura tridimensional de un homólogo de Cas13a unido a precrRNA, esta hipótesis se probó mapeando los sitios de escisión de LshCas13a en pre-crRNA no afines (FIG. 40F). LshCas13a fue capaz de procesar pre-crRNA de LwaCas13a y LbuCas13a, generando un sitio de escisión desplazado a un nucleótido de la base de horquilla predicha. En concordancia con esta observación, el procesamiento del Lsh pre-crRNA por LwaCas13a y LbuCas13a se produce en el intervalo estándar de cuatro nucleótidos desde el tallo de repetición, lo cual difiere del sitio afín de LshCas13a. Esto respalda las observaciones de que el sitio de procesamiento de LshCas13a característico depende de la arquitectura de la proteína, no de la secuencia de pre-crRNA, y que LshCas13a es atípica dentro del árbol de Cas13a con respecto al procesamiento de pre-crRNA.
Las enzimas Cas13a inician la escisión de ssRNA en uridinas o adenosinas
Los estudios previos establecieron que los complejos Cas13a:crRNA reconocen y se unen a dianas de ssRNA complementarias, denominados activadores de ssRNA, para desencadenar la actividad general de la RNasa en restos de uridina expuestos (FIG. 42A). Se ensayó si el panel de homólogos retenía la actividad de degradación no específica demostrada por LbuCas13a y LshCas13a. También se ensayó si la preferencia por uridina dentro del sitio activo de HEPN es universal dentro de la familia. Para ensayar sistemáticamente la actividad general de la RNasa, se supervisó la capacidad de un complejo ternario que comprende Cas13a:crRNA con un activador de ssRNA unido para degradar una diana trans-ssRNA (FIG. 42A). Se detectó actividad de escisión de trans-ssRNA para ocho de los diez homólogos en el transcurso de una hora (FIG. 42B; FIG. 43A). El más notable de los homólogos de Cas13a activos para la escisión de trans-ssRNA es HheCas13a, que no posee actividad de procesamiento de pre-crRNA detectable, aunque catalizó la degradación completa de sustratos guiada por su pre-crRNA de longitud completa afín. Mientras que los homólogos previamente caracterizados LshCas13a (Abudayyeh et al., Science. 5 de agosto de 2016; 353 (6299): aaf5573) y LbuCas13a presentan una preferencia por la uridina 5' en el enlace escindible, los productos de diferentes longitudes generados por los otros homólogos sugieren que pueden existir diferentes preferencias de nucleótidos en el sitio activo dentro de esta familia de proteínas (FIG. 43B).
Para explorar más las preferencias por nucleótidos para la escisión de trans-ssRNA de los homólogos de Cas13a, se midió la capacidad de escisión en trans de estas enzimas utilizando homopolímeros de 5 unidades de A, C, G y U como sustratos. Seis homólogos pudieron escindir estos sustratos cortos (FIG. 42C; FIG. 43C; FIG. 50 (Tabla 5)). Cuatro de los homólogos, LbuCas13a, LwaCas13a, HheCas13a y PprCas13a, presentaron una escisión preferida del sustrato de homo-uridina, aunque se observaron preferencias secundarias por los homólogos con las actividades más altas (FIG. 42C; FIG. 43D). Por el contrario, LbaCas13a y EreCas13a preferían la homoadenosina, de acuerdo con los sitios de escisión mapeados bioquímicamente en dianas más largas (FIG. 43B). La generación de productos idénticos a partir de estos sustratos largos por parte de CamCas13a es coherente con la preferencia de adenosina por parte de este clado del árbol genealógico de Cas13a (FIG. 42, FIG. 39; FIG. 43).
Una diferencia notable entre estas enzimas era la velocidad a la que la escisión de trans-ssRNA alcanza la saturación en las condiciones ensayadas del activador de ssRNA equimolar y el complejo de interferencia Cas13a:crRNA. Estas diferencias enzimáticas podrían tener efectos drásticos en el papel biológico de Cas13a. Se cuantificó la varianza en la escisión de trans-ssRNA dentro de la familia de homólogos Cas13a. Se desarrolló un examen de alto rendimiento que utiliza un indicador de ssRNA fluorescente corto para la escisión del ARN para tener en cuenta tanto la unión del activador de ssRNA como la escisión de trans-ssRNA, las dos propiedades centrales de las enzimas Cas13a que contribuyen a la producción enzimática total. Para averiguar la sensibilidad de cada homólogo de Cas13a, se añadieron cantidades decrecientes de activador de ssRNA complementario para iniciar la reacción, y se calculó la tasa aparente de escisión del indicador de ssRNA fluorescente a partir de cada uno de los cursos temporales resultantes. Aunque las tasas calculadas son una convolución de la afinidad de unión del activador de ssRNA y la tasa de recambio catalítico para cada una de las enzimas, dan una medida relativa de la actividad de escisión que es comparable entre homólogos.
Cinco homólogos (LbuCas13a, LwaCas13a, LbaCas13a, HheCas13a y PprCas13a) demostraron una actividad de escisión suficientemente detectable dentro de este ensayo para un análisis reproducible. De estos cinco homólogos, LbuCas13a presentó la mayor sensibilidad, con escisión del indicador detectable en presencia de solo 10 fM de activador complementario (FIG. 42D). Solo dos homólogos, LwaCas13a y PprCas13a, mostraron suficiente actividad para detectar el activador en el intervalo picomolar con sensibilidades de 10 pM y 100 pM, respectivamente. LbaCas13a y HheCas13a fueron mucho menos sensibles, volviéndose activo únicamente a niveles nanomolares de indicador, lo que está cerca de la equimolaridad en relación con el complejo Cas13a. Dado que este ensayo se basa en un número sustancial de acontecimientos en trans de escisión para producir fluorescencia detectable, se puede suponer que los tres homólogos incapaces de producir una señal detectable por encima del valor de referencia a pesar de las preferencias similares del sitio de escisión (EreCas13a, CamCas13a y LshCas13a) poseen sensibilidades a la diana complementaria aún menos sensibles. El intervalo notablemente amplio de sensibilidades (~107 veces) sugiere una capacidad diversa de las enzimas Cas13a para proteger a un organismo hospedador del ARN extraño.
La secuencia repetida CRISPR determina el procesamiento de pre-crRNA no afín
Las actividades duales de Cas13a brindan la oportunidad de estudiar la interdependencia del procesamiento de precrRNA y el direccionamiento entre distintos operones de CRISPR de Tipo VI-A. Para determinar los requisitos de sustrato para ambas actividades, se ensayó la medida en la que diferentes homólogos pueden reconocer crRNA no afines para el procesamiento y el establecimiento de la guía como diana. Inicialmente, se intentó predecir por medio de la bioinformática la probable capacidad de intercambio de crRNA a través del análisis filogenético de la familia Cas13a y las similitudes de crRNA. Este análisis sugirió que existen dos clados distintos de homólogos, denominados alfa y beta para mayor claridad (Stamatakis, Bioinformatics. 1 de mayo de 2014; 30 (9): 1312-3) (FIG. 44A). Cinco de los homólogos purificados existen fuera de estos clados con relaciones ancestrales ambiguas; se cuestionó si la secuencia de pre-crRNA (repetición CRISPR) podría dictar la ortogonalidad funcional. Debido al contenido corto y estructurado de las repeticiones CRISPR, se usó una matriz de puntuación de alineamiento de secuencias por pares para construir una relación de agrupamientos jerárquicos entre las repeticiones CRISPR para puntuar la variación en la familia (Burstein et al., Nat Commun. 3 de febrero de 2016; 7:10613). Sorprendentemente, este análisis apuntó a la existencia de dos grupos de crRNA, solapantes pero distintos de los clados de proteínas determinados por las secuencias de aminoácidos (FIG. 44B y 44C). Mientras que los crRNA del grupo 1 se correlacionan bien con un subconjunto de las proteínas del clado alfa y todos los crRNA asociados al clado beta están dentro del grupo 2, los homólogos con relaciones filogenéticas ambiguas se dividen entre los dos grupos (FIG. 44C).
Debido a la incapacidad de predecir fácilmente la ortogonalidad de Cas13a:crRNA usando solo análisis bioinformáticos, se ensayó el grado de intercambiabilidad funcional entre crRNA no afines para el procesamiento y la escisión de la diana de trans-ssRNA por cada uno de los homólogos de Cas13a (FIG. 44D y 44F). Para el procesamiento de pre-crRNA, se encontró que los grupos de crRNA definidos por las comparaciones de secuencias por pares predijeron su capacidad para ser procesados por sus proteínas Cas13a asociadas (FIG. 44D). Por ejemplo, los pre-crRNA del grupo 1 solo se procesan por las proteínas del clado alfa y viceversa para el grupo 2 y el clado beta. Por el contrario, la clasificación de proteínas es menos predictiva, ya que la mayoría de las proteínas clasificadas de forma ambigua podrían procesar secuencias del grupo de repetición 2, independientemente de dónde se agruparon sus secuencias repetidas.
Tres homólogos (PprCas13a, HheCas13a y Rca13a) eran atípicos en el procesamiento de pre-crRNA con respecto a su posición dentro de los grupos de crRNA. HheCas13a no pudo escindir ningún pre-crRNA no afín y, a la inversa, ningún homologo, incluido HheCas13a, procesó el Hhe pre-crRNA. Esto sugiere que la incapacidad de HheCas 13a para procesar su pre-crRNA afín refleja no solo la secuencia de repetición divergente (FIG. 38; FIG. 39), sino también la pérdida de actividad de procesamiento de pre-crRNA dentro de la proteína. Por el contrario, la desviación de la actividad de PprCas13a y RcaCas13a se explica por la divergencia de la secuencia repetida de crRNA. PprCas13a y RcaCas13a procesan sus propios crRNA, sin embargo, ambos también procesan las secuencias no afines del grupo de repetición 2 de crRNA. La secuencia repetida de crRNA de PprCas13a difiere de las otras repeticiones de crRNA del grupo 2 en el sitio de escisión de la región flanqueante 5', lo que sugiere una mayor flexibilidad de sustrato para el procesamiento de pre-crRNA por PprCas13a. De forma análoga, una característica de secuencia distintiva del crRNA de RcaCas13a es un tallo-bucle de seis pares de bases extendido en relación con el tallo-bucle de cinco pares de bases estándar presente en los crRNA del resto de la familia. Vale la pena señalar que la tolerancia de sustitución posicional dentro de cada repetición de crRNA para el procesamiento de pre-crRNA de Cas13a es coherente con los estudios de mutación del complejo LbuCas13a:crRNA, analizado anteriormente, y las perspectivas estructurales recientes obtenidas del complejo LshCas13a:crRNA (Liu et al., Cell, 12 de enero de 2017; 168(1-2): 121-134.e 12). En general, estos resultados sugieren que la secuencia de una repetición CRISPR de Tipo VI-A dicta su capacidad para el procesamiento de pre-crRNA por parte de la familia Cas13a. Sin embargo, los homólogos que evolucionaron en presencia de repeticiones divergentes (PprCas13a y RcaCas13a) conservan la capacidad de procesar otras secuencias del grupo 2.
Dos subfamilias de enzimas Cas13a funcionalmente ortogonales
Se investigó si los grupos de intercambiabilidad de procesamiento de pre-crRNA definidos en la FIG. 44D eran competentes para dirigir la escisión de trans-ssRNA por homólogos de Cas13a no afines. Para estudiar la escisión mediada por Cas13a de trans-ssRNA dirigida por pre-crRNA no afines y crRNA maduros, se modificó el ensayo de fluorescencia descrito en los ejemplos anteriores, y el análisis se limitó a los cinco homólogos que mostraban una actividad de escisión significativa en los experimentos de escisión de ssRNA (véase la FIG. 42C). En términos generales, estos resultados reflejaron los resultados del procesamiento de pre-crRNA, determinando la identidad del grupo de repetición de crRNA los grupos funcionales, pero con algunos contrastes llamativos compatibles con que el procesamiento y el direccionamiento sean actividades enzimáticas independientes (FIG. 44E y 44F). Por ejemplo, el pre-crRNA y el crRNA maduro de Ppr puede dirigir la escisión del ssRNA por proteínas no afines LwaCas13a y LbuCas13a, a pesar de su incapacidad para procesar estos pre-crRNA. Otra sorpresa es la promiscuidad de HheCas13a, que se dirige por todos los pre-crRNA y crRNA maduros del grupo 2 para la escisión de trans-ssRNA, a pesar de carecer de actividad de procesamiento de pre-crRNA con cualquiera de estas guías. Esto sugiere que la maduración de crRNA no es necesaria para la escisión de trans-ssRNA, una observación de acuerdo con los hallazgos de que los mutantes deficientes en el procesamiento de pre-crRNA por LbuCas 13a poseen capacidad de escisión de trans-ssRNA.
La comparación de la intercambiabilidad de crRNA tanto para el procesamiento de pre-crRNA como para la escisión de trans-ssRNA define dos subfamilias funcionalmente ortogonales dentro de la familia de proteínas Cas13a. El primer grupo (p. ej., LbuCas13a) tiene una amplia promiscuidad tanto para el procesamiento de pre-crRNA como para la escisión de trans-ssRNA dirigida por crRNA de toda la familia de proteínas. Este grupo polifilético también muestra preferencia por uridina dentro del sitio activo de escisión de trans-ssRNA. El segundo grupo (por ejemplo, LbaCas13a), definido tanto por crRNA como por secuencias de proteínas, tiene un perfil de intercambiabilidad de crRNA característico y se escinde preferentemente en adenosinas durante la escisión de la diana de trans-ssRNA. Para ensayar las reactividades ortogonales de estas subfamilias de Cas13a, se verificó que LbuCas13a y LbaCas13a escindían los indicadores de ssRNA homo-A u homo-U, respectivamente (FIG. 45A y 45B). Aunque las diferentes sondas generaban cantidades similares de señal fluorescente, cabe señalar que se añadieron cantidades sustancialmente diferentes de activador de ssRNA debido a las sensibilidades diferenciales de los homólogos (10 pM frente a 1 nM para LbuCas13a y LbaCas13a, respectivamente). Para verificar la ortogonalidad, se ensayó un panel de reacciones de control con todas las posibles combinaciones no afines entre crRNA, activador e indicador, sin que se detectara una señal sustancial excepto para las combinaciones afines (FIG. 45C). Tomados en conjunto, estos resultados definen distintos homólogos de Cas13a que pueden funcionar en paralelo dentro del mismo sistema.
El procesamiento de pre-crRNA mejora la eficacia de direccionamiento en el contexto de una matriz CRISPR
Un hallazgo desconcertante de este estudio es la ausencia de un requisito estricto para que el crRNA maduro desencadene la subsiguiente reacción de escisión de la diana de trans-ssRNA por Cas13a. Además, los mutantes deficientes en el procesamiento de LbuCas 13a mantienen eficacias similares de escisión de trans-ssRNA, incluso cuando está dirigido por un pre-crRNA en lugar de un crRNA maduro (FIG. 46; FIG. 47). Esto condujo a la hipótesis de que el papel del procesamiento de pre-crRNA dentro de los locus de CRISPR de Tipo VI no es necesariamente para el establecimiento eficaz como diana de ssRNA, sino que sirve para liberar cada crRNA de los confines de un transcrito de matriz CRISPR largo. Se cuestionó si el procesamiento de pre-crRNA podría aliviar las restricciones de plegamiento del ARN y el posible impedimento estérico de las especies espaciadoras de Cas13a:crRNA vecinas durante la carga del crRNA y/o el direccionamiento a ssRNA. Para analizar esto, se comparó la eficacia de escisión de trans-ssRNA dirigida por una matriz CRISPR, utilizando LbuCas13a de tipo silvestre o un mutante inactivo de procesamiento de pre-crRNA.
Dado que todos los mutantes puntuales individuales defectuosos en el procesamiento de LbuCas13a (FIG. 40) conservaban niveles bajos de actividad de procesamiento de pre-crRNA, se creó un mutante doble (R1079A/K1080A) que no poseía actividad de procesamiento detectable, pero conservaba eficacias de procesamiento de trans-ssRNA similares o mayores que las de LbuCas 13a de tipo silvestre (FIG. 46A y 46B). Este doble mutante y la enzima LbuCas 13a de tipo silvestre se ensayaron con respecto a la escisión de ssRNA en presencia de un ARN diana y un pequeño transcrito de matriz CRISPR consistente en seis unidades de repetición-espaciador distintas (FIG. 46C y 46D). La tasa de escisión de trans-ssRNA por el mutante inactivo de procesamiento de crRNA se redujo significativamente para todas las secuencias espaciadoras dentro de la matriz (prueba t unilateral: p<0,001 para todos los pares). La actividad reducida en comparación con LbuCas13a de tipo silvestre es más pronunciada con cada espaciador sucesivo dentro de la matriz, dirigiendo el último espaciador la escisión con una tasa que es solo el 15 % de la catalizada por la enzima de tipo silvestre. Este hallazgo sugiere que, si bien el procesamiento de pre-crRNA no es necesario para el direccionamiento, mejora la actividad mediante la liberación de crRNA de la matriz CRISPR, dando lugar a un modelo revisado para los sistemas CRISPR de Tipo VI (FIG. 55).
FIG. 38A-38C. El procesamiento de pre-crRNA se conserva ampliamente dentro de la familia de proteínas Cas13a. (A) Esquema de la ruta de biogénesis de crRNA catalizada por Cas13a. Los transcritos de pre-crRNA se escinden por Cas13a para generar crRNA maduros. A continuación se proporciona un esquema de un pre-crRNA que destaca características funcionales importantes. (B) Alineamiento de la porción 5' de las secuencias repetidas de CRISPR de los sistemas CRISPR de tipo VI estudiados que resaltan el sitio de escisión del pre-crRNA. Los sitios de escisión de corte mapeados se muestran como barras rojas. Las desviaciones de la secuencia de repetición de crRNA de Lbu se indican en texto negro. Se requerían g minúsculas para fines de transcripción y no son parte de las secuencias repetidas del crRNA nativo. La secuencia de repetición CRISPR completa se representa en un diagrama en la FIG.
39B. (C) Gel representativo de la escisión de pre-crRNA mediada por Cas13a por 9 homólogos de Cas13a después de 60 min de incubación con sustratos de pre-crRNA radiomarcados en 5'.
FIG. 39A-39C. Locus de CRISPR y arquitectura de repetición de crRNA para los homólogos de Cas13a utilizados en este estudio (A) Árbol filogenético de máxima verosimilitud de proteínas Cas13a con diagramas de locus de Tipo VI-A adaptados de (Shmakov et al., Mol Cell. 5 de noviembre de 2015; 60(3):385-97). Los ORF de Cas13a se muestran en verde azulado. Las matrices CRISPR se representan como recuadros negros (repeticiones), rombos amarillos (espaciadores) y el tamaño de la matriz de espaciadores para matrices más grandes son como se ha indicado anteriormente. Los ORF de interés que rodean los locus se indican con las siguientes abreviaturas: T-Toxina, AT-antitoxina y TP-transposasa. (B) Alineamiento manual de secuencias repetidas CRISPR de homólogos utilizados. Los sitios de escisión de procesamiento de pre-crRNA se señalan por líneas rojas. Las desviaciones de la secuencia de repetición de crRNA de Lbu se indican en texto negro. Se requerían g minúsculas para fines de transcripción y no son parte de las secuencias repetidas del crRNA nativo. Se ensayaron dos secuencias separadas de crRNA de Hhe, conteniendo la primera la secuencia nativa y conteniendo la segunda una extensión de cuatro nucleótidos para extender la repetición nativa atípicamente corta. Ninguna repetición de crRNA se escindió por HheCas 13a en ninguna de las condiciones estudiadas. (C) ensayo de procesamiento de pre-crRNA con HheCas13a en la secuencia de repetición nativa de crRNA en condiciones variables de sal y pH. No se observaron productos de escisión.
FIG. 40A-40F. Identificación de restos importantes para la escisión de pre-crRNA por LbuCas13a (A) Esquema de organización de dominios de LbuCas13a, con dominios anotados basados en una estructura cristalina de LshCas13a (Liu et al., Cell, 12 de enero de 2017; 168(1-2): 121-134.e12). Alineamiento de secuencias múltiples de aminoácidos de (B) la región local en el dominio helicoidal 1 de Cas13a implicado en el procesamiento de pre-crRNA por estudios en LshCas13a, y (C) la región dentro del dominio HEPN2 de Cas13a implicada en el procesamiento de pre-crRNA por estudios en LbuCas13a. Véase en la FIG. 41 el alineamiento completo del árbol genealógico de estas regiones y en la FIG. 57 un alineamiento completo de proteínas. Los restos cuya mutación afecta severamente al procesamiento de pre-crRNA están marcados con rombos amarillos, y los restos cuya mutación afecta mínimamente al procesamiento de pre-crRNA están marcados con rombos verde azulados. Los símbolos sobre las secuencias de LbuCas13a corresponden a mutaciones realizadas en LbuCas13a, y los símbolos debajo de la secuencia de LshCas13a corresponden a mutaciones realizadas en LshCas13a por Liu. et al., Cell; 12 de enero de 2017; 168(1-2):121-134.e12. La coloración del alineamiento de la matriz indica la conservación de restos usando el esquema ClustalX, indicando las tonalidades más oscuras la fuerza de la conservación. Procesamiento de pre-crRNA en condiciones de recambio único medido para mutantes en (D) el dominio helicoidal 1 y (E) el dominio HEPN2. Los datos cuantificados se ajustaron con disminuciones exponenciales simples con constantes de tasas de pseudoprimer orden calculadas (kobs) (media ± s.d., n = 3) de la siguiente manera: Lbu WT 0,074 ± 0,003 min-1, E299A 0,071 ± 0,005 min-1, K310A 0,071 ± 0,003 min-1, R311A 0,054 ± 0,007 min-1, N314A 0,029 ± 0,008 min-1, R1079A 0,009 ± 0,007 min-1, D1078A 0,023 ± 0,002 min-1, K1080A 0,016 ± 0,004 min-1 y K1087A 0,076 ± 0,007 min-1, mientras que R1072A y K1082A no se pudieron ajustar. (F) Gel representativo de procesamiento de pre-crRNA del pre-crRNA de LshCas13a, LwaCas13a y LbuCas13a por proteínas LbuCas13a, LshCas13a y LwaCas13a usando condiciones estándar. La escalera de hidrólisis en la calle más a la derecha permite comparaciones de tamaño relativo, aunque las sutiles diferencias de secuencias entre los tres pre-crRNA alterarán la migración de estos pequeños fragmentos.
FIG. 41A-41B. Alineamientos completos de los dom inios helicoidal 1 y HEPN (A-B) Alineamiento de secuencias múltiples de 19 miembros de la familia Cas13a en (A) el dominio helicoidal 1 y (B) el dominio HEPN2. Los números de registro de GI se enumeran antes del nombre de cada especie. Las coordenadas basadas en la secuencia de LbuCas13a se indican encima del alineamiento y las coordenadas de la secuencia de LshCas13a se indican abajo. Las mutaciones analizadas en este estudio se indican encima del alineamiento con rombos amarillos y verde azulados que corresponden a sustituciones de alanina que afectaron negativamente a la reacción de procesamiento de precrRNA o a las que tuvieron efectos mínimos en el procesamiento de pre-crRNA, respectivamente. Las mutaciones ensayadas por (Liu et al., Cell, 12 de enero de 2017; 168(1-2):121-134.e12) se representan debajo de la secuencia de LshCas13a. Las puntuaciones de conservación se calcularon por Jalview utilizando el método AMAS.
FIG. 42A-42D. Los miembros de la familia de proteínas Cas13a escinden el ssRNA con varias eficacias (A) Esquema del direccionamiento a ssRNA por Cas13a. Por razones de simplicidad, la escisión de trans-ssRNA fue el foco de estudio. (B) Gel representativo de la escisión de trans-ssRNA mediada por Cas13a por los diez homólogos después de 60 min de incubación. Los complejos Cas13a:crRNA se formaron como se describe en los métodos utilizando productos de crRNA maduros con una concentración final de complejo RNP de 50 nM. Se añadió <1 nM de trans­ diana de ssRNA radiomarcada para iniciar la reacción en presencia y ausencia de activador de ssRNA complementario a crRNA, sin marcar, a una concentración 50 nM. Se observó una actividad de escisión débil de trans-ssRNA por LshCas13a, estando indicadas las bandas de producto por flechas dobles a la derecha. (C) Mapa de calor que indica los porcentajes de escisión de trans-ssRNA catalizada por Cas13a para cada sustrato de ssRNA de homopolímero de 5 unidades, para seis Cas13a diferentes. Las condiciones del ensayo fueron idénticas a las de la parte (B), excepto LbuCas13a y LwaCas13a que se incubaron durante 5 min en lugar de 60 min. (n = 3, valores con errores asociados presentados en la FIG. 51 (Tabla 6). (D) Tasas de escisión aparentes de un indicador de ssRNA fluorescente por cinco homólogos en un intervalo de concentraciones de activador de ssRNA. Los complejos Cas13a:crRNA se preincubaron a una proporción de 2:1 respectivamente con una concentración final de complejo activo de 50 nM. Se añadieron un activador de ssRNA complementario y un indicador de escisión de ssRNA fluorescente para iniciar las reacciones. Los cursos temporales de las curvas de señal de indicador normalizadas se ajustaron con disminuciones exponenciales simples y se representan gráficamente las tasas aparentes (n = 3). Algunas condiciones se estabilizaron antes del primer punto de tiempo medido, por lo tanto, se supone que sus tasas son mínimamente de 0,5 min-1 y están etiquetadas con un * en el gráfico.
FIG. 43A-43D. Escisión de trans-ssRNA por homólogos de Cas13a (A) Análisis del curso temporal de la escisión de trans-ssRNA por diez homólogos de Cas13a diferentes en presencia y ausencia de activador de ssRNA. Se tomaron puntos de tiempo a 1, 10 y 60 min. Se observan productos de escisión específicos del activador de ssRNA para LbuCas13a, LwaCas13a, LbaCas13a, EreCas13a, HheCas13a, PprCas13a, CamCas13a y LshCas13a. La línea de puntos indica el límite entre geles PAGE separados. (B) Sitios de escisión de trans-ssRNA mapeados en múltiples reacciones de escisión para cuatro homólogos de Cas13a. Los diferentes patrones de división se indican con flechas rojas. Parece ser que LbaCas13a y EreCas13a pueden tener preferencia por la adenosina, mientras que LwaCas13a parece ser más promiscua con respecto a la preferencia de nucleótidos. (C-D) Geles de escisión de trans-ssRNA representativos de sustratos de ssRNA de homopolímero por cinco homólogos de Cas13a.
FIG. 44A-44F. Intercambiabilidad de crRNA dentro de la familia Cas13a (A) Árbol filogenético de máxima verosimilitud de proteínas Cas13a. Los homólogos utilizados en este estudio están en negrita y los clados resaltados. Los valores de bootstrap se encuentran en la FIG. 39. (B) Matriz de puntuación de similitud simétrica para repeticiones CRISPR de homólogos utilizados en este estudio. Las filas y las columnas están ordenadas por grupo de repetición CRISPR. (C) Matriz de puntuación de similitud asimétrica para repeticiones CRISPR de homólogos utilizados en este estudio. En este caso se presentan las mismas puntuaciones por pares que en (B), con la excepción de que las filas se reordenan para corresponder al árbol filogenético de Cas13a. (D-F) Matriz de actividad funcional para (D) procesamiento de pre-crRNA por proteínas no afines, (E) escisión de trans-ssRNA dirigida por pre-crRNA y (F) escisión de trans-ssRNA dirigida por crRNA maduros. Los ensayos de procesamiento se realizaron utilizando condiciones estándar y se analizaron los puntos finales de reacción de 60 min. Los ensayos de escisión de trans-ssRNA se realizaron utilizando el ensayo indicador de ssRNA fluorescente con tasas iniciales ajustadas. Las concentraciones de activador de ssRNA fueron las siguientes: LbuCas13a: 100 pM, LwaCas13a: 100 pM, PprCas13a: 100 nM, LbaCas13a: 10 nM y HheCas13a: 100 nM. Las tasas iniciales se ajustaron en tres repeticiones para tener en cuenta las diferencias en los valores estabilizados de fluorescencia y se normalizaron para cada par afín Cas13a:crRNA. Véanse en las FIG. 52, 53 y 54 (Tablas 7, 8 y 9, respectivamente) los valores numéricos y errores asociados (n = 3).
FIG. 45A-45C. Validación funcional de las subfamilias de Cas13a ortogonales para la detección de ARN (A) Esquema del ensayo de detección de ARN modificado para usar sustratos de indicadores de ssRNA de homopolímero fluorescente para analizar la activación de la escisión de trans-ssRNA por LbuCas13a o LbaCas13a. (B) Curso temporal de las mediciones de fluorescencia de partida generada por indicadores de homopolímero incubados con LbuCas13a: Lbu-crRNA: activador de ssRNA 10 pM o LbaCas13a: Lba-crRNA: activador de ssRNA 1 nM (media ± s.d., n = 3). (C) Mediciones de fluorescencia de partida generada por los indicadores de ssRNA de homopolímero fluorescente en un panel de combinaciones de crRNA, activador de ssRNA y proteína Cas13a (media ± s.d., n = 3).
FIG. 46A-46D. Descifrado del papel del procesamiento de la matriz de crRNA para LbuCas13a (A) Datos de curso temporal cuantificados de los ensayos de procesamiento de pre-crRNA para el mutante R1079A/K1080A en comparación con LbuCas13a de tipo silvestre. Los datos cuantificados se ajustaron a disminuciones exponenciales simples y constante de velocidad de pseudoprimer orden (kobs) (media ± s.d., n = 3) para LbuCas13a WT de 0,074 ± 0,003 min-1, mientras que el mutante R1079A/K1080A no pudo ajustarse con suficiente confianza para producir una constante de velocidad. (B) Tasa aparente de indicador fluorescente por LbuCas13a de tipo silvestre y mutante inactivo de procesamiento de R1079A/K1080A dirigido por pre-crRNA y crRNA maduros. Se preincubaron complejos Cas13a:ARN durante 60 min en una proporción de 1:1, y luego se añadieron 10 pM de activador y 150 nM de indicador para iniciar la reacción, (media ± s.d., n = 3) (C) Tasas aparentes de escisión del indicador de ssRNA fluorescente por 300 nM de LbuCas13a de tipo silvestre o mutante inactivo para el procesamiento de pre-crRNA R1079A/K1080A dirigidos por 50 nM de una matriz CRISPR que contiene seis espaciadores de repetición de crRNA. Cada grupo de barras representa la adición de 100 pM de una secuencia activadora de ssRNA distinta complementaria a las posiciones esquematizadas dentro de la matriz CRISPR indicada debajo de cada grupo de barras. Cada tasa se ajusta a partir de datos de tres réplicas biológicas y se representa la desviación estándar de la tasa. La tasa de proteína mutante es estadísticamente diferente de la de LbuCas13a de tipo silvestre para todas las posiciones del espaciador (prueba t unilateral: p<0,001). (D) Datos de (C) representados como un porcentaje de la actividad de LbuCAs13a de tipo silvestre que demuestra el efecto posicional de la disminución de las eficacias de direccionamiento a trans-ssRNA por el mutante inactivo de procesamiento de pre-crRNA.
FIG. 47A-47C. Escisión en trans por mutantes puntuales de LbuCas13a en regiones implicadas en el procesamiento de pre-crRNA. (AC) Escisión de trans-ssRNA por varios mutantes puntuales de LbuCas13a "implicados" en el procesamiento de pre-crRNA. Las reacciones de escisión se realizaron con Cas13a:crRNA 50 nM a 25 °C o 37 °C con activador de ssRNA 0,2 nM o 1 nM, según se indica. Se usaron concentraciones de activador y temperaturas más bajas para ralentizar la cinética de reacción y obtener mediciones más precisas. Las curvas ajustadas son disminuciones exponenciales simples con constantes de tasas de pseudoprimer orden calculadas (media ± s.d., n = 3) de la siguiente manera: Condiciones de 25 °C: Lbu WT 1,76 ± 0,24 min-1, K299A 1,72 ± 0,65 min-1, K310A 3,19 ± 0,27 min-1, R1072A 2,95 ± 0,53 min-1, R1079A 0,93 ± 0,28 min-1 y K1082A 2,64 ± 0,63 min-1 y condiciones de 37 °C: R311A 0,39 ± 0,09 min-1 y N314A 0,54 ± 0,11 min-1, mientras que el tipo silvestre y el mutante inactivo de procesamiento (R1079A/K1080A) se estancaron demasiado rápido para una medición de tasa precisa: WT 2,95 ± 1,97 min-1 y R1079A/K1080A 4,86 ± 4,99 min-1.
FIG. 48A-48B. El mutante inactivo de procesamiento de crRNA R1079A/K1080A conserva una afinidad de unión de crRNA similar y no procesa una matriz de pre-cRNA (A) Se realizaron ensayos de unión de filtro como se describe en los métodos para determinar la afinidad de unión de crRNA maduro a LbuCas13a WT y LbuCas13a R1079A/K1080A.

Claims (14)

REIVINDICACIONES
1. Un método para detectar un ARN diana monocatenario en una muestra biológica que comprende una pluralidad de ARN, comprendiendo el método:
a) poner en contacto la muestra biológica con:
i) un ARN detector marcado; y
ii) una proteína C2c2 que escinde el ARN detector marcado; y
iii) un ARN guía (gRNA) que hibrida con el ARN diana monocatenario, en donde el gRNA se une a la proteína C2c2; y
b) medir una señal detectable producida por la escisión del ARN detector marcado.
2. El método de acuerdo con la reivindicación 1, en donde el ARN diana monocatenario está presente en la muestra biológica en un intervalo de 10 fM a 1 nM.
3. El método de acuerdo con la reivindicación 1 o la reivindicación 2, en donde la muestra biológica está en contacto durante 2 horas o menos, 1 hora o menos, 30 minutos o menos, 20 minutos o menos, 10 minutos o menos, 5 minutos o menos o 1 minuto o menos, antes de dicha medición.
4. El método de acuerdo con una cualquiera de las reivindicaciones 1-3, que comprende determinar una cantidad del ARN diana presente en la muestra biológica.
5. El método de acuerdo con una cualquiera de las reivindicaciones 1-4, en donde la pluralidad de ARN comprende de 5 a 107 ARN que difieren entre sí en secuencia.
6. El método de acuerdo con una cualquiera de las reivindicaciones 1-5, en donde la medición de una señal detectable comprende una o más de: detección basada en nanopartículas de oro, polarización de fluorescencia, transición/dispersión de fase coloidal, detección electroquímica, detección de señales fluorescentes y detección basada en semiconductores.
7. El método de acuerdo con una cualquiera de las reivindicaciones 1-6, en donde el ARN detector marcado comprende un par de colorantes emisores de fluorescencia o un par inactivador/flúor.
8. El método de acuerdo con una cualquiera de las reivindicaciones 1-7, en donde el ARN detector marcado comprende uno o más de: un enlace internucleosídico no natural, un mimético de ácido nucleico, un resto de azúcar modificado, una nucleobase modificada, un ácido nucleico bloqueado (ANB), un ácido peptidonucleico (APN), un ácido nucleico de morfolino y un ácido nucleico de ciclohexenilo (CeNA).
9. El método de acuerdo con una cualquiera de las reivindicaciones 1-8, en donde el ARN diana monocatenario procede de:
(a) un virus, opcionalmente, en donde el ARN diana monocatenario procede de un virus seleccionado de: virus de Zika, virus de la inmunodeficiencia humana (VIH), virus de la hepatitis B, virus de la hepatitis C, virus del herpes, virus del herpes simple de tipo I, virus del herpes simple de tipo II, virus del papiloma, virus de la rabia, gripe, citomegalovirus, virus de tipo parvo del suero humano, virus respiratorio sincitial, virus de la varicela-zóster, virus del sarampión, adenovirus, virus de la leucemia de linfocitos T humanos, virus de Epstein-Barr, virus de la leucemia murina, virus de las paperas, virus de la estomatitis vesicular, virus Sindbis, virus de la coriomeningitis linfocítica, virus de las verrugas, virus de la lengua azul, virus Sendai, virus de la leucemia felina, reovirus, virus de la polio, virus de simio 40, virus de tumor mamario de ratón, virus del dengue, virus de la rubéola, virus del Nilo Occidental y virus de la fiebre amarilla;
b) un parásito, un helminto, un hongo, un protozoo o una bacteria, opcionalmente en donde la bacteria es una bacteria patógena; y, opcionalmente, las bacterias patógenas se seleccionan de: Mycobacterium tuberculosis, Streptococcus agalactiae, Staphylococcus aureus resistente a meticilina, Legionella pneumophila, Streptococcus pyogenes, Escherichia coli, Neisseria gonorrhoeae, Neisseria meningitidis, neumococo, Cryptococcus neoformans, Treponema pallidum, espiroquetas de la enfermedad de Lyme, Pseudomonas aeruginosa, Mycobacterium leprae y Brucella abortus; o
c) una célula humana, una célula animal, una célula vegetal, una célula cancerosa, una célula infectada o una célula enferma.
10. El método de acuerdo con una cualquiera de las reivindicaciones 1-9, el ARN diana monocatenario procede de la gripe.
11. El método de acuerdo con una cualquiera de las reivindicaciones 1-10, en el que la proteína C2c2 comprende una secuencia de aminoácidos que tiene una identidad de secuencia de aminoácidos de un 80 % o más con la secuencia de aminoácidos expuesta en una cualquiera de los SEQ ID NO: 1-6.
12. Un kit para detectar un ARN diana en una muestra biológica que comprende una pluralidad de ARN, comprendiendo el kit:
a. un ARN detector marcado que comprende un par de colorantes emisores de fluorescencia; y
b. una proteína C2c2, en donde opcionalmente la proteína C2c2 comprende una secuencia de aminoácidos que tiene al menos un 80 % de identidad de secuencia de aminoácidos con la secuencia de aminoácidos expuesta en el SEQ ID NO: 2 o el SEQ ID NO: 6.
13. El kit de la reivindicación 12, que comprende un ARN diana de control positivo.
14. El kit de una cualquiera de las reivindicaciones 12-13, que comprende al menos uno de:
a) un ARN guía de C2c2 y/o un ácido nucleico que codifica dicho ARN guía;
b) un ARN guía de C2c2 precursor y/o un ácido nucleico que codifica dicho ARN guía precursor; y
c) una matriz de ARN guía de C2c2 precursor, y/o un ácido nucleico que codifica dicha matriz de ARN guía precursor, en donde la matriz de ARN guía precursor comprende dos o más ARN guía, de los cuales cada uno tiene una secuencia guía diferente y/o un sitio de inserción para una secuencia guía de elección.
ES17813959T 2016-06-16 2017-06-13 Métodos y composiciones para detectar un ARN diana Active ES2908484T3 (es)

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
US201662351172P 2016-06-16 2016-06-16
US201662378156P 2016-08-22 2016-08-22
US15/467,922 US10337051B2 (en) 2016-06-16 2017-03-23 Methods and compositions for detecting a target RNA
PCT/US2017/037308 WO2017218573A1 (en) 2016-06-16 2017-06-13 Methods and compositions for detecting a target rna

Publications (1)

Publication Number Publication Date
ES2908484T3 true ES2908484T3 (es) 2022-04-29

Family

ID=60661224

Family Applications (1)

Application Number Title Priority Date Filing Date
ES17813959T Active ES2908484T3 (es) 2016-06-16 2017-06-13 Métodos y composiciones para detectar un ARN diana

Country Status (11)

Country Link
US (7) US10337051B2 (es)
EP (2) EP3471749B1 (es)
JP (2) JP2019522472A (es)
CN (2) CN109641026B (es)
AU (2) AU2017283538B2 (es)
CA (1) CA3024883A1 (es)
DE (3) DE212017000062U1 (es)
DK (1) DK3471749T3 (es)
ES (1) ES2908484T3 (es)
GB (1) GB2557153B (es)
WO (1) WO2017218573A1 (es)

Families Citing this family (60)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
AU2016279077A1 (en) 2015-06-18 2019-03-28 Omar O. Abudayyeh Novel CRISPR enzymes and systems
US10337051B2 (en) 2016-06-16 2019-07-02 The Regents Of The University Of California Methods and compositions for detecting a target RNA
AU2017283713B2 (en) * 2016-06-17 2021-04-08 Massachusetts Institute Of Technology Type VI CRISPR orthologs and systems
JP7306696B2 (ja) 2016-09-30 2023-07-11 ザ リージェンツ オブ ザ ユニバーシティ オブ カリフォルニア Rna誘導型核酸修飾酵素及びその使用方法
BR112019006384A2 (pt) 2016-09-30 2019-06-25 Univ California enzimas modificadoras de ácido nucleico guiadas por rna e métodos de uso das mesmas
SI3551753T1 (sl) * 2016-12-09 2022-09-30 The Broad Institute, Inc. Diagnostika, temelječa na sistemu CRISPR EFFECTOR
US11104937B2 (en) * 2017-03-15 2021-08-31 The Broad Institute, Inc. CRISPR effector system based diagnostics
CN111108220A (zh) * 2017-03-15 2020-05-05 博德研究所 用于病毒检测的基于crispr效应***的诊断
US11174515B2 (en) * 2017-03-15 2021-11-16 The Broad Institute, Inc. CRISPR effector system based diagnostics
US11021740B2 (en) * 2017-03-15 2021-06-01 The Broad Institute, Inc. Devices for CRISPR effector system based diagnostics
AU2018254619B2 (en) 2017-04-21 2022-07-21 The General Hospital Corporation Variants of Cpf1 (CAS12a) with altered PAM specificity
US11168322B2 (en) 2017-06-30 2021-11-09 Arbor Biotechnologies, Inc. CRISPR RNA targeting enzymes and systems and uses thereof
US20200165594A1 (en) * 2017-07-07 2020-05-28 The Broad Institute, Inc. Crispr system based antiviral therapy
WO2019060469A2 (en) * 2017-09-19 2019-03-28 Massachusetts Institute Of Technology CAS9 STREPTOCOCCUS CANIS AS A GENOMIC ENGINEERING PLATFORM WITH NEW PAM SPECIFICITY
AU2018346530A1 (en) 2017-10-04 2020-04-30 Massachusetts Institute Of Technology CRISPR effector system based diagnostics
US11970719B2 (en) 2017-11-01 2024-04-30 The Regents Of The University Of California Class 2 CRISPR/Cas compositions and methods of use
SG11202003863VA (en) 2017-11-01 2020-05-28 Univ California Casz compositions and methods of use
US11661599B1 (en) 2017-12-14 2023-05-30 National Technology & Engineering Solutions Of Sandia, Llc CRISPR-Cas based system for targeting single-stranded sequences
DK3765615T3 (da) 2018-03-14 2023-08-21 Arbor Biotechnologies Inc Nye enzymer og systemer til målretning af crispr dna
FI3765616T3 (fi) 2018-03-14 2023-08-29 Arbor Biotechnologies Inc Uusia CRISPR-DNA- ja RNA-kohdennusentsyymejä ja -järjestelmiä
WO2019204210A1 (en) * 2018-04-16 2019-10-24 Georgia Tech Research Corporation Mrna driven expression of rna editors for treatment of pathologies
CN110551800B (zh) * 2018-06-03 2022-08-19 上海吐露港生物科技有限公司 一种耐高温Cas蛋白的用途及靶标核酸分子的检测方法和试剂盒
SG11202101934SA (en) * 2018-07-30 2021-03-30 Readcoor Llc Methods and systems for sample processing or analysis
US11608519B2 (en) 2018-07-30 2023-03-21 Tokitae Llc Specific detection of deoxyribonucleic acid sequences using novel CRISPR enzyme-mediated detection strategies
WO2020028729A1 (en) 2018-08-01 2020-02-06 Mammoth Biosciences, Inc. Programmable nuclease compositions and methods of use thereof
CN109055499B (zh) * 2018-08-30 2021-01-19 杭州杰毅生物技术有限公司 基于CRISPR-Cas的等温核酸检测方法及试剂盒
WO2020051452A2 (en) * 2018-09-07 2020-03-12 The J. David Gladstone Institutes, A Testamentary Trust Established Under The Will Of J. David Gladstone Hiv or hcv detection with crispr-cas13a
WO2020072816A1 (en) * 2018-10-03 2020-04-09 The Broad Institute, Inc. Crispr effector system based diagnostics for hemorrhagic fever detection
EP3931313A2 (en) 2019-01-04 2022-01-05 Mammoth Biosciences, Inc. Programmable nuclease improvements and compositions and methods for nucleic acid amplification and detection
EP4219700A1 (en) 2019-03-07 2023-08-02 The Regents of the University of California Crispr-cas effector polypeptides and methods of use thereof
KR20210142690A (ko) 2019-03-21 2021-11-25 셜록 바이오사이언스, 인크. 시스템
WO2021002476A1 (ja) * 2019-07-04 2021-01-07 国立研究開発法人理化学研究所 標的核酸断片の検出方法及びキット
US20220364159A1 (en) * 2019-07-26 2022-11-17 Mammoth Biosciences, Inc. Compositions for detection of dna and methods of use thereof
WO2021062201A1 (en) * 2019-09-25 2021-04-01 Spotlight Therapeutics Compositions and methods for nucleoprotein targeting and expression
CN110732028B (zh) * 2019-11-01 2022-07-26 南开大学 一种可限制激活CRISPR/Cas13a的双锁纳米粒子的制备方法和应用
WO2021168578A1 (en) * 2020-02-27 2021-09-02 Lsk Technologies Inc. Systems and methods for characterization of an assay from regions of interest using optical reactions
US20210348243A1 (en) * 2020-03-19 2021-11-11 The J. David Gladstone Institutes, a testamentary trust established under the Will of J. David Glads RAPID FIELD-DEPLOYABLE DETECTION OF SARS-CoV-2 VIRUS
CN113549605B (zh) * 2020-04-26 2023-03-31 生物岛实验室 用于抑制SARS-CoV-2的组合物及载体***
JP2023527768A (ja) * 2020-05-19 2023-06-30 ザ リージェンツ オブ ザ ユニバーシティ オブ カリフォルニア 核酸検出のためのヌクレアーゼ連鎖反応用の組成物および方法
US20230193368A1 (en) * 2020-05-29 2023-06-22 University Of Florida Research Foundation Crispr/cas chain reaction systems and methods for amplifying the detection sensitivity of crispr-based target detection
TW202219272A (zh) 2020-06-12 2022-05-16 美商夏洛克生物科學公司 SARS-CoV-2之偵測
CN113293198B (zh) * 2020-09-18 2022-12-02 山东舜丰生物科技有限公司 基于crispr技术进行靶核酸多重检测的方法
WO2022188039A1 (en) 2021-03-09 2022-09-15 Huigene Therapeutics Co., Ltd. Engineered crispr/cas13 system and uses thereof
CN112143821A (zh) * 2020-09-30 2020-12-29 北京师范大学 Fret检测白色念珠菌,新生隐球菌和肺炎克雷伯杆菌的试剂及其应用
WO2022068912A1 (en) 2020-09-30 2022-04-07 Huigene Therapeutics Co., Ltd. Engineered crispr/cas13 system and uses thereof
CN112813179B (zh) * 2020-12-09 2023-04-18 广州市第一人民医院(广州消化疾病中心、广州医科大学附属市一人民医院、华南理工大学附属第二医院) 一种用于***病原菌检测的试剂盒及其使用方法
TW202237844A (zh) * 2020-12-09 2022-10-01 德商拜恩技術股份公司 Rna製造
EP4291678A1 (en) 2021-02-09 2023-12-20 Sherlock Biosciences, Inc. Nucleic acid amplification using promoter primers
WO2022241032A1 (en) * 2021-05-12 2022-11-17 Mammoth Biosciences, Inc. Enhanced guide nucleic acids and methods of use
US20220389418A1 (en) 2021-06-01 2022-12-08 Helmholtz-Institut Für Rna-Basierte Nfektionsforschung (Hzi) Rna-guided cas nucleases and uses thereof in diagnostics and therapy
US20230167487A2 (en) 2021-07-12 2023-06-01 Labsimply, Inc. Crispr cascade assay
US11814689B2 (en) 2021-07-21 2023-11-14 Montana State University Nucleic acid detection using type III CRISPR complex
US11820983B2 (en) 2021-12-13 2023-11-21 Labsimply, Inc. Tuning cascade assay kinetics via molecular design
WO2023114090A2 (en) 2021-12-13 2023-06-22 Labsimply, Inc. Signal boost cascade assay
WO2023112886A1 (ja) * 2021-12-16 2023-06-22 国立研究開発法人理化学研究所 1本鎖rnaの製造方法
WO2024020352A1 (en) * 2022-07-18 2024-01-25 Vertex Pharmaceuticals Incorporated Tandem guide rnas (tg-rnas) and their use in genome editing
US20240229133A1 (en) * 2022-09-14 2024-07-11 Revvity Health Sciences, Inc. Methods and compositions for single-stranded nucleic acid ladders by guided cleavage
US11982677B2 (en) 2022-10-02 2024-05-14 Vedabio, Inc. Dimerization screening assays
US11965205B1 (en) 2022-10-14 2024-04-23 Vedabio, Inc. Detection of nucleic acid and non-nucleic acid target molecules
CN116814627B (zh) * 2023-07-11 2024-07-19 深圳市辰景生命科技有限公司 sgRNA组合物、检测新型冠状病毒SARS-CoV-2的试剂盒以及检测方法

Family Cites Families (76)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US3687808A (en) 1969-08-14 1972-08-29 Univ Leland Stanford Junior Synthetic polynucleotides
US5034506A (en) 1985-03-15 1991-07-23 Anti-Gene Development Group Uncharged morpholino-based polymers having achiral intersubunit linkages
US5602240A (en) 1990-07-27 1997-02-11 Ciba Geigy Ag. Backbone modified oligonucleotide analogs
US5489677A (en) 1990-07-27 1996-02-06 Isis Pharmaceuticals, Inc. Oligonucleoside linkages containing adjacent oxygen and nitrogen atoms
US5719262A (en) 1993-11-22 1998-02-17 Buchardt, Deceased; Ole Peptide nucleic acids having amino acid side chains
US5539082A (en) 1993-04-26 1996-07-23 Nielsen; Peter E. Peptide nucleic acids
US5714331A (en) 1991-05-24 1998-02-03 Buchardt, Deceased; Ole Peptide nucleic acids having enhanced binding affinity, sequence specificity and solubility
JP3756313B2 (ja) 1997-03-07 2006-03-15 武 今西 新規ビシクロヌクレオシド及びオリゴヌクレオチド類縁体
KR100414936B1 (ko) 1997-09-12 2004-01-13 엑시콘 에이/에스 이환 및 삼환 뉴클레오시드, 뉴클레오타이드 및올리고뉴클레오타이드 동족체
WO2001036668A1 (de) 1999-11-16 2001-05-25 Atto-Tec Gmbh Farbstoffmarkiertes oligonukleotid zum markieren eines nukleinsäuremoleküls
US6727356B1 (en) 1999-12-08 2004-04-27 Epoch Pharmaceuticals, Inc. Fluorescent quenching detection reagents and methods
US7019129B1 (en) 2000-05-09 2006-03-28 Biosearch Technologies, Inc. Dark quenchers for donor-acceptor energy transfer
EP1294863B1 (en) * 2000-05-24 2009-07-08 Third Wave Technologies, Inc. Detection of rna
US6773885B1 (en) 2000-09-29 2004-08-10 Integrated Dna Technologies, Inc. Compositions and methods for visual ribonuclease detection assays
US6818420B2 (en) 2002-02-27 2004-11-16 Biosource International, Inc. Methods of using FET labeled oligonucleotides that include a 3′-5′ exonuclease resistant quencher domain and compositions for practicing the same
CN1886512A (zh) 2002-04-23 2006-12-27 斯克里普斯研究所 多肽在叶绿体中的表达以及用于表达多肽的组合物和方法
DE10259374A1 (de) 2002-12-18 2004-07-08 Atto-Tec Gmbh Carboxamid-substituierte Farbstoffe für analytische Anwendungen
DE10329860A1 (de) 2003-07-02 2005-01-20 Atto-Tec Gmbh Sulfonamidderivate polycyclischer Farbstoffe für analytische Anwendungen
EP1580273A1 (en) 2004-03-26 2005-09-28 Friedrich-Alexander-Universität Erlangen-Nürnberg Peptide-based method for monitoring gene expression in a host cell
EP1789794A1 (en) 2004-09-14 2007-05-30 Applera Corporation, Applied Biosystems Group Multi-chromophoric quencher constructs for use in high sensitivity energy transfer probes
CN101283089A (zh) 2005-10-07 2008-10-08 加利福尼亚大学董事会 修饰细胞色素p450酶的编码核酸和其应用方法
US9689031B2 (en) 2007-07-14 2017-06-27 Ionian Technologies, Inc. Nicking and extension amplification reaction for the exponential amplification of nucleic acids
ES2633786T3 (es) 2008-04-01 2017-09-25 Biosearch Technologies, Inc. Sondas de fluoróforo atenuadoras oscuras de ácido nucleico estabilizado
WO2011053871A2 (en) 2009-10-30 2011-05-05 Life Technologies Corporation Multi-primer assay for mycoplasma detection
CA2790123A1 (en) 2010-02-15 2011-08-18 Cascade Biosystems, Inc. Methods and materials for detecting viral or microbial infections
JP2013531983A (ja) 2010-06-11 2013-08-15 パソジェニカ,インコーポレイテッド 多重生物検出のための核酸ならびにその使用および製造方法
DE102010042634A1 (de) 2010-10-19 2012-04-19 Atto-Tec Gmbh Neue Amin-substituierte tricyclische Fluoreszenzfarbstoffe
US9730967B2 (en) 2011-02-04 2017-08-15 Katherine Rose Kovarik Method and system for treating cancer cachexia
EP2787077B1 (en) 2011-10-31 2019-10-23 Eiken Kagaku Kabushiki Kaisha Method for detecting target nucleic acid
US8815782B2 (en) 2011-11-11 2014-08-26 Agilent Technologies, Inc. Use of DNAzymes for analysis of an RNA sample
PT2800811T (pt) 2012-05-25 2017-08-17 Univ California Métodos e composições para modificação de adn alvo dirigida por arn e para modulação dirigida por arn de transcrição
US20140024024A1 (en) * 2012-07-17 2014-01-23 General Electric Company Methods of detecting dna, rna and protein in biological samples
DK3360964T3 (da) 2012-12-06 2019-10-28 Sigma Aldrich Co Llc Crispr-baseret genommodifikation og -regulering
CN103088128B (zh) * 2013-01-09 2015-11-18 华中科技大学 一种microRNA的二次循环扩增检测方法及试剂盒
SG11201507378UA (en) 2013-03-14 2015-10-29 Caribou Biosciences Inc Compositions and methods of nucleic acid-targeting nucleic acids
US9234213B2 (en) * 2013-03-15 2016-01-12 System Biosciences, Llc Compositions and methods directed to CRISPR/Cas genomic engineering systems
WO2015071474A2 (en) 2013-11-18 2015-05-21 Crispr Therapeutics Ag Crispr-cas system materials and methods
US9994831B2 (en) 2013-12-12 2018-06-12 The Regents Of The University Of California Methods and compositions for modifying a single stranded target nucleic acid
US9850525B2 (en) 2014-01-29 2017-12-26 Agilent Technologies, Inc. CAS9-based isothermal method of detection of specific DNA sequence
AU2015234204A1 (en) 2014-03-20 2016-10-06 Universite Laval CRISPR-based methods and products for increasing frataxin levels and uses thereof
US10253311B2 (en) 2014-04-10 2019-04-09 The Regents Of The University Of California Methods and compositions for using argonaute to modify a single stranded target nucleic acid
WO2015191693A2 (en) 2014-06-10 2015-12-17 Massachusetts Institute Of Technology Method for gene editing
KR20170036801A (ko) 2014-08-19 2017-04-03 프레지던트 앤드 펠로우즈 오브 하바드 칼리지 핵산의 프로빙 및 맵핑을 위한 rna-가이드된 시스템
WO2016094867A1 (en) 2014-12-12 2016-06-16 The Broad Institute Inc. Protected guide rnas (pgrnas)
EP3230452A1 (en) 2014-12-12 2017-10-18 The Broad Institute Inc. Dead guides for crispr transcription factors
WO2016106236A1 (en) 2014-12-23 2016-06-30 The Broad Institute Inc. Rna-targeting system
EP3250689B1 (en) 2015-01-28 2020-11-04 The Regents of The University of California Methods and compositions for labeling a single-stranded target nucleic acid
AU2016279077A1 (en) * 2015-06-18 2019-03-28 Omar O. Abudayyeh Novel CRISPR enzymes and systems
EP3129393B1 (en) 2015-06-18 2021-08-04 The Broad Institute Inc. Crispr enzyme mutations reducing off-target effects
US9790490B2 (en) 2015-06-18 2017-10-17 The Broad Institute Inc. CRISPR enzymes and systems
WO2016205749A1 (en) 2015-06-18 2016-12-22 The Broad Institute Inc. Novel crispr enzymes and systems
US9580727B1 (en) 2015-08-07 2017-02-28 Caribou Biosciences, Inc. Compositions and methods of engineered CRISPR-Cas9 systems using split-nexus Cas9-associated polynucleotides
EP3365441A1 (en) 2015-10-22 2018-08-29 The Broad Institute Inc. Type vi-b crispr enzymes and systems
WO2017120410A1 (en) 2016-01-08 2017-07-13 University Of Georgia Research Foundation, Inc. Methods for cleaving dna and rna molecules
US11441146B2 (en) 2016-01-11 2022-09-13 Christiana Care Health Services, Inc. Compositions and methods for improving homogeneity of DNA generated using a CRISPR/Cas9 cleavage system
US9896696B2 (en) 2016-02-15 2018-02-20 Benson Hill Biosystems, Inc. Compositions and methods for modifying genomes
CN109312336A (zh) 2016-02-23 2019-02-05 阿克生物公司 用于靶标检测的方法和组合物
US20190093091A1 (en) 2016-04-06 2019-03-28 Temple University - Of The Commonwealth System Of Higher Education Compositions for eradicating flavivirus infections in subjects
WO2017205668A1 (en) 2016-05-25 2017-11-30 Arizona Board Of Regents On Behalf Of Arizona State University Portable, low-cost pathogen detection and strain identification platform
US10337051B2 (en) 2016-06-16 2019-07-02 The Regents Of The University Of California Methods and compositions for detecting a target RNA
AU2017283713B2 (en) 2016-06-17 2021-04-08 Massachusetts Institute Of Technology Type VI CRISPR orthologs and systems
ES2915562T3 (es) 2016-06-24 2022-06-23 Univ Colorado Regents Métodos para generar bibliotecas combinatorias con código de barras
EP3500967A1 (en) 2016-08-17 2019-06-26 The Broad Institute, Inc. Methods for identifying class 2 crispr-cas systems
BR112019006384A2 (pt) 2016-09-30 2019-06-25 Univ California enzimas modificadoras de ácido nucleico guiadas por rna e métodos de uso das mesmas
JP7306696B2 (ja) 2016-09-30 2023-07-11 ザ リージェンツ オブ ザ ユニバーシティ オブ カリフォルニア Rna誘導型核酸修飾酵素及びその使用方法
CN106701830B (zh) 2016-12-07 2020-01-03 湖南人文科技学院 一种敲除猪胚胎p66shc基因的方法
SI3551753T1 (sl) 2016-12-09 2022-09-30 The Broad Institute, Inc. Diagnostika, temelječa na sistemu CRISPR EFFECTOR
BR112019015244A2 (pt) * 2017-03-24 2020-04-14 Curevac Ag ácidos nucleicos codificando proteínas associadas a crispr e usos dos mesmos
AU2018254619B2 (en) 2017-04-21 2022-07-21 The General Hospital Corporation Variants of Cpf1 (CAS12a) with altered PAM specificity
CA3072312A1 (en) 2017-08-09 2019-02-14 Benson Hill, Inc. Compositions and methods for modifying genomes
US20200255858A1 (en) 2017-11-01 2020-08-13 Jillian F. Banfield Casy compositions and methods of use
SG11202003863VA (en) 2017-11-01 2020-05-28 Univ California Casz compositions and methods of use
US11970719B2 (en) 2017-11-01 2024-04-30 The Regents Of The University Of California Class 2 CRISPR/Cas compositions and methods of use
EP3704254A4 (en) 2017-11-01 2021-09-01 The Regents of The University of California CAS12C COMPOSITIONS AND METHOD OF USE
US10253365B1 (en) 2017-11-22 2019-04-09 The Regents Of The University Of California Type V CRISPR/Cas effector proteins for cleaving ssDNAs and detecting target DNAs
CN111836903A (zh) 2017-12-22 2020-10-27 博德研究所 基于crispr效应***的多重诊断

Also Published As

Publication number Publication date
CN109641026B (zh) 2023-01-03
JP2019522472A (ja) 2019-08-15
CN109641026A (zh) 2019-04-16
US20190177775A1 (en) 2019-06-13
US20180208977A1 (en) 2018-07-26
DE212017000056U1 (de) 2018-11-21
JP7437474B2 (ja) 2024-02-22
GB201804822D0 (en) 2018-05-09
US20200010878A1 (en) 2020-01-09
US10337051B2 (en) 2019-07-02
GB2557153B (en) 2019-03-20
EP4036249A1 (en) 2022-08-03
WO2017218573A1 (en) 2017-12-21
US10494664B2 (en) 2019-12-03
AU2017283538A1 (en) 2018-12-13
US11840725B2 (en) 2023-12-12
US20170362644A1 (en) 2017-12-21
US11827919B2 (en) 2023-11-28
CN116287127A (zh) 2023-06-23
US20180208976A1 (en) 2018-07-26
AU2017283538B2 (en) 2022-07-21
EP3471749A1 (en) 2019-04-24
GB2557153A (en) 2018-06-13
US20200010879A1 (en) 2020-01-09
AU2022256169A1 (en) 2022-11-24
CA3024883A1 (en) 2017-12-21
DE212017000062U1 (de) 2018-11-29
US11459600B2 (en) 2022-10-04
EP3471749B1 (en) 2022-01-12
DK3471749T3 (da) 2022-02-07
JP2022185083A (ja) 2022-12-13
EP3471749A4 (en) 2020-01-08
DE212017000061U1 (de) 2018-12-04
US20240182953A1 (en) 2024-06-06
US11459599B2 (en) 2022-10-04

Similar Documents

Publication Publication Date Title
ES2908484T3 (es) Métodos y composiciones para detectar un ARN diana
US11118224B2 (en) Type V CRISPR/Cas effector proteins for cleaving ssDNAs and detecting target DNAs
ES2728743T3 (es) Flujo de trabajo para la detección de ligandos utilizando ácidos nucleicos
ES2618127T3 (es) Composiciones de dúplex de cebador de extremos cohesivos y métodos de uso
ES2854049T3 (es) Composiciones y procedimientos para la detección de Mycoplasma genitalium
ES2686323T3 (es) Composiciones y procedimientos para la detección de virus 1 y 2 del herpes simple
ES2572930T3 (es) Composiciones y métodos para la detección de Staphylococcus aureus
ES2729304T3 (es) Composiciones y procedimientos para detectar Staphylococcus aureus resistente a la meticilina que contiene mecC
ES2874259T3 (es) Composiciones y procedimientos para la detección de Trichomonas vaginalis
ES2886605T3 (es) Procedimiento genérico para la estabilización de ARN específico
Jansson-Fritzberg Structure and Dynamics of Telomerase
Steiner Metal ion binding to group II intron ribozymes: a study from bulk to the single molecule level