ES2952978T3 - Sistemas y enzimas novedosos de direccionamiento a ADN de CRISPR - Google Patents

Sistemas y enzimas novedosos de direccionamiento a ADN de CRISPR Download PDF

Info

Publication number
ES2952978T3
ES2952978T3 ES19714925T ES19714925T ES2952978T3 ES 2952978 T3 ES2952978 T3 ES 2952978T3 ES 19714925 T ES19714925 T ES 19714925T ES 19714925 T ES19714925 T ES 19714925T ES 2952978 T3 ES2952978 T3 ES 2952978T3
Authority
ES
Spain
Prior art keywords
crispr
sequence
seq
dna
target
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
ES19714925T
Other languages
English (en)
Inventor
Shaorong Chong
Winston X Yan
David A Scott
David R Cheng
Pratyusha Hunnewell
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Arbor Biotechnologies Inc
Original Assignee
Arbor Biotechnologies Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Arbor Biotechnologies Inc filed Critical Arbor Biotechnologies Inc
Application granted granted Critical
Publication of ES2952978T3 publication Critical patent/ES2952978T3/es
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/16Hydrolases (3) acting on ester bonds (3.1)
    • C12N9/22Ribonucleases RNAses, DNAses
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/102Mutagenizing nucleic acids
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/113Non-coding nucleic acids modulating the expression of genes, e.g. antisense oligonucleotides; Antisense DNA or RNA; Triplex- forming oligonucleotides; Catalytic nucleic acids, e.g. ribozymes; Nucleic acids used in co-suppression or gene silencing
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/87Introduction of foreign genetic material using processes not otherwise provided for, e.g. co-transformation
    • C12N15/90Stable introduction of foreign DNA into chromosome
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/87Introduction of foreign genetic material using processes not otherwise provided for, e.g. co-transformation
    • C12N15/90Stable introduction of foreign DNA into chromosome
    • C12N15/902Stable introduction of foreign DNA into chromosome using homologous recombination
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2310/00Structure or type of the nucleic acid
    • C12N2310/10Type of nucleic acid
    • C12N2310/20Type of nucleic acid involving clustered regularly interspaced short palindromic repeats [CRISPRs]
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2310/00Structure or type of the nucleic acid
    • C12N2310/50Physical structure
    • C12N2310/53Physical structure partially self-complementary or closed
    • C12N2310/531Stem-loop; Hairpin
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2800/00Nucleic acids vectors
    • C12N2800/80Vectors containing sites for inducing double-stranded breaks, e.g. meganuclease restriction sites

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Engineering & Computer Science (AREA)
  • Chemical & Material Sciences (AREA)
  • Zoology (AREA)
  • Organic Chemistry (AREA)
  • Biomedical Technology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Wood Science & Technology (AREA)
  • Molecular Biology (AREA)
  • Biotechnology (AREA)
  • General Engineering & Computer Science (AREA)
  • Microbiology (AREA)
  • Biochemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Biophysics (AREA)
  • Physics & Mathematics (AREA)
  • Plant Pathology (AREA)
  • Medicinal Chemistry (AREA)
  • Mycology (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Enzymes And Modification Thereof (AREA)
  • Saccharide Compounds (AREA)
  • Medicines That Contain Protein Lipid Enzymes And Other Medicines (AREA)

Abstract

La divulgación describe nuevos sistemas, métodos y composiciones para la manipulación de ácidos nucleicos de forma dirigida. La divulgación describe sistemas, componentes y métodos CRISPR diseñados de origen no natural para la modificación dirigida de ácidos nucleicos como el ADN. Cada sistema incluye uno o más componentes proteicos y uno o más componentes de ácido nucleico que juntos se dirigen a ácidos nucleicos. (Traducción automática con Google Translate, sin valor legal)

Description

DESCRIPCIÓN
Sistemas y enzimas novedosos de direccionamiento a ADN de CRISPR
Campo de la invención
La presente divulgación se refiere a sistemas, a métodos y a composiciones usados para el control de la expresión génica que implica la selección como diana de secuencias y la edición de ácidos nucleicos, que usa sistemas de vector relacionados con repeticiones palindrómicas cortas agrupadas y regularmente interespaciadas (CRISPR) y componentes de las mismas.
Antecedentes
La aplicación reciente de los avances en las tecnologías y el análisis de la secuenciación del genoma ha producido conocimientos significativos sobre la base genética de las actividades biológicas en muchas áreas diversas de la naturaleza, que van desde las rutas de biosíntesis procariotas hasta las patologías humanas. Para comprender y evaluar completamente la gran cantidad de información producida por las tecnologías de secuenciación genética, se necesitan aumentos equivalentes en la escala, la eficacia y la facilidad de las tecnologías para la manipulación del genoma y el epigenoma. Estas tecnologías novedosas de ingeniería del genoma y el epigenoma acelerarán el desarrollo de aplicaciones novedosas en numerosas áreas, incluyendo la biotecnología, la agricultura y la terapéutica humana.
Actualmente se sabe que las repeticiones palindrómicas cortas agrupadas y regularmente interespaciadas (CRISPR) y los genes asociados a CRISPR (Cas), conocidos conjuntamente como sistemas de CRISPR-Cas o CRISPR/Cas, proporcionan inmunidad a bacterias y arqueas frente a la infección por fagos. Los sistemas de CRISPR-Cas de la inmunidad adaptativa procariota son un grupo extremadamente diverso de proteínas efectoras, elementos no codificantes, así como arquitecturas de loci, algunos ejemplos de los cuales se han diseñado por ingeniería genética y adaptado para producir biotecnologías importantes.
Los componentes del sistema implicados en la defensa del huésped incluyen una o más proteínas efectoras capaces de modificar el ADN o el ARN y un elemento guía de ARN que es responsable de dirigir estas actividades proteicas a una secuencia específica en el ADN o ARN del fago. La guía de ARN está compuesta por un ARN de CRISPR (ARNcr) y puede requerir un ARN transactivador adicional (ARNtracr) para permitir la manipulación del ácido nucleico seleccionado como diana por la(s) proteína(s) efectora(s). El ARNcr consiste en una repetición directa responsable de la unión de la proteína al ARNcr y una secuencia espaciadora que es complementaria a la secuencia diana de ácido nucleico deseada. Los sistemas de CRISPR pueden reprogramarse para seleccionar como diana dianas de ADN o ARN alternativas modificando la secuencia espaciadora del ARNcr.
Los sistemas de CRISPR-Cas pueden clasificarse en términos amplios en dos clases: los sistemas de clase 1 se componen de múltiples proteínas efectoras que juntas forman un complejo alrededor de un ARNcr, y los sistemas de clase 2 consisten en una única proteína efectora que forma complejos con la guía de ARN para seleccionar como diana sustratos de ADN o ARN. La composición de efectores de una sola subunidad de los sistemas de clase 2 proporciona un conjunto de componentes más simple para la ingeniería genética y su traducción en aplicaciones, y hasta ahora ha sido una fuente importante de efectores programables. Por tanto, el descubrimiento, la ingeniería y la optimización de sistemas de clase 2 novedosos pueden conducir a tecnologías programables potentes y generalizadas para la ingeniería del genoma y más allá.
Los sistemas de CRISPR-Cas son sistemas inmunitarios adaptativos en arqueas y bacterias que defienden a las especies contra elementos genéticos extraños. La caracterización y la ingeniería de los sistemas de CRISPR-Cas de clase 2, ejemplificados por CRISPR-Cas9, han allanado el camino para una amplia gama de aplicaciones biotecnológicas en la edición del genoma y más allá. Sin embargo, sigue existiendo la necesidad de sistemas y efectores programables adicionales para modificar ácidos nucleicos y polinucleótidos (es decir, ADN, ARN o cualquier híbrido, derivado o modificación) más allá de los sistemas de CRISPR-Cas actuales que permitan novedosas aplicaciones a través de sus propiedades únicas.
Los documentos WO 2017/127807 y WO 2018/035250 se refieren a sistemas de CRISPR-Cas de tipo V que comprenden un ARN guía y una proteína efectora de CRISPR-Cas. La cita o identificación de cualquier documento en esta solicitud no es una admisión de que tal documento esté disponible como técnica anterior a la presente invención.
Sumario
El objeto de la invención es tal como se define en las reivindicaciones adjuntas.
Esta divulgación proporciona sistemas y composiciones diseñados por ingeniería genética que no se producen de manera natural para nuevos sistemas de CRISPR-Cas de clase 2 de un solo efector, junto con métodos para la identificación computacional a partir de bases de datos genómicas, el desarrollo de los loci naturales en un sistema diseñado por ingeniería genética y la validación experimental y su traducción en aplicaciones. Estos nuevos efectores tienen una secuencia divergente a los ortólogos y homólogos de efectores de CRISPR de clase 2 existentes, y tienen también organizaciones de dominios únicas. Proporcionan características adicionales que incluyen, pero no se limitan a, 1) novedosas propiedades de edición de ADN/ARN y mecanismos de control, 2) tamaño más pequeño para una mayor versatilidad en estrategias de administración, 3) procesos celulares desencadenados por el genotipo tales como muerte celular y 4) inserción, escisión y movilización de ADN programables guiadas por ARN. La adición de los nuevos sistemas de selección como diana de ADN descritos en el presente documento al conjunto de herramientas de técnicas para la manipulación del genoma y el epigenoma permite amplias aplicaciones para alteraciones programadas específicas.
En general, esta divulgación se refiere a nuevos sistemas de CRISPR-Cas que incluyen enzimas recién descubiertas y otros componentes usados para crear sistemas mínimos que pueden usarse en entornos no naturales, por ejemplo, en bacterias distintas de aquellas en las que se descubrió inicialmente el sistema.
En un aspecto, la invención proporciona un sistema asociado a repeticiones palindrómicas cortas agrupadas y regularmente interespaciadas (CRISPR) (Cas) que no se produce de manera natural que comprende:
(a) una guía de ARN o un ácido nucleico que codifica para la guía de ARN, en el que la guía de ARN comprende una secuencia de repetición directa y una secuencia espaciadora; y
(b) una proteína efectora de CRISPR-Cas o un ácido nucleico que codifica para la proteína efectora, en el que la proteína efectora comprende una secuencia de aminoácidos con una identidad de al menos el 95 % con s Eq ID NO: 5, SEQ ID NO: 14 o SEQ ID NO: 16,
en el que la proteína efectora de CRISPR-Cas se une a la guía de ARN, y en el que la secuencia espaciadora se une a un ácido nucleico diana, y en el que el ácido nucleico diana es ADN.
En otro aspecto, la invención proporciona una célula que comprende el sistema de la invención.
En otro aspecto, la invención proporciona un método in vitro o ex vivo para modificar una molécula de ADN, comprendiendo el método poner en contacto la molécula de ADN con un sistema de la invención.
En otro aspecto, la invención proporciona un método in vitro o ex vivo para seleccionar como diana un ácido nucleico diana, comprendiendo el método poner en contacto el ácido nucleico diana con un sistema de la invención, en el que el ácido nucleico diana es ADN.
Además, se dan a conocer sistemas de CRISPR-Cas diseñados por ingeniería genética que no se producen de manera natural que incluyen: i) una o más guías de ARN de tipo V-I (CLUST.029130) o uno o más ácidos nucleicos que codifican para las una o más guías de ARN de tipo V-I, en los que una guía de ARN de tipo V-I incluye o consiste en una secuencia de repetición directa y una secuencia espaciadora que puede hibridarse con un ácido nucleico diana; y ii) una proteína efectora de CRISPR-Cas de tipo V-I (CLUST.029130) o un ácido nucleico que codifica para la proteína efectora de CRISPR-Cas de tipo V-I, en los que la proteína efectora de CRISPR-Cas de tipo V-I puede unirse a una guía de ARN de tipo V-I y dirigir la secuencia de ácido nucleico diana complementaria a la secuencia espaciadora, en los que el ácido nucleico diana es un ADN. Tal como se usa en el presente documento, las proteínas efectoras de CRISPR-Cas de tipo V-I (CLUST.029130) también se denominan proteínas efectoras Cas12i, y estos dos términos se usan indistintamente en esta divulgación.
En algunas realizaciones de cualquiera de los sistemas descritos en el presente documento, la proteína efectora de CRISPR-Cas de tipo V-I tiene aproximadamente 1100 aminoácidos o menos de longitud (excluyendo cualquier secuencia de aminoácidos señal o etiqueta peptídica fusionada con la misma) e incluye al menos un dominio RuvC. En algunas realizaciones, ninguno, uno o más de los dominios RuvC están catalíticamente inactivados. En algunas realizaciones, la proteína efectora de CRISPR-Cas de tipo V-I incluye o consiste en la secuencia de aminoácidos X1SHX4DX6X7 (SEQ ID NO: 200), en la que X1 es S o T, X4 es Q o L, X6 es P o S, y X7 es F o L.
En algunas realizaciones, la proteína efectora de CRISPR-Cas de tipo V-I incluye o consiste en la secuencia de aminoácidos X1XDXNX6X7XXXX11 (SEQ ID NO: 201), en la que X1 es A o G o S, X es cualquier aminoácido, X6 es Q o I, X7 es T o S o V, y X10 es T o A. En algunas realizaciones, la proteína efectora de CRISPR-Cas de tipo V-I incluye o consiste en la secuencia de aminoácidos X1X2X3E (SEQ ID NO: 210), en la que X1 es C o F o I o L o M o P o V o W o Y, X2 C o F o I o L o M o P o R o V o W o Y, y X3 C o F o G o I o L o M o P o V o W o Y.
En algunas realizaciones, la proteína efectora de CRISPR-Cas de tipo V-I incluye más de una secuencia del conjunto de SEQ ID NO: 200, SEQ ID NO: 201 y SEQ ID NO: 210. En algunas divulgaciones, la proteína efectora de CRISPR-Cas de tipo V-I incluye o consiste en una secuencia de aminoácidos que es al menos el 80 % (por ejemplo, el 81 %, el 82 %, el 83 %, el 84 %, el 85 %, el 86 %, el 87 %, el 88 %, el 89 %, el 90 %, el 91 %, el 92 %, el 93 %, el 94 %, el 95 %, el 96 %, el 97 %, el 98 %, el 99 % o el 100 %) idéntica a una secuencia de aminoácidos proporcionada en la tabla 4 (por ejemplo, SEQ ID NO: 1-5 y 11-18).
En algunas realizaciones de cualquiera de los sistemas descritos en el presente documento, la proteína efectora de CRISPR-Cas de tipo V-I incluye o consiste en una secuencia de aminoácidos que es al menos el 80 % (por ejemplo, el 81 %, el 82 %, el 83 %, el 84 %, el 85 %, el 86 %, el 87 %, el 88 %, el 89 %, el 90 %, el 91 %, el 92 %, el 93 %, el 94 %, el 95 %, el 96 %, el 97 %, el 98 %, el 99 % o el 100 %) idéntica a la secuencia de aminoácidos de Cas12i2 (SEQ ID NO: 5). En algunas realizaciones, la proteína efectora de CRISPR-Cas de tipo V-I es Cas12i2 (SEQ ID NO: 5). Además, se da a conocer la proteína efectora de CRISPR-Cas de tipo V-I Cas12i1 (SEQ ID NO: 3).
En algunas realizaciones, la proteína efectora de CRISPR-Cas de tipo V-I puede reconocer un motivo adyacente al protoespaciador (PAM), y el ácido nucleico diana incluye o consiste en un PAM que incluye o que consiste en la secuencia de ácido nucleico 5'-TTN-3' o 5'-TTH-3' o 5'-TTY-3' o 5'-TTC-3'.
En algunas realizaciones de cualquiera de los sistemas descritos en el presente documento, la proteína efectora de CRISPR-Cas de tipo V-I incluye una o más sustituciones de aminoácido dentro de al menos uno de los dominios RuvC. En algunas divulgaciones, la una o más sustituciones de aminoácido incluyen una sustitución, por ejemplo, una sustitución de alanina, en un residuo de aminoácido correspondiente a D647 o E894 o D948 de SEQ ID NO: 3. En algunas realizaciones, la una o más sustituciones de aminoácido incluyen una sustitución de alanina en un residuo de aminoácido correspondiente a D599 o E833 o D886 de SEQ ID NO: 5. En algunas realizaciones, la una o más sustituciones de aminoácido dan como resultado una reducción de la actividad nucleasa de la proteína efectora de CRISPR-Cas de tipo V-I en comparación con la actividad nucleasa de la proteína efectora de CRISPR-Cas de tipo V-I sin la una o más sustituciones de aminoácido.
En algunas realizaciones de cualquiera de los sistemas descritos en el presente documento, la guía de ARN de tipo V-I incluye una secuencia de repetición directa que incluye una estructura de tallo-bucle proximal al extremo 3' (inmediatamente adyacente a la secuencia espaciadora). En algunas realizaciones, la repetición directa de la guía de ARN de tipo V-I incluye un tallo-bucle proximal al extremo 3', en la que el tallo tiene 5 nucleótidos de longitud. En algunas realizaciones, la repetición directa de la guía de ARN de tipo V-I incluye un tallo-bucle proximal al extremo 3', en la que el tallo tiene 5 nucleótidos de longitud y el bucle tiene 7 nucleótidos de longitud. En algunas realizaciones, la repetición directa de la guía de ARN de tipo V-I incluye un tallo-bucle proximal al extremo 3', en la que el tallo tiene 5 nucleótidos de longitud y el bucle tiene 6, 7 u 8 nucleótidos de longitud.
En algunas realizaciones, la repetición directa de la guía de ARN de tipo V-I incluye la secuencia 5'-CCGUCNNNNNNUGACGG-3' (SEQ ID NO: 202) proximal al extremo 3', en la que N se refiere a cualquier base nitrogenada. En algunas realizaciones, la repetición directa de la guía de ARN de tipo V-I incluye la secuencia 5'-GUGCCNNNNNNUGGCAC-3' (SEQ ID NO: 203) proximal al extremo 3', en la que N se refiere a cualquier base nitrogenada.
En algunas realizaciones, la repetición directa de la guía de ARN de tipo V-I incluye la secuencia 5'-GUGUCN5-6UGACAX1-3 ' (SEQ ID NO: 204) proximal al extremo 3', en la que N5-6 se refiere a una secuencia contigua de 5 ó 6 bases nitrogenadas cualesquiera, y X1 se refiere a C o T o U. En algunas realizaciones, la repetición directa de la guía de ARN de tipo V-I incluye la secuencia 5'-UCX3UXsX6X7UUGACGG-3' (SEQ ID NO: 205) proximal al extremo 3', en la que X3 se refiere a C o T o U, X5 se refiere a A o T o U, X6 se refiere a A o C o G, y X7 se refiere a A o G. En algunas realizaciones, la repetición directa de la guía de ARN de tipo V-I incluye la secuencia 5'-CCX3X4X5CX7UUGGCAC-3' (SEQ ID NO: 206) proximal al extremo 3', en la que X3 se refiere a C o T o U, X4 se refiere a A o T o U, X5 se refiere a C o T o U, y X7 se refiere a A o G.
En algunas realizaciones, la guía de ARN de tipo V-I incluye una secuencia de repetición directa que incluye o que consiste en una secuencia de nucleótidos que es al menos el 80 % idéntica, por ejemplo, el 85 %, el 90 %, el 91 %, el 92 %, el 93 %, el 94 %, el 95 %, el 96 %, el 97 %, el 98 %, el 99 % o el 100 % idéntica, a una secuencia de nucleótidos proporcionada en la tabla 5A (por ejemplo, SEQ ID NO: 6-19 y 19-24).
En algunas realizaciones, la guía de ARN de tipo V-I incluye o consiste en una secuencia de nucleótidos o subsecuencia de la misma proporcionada en la tabla 5B (por ejemplo, SEQ ID NO: 150-163). En algunas realizaciones, la guía de ARN de tipo V-I incluye o consiste en una secuencia de nucleótidos construida por la concatenación de una secuencia de repetición directa, espaciador, repetición directa en la que la secuencia de repetición directa se proporciona en la tabla 5A y la longitud del espaciador se proporciona en la columna de longitud del espaciador 1 en la tabla 5B. En algunas realizaciones, la guía de ARN de tipo V-I incluye o consiste en una secuencia de nucleótidos construida por la concatenación de una secuencia de repetición directa, espaciador, repetición directa en la que la secuencia de repetición directa se proporciona en la tabla 5A y la longitud del espaciador se proporciona en la columna de longitud del espaciador 2 en la tabla 5B. En algunas realizaciones, la guía de a Rn de tipo V-I incluye o consiste en una secuencia de nucleótidos construida por la concatenación de una secuencia de repetición directa, espaciador, repetición directa en la que la secuencia de repetición directa se proporciona en la tabla 5A y la longitud del espaciador se proporciona en la columna de longitud del espaciador 3 en la tabla 5B.
En algunas realizaciones de cualquiera de los sistemas descritos en el presente documento, la secuencia espaciadora de la guía de ARN de tipo V-I incluye o consiste en entre aproximadamente 15 y aproximadamente 34 nucleótidos (por ejemplo, 16, 17, 18, 19, 20, 21 ó 22 nucleótidos). En algunas realizaciones de cualquiera de los sistemas descritos en el presente documento, el espaciador tiene entre 17 nucleótidos y 31 nucleótidos de longitud.
En algunas realizaciones de cualquiera de los sistemas proporcionados en el presente documento, el ácido nucleico diana es un ADN. En algunas realizaciones de cualquiera de los sistemas descritos en el presente documento, el ácido nucleico diana incluye un motivo adyacente al protoespaciador (PAM), por ejemplo, un PAM que incluye o que consiste en la secuencia de ácido nucleico 5'-TTN-3' o 5'-TTH-3' o 5'-TTY-3' o 5'-TTC-3'. En determinadas realizaciones de cualquiera de los sistemas proporcionados en el presente documento, la selección como diana del ácido nucleico diana por la proteína efectora de CRISPR-Cas de tipo V-I y la guía de ARN da como resultado una modificación (por ejemplo, un evento de escisión monocatenaria o bicatenaria) en el ácido nucleico diana. En algunas realizaciones, la modificación es un evento de deleción. En algunas realizaciones, la modificación es un evento de inserción. En algunas realizaciones, la modificación da como resultado toxicidad celular y/o muerte celular.
En algunas realizaciones, la proteína efectora de CRISPR-Cas de tipo V-I tiene actividad nucleasa no específica (es decir, “colateral”) (por ejemplo, ADNasa). En determinadas realizaciones de cualquiera de los sistemas proporcionados en el presente documento, el sistema incluye además un ácido nucleico molde donador (por ejemplo, un ADN o un ARN).
En algunas realizaciones de cualquiera de los sistemas proporcionados en el presente documento, el sistema está dentro de una célula (por ejemplo, una célula eucariota (por ejemplo, una célula de mamífero) o una célula procariota (por ejemplo, una célula bacteriana)).
En otro aspecto, la divulgación proporciona métodos para seleccionar como diana y editar un ácido nucleico diana, en los que los métodos incluyen poner en contacto el ácido nucleico diana con cualquiera de los sistemas descritos en el presente documento. Estos pueden llevarse a cabo como métodos ex vivo o in vitro. En algunas realizaciones, los métodos descritos en el presente documento no modifican la identidad genética de la línea germinal de un ser humano.
En otros aspectos, la divulgación proporciona métodos para dirigir la inserción de un ácido nucleico de carga útil en un sitio de un ácido nucleico diana, en los que los métodos incluyen poner en contacto el ácido nucleico diana con cualquiera de los sistemas descritos en el presente documento.
En aún otro aspecto, la divulgación proporciona métodos para dirigir la escisión de un ácido nucleico de carga útil desde un sitio en un ácido nucleico diana, en los que los métodos incluyen poner en contacto el ácido nucleico diana con cualquiera de los sistemas descritos en el presente documento.
En otro aspecto, la divulgación proporciona métodos para seleccionar como diana y mellar una cadena no diana (cadena complementaria no espaciadora) de un ADN diana bicatenario tras el reconocimiento de una cadena diana (cadena complementaria espaciadora) del ADN diana bicatenario. El método incluye poner en contacto el ADN diana bicatenario con cualquiera de los sistemas descritos en el presente documento.
En aún otro aspecto, la divulgación proporciona métodos para seleccionar como diana y escindir un ADN diana bicatenario, incluyendo el método poner en contacto el ADN diana bicatenario con cualquiera de los sistemas descritos en el presente documento.
En algunas realizaciones de los métodos para seleccionar como diana y escindir un ADN diana bicatenario, una cadena no diana (cadena complementaria no espaciadora) del ADN diana bicatenario se mella antes de que se melle una cadena diana (cadena complementaria espaciadora) del ácido nucleico diana bicatenario.
En aún otro aspecto, la divulgación proporciona métodos para editar específicamente un ácido nucleico bicatenario, incluyendo los métodos: poner en contacto (a) una proteína efectora de tipo V-I y otra enzima con actividad de mellado específica de secuencia; (b) una guía de ARN de tipo V-I que guía la proteína efectora de tipo V-I para mellar la cadena opuesta en relación con la actividad de la otra nickasa específica de secuencia; y (c) el ácido nucleico bicatenario, en los que el método da como resultado una probabilidad reducida de modificación inespecífica.
En algunas realizaciones, la proteína efectora de tipo V-I incluye además una secuencia de ligador. En algunas realizaciones, la proteína efectora de tipo V-I incluye una o más mutaciones o sustituciones de aminoácido que hacen que la proteína asociada a CRISPR no pueda escindir el ADN.
En aún otro aspecto, la divulgación proporciona métodos para la edición de bases de un ácido nucleico bicatenario, incluyendo el método: poner en contacto (a) una proteína de fusión que comprende una proteína efectora de tipo V-I y un dominio de proteína con actividad de modificación de ADN (por ejemplo, desaminación de citidina); (b) una guía de ARN de tipo V-I que selecciona como diana el ácido nucleico bicatenario, y (c) el ácido nucleico bicatenario. El efector de tipo V-I de la proteína de fusión puede modificarse para mellar la cadena no diana del ácido nucleico bicatenario. En algunas realizaciones, el efector de tipo V-I de la proteína de fusión puede modificarse para ser deficiente en nucleasa. zzz
En otro aspecto, la divulgación proporciona métodos para modificar una molécula de ADN, incluyendo los métodos poner en contacto la molécula de ADN con un sistema descrito en el presente documento.
En algunas realizaciones de cualquiera de los métodos descritos en el presente documento (y composiciones para su uso en tales métodos), la célula es una célula eucariota. En algunas realizaciones, la célula es una célula animal. En algunas realizaciones, la célula es una célula cancerosa (por ejemplo, una célula tumoral). En algunas realizaciones, la célula es una célula de agente infeccioso o una célula infectada con un agente infeccioso. En algunas realizaciones, la célula es una célula bacteriana, una célula infectada con un virus, una célula infectada con un prión, una célula fúngica, un protozoo o una célula parasitaria.
En otro aspecto, la divulgación proporciona métodos de tratamiento de una afección o enfermedad en un sujeto que lo necesita y composiciones para su uso en tales métodos. Los métodos incluyen administrar al sujeto un sistema descrito en el presente documento, en los que la secuencia espaciadora es complementaria a al menos 15 nucleótidos de un ácido nucleico diana asociado con la afección o enfermedad, en los que la proteína efectora de CRISPR-Cas de tipo V-I se asocia con la guía de ARN para formar un complejo, en los que el complejo se une a una secuencia de ácido nucleico diana que es complementaria a los al menos 15 nucleótidos de la secuencia espaciadora, y en los que, tras la unión del complejo a la secuencia de ácido nucleico diana, la proteína efectora de CRISPR-Cas de tipo V-I escinde o silencia el ácido nucleico diana, tratando de ese modo la afección o enfermedad en el sujeto.
En algunas realizaciones de los métodos descritos en el presente documento (y composiciones para su uso en tales métodos), la afección o enfermedad es un cáncer o una enfermedad infecciosa. En algunas realizaciones, la afección o enfermedad es cáncer, en la que el cáncer se selecciona del grupo que consiste en tumor de Wilms, sarcoma de Ewing, un tumor neuroendocrino, un glioblastoma, un neuroblastoma, un melanoma, cáncer de piel, cáncer de mama, cáncer de colon, cáncer rectal, cáncer de próstata, cáncer de hígado, cáncer renal, cáncer pancreático, cáncer de pulmón, cáncer biliar, cáncer de cuello uterino, cáncer de endometrio, cáncer de esófago, cáncer gástrico, cáncer de cabeza y cuello, carcinoma medular de tiroides, cáncer de ovario, glioma, linfoma, leucemia, mieloma, leucemia linfoblástica aguda, leucemia mielógena aguda, leucemia linfocítica crónica, leucemia mielógena crónica, linfoma de Hodgkin, linfoma no Hodgkin y cáncer de vejiga urinaria.
En algunas realizaciones, la proteína efectora de tipo V-I incluye o consiste en al menos una señal de localización nuclear (NLS) (por ejemplo, dos, tres, cuatro, cinco, seis o más). En algunas realizaciones, la proteína efectora de tipo V-I incluye o consiste en al menos una señal de exportación nuclear (NES) (por ejemplo, dos, tres, cuatro, cinco, seis o más). En algunas realizaciones, la proteína efectora de tipo V-I incluye al menos una NLS (por ejemplo, dos, tres, cuatro, cinco, seis o más) y al menos una NES (por ejemplo, dos, tres, cuatro, cinco, seis o más).
En algunas realizaciones, los sistemas descritos en el presente documento incluyen un ácido nucleico que codifica para una o más guías de ARN. En algunas realizaciones, el ácido nucleico que codifica para la una o más guías de ARN está operativamente unido a un promotor (por ejemplo, un promotor constitutivo o un promotor inducible).
En algunas realizaciones, los sistemas descritos en el presente documento incluyen un ácido nucleico que codifica para un ácido nucleico diana (por ejemplo, un ADN diana). En algunas realizaciones, el ácido nucleico que codifica para el ácido nucleico diana está operativamente unido a un promotor (por ejemplo, un promotor constitutivo o un promotor inducible).
En algunas realizaciones, los sistemas descritos en el presente documento incluyen un ácido nucleico que codifica para una proteína efectora de CRISPR-Cas de tipo V-I en un vector. En algunas realizaciones, el sistema incluye además uno o más ácidos nucleicos que codifican para una guía de ARN presente en el vector.
En algunas realizaciones, los vectores incluidos en los sistemas son vectores virales (por ejemplo, vectores retrovirales, vectores lentivirales, vectores adenovirales, vectores adenoasociados y vectores de herpes simple. En algunas realizaciones, los vectores incluidos en el sistema son vectores de fago.
En algunas realizaciones, los sistemas proporcionados en el presente documento están en un sistema de administración. En algunas realizaciones, el sistema de administración es una nanopartícula, un liposoma, un exosoma, una microvesícula y un cañón de genes.
La divulgación también proporciona una célula (por ejemplo, una célula eucariota o una célula procariota (por ejemplo, una célula bacteriana)) que comprende un sistema descrito en el presente documento. En algunas realizaciones, la célula eucariota es una célula de mamífero (por ejemplo, una célula humana) o una célula vegetal. La divulgación también proporciona modelos animales (por ejemplo, modelos de roedor, conejo, perro, mono o simio) y modelos vegetales que incluyen las células. En algunas realizaciones, los métodos se usan para tratar a un sujeto, por ejemplo, un mamífero, tal como un paciente humano. El sujeto mamífero puede ser también un mamífero domesticado, tal como un perro, un gato, un caballo, un mono, un conejo, una rata, un ratón, una vaca, una cabra o una oveja.
En aún otro aspecto, la divulgación proporciona métodos para detectar un ácido nucleico diana (por ejemplo, ADN o ARN) en una muestra, incluyendo los métodos: (a) poner en contacto la muestra con un sistema proporcionado en el presente documento y un ácido nucleico indicador marcado, en los que la hibridación del ARNcr con el ácido nucleico diana provoca la escisión del ácido nucleico indicador marcado; y (b) medir una señal detectable producida por la escisión del ácido nucleico indicador marcado, detectando de ese modo la presencia del ácido nucleico diana en la muestra.
En algunas realizaciones, los métodos para detectar un ácido nucleico diana pueden incluir también comparar un nivel de la señal detectable con un nivel de señal de referencia, y determinar una cantidad de ácido nucleico diana en la muestra basándose en el nivel de la señal detectable.
En algunas realizaciones, la medición se realiza usando detección de nanopartículas de oro, polarización de fluorescencia, dispersión/transición de fase coloidal, detección electroquímica o detección basada en semiconductores.
En algunas realizaciones, el ácido nucleico indicador marcado puede incluir un par de colorantes emisores de fluorescencia, un par de transferencia de energía por resonancia de fluorescencia (FRET) o un par de extintor/fluoróforo, en el que la escisión del ácido nucleico indicador marcado por la proteína efectora da como resultado un aumento o una disminución de la cantidad de señal producida por el ácido nucleico indicador marcado.
Volviendo a otro aspecto, la divulgación incluye métodos para modificar un ADN diana, que incluyen poner en contacto el ADN diana con un complejo que comprende una proteína efectora Cas12i y una guía de ARN de tipo V-I diseñada por ingeniería genética, que se diseña para hibridarse con (por ejemplo, es al menos el 70 %, el 75 %, el 80 %, el 85 %, el 90 %, el 95 %, el 96 %, el 97 %, el 98 %, el 99 % o el 100 % complementaria a) una secuencia diana del ADN diana, y el sistema se distingue por (a) la falta de un ARNtracr en el sistema, y (b) la proteína efectora Cas12i y la guía de ARN de tipo V-I forman un complejo que se asocia con el ADN diana, modificando de ese modo el ADN diana.
En determinadas realizaciones, modificar el ADN diana incluye escindir al menos una cadena del ADN diana (por ejemplo, crear una “mella” o rotura monocatenaria o crear una rotura bicatenaria). Alternativa o adicionalmente, la modificación del ADN diana incluye o bien (i) la unión al ADN diana, impidiendo de ese modo que el ADN diana se asocie con otra biomolécula u otro complejo, o bien (ii) el desenrollado de una porción del ADN diana. En algunos casos, el ADN diana incluye una secuencia de motivo adyacente al protoespaciador (PAM) que es reconocida por la proteína efectora Cas12i, tal como 5'-TTN-3' o 5'-TTH-3' o 5'-TTY-3' o 5'-TTC-3'. La proteína efectora Cas12 es, en determinadas realizaciones, una proteína efectora Cas12i1 o una proteína efectora Cas12i2.
Continuando con este aspecto de la divulgación, en determinadas realizaciones, el contacto del ADN diana con el complejo se produce en una célula, por ejemplo, (a) poniendo en contacto la célula con el complejo, complejo que se forma in vitro, o (b) poniendo en contacto la célula con uno o más ácidos nucleicos que codifican para la proteína efectora Cas12i y la guía de ARN de tipo V-I, que luego los expresa la célula y que forman el complejo dentro de la célula. En algunos casos, la célula es una célula procariota; en otros casos, es una célula eucariota. En otro aspecto, esta divulgación se refiere a métodos para alterar un ADN diana, que incluyen poner en contacto el ADN diana dentro de la célula con un sistema de edición del genoma que incluye una proteína Cas12i y una guía de ARN de tipo V-I (por ejemplo, un ARNcr, un ARN guía o una estructura similar, que comprende opcionalmente una o más modificaciones de nucleótidos, bases nitrogenadas o estructura principal) que comprende una secuencia espaciadora de 15-24 nucleótidos que tiene una complementariedad de al menos el 70 %, el 75 %, el 80 %, el 85 %, el 90 %, el 91 %, el 92 %, el 93 %, el 94 %, el 95 %, el 96 %, el 97 %, el 98 %, el 99 % o el 100 % con una secuencia en el ADN diana, pero cuyo sistema no comprende ningún ARNtracr. En diversas realizaciones, la proteína Cas12i incluye o consiste en una secuencia de aminoácidos que tiene una identidad de secuencia de al menos el 95 %, por ejemplo, el 96 %, el 97 %, el 98 %, el 99 % o el 100 %, con SEQ ID NO: 3 y la guía de ARN de tipo V-I comprende una secuencia de repetición directa con una identidad de secuencia de al menos el 95 %, por ejemplo, el 96 %, el 97 %, el 98 %, el 99 % o el 100 %, con una de SEQ ID NO: 7 ó 24; o la proteína Cas12i incluye o consiste en una secuencia de aminoácidos que tiene una identidad de secuencia de al menos el 95 %, por ejemplo, el 96 %, el 97 %, el 98 %, el 99 % o el 100 %, con SEQ ID NO: 5 y la guía de ARN de tipo V-I comprende una secuencia de repetición directa con una identidad de secuencia de al menos el 95 % por ejemplo, el 96 %, el 97 %, el 98 %, el 99 % o el 100 %, con una de SEQ ID NO: 9 ó 10. El ADN diana es opcionalmente un ADN celular, y el contacto se produce opcionalmente dentro de una célula tal como una célula procariota o una célula eucariota (por ejemplo, una célula de mamífero, una célula vegetal o una célula humana).
En algunas realizaciones, la proteína efectora de CRISPR-Cas de tipo V-I comprende una secuencia de aminoácidos que tiene una identidad de secuencia de al menos el 90 %, o al menos el 95 %, con una de SEQ ID NO: 1-5 u 11-18. Según determinadas realizaciones, la proteína efectora de CRISPR-Cas de tipo V-I comprende una secuencia de aminoácidos dada por SEQ ID NO: 3, o una secuencia de aminoácidos dada por SEQ ID NO: 5. La longitud total de la proteína efectora de CRISPR-Cas según determinadas realizaciones tiene menos de 1100 aminoácidos, excluyendo cualquier secuencia señal de aminoácidos o etiqueta peptídica fusionada con la misma. En algunos casos, la proteína efectora de CRISPR-Cas comprende una sustitución de aminoácido, por ejemplo, una sustitución en un residuo de aminoácido correspondiente a D647, E894 o D948 de SEQ ID NO: 3 o una sustitución en un residuo de aminoácido correspondiente a D599, E833 o D886 de SEQ ID NO: 5. La sustitución es opcionalmente una alanina.
En aún otro aspecto, esta divulgación se refiere a sistemas de CRISPR-Cas diseñados por ingeniería genética que no se producen de manera natural, que incluyen o que consisten en una proteína efectora Cas12i y una guía de ARN de tipo V-I diseñada por ingeniería genética (por ejemplo, un ARNcr, un ARN guía o una estructura similar, que incluye opcionalmente una o más modificaciones de nucleótidos, bases nitrogenadas o estructura principal) que tiene una secuencia espaciadora de 15-34 nucleótidos que es al menos el 80 %, por ejemplo, el 85 %, el 90 %, el 91 %, el 92 %, el 93 %, el 94 %, el 95 %, el 96 %, el 97 %, el 98 %, el 99 % o el 100 %, complementaria a una secuencia diana. Los sistemas no incluyen ningún ARNtracr, y la proteína efectora Cas12i y la guía de ARN de tipo V-I forman un complejo que se asocia con la secuencia diana. En algunos casos, el complejo de la proteína efectora Cas12i y la guía de ARN de tipo V-I provoca la escisión de al menos una cadena de un ADN que comprende la secuencia diana. La secuencia diana puede incluir una secuencia de motivo adyacente al protoespaciador (PAM) reconocida por la proteína efectora Cas12i, cuya secuencia de PAM es opcionalmente 5'-TTN-3', 5'-TTY-3' o 5'-TTH-3' o 5'-TTC-3'. La guía de ARN de tipo V-I puede incluir una secuencia de repetición directa que tiene una identidad de secuencia de al menos el 95 %, por ejemplo, el 96 %, el 97 %, el 98 %, el 99 % o el 100 %, con una de SEQ ID NO: 7, 9, 10, 24, 100 ó 101.
En determinadas realizaciones, la proteína efectora Cas12i comprende una secuencia de aminoácidos que tiene una identidad de secuencia de al menos el 95 % con SEQ ID NO: 3 y la secuencia de repetición directa tiene una identidad de secuencia de al menos el 95 % con SEQ ID NO: 100, o la proteína efectora Cas12i comprende una secuencia de aminoácidos que tiene una identidad de secuencia de al menos el 95 % con SEQ ID NO: 5 y la secuencia de repetición directa tiene una identidad de secuencia de al menos el 95 % con SEQ ID NO: 101. Alternativa o adicionalmente, la proteína efectora Cas12i comprende una sustitución de aminoácido (opcionalmente, una sustitución de alanina) seleccionada del grupo que consiste en (a) una sustitución en un residuo de aminoácido correspondiente a D647, E894 o D948 de SEQ ID NO: 3; y (b) una sustitución en un residuo de aminoácido correspondiente a D599, E833 o D886 de SEQ ID NO: 5.
En todavía otro aspecto, esta divulgación se refiere a una composición que comprende uno o más ácidos nucleicos que codifican para un sistema de CRISPR-Cas (o un sistema de edición del genoma) según uno de los aspectos de la divulgación. Y en otro aspecto, la divulgación se refiere a un vector viral que codifica para un sistema de CRISPR-Cas (o un sistema de edición del genoma) según uno de los aspectos de la divulgación.
La divulgación también incluye métodos para seleccionar como diana y mellar una cadena complementaria no espaciadora de un ADN diana bicatenario tras el reconocimiento de una cadena complementaria espaciadora del a Dn diana bicatenario, comprendiendo el método poner en contacto el ADN diana bicatenario con cualquiera de los sistemas descritos en el presente documento.
En otro aspecto, la divulgación incluye métodos para seleccionar como diana y escindir un ADN diana bicatenario, comprendiendo el método poner en contacto el ADN diana bicatenario con un sistema tal como se describe en el presente documento. En estos métodos, una cadena complementaria no espaciadora del ADN diana bicatenario se mella antes de que se melle una cadena complementaria espaciadora del ácido nucleico diana bicatenario.
En otras realizaciones, la divulgación incluye métodos para detectar un ácido nucleico diana en una muestra, comprendiendo el método: (a) poner en contacto la muestra con un sistema tal como se describe en el presente documento y un ácido nucleico indicador marcado, en el que la hibridación del ARNcr con el ácido nucleico diana provoca la escisión del ácido nucleico indicador marcado; y (b) medir una señal detectable producida por la escisión del ácido nucleico indicador marcado, detectando de ese modo la presencia del ácido nucleico diana en la muestra. Estos métodos pueden incluir además comparar un nivel de la señal detectable con un nivel de señal de referencia, y determinar una cantidad de ácido nucleico diana en la muestra basándose en el nivel de la señal detectable. En algunas realizaciones, la medición se realiza usando detección de nanopartículas de oro, polarización de fluorescencia, dispersión/transición de fase coloidal, detección electroquímica o detección basada en semiconductores. En algunas realizaciones, el ácido nucleico indicador marcado comprende un par de colorantes emisores de fluorescencia, un par de transferencia de energía por resonancia de fluorescencia (FRET) o un par de extintor/fluoróforo, en el que la escisión del ácido nucleico indicador marcado por la proteína efectora da como resultado un aumento o una disminución de la cantidad de señal producida por el ácido nucleico indicador marcado.
En otro aspecto, los métodos en el presente documento incluyen editar específicamente un ácido nucleico bicatenario, comprendiendo el método poner en contacto, en condiciones suficientes y durante un periodo de tiempo suficiente, (a) un efector de CRISPR-Cas de tipo V-I y otra enzima con actividad de mellado específica de secuencia, y un ARNcr que guía el efector de CRISPR-Cas de tipo V-I para mellar la cadena opuesta en relación con la actividad de la otra nickasa específica de secuencia; y (b) el ácido nucleico bicatenario; en el que el método da como resultado la formación de una rotura bicatenaria.
Otro aspecto incluye métodos para editar un ácido nucleico bicatenario, comprendiendo el método poner en contacto, en condiciones suficientes y durante un periodo de tiempo suficiente, (a) una proteína de fusión que comprende un efector de CRISPR-Cas de tipo V-I y un dominio de proteína con actividad de modificación de ADN y una guía de ARN que selecciona como diana el ácido nucleico bicatenario; y (b) el ácido nucleico bicatenario; en el que el efector de CRISPR-Cas de tipo V-I de la proteína de fusión se modifica para mellar una cadena no diana del ácido nucleico bicatenario.
Otro aspecto incluye métodos para inducir latencia o muerte celular específica de estado transcripcional o específica de genotipo en una célula, comprendiendo el método poner en contacto una célula, por ejemplo, una célula procariota o eucariota, con cualquier sistema dado a conocer en el presente documento, en el que la guía de ARN que se hibrida con el ADN diana provoca una latencia o muerte celular mediada por actividad ADNasa colateral. Por ejemplo, la célula puede ser una célula de mamífero, por ejemplo, una célula cancerosa. La célula puede ser una célula infecciosa o una célula infectada con un agente infeccioso, por ejemplo, una célula infectada con un virus, una célula infectada con un prión, una célula fúngica, un protozoo o una célula parasitaria.
En otro aspecto, la divulgación proporciona métodos para tratar una afección o enfermedad en un sujeto que lo necesita, comprendiendo el método administrar al sujeto cualquiera de los sistemas descritos en el presente documento, en el que la secuencia espaciadora es complementaria a al menos 15 nucleótidos de un ácido nucleico diana asociado con la afección o enfermedad; en el que la proteína efectora de CRISPR-Cas de tipo V-I se asocia con la guía de ARN para formar un complejo; en el que el complejo se une a una secuencia de ácido nucleico diana que es complementaria a los al menos 15 nucleótidos de la secuencia espaciadora; y en el que, tras la unión del complejo a la secuencia de ácido nucleico diana, la proteína efectora de CRISPR-Cas de tipo V-I escinde el ácido nucleico diana, tratando de ese modo la afección o enfermedad en el sujeto. Por ejemplo, la afección o enfermedad puede ser un cáncer o una enfermedad infecciosa. Por ejemplo, la afección o enfermedad puede ser cáncer, y en la que el cáncer se selecciona del grupo que consiste en tumor de Wilms, sarcoma de Ewing, un tumor neuroendocrino, un glioblastoma, un neuroblastoma, un melanoma, cáncer de piel, cáncer de mama, cáncer de colon, cáncer rectal, cáncer de próstata, cáncer de hígado, cáncer renal, cáncer pancreático, cáncer de pulmón, cáncer biliar, cáncer de cuello uterino, cáncer de endometrio, cáncer de esófago, cáncer gástrico, cáncer de cabeza y cuello, carcinoma medular de tiroides, cáncer de ovario, glioma, linfoma, leucemia, mieloma, leucemia linfoblástica aguda, leucemia mielógena aguda, leucemia linfocítica crónica, leucemia mielógena crónica, linfoma de Hodgkin, linfoma no Hodgkin o cáncer de vejiga urinaria.
La divulgación también incluye los sistemas o las células tal como se describen en el presente documento para su uso como medicamento, o para su uso en el tratamiento o la prevención de un cáncer o una enfermedad infecciosa, por ejemplo, en los que el cáncer se selecciona del grupo que consiste en tumor de Wilms, sarcoma de Ewing, un tumor neuroendocrino, un glioblastoma, un neuroblastoma, un melanoma, cáncer de piel, cáncer de mama, cáncer de colon, cáncer rectal, cáncer de próstata, cáncer de hígado, cáncer renal, cáncer pancreático, cáncer de pulmón, cáncer biliar, cáncer de cuello uterino, cáncer de endometrio, cáncer de esófago, cáncer gástrico, cáncer de cabeza y cuello, carcinoma medular de tiroides, cáncer de ovario, glioma, linfoma, leucemia, mieloma, leucemia linfoblástica aguda, leucemia mielógena aguda, leucemia linfocítica crónica, leucemia mielógena crónica, linfoma de Hodgkin, linfoma no Hodgkin o cáncer de vejiga urinaria.
La divulgación también proporciona el uso de los sistemas o las células tal como se describen en el presente documento en métodos in vitro o ex vivo para:
a) seleccionar como diana y editar un ácido nucleico diana;
b) degradar de manera no específica ADN monocatenario tras el reconocimiento de un ácido nucleico diana de ADN;
c) seleccionar como diana y mellar una cadena complementaria no espadadora de un ADN diana bicatenario tras el reconocimiento de una cadena complementaria espadadora del ADN diana bicatenario;
d) seleccionar como diana y escindir un ADN diana bicatenario;
e) detectar un ácido nucleico diana en una muestra;
f) editar específicamente un ácido nucleico bicatenario;
g) realizar edición de bases a un ácido nucleico bicatenario;
h) inducir latencia o muerte celular específica de estado transcripcional o específica de genotipo en una célula. i) crear una indel en un ADN diana bicatenario;
j) insertar una secuencia en un ADN diana bicatenario, o
k) delecionar o invertir una secuencia en un ADN diana bicatenario.
En otro aspecto, la divulgación proporciona el uso de los sistemas o las células descritos en el presente documento en métodos para:
a) seleccionar como diana y editar un ácido nucleico diana;
b) degradar de manera no específica ADN monocatenario tras el reconocimiento de un ácido nucleico diana de ADN;
c) seleccionar como diana y mellar una cadena complementaria no espaciadora de un ADN diana bicatenario tras el reconocimiento de una cadena complementaria espaciadora del ADN diana bicatenario;
d) seleccionar como diana y escindir un ADN diana bicatenario;
e) detectar un ácido nucleico diana en una muestra;
f) editar específicamente un ácido nucleico bicatenario;
g) realizar edición de bases a un ácido nucleico bicatenario;
h) inducir latencia o muerte celular específica de estado transcripcional o específica de genotipo en una célula; i) crear una indel en un ADN diana bicatenario;
j) insertar una secuencia en un ADN diana bicatenario, o
k) delecionar o invertir una secuencia en un ADN diana bicatenario,
en los que el método no comprende ningún procedimiento para modificar la identidad genética de la línea germinal de un ser humano y no comprende ningún método de tratamiento del cuerpo humano o animal.
En los métodos descritos en el presente documento, escindir el ADN diana o ácido nucleico diana da como resultado la formación de una indel, o en los que escindir el ADN diana o ácido nucleico diana da como resultado la inserción de una secuencia de ácido nucleico, o en los que escindir el ADN diana o ácido nucleico diana comprende escindir el ADN diana o ácido nucleico diana en dos sitios, y da como resultado la deleción o inversión de una secuencia entre los dos sitios.
Los diversos sistemas descritos en el presente documento pueden carecer de un ARNtracr. En algunas realizaciones, la proteína efectora de CRISPR-Cas de tipo V-I y la guía de ARN de tipo V-I forman un complejo que se asocia con el ácido nucleico diana, modificando de ese modo el ácido nucleico diana.
En algunas realizaciones de los sistemas descritos en el presente documento, la secuencia espaciadora tiene entre 15 y 47 nucleótidos de longitud, por ejemplo, entre 20 y 40 nucleótidos de longitud, o entre 24 y 38 nucleótidos de longitud.
En otro aspecto, la divulgación proporciona células eucariotas, por ejemplo, células de mamífero, por ejemplo, células humanas, que comprenden un locus diana modificado de interés, en las que el locus diana de interés se ha modificado según un método o a través del uso de una composición de una cualquiera de las reivindicaciones anteriores. Por ejemplo, la modificación del locus diana de interés puede dar como resultado:
(i) que la célula eucariota comprenda una expresión alterada de al menos un producto génico;
(ii) que la célula eucariota comprenda una expresión alterada de al menos un producto génico, en la que se aumenta la expresión del al menos un producto génico;
(iii) que la célula eucariota comprenda una expresión alterada de al menos un producto génico, en la que se disminuye la expresión del al menos un producto génico; o
(iv) que la célula eucariota comprenda un genoma editado.
En otro aspecto, la divulgación proporciona una línea de células eucariotas de, o que comprende, las células eucariotas descritas en el presente documento, o la progenie de las mismas, o un organismo multicelular que comprende una o más células eucariotas descritas en el presente documento.
La divulgación también proporciona modelos vegetales o animales que comprenden una o más células tal como se describen en el presente documento.
En otro aspecto, la divulgación proporciona métodos para producir una planta, que tiene un rasgo modificado de interés codificado por un gen de interés, comprendiendo el método poner en contacto una célula vegetal con cualquiera de los sistemas descritos en el presente documento, o bien modificando o bien introduciendo de ese modo dicho gen de interés, y regenerar una planta a partir de la célula vegetal.
La divulgación también proporciona métodos para identificar un rasgo de interés en una planta, en los que el rasgo de interés está codificado por un gen de interés, comprendiendo el método poner en contacto una célula vegetal con cualquiera de los sistemas descritos en el presente documento, identificando de ese modo el gen de interés. Por ejemplo, el método puede comprender además introducir el gen de interés identificado en una célula vegetal o una línea de células vegetales o un germoplasma vegetal y generar una planta a partir de los mismos, mediante lo cual la planta contiene el gen de interés. El método puede incluir que la planta muestre el rasgo de interés.
La divulgación también incluye métodos para seleccionar como diana y escindir un ADN monocatenario diana, comprendiendo el método poner en contacto el ácido nucleico diana con cualquiera de los sistemas descritos en el presente documento. Los métodos pueden incluir que la afección o enfermedad sea infecciosa, y en los que el agente infeccioso se selecciona del grupo que consiste en virus de la inmunodeficiencia humana (VIH), virus del herpes simple 1 (VHS1) y virus del herpes simple 2 (VHS2).
En algunos de los métodos descritos en el presente documento, ambas cadenas de ADN diana pueden escindirse en sitios diferentes, dando como resultado un corte escalonado. En otras realizaciones, ambas cadenas de ADN diana se escinden en el mismo sitio, dando como resultado una rotura bicatenaria (DSB) roma. En algunos de los métodos terapéuticos descritos en el presente documento, la afección o enfermedad se selecciona del grupo que consiste en fibrosis quística, distrofia muscular de Duchenne, distrofia muscular de Becker, deficiencia de alfa-1-antitripsina, enfermedad de Pompe, distrofia miotónica, enfermedad de Huntington, síndrome del cromosoma X frágil, ataxia de Friedreich, esclerosis lateral amiotrófica, demencia frontotemporal, enfermedad renal crónica hereditaria, hiperlipidemia, hipercolesterolemia, amaurosis congénita de Leber, enfermedad drepanocítica y beta-talasemia.
El término “evento de escisión”, tal como se usa en el presente documento, se refiere a una rotura de ADN en un ácido nucleico diana creada por una nucleasa de un sistema de CRISPR descrito en el presente documento. En algunas realizaciones, el evento de escisión es una rotura de ADN bicatenario. En algunas realizaciones, el evento de escisión es una rotura de ADN monocatenario.
El término “sistema de CRISPR-Cas”, “sistema de CRISPR-Cas de tipo V-I” o “sistema de tipo V-I”, tal como se usa en el presente documento, se refiere a una proteína efectora de CRISPR-Cas de tipo V-I (es decir, proteína efectora Cas12i) y a una o más guías de ARN de tipo V-I, y/o a ácidos nucleicos que codifican para la proteína efectora de CRISPR-Cas de tipo V-I o para las una o más guías de ARN de tipo V-I, y opcionalmente promotores unidos operativamente a la expresión del efector de CRISPR o a la guía de ARN o a ambos.
El término “matriz de CRISPR”, tal como se usa en el presente documento, se refiere al segmento de ácido nucleico (por ejemplo, ADN) que incluye espaciadores y repeticiones de CRISPR, comenzando con el primer nucleótido de la primera repetición de CRISPR y terminando con el último nucleótido de la última repetición de CRISPR (terminal). Normalmente, cada espaciador en una matriz de CRISPR se ubica entre dos repeticiones.
Los términos “repetición de CRISPR” o “repetición directa de CRISPR” o “repetición directa”, tal como se usan en el presente documento, se refieren a múltiples secuencias de repetición directa cortas, que muestran muy poca o ninguna variación de secuencia dentro de una matriz de CRISPR. Adecuadamente, una repetición directa de tipo V-I puede formar una estructura de tallo-bucle.
Una “estructura de tallo-bucle” se refiere a un ácido nucleico que tiene una estructura secundaria que incluye una región de nucleótidos que se sabe o se predice que forman una doble cadena (porción de tallo) que está unida en un lado por una región de nucleótidos predominantemente monocatenarios (porción de bucle). Los términos estructuras de “horquilla” y “plegable hacia atrás” también se usan en el presente documento para referirse a estructuras de tallo-bucle. Tales estructuras se conocen bien en la técnica y estos términos se usan consecuentemente con sus significados conocidos en la técnica. Tal como se conoce en la técnica, una estructura de tallo-bucle no requiere un apareamiento de bases exacto. Por tanto, el tallo puede incluir uno o más apareamientos erróneos de bases. Alternativamente, el apareamiento de bases puede ser exacto, es decir no incluye ningún apareamiento erróneo. Las estructuras de tallo-bucle predichas de algunas repeticiones directas de tipo V-I se ilustran en la figura 3. El tallo para la repetición directa de tipo V-I contenida dentro de la guía de ARN está compuesto por 5 bases nitrogenadas complementarias que se hibridan entre sí, y el bucle tiene 6, 7 ó 9 nucleótidos de longitud.
El término “ARN de CRISPR” o “ARNcr”, tal como se usa en el presente documento, se refiere a una molécula de ARN que comprende una secuencia guía usada por un efector de CRISPR para seleccionar como diana una secuencia de ácido nucleico específica. Normalmente, los ARNcr contienen una secuencia espaciadora que media en el reconocimiento de la diana, y una secuencia de repetición directa (denominada en el presente documento secuencia de repetición directa o “DR”) que forma un complejo con una proteína efectora de CRISPR-Cas.
El término “ácido nucleico molde donador”, tal como se usa en el presente documento, se refiere a una molécula de ácido nucleico que pueden usar una o más proteínas celulares para alterar la estructura de un ácido nucleico diana después de que una enzima CRISPR descrita en el presente documento haya alterado un ácido nucleico diana. En algunas realizaciones, el ácido nucleico molde donador es un ácido nucleico bicatenario. En algunas realizaciones, el ácido nucleico molde donador es un ácido nucleico monocatenario. En algunas realizaciones, el ácido nucleico molde donador es lineal. En algunas realizaciones, el ácido nucleico molde donador es circular (por ejemplo, un plásmido). En algunas realizaciones, el ácido nucleico molde donador es una molécula de ácido nucleico exógeno. En algunas realizaciones, el ácido nucleico molde donador es una molécula de ácido nucleico endógeno (por ejemplo, un cromosoma).
El término “efector de CRISPR-Cas”, “efector de CRISPR”, “efector”, “proteína asociada a CRISPR” o “enzima CRISPR”, “proteína efectora de CRISPR-Cas de tipo V-I”, “efector de CRISPR-Cas de tipo V-I”, “efector de tipo V-I” o “proteína efectora Cas12i”, tal como se usa en el presente documento, se refiere a una proteína que lleva a cabo una actividad enzimática o que se une a un sitio diana en un ácido nucleico especificado por una guía de ARN. Una proteína efectora de CRISPR-Cas de tipo V-I asociada dentro de un sistema de CRISPR-Cas de tipo V-I también puede denominarse en el presente documento “Cas12i” o “enzima Cas12i”. Una enzima Cas12i puede reconocer un motivo corto asociado en las proximidades de un ADN diana denominado motivo adyacente al protoespaciador (PAM). Adecuadamente, una enzima Cas12i de la presente divulgación puede reconocer un PAM que comprende o que consiste en TTN, en el que N indica cualquier nucleótido. Por ejemplo, el PAM puede ser TTN, TTH, TTY o TTC.
En algunas realizaciones, una proteína efectora de CRISPR-Cas de tipo V-I tiene actividad endonucleasa, actividad nickasa y/o actividad exonucleasa.
Los términos “complejo de efector de CRISPR”, “complejo efector”, “complejo binario” o “complejo de vigilancia”, tal como se usan en el presente documento, se refieren a un complejo que contiene una proteína efectora de CRISPR-Cas de tipo V-I y una guía de ARN de tipo V-I.
El término “guía de ARN”, tal como se usa en el presente documento, se refiere a cualquier molécula de ARN que facilita el direccionamiento de una proteína descrita en el presente documento a un ácido nucleico diana. Las “guías de ARN” a modo de ejemplo incluyen, pero no se limitan a, ARNcr, pre-ARNcr (por ejemplo DR-espaciador-DR) y ARNcr maduros (por ejemplo, DR_maduro-espaciador, DR_maduro-espaciador-DR_maduro). Tal como se usa en el presente documento, el término “selección como diana” se refiere a la capacidad de un complejo que incluye una proteína asociada a CRISPR y una guía de ARN, tal como un ARNcr, para unirse preferente o específicamente a, por ejemplo, hibridarse con, un ácido nucleico diana específico en comparación con otros ácidos nucleicos que no tienen la misma secuencia o una similar que el ácido nucleico diana.
Tal como se usa en el presente documento, el término “ácido nucleico diana” se refiere a un sustrato de ácido nucleico específico que contiene una secuencia de ácido nucleico complementaria a la totalidad o una parte del espaciador en una guía de ARN. En algunas realizaciones, el ácido nucleico diana comprende un gen o una secuencia dentro de un gen. En algunas realizaciones, el ácido nucleico diana comprende una región no codificante (por ejemplo, un promotor). En algunas realizaciones, el ácido nucleico diana es monocatenario. En algunas realizaciones, el ácido nucleico diana es bicatenario.
Los términos “complejo de CRISPR activado”, “complejo activado” o “complejo ternario”, tal como se usan en el presente documento, se refieren a un complejo de efector de CRISPR después de que se haya unido a o haya modificado un ácido nucleico diana.
Los términos “ARN colateral” o “ADN colateral”, tal como se usan en el presente documento, se refieren a un sustrato de ácido nucleico que se escinde de manera no específica por un complejo de CRISPR activado.
El término “actividad ADNasa colateral”, tal como se usa en el presente documento en referencia a una enzima CRISPR, se refiere a la actividad ADNasa no específica de un complejo de CRISPR activado.
A menos que se defina de otro modo, todos los términos técnicos y científicos usados en el presente documento tienen el mismo significado que entiende habitualmente un experto en la técnica a la que pertenece esta invención. Aunque pueden usarse métodos y materiales similares o equivalentes a los descritos en el presente documento en la práctica o las pruebas de la presente invención, a continuación se describen métodos y materiales adecuados. Además, los materiales, métodos y ejemplos son sólo ilustrativos y no se pretende que sean limitativos.
Otras características y ventajas de la invención resultarán evidentes a partir de la siguiente descripción detallada y a partir de las reivindicaciones.
Breve descripción de las figuras
Las figuras incluyen una serie de esquemas y secuencias de ácidos nucleicos y aminoácidos que representan los resultados del análisis de locus de diversas agrupaciones de proteínas.
Las figuras 1A y 1B juntas representan un árbol de clasificación de efectores de tipo V (proteínas Cas12). La organización de loci de CRISPR-Cas correspondiente se muestra para cada rama, con la necesidad de un ARNtracr representado por un rectángulo blanco adyacente a una matriz de CRISPR. Los sistemas CLUST.029130 (tipo V-I) se representan como Cas12i.
La figura 2A es una representación esquemática de los dominios funcionales del efector CLUST.029130 (tipo V­ I), denominado Cas12i. El sombreado gris sólido indica la ubicación del dominio RuvC C-terminal, con los residuos catalíticos en los tres motivos de secuencia conservados (I, II y III) indicados y mostrados a escala. La ubicación del dominio de hélice puente se indica con el superíndice h.
La figura 2B es una representación esquemática de una alineación de secuencias múltiples de proteínas efectoras Cas12i, con las ubicaciones relativas de los residuos catalíticos conservados del dominio RuvC indicadas por RuvC I/II/III.
La figura 3 es un grupo de diagramas esquemáticos que muestran la estructura secundaria predicha del transcrito de ARN de ejemplos de secuencias de repetición directa de tipo V-1.
La figura 4A es una representación esquemática del diseño de cribado in vivo de plásmidos efectores y no codificantes. Se diseñaron bibliotecas de matrices de CRISPR que incluyen espaciadores no repetitivos muestreados uniformemente de ambas cadenas de pACYC184 o genes esenciales de E. coli flanqueados por dos DR y expresados por J23119.
La figura 4B es una representación esquemática del flujo de trabajo de cribado de selección negativa; 1) se clonaron bibliotecas de matrices de CRISPR en el plásmido efector, 2) el plásmido efector y, cuando estaba presente, el plásmido no codificante, se transformaron en E. coli seguido de un crecimiento para la selección negativa de matrices de CRISPR que confieren interferencia contra transcritos de ADN o ARN de pACYC184 o genes esenciales de E. coli, 3) se usó secuenciación dirigida del plásmido efector para identificar matrices de CRISPR agotadas y se usó secuenciación de ARN pequeño para identificar ARNcr maduro y ARNtracr.
Las figuras 5A-B y las figuras 5C-D son representaciones gráficas que muestran la densidad de dianas agotadas y no agotadas para Cas12i1 y Cas12i2, respectivamente. Se representan en gráficos independientes espaciadores fuertemente agotados que seleccionan como diana tanto genes esenciales de E. coli como pACYC184. Las dianas en la cadena superior y la cadena inferior se muestran por separado, y en relación con la orientación de los genes anotados.
Las figuras 6A y 6B son gráficos de dispersión que muestran el efecto de mutar el residuo catalítico de RuvC-I aspartato (en la ubicación 647 para Cas12i1 y 599 para Cas12i2) a alanina. Cada punto representa un espaciador, y el valor indica el agotamiento en veces en las condiciones especificadas para el eje (tipo natural frente a mutante). Los valores más altos indican un agotamiento más fuerte (es decir, menos colonias supervivientes).
Las figuras 7A y 7B son gráficos de dispersión que muestran el efecto de añadir o eliminar las secuencias no codificantes en el sistema de CRISPR-Cas de tipo V-I que está cribándose. Cada punto representa un espaciador, y el valor indica el agotamiento en veces en las condiciones especificadas para el eje (tipo natural frente a mutante). Los valores más altos indican un agotamiento más fuerte (es decir, menos colonias supervivientes).
Las figuras 8A y 8B son mapas térmicos de los resultados de cribado globales para Cas12i1 y Cas12i2, respectivamente. El mapa térmico se descompone en dependencias tales como la orientación de la repetición directa, la necesidad de secuencia no codificante, así como el requisito del dominio RuvC intacto (en el que dCas12i se refiere a una mutación puntual en un residuo catalíticamente activo del dominio RuvC-I). El eje Y descompone las dianas de la biblioteca en las características constituyentes de seleccionar como diana pACYC184, genes esenciales de E. coli (E. coli EG) o la cualidad de estar en forma de cadenas ("strandedness") de la selección como diana (S, sentido; AS, antisentido). Se ejecutaron cribados in vivo de Cas12i1 y Cas12i2 en cepas de células competentes Endura Stbl3 y E. cloni®, respectivamente. Las matrices de CRISPR fuertemente agotadas en controles negativos sin efectores Cas12i1 o Cas12i2 se restan de los análisis respectivos.
Las figuras 9A y 9B son logotipos web de motivos PAM en 5' identificados a partir de secuencias que flanquean dianas para espaciadores fuertemente agotados a partir de cribados in vivo de Cas12i1 y Cas12i2, respectivamente.
Las figuras 10A y 10B son gráficos de violín de puntuaciones de bits para todas las permutaciones posibles de nucleótidos diana y flanqueantes, que confirman que cada una de Casl2i1 y Cas12i2 tienen preferencia por sólo un único motivo pAm de 2 nt en las posiciones 2a y 3a en el sentido de 5' de las dianas espaciadoras.
Las figuras 11A y 11B representan el mapeo de lectura de la secuenciación de ARN pequeño de muestras de cribado in vivo de los sistemas Cas12i mínimos, que revelan el ARNcr maduro de sistemas Cas12i1 y Cas12i2, respectivamente.
La figura 12 es un gel desnaturalizante que muestra el procesamiento de pre-ARNcr por proteína efectora Cas12i1. Procesamiento independiente de magnesio de pre-ARNcr expresado por Cas12i1 a partir de una matriz de CRISPR mínima (repetición-espaciador-repetición-espaciador-repetición) con una repetición de 24 nt y un espaciador de 28 nt. Se incubó pre-ARNcr con Cas12i1 durante 30 minutos a 37 °C y se analizó en un gel de TBE-urea al 15 %.
La figura 13 es una representación de un gel que muestra la manipulación de ADNmc no diana (derecha) o diana (izquierda) marcado con colorante IR800 mediante dosis crecientes de complejo binario de Cas12i1. Las muestras se analizaron mediante electroforesis en gel desnaturalizante de TBE-urea al 15 %.
La figura 14 es una representación de un gel que muestra la manipulación de ADNmc colateral marcado con colorante IR800 (sin similitud de secuencia con la diana) en presencia de ADNmc no diana (derecha) o diana (izquierda) no marcado mediante dosis crecientes de complejo binario de Cas12i1. Las muestras se analizaron mediante electroforesis en gel desnaturalizante de TBE-urea al 15 %.
La figura 15 es una representación de un gel que muestra la manipulación de ADNbc no diana (derecha) o diana (izquierda) marcado con colorante IR800 mediante dosis crecientes de complejo binario de Cas12i1. Las muestras se analizaron mediante electroforesis en gel desnaturalizante de TBE-urea al 15 %.
La figura 16 es una representación de un gel que muestra la manipulación de ADNbc diana marcado con colorante IR800 mediante dosis crecientes de complejo binario de Cas12i1 y extinguido directamente (izquierda) 0 tratado con nucleasa S1 antes de la extinción (derecha). Las muestras se analizaron mediante electroforesis en gel no desnaturalizante de TBE al 4-20 %.
Las figuras 17A y 17B son representaciones de geles que muestran la eficiencia de escisión asimétrica de la cadena diana (complementaria espaciadora; "SC”) frente a la cadena no diana (complementaria no espaciadora; "NSC”) de ADNbc. La figura 17A es un gel desnaturalizante del que se obtuvieron imágenes mediante IR800 (sólo ADN marcado), mientras que la figura 17B es un gel desnaturalizante del que se obtuvieron imágenes mediante tinte SYBR (ADN total). Cada gel representa la actividad de escisión o mellado en ADNbc con cadena NSC marcada con IR800 en 5' (izquierda) o cadena SC marcada con IR800 en 5' (derecha), con concentraciones crecientes de complejo binario de Cas12i1. El complejo binario de Cas12i1 se formó incubando previamente Cas12i1 con pre-ARNcr durante 10 minutos a 37 °C antes de la adición a los sustratos y la incubación durante 1 hora a 37 °C.
La figura 18A es una representación esquemática del diseño de un ensayo in vitro para detectar el silenciamiento génico. En una reacción en un solo recipiente (representada por el límite exterior), moldes de ADN lineal que codifican para el efector Cas12i, la guía de ARN y el factor sigma 28 se combinan con un reactivo de IVTT (transcripción y traducción in vitro) reconstituido y enzima nuclear de ARN polimerasa de E. coli (indicada por RNAPc). Se incluye un plásmido de ADN que codifica para GFP seleccionado como diana por la guía de a Rn , ya que es un molde de ADN lineal no diana que expresa RFP como control interno. Tanto GFP como RFP se expresan a partir del promotor de factor sigma 28 (fliC), y la fluorescencia de GFP y RFP se mide cada 5 minutos durante hasta 12 horas.
La figura 18B es una representación esquemática del diseño del plásmido que codifica para GFP usando como sustrato en el ensayo de silenciamiento génico in vitro. El plásmido codifica para GFP bajo el promotor sig28, y se diseñan guías de ARN diseñadas por ingeniería genética para seleccionar como diana tanto las cadenas de la región promotora como el gen de GFP (indicado por cheurones cortos en ambas orientaciones).
Las figuras 19A y 19B son gráficos que muestra el agotamiento en veces de la fluorescencia de GFP (eje y) a lo largo de 12 horas (720 minutos, eje x) con el efector de tipo V-I tal como se indica en un complejo con una guía que contiene una secuencia complementaria a la cadena molde (figura 19A) y la cadena codificante (figura 19B) de la región codificante de GFP del sustrato. El agotamiento en veces de la fluorescencia de GFP se calcula como la razón de la fluorescencia de GFP normalizada con el efector de tipo V-1 en un complejo con una guía de ARN no diana con respecto a la del efector de tipo V-I en un complejo con una guía de a Rn que selecciona como diana GFP. Cas12i1 (línea continua) muestra un mayor agotamiento (silenciamiento génico) en comparación con la actividad de cada una de las formas mutantes Cas12i1 D647A o Cas12i1 E894A o Cas12i1 D948A.
La figura 20 muestra las diferentes formas de proteína y/o ARN en la reconstitución in vitro del sistema de CRISPR-Cas usado en el cribado agrupado in vitro. Las direcciones transcripcionales se indican por la orientación de la flecha de promotor T7.
La figura 21 muestra una realización de los sustratos de ADNmc y ADNbc para el cribado agrupado in vitro. La secuencia diana está flanqueada por 6 bases degeneradas (“N”) tanto en el lado en 5' como en el lado en 3', que son adyacentes a una región común usada como marca fiduciaria para el posterior análisis de datos tras la secuenciación de última generación. En el sustrato de ADNbc, la síntesis de la segunda cadena se completa usando un relleno de ADN polimerasa I después de hibridar un cebador con la marca fiduciaria en 3'.
La figura 22 muestra un esquema de la preparación de biblioteca de secuenciación unidireccional de los fragmentos de ADNmc posteriores a la incubación con el sistema de CRISPR-Cas reconstituido.
La figura 23 muestra un esquema de la preparación de biblioteca de secuenciación bidireccional posible con los fragmentos de ADNbc posteriores a la incubación con los sistemas de CRISPR-Cas reconstituidos. El adaptador de secuenciación puede ligarse a ambos fragmentos cortados, y luego seleccionarse para usar una combinación de cebadores comunes al adaptador y comunes al sustrato de ADNbc.
Las figuras 24A-B muestran las formas de los productos de longitud completa y escindidos capturados por la preparación de biblioteca de secuenciación de última generación y la lectura usando A) adaptador de ligación I5/P5 y fiduciario en 3' para la amplificación dirigida y la adición de I7/P7, o B) adaptador de ligación I7/P7 y fiduciario en 5' para la amplificación dirigida y la adición de I5/P5.
Las figuras 25A-B muestra un esquema para A) el mapeo de longitud de diana de ADNmc y B) el mapeo de longitud de sustrato, respectivamente.
Las figuras 26A-B muestran la distribución de longitudes de sustrato de ADNbc para Cas12i1 expresada por IVTT en un complejo con un ARNcr de cadena superior (orientación activa) que selecciona como diana ADNbc (rojo) frente a controles de Apo (sólo efector) (azul). (A) Se prepararon bibliotecas de secuenciación de última generación para la lectura con un primer cebador complementario a un asidero ligado al extremo 5' del sustrato de longitud completa o escindido (y que contiene secuencias de I5/P5) y un segundo cebador complementario a la secuencia fiduciaria en 3' del sustrato (y que contiene secuencias de I7/P7). (B) Se prepararon bibliotecas de secuenciación de última generación para la lectura con un primer cebador complementario a la secuencia fiduciaria en 5' del sustrato (y que contiene secuencias de I5/P5) y un segundo cebador complementario a un asidero ligado al extremo 3' del sustrato de longitud completa o escindido (y que contiene secuencias de I7/P7). Las figuras 27A-B muestran la distribución de longitudes de diana de ADNbc para Cas12i1 expresada por IVTT en un complejo con un ARNcr de cadena superior (orientación activa) que selecciona como diana ADNbc (rojo) frente a controles de Apo (sólo efector) (azul). (A) Se prepararon bibliotecas de secuenciación de última generación para la lectura con un primer cebador complementario a un asidero ligado al extremo 5' del sustrato de longitud completa o escindido (y que contiene secuencias de I5/P5) y un segundo cebador complementario a la secuencia fiduciaria en 3' del sustrato (y que contiene secuencias de I7/P7). (B) Se prepararon bibliotecas de secuenciación de última generación para la lectura con un primer cebador complementario a la secuencia fiduciaria en 5' del sustrato (y que contiene secuencias de I5/P5) y un segundo cebador complementario a un asidero ligado al extremo 3' del sustrato de longitud completa o escindido (y que contiene secuencias de I7/P7).
Las figuras 28A-B muestran la distribución de longitudes de sustrato de ADNbc (X) frente a longitudes de diana (Y) para Cas12i1 expresada por IVTT en un complejo con un ARNcr de cadena superior (orientación activa) que selecciona como diana ADNbc (rojo) frente a controles de Apo (sólo efector) (azul). (A) Se prepararon bibliotecas de secuenciación de última generación para la lectura con un primer cebador complementario a un asidero ligado al extremo 5' del sustrato de longitud completa o escindido (y que contiene secuencias de I5/P5) y un segundo cebador complementario a la secuencia fiduciaria en 3' del sustrato (y que contiene secuencias de I7/P7). (B) Se prepararon bibliotecas de secuenciación de última generación para la lectura con un primer cebador complementario a la secuencia fiduciaria en 5' del sustrato (y que contiene secuencias de I5/P5) y un segundo cebador complementario a un asidero ligado al extremo 3' del sustrato de longitud completa o escindido (y que contiene secuencias de I7/P7).
La figura 29 muestra un logotipo web que indica un motivo PAM TTN en 5' (izquierda de la secuencia diana) para Cas12i1 asociado con la escisión de la cadena no diana entre los 24/+25 nucleótidos en relación con el PAM. No se observa ningún requisito de secuencia de PAM en el lado derecho de la diana Cas12i1.
La figura 30 muestra una proyección en 3' de 5 nt asociada con la escisión de ADN bicatenario por Cas12i1 indicada mediante la escisión observada entre los 24/+25 nucleótidos de la cadena no diana en relación con el PAM y la escisión entre los 19/+20 nucleótidos de la cadena diana en relación con el PAM.
Las figuras 31A-B muestran la distribución de longitudes de sustrato de ADNbc para Cas12i1 expresada por IVTT en un complejo con un ARNcr no diana (rojo) frente a controles de Apo (efector sólo) (azul). (A) Se prepararon bibliotecas de secuenciación de última generación para la lectura con un primer cebador complementario a un asidero ligado al extremo 5' del sustrato de longitud completa o escindido (y que contiene secuencias de I5/P5) y un segundo cebador complementario a la secuencia fiduciaria en 3' del sustrato (y que contiene secuencias de I7/P7). (B) Se prepararon bibliotecas de secuenciación de última generación para la lectura con un primer cebador complementario a la secuencia fiduciaria en 5' del sustrato (y que contiene secuencias de I5/P5) y un segundo cebador complementario a un asidero ligado al extremo 3' del sustrato de longitud completa o escindido (y que contiene secuencias de I7/P7).
Las figuras 32A-B muestran la distribución de longitudes de sustrato de ADNbc para Cas12i1 expresada por IVTT en un complejo con un ARNcr de cadena inferior (orientación inactiva) que selecciona como diana ADNbc (rojo) frente a controles de Apo (efector sólo) (azul). (A) Se prepararon bibliotecas de secuenciación de última generación para la lectura con un primer cebador complementario a un asidero ligado al extremo 5' del sustrato de longitud completa o escindido (y que contiene secuencias de I5/P5) y un segundo cebador complementario a la secuencia fiduciaria en 3' del sustrato (y que contiene secuencias de I7/P7). (B) Se prepararon bibliotecas de secuenciación de última generación para la lectura con un primer cebador complementario a la secuencia fiduciaria en 5' del sustrato (y que contiene secuencias de I5/P5) y un segundo cebador complementario a un asidero ligado al extremo 3' del sustrato de longitud completa o escindido (y que contiene secuencias de I7/P7).
Las figuras 33A-B muestran la distribución de longitudes de sustrato de ADNbc para Cas12i2 expresada por IVTT en un complejo con un ARNcr de cadena superior (orientación activa) que selecciona como diana ADNbc (rojo) frente a controles de Apo (efector sólo) (azul). (A) Se prepararon bibliotecas de secuenciación de última generación para la lectura con un primer cebador complementario a un asidero ligado al extremo 5' del sustrato de longitud completa o escindido (y que contiene secuencias de I5/P5) y un segundo cebador complementario a la secuencia fiduciaria en 3' del sustrato (y que contiene secuencias de I7/P7). (B) Se prepararon bibliotecas de secuenciación de última generación para la lectura con un primer cebador complementario a la secuencia fiduciaria en 5' del sustrato (y que contiene secuencias de I5/P5) y un segundo cebador complementario a un asidero ligado al extremo 3' del sustrato de longitud completa o escindido (y que contiene secuencias de I7/P7).
Las figuras 34A-B muestran la distribución de longitudes de diana de ADNbc para Cas12i2 expresada por IVTT en un complejo con un ARNcr de cadena superior (orientación activa) que selecciona como diana ADNbc (rojo) frente a controles de Apo (efector sólo) (azul). (A) Se prepararon bibliotecas de secuenciación de última generación para la lectura con un primer cebador complementario a un asidero ligado al extremo 5' del sustrato de longitud completa o escindido (y que contiene secuencias de I5/P5) y un segundo cebador complementario a la secuencia fiduciaria en 3' del sustrato (y que contiene secuencias de I7/P7). (B) Se prepararon bibliotecas de secuenciación de última generación para la lectura con un primer cebador complementario a la secuencia fiduciaria en 5' del sustrato (y que contiene secuencias de I5/P5) y un segundo cebador complementario a un asidero ligado al extremo 3' del sustrato de longitud completa o escindido (y que contiene secuencias de I7/P7).
Las figuras 35A-B muestran la distribución de longitudes de sustrato de ADNbc (X) frente a longitudes de diana (Y) para Cas12i2 expresada por IVTT en un complejo con un ARNcr de cadena superior (orientación activa) que selecciona como diana ADNbc (rojo) frente a controles de Apo (efector sólo) (azul). (A) Se prepararon bibliotecas de secuenciación de última generación para la lectura con un primer cebador complementario a un asidero ligado al extremo 5' del sustrato de longitud completa o escindido (y que contiene secuencias de I5/P5) y un segundo cebador complementario a la secuencia fiduciaria en 3' del sustrato (y que contiene secuencias de I7/P7). (B) Se prepararon bibliotecas de secuenciación de última generación para la lectura con un primer cebador complementario a la secuencia fiduciaria en 5' del sustrato (y que contiene secuencias de I5/P5) y un segundo cebador complementario a un asidero ligado al extremo 3' del sustrato de longitud completa o escindido (y que contiene secuencias de I7/P7).
La figura 36 muestra un logotipo web que indica un motivo PAM TTN en 5' (izquierda de la secuencia diana) para Cas12i2 asociado con la escisión de la cadena no diana entre los 24/+25 nucleótidos en relación con el PAM. No se observa ningún requisito de secuencia de PAM en el lado derecho de la diana Cas12i2.
La figura 37 muestra un corte romo asociado con la escisión de ADN bicatenario por Cas12i2 indicada mediante la escisión observada entre los 24/+25 nucleótidos de la cadena no diana en relación con el PAM y la escisión entre los 24/+25 nucleótidos de la cadena diana en relación con el PAM.
Las figuras 38A-B muestran la distribución de longitudes de sustrato de ADNbc para Cas12i2 expresada por IVTT en un complejo con un ARNcr no diana (rojo) frente a controles de Apo (efector sólo) (azul). (A) Se prepararon bibliotecas de secuenciación de última generación para la lectura con un primer cebador complementario a un asidero ligado al extremo 5' del sustrato de longitud completa o escindido (y que contiene secuencias de I5/P5) y un segundo cebador complementario a la secuencia fiduciaria en 3' del sustrato (y que contiene secuencias de I7/P7). (B) Se prepararon bibliotecas de secuenciación de última generación para la lectura con un primer cebador complementario a la secuencia fiduciaria en 5' del sustrato (y que contiene secuencias de I5/P5) y un segundo cebador complementario a un asidero ligado al extremo 3' del sustrato de longitud completa o escindido (y que contiene secuencias de I7/P7).
Las figuras 39A-B muestran la distribución de longitudes de sustrato de ADNbc para Cas12i2 expresada por IVTT en un complejo con un ARNcr de cadena inferior (orientación inactiva) que selecciona como diana ADNbc (rojo) frente a controles de Apo (efector sólo) (azul). (A) Se prepararon bibliotecas de secuenciación de última generación para la lectura con un primer cebador complementario a un asidero ligado al extremo 5' del sustrato de longitud completa o escindido (y que contiene secuencias de I5/P5) y un segundo cebador complementario a la secuencia fiduciaria en 3' del sustrato (y que contiene secuencias de I7/P7). (B) Se prepararon bibliotecas de secuenciación de última generación para la lectura con un primer cebador complementario a la secuencia fiduciaria en 5' del sustrato (y que contiene secuencias de I5/P5) y un segundo cebador complementario a un asidero ligado al extremo 3' del sustrato de longitud completa o escindido (y que contiene secuencias de I7/P7). La figura 40 es un esquema de los constructos usados para la validación en mamíferos de los sistemas de CRISPR de tipo V-I tal como se describe en el presente documento. El efector tiene codones de mamíferos optimizados, y una secuencia de localización nuclear de nucleoplasmina (npNLS) está unida al extremo C-terminal de la proteína. La expresión en mamíferos a partir del plásmido usa un promotor EF1alfa corto (EFS) y una secuencia de poliA de bGH (bGHpA). La guía de ARN se expresa a partir de un fragmento de ADNbc lineal, impulsado por un promotor de ARN polimerasa III (U6). El esquema describe diferentes implementaciones, con la guía de ARN expresada con un pre-ARNcr que porta una única diana, con un ARNcr maduro o multiplexada con múltiples dianas en la configuración mostrada.
La figura 41A es un gráfico de barras que muestra la actividad de indel inducida por el efector de CRISPR Cas12i2 dirigido al locus de VEGFA en la línea de células 293T 72 horas tras la transfección transitoria de los constructos de efector y guía de ARN descritos en la figura 40. Se sometieron a ensayo diferentes diseños de guía de ARN, y muestran grados de eficacia variables. Las barras de error representan el EEM, con 3 réplicas. La figura 41B es una representación de indels representativas a partir de secuenciación de última generación. Están marcadas la secuencia de PAM TTC y las indels representativas que se producen >20 pb en el sentido de 3' del PAM.
Descripción detallada
La amplia diversidad natural de los sistemas de defensa de CRISPR-Cas contienen una amplia gama de mecanismos de actividad y elementos funcionales que pueden aprovecharse para biotecnologías programables. En un sistema natural, estos mecanismos y parámetros permiten una defensa eficiente contra ADN y virus extraños al tiempo que proporcionan autodiscriminación frente a no autodiscriminación para evitar dirigirse a sí mismos. En un sistema diseñado por ingeniería, los mismos mecanismos y parámetros también proporcionan una caja de herramientas diversa de tecnologías moleculares y definen los límites del espacio de direccionamiento. Por ejemplo, los sistemas Cas9 y Cas13a tienen actividad ADN y ARN endonucleasa canónica y sus espacios de direccionamiento están definidos por el motivo adyacente al protoespaciador (PAM) en el ADN diana y los sitios flanqueantes del protoespaciador (PFS) en el ARN diana, respectivamente.
Los métodos descritos en el presente documento se han usado para descubrir mecanismos y parámetros adicionales dentro de los sistemas efectores de clase 2 de una sola subunidad que pueden expandir las capacidades de manipulación de ácidos nucleicos programables por ARN.
En un aspecto, la divulgación se refiere al uso de métodos y algoritmos computacionales para buscar e identificar novedosas familias de proteínas que presenten un fuerte patrón de coexistencia con determinadas otras características dentro de secuencias genómicas que se producen de manera natural. En determinadas realizaciones, estos métodos computacionales están dirigidos a identificar familias de proteínas que coexisten en proximidad estrecha a matrices de CRISPR. Sin embargo, los métodos dados a conocer en el presente documento son útiles para identificar proteínas que se producen de manera natural en proximidad estrecha a otras características, tanto no codificantes como codificantes de proteínas (por ejemplo, fragmentos de secuencias de fagos en áreas no codificantes de loci bacterianos; o proteínas de CRISPR Cas1). Se entiende que los métodos y cálculos descritos en el presente documento pueden realizarse en uno o más dispositivos informáticos.
En algunas realizaciones, se obtiene un conjunto de secuencias genómicas a partir de bases de datos genómicas o metagenómicas. Las bases de datos comprenden lecturas cortas, o datos a nivel de cóntigo, o armazones ensamblados, o secuencias genómicas completas de organismos. Asimismo, la base de datos puede comprender datos de secuencias genómicas de organismos procariotas u organismos eucariotas, o puede incluir datos de muestras ambientales metagenómicas. Los ejemplos de repositorios de bases de datos incluyen RefSeq del Centro Nacional para la Información Biotecnológica (National Center for Biotechnology Information, NCBI), GenBank del NCBI, Whole Genome Shotgun (WGS) del NCBI e Integrated Microbial Genomes (IMG) del Joint Genome Institute (JGI).
En algunas realizaciones, se impone un requisito de tamaño mínimo para seleccionar datos de secuencia genómica de una longitud mínima especificada. En determinadas realizaciones a modo de ejemplo, la longitud mínima del cóntigo puede ser de 100 nucleótidos, 500 nt, 1 kb, 1,5 kb, 2 kb, 3 kb, 4 kb, 5 kb, 10 kb, 20 kb, 40 kb o 50 kb.
En algunas realizaciones, se extraen proteínas conocidas o predichas del conjunto completo o seleccionado de datos de secuencia genómica. En algunas realizaciones, se toman proteínas conocidas o predichas de la extracción de anotaciones de secuencia codificante (CDS) proporcionadas por la base de datos fuente. En algunas realizaciones, las proteínas predichas se determinan aplicando un método computacional para identificar proteínas a partir de secuencias de nucleótidos. En algunas realizaciones, se usa GeneMark Suite para predecir proteínas a partir de secuencias genómicas. En algunas realizaciones, se usa Prodigal para predecir proteínas a partir de secuencias genómicas. En algunas realizaciones, pueden usarse múltiples algoritmos de predicción de proteínas sobre el mismo conjunto de datos de secuencia desduplicándose el conjunto resultante de proteínas. En algunas realizaciones, se identifican matrices de CRISPR a partir de los datos de secuencia genómica. En algunas realizaciones, se usa PILER-CR para identificar matrices de CRISPR. En algunas realizaciones, se usa la herramienta de reconocimiento de CRISPR (CRT) para identificar matrices de CRISPR. En algunas realizaciones, las matrices de CRISPR se identifican mediante una heurística que identifica motivos de nucleótidos repetidos un número mínimo de veces (por ejemplo, 2, 3 ó 4 veces), en las que el espacio entre apariciones consecutivas de un motivo repetido no excede una longitud específica (por ejemplo, 50, 100 ó 150 nucleótidos). En algunas realizaciones, pueden usarse múltiples herramientas de identificación de matrices de CRISPR sobre el mismo conjunto de datos de secuencia desduplicándose el conjunto resultante de matrices de CRISPR.
En algunas realizaciones, se identifican proteínas en proximidad estrecha a matrices de CRISPR. En algunas realizaciones, la proximidad se define como una distancia de nucleótidos y puede estar dentro de 20 kb, 15 kb o 5 kb. En algunas realizaciones, la proximidad se define como el número de marcos de lectura abiertos (ORF) entre una proteína y una matriz de CRISPR, y determinadas distancias a modo de ejemplo pueden ser 10, 5, 4, 3, 2, 1 ó 0 ORF. Las proteínas identificadas como en proximidad estrecha a una matriz de CRISPR se agrupan luego en agrupaciones de proteínas homólogas. En algunas realizaciones, se usa blastclust para formar agrupaciones de proteínas. En determinadas otras realizaciones, se usa mmseqs2 para formar agrupaciones de proteínas.
Para establecer un patrón de coexistencia fuerte entre los miembros de una agrupación de proteínas con matrices de CRISPR, puede realizarse una búsqueda BLAST de cada miembro de la familia de proteínas en el conjunto completo de proteínas conocidas y predichas previamente compiladas. En algunas realizaciones, puede usarse UBLAST o mmseqs2 para buscar proteínas similares. En algunas realizaciones, puede realizarse una búsqueda sólo para un subconjunto representativo de proteínas en la familia.
En algunas realizaciones, las agrupaciones de proteínas dentro de una proximidad estrecha a matrices de CRISPR se clasifican o se filtran mediante una métrica para determinar la coexistencia. Una métrica a modo de ejemplo es la razón del número de elementos en una agrupación de proteínas con respecto al número de coincidencias de BLAST hasta un determinado umbral de valor E. En algunas realizaciones, puede usarse un umbral de valor E constante. En otras realizaciones, el umbral de valor E puede determinarse por los miembros más distantes de la agrupación de proteínas. En algunas realizaciones, el conjunto global de proteínas está agrupado y la métrica de coexistencia es la razón del número de elementos de la agrupación asociada a CRISPR con respecto al número de elementos de la(s) agrupación/agrupaciones global(es) que las contienen.
En algunas realizaciones, se usa un proceso de revisión manual para evaluar la funcionalidad potencial y el conjunto mínimo de componentes de un sistema diseñado por ingeniería genética basado en la estructura de locus que se produce de manera natural de las proteínas en la agrupación. En algunas realizaciones, una representación gráfica de la agrupación de proteínas puede ayudar en la revisión manual y puede contener información que incluye similitud de secuencia por parejas, árbol filogenético, organismos/entornos fuente, dominios funcionales predichos y una representación gráfica de estructuras de locus. En algunas realizaciones, la representación gráfica de estructuras de locus puede filtrar familias de proteínas cercanas que tienen una alta representación. En algunas realizaciones, la representación puede calcularse mediante la razón del número de proteínas cercanas relacionadas con respecto al/a los tamaño(s) del/de las agrupación/agrupaciones global(es) que las contienen. En determinadas realizaciones a modo de ejemplo, la representación gráfica de la agrupación de proteínas puede contener una representación de las estructuras de matriz de CRISPR de los loci que se producen de manera natural. En algunas realizaciones, la representación gráfica de la agrupación de proteínas puede contener una representación del número de repeticiones directas conservadas frente a la longitud de la supuesta matriz CRISPR, o el número de secuencias espaciadoras únicas frente a la longitud de la supuesta matriz de CRISPR. En algunas realizaciones, la representación gráfica de la agrupación de proteínas puede contener una representación de diversas métricas de coexistencia del supuesto efector con matrices de CRISPR para predecir nuevos sistemas de CRISPR-Cas e identificar sus componentes.
Cribado agrupado
Para validar de manera eficiente la actividad de los novedosos sistemas de CRISPR-Cas diseñados por ingeniería genética y evaluar simultáneamente de manera imparcial diferentes mecanismos de actividad y parámetros funcionales, se usa un nuevo enfoque de cribado agrupado en E. coli. En primer lugar, a partir de la identificación computacional de la proteína conservada y elementos no codificantes del novedoso sistema de CRISPR-Cas, se usa síntesis de ADN y clonación molecular para ensamblar los componentes separados en un solo vector de expresión artificial, que en una realización se basa en una estructura principal de pET-28a+. En una segunda realización, los efectores y elementos no codificantes se transcriben en un único transcrito de ARNm y se usan diferentes sitios de unión al ribosoma para traducir los efectores individuales.
En segundo lugar, el ARNcr natural y los espaciadores de direccionamiento se reemplazan por una biblioteca de ARNcr sin procesar que contienen espaciadores no naturales dirigidos a un segundo plásmido, pACYC184. Esta biblioteca de ARNcr se clona en la estructura principal del vector que contiene los efectores proteicos y los elementos no codificantes (por ejemplo, pET-28a+) y, posteriormente, se transforma la biblioteca en E. coli junto con la diana de plásmido pACYC184. En consecuencia, cada célula de E. coli resultante no contiene más de un espaciador de direccionamiento. En una realización alternativa, la biblioteca de ARNcr sin procesar que contienen espaciadores no naturales también se dirige a genes esenciales de E. coli extraídos de recursos tales como los descritos en Baba et al. (2006) Mol. Syst. Biol. 2: 2006.0008; y Gerdes et al. (2003) J. Bacteriol.
185(19): 5673-84. En esta realización, la actividad positiva dirigida de los novedosos sistemas de CRISPR-Cas que altera la función génica esencial da como resultado muerte celular o detención del crecimiento. En algunas realizaciones, los espaciadores de direccionamiento de genes esenciales pueden combinarse con las dianas de pACYC184 para añadir otra dimensión al ensayo. En otras realizaciones, las secuencias no codificantes que flanquean la matriz de CRISPR, el supuesto efector o marcos de lectura abiertos accesorios, y anti-repeticiones predichas indicativas de elementos de ARNtracr, se concatenaron juntos y se clonaron en pACYC184 y se expresaron por lac y promotores T7 inducibles por IPTG.
En tercer lugar, se cultivan E. coli bajo la selección con antibióticos. En una realización, se usa selección con tres antibióticos: kanamicina para garantizar la transformación exitosa del vector pET-28a+ que contiene el sistema efector de CRISPR-Cas diseñado por ingeniería genética, y cloranfenicol y tetraciclina para garantizar la cotransformación exitosa del vector diana pACYC184. Dado que pACYC184 normalmente confiere resistencia a cloranfenicol y tetraciclina, bajo la selección con antibióticos, la actividad positiva del novedoso sistema de CRISPR-Cas dirigido al plásmido eliminará las células que expresan activamente los efectores, los elementos no codificantes y los elementos activos específicos de la biblioteca de ARNcr. El examen de la población de células supervivientes en un punto de tiempo posterior en comparación con un punto de tiempo anterior normalmente proporciona una señal reducida en comparación con los ARNcr inactivos. En algunas realizaciones, se usa selección con dos antibióticos. Por ejemplo, la retirada o bien de cloranfenicol o bien de tetraciclina para eliminar la presión selectiva puede proporcionar información novedosa sobre el sustrato de direccionamiento, la especificidad de secuencia y la potencia. En algunas realizaciones, sólo se usa kanamicina para garantizar la transformación exitosa del vector pET-28a+ que contiene el sistema efector de CRISPR-Cas diseñado por ingeniería genética. Esta realización es adecuada para bibliotecas que contienen espaciadores dirigidos a genes esenciales de E. coli, ya que no se necesita una selección adicional más allá de la kanamicina para observar las alteraciones del crecimiento. En esta realización, se elimina la dependencia del cloranfenicol y la tetraciclina, y sus dianas (si las hay) en la biblioteca proporcionan una fuente adicional de información negativa o positiva sobre el sustrato de direccionamiento, la especificidad de secuencia y la potencia.
Dado que el plásmido pACYC184 contiene un conjunto diverso de características y secuencias que pueden afectar a la actividad de un sistema de CRISPR-Cas, el mapeo de los ARNcr activos a partir del cribado agrupado en pACYC184 proporciona patrones de actividad que pueden sugerir diferentes mecanismos de actividad y parámetros funcionales de una manera amplia, sin ceñirse a una hipótesis. De este modo, las características requeridas para reconstituir el novedoso sistema de CRISPR-Cas en una especie procariota heteróloga pueden someterse a prueba y estudiarse de manera más exhaustiva.
Determinadas ventajas importantes del cribado agrupado in vivo descrito en el presente documento incluyen: (1) versatilidad - el diseño del plásmido permite expresar múltiples efectos y/o elementos no codificantes; la estrategia de clonación de la biblioteca permite que se expresen ambas direcciones transcripcionales direcciones del ARNcr predicho computacionalmente;
(2) pueden usarse pruebas exhaustivas de mecanismos de actividad y parámetros funcionales para evaluar diversos mecanismos de interferencia, incluida la escisión de ADN o ARN; para examinar la coexistencia de características tales como transcripción, replicación de ADN de plásmido; y secuencias flanqueantes para una biblioteca de ARNcr para determinar de manera fiable los PAM con una equivalencia de complejidad de 4N; (3) sensibilidad - pACYC184 es un plásmido de bajo número de copias, que permite alta sensibilidad para la actividad de CRISPR-Cas, porque incluso tasas de interferencia moderadas pueden eliminar la resistencia a antibióticos codificada por el plásmido; y
(4) eficiencia - el cribado agrupado incluye etapas optimizadas de biología molecular que permiten una mayor velocidad y rendimiento de la secuenciación de ARN, y las muestras de expresión de proteínas pueden recogerse directamente de las células supervivientes en el cribado.
Tal como se comenta en más detalle en los ejemplos más adelante, las novedosas familias de CRISPR-Cas descritas en el presente documento se evaluaron usando este cribado agrupado in vivo para evaluar sus elementos, mecanismos y parámetros operativos, así como su capacidad para activarse y reprogramarse en un sistema diseñado por ingeniería genética fuera de su entorno celular natural.
Cribado agrupado in vitro
También pueden usarse enfoques de cribado agrupado in vitro y son complementarios a los cribados agrupados in vivo. Los cribados agrupados in vitro permiten una rápida caracterización bioquímica y reducción de un sistema de CRISPR a los componentes esenciales necesarios para la actividad del sistema. En una realización, se usa un sistema de transcripción y traducción in vitro (IVTT) libre de células para sintetizar directamente ARN y proteína a partir de ADN que codifica para las proteínas no codificantes y efectoras del sistema de CRISPR, permitiendo de ese modo un método más rápido y con mayor rendimiento para evaluar un mayor número de sistemas efectores de CRISPR-Cas separados distintos que los ensayos bioquímicos convencionales basados en proteínas purificadas por FPLC. Además de permitir un rendimiento y una eficiencia mayores de las reacciones bioquímicas, el cribado in vitro presenta varias ventajas que lo hacen complementaria al enfoque de cribado agrupado in vivo descrito anteriormente.
(1) Observación directa tanto de señales de enriquecimiento como de agotamiento - el cribado agrupado in vitro permite una lectura tanto del enriquecimiento de escisión, en el que los productos de escisión pueden capturarse y secuenciarse directamente para identificar sitios de corte, patrones de escisión y motivos de secuencia específicos para sistemas efectores activos, como del agotamiento de dianas, en el que la señal negativa a partir del agotamiento de dianas específicas dentro de la población no escindida se usa como indicador de actividad. Dado que el cribado agrupado in vivo utiliza una lectura de agotamiento de dianas, el modo de enriquecimiento ofrece información adicional sobre la actividad efectora.
(2) Mayor control de los componentes de reacción y el entorno - los componentes y la actividad bien definidos del IVTT patentado permiten un control preciso de los componentes de reacción para identificar los componentes mínimos necesarios para una mayor traducción de la actividad, en comparación con el medio celular de E. coli complejo para un cribado in vivo. Además, pueden realizarse modificaciones no naturales a los componentes de reacción para una actividad potenciada o una lectura más fácil; por ejemplo, añadir enlaces de fosforotioato a los sustratos de ADNmc y ADNbc para reducir el ruido al limitar la degradación de los sustratos por exonucleasas. (3) Robustez frente a proteínas tóxicas/inhibidoras del crecimiento - para las proteínas que pueden ser tóxicas para el crecimiento de células de E. coli, el cribado agrupado in vitro permite un cribado funcional sin someterse a las restricciones de crecimiento de una célula viva. Esto permite en última instancia una mayor versatilidad en la selección y el cribado de proteínas.
Las novedosas familias de CRISPR-Cas descritas en el presente documento se evaluaron usando una combinación de cribados agrupados in vivo e in vitro para evaluar sus elementos, mecanismos y parámetros operativos, así como su capacidad para ser activos y reprogramarse en un sistema diseñado por ingeniería genética fuera de su entorno celular natural.
Efectores de CRISPR-Cas de clase 2 que tienen un dominio RuvC
En un aspecto, la divulgación proporciona sistemas de CRISPR-Cas de clase 2 denominados en el presente documento sistemas de CRISPR-Cas CLUST.029130 (de tipo V-I). Estos sistemas de CRISPR-Cas de clase 2 incluyen una proteína asociada a CRISPR aislada que tiene un dominio RuvC y un ARNcr aislado, también denominada guía de ARN, ARN guía o ARNg, que comprende una secuencia espaciadora que es complementaria a una secuencia de ácido nucleico diana tal como una secuencia de ADN.
Adecuadamente, una proteína efectora de CRISPR-Cas que tiene un dominio RuvC puede incluir uno o más motivos del conjunto de: el motivo de RuvC III, X1SHX4DX6X7 (SEQ ID NO: 200), en el que X1 es S o T, X4 es Q o L, X6 es P o S, y X7 es F o L; el motivo de RuvC I, X1XDXNX6X7XXXX11 (SEQ ID NO: 201), en el que X1 es A o G o S, X es cualquier aminoácido, X6 es Q o I, X7 es T o S o V, y X11 es T o A; y el motivo de RuvC II, X1X2X3E (SEQ ID NO: 210), en el que X1 es C o F o I o L o M o P o V o W o Y, X2 es C o F o I o L o M o P o R o V o W o Y, y X3 es C o F o G o I o L o M o P o V o W o Y.
Adecuadamente, un sistema de CRISPR-Cas de tipo V-I incluye un efector de CRISPR-Cas que tiene un dominio RuvC y un ARNcr de tipo V-I. Adecuadamente, el efector Cas12i tiene aproximadamente 1100 aminoácidos o menos de longitud, e incluye un dominio de interacción con PAM funcional que reconoce el PAM en el ADN diana. Las proteínas efectoras de CRISPR-Cas de tipo V-I son capaces de unirse a una guía de ARN de tipo V-I para formar un sistema de CRISPR-Cas de tipo V-I, en las que la guía de ARN de tipo V-I incluye una estructura de tallo-bucle con un tallo de 5 nucleótidos y un bucle de 6, 7 u 8 nucleótidos. Los sistemas de CRISPR-Cas de tipo V-I son capaces de seleccionar como diana y unirse a ADN específico de secuencia sin la presencia de un ARNtracr.
En algunas realizaciones, la proteína efectora de CRISPR-Cas de tipo V-I y la guía de ARN de tipo V-I forman un complejo binario que puede incluir otros componentes. El complejo binario se activa tras la unión a un sustrato de ácido nucleico que es complementario a una secuencia espaciadora en la guía de ARN (es decir, un ácido nucleico diana o sustrato específico de secuencia). En algunas realizaciones, el sustrato específico de secuencia es un ADN bicatenario. En algunas realizaciones, el sustrato específico de secuencia es un ADN monocatenario. En algunas realizaciones, la especificidad de secuencia requiere una coincidencia completa de la secuencia espaciadora en la guía de a Rn (por ejemplo, ARNcr) con el sustrato diana. En otras realizaciones, la especificidad de secuencia requiere una coincidencia parcial (contigua o no contigua) de la secuencia espaciadora en la guía de ARN (por ejemplo, ARNcr) con el sustrato diana. La especificidad de secuencia en determinadas realizaciones requiere además una coincidencia completa entre una secuencia de motivo adyacente al protoespaciador (“PAM”) próximo a la secuencia espaciadora, y una secuencia canónica de PAM reconocida por la proteína asociada a CRISPR. En algunos casos, no se requiere una coincidencia completa de la secuencia de PAM, y una coincidencia parcial es suficiente para la asociación específica de secuencia del complejo binario y el sustrato de ADN.
En algunas realizaciones, el sustrato de ácido nucleico diana es un ADN bicatenario (ADNbc). En algunas realizaciones, el sustrato de ácido nucleico diana es un ADNbc e incluye un PAM. En algunas realizaciones, el complejo binario modifica el sustrato de ADNbc específico de secuencia diana tras unirse al mismo. En algunas realizaciones, el complejo binario mella preferentemente la cadena no diana del sustrato de ADNbc diana. En algunas realizaciones, el complejo binario escinde ambas cadenas del sustrato de ADNbc diana. En algunas realizaciones, el complejo binario escinde ambas cadenas del sustrato de ADNbc diana con un corte escalonado. En algunas realizaciones, el complejo binario crea una rotura bicatenaria (DSB) roma en el sustrato de ADNbc diana.
En algunas realizaciones, el sustrato de ácido nucleico diana es un ADN monocatenario (ADNmc). En algunas realizaciones, el sustrato de ácido nucleico diana es un ADNmc y no incluye ningún PAM. En algunas realizaciones, el complejo binario modifica el sustrato de ADNmc específico de secuencia diana tras unirse al mismo. En algunas realizaciones, el complejo binario escinde el sustrato de ADNmc diana.
En algunas realizaciones, el complejo binario se activa tras la unión al sustrato diana. En algunas realizaciones, el complejo activado presenta actividad de “recambio múltiple”, mediante la cual, tras actuar sobre (por ejemplo, escindiendo) el sustrato diana, el complejo activado permanece en un estado activado. En algunas realizaciones, el complejo binario presenta actividad de “recambio individual”, mediante la cual, tras actuar sobre el sustrato diana, el complejo binario vuelve a un estado inactivo. En algunas realizaciones, el complejo activado presenta actividad de escisión no específica (es decir, “colateral”), mediante la cual el complejo activado escinde ácidos nucleicos sin similitud de secuencia con la diana. En algunas realizaciones, el sustrato de ácido nucleico colateral es un ADNmc.
Modificaciones de enzimas CRISPR
Enzimas CRISPR deficientes en nucleasas
Cuando las enzimas CRISPR descritas en el presente documento tienen actividad nucleasa, las enzimas CRISPR pueden modificarse para que tengan una actividad nucleasa disminuida, por ejemplo, la inactivación de nucleasa de al menos el 50 %, al menos el 60 %, al menos el 70 %, al menos el 80 %, al menos el 90 %, al menos el 95 %, al menos el 97 % o del 100 % en comparación con las enzimas CRISPR de tipo natural. La actividad nucleasa puede disminuirse mediante varios métodos, por ejemplo, introduciendo mutaciones en los dominios de interacción con PAM o nucleasa de las enzimas CRISPR. En algunas realizaciones, se identifican residuos catalíticos para las actividades nucleasa, y estos residuos de aminoácido pueden sustituirse por diferentes residuos de aminoácido (por ejemplo, glicina o alanina) para disminuir la actividad nucleasa. Los ejemplos de tales mutaciones para Cas12i1 incluyen D647A o E894A o D948A. Los ejemplos de tales mutaciones para Cas12i2 incluyen D599A o E833A o D886A.
Las enzimas CRISPR inactivadas pueden comprender (por ejemplo, por medio de una proteína de fusión, péptidos ligadores, ligadores peptídicos de Gly4Ser (GS), etc.) o estar asociadas (por ejemplo, por medio de coexpresión de múltiples proteínas) con uno o más dominios funcionales. Estos dominios funcionales pueden tener diversas actividades, por ejemplo, actividad metilasa, actividad desmetilasa, actividad de activación de la transcripción, actividad de represión de la transcripción, actividad de factor de liberación de la transcripción, actividad de modificación de histonas, actividad de escisión de ARN, actividad de escisión de ADN, actividad de unión a ácido nucleico y actividad de cambio (por ejemplo, inducible por luz). En algunas realizaciones, los dominios funcionales son caja asociada a Krüppel (KRAB), VP64, VP16, Fok1, P65, HSF1, MyoD1 y biotina-APEX.
El posicionamiento del uno o más dominios funcionales en las enzimas CRISPR inactivadas permite la orientación espacial correcta del dominio funcional para afectar a la diana con el efecto funcional atribuido. Por ejemplo, si el dominio funcional es un activador de la transcripción (por ejemplo, VP16, VP64 o p65), el activador de la transcripción se coloca en una orientación espacial que permite que afecte a la transcripción de la diana. Asimismo, está situado un represor de la transcripción para que afecte a la transcripción de la diana, y está situada una nucleasa (por ejemplo, Fok1) para que escinda o escinda parcialmente la diana. En algunas realizaciones, el dominio funcional está situado en el extremo N-terminal de la enzima CRISPR. En algunas realizaciones, el dominio funcional está situado en el extremo C-terminal de la enzima CRISPR. En algunas realizaciones, la enzima CRISPR inactivada se modifica para que comprenda un primer dominio funcional en el extremo N-terminal y un segundo dominio funcional en el extremo C-terminal.
Enzimas divididas
La presente divulgación también proporciona una versión dividida de las enzimas CRISPR descritas en el presente documento. La versión dividida de las enzimas CRISPR puede ser ventajosa para la administración. En algunas realizaciones, las enzimas CRISPR se dividen en dos partes de las enzimas, que juntas comprenden sustancialmente una enzima CRISPR en funcionamiento.
La división puede realizarse de modo que el/los dominio(s) catalítico(s) no se vea(n) afectado(s). Las enzimas CRISPR pueden funcionar como una nucleasa o pueden ser enzimas inactivadas, que son esencialmente proteínas de unión a ARN con muy poca o ninguna actividad catalítica (por ejemplo, debido a mutación/mutaciones en sus dominios catalíticos).
En algunas realizaciones, el lóbulo de nucleasa y el lóbulo de hélice a se expresan como polipéptidos separados. Aunque los lóbulos no interactúan por sí solos, la guía de ARN los recluta en un complejo que recapitula la actividad de enzimas CRISPR de longitud completa y cataliza la escisión de ADN específica de sitio. El uso de una guía de ARN modificada anula la actividad de la enzima dividida al evitar la dimerización, lo que permite el desarrollo de un sistema de dimerización inducible. La enzima dividida se describe, por ejemplo, en Wright, Addison V., et al. “Rational design of a split-Cas9 enzyme complex”, Proc. Nat'l. Acad. Sci., 112.10 (2015): 2984­ 2989.
En algunas realizaciones, la enzima dividida puede fusionarse con una pareja de dimerización, por ejemplo, empleando dominios de dimerización sensibles a rapamicina. Esto permite la generación de una enzima CRISPR químicamente inducible para el control temporal de la actividad de la enzima CRISPR. Por tanto, las enzimas CRISPR pueden volverse químicamente inducibles al dividirse en dos fragmentos y los dominios de dimerización sensibles a rapamicina pueden usarse para el reensamblaje controlado de las enzimas CRISPR.
El punto de división normalmente se diseña in silico y se clona en los constructos. Durante este proceso, pueden introducirse mutaciones en la enzima dividida y pueden eliminarse dominios no funcionales. En algunas realizaciones, las dos partes o fragmentos de la enzima CRISPR dividida (es decir, los fragmentos N-terminal y C-terminal) pueden formar una enzima CRISPR completa, que comprende, por ejemplo, al menos el 70 %, al menos el 80 %, al menos al menos el 90 %, al menos el 95 % o al menos el 99 % de la secuencia de la enzima CRISPR de tipo natural.
Enzimas autoactivantes o inactivantes
Las enzimas CRISPR descritas en el presente documento pueden diseñarse para que se autoactiven o se autoinactiven. En algunas realizaciones, las enzimas CRISPR se autoinactivan. Por ejemplo, la secuencia diana puede introducirse en los constructos codificantes de enzimas CRISPR. Por tanto, las enzimas CRISPR pueden escindir la secuencia diana, así como el constructo que codifica para la enzima, autoinactivando de ese modo su expresión. Se describen métodos de construcción de un sistema de CRISPR autoinactivante, por ejemplo, en Epstein, Benjamin E. y David V. Schaffer. “Engineering a Self-Inactivating CRISPR System for AAV Vectors”, Mol. Ther., 24 (2016): S50.
En algunas otras realizaciones, una guía de ARN adicional, expresada bajo el control de un promotor débil (por ejemplo, el promotor 7SK), puede dirigirse a la secuencia de ácido nucleico que codifica para la enzima CRISPR para evitar y/o bloquear su expresión (por ejemplo, al prevenir la transcripción y/o traducción del ácido nucleico). La transfección de células con vectores que expresan la enzima CRISPR, las guías de ARN y las guías de ARN que se dirigen al ácido nucleico que codifica para la enzima CRISPR puede conducir a una alteración eficiente del ácido nucleico que codifica para la enzima CRISPR y disminuir los niveles de la enzima CRISPR, limitando de ese modo la actividad de edición del genoma.
En algunas realizaciones, la actividad de edición del genoma de las enzimas CRISPR puede modularse a través de firmas de ARN endógeno (por ejemplo, miARN) en células de mamífero. El cambio de enzima CRISPR puede realizarse usando una secuencia complementaria al miARN en la 5'-UTR del ARNm que codifica para la enzima CRISPR. Los cambios responden de manera selectiva y eficiente al miARN en las células diana. Por tanto, los cambios pueden controlar diferencialmente la edición del genoma al detectar actividades endógenas de miARN dentro de una población celular heterogénea. Por tanto, los sistemas de cambio pueden proporcionar un marco para la edición del genoma selectivo de tipo celular y la ingeniería celular basada en información de miARN intracelular (Hirosawa, Moe et al. “Cell-type-specific genome editing with a microRNA-responsive CRISPR-Cas9 switch”, Nucl. Acids Res., 27 de julio de 2017; 45(13): e118).
Enzimas CRISPR inducibles
Las enzimas CRISPR pueden ser inducibles, por ejemplo, inducibles por luz o inducibles químicamente. Este mecanismo permite la activación del dominio funcional en las enzimas CRISPR con un desencadenante conocido. La inducibilidad por la luz puede lograrse mediante diversos métodos conocidos en la técnica, por ejemplo, mediante el diseño de un complejo de fusión en el que se usa el emparejamiento CRY2PHR/CIBN en enzimas CRISPR divididas (véase, por ejemplo, Konerman et al. “Optical control of mammalian endogenous transcription and epigenetic states”, Nature, 500.7463 (2013): 472). La inducibilidad química puede lograrse, por ejemplo, mediante el diseño de un complejo de fusión en el que se usa el emparejamiento FκΒP/FRB (proteína de unión a FK506/dominio de unión a rapamicina de FκΒP) en enzimas CRISPR divididas. Se requiere rapamicina para formar el complejo de fusión, activando de ese modo las enzimas CRISPR (véase, por ejemplo, Zetsche, Volz y Zhang, “A split-Cas9 architecture for inducible genome editing and transcription modulation”, Nature Biotech., 33.2 (2015): 139-142).
Además, la expresión de las enzimas CRISPR puede modularse mediante promotores inducibles, por ejemplo, activación transcripcional controlada por tetraciclina o doxiciclina (sistemas de expresión Tet-On y Tet-Off), sistema de expresión génica inducible por hormonas (por ejemplo, un sistema de expresión génica inducible por ecdisona) y un sistema de expresión génica inducible por arabinosa. Cuando se administra como ARN, la expresión de la proteína efectora dirigida al ARN puede modularse a través de un ribointerruptor, que puede detectar una molécula pequeña como la tetraciclina (véase, por ejemplo, Goldfless, Stephen J. et al. “Direct and specific chemical control of eukaryotic translation with a synthetic RNA-protein interaction”, Nucl. Acids Res., 40.9 (2012): e64-e64).
Se describen diversas realizaciones de enzimas CRISPR inducibles y sistemas de CRISPR inducibles, por ejemplo, en los documentos US8871445, US20160208243 y WO2016205764.
Mutaciones funcionales
Pueden introducirse diversas mutaciones o modificaciones en las enzimas CRISPR tal como se describe en el presente documento para mejorar la especificidad y/o robustez. En algunas realizaciones, se identifican los residuos de aminoácido que reconocen el motivo adyacente al protoespaciador (PAM). Las enzimas CRISPR descritas en el presente documento pueden modificarse adicionalmente para reconocer PAM diferentes, por ejemplo, sustituyendo los residuos de aminoácido que reconocen el PAM por otros residuos de aminoácido. En algunas realizaciones, las enzimas CRISPR pueden reconocer PAM alternativos, por ejemplo, tal como se describe en el presente documento.
En algunas realizaciones, las proteínas asociadas a CRISPR incluyen al menos una señal de localización nuclear (NLS) (por ejemplo, 1, 2, 3, 4, 5, 6, 7, 8, 9 ó 10) unida al extremo N-terminal o C-terminal de la proteína. Los ejemplos no limitativos de NLS incluyen una secuencia de NLS derivada de: la NLS del antígeno T grande del virus SV40, que tiene la secuencia de aminoácidos PKKKRKV (SEQ ID NO: 300); la NLS de nucleoplasmina (por ejemplo, la NlS de nucleoplasmina bipartita con la secuencia KRPAATKKAg Qa KKKK (SEQ ID NO: 301)); la NLS de c-myc que tiene la secuencia de aminoácidos PAAKRVKLD (SEQ ID NO: 302) o Rq RRNELKRSP (SeQ ID NO: 303); la NLS de hRNPA1 M9 que tiene la secuencia NQSSNFGPMKGGNFGGRSSGPYGGGGQYFAKPRNQGGY (SEQ ID NO: 304); la secuencia RMRIZFKNKGKDTAELRRRRVEVSVELRKAKKDEQILKRRNV (SEQ ID NO: 305) del dominio IBB de importinaalfa; las secuencias VSRKRPRP (SEQ ID NO: 306) y PPKKARED (SEQ ID NO: 307) de la proteína T del mioma; la secuencia PQPKKKPL (SEQ ID NO: 308) de p53 humana; la secuencia SALIKKKKKMAP (SEQ ID NO: 309) de c-abl IV de ratón; las secuencias DRLRR (SEQ ID NO: 310) y PKQKKRK (SEQ ID NO: 311) de NS1 del virus de la gripe; la secuencia RKLKKKIKKL (SEQ ID NO: 312) del antígeno delta del virus de la hepatitis; la secuencia REKKKFLKRR (SEQ ID NO: 313) de la proteína Mx1 de ratón; la secuencia KRKGDEVDGVDEVAKKKSKK (SEQ ID NO: 314) de la poli(ADP-ribosa) polimerasa humana; y la secuencia RKCLQAGMNLEARKTKK (SEQ ID NO: 315) del receptor de glucocorticoides humano. En algunas realizaciones, la proteína asociada a CRISPR incluye al menos una señal de exportación nuclear (NES) (por ejemplo, 1, 2, 3, 4, 5, 6, 7, 8, 9 ó 10) unida al extremo N-terminal o C-terminal de la proteína. En una realización preferida, está unida una NLS o NES C-terminal y/o N-terminal para una expresión óptima y direccionamiento nuclear en células eucariotas, por ejemplo, células humanas.
En algunas realizaciones, las enzimas CRISPR descritas en el presente documento están mutadas en uno o más residuos de aminoácido para alterar una o más actividades funcionales. Por ejemplo, en algunas realizaciones, la enzima CRISPR está mutada en uno o más residuos de aminoácido para alterar su actividad helicasa. En algunas realizaciones, la enzima CRISPR está mutada en uno o más residuos de aminoácido para alterar su actividad nucleasa (por ejemplo, actividad endonucleasa o actividad exonucleasa). En algunas realizaciones, la enzima CRISPR está mutada en uno o más residuos de aminoácido para alterar su capacidad para asociarse funcionalmente con una guía de ARN. En algunas realizaciones, la enzima CRISPR está mutada en uno o más residuos de aminoácido para alterar su capacidad para asociarse funcionalmente con un ácido nucleico diana.
En algunas realizaciones, las enzimas CRISPR descritas en el presente documento son capaces de escindir una molécula de ácido nucleico diana. En algunas realizaciones, la enzima CRISPR escinde ambas cadenas de la molécula de ácido nucleico diana. Sin embargo, en algunas realizaciones, la enzima CRISPR está mutada en uno o más residuos de aminoácido para alterar su actividad de escisión. Por ejemplo, en algunas realizaciones, la enzima CRISPR puede comprender una o más mutaciones que hacen que la enzima sea incapaz de escindir un ácido nucleico diana. En otras realizaciones, la enzima CRISPR puede comprender una o más mutaciones de manera que la enzima es capaz de escindir una única cadena del ácido nucleico diana (es decir, actividad nickasa). En algunas realizaciones, la enzima CRISPR es capaz de escindir la cadena del ácido nucleico diana que es complementaria a la cadena con la que se hibrida la guía de ARN. En algunas realizaciones, la enzima CRISPR es capaz de escindir la cadena del ácido nucleico diana con la que se hibrida la guía de ARN.
En algunas realizaciones, una enzima CRISPR descrita en el presente documento puede modificarse por ingeniería genética para que comprenda una deleción en uno o más residuos de aminoácido para reducir el tamaño de la enzima al tiempo que se retienen una o más actividades funcionales deseadas (por ejemplo, actividad nucleasa y la capacidad de interactuar funcionalmente con una guía de ARN). La enzima CRISPR truncada puede usarse ventajosamente en combinación con sistemas de administración que tienen limitaciones de carga.
En un aspecto, la presente divulgación proporciona secuencias de ácido nucleico que son al menos el 10 %, el 15 %, el 20 %, el 25 %, el 30 %, el 35 %, el 40 %, el 45 %, el 50 %, el 55 %, el 60 %, el 65 %, el 70 %, el 75 %, el 80 %, el 85 %, el 90 %, el 91 %, el 92 %, el 93 %, el 94 %, el 95 %, el 96 %, el 97 %, el 98 % o el 99 % idénticas a las secuencias nucleicas descritas en el presente documento. En otro aspecto, la presente divulgación también proporciona secuencias de aminoácidos que son al menos el 10 %, el 15 %, el 20 %, el 25 %, el 30 %, el 35 %, el 40 %, el 45 %, el 50 %, el 55 %, el 60 %, el 65 %, el 70 %, el 75 %, el 80 %, el 85 %, el 90 %, el 91 %, el 92 %, el 93 %, el 94 %, el 95 %, el 96 %, el 97 %, el 98 % o el 99 % idénticas a las secuencias de aminoácidos descritas en el presente documento.
En algunas realizaciones, las secuencias de ácido nucleico tienen al menos una porción (por ejemplo, al menos 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 20, 30, 40, 50, 60, 70, 80, 90 ó 100 nucleótidos, por ejemplo, nucleótidos contiguos o no contiguos) que es la misma que las secuencias descritas en el presente documento. En algunas realizaciones, las secuencias de ácido nucleico tienen al menos una porción (por ejemplo, al menos 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 20, 30, 40, 50, 60, 70, 80, 90 ó 100 nucleótidos, por ejemplo, nucleótidos contiguos o no contiguos) que es diferente de las secuencias descritas en el presente documento.
En algunas realizaciones, las secuencias de aminoácidos tienen al menos una porción (por ejemplo, al menos 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 20, 30, 40, 50, 60, 70, 80, 90 ó 100 residuos de aminoácido, por ejemplo, residuos de aminoácido contiguos o no contiguos) que es la misma que las secuencias descritas en el presente documento. En algunas realizaciones, las secuencias de aminoácidos tienen al menos una porción (por ejemplo, al menos 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 20, 30, 40, 50, 60, 70, 80, 90 ó 100 residuos de aminoácido, por ejemplo, residuos de aminoácido contiguos o no contiguos) que es diferente de las secuencias descritas en el presente documento.
Para determinar el porcentaje de identidad de dos secuencias de aminoácidos, o de dos secuencias de ácido nucleico, las secuencias se alinean para fines de comparación óptima (por ejemplo, pueden introducirse huecos en una o ambas de una primera y una segunda secuencia de aminoácidos o de ácido nucleico para la alineación óptima y las secuencias no homólogas pueden descartarse para fines de comparación). En general, la longitud de una secuencia de referencia alineada para fines de comparación debe ser al menos el 80 % de la longitud de la secuencia de referencia y, en algunas realizaciones, es al menos el 90 %, el 95 % o el 100 % de la longitud de la secuencia de referencia. A continuación, se comparan los residuos de aminoácidos o nucleótidos en las posiciones de aminoácidos o posiciones de nucleótidos correspondientes. Cuando una posición en la primera secuencia está ocupada por el mismo residuo de aminoácido o nucleótido que la posición correspondiente en la segunda secuencia, entonces las moléculas son idénticas en esa posición. El porcentaje de identidad entre las dos secuencias es una función del número de posiciones idénticas compartidas por las secuencias, teniendo en cuenta el número de huecos y la longitud de cada hueco, que es necesario introducir para una alineación óptima de las dos secuencias. Para los fines de la presente divulgación, la comparación de secuencias y la determinación del porcentaje de identidad entre dos secuencias pueden lograrse usando una matriz de puntuación Blosum 62 con una penalización por hueco de 12, una penalización por extensión de hueco de 4 y una penalización por hueco de desplazamiento de marco de 5.
Más allá de las aplicaciones bioquímicas y diagnósticas descritas en el presente documento, los sistemas de CRISPR-Cas de tipo V-I programables descritos en el presente documento tienen importantes aplicaciones en células eucariotas, tales como la modificación terapéutica del genoma, incluyendo los ejemplos de modificaciones, pero sin limitarse a; corrección del genotipo, silenciamiento génico, inserción/deleción de secuencias genéticas (mediante reparación dirigida por homología o de otro modo), modificación de un solo nucleótido o regulación génica. Estas modalidades de modificación génica pueden usar la actividad nucleasa de Cas12i, el doble mellado o la unión a ADN programable de Cas12i catalíticamente inactiva fusionada con dominios efectores adicionales.
En algunas realizaciones, las proteínas asociadas a CRISPR y las proteínas accesorias descritas en el presente documento pueden fusionarse con una o más etiquetas peptídicas, incluyendo una etiqueta His, una etiqueta GST, una etiqueta FLAG o una etiqueta myc. En algunas realizaciones, las proteínas asociadas a CRISPR o las proteínas accesorias descritas en el presente documento pueden fusionarse con un resto detectable, tal como una proteína fluorescente (por ejemplo, proteína fluorescente verde o proteína fluorescente amarilla). Y en algunas realizaciones, las proteínas asociadas a CRISPR o las proteínas accesorias de esta divulgación se fusionan con un resto peptídico o no peptídico que permite que estas proteínas entren o se localicen en un tejido, una célula o una región de una célula. Por ejemplo, una proteína asociada a CRISPR o una proteína accesoria de esta divulgación (tal como Cas12i) puede comprender una secuencia de localización nuclear (NLS) tal como una NLS de SV40 (virus de simio 40), una NLS de c-Myc u otra NLS monopartita adecuada. La NLS puede fusionarse con un extremo N-terminal y/o C-terminal de la proteína asociada a CRISPR o la proteína accesoria, y puede fusionarse de manera individual (es decir, una única NLS) o concatenada (por ejemplo, una cadena de 2, 3, 4, etc., NLS).
En aquellas realizaciones en las que se fusiona una etiqueta con una proteína asociada a CRISPR, tal etiqueta puede facilitar la purificación basada en afinidad o basada en carga de la proteína asociada a CRISPR, por ejemplo, mediante cromatografía de líquidos o separación con perlas utilizando un reactivo de intercambio iónico o de afinidad inmovilizado. Como ejemplo no limitativo, una proteína asociada a CRISPR recombinante de esta divulgación (tal como Cas12i) comprende una etiqueta de polihistidina (His), y para la purificación se carga en una columna de cromatografía que comprende un ion metálico inmovilizado (por ejemplo, un ion Zn2+, Ni2+, Cu2+ quelado por un ligando quelante inmovilizado en la resina, resina que puede ser una resina preparada individualmente o una resina disponible comercialmente) o una columna lista para usar tal como la columna HisTrap FF comercializada por GE Healthcare Life Sciences, Marlborough, Massachusetts. Después de la etapa de carga, la columna se enjuaga opcionalmente, por ejemplo, usando una o más disoluciones tampón adecuadas, y luego la proteína etiquetada con His se eluye usando un tampón de elución adecuado. Alternativa o adicionalmente, si la proteína asociada a CRISPR recombinante de esta divulgación utiliza una etiqueta FLAG, tal proteína puede purificarse usando métodos de inmunoprecipitación conocidos en la industria. Otros métodos de purificación adecuados para proteínas asociadas a CRISPR o proteínas accesorias etiquetadas de esta divulgación resultarán evidentes para los expertos en la técnica.
Las proteínas descritas en el presente documento (por ejemplo, proteínas asociadas a CRISPR o proteínas accesorias) pueden administrarse o usarse como moléculas de ácido nucleico o polipéptidos. Cuando se usan moléculas de ácido nucleico, la molécula de ácido nucleico que codifica para las proteínas asociadas a CRISPR puede tener codones optimizados, tal como se comenta con más detalle a continuación. Pueden optimizarse los codones del ácido nucleico para su uso en cualquier organismo de interés, en particular células humanas o bacterias. Por ejemplo, el ácido nucleico puede tener codones optimizados para cualquier eucariota no humano, incluyendo ratones, ratas, conejos, perros, ganado o primates no humanos. Están disponibles fácilmente tablas de uso de codones, por ejemplo, en la “Base de datos de uso de codones” disponible en www.kazusa.orjp/codon/ y estas tablas pueden adaptarse de varios modos. Véase Nakamura et al. Nucl. Acids Res. 28:292 (2000). También están disponibles algoritmos informáticos para la optimización de codones de una secuencia particular para la expresión en una célula huésped particular, tales como Gene Forge (Aptagen; Jacobus, PA).
En algunos casos, los ácidos nucleicos de esta divulgación que codifican para proteínas asociadas a CRISPR o proteínas accesorias para la expresión en células eucariotas (por ejemplo, humanas u otras células de mamíferos, etc.) incluyen uno o más intrones, es decir, una o más secuencias no codificantes que comprenden, en un primer extremo (por ejemplo, un extremo 5'), una secuencia donadora de corte y empalme y, en un segundo extremo (por ejemplo, el extremo 3'), una secuencia aceptora de corte y empalme. Puede usarse cualquier donador de corte y empalme/aceptor de corte y empalme adecuado en las diversas realizaciones de esta divulgación, incluyendo, sin limitación, el intrón del virus de simio 40 (SV40), el intrón de beta-globina e intrones sintéticos. Alternativa o adicionalmente, los ácidos nucleicos de esta divulgación que codifican para proteínas asociadas a CRISPR o proteínas accesorias pueden incluir, en el extremo 3' de una secuencia codificante de ADN, una señal de parada de la transcripción tal como una señal de poliadenilación (poliA). En algunos casos, la señal de poliA está ubicada muy cerca de, o junto a, un intrón tal como el intrón de SV40. Guías de ARN
En algunas realizaciones, los sistemas de CRISPR descritos en el presente documento incluyen al menos una guía de ARN de tipo V-I. La arquitectura de muchas guías de ARN se conoce en la técnica (véanse, por ejemplo, las publicaciones internacionales n.os WO 2014/093622 y WO 2015/070083). En algunas realizaciones, los sistemas de CRISPR descritos en el presente documento incluyen múltiples guías de ARN (por ejemplo, dos, tres, cuatro, cinco, seis, siete, ocho o más guías de ARN).
En algunas realizaciones, los sistemas de CRISPR descritos en el presente documento incluyen al menos una guía de ARN de tipo V-I o un ácido nucleico que codifica para al menos una guía de ARN de tipo V-I. En algunas realizaciones, la guía de ARN incluye un ARNcr. Generalmente, los ARNcr descritos en el presente documento incluyen una secuencia de repetición directa y una secuencia espaciadora. En determinadas realizaciones, el ARNcr incluye, consiste esencialmente en o consiste en una secuencia de repetición directa unida a una secuencia guía o secuencia espaciadora. En algunas realizaciones, el ARNcr incluye una secuencia de repetición directa, una secuencia espaciadora y una secuencia de repetición directa (DR-espaciador-DR), que es típica de configuraciones de ARNcr precursor (pre-ARNcr) en otros sistemas de CRISPR. En algunas realizaciones, el ARNcr incluye una secuencia de repetición directa truncada y una secuencia espaciadora, que es típica de ARNcr procesado o maduro. En algunas realizaciones, la proteína efectora de CRISPR-Cas forma un complejo con la guía de ARN, y la secuencia espaciadora dirige el complejo a una unión específica de secuencia con el ácido nucleico diana que es complementario a la secuencia espaciadora.
Adecuadamente, los sistemas de CRISPR descritos en el presente documento comprenden al menos una guía de ARN de tipo V-I o ácidos nucleicos que codifican para una guía de ARN de tipo V-I, en los que la guía de ARN comprende una repetición directa. Adecuadamente, la guía de ARN de tipo V-I puede formar una estructura secundaria tal como una estructura de tallo-bucle, por ejemplo, tal como se describe en el presente documento. La repetición directa puede incluir dos tramos de nucleótidos que pueden ser complementarios entre sí, separados por nucleótidos intermedios de manera que la repetición directa puede hibridarse para formar el dúplex de ARN bicatenario (dúplex de ARNbc) dando como resultado una estructura de tallo-bucle en la que los dos tramos complementarios de nucleótidos forman un tallo y los nucleótidos intermedios forman un bucle o una horquilla (figura 3). Por ejemplo, los nucleótidos intermedios que forman el “bucle” tienen una longitud de desde aproximadamente 6 nucleótidos hasta aproximadamente 8 nucleótidos, o de aproximadamente 7 nucleótidos. En diferentes realizaciones, el tallo puede incluir al menos 2, al menos 3, al menos 4 ó 5 pares de bases.
Adecuadamente, la repetición directa puede incluir dos tramos complementarios de nucleótidos que tienen una longitud de aproximadamente 5 nucleótidos separados por aproximadamente siete nucleótidos intermedios. Algunas repeticiones directas a modo de ejemplo de los sistemas de tipo V-I se ilustran en la figura 3, adecuadamente cuando se parte de repeticiones directas de tipo V-I que se producen de manera natural, el experto puede imitar la estructura de tales repeticiones directas ilustradas en la figura 3.
La repetición directa puede incluir o consistir en de aproximadamente 22 a 40 nucleótidos, o de aproximadamente 23 a 38 nucleótidos, o de aproximadamente 23 a 36 nucleótidos.
En algunas realizaciones, los sistemas de CRISPR descritos en el presente documento incluyen una pluralidad de guías de ARN (por ejemplo, 2, 3, 4, 5, 10, 15 o más) o una pluralidad de ácidos nucleicos que codifican para una pluralidad de guías de ARN.
En algunas realizaciones, el sistema de CRISPR descrito en el presente documento incluye una guía de ARN o un ácido nucleico que codifica para la guía de ARN. En algunas realizaciones, la guía de ARN comprende o consiste en una secuencia de repetición directa y una secuencia espaciadora capaz de hibridarse (por ejemplo, se hibrida en condiciones apropiadas) con un ácido nucleico diana, en la que la secuencia de repetición directa comprende 5'-CCGUCNNNNNNNGACGG-3' (SEQ ID NO: 202) proximal a su extremo 3' y adyacente a la secuencia espaciadora. En algunas realizaciones, la guía de ARN comprende o consiste en una secuencia de repetición directa y una secuencia espaciadora capaz de hibridarse (por ejemplo, se hibrida en condiciones apropiadas) con un ácido nucleico diana, en la que la secuencia de repetición directa comprende 5'-GUGCCNNNNNNNGGCAC-3' (SEQ ID NO: 203) proximal a su extremo 3' y adyacente a la secuencia espaciadora. En algunas realizaciones, la guía de ARN comprende o consiste en una secuencia de repetición directa y una secuencia espaciadora capaz de hibridarse (por ejemplo, se hibrida en condiciones apropiadas) con un ácido nucleico diana, en la que la secuencia de repetición directa comprende 5'-GUGUCN5-6UGACAX1-3' (SEQ ID NO: 204) proximal al extremo 3' y adyacente a la secuencia espaciadora, en la que N5-6 se refiere a una secuencia contigua de 5 ó 6 bases nitrogenadas cualesquiera, y X1 se refiere a C o T o U.
Se proporcionan ejemplos de pares de proteína efectora y secuencias de repetición directa de guías de ARN en la tabla 5A. En algunas realizaciones, la secuencia de repetición directa comprende o consiste en una secuencia de ácido nucleico enumerada en la tabla 5A (por ejemplo, SEQ ID NO: 6-10, 19-24). En algunas realizaciones, la secuencia de repetición directa comprende o consiste en un ácido nucleico que tiene una secuencia de ácido nucleico enumerada en la tabla 5A con un truncamiento de los tres nucleótidos 5' iniciales. En algunas realizaciones, la secuencia de repetición directa comprende o consiste en un ácido nucleico que tiene una secuencia de ácido nucleico enumerada en la tabla 5A con un truncamiento de los cuatro nucleótidos 5' iniciales. En algunas realizaciones, la secuencia de repetición directa comprende o consiste en un ácido nucleico que tiene una secuencia de ácido nucleico enumerada en la tabla 5A con un truncamiento de los cinco nucleótidos 5' iniciales. En algunas realizaciones, la secuencia de repetición directa comprende o consiste en un ácido nucleico que tiene una secuencia de ácido nucleico enumerada en la tabla 5A con un truncamiento de los seis nucleótidos 5' iniciales. En algunas realizaciones, la secuencia de repetición directa comprende o consiste en un ácido nucleico que tiene una secuencia de ácido nucleico enumerada en la tabla 5A con un truncamiento de los siete nucleótidos 5' iniciales. En algunas realizaciones, la secuencia de repetición directa comprende o consiste en un ácido nucleico que tiene una secuencia de ácido nucleico enumerada en la tabla 5A con un truncamiento de los ocho nucleótidos 5' iniciales.
Multiplexación de guías de ARN
Se ha demostrado que los efectores de CRISPR-Cas CLUST.029130 (de tipo V-I) emplean más de una guía de ARN, permitiendo de ese modo la capacidad de estos efectores, y sistemas y complejos que los incluyen, para dirigirse a múltiples dianas de ácido nucleico diferentes. La proteína efectora de CRISPR-Cas o un ácido nucleico que codifica para la proteína efectora usados en el sistema de la invención comprende una secuencia de aminoácidos con una identidad de al menos el 95 % con SEQ ID NO: 5, SEQ ID NO: 14 o SEQ ID NO: 16. En algunas realizaciones, los sistemas de CRISPR descritos en el presente documento incluyen múltiples guías de ARN (por ejemplo, dos, tres, cuatro, cinco, seis, siete, ocho, nueve, diez, quince, veinte, treinta, cuarenta o más guías de a Rn ). En algunas realizaciones, los sistemas de CRISPR descritos en el presente documento incluyen una sola cadena de ARN o un ácido nucleico que codifica para una sola cadena de ARN, en los que las guías de ARN están dispuestas en tándem. La única cadena de a Rn puede incluir múltiples copias de la misma guía de ARN, múltiples copias de guías de ARN distintas, o combinaciones de las mismas.
En algunas realizaciones, las proteínas efectoras de CRISPR-Cas CLUST.029130 (de tipo V-I) se administran complejadas con múltiples guías de ARN dirigidas a diferentes ácidos nucleicos diana. En algunas realizaciones, las proteínas efectoras de CRISPR-Cas CLUST.029130 (de tipo V-I) pueden coadministrarse con múltiples guías de ARN, cada una específica para un ácido nucleico diana diferente. Se describen métodos de multiplexación usando proteínas asociadas a CRISPR, por ejemplo, en los documentos US 9.790.490 y EP 3009511.
Modificaciones de guías de ARN
Longitudes de espaciadores
La longitud del espaciador de las guías de ARN puede oscilar entre aproximadamente 15 y 50 nucleótidos. En algunas realizaciones, la longitud del espaciador de una guía de ARN es de al menos 16 nucleótidos, al menos 17 nucleótidos, al menos 18 nucleótidos, al menos 19 nucleótidos, al menos 20 nucleótidos, al menos 21 nucleótidos o al menos 22 nucleótidos. En algunas realizaciones, la longitud del espaciador es de desde 15 hasta 17 nucleótidos, desde 15 hasta 23 nucleótidos, desde 16 hasta 22 nucleótidos, desde 17 hasta 20 nucleótidos, desde 20 hasta 24 nucleótidos (por ejemplo, 20, 21, 22, 23 ó 24 nucleótidos), desde 23 hasta 25 nucleótidos (por ejemplo, 23, 24 ó 25 nucleótidos), desde 24 hasta 27 nucleótidos, desde 27 hasta 30 nucleótidos, desde 30 hasta 45 nucleótidos (por ejemplo, 30, 31, 32, 33, 34, 35, 40 ó 45 nucleótidos), desde 30 ó 35 hasta 40 nucleótidos, desde 41 hasta 45 nucleótidos, desde 45 hasta 50 nucleótidos, o más. En algunas realizaciones, la longitud del espaciador de una guía de ARN es de 31 nucleótidos. En algunas realizaciones, la longitud de repetición directa de la guía de ARN es de al menos 21 nucleótidos, o es de desde 21 hasta 37 nucleótidos (por ejemplo, 23, 24, 25, 30, 35 ó 36 nucleótidos). En algunas realizaciones, la longitud de repetición directa de la guía de ARN es de 23 nucleótidos.
Las secuencias de guía de ARN pueden modificarse de una manera que permite la formación del complejo de efector de CRISPR y la unión satisfactoria a la diana, mientras que al mismo tiempo no permite una actividad nucleasa satisfactoria (es decir, sin actividad nucleasa/sin causar indels). Estas secuencias guía modificadas se denominan “guías muertas” o “secuencias guía muertas”. Estas guías muertas o secuencias guía muertas pueden ser catalíticamente inactivas o conformacionalmente inactivas con respecto a la actividad nucleasa. Las secuencias guía muertas son normalmente más cortas que las respectivas secuencias guía que dan como resultado una escisión activa de ARN. En algunas realizaciones, las guías muertas son el 5 %, el 10 %, el 20 %, el 30 %, el 40 % o el 50 % más cortas que las respectivas guías de ARN que tienen actividad nucleasa. Las secuencias guía muertas de guías de ARN pueden tener desde 13 hasta 15 nucleótidos de longitud (por ejemplo, 13, 14 ó 15 nucleótidos de longitud), desde 15 hasta 19 nucleótidos de longitud o desde 17 hasta 18 nucleótidos de longitud (por ejemplo, 17 nucleótidos de longitud).
Por tanto, en un aspecto, la divulgación proporciona sistemas de CRISPR que no se producen de manera natural o diseñados por ingeniería genética que incluyen una enzima CRISPR funcional tal como se describe en el presente documento y una guía de a Rn (ARNg), en los que la ARNg comprende una secuencia guía muerta, mediante lo cual la ARNg es capaz de hibridarse con una secuencia diana de manera que el sistema de CRISPR se dirige a un locus genómico de interés en una célula sin actividad de escisión detectable.
Se describe una descripción detallada de guías muertas, por ejemplo, en el documento WO 2016094872.
Guías inducibles
Pueden generarse guías de ARN como componentes de sistemas inducibles. La naturaleza inducible de los sistemas permite el control espaciotemporal de la edición génica o la expresión génica. En algunas realizaciones, los estímulos para los sistemas inducibles incluyen, por ejemplo, radiación electromagnética, energía sonora, energía química y/o energía térmica.
En algunas realizaciones, la transcripción de la guía de ARN puede modularse mediante promotores inducibles, por ejemplo, activación transcripcional controlada por tetraciclina o doxiciclina (sistemas de expresión Tet-On y Tet-Off), sistemas de expresión génica inducibles por hormonas (por ejemplo, sistemas de expresión génica inducibles por ecdisona) y sistemas de expresión génica inducibles por arabinosa. Otros ejemplos de sistemas inducibles incluyen, por ejemplo, sistemas de activaciones de la transcripción de dos híbridos de molécula pequeña (FκΒP, ABA, etc.), sistemas inducibles por luz (fitocromo, dominios LOV o criptocromo) o efector transcripcional inducible por luz (LITE). Estos sistemas inducibles se describen, por ejemplo, en los documentos WO 2016205764 y US 8795965.
Modificaciones químicas
Pueden aplicarse modificaciones químicas a la estructura principal de fosfato, azúcar y/o base de la guía de ARN. Las modificaciones de la estructura principal tales como fosforotioatos modifican la carga en la estructura principal de fosfato y ayudan en la administración y la resistencia a la nucleasa del oligonucleótido (véase, por ejemplo, Eckstein, “Phosphorothioates, essential components of therapeutic oligonucleotides”, Nucl. Acid Ther., 24 (2014), págs. 374-387); las modificaciones de azúcares, tales como 2'-O-metilo (2'-OMe), 2'-F y ácido nucleico bloqueado (LNA), mejoran tanto el apareamiento de bases como la resistencia a nucleasas (véase, por ejemplo, Allerson et al. “Fully 2'-modified oligonucleotide duplexes with improved in vitro potency and stability compared to unmodified small interfering RNA”, J. Med. Chem., 48.4 (2005): 901-904). Bases modificadas químicamente, tales como 2-tiouridina o N6-metiladenosina, entre otras, pueden permitir un apareamiento de bases más fuerte o más débil (véase, por ejemplo, Bramsen et al., “Development of therapeutic-grade small interfering RNAs by chemical engineering”, Front. Genet. 20 de agosto de 2012; 3:154). Además, el ARN es susceptible de conjugaciones en los extremos 5' y 3' con una variedad de restos funcionales, incluyendo colorantes fluorescentes, polietilenglicol o proteínas.
Puede aplicarse una amplia variedad de modificaciones en las moléculas de guía de ARN sintetizadas químicamente. Por ejemplo, la modificación de un oligonucleótido con un 2'-OMe para mejorar la resistencia a la nucleasa puede cambiar la energía de unión del apareamiento de bases de Watson-Crick. Además, una modificación de 2'-OMe puede afectar a la forma en que el oligonucleótido interactúa con los reactivos de transfección, las proteínas o cualquier otra molécula en la célula. Los efectos de estas modificaciones pueden determinarse mediante pruebas empíricas.
En algunas realizaciones, la guía de ARN incluye una o más modificaciones de fosforotioato. En algunas realizaciones, la guía de ARN incluye uno o más ácidos nucleicos bloqueados con el fin de mejorar el apareamiento de bases y/o aumentar la resistencia a las nucleasas.
Puede encontrarse un resumen de estas modificaciones químicas, por ejemplo, en Kelley et al., “Versatility of chemically synthesized guide RNAs for CRISPR-Cas9 genome editing”, J. Biotechnol. 10 de septiembre de 2016; 233:74-83; el documento WO 2016205764; y el documento US 8795965 B2.
Modificaciones de secuencias
Las secuencias y las longitudes de las guías de ARN y los ARNcr descritos en el presente documento pueden optimizarse. En algunas realizaciones, la longitud optimizada de la guía de ARN puede determinarse identificando la forma procesada del ARNcr, o mediante estudios empíricos de longitud para guías de ARN, de ARNcr.
Las guías de ARN también pueden incluir una o más secuencias de aptámeros. Los aptámeros son moléculas de oligonucleótidos o péptidos que pueden unirse a una molécula diana específica. Los aptámeros pueden ser específicos para efectores de genes, activadores de genes o represores de genes. En algunas realizaciones, los aptámeros pueden ser específicos de una proteína, que a su vez es específica y recluta/se une a efectores de genes, activadores de genes o represores de genes específicos. Los efectores, activadores o represores pueden estar presentes en forma de proteínas de fusión. En algunas realizaciones, la guía de ARN tiene dos o más secuencias de aptámeros que son específicas para las mismas proteínas adaptadoras. En algunas realizaciones, las dos o más secuencias de aptámeros son específicas para diferentes proteínas adaptadoras. Las proteínas adaptadoras pueden incluir, por ejemplo, MS2, PP7, Qp, F2, GA, fr, JP501, M12, R17, BZ13, JP34, JP500, KU1, M11, MX1, TW18, VK, SP, FI, ID2, NL95, TW19, AP205, <^ Cb5, <^ Cb8r, ^Cb12r, <^ Cb23r, 7s y PRR1. Por consiguiente, en algunas realizaciones, el aptámero se selecciona de proteínas de unión que se unen específicamente a una cualquiera de las proteínas adaptadoras tal como se describe en el presente documento. En algunas realizaciones, la secuencia de aptámero es un bucle de MS2. Puede encontrarse una descripción detallada de los aptámeros, por ejemplo, en Nowak et al., “Guide RNA engineering for versatile Cas9 functionality”, Nucl. Acid. Res., 16 de noviembre de 2016; 44(20):9555-9564; y el documento WO 2016205764.
Requisitos de coincidencia con la secuencia diana:guía
En sistemas de CRISPR clásicos, el grado de complementariedad entre una secuencia guía y su secuencia diana correspondiente puede ser de aproximadamente el 50 %, el 60 %, el 75 %, el 80 %, el 85 %, el 90 %, el 95 %, el 97,5 %, el 99 % o el 100 %. En algunas realizaciones, el grado de complementariedad es del 100 %. La guías de ARN pueden tener aproximadamente 5, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 35, 40, 45, 50, 75 o más nucleótidos de longitud.
Para reducir las interacciones inespecíficas, por ejemplo, para reducir la interacción de la guía con una secuencia diana que tiene baja complementariedad, pueden introducirse mutaciones en los sistemas de CRISPR de modo que los sistemas de CRISPR puedan distinguir entre secuencias diana e inespecíficas que tienen más del 80 %, el 85 %, el 90 % o el 95 % de complementariedad. En algunas realizaciones, el grado de complementariedad es de desde el 80 % hasta el 95 %, por ejemplo, aproximadamente el 83 %, el 84 %, el 85 %, el 86 %, el 87 %, el 88 %, el 89 %, el 90 %, el 91 %, el 92 %, el 93 %, el 94 % o el 95 % (por ejemplo, distinguiendo entre una diana que tiene 18 nucleótidos de una no diana de 18 nucleótidos que tiene 1, 2 ó 3 apareamientos erróneos). Por consiguiente, en algunas realizaciones, el grado de complementariedad entre una secuencia guía y su secuencia diana correspondiente es mayor del 94,5 %, el 95 %, el 95,5 %, el 96 %, el 96,5 %, el 97 %, el 97,5 %, el 98 %, el 98,5 %, el 99 %, el 99,5 % o el 99,9 %. En algunas realizaciones, el grado de complementariedad es del 100 %. Se sabe en el campo que no se requiere una complementariedad completa siempre que haya suficiente complementariedad para ser funcional. Pueden aprovecharse modulaciones de la eficiencia de escisión mediante la introducción de apareamientos erróneos, por ejemplo, uno o más apareamientos erróneos, tal como 1 ó 2 apareamientos erróneos, entre una secuencia espaciadora y una secuencia diana, incluyendo la posición del apareamiento erróneo a lo largo del espaciador/diana. Cuanto más central (es decir, no en los extremos 3' ó 5') esté ubicado un apareamiento erróneo, por ejemplo, un apareamiento erróneo doble, más se ve afectada la eficiencia de escisión. Por consiguiente, al elegir posiciones de apareamiento erróneo a lo largo de la secuencia espaciadora, puede modularse la eficiencia de escisión. Por ejemplo, si se desea menos del 100 % de escisión de las dianas (por ejemplo, en una población celular), pueden introducirse 1 ó 2 apareamientos erróneos entre la secuencia espaciadora y diana en las secuencias espaciadoras.
Optimización de sistemas de CRISPR para su uso en organismos seleccionados
Optimización de codones
La invención contempla todas las posibles variaciones de ácidos nucleicos, tales como ADNc, que podrían realizarse seleccionando combinaciones basadas en posibles elecciones de codones. Estas combinaciones se realizan de acuerdo con el código genético de tripletes convencional tal como se aplica al polinucleótido que codifica para la variante que se produce de manera natural, y la totalidad de tales variaciones deben considerarse como dadas a conocer específicamente. En el presente documento se dan a conocer secuencias de nucleótidos que codifican para variantes de proteínas efectoras asociadas a CRISPR-Cas de tipo V-I cuyos codones se han optimizado para su expresión en bacterias (por ejemplo, E. coli) y en células humanas. Por ejemplo, las secuencias con codones optimizados para células humanas pueden generarse sustituyendo los codones de la secuencia de nucleótidos que aparecen con menor frecuencia en células humanas por codones que aparecen con mayor frecuencia en células humanas. La frecuencia de aparición de los codones puede determinarse computacionalmente mediante métodos conocidos en la técnica. Se ha publicado un ejemplo de cálculo de estas frecuencias de codones para diversas células huésped (por ejemplo, E. coli, levadura, insecto, C. elegans, D. melanogaster, ser humano, ratón, rata, cerdo, P. pastoris, A. thalian, maíz y tabaco) o se ha puesto a disposición por fuentes tales como la herramienta de tabla de frecuencia de uso de codones GenScript® (a continuación se incluyen tablas de uso de codones a modo de ejemplo para E. coli y seres humanos).
Tabla 1. Tabla de uso de codones para E. coli
Figure imgf000030_0001
Tabla 2. Tabla de uso de codones para seres humanos
Figure imgf000030_0002
Figure imgf000031_0001
Métodos de uso de sistemas de CRISPR
Los sistemas de CRISPR descritos en el presente documento tienen una amplia variedad de utilidades, incluyendo la modificación (por ejemplo, supresión, inserción, translocación, inactivación o activación) de un polinudeótido diana en una multiplicidad de tipos de células. Los sistemas de CRISPR tienen un amplio espectro de aplicaciones en, por ejemplo, la detección de ADN/ARN (por ejemplo, desbloqueo de indicador enzimático de alta sensibilidad específico (SHERLOCK)), el seguimiento y etiquetado de ácidos nucleicos, ensayos de enriquecimiento (extracción de la secuencia deseada del acervo), la detección de ADN tumoral circulante, la preparación de bibliotecas de última generación, el cribado de fármacos, el diagnóstico y pronóstico de enfermedades y el tratamiento de diversos trastornos genéticos. Sin querer limitarse a ninguna teoría en particular, los sistemas de CRISPR que incluyen una proteína Cas12i pueden presentar una mayor actividad o pueden ser preferentemente activos cuando se dirigen a determinados entornos, tales como plásmidos de ADN, ADN superenrollado o loci genómicos transcripcionalmente activos.
Sistemas de edición del genoma generales
El término “sistema de edición del genoma” se refiere a un sistema de CRISPR diseñado por ingeniería genética de la presente divulgación que tiene actividad de edición de ADN guiada por ARN. Los sistemas de edición del genoma de la presente divulgación incluyen al menos dos componentes de los sistemas de CRISPR descritos anteriormente: una guía de ARN y una proteína efectora de CRISPR relacionada. En determinadas realizaciones de esta divulgación, el efector es una proteína Cas12i y la guía de ARN es un guía de ARN de tipo V-I relacionada. Tal como se describió anteriormente, estos dos componentes forman un complejo que es capaz de asociarse con una secuencia de ácido nucleico específica y editar el ADN en, o alrededor de, esa secuencia de ácido nucleico, por ejemplo, realizando una o más de una rotura monocatenaria (una SSB o mella), una rotura bicatenaria (un DSB), una modificación de base nitrogenada, una metilación o desmetilación de ADN, una modificación de cromatina, etc.
En determinadas realizaciones, un sistema de edición del genoma es transitoriamente activo (por ejemplo, incorporando un efector de CRISPR inducible tal como se comentó anteriormente), mientras que en otras realizaciones, el sistema es constitutivamente activo (por ejemplo, está codificado por ácidos nucleicos en los que la expresión de los componentes del sistema de CRISPR está controlada por uno o más promotores fuertes).
Los sistemas de edición del genoma de la presente divulgación, cuando se introducen en células, pueden alterar (a) el ADN genómico (ADNg) endógeno incluyendo, sin limitación, ADN que codifica para, por ejemplo, una diana génica de interés, una secuencia exónica de un gen, una secuencia intrónica de un gen, un elemento regulador de un gen o grupo de genes, etc.; (b) ADN extragenómico endógeno tal como ADN mitocondrial (ADNmt); y/o (c) ADN exógeno tal como un genoma viral no integrado, un plásmido, un cromosoma artificial, etc. A lo largo de esta divulgación, estos sustratos de ADN se denominan “ADN diana”.
En casos en los que la edición del genoma funciona generando SSB o DSB, las alteraciones provocadas por el sistema pueden adoptar la forma de inserciones o deleciones cortas de ADN, que se denominan colectivamente “indels”. Estas indels pueden formarse dentro de, o próximas a, un sitio de escisión predicho que normalmente está próximo a la secuencia de PAM y/o dentro de una región de complementariedad a la secuencia espaciadora, aunque en algunos casos pueden producirse indels fuera de tal sitio de escisión predicho. Sin querer limitarse a ninguna teoría, se cree que las indels normalmente son el resultado de la reparación de una SSB o DSB mediante rutas de reparación de daño en el ADN “propensas a errores”, tales como la unión de extremos no homólogos (NHEJ).
En algunos casos, se usa edición del genoma para generar dos DSB dentro de 50, 60, 70, 80, 90, 100, 200, 300, 400, 500, 600, 700, 800, 900, 1000, 1250, 1500, 1750 ó 2000 pares de bases entre sí, lo que da como resultado uno o más desenlaces, incluyendo la formación de una indel en uno o ambos sitios de escisión, así como la deleción o inversión de una secuencia de ADN dispuesta entre las DSB.
Alternativamente, los sistemas de edición del genoma de esta divulgación pueden alterar el ADN diana a través de la integración de nuevas secuencias. Estas nuevas secuencias pueden ser distintas de la secuencia existente del ADN diana (como ejemplo no limitativo, integradas por NHEJ mediante la ligación de extremos romos) o pueden corresponder a un molde de ADN que tiene una o más regiones que son homólogas a una región del ADN diana. La integración de moldes de secuencias homólogas también se denomina “reparación dirigida por homología” o “HDR”. El ADN molde para la HDR puede ser endógeno con respecto a la célula, incluyendo, sin limitación, en forma de una secuencia homóloga ubicada en otra copa del mismo cromosoma que el ADN diana, una secuencia homóloga de la misma agrupación de genes que el ADN diana, etc. Alternativa o adicionalmente, el ADN molde puede proporcionarse de manera exógena, incluyendo, sin limitación, como ADN lineal o circular libre, como ADN unido (de manera covalente o no covalente) a uno o más componentes del sistema de edición del genoma, o como parte de un genoma de vector.
En algunos casos, la edición comprende el silenciamiento temporal o permanente de un gen mediante interferencia mediada por CRISPR, tal como describen Matthew H. Larson et al. “CRISPR interference (CRISPRi) for sequence-specific control of gene expression”, Nature Protocols 8, 2180-2196 (2013).
Los sistemas de edición del genoma pueden incluir otros componentes, incluyendo, sin limitación, uno o más dominios funcionales heterólogos que median en la modificación de base nitrogenada específica de sitio, la metilación o desmetilación de ADN, o la modificación de cromatina. En algunos casos, el dominio funcional heterólogo se une covalentemente a una proteína asociada a CRISPR tal como Cas12i, por ejemplo, por medio de un enlace peptídico directo o un ligador de péptidos intermedios. Las fusiones de este tipo se describen con mayor detalle a continuación. En algunas realizaciones, el dominio funcional heterólogo se une covalentemente al ARNcr, por ejemplo, por medio de una reticulación química. Y en algunas realizaciones, uno o más grupos funcionales pueden asociarse de manera no covalente con una proteína asociada a CRISPR y/o un ARNcr. Esto se realiza, de diversas maneras, por medio de un aptámero unido al ARNcr y/o al grupo funcional heterólogo, un motivo peptídico fusionado con la proteína asociada a CRISPR, y un dominio de unión configurado para unir tal motivo fusionado con el dominio funcional heterólogo, o viceversa.
En otras partes en esta memoria descriptiva se describen con mayor detalle diseños de sistemas de edición del genoma y desenlaces de la edición del genoma.
Detección de ADN/ARN
En un aspecto, el sistema de CRISPR-Cas descrito en el presente documento puede usarse en la detección de ADN/ARN mediante detección de ADN. Pueden reprogramarse ADNasas guiadas por ARN efector único con guías de ARN para proporcionar una plataforma para la detección de ADN monocatenario (ADNmc) específico. Tras el reconocimiento de su diana de ADN, una proteína efectora de CRISPR de tipo V-I activada participa en la escisión “colateral” de ADNmc cercano sin similitud de secuencia con la secuencia diana. Esta actividad de escisión colateral programada por ARN permite que los sistemas de CRISPR detecten la presencia de un ADN específico mediante la degradación no específica de ADNmc marcado.
La actividad ADNasamc colateral puede combinarse con un indicador en aplicaciones de detección de ADN tales como un método denominado método de indicador trans de CRISPR dirigido por endonucleasa de ADN (DETECTR), que cuando se combina con amplificación logra una sensibilidad atomolar para la detección de ADN (véase, por ejemplo, Chen et al., Science, 360(6387):436-439, 2018). Una aplicación del uso de las enzimas descritas en el presente documento es degradar ADNmc no diana en un entorno in vitro. Una molécula de ADNmc “indicador” que une un fluoróforo y un extintor también puede añadirse sistema al in vitro, junto con una muestra desconocida de ADN (o bien monocatenario o bien bicatenario). Tras reconocer la secuencia diana en el fragmento desconocido de ADN, el complejo de vigilancia que contiene un efector de tipo V-I escinde el ADNmc indicador dando como resultado una lectura fluorescente.
En otras realizaciones, el método SHERLOCK (desbloqueo de indicador enzimático de alta sensibilidad específico) también proporciona una plataforma de detección de ácidos nucleicos in vitro con sensibilidad atomolar (o de molécula única) basándose en la amplificación de ácidos nucleicos y la escisión colateral de un ADNmc indicador, lo que permite la detección en tiempo real de la diana. Se describen en detalle métodos de uso de CRISPR en SHERLOCK, por ejemplo, en Gootenberg, et al. “Nucleic acid detection with CRISPR-Cas13a/C2c2”, Science, 356(6336):438-442 (2017).
En algunas realizaciones, los sistemas de CRISPR descritos en el presente documento pueden usarse en hibridación in situ de fluorescencia resistente a errores multiplexada (MERFISH). Estos métodos se describen en, por ejemplo, Chen et al., “Spatially resolved, highly multiplexed RNA profiling in single cells”, Science, 24 de abril de 2015; 348(6233):aaa6090.
En algunas realizaciones, los sistemas de CRISPR descritos en el presente documento pueden usarse para detectar un ADN diana en una muestra (por ejemplo, una muestra clínica, una célula o un lisado celular). La actividad ADNasa colateral de las proteínas efectoras de CRISPR-Cas CLUST.029130 (de tipo V-I) descritas en el presente documento se activa cuando las proteínas efectoras se unen a un ácido nucleico diana. Al unirse al ADN diana de interés, la proteína efectora escinde un ADNmc detector marcado para generar o cambiar una señal (por ejemplo, una señal aumentada o una señal disminuida), permitiendo de ese modo la detección cualitativa y cuantitativa del ADN diana en la muestra. La detección y cuantificación específicas de ADN en la muestra permite multitud de aplicaciones, incluyendo el diagnóstico.
En algunas realizaciones, los métodos incluyen a) poner en contacto una muestra con: (i) una guía de ARN (por ejemplo, ARNcr) y/o un ácido nucleico que codifica para la guía de ARN, en los que la guía de ARN consiste en una secuencia de repetición directa y una secuencia espaciadora capaz de hibridarse con el ARN diana; (ii) una proteína efectora de CRISPR-Cas CLUST.029130 (de tipo V-I) y/o un ácido nucleico que codifica para la proteína efectora; y (iii) un ADNmc detector marcado; en los que la proteína efectora se asocia con la guía de a Rn para formar un complejo de vigilancia; en los que el complejo de vigilancia se hibrida con el ADN diana; y en los que, tras la unión del complejo de vigilancia al ADN diana, la proteína efectora presenta actividad ADNasa colateral y escinde el ADNmc detector marcado; y b) medir una señal detectable producida por la escisión del ADNmc detector marcado, en los que dicha medición proporciona la detección del ADN diana en la muestra.
En algunas realizaciones, los métodos incluyen además comparar la señal detectable con una señal de referencia y determinar la cantidad de ADN diana en la muestra. En algunas realizaciones, la medición se realiza usando detección de nanopartículas de oro, polarización de fluorescencia, transición/dispersión de fase coloidal, detección electroquímica y detección basada en semiconductores. En algunas realizaciones, el ADNmc detector marcado incluye un par de colorantes emisores de fluorescencia, un par de transferencia de energía por resonancia de fluorescencia (FRET) o un par de extintor/fluoróforo. En algunas realizaciones, tras la escisión del ADNmc detector marcado por la proteína efectora, disminuye o aumenta una cantidad de señal detectable producida por el ADNmc detector marcado. En algunas realizaciones, el ADNmc detector marcado produce una primera señal detectable antes de la escisión por la proteína efectora y una segunda señal detectable después de la escisión por la proteína efectora.
En algunas realizaciones, se produce una señal detectable cuando la proteína efectora escinde el ADNmc detector marcado. En algunas realizaciones, el ADNmc detector marcado incluye una base nitrogenada modificada, un resto de azúcar modificado, un enlace de ácido nucleico modificado o una combinación de los mismos.
En algunas realizaciones, los métodos incluyen la detección multicanal de múltiples ADN diana independientes en una muestra (por ejemplo, dos, tres, cuatro, cinco, seis, siete, ocho, nueve, diez, quince, veinte, treinta, cuarenta o más a Rn diana) mediante el uso de múltiples sistemas de CRISPR-Cas CLUST.029130 (de tipo V-I), cada uno de los cuales incluye una proteína efectora ortóloga distinta y guías de ARN correspondientes, lo que permite la diferenciación de múltiples ADN diana en la muestra. En algunas realizaciones, los métodos incluyen la detección multicanal de múltiples ADN diana independientes en una muestra, con el uso de múltiples casos de sistemas de CRISPR-Cas CLUST.029130 (de tipo V-I), cada uno de los cuales contiene una proteína efectora ortóloga con sustratos de ADNasamc colateral diferenciables. Se describen métodos de detección de un ADN en una muestra usando proteínas asociadas a CRISPR, por ejemplo, en la publicación de patente estadounidense n.° 2017/0362644.
Seguimiento y etiquetado de ácidos nucleicos
Los procesos celulares dependen de una red de interacciones moleculares entre proteínas, ARN y ADN. La detección precisa de las interacciones proteína-ADN y proteína-ARN es clave para comprender tales procesos. Las técnicas de etiquetado de proximidad in vitro emplean una etiqueta de afinidad combinada con un grupo indicador, por ejemplo, un grupo fotoactivable, para etiquetar polipéptidos y ADN en las proximidades de una proteína o un a Dn de interés in vitro. Después de la irradiación UV, los grupos fotoactivables reaccionan con las proteínas y otras moléculas que están en proximidad estrecha con las moléculas etiquetadas, marcándolas. Las moléculas de interacción marcadas pueden recuperarse e identificarse posteriormente. Las proteínas efectoras de direccionamiento al ADN pueden usarse, por ejemplo, para dirigir sondas a secuencias de ADN seleccionadas. Estas aplicaciones también pueden aplicarse en modelos animales para la obtención de
imágenes in vivo de enfermedades o tipos de células difíciles de cultivar. Los métodos de seguimiento y etiquetado de ácidos nucleicos se describen, por ejemplo, en los documentos US 8795965; WO 2016205764; y
WO 2017070605.
Edición del genoma usando nickasas CRISPR emparejadas
Los sistemas de CRISPR descritos en el presente documento pueden usarse en tándem de manera que dos
enzimas de mellado Cas12i, o una enzima Cas12i y otra enzima CRISPR-Cas con actividad de mellado, dirigidas
por un par de guías de ARN a cadenas opuestas de un locus diana, pueden generar una rotura bicatenaria con proyecciones. Este método puede reducir la probabilidad de modificaciones inespecíficas, porque se espera que
se produzca una rotura bicatenaria sólo en los loci donde ambas enzimas generan una mella, aumentando de
ese modo la especificidad de edición del genoma. Este método se denomina estrategia de “doble mellado” o
“nickasa emparejada” y se describe, por ejemplo, en Ran et al., “Double nicking by RNA-guided CRISPR Cas9
for enhanced genoma editing specificity”, Cell, 12 de septiembre de 2013; 154(6):1380-1389, y en Mali et al.,
“CAS9 transcriptional activators for target specificity screening and paired nickases for cooperative genome engineering”, Nature Biotechnology, 1 de agosto de 2013; 31:833-838.
Las primeras aplicaciones de nickasas emparejadas demostraron la utilidad de esta estrategia en líneas de
células de mamífero. Se han descrito aplicaciones de nickasas emparejadas en la planta modelo Arabidopsis
(por ejemplo, en Fauser et al., “Both CRISPR/Cas-based nucleases and nickases can be used efficiently for
genome engineering in Arabidopsis thaliana”, The Plant Journal 79(2):348-59 (2014), y Shiml et al., “The CRISPR/Cas system can be used as nuclease for in planta gene targeting and as paired nickases for directed mutagenesis in Arabidopsis resulting in heritable progeny”, The Plant Journal 80(6): 1139-50 (2014); en cultivos
tales como en arroz (por ejemplo, en Mikami et al., “Precision Targeted Mutagenesis via Cas9 Paired Nickases in
Rice”, Plant and Cell Physiology 57(5):1058-68 (2016) y en trigo (por ejemplo, en Cermák et al., “A Multipurpose
Toolkit to Enable Advanced Genome Engineering in Plants”, Plant Cell 29: 1196-1217 (2017); en bacterias (por
ejemplo, en Standage-Beier et al., “Targeted Large-Scale Deletion of Bacterial Genomes Using CRISPR-Nickases”, ACS Synthetic Biology 4(11): 1217-25 (2015); y en células humanas primarias con fines terapéuticos
(por ejemplo, en Dabrowska et al., “Precise Excision of the CAG Tract from the Huntingtin Gene by Cas9 Nickases”, Frontiers in Neuroscience 12:75 (2018), y en Kocher et al., “Cut and Paste: Efficient Homology-Directed Repair of a Dominant Negative KRT14 Mutation via CRISPR/Cas9 Nickases”, Molecular Therapy 25(11):2585-2598 (2017)).
Los sistemas de CRISPR descritos en el presente documento también pueden usarse como nickasas emparejadas para detectar uniones de corte y empalme tal como se describe, por ejemplo, en Santo y Paik, “ splice junction-targeted CRISPR approach (spJCRISPR) reveals human FOXO3B to be a protein-coding gene”,
Gene 673:95-101 (2018).
Los sistemas de CRISPR descritos en el presente documento también pueden usarse como nickasas emparejadas para insertar moléculas de ADN en loci diana tal como se describe, por ejemplo, en Wang et al., “Therapeutic Genome Editing for Myotonic Dystrophy Type 1 Using CRISPR/Cas9”, Molecular Therapy 26(11):2617-2630 (2018). Los sistemas de CRISPR descritos en el presente documento también pueden usarse
como nickasas individuales para insertar genes tal como se describe, por ejemplo, en Gao et al., “Single Cas9
nickase induced generation of NRAMP1 knockin cattle with reduced off target effects”, Genome Biology 18(1):13
(2017).
Potenciación de la edición de bases usando nickasas CRISPR
Los sistemas de CRISPR descritos en el presente documento pueden usarse para aumentar la eficiencia de la
edición de bases de CRISPR. En la edición de bases, un dominio de proteína con actividad de modificación de nucleótidos de ADN (por ejemplo, desaminación de citidina) se fusiona con una enzima CRISPR.Cas programable que se ha desactivado por mutación para dejar de presentar actividad de escisión de ADN bicatenario. En algunas realizaciones, se ha demostrado que el uso de una nickasa como proteína Cas programable mejora la eficiencia de la edición de bases tal como se describe, por ejemplo, en Komor et al., “Programmable editing of a target base in genomic DNA without double-stranded DNA cleavage”, Nature
533:420-424 (2016), y Nishida et al., “Targeted nucleotide editing using hybrid prokaryotic and vertebrate
adaptive immune systems”, Science 353 (6305): aaf8729 (2016). Se plantea la hipótesis de que una nickasa que
mella la cadena no editada del locus diana estimula las rutas de reparación de ADN endógeno, tal como la reparación de apareamientos erróneos o la reparación por escisión de bases de parche largo, que preferentemente resuelve un emparejamiento erróneo generado por la edición de bases a un alelo deseado, o proporciona una mejor accesibilidad del dominio catalítico de edición al ADN diana.
Mutagénesis dirigida y marcaje de ADN con nickasas y ADN polimerasas
Los sistemas de CRISPR descritos en el presente documento pueden usarse junto con proteínas que actúan sobre ADN mellado. Una de tales clases de proteínas son las ADN polimerasas de traducción de mellas, tales como ADN polimerasa I de E. coli o ADN polimerasa Taq.
En algunas realizaciones, el sistema de CRISPR (por ejemplo, una nickasa CRISPR) puede fusionarse con una ADN polimerasa I propensa a errores. Esta proteína de fusión puede seleccionarse como diana con una guía de ARN para generar una mella en un sitio de ADN. Luego, la ADN polimerasa inicia la síntesis de ADN en la mella, desplazando los nucleótidos en el sentido de 3', y, dado que se usa una polimerasa propensa a errores, dando como resultado la mutagénesis del locus diana. Pueden usarse variantes de polimerasa con sesgos variables de procesividad, fidelidad e incorporación errónea para influir en las características de los mutantes que se generan. Este método, denominado EvolvR, se describe en detalle, por ejemplo, en Halperin et al., “CRISPR-guided DNA polymerases enable diversification of all nucleotides in a tunable window”, Nature 560, 248-252 (2018).
En algunas realizaciones, puede usarse una nickasa CRISPR en un protocolo de marcaje de ADN de traducción de mellas. La traducción de mellas, descrita por primera vez por Rigby et al. en 1977, implica la incubación de ADN con una enzima de mellado de ADN, tal como ADNasa I, que crea una o más mellas en la molécula de ADN. A continuación, se usa una ADN polimerasa de traducción de mellas, tal como ADN polimerasa I, para incorporar residuos de ácido nucleico residuos marcados en los sitios mellados. Se describen en detalle métodos para aprovechar la programabilidad de las nickasas CRISPR para etiquetar covalentemente repeticiones teloméricas con colorantes fluorescentes, usando una variante de un protocolo de marcaje de traducción de mellas clásico, por ejemplo, en McCaffery et al., “High-throughput single-molecule telomere characterization”, Genome Research 27:1904-1915 (2017). Este método permite un análisis resuelto por haplotipo de longitudes de telómero a nivel de molécula individual.
Seguimiento y etiquetado de ácidos nucleicos
Los procesos celulares dependen de una red de interacciones moleculares entre proteínas, ARN y ADN. La detección precisa de las interacciones proteína-ADN y proteína-ARN es clave para comprender tales procesos. Las técnicas de etiquetado de proximidad in vitro emplean una etiqueta de afinidad combinada con un grupo indicador, por ejemplo, un grupo fotoactivable, para etiquetar polipéptidos y ARN en las proximidades de una proteína o un a Rn de interés in vitro. Después de la irradiación UV, los grupos fotoactivables reaccionan con las proteínas y otras moléculas que están en proximidad estrecha con las moléculas etiquetadas, marcándolas. Las moléculas de interacción marcadas pueden recuperarse e identificarse posteriormente. Las proteínas efectoras de direccionamiento al ARN pueden usarse, por ejemplo, para dirigir sondas a secuencias de ARN seleccionadas. Estas aplicaciones también pueden aplicarse en modelos animales para la obtención de imágenes in vivo de enfermedades o tipos de células difíciles de cultivar. Los métodos de seguimiento y etiquetado de ácidos nucleicos se describen, por ejemplo, en los documentos US 8795965; WO 2016205764; y WO 2017070605.
Cribado de alto rendimiento
Los sistemas de CRISPR descritos en el presente documento pueden usarse para preparar bibliotecas de secuenciación de última generación (NGS). Por ejemplo, para crear una biblioteca de NGS rentable, los sistemas de CRISPR pueden usarse para alterar la secuencia codificante de un gen diana, y los clones transfectados con enzimas CRISPR pueden cribarse simultáneamente mediante secuenciación de última generación (por ejemplo, en el sistema Ion Torrent PGM). Puede encontrarse una descripción detallada sobre cómo preparar bibliotecas de NGS, por ejemplo, en Bell et al., “A high-throughput screening strategy for detecting CRISPR-Cas9 induced mutations using next-generation sequencing”, BMC Genomics, 15.1 (2014): 1002.
Microorganismos modificados por ingeniería genética
Se usan ampliamente microorganismos (por ejemplo, E. coli, levadura y microalgas) para biología sintética. El desarrollo de la biología sintética tiene una amplia utilidad, incluyendo diversas aplicaciones clínicas. Por ejemplo, los sistemas de CRISPR programables descritos en el presente documento pueden usarse para dividir proteínas de dominios tóxicos para la muerte celular dirigida, por ejemplo, usando ARN ligado al cáncer como transcrito diana. Además, las rutas que implican interacciones proteína-proteína pueden verse influidas en sistemas biológicos sintéticos con, por ejemplo, complejos de fusión con los efectores apropiados tales como cinasas o enzimas.
En algunas realizaciones, pueden introducirse secuencias de guía de ARN que se dirigen a secuencias de fagos en el microorganismo. Por tanto, la divulgación también proporciona métodos de vacunación de un microorganismo (por ejemplo, una cepa de producción) contra la infección por fagos.
En algunas realizaciones, los sistemas de CRISPR proporcionados en el presente documento pueden usarse para modificar por ingeniería genética microorganismos, por ejemplo, para mejorar el rendimiento o mejorar la eficiencia de la fermentación. Por ejemplo, los sistemas de CRISPR descritos en el presente documento pueden usarse para modificar por ingeniería genética microorganismos, tales como levadura, para generar biocombustibles o biopolímeros a partir de azúcares fermentables, o para degradar lignocelulosa de origen vegetal derivada de desechos agrícolas como fuente de azúcares fermentables. Más particularmente, los métodos descritos en el presente documento pueden usarse para modificar la expresión de genes endógenos requeridos para la producción de biocombustibles y/o para modificar genes endógenos, que pueden interferir con la síntesis de biocombustibles. Estos métodos de modificación por ingeniería genética de microorganismos se describen, por ejemplo, en Verwaal et al., “CRISPR/Cpf1 enables fast and simple genome editing of Saccharomyces cerevisiae”, Yeast, 8 de septiembre de 2017. doi: 10.1002/yea.3278; y Hlavova et al., “Improving microalgae for biotechnology-from genetics to synthetic biology”, Biotechnol. Adv., 1 de noviembre de 2015; 33:1194-203.
En algunas realizaciones, los sistemas de CRISPR descritos en el presente documento pueden usarse para modificar por ingeniería genética microorganismos que presentan rutas de reparación defectuosas, tales como la bacteria celulolítica mesófila Clostridium cellulolyticum, un organismo modelo para la investigación bioenergética. En algunas realizaciones, puede usarse una nickasa CRISPR para introducir mellas individuales en un locus diana, lo que puede dar como resultado la inserción de un molde de ADN proporcionado de manera exógena mediante recombinación homóloga. Se describe un método detallado sobre cómo usar una nickasa CRISPR para editar microbios con reparación defectuosa, por ejemplo, en Xu et al., “Efficient Genome Editing in Clostridium cellulolyticum via CRISPR-Cas9 Nickase”, Appl Environ Microbiology 81:4423-4431 (2015).
En algunas realizaciones, los sistemas de CRISPR proporcionados en el presente documento pueden usarse para inducir muerte o latencia de una célula (por ejemplo, un microorganismo tal como un microorganismo modificado por ingeniería genética). Estos métodos pueden usarse para inducir latencia o muerte de una multitud de tipos de células, incluyendo células procariotas y eucariotas, incluyendo, pero sin limitarse a, células de mamíferos (por ejemplo, células cancerosas o células de histocultivo), protozoos, células fúngicas, células infectadas con un virus, células infectadas con una bacteria intracelular, células infectadas con un protozoo intracelular, células infectadas con un prión, bacterias (por ejemplo, bacterias patógenas y no patógenas), protozoos y parásitos unicelulares y multicelulares. Por ejemplo, en el campo de la biología sintética es altamente deseable disponer de mecanismos de control de microorganismos modificados por ingeniería genética (por ejemplo, bacterias) para evitar su propagación o diseminación. Los sistemas descritos en el presente documento pueden usarse como “interruptores de muerte” para regular y/o prevenir la propagación o diseminación de un microorganismo modificado por ingeniería genética. Además, existe la necesidad en la técnica de alternativas a los tratamientos con antibióticos actuales.
Los sistemas descritos en el presente documento también pueden usarse en aplicaciones en las que es deseable destruir o controlar una población microbiana específica (por ejemplo, una población bacteriana). Por ejemplo, los sistemas descritos en el presente documento pueden incluir una guía de ARN (por ejemplo, un ARNcr) que se dirige a un ácido nucleico (por ejemplo, un a Dn ) que es específico de género, especie o cepa, y puede administrarse a la célula. Al formar complejos y unirse al ácido nucleico diana, la actividad nucleasa de las proteínas efectoras de CRISPR-Cas CLUST.029130 (tipo V-I) altera las funciones esenciales dentro de los microorganismos, dando como resultado finalmente latencia o muerte. En algunas realizaciones, los métodos comprenden poner en contacto la célula con un sistema descrito en el presente documento que incluye proteínas efectoras de CRISPR-Cas CLUST.029130 (tipo V-I) o un ácido nucleico que codifica para la proteína efectora, y una guía de ARN (por ejemplo, un ARNcr) o un ácido nucleico que codifica para la guía de ARN, en los que la secuencia espaciadora es complementaria a al menos 15 nucleótidos (por ejemplo, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 35, 40, 45, 50 o más nucleótidos) de un ácido nucleico diana.
Sin querer limitarse a ninguna teoría en particular, la actividad nucleasa de las proteínas efectoras de CRISPR-Cas CLUST.029130 (tipo V-I) puede inducir muerte celular programada, toxicidad celular, apoptosis, necrosis, necroptosis, muerte celular, detención del ciclo celular, anergia celular, una reducción del crecimiento celular o una reducción de la proliferación celular. Por ejemplo, en bacterias, la escisión del ADN por las proteínas efectoras de CRISPR-Cas CLUST.029130 (tipo V-I) puede ser bacteriostática o bactericida.
Aplicación en plantas
Los sistemas de CRISPR descritos en el presente documento tienen una amplia variedad de utilidad en plantas. En algunas realizaciones, los sistemas de CRISPR pueden usarse para modificar por ingeniería genética genomas de plantas (por ejemplo, mejorar la producción, fabricar productos con modificaciones postraduccionales deseadas o introducir genes para producir productos industriales). En algunas realizaciones, los sistemas de CRISPR pueden usarse para introducir un rasgo deseado en una planta (por ejemplo, con o sin modificaciones hereditarias en el genoma), o regular la expresión de genes endógenos en células vegetales o plantas completas. Las plantas que pueden editarse usando los sistemas de CRISPR de esta divulgación (por ejemplo, sistemas Cas12i) pueden ser monocotiledóneas o dicotiledóneas, e incluyen, sin limitación, cártamo, maíz, cannabis, arroz, caña de azúcar, colza, sorgo, tabaco, centeno, cebada, trigo, mijo, avena, cacahuete, patata, pasto varilla, césped, soja, alfalfa, girasol, algodón y Arabidopsis. La presente divulgación también abarca una planta que tiene un rasgo realizado según un método de la divulgación y/o que utiliza un sistema de CRISPR de la divulgación.
En algunas realizaciones, los sistemas de CRISPR pueden usarse para identificar, editar y/o silenciar genes que codifican para proteínas específicas, por ejemplo, proteínas alergénicas (por ejemplo, proteínas alergénicas en cacahuete, soja, lentejas, guisantes, judías verdes y judías mungo). Se describe una descripción detallada sobre cómo identificar, editar y/o silenciar genes que codifican para proteínas, por ejemplo, en Nicolaou et al., “Molecular diagnosis of peanut and legume allergy”, Curr. Opin. Allergy Clin. Immunol. 11(3):222-8 (2011) y el documento WO 2016205764 A1.
Impulsos génicos
El impulso génico es el fenómeno en el que la herencia de un gen o conjunto de genes particular está sesgada favorablemente. Los sistemas de CRISPR descritos en el presente documento pueden usarse para crear impulsos génicos. Por ejemplo, los sistemas de CRISPR pueden diseñarse para seleccionar como diana y alterar un alelo particular de un gen, lo que hace que la célula copie el segundo alelo para corregir la secuencia. Debido a la copia, el primer alelo se convertirá en el segundo alelo, aumentando la posibilidad de que el segundo alelo se transmita a la descendencia. Se describe un método detallado sobre cómo usar los sistemas de CRISPR descritos en el presente documento para crear impulsos génicos, por ejemplo, en Hammond et al., “A CRISPR-Cas9 gene drive system targeting female reproduction in the malaria mosquito vector Anopheles gambiae”, Nat. Biotechnol, enero de 2016; 34(1):78-83.
Cribado agrupado
Tal como se describe en el presente documento, el cribado de CRISPR agrupado es una potente herramienta para identificar genes implicados en mecanismos biológicos tales como proliferación celular, resistencia a fármacos e infección viral. Las células se transducen en masa con una biblioteca de vectores codificantes de guía de ARN (ARNg) descritos en el presente documento, y la distribución de ARNg se mide antes y después de aplicar una exposición selectiva. Los cribados de CRISPR agrupados funcionan bien para los mecanismos que afectan a la supervivencia y proliferación celular, y pueden extenderse para medir la actividad de genes individuales (por ejemplo, mediante el uso de líneas de células indicadoras modificadas). Los cribados de CRISPR en matriz, en los que sólo se selecciona como diana un gen a la vez, posibilitan el uso de la secuenciación de ARN como lectura. En algunas realizaciones, los sistemas de CRISPR que se describen en el presente documento pueden usarse en cribados de CRISPR en una sola célula. Puede encontrarse una descripción detallada sobre los cribados de CRISPR agrupados, por ejemplo, en Datlinger et al., “Pooled CRISPR screening with single-cell transcriptome read-out”, Nat. Methods., marzo de 2017; 14(3):297-301.
Mutagénesis de saturación (“golpeo”)
Los sistemas de CRISPR descritos en el presente documento pueden usarse para mutagénesis de saturación in situ. En algunas realizaciones, puede usarse una biblioteca de guías de ARN agrupada para realizar la mutagénesis de saturación in situ para genes o elementos reguladores particulares. Tales métodos pueden revelar características mínimas críticas y vulnerabilidades discretas de estos genes o elementos reguladores (por ejemplo, potenciadores). Estos métodos se describen, por ejemplo, en Canver et al., “BCL11A enhancer dissection by Cas9-mediated in situ saturating mutagenesis”, Nature, 12 de noviembre de 2015; 527 (7577): 192­ 7.
Aplicaciones terapéuticas
Los sistemas de CRISPR descritos en el presente documento que tienen actividad en un contexto celular de mamífero (por ejemplo, Cas12i2) pueden tener una amplia gama de aplicaciones terapéuticas. Además, cada ortólogo de nucleasa puede presentar propiedades únicas (por ejemplo, tamaño, pAm , etc.) que lo hacen ventajoso para determinadas modalidades de direccionamiento, tratamiento o administración, por lo que la selección del ortólogo es importante para asignar la nucleasa que proporciona el máximo beneficio terapéutico. Hay numerosos factores que influyen en la idoneidad de la edición génica como herramienta terapéutica para una enfermedad particular. Con las terapias génicas basadas en nucleasas, los enfoques primarios para la edición terapéutica han sido la alteración génica y la corrección génica. En el primero, la alteración génica se produce generalmente con un evento (tal como una rotura bicatenaria dirigida inducida por nucleasa) que activa el mecanismo de reparación de ADN endógeno de unión de extremos no homólogos de la célula diana, lo que produce indels que a menudo dan como resultado una pérdida de mutación funcional que está destinada a beneficiar al paciente. En el segundo, la corrección génica utiliza la actividad nucleasa para inducir rutas de reparación de ADN alternativas (tales como reparación dirigida por homología, o HDR) con la ayuda de un ADN molde (ya sea endógeno o exógeno, monocatenario o bicatenario). El ADN molde puede ser una corrección endógena de una mutación causante de enfermedad, o por el contrario la inserción de un transgén terapéutico en un locus alternativo (habitualmente loci de lugar seguro tales como AAVS1). Se describen métodos para diseñar ácidos nucleicos molde donantes exógenos, por ejemplo, en la publicación PCT n.° WO 2016094874 A1. Un requisito de las terapias que usan cualquiera de estas modalidades de edición es la comprensión de los moduladores genéticos de una determinada enfermedad; las enfermedades no deben ser necesariamente monogénicas, sino que la información sobre las mutaciones que pueden afectar al avance o desenlace de la enfermedad es importante para proporcionar pautas sobre la posible eficacia de una terapia génica.
Sin querer estar limitados, los sistemas de CRISPR descritos en el presente documento pueden utilizarse en un método para tratar las siguientes enfermedades, en el que se identifican las dianas génicas específicas, además de las referencias relevantes para ayudar en la adaptación de los sistemas de CRISPR de tipo V-I a áreas de enfermedades específicas; fibrosis quística mediante la selección como diana de CFTR (documento WO2015157070A2), distrofia muscular de Duchenne y distrofia muscular de Becker mediante la selección como diana de distrofina (DMD) (documento WO2016161380A1), deficiencia en alfa-1-antitripsina mediante la selección como diana de alfa-1-antitripsina (A1AT) (documento WO2017165862A1), trastornos de almacenamiento lisosómico tales como enfermedad de Pompe, también conocida como enfermedad de almacenamiento de glucógeno de tipo II, mediante la selección como diana de alfa-glucosidasa ácida (GAA), distrofia miotónica mediante la selección como diana de DMPK, enfermedad de Huntington mediante la selección como diana de HTT, síndrome del cromosoma X frágil mediante la selección como diana de FMR1, ataxia de Friedreich mediante la selección como diana de frataxina, esclerosis lateral amiotrófica (ELA) y demencia frontotemporal (FTD) mediante la selección como diana de C9orf72, enfermedad renal crónica hereditaria mediante la selección como diana de ApoL1, enfermedad cardiovascular e hiperlipidemia mediante la selección como diana de PCSK9, APOC3, ANGPTL3, LPA (Nature 555, S23-S25 (2018)), y ceguera congénita tal como amaurosis congénita de Leber de tipo 10 (LCA10) mediante la selección como diana de CEP290 (Maeder et al., NatMed. Febrero de 2019;25(2):229-233). La mayoría de las enfermedades anteriormente mencionadas se trata mejor con un enfoque de edición génica in vivo, en el que es necesario la edición in situ de los tejidos y tipos de células implicados en la enfermedad con una dosis y una eficiencia suficientes para producir un beneficio terapéutico. Se describen algunos obstáculos de la administración in vivo en la sección “Administración de sistemas de CRISPR” a continuación, aunque en general un tamaño más pequeño del gen de los efectores de CRISPR de tipo V-I permite un empaquetamiento más versátil en vectores virales con una restricción de carga útil, tales como virus adenoasociados.
La edición ex vivo, en la que las células se retiran del cuerpo del paciente y luego se editan antes del trasplante de vuelta al paciente, presenta una excelente oportunidad terapéutica para las tecnologías de edición génica. La capacidad para manipular las células fuera del cuerpo presenta múltiples ventajas, que van desde la capacidad para usar tecnologías para una administración altamente eficiente de proteína, ADN y ARN a células, tales como electroporación y nucleofección, que no son susceptibles en un contexto in vivo, hasta ser capaces de evaluar la toxicidad (tal como a partir de efectos inespecíficos), luego seleccionar y expandir adicionalmente células satisfactoriamente editadas para producir una población que proporciona una ventaja terapéutica. Estas ventajas se ven contrarrestadas por las poblaciones y los tipos de células relativamente escasos que pueden recogerse, procesarse y luego devolverse al cuerpo satisfactoriamente al tiempo que conservan la funcionalidad. Sin querer estar limitados, no obstante hay enfermedades graves que son susceptibles a la edición del genoma ex vivo usando los sistemas descritos en el presente documento. Por ejemplo, tanto la anemia drepanocítica (SCD), a la que se hace referencia en el documento WO2015148863A2, como la beta-talasemia, a la que se hace referencia en el documento WO2015148860A1, son ejemplos de enfermedades en las que la comprensión de la fisiopatología ha permitido varias modalidades de edición diferentes en células madre hematopoyéticas para el tratamiento de la enfermedad. La beta-talasemia y la SCD pueden tratarse ambas con la alteración del potenciador eritroide BCL11A para aumentar los niveles de hemoglobina fetal (tal como ilustran usando las nucleasas de dedos de zinc Psatha et al. Mol Ther Methods Clin Dev. 21 de septiembre de 2018). Además, pueden usarse métodos de corrección génica para revertir mutaciones perjudiciales en la SCD y la betatalasemia. En otro caso, la adición de una beta-globina expresada a partir de un locus de lugar seguro proporciona otra estrategia terapéutica alternativa para la edición génica ex vivo.
Como consecuencia de la edición ex vivo de células madre hematopoyéticas, también pueden editarse células inmunitarias. En la inmunoterapia contra el cáncer, un modo terapéutico es modificar las células inmunitarias, tales como células T, para reconocer y combatir el cáncer, tal como se hace referencia en el documento WO2015161276A2. Para aumentar la eficacia y la disponibilidad al tiempo que se reduce el coste, la creación de terapias con células T alogénicas existentes es atractiva, y la edición génica tiene el potencial de modificar antígenos de superficie para minimizar cualquier efecto secundario inmunológico (Jung et al., Mol Cell. 31 de agosto de 2018).
En otra realización, la invención puede usarse en un método para tratar virus u otros patógenos con una etapa intermedia de ADN bicatenario de su ciclo de vida. Específicamente, seleccionar como diana virus cuya infección inicial deja una infección latente que persiste permanentemente sería de gran valor terapéutico. En los siguientes ejemplos, los sistemas de CRISPR de tipo V-I pueden usarse para seleccionar como diana directamente el genoma viral (tal como con VHS-1, VHS-2 o VIH), o usarse para editar las células huésped para reducir o eliminar los receptores que permiten la infección para hacerlos insensibles al virus (VIH), tal como se hace referencia para VHS-1 y VHS-2 en los documentos WO2015153789A1, WO2015153791A1 y WO2017075475A1, y para el VIH en los documentos WO2015148670A1 y WO2016183236A1.
En otro aspecto, los sistemas de CRISPR descritos en el presente documento pueden diseñarse por ingeniería genética para permitir funciones adicionales que utiliza Cas12i enzimáticamente inactiva como armazón en cuya parte superior pueden unirse dominios de proteína para conferir actividades tales como activación transcripcional, represión, edición de bases y metilación/desmetilación.
Por tanto, esta divulgación proporciona sistemas de CRISPR-Cas y células para su uso en el tratamiento o la prevención de cualquiera de las enfermedades dadas a conocer en el presente documento.
Administración de sistemas de CRISPR
Los sistemas de CRISPR descritos en el presente documento, o componentes de los mismos, moléculas de ácido nucleico de los mismos, o moléculas de ácido nucleico que codifican para o proporcionan componentes de los mismos, pueden administrarse mediante diversos sistemas de administración tales como vectores, por ejemplo, plásmidos, vectores de administración virales, tales como virus adenoasociados (VAA), lentivirus, adenovirus y otros vectores virales, o métodos, tales como nucleofección o electroporación de complejos de ribonucleoproteínas que consisten en efectores de tipo V-I y su(s) guía(s) de ARN relacionada(s). Las proteínas y una o más guías de ARN pueden empaquetarse en uno o más vectores, por ejemplo, plásmidos o vectores virales. Para aplicaciones bacterianas, los ácidos nucleicos que codifican para cualquiera de los componentes de los sistemas de CRISPR descritos en el presente documento pueden administrarse a las bacterias mediante un fago. Los fagos a modo de ejemplo incluyen, pero no se limitan a, fago T4, Mu, fago X, fago T5, fago T7, fago T3, 029, M13, MS2, Qp y 0X174.
En algunas realizaciones, los vectores, por ejemplo, plásmidos o vectores virales, se administran al tejido de interés, por ejemplo, mediante inyección intramuscular, administración intravenosa, administración transdérmica, administración intranasal, administración oral o administración en la mucosa. Tal administración puede ser por medio de una sola dosis o de múltiples dosis. Un experto en la técnica entiende que la dosis real que va a administrarse en el presente documento puede variar mucho dependiendo de una variedad de factores, tales como las opciones de vector, las células diana, los organismos, los tejidos, las condiciones generales del sujeto que va a tratarse, los grados de transformación/modificación buscada, las vías de administración, los modos de administración, los tipos de transformación/modificación buscada, etc.
En determinadas realizaciones, la administración es por medio de virus adenoasociados (VAA), por ejemplo, VAA2, VAA8 o VAA9, que pueden administrarse en una única dosis que contiene al menos 1 * 105 partículas (también denominadas unidades de partículas, up) de adenovirus o virus adenoasociados. En algunas realizaciones, la dosis es de al menos aproximadamente 1 * 106 partículas, al menos aproximadamente 1 * 107 partículas, al menos aproximadamente 1 * 108 partículas o al menos aproximadamente 1 * 109 partículas de los virus adenoasociados. Los métodos de administración y las dosis se describen, por ejemplo, en el documento WO 2016205764 y la patente estadounidense n.° 8.454.972. Debido a la limitada carga útil genómica del VAA recombinante, un tamaño más pequeño de las proteínas efectoras de CRISPR-Cas de tipo V-I descritas en el presente documento permite una mayor versatilidad en el empaquetamiento del efector y de las guías de ARN con las secuencias de control apropiadas (por ejemplo, promotores) necesarias para una expresión eficiente y específica del tipo de célula.
En algunas realizaciones, la administración es por medio de un vector de virus adenoasociado recombinante (VAAr). Por ejemplo, en algunas realizaciones, puede usarse un vector de VAA modificado para la administración. Los vectores de VAA modificados pueden basarse en uno o más de varios tipos de cápside, incluyendo VAA1, VAA2, VAA5, VAA6, VAA8, VAA8.2. VAA9, VAA rhlO, vectores de VAA modificados (por ejemplo, VAA2 modificado, VAA3 modificado, VAA6 modificado) y VAA pseudotipificado (por ejemplo, VAA2/8, VAA2/5 y VAA2/6). Los vectores de VAA y las técnicas a modo de ejemplo que pueden usarse para producir partículas de VAAr se conocen en la técnica (véanse, por ejemplo, Aponte-Ubillus et al. (2018) Appl. Microbiol. Biotechnol. 102(3): 1045-54; Zhong et al. (2012) J. Genet. Syndr. Gene Ther. S1: 008; West et al. (1987) Virology 160: 38-47 (1987); Tratschin et al. (1985) Mol. Cell. Biol. 5: 3251-60); las patentes estadounidenses n.os 4.797.368 y 5.173.414; y las publicaciones internacionales n.os WO 2015/054653 y WO 93/24641).
En algunas realizaciones, la administración es por medio de plásmidos. La dosificación puede ser un número suficiente de plásmidos como para provocar una respuesta. En algunos casos, las cantidades adecuadas de ADN de plásmido en las composiciones de plásmido pueden ser de aproximadamente 0,1 a aproximadamente 2 mg. Los plásmidos incluirán generalmente (i) un promotor; (ii) una secuencia que codifica para enzimas CRISPR dirigidas a ácidos nucleicos, operativamente unidas al promotor; (iii) un marcador seleccionable; (iv) un origen de replicación; y (v) un terminador de la transcripción en el sentido de 3' y operativamente unido a (ii). Los plásmidos también pueden codificar para los componentes de ARN de un sistema de CRISPR-Cas, pero uno o más de éstos pueden estar codificados en su lugar en vectores diferentes. La frecuencia de administración está dentro del ámbito del profesional médico o veterinario (por ejemplo, médico, veterinario) o un experto en la técnica.
En otra realización, la administración es por medio de liposomas o formulaciones de lipofectina y similares, y pueden prepararse mediante métodos conocidos por los expertos en la técnica. Tales métodos se describen, por ejemplo, en el documento WO 2016205764 y las patentes estadounidenses n.os 5.593.972; 5.589.466; y 5.580.859.
En algunas realizaciones, la administración es por medio de nanopartículas o exosomas. Por ejemplo, se ha demostrado que los exosomas son particularmente útiles en la administración de ARN.
Medios adicionales de introducción de uno o más componentes de los nuevos sistemas de CRISPR en las células es mediante el uso de péptidos de penetración celular (CPP). En algunas realizaciones, un péptido de penetración celular se une a las enzimas CRISPR. En algunas realizaciones, las enzimas CRISPR y/o las guías de ARN se acoplan a uno o más CPP para transportarlos dentro de las células de manera eficaz (por ejemplo, protoplastos de plantas). En algunas realizaciones, las enzimas CRISPR y/o la(s) guía(s) de ARN están codificadas por una o más moléculas de ADN circulares o no circulares que se acoplan a uno o más CPP para la administración celular.
Los CPP son péptidos cortos de menos de 35 aminoácidos derivados de proteínas o de secuencias quiméricas capaces de transportar biomoléculas a través de la membrana celular de manera independiente del receptor. Los CPP pueden ser péptidos catiónicos, péptidos que tienen secuencias hidrófobas, péptidos anfipáticos, péptidos que tienen secuencias ricas en prolina y secuencias antimicrobianas, y péptidos quiméricos o bipartitos. Los ejemplos de CPP incluyen, por ejemplo, Tat (que es una proteína activadora transcripcional nuclear requerida para la replicación viral por VIH de tipo 1), penetratina, secuencia de péptido señal de factor de crecimiento de fibroblastos (FGF) de Kaposi, secuencia de péptido señal de integrina p3, secuencia de Arg del péptido poliarginina, transportadores moleculares ricos en guanina y péptido flecha dulce. Los CPP y los métodos para usarlos se describen, por ejemplo, en Hallbrink et al., “Prediction of cell-penetrating peptides”, Methods Mol. Biol., 2015; 1324:39-58; Ramakrishna et al., “Gene disruption by cell-penetrating peptide-mediated delivery of Cas9 protein and guide RNA”, Genome Res., junio de 2014; 24(6):1020-7; y el documento WO 2016205764 A1.
La administración del sistema de CRISPR de tipo V-I como complejo de ribonucleoproteína por electroporación o nucleofección, en la que la proteína Cas12i purificada se incuba previamente con una guía de ARN y se somete a electroporación (o nucleofección) en las células de interés, es otro método de introducción eficaz del sistema de CRISPR en células para la edición génica. Esto es particularmente útil para la edición del genoma ex vivo y el desarrollo de terapias celulares, y tales métodos se describen en Roth et al. “Reprogramming human T cell function and specifi city with non-viral genome targeting”, Nature, julio de 2018; 559 (7714): 405-409.
También se describen diversos métodos de administración para los sistemas de CRISPR descritos en el presente documento, por ejemplo, en los documentos US 8795965, EP 3009511, WO 2016205764 y WO 2017070605.
Kits
Esta divulgación también abarca kits para llevar a cabo los diversos métodos de la divulgación utilizando los sistemas de CRISPR descritos en el presente documento. Un kit a modo de ejemplo de la presente divulgación comprende (a) uno o más ácidos nucleicos que codifican para una proteína asociada a CRISPR y un ARNcr relacionado, y/o (b) un complejo de ribonucleoproteína de una proteína asociada a CRISPR y un ARNcr relacionado. En algunas realizaciones, el kit comprende una proteína Cas12i y un ARN guía de Cas12i. Tal como se describió anteriormente, un complejo de proteína y ARN guía tiene una actividad de edición tal como formación de SSB, formación de DSB, interferencia de CRISPR, modificación de bases nitrogenadas, metilación o desmetilación de ADN, modificación de cromatina, etc. En determinadas realizaciones, la proteína asociada a CRISPR es una variante, tal como una variante que tiene actividad endonucleasa reducida.
Los kits de esta divulgación también incluyen opcionalmente reactivos adicionales, incluyendo uno o más de un tampón de reacción, un tampón de lavado, uno o más materiales de control (por ejemplo, un sustrato o un ácido nucleico que codifica para un componente del sistema de CRISPR), etc. Un kit de la presente divulgación también incluye opcionalmente instrucciones para realizar un método de esta divulgación utilizando los materiales proporcionados en el kit. Las instrucciones se proporcionan en forma física, por ejemplo, como un documento impreso empaquetado físicamente con otro elemento del kit, y/o en forma digital, por ejemplo, un documento publicado digitalmente que puede descargarse de un sitio web o proporcionado en un medio legible por ordenador.
Ejemplos
La invención se describe además en los siguientes ejemplos, que no limitan el alcance de la invención descrita en las reivindicaciones.
Ejemplo 1: Identificación de componentes mínimos para el sistema de CRISPR-Cas CLUST.029130 (tipo V-I) (figuras 1 - 3)
Esta familia de proteínas describe un gran efector único asociado con los sistemas de CRISPR que se encuentra en secuencias metagenómicas no cultivadas recogidas de ambientes de agua dulce (tabla 3). Los efectores de CLUST.029130 (tipo V-I), denominados Cas12i, incluyen las proteínas a modo de ejemplo detalladas en las tablas 3 y 4. Se muestran secuencias de repetición directas a modo de ejemplo en la tabla 5.
Las secuencias del genoma y metagenoma se descargaron de NCBI (Benson et al., (2013) GenBank. Nucleic Acids Res. 41, D36-42; Pruit et al. (2012) NCBI Reference Sequences (RefSeq): current status, new features and genome annotation policy. Nucleic Acids Res. 40, D130-135), secuenciación del genoma completo (WGS) de NCBI y DOE JGI Integrated Microbial Genomes (Markowitz et al. (2012) IMG: the Integrated Microbial Genomes database and comparative analysis system. Nucleic Acids Res. 40, D115-122) y se compilaron para construir una base de datos de 293.985 sistemas de CRISPR-Cas supuestos, dentro de la cual se identificaron sistemas de nucleasa novedosos. Este enfoque para la ingeniería de canalización realiza un filtrado mínimo en las etapas intermedias para expandir el espacio de búsqueda para el descubrimiento de efectores de CRISPR novedosos y reducir los sesgos.
El árbol de clasificación representado en las figuras 1A-1B se construyó comparando los perfiles de secuencia extraídos de múltiples alineaciones de grupos de proteínas Cas2 fácilmente alineables. Se realizaron comparaciones de perfil-perfil usando HHsearch (Soding et al., (2005) Protein homology detection by HMM-HMM comparison. Bioinforma. Oxf. Ingl. 21, 951-960); las puntuaciones entre dos perfiles se normalizaron por el mínimo de las autopuntuaciones y se convirtieron en una matriz de distancia en la escala logarítmica natural. Se reconstruyó el dendrograma UPGMA a partir de la matriz de distancia. El árbol a la profundidad de 2 unidades de distancia (correspondientes a la puntuación de búsqueda HH por parejas de e 2d = 0,02 en relación con la autopuntuación) normalmente recupera de manera fiable la similitud del perfil y puede servir como guía para la clasificación de subtipos (Shmakov et al., 2017).
La arquitectura de dominios de Cas12i, representada en las figuras 2A y 2B, indica que el efector contiene los residuos catalíticos activos del dominio de nucleasa RuvC. Además, la estructura secundaria predicha de la repetición directa más prevalente para los loci de tipo V-I, representada en la figura 3, indica una estructura de tallo-bucle que se conserva en el ARNcr de muchos sistemas de CRISPR-Cas de tipo V-I a modo de ejemplo.
Tabla 3. Proteínas efectoras CLUST.029130 (tipo V-I) representativas
Figure imgf000041_0001
Figure imgf000042_0001
Tabla 4. Secuencias de aminoácidos de proteínas efectoras CLUST.029130 (tipo V-I) representativas
Figure imgf000042_0002
Figure imgf000043_0001
Figure imgf000044_0001
Figure imgf000045_0001
Figure imgf000046_0001
MSNKEKNASETRKAYTTKMIPRSHDRMKLLGNFMDYLMDGTPIFFELWNQFGGGIDRDIISGTANKDKISDDLLLA VNWFKVMPINSKPQGVSPSNLANLFQQYSGSEPDIQAQEYFASNFDTEKHQWKDMRVEYERLLAELQLSRSDMHHD LKLMYKEKCIGLSLSTAHYITSVMFGTGAKNNRQTKHQFYSKVIQLLEESTQINSVEQLASIILKAGDCDSYRKLR IRCSRKGATPSILKIVQDYELGTNHDDEVNVPSLIANLKEKLGRFEYECEWKCMEKIRAFIASKVGPYYLGSYSAM LENALSPIKGMTTKNCKFVLKQIDAKNDIKYENEPFGKIVEGFFDSPYFESDTNVKWVLHPHHIGESNIKTLWEDL NAIHSKYEEDIASLSEDKKEKRIKVYQGDVCQTINTYCEEVGKEAKTPLVQLLRYLYSRKDDIAVDKIIDGITFLS KKHKVEKQKINPVIQKYPSFNFGNNSKLLGKIISPKDKLKHNLKCNRNQVDNYIWIEIKVLNTKTMRWEKHHYALS STRFLEEVYYPATSENPPDALAARFRTKTNGYEGKPALSAEQIEQIRSAPVGLRKVKKRQMRLEAARQQNLLPRYT WGKDFNINICKRGNNFEVTLATKVKKKKEKNYKWLGYDANIVRKNTYAAIEAHANGDGVIDYNDLPVKPIESGFV TVESQVRDKSYDQLSYNGVKLLYCKPHVESRRSFLEKYRNGTMKDNRGNNIQIDFMKDFEAIADDETSLYYFNMKY CKLLQSSIRNHSSQAKEYREEIFELLRDGKLSVLKLSSLSNLSFVMFKVAKSLIGTYFGHLLKKPKNSKSDVKAPP ITDEDKQKADPEMFALRLALEEKRLNKVKSKKEVIANKIVAKALELRDKYGPVLIKGENISDTTKKGKKSSTNSFL MDWLARGVANKVKEMVMMHQGLEFVEVNPNFTSHQDPFVHKNPENTFRARYSRCTPSELTEKNRKEILSFLSDKPS KRPTNAYYNEGAMAFLATYGLKKNDVLGVSLEKFKQIMANILHQRSEDQLLFPSRGGMFYLATYKLDADATSVNWN GKQFWVCNADLVAAYNVGLVDIQKDFKKK (SEQ ID NO: 3) >3300028569|Ga0247843_1000055_230|M
[acuático-agua dulce] MPRNYFLGIFSLQKNKSWHCSVEIRHKGYRSSVMVSDSTIRPYASKLAPNDPKLKMLNDTFNWLDHAYKVFFDVS VALFGAIEHETAQELIGEKSKFDADLICAIMWFRLEEKSDNPGPLQTVEQRMRLFQKYSGHEPSSFTQEYIKGNID SEKYEWVDCRLKFIDLARNINTTQESLKIDAYTLFMNKLIPVSKDDEFNAYGLISQLFGTGKKEDRSIKAAMLEEI SNILADKKPDTWEEYHDLIKKNFNVDNYKELKEKLSAGSSGRDSSLVIDLKEEKTGLLQPNFIKNRIVKFREDADK KKTVFLLPNRMKLREFIASQIGPFEQNSWSAVLNRSMAAIQSKNSSNILYTNEKEERNNEIQELLKKDILSAASIL GDFRRGEFNRSWSKNHLGARLNELFEIWQDLTMDDGIRKYVDLCKDKFSRRPVKALLQYIYPYFDKITAKQFLDA ASYNTLVETNNRKKIHPTVTGPTVCNWGPKSTINGSITPPNQMVKGRPAGSHGMIWVTMTVIDNGRWIKHHLPFYN SRYYEEHYCYREGLPTKNQPRTKQLGTQVGSTISATSLAALKSQEEQDRRNDRKNRFKAHKSIIRSQENIEYNVAF DKSTNFDVTRKNGEFFITISSRVATPKYSYKLNIGDMIMGLDNNQTAPCTYSIWRWEKDTEGSFFHNKIWLQLVT DGKITSIVDNNRQVDQLSYAGIEYSNFAEWRKDRRQFLRSINEDYVKKSDNWRNMNLYQWNAEYSRLLLDVMKENK GKNIQNTFRAEIEELICGKFGIRLGSLFHHSLQFLTNCKSLISSYFMLNNKKEEYDQELFDSDFFRLMKSIGDKRV RKRKEKSSRISSTVLQIARENNIKSLCVEGDLPTATKKTKPKQNQKSIDWCARAWKKLNDGCKVLGINLQAIDPR DTSHLDPFVYYGKKSTKVGKEARYTIVEPSNIKEYMTNRFDDWHRGVTKKSKKGDVQTSTTVLLYQEALRQFASHY ELDFDSLPKMKFYDLAKRLGDHEKVIIPCRGGRAYLSTYPVTKDSSKITFNGRERWYNESDWAAVNIVLRGIRDE DEQPDDAKKQALARTK (SEQ ID NO: 11)
>3300028569|Ga0247843_1000055_232|P
[acuático-agua dulce] MVSDSTIRPYASKLAPNDPKLKMLNDTFNWLDHAYKVFFDVSVALFGAIEHETAQELIGEKSKFDADLICAIMWFR LEEKSDNPGPLQTVEQRMRLFQKYSGHEPSSFTQEYIKGNIDSEKYEWVDCRLKFIDLARNINTTQESLKIDAYTL FMNKLIPVSKDDEFNAYGLISQLFGTGKKEDRSIKAAMLEEISNILADKKPDTWEEYHDLIKKNFNVDNYKELKEK LSAGSSGRDSSLVIDLKEEKTGLLQPNFIKNRIVKFREDADKKKTVFLLPNRMKLREFIASQIGPFEQNSWSAVLN RSMAAIQSKNSSNILYTNEKEERNNEIQELLKKDILSAASILGDFRRGEFNRSWSKNHLGARLNELFEIWQDLTM DDGIRKYVDLCKDKFSRRPVKALLQYIYPYFDKITAKQFLDAASYNTLVETNNRKKIHPTVTGPTVCNWGPKSTIN GSITPPNQMVKGRPAGSHGMIWVTMTVIDNGRWIKHHLPFYNSRYYEEHYCYREGLPTKNQPRTKQLGTQVGSTIS ATSLAALKSQEEQDRRNDRKNRFKAHKSIIRSQENIEYNVAFDKSTNFDVTRKNGEFFITISSRVATPKYSYKLNI GDMIMGLDNNQTAPCTYSIWRWEKDTEGSFFHNKIWLQLVTDGKITSIVDNNRQVDQLSYAGIEYSNFAEWRKDR RQFLRSINEDYVKKSDNWRNMNLYQWNAEYSRLLLDVMKENKGKNIQNTFRAEIEELICGKFGIRLGSLFHHSLQF LTNCKSLISSYFMLNNKKEEYDQELFDSDFFRLMKSIGDKRVRKRKEKSSRISSTVLQIARENNIKSLCVEGDLPT ATKKTKPKQNQKSIDWCARAWKKLNDGCKVLGINLQAIDPRDTSHLDPFVYYGKKSTKVGKEARYTIVEPSNIKE YMTNRFDDWHRGVTKKSKKGDVQTSTTVLLYQEALRQFASHYELDFDSLPKMKFYDLAKRLGDHEKVIIPCRGGRA YLSTYPVTKDSSKITFNGRERWYNESDWAAVNIVLRGIRDEDEQPDDAKKQALARTK (SEQ ID NO: 12)
Figure imgf000048_0001
Figure imgf000049_0001
Figure imgf000050_0002
Tabla 5A. Proteínas efectoras y repeticiones directas de CLUST.029130 (tipo V-I) representativas
Figure imgf000050_0001
Figure imgf000051_0001
Tabla 5B. Secuencias de pre-ARNcr de CLUST.029130 (tipo V-I) de ejemplo
Figure imgf000051_0002
Figure imgf000052_0001
Ejemplo 2: Validación bacteriana in vivo de sistemas de CRISPR-Cas CLUST.029130 (tipo V-I) modificados por ingeniería genética (figuras 4A-10B)
Habiendo identificado los componentes mínimos de los sistemas de CRISPR-Cas de tipo V-I, se seleccionaron dos sistemas para la validación funcional, uno que comprendía el efector designado Cas12i1 (SEQ ID NO: 3) y el otro que comprendía el efector designado Cas12i2 (SEQ ID NO: 5).
Métodos
Síntesis de genes y clonación de bibliotecas de oligonucleótidos
Las secuencias de proteínas con codones optimizados para E. coli para proteínas accesorias de efectores de CRISPR se clonaron en pET-28a(+) (EMD-Millipore) para crear el plásmido efector. Las secuencias no codificantes que flanquean a los genes Cas (incluidos 150 nt de la secuencia codificante de CDS terminal) o la matriz de CRISPR se sintetizaron (Genscript) en pACYC184 (New England Biolabs) para crear el plásmido no codificante (figura 4A). Los plásmidos mutantes efectores (por ejemplo, D513A o A513D) se clonaron mediante mutagénesis dirigida al sitio utilizando los cebadores indicados en la tabla de secuencias: en primer lugar se introdujeron cambios de secuencia en fragmentos de PCR, que luego volvieron a ensamblarse en un plásmido usando NEBuilder HiFi DNA Assembly Master Mix o NEB Gibson Assembly Master Mix (New England Biolabs) siguiendo las instrucciones del fabricante.
Para la biblioteca de espaciadores agrupados, en primer lugar se diseñó informáticamente un grupo de síntesis de biblioteca de oligonucleótidos (OLS) (Agilent) para expresar una matriz de CRISPR mínima de secuencias de “repetición-espaciador-repetición”. Los elementos de “repetición” se derivaron de la secuencia de repetición directa consenso que se encuentra en la matriz de CRISPR asociada con el efector, y el “espaciador” representa -8900 secuencias dirigidas al plásmido pACYC184 y genes esenciales de E. coli o secuencias no dirigidas de control negativo. La longitud del espaciador se determinó por la moda de las longitudes de espaciador encontradas en la matriz de CRISPR endógena. Flanqueando a la matriz de CRISPR mínima había sitios de cebado de PCR únicos que permitieron la amplificación de una biblioteca específica a partir de un grupo más grande de síntesis de oligo.
A continuación, se clonó la biblioteca de matrices de CRISPR mínimas en el plásmido efector para crear una biblioteca de plásmido efector. Se adjuntaron sitios de restricción flanqueantes, un identificador molecular único y un promotor J23119 para expresión de la matriz en la biblioteca de oligos usando PCR (NEBNext High-Fidelity 2x PCR Master Mix), y luego se usó NEB Golden Gate Assembly Master Mix (New England Biolabs) para ensamblar la biblioteca completa de plásmidos de efectores con sus matrices de direccionamiento. Esto representó la “biblioteca de entrada” para el cribado.
Cribado en E. coli in vivo
El cribado in vivo se realizó usando células de E. coli electrocompetentes EXPRESS® BL21(DE3) (Lucigen) a menos que se indique lo contrario. Las células competentes se cotransformaron con el plásmido efector y/o no codificante (figura 4b ). Las células se sometieron a electroporación con la “biblioteca de entrada” según los protocolos del fabricante usando un Gene Pulser Xcell (Bio-rad) con una cubeta de 1,0 mm. Las células se sembraron en placa sobre placas de bioensayo que contenían tanto cloranfenicol (Fisher) como kanamicina (Alfa Aesar) y se cultivaron durante 11 horas, después de lo cual se estimó el recuento aproximado de colonias para garantizar una representación suficiente de la biblioteca y se recogieron las células.
Las fracciones de ADN de plásmido se extrajeron de las células recogidas para crear la “biblioteca de salida” usando un kit QIAprep Spin Miniprep (Qiagen), mientras que se recogió el ARN total >17 nt lisando las células recogidas en Direct-zol (Zymo Research), seguido de extracción usando el kit de minipreparación de ARN Directzol (Zymo Research).
La biblioteca de secuenciación de última generación para la señal de agotamiento de ADN se preparó mediante la realización de una PCR en las bibliotecas tanto de entrada como de salida, usando cebadores personalizados que flanqueaban el casete de matriz de CRISPR de la biblioteca de plásmidos efectores y que contenían códigos de barras y asideros compatibles con la química de secuenciación de Illumina. Luego, esta biblioteca se normalizó, se agrupó y se cargó en una Nextseq 550 (Illumina) para evaluar la actividad de los efectores.
Análisis de secuenciación de cribado bacteriano
Los datos de secuenciación de última generación para bibliotecas de entrada y salida de cribado se desmultiplexaron usando Illumina bcl2fastq. Las lecturas en los archivos fastq resultantes para cada muestra contenían los elementos de la matriz de cRlSPR para la biblioteca de plásmidos de detección. La secuencia de repetición directa de la matriz de CRISPR se usó para determinar la orientación de la matriz, y la secuencia espaciadora se asignó a la fuente (pACYC184 o genes esenciales de E. coli) o secuencia de control negativa (GFP) para determinar la diana correspondiente. Para cada muestra, el número total de lecturas para cada elemento de matriz único (ra) en una biblioteca de plásmidos dada se contó y se normalizó tal como sigue: (ra+1) / lecturas totales para todos los elementos de la matriz de la biblioteca. La puntuación de agotamiento se calculó dividiendo las lecturas de salida normalizadas para un elemento de matriz dado entre las lecturas de entrada normalizadas.
Para identificar parámetros específicos que dan como resultado la actividad enzimática y la muerte celular bacteriana, se usó secuenciación de última generación (NGS) para cuantificar y comparar la representación de matrices de CRISPR individuales (es decir, repetición-espaciador-repetición) en el producto de PCR de las bibliotecas de plásmidos de entrada y salida. Se definió el agotamiento en veces para cada matriz de CRISPR como el recuento de lectura de entrada normalizado dividido entre el recuento de lectura de salida normalizado (con 1 añadido para evitar la división por cero). Se consideró que una matriz estaba “fuertemente agotada” si el agotamiento en veces era mayor de 3. Al calcular el agotamiento en veces de la matriz en las réplicas biológicas, se tomó el valor máximo de agotamiento en veces para una matriz de CRISPR dada en todos los experimentos (es decir, una matriz fuertemente agotada debe estar fuertemente agotada en todas las réplicas biológicas). Se generó una matriz que incluía el agotamiento en veces de la matriz y las siguientes características para cada diana de espaciador: cadena diana, direccionamiento del transcrito, direccionamiento de ORI, motivos de secuencia diana, motivos de secuencia flanqueante y estructura secundaria diana. Se investigó el grado en que las diferentes características de esta matriz explicaban el agotamiento de la diana para sistemas de tipo V-I, produciendo de ese modo un amplio estudio de los parámetros funcionales dentro de un solo cribado.
Resultados
Las figuras 5A-D representan la ubicación de dianas fuertemente agotadas para Cas12i1 y Cas12i2 que seleccionan como diana pACYC184 y genes esenciales de E. coli E. cloni®. En particular, la ubicación de dianas fuertemente agotadas aparece dispersa en todo el espacio de diana potencial.
Se encontró que las actividades de interferencia de ADNbc de los efectores de tipo V-I, Cas12i1 (1094aa) y Cas12i2 (1054aa), se eliminan mediante la mutación del aspartato conservado en el motivo RuvC I (figuras 6A y 6B). La actividad de interferencia de ADNbc dependiente de RuvC de Cas12i no muestra ningún requisito para las secuencias no codificantes que flanquean la matriz de CRISPR o los genes cas (figuras 7A y 7b ), lo que indica que el módulo de interferencia V-I mínimo incluye sólo el efector y ARNcr (figuras 8A y 8B).
El análisis de las secuencias flanqueantes de la diana correspondientes a matrices fuertemente agotadas de cribados in vivo muestran que la interferencia de ADNbc por Cas12i depende de PAM. Específicamente, se encontró que Cas12i1 y Cas12i2 mostraron ambos una preferencia por pAm TTN en 5' (figuras 9A-B y 10A-B). Estos resultados sugieren que los efectores Cas12i compactos pueden realizar interferencia de ADNbc dependiente de PAM autónoma.
Ejemplo 3: Caracterización mecanicista bioquímica de sistemas de CRISPR-Cas CLUST.029130 (tipo V-I) modificados por ingeniería genética (figuras 11A-13, 15-17B)
Cas12i procesa pre-ARNcr in vivo
Para investigar la biogénesis de ARNcr para los sistemas de CRISPR-Cas de tipo V-I, se purificaron y se secuenciaron pequeños ARN de E. coli que expresa Cas12i y la biblioteca de matriz de CRISPR mínima del cribado bacteriano. Las figuras 11A y 11B muestran la acumulación de lecturas de secuenciación de ARN, mostrando una forma de consenso fuerte del ARNcr maduro Cas12i1 y Cas12i2, respectivamente, así como una distribución de longitudes de espaciador. La longitud del espaciador más común observada fue 21, con una variación de longitud entre 16 nt y 22 nt.
Para el sistema de CRISPR-Cas de tipo V-I que contiene Cas12i1, el ARNcr maduro puede tomar la forma 5'-AUUUUUGUGCCCAUCGUUGGCAC[espaciador]-3' (SEQ ID NO: 100).
Para el sistema de CRISPR-Cas de tipo V-I que contiene Cas12i2, el ARNcr maduro puede tomar la forma 5'-AGAAAUCCGUCUUUCAUUGACGG[espaciador]-3' (SEQ ID NO: 101).
La secuenciación del ARN pequeño del cribado bacteriano in vivo se realizó extrayendo el ARN total de las bacterias recogidas usando Direct-zol RNA MiniPrep Plus con reactivo TRI (Zymo Research). El ARN ribosómico se eliminó usando un kit de eliminación de ARNr Ribo-Zero para bacterias, seguido de una limpieza con un kit RNA Clean y Concentrator-5. El ARN total agotado en ARN ribosómico resultante se trató con t 4 PNK durante 3 horas sin a Tp para enriquecer los extremos 3'-P, después de lo cual se añadió ATP y la reacción se incubó durante otra hora para enriquecer los extremos 5'-OH. Luego, las muestras se purificaron en columna, se incubaron con ARN 5' polifosfatasa (Lucigen) y se purificaron en columna nuevamente antes de la preparación para la secuenciación de última generación usando NEBNext Multiplex Small RNA Library Prep Set para Illumina (New England Biolabs). La biblioteca se secuenció en los extremos emparejados en una Nextseq 550 (Illumina), y las alineaciones de los extremos emparejados resultantes se analizaron usando Geneious 11.0.2 (Biomatters). Purificación del efector Cas12i
Los vectores efectores se transformaron en E. coli NiCo21 (DE3) (New England BioLabs) y se expresaron bajo un promotor T7. Las células transformadas se cultivaron inicialmente durante la noche en 3 ml de caldo Luria (Sigma) 50 ug/ml de kanamicina, seguido de inoculación de 1 litro de medio Terrific Broth (Sigma) 50 ug/ml de kanamicina con 1 ml de cultivo durante la noche. Las células se cultivaron a 37 °C hasta una DO600 de 1-1,5, luego se indujo expresión de proteínas con IPTG 0,2 mM. A continuación, los cultivos se cultivaron a 20 °C durante 14-18 horas más. Los cultivos se recogieron y se sedimentaron mediante centrifugación, luego se resuspendieron en 80 ml de tampón de lisis (HEPES 50 mM, pH 7,6, NaCl 0,5 M, imidazol 10 mM, 2-mercaptoetanol 14 mM y glicerol al 5 %) inhibidores de proteasa (Sigma). Las células se lisaron a través de un disruptor celular (Constant System Limited), luego se centrifugaron dos veces a 28.000xg durante 20 minutos a 4 °C para aclarar el lisado. El lisado se cargó sobre una columna HisTrap® FF de 5 ml (GE Life Sciences), luego se purificó mediante FPLC (AKTA Pure, GE Life Sciences) sobre un gradiente de imidazol de desde 10 mM hasta 250 mM. Se purificó Cas12i1 en tampón bajo en sal (HEPES-KOH 50 mM pH 7,8, KCl 500 mM, MgCh 10 mM, 2-mercaptoetanol 14 mM y glicerol al 5 %). Después de la purificación, las fracciones se procesaron en geles de SDS-PAGE y se agruparon las fracciones que contenían proteína del tamaño apropiado y se concentraron usando unidades centrífugas Amicon Ultra-15 de 10 kD. La concentración de proteínas se determinó mediante el ensayo de proteínas Qubit (Thermo Fisher).
Cas12i procesa pre-ARNcr in vitro
Para determinar si Cas12i1 puede realizar biogénesis autónoma de ARNcr, se incubó la proteína efectora purificada de E. coli con un pre-ARNcr expresado a partir de una matriz de CRISPR mínima (repeticiónespaciador-repetición-espaciador-repetición). Se observó que Cas12i1 purificado procesa el pre-ARNcr en fragmentos que coinciden con los ARNcr maduros identificados a partir del RNAseq pequeño in vivo, lo que sugiere que Cas12i1 puede procesar pre-ARNcr autónomo (figura 12).
Se realizaron ensayos de procesamiento de pre-ARNcr para Cas12i1 a 37 °C durante 30 minutos en tampón de escisión a una concentración final de pre-ARNcr de 100 nM. La reacción se realizó en tampón de escisión optimizado (Tris-HCl 50 mM pH 8,0, NaCl 50 mM, DTT 1 mM, MgCh 10 mM, 50 ug/ml de BSA) para Cas12i. Las reacciones se extinguieron con la adición de 1 ug/ul de proteinasa K (Ambion) y se incubaron a 37 °C durante 15 minutos. Se añadió EDTA 50 mM a las reacciones antes de mezclar con un volumen igual de tampón de muestra 2X TBE-Urea (Invitrogen) y desnaturalizar a 65 °C durante 3 minutos. Las muestras se analizaron en geles de TBE-Urea al 15 % (Invitrogen). Los geles se tiñeron durante 5 minutos con tinción de ácido nucleico SYBR Gold (Invitrogen) y se obtuvieron imágenes en Gel Doc EZ (Biorad). Se obtuvieron imágenes por primera vez de los geles que contenían pre-ARNcr marcado en el escáner Odyssey CLx (LI-COR Biosciences) antes de la tinción con SYBR.
Manipulación del ADN de Cas12i1 usando matrices fuertemente agotadas
Para explorar el mecanismo de la actividad de interferencia de Cas12i1, se seleccionaron secuencias de matriz de CRlSPR fuertemente agotadas del cribado de selección negativa in vivo y se generó pre-ARNcr con la disposición DR-espaciador-DR-espaciador-DR. Los pre-ARNcr se diseñaron para dirigir Cas12i1 a sustratos de ADNmc y ADNbc de 128 nt que contienen secuencias diana complementarias al segundo espaciador del pre-ARNcr. Se observó que el complejo binario Cas12i1 que consistía en la proteína efectora y el pre-ARNcr escindió 100 nM del ADNmc diana hasta la saturación a una concentración de complejo de 62,5 nM (figura 13). Se observó una degradación adicional del ADNmc escindido en fragmentos cortos o nucleótidos individuales a concentraciones crecientes del complejo, lo que sugiere una escisión colateral del ADNmc activada por la unión del complejo binario a una diana del ADNmc (figura 13).
Para explorar la actividad de interferencia de ADNbc de Cas12i, se seleccionó como diana el complejo binario Cas12i1 para dirigirse a sustratos de ADNbc que contenían una etiqueta de extremo 5' en la cadena complementaria no espaciadora. Para evaluar exhaustivamente tanto la escisión del ADNbc como la actividad de mellado, las reacciones de escisión del ADNbc resultantes se dividieron en tres fracciones para diferentes análisis. Las dos primeras fracciones se extinguieron y se analizaron en condiciones de electroforesis en gel desnaturalizantes o no desnaturalizantes, respectivamente. La tercera fracción se trató con 0,1 U de nucleasa S1 para convertir cualquier mella de ADNbc en roturas de doble cadena, se extinguió y se analizó mediante electroforesis en gel no desnaturalizante.
Se observó una escisión dependiente de la dosis en condiciones desnaturalizantes, lo que sugiere o bien mellado de la diana o bien escisión de ADNbc (figura 15). En condiciones no desnaturalizantes sin tratamiento con nucleasa S1, se observó un aumento dependiente de la dosis en un producto primario que migró con una movilidad electroforética ligeramente más baja que el ADNbc de entrada, lo que sugiere un producto de ADNbc mellado (figura 16). Cuando estos productos se incubaron con nucleasa S1, la banda desplazada hacia arriba se convirtió en un producto de ADNbc más pequeño, lo que indica la conversión mediada por S1 de ADNbc mellado en roturas de doble cadena (figura 16). También se observaron productos menores de escisión de ADNbc a altas concentraciones y tiempos de incubación, lo que indica que Cas12i1 es una nucleasa de ADNbc que escinde las cadenas complementarias espaciadoras (“SC”) y no espaciadoras complementarias (“NSC”) de ADNbc diana con eficiencias sustancialmente diferentes (figura 17A).
La observación de la actividad de mellado que acompaña al marcaje en 5' de la cadena complementaria del espaciador de los sustratos de ADNbc sugiere que Cas12i1 preferentemente mella en la cadena de ADN que se opone al híbrido ARNcr-ADN diana. Para validar este sesgo en la escisión de la cadena de ADN por Cas12i1, se generaron sustratos de ADNbc que se marcaron con colorante IR800 en el extremo 5' del complemento espaciador o en el extremo 5' de la cadena complementaria no espaciadora. A concentraciones más bajas del complejo efector, se observó sólo la escisión de la cadena NSC del dúplex de ADN, mientras que a concentraciones más altas del complejo efector, se observó la escisión tanto de la cadena NSC como de la SC (figura 17A-B). La comparación de la tinción con SYBR que marca todos los productos de ácido nucleico con el marcaje específico de cadenas usando el colorante IR800 revela una diferencia en la tasa de formación de productos de cadenas frente a la acumulación general de productos de escisión. Estos resultados sugieren una serie ordenada de acontecimiento que conducen a la interferencia de ADNbc, por lo que el complejo binario Cas12i1 mella en primer lugar la cadena NSC y luego escinde la cadena SC con una menor eficiencia, lo que da como resultado la escisión de ADNbc. Tomados en conjunto, estos hallazgos indican que Cas12i es un efector que puede realizar procesamiento autónomo de pre-ARNcr, escisión diana y colateral de ADNmc, y escisión de ADNbc. Este espectro de actividades catalíticas es muy similar al de Cas12a y Cas12b, excepto por el notable sesgo hacia la escisión de la cadena complementaria no espaciadora, lo que da como resultado una mella preferencial en el ADNbc.
Preparación de ARNcr y ARN de sustrato
Se solicitaron moldes de oligos de ADN monocatenario para ARNcr y ARN de sustrato a IDT. Los moldes de ARN de sustrato y pre-ARNcr se amplificaron por PCR para generar un molde de ADN de transcripción in vitro (IVT) bicatenario usando la mezcla maestra NEBNEXT Hifi 2x (New England Biolabs). Se generaron moldes ADN bicatenario para ARNcr maduro apareando el cebador de T7 con los moldes seguido de extensión usando ADN polimerasa I, fragmento grande (Klenow) (New England Biolabs). El apareamiento se realizó incubando durante 5 min a 95 °C seguido de una rampa descendente de -5 °C/min hasta 4 °C. Se realizó transcripción in vitro incubando los moldes de ADNbc con ARN polimerasa de T7 a 37 °C durante 3 horas usando el kit de ARN de alto rendimiento HiScribe® T7 Quick (New England Biolabs). Después de la incubación, las muestras de IVT se trataron con Turbo DNase® (Thermo Scientific) y luego se purificaron con el kit RNA Clean & Concentrator (Zymo Research). El ARNcr maduro generado a partir de IVT se trató con fosfatasa alcalina intestinal de ternera (Thermo Fisher) o ARN 5'-polifosfatasa (Lucigen) durante 2 horas a 37 °C para generar 5'-hidroxilo o 5'-monofosfato, respectivamente, seguido de limpieza con el kit RNA Clean & Concentrator (Zymo Research). Las concentraciones se midieron mediante Nanodrop 2000 (Thermo Fisher).
Las secuencias de pre-ARNcr usadas en la caracterización bioquímica de Cas12i se incluyen en la tabla 6. Los moldes de oligonucleótidos y los cebadores para la preparación de ARNcr se incluyen en la tabla 9.
Preparación de ADN y ARN de sustrato marcado con IR-800
Los sustratos de ARN de IVT se trataron con fosfatasa alcalina intestinal de ternera (Thermo Fisher) durante 30 minutos a 37 °C para convertir el 5’-trifosfato en un grupo hidroxilo 5’ terminal y se purificaron con el kit RNA Clean & Concentrator (Zymo Research). Se añadió un grupo terminal tiol al grupo hidroxilo 5’ terminal de los sustratos de ADN y ARN a través del kit de etiquetado 5’ EndTag (Vector Labs), luego se marcaron los sustratos con IRDye 800CW Maleimide (LI-COR Biosciences). Los sustratos se purificaron utilizando el kit DNA Clean & Concentrator o el kit RNA Clean & Concentrator (Zymo Research). Los sustratos de ADNbc marcados se generaron marcando la cadena de ADNmc no diana (complementaria no espaciadora), apareando con un cebador y luego extendiendo con ADN polimerasa I, fragmento grande (Klenow) (New England Biolabs) durante 15 minutos a 25 °C. Estos sustratos se purificaron con el kit DNA Clean & Concentrator (Zymo Research). Las concentraciones se midieron mediante Nanodrop 2000 (Thermo Fisher).
Las secuencias de sustrato de ARN y ADN usadas en la caracterización bioquímica de Cas12i se incluyen en las tablas 7 y 8.
Ensayos de escisión de la diana con Cas12i
ADNmc: los ensayos de escisión de la diana Cas12i con ADNmc se realizaron en tampón de escisión optimizado (Tris-HCl 50 mM pH 8,0, NaCl 50 mM, DTT 1 mM, MgCl2 10 mM, 50 ug/ml de BSA). El complejo binario se formó incubando una razón molar 1:2 de Cas12i:pre-ARNcr durante 10 minutos a 37 °C, seguido de transferencia a hielo. Todas las diluciones adicionales del complejo se realizaron en hielo manteniendo fija la razón proteína:ARN. El complejo se añadió a sustratos marcados con IR800 100 nM y se incubó a 37 °C durante 30 minutos. Las reacciones se trataron con un cóctel de ARNasa y proteinasa K y se analizaron tal como anteriormente.
ADNbc: los ensayos de escisión de diana de ADNbc se establecieron en el tampón de escisión optimizado a 37 °C durante 1 hora. El complejo binario se formó tal como se describió anteriormente y se añadió al sustrato ADNbc 100 nM. Las reacciones se trataron primero con cóctel de ARNasa con incubación a 37 °C durante 15 minutos. A continuación, se trataron con proteinasa K con incubación a 37 °C durante 15 minutos. Para detectar productos de escisión de ADNbc, las reacciones se analizaron con gel de TBE-urea al 15 % tal como se describió anteriormente. Para detectar la actividad de mellado de Cas12i, las reacciones se purificaron con SPRI después del tratamiento con proteinasa K y se dividieron en tres fracciones. Una fracción se analizó en un gel de TBE-urea al 15 % tal como se describió anteriormente. Otra fracción se mezcló con tampón de muestra de TBE de alta densidad 5x y se analizó en un gel de TBE al 4-20 % no desnaturalizante para detectar productos de ADNbc mellados. La última fracción se incubó con 0,01 U/ul de S1 nucleasa (Thermo Scientific) a 50 °C durante 1 hora para convertir las mellas en roturas de doble cadena, seguido de la mezcla con tampón de muestra TBE de alta densidad 5x y se analizó en un gel de TBE al 4-20 % no desnaturalizante. Se tomaron imágenes de todos los geles en el escáner Odyssey CLx seguido de una tinción con SYBR de 5 minutos y la imagen en el generador de imágenes Gel Doc.
Para identificar la cadena mellada, se preparó ADNbc marcando la cadena diana (complementaria al ARNcr) o la cadena no diana (complementaria sin espaciador, misma secuencia que el ARNcr). La reacción de escisión se realizó tal como se describe. A continuación, las cadenas marcadas se hibridaron con los cebadores correspondientes y se extendieron con ADN polimerasa I, fragmento grande (Klenow) (New England Biolabs) durante 15 minutos a 25 °C. Los sustratos de ADNbc luego se purificaron usando la purificación SPRI.
Tabla 6. Pre-ARNcr usados para la bioquímica in vitro de CLUST.029130 (tipo V-I)
Figure imgf000056_0001
Figure imgf000057_0001
Tabla 7. Sustratos usados para la bioquímica in vitro de CLUST.029130 (tipo V-I)
Figure imgf000057_0003
Tabla 8. Ácidos nucleicos colaterales usados para la bioquímica in vitro de CLUST.029130 (tipo V-I)
Figure imgf000057_0004
Tabla 9. Oligos molde de IDT y cebadores para ARNcr usados para la bioquímica in vitro de CLUST.029130 (tipo V-I)
Figure imgf000057_0002
Figure imgf000058_0001
Ejemplo 4; Cribado agrupado in vitro para la evaluación rápida de los sistemas de CRISPR-Cas (figuras 20-25)
Tal como se describe en el presente documento, el cribado agrupado in vitro sirve como un método eficiente y de alto rendimiento para realizar una evaluación bioquímica. A modo de resumen, se comienza por reconstitución in vitro del sistema de CRISPR-Cas (figura 20). En una realización, la proteína efectora se produce usando un reactivo de transcripción y traducción in vitro que usa un molde de ADNbc que contiene un promotor de la polimerasa de ARN T7 que impulsa la expresión de la(s) proteína(s) efectora(s) y produce proteínas para la reacción. En otra realización, las matrices de CRISPR mínimas y los ARNtracr incluyen secuencias del promotor T7 añadidas a las direcciones de transcripción de la cadena superior o de la cadena inferior usando PCR para interrogar todas las orientaciones posibles del ARN. Tal como se muestra en la figura 20, la forma Apo contiene sólo el efector, la forma binaria contiene la proteína efectora y la matriz de CRISPR mínima de transcripción de T7, y la forma binaria ARNtracr añade cualquier elemento de ARNtracr transcrito por T7 al complejo para la incubación.
En una realización, la actividad endonucleolítica de los sistemas de CRISPR-Cas es la principal actividad bioquímica analizada. La figura 21 muestra una forma de los sustratos de ADNmc y ADNbc, en la que una secuencia diana está flanqueada en ambos lados por 6 bases degeneradas para crear un grupo de posibles secuencias PAM que pueden activar la actividad de escisión de ADNmc y ADNbc. Además de la secuencia PAM, los sustratos incluyen marcas fiduciarias 5’ y 3’ diseñadas para facilitar los protocolos de preparación de bibliotecas de secuenciación de última generación que enriquecen selectivamente el sustrato de ADNmc o ADNbc, así como también proporcionan secuencias únicas que facilitan el mapeo de los productos de escisión. En una realización, el sustrato de ADNbc se genera mediante la síntesis de la segunda cadena en la dirección de 5’ a 3’ usando un cebador de ADN corto y ADN polimerasa I. Pueden realizarse reacciones similares usando grupos de diferentes dianas en la matriz de CRISPR mínima, así como bibliotecas de diferentes secuencias de ADNmc y ADNbc.
La reacción de escisión de CRISPR-Cas se realiza mezclando e incubando los complejos Apo/binario/binario-ARNtracr preformados con sustratos o bien de direccionamiento o bien no de direccionamiento. Si bien son posibles otros métodos, tales como la electroforesis en gel, una realización útil para la máxima sensibilidad y captura de resolución de pares de bases de la escisión es la secuenciación de última generación del sustrato de ADNmc o ADNbc después de la incubación con el complejo efector. La figura 22 es un esquema que describe la preparación de la biblioteca para el enriquecimiento de los sustratos de ADNmc. Al recocer un cebador en secuencias bien definidas dentro de las marcas fiduciarias, se produce la síntesis de la segunda cadena y la reparación del extremo para producir fragmentos de ADNbc que representan tanto el ADNmc cortado como el no cortado. Posteriormente, las moléculas de ADNbc recién formadas son un sustrato para la ligación del adaptador, después de lo cual se realiza una PCR selectiva usando un cebador (I5/P5) complementario al adaptador de ligación y otro (I7/P7) que es complementario a la fiduciaria en 3’ del sustrato original de ADNmc. Esto finalmente produce una biblioteca de secuenciación que contiene productos de ADNmc de longitud completa, así como escindidos y degradados, tal como se demuestra en la figura 24A. La preparación de la biblioteca NGS de lectura de ADNbc comienza sin requerir el recocido del cebador y la síntesis de la segunda cadena, por lo que la reparación final y la posterior ligación del adaptador pueden realizarse directamente. La figura 23 describe la descripción general de la preparación de la biblioteca que, de forma similar a la preparación de ADNmc, marca tanto los fragmentos escindidos/degradados así como los no escindidos. Cabe destacar que cualquiera de los extremos del fragmento de escisión de ADNbc puede enriquecerse en función de la elección del cebador de PCR. En una realización, ilustrada en la figura 24A, pueden prepararse bibliotecas de secuenciación de última generación para manipulación de ADNbc para lectura con un primer cebador complementario a un asidero ligado al extremo 5’ del sustrato de longitud completa o escindido (y que contiene secuencias I5/P5) y un segundo cebador complementario a la fiduciaria en 3' secuencia del sustrato (y que contiene secuencias I7/P7). En una realización, ilustrada en la figura 24B, pueden prepararse bibliotecas de secuenciación de última generación para manipulación de ADN para lectura con un primer cebador complementario a la secuencia de referencia 5' del sustrato (y que contiene secuencias I5/P5) y un segundo cebador complementario a un asidero ligado al extremo 3' del sustrato de longitud completa o escindido (y que contiene secuencias I7/P7). La longitud de la diana y la longitud del sustrato pueden extraerse de las lecturas NGS resultantes de los experimentos de manipulación de ARN/ADNmc/ADNbc tal como se muestra en figuras 25A-B, respectivamente. La longitud de diana y las longitudes de sustrato extraídas pueden usarse para investigar la presencia de mellas o escisión de ARN/ADNmc/ADNbc.
Ejemplo 5: Caracterización de la actividad de escisión de ADNbc para el sistema de CRISPR-Cas de tipo V-11 (figuras 26 - 32)
Habiendo identificado computacionalmente los componentes mínimos de los sistemas de CRISPR-Cas de tipo V­ I, se investigó la actividad de escisión del ADN bicatenario (ADNbc) del sistema de tipo V-I1 que contiene el efector Cas12i1.
Cas12i1 expresado por IVTT en complejo con un ARNcr expresado en la cadena superior que selecciona como diana ADNbc dio como resultado una población de longitudes de diana truncadas que no están presentes en los controles apo (sólo efectores) tal como se muestra en la figura 26A-B. Las bibliotecas preparadas usando un adaptador de ligación en 5' y seleccionando la fiduciaria en 3' (tal como se muestra en la figura 24A) mostraron un producto de escisión no presente en el control Apo en la posición 24 dentro de la secuencia diana. Este resultado indica una mella en la cadena de ADNbc no diana o en ambas cadenas del ADNbc entre los nucleótidos 24 y 25 en relación con PAM. El análisis de la longitud de la diana muestra un pico en 24 que indica el truncamiento de la diana entre los nucleótidos 24 y 25 (figura 27A). Esta población de secuencias diana truncadas coincide con longitudes de sustrato que indican la escisión de la cadena de ADNbc no diana entre los nucleótidos 24 y 25 de la secuencia diana (figura 28A).
Las bibliotecas preparadas usando un adaptador de ligación en 3' y seleccionando la fiduciaria en 5' (tal como se muestra en la figura 24B) mostraron un producto de escisión no presente en el control Apo en la posición -9 (+19 dada una diana de 28 nt) dentro de la secuencia diana. Este resultado indica o bien una mella en la cadena de ADNbc diana o bien en ambas cadenas de ADNbc entre los nucleótidos 19 y 20 en relación con PAM. El análisis de la longitud de la diana muestra un pico a -9 nucleótidos de PAM (diana de longitud completa de 28 nt) que indica el truncamiento de la diana entre los nucleótidos 19 y 20 (figura 27B). Esta población de secuencias diana truncadas coincide con longitudes de sustrato que indican la escisión de la cadena de ADNbc diana entre los nucleótidos 19 y 20 de la secuencia diana (figura 28B).
El análisis de motivo de secuencia para sustratos que muestran escisión de cadena no diana entre los nucleótidos 24/+25 en relación con pAm reveló un motivo PAM TTN en 5' a la izquierda de la secuencia diana para Cas12i1 (figura 29). No se observó ningún requisito de secuencia PAM en el lado derecho de la diana Cas12i1. Tomados en conjunto, el cribado in vitro de Cas12i1 indica mellas predominantes entre los 24/+25 nucleótidos de la cadena no diana en relación con un PAM TTN con una fracción significativa de estos productos convertidos en roturas de doble cadena con una proyección de 5nt 3' por escisión de la cadena diana entre los 19/+20 nucleótidos relativos al PAM (figura 30).
El direccionamiento de Cas12i1 en complejo con un ARNcr no diana expresado en la cadena superior dio como resultado que no se manipulara el pariente del ADNbc, lo que indica que la especificidad de escisión de Cas12i1 es conferida por el espaciador de ARNcr (figura 31A-B). Cas12i1 no mostró actividad de escisión en presencia de un ARNcr expresado en la cadena inferior dirigido al sustrato de ADNbc, lo que indica que se requiere el ARNcr orientado en la cadena superior para la formación del complejo Cas12i1 activo (figura 32A-B).
Ejemplo 6: Caracterización de la actividad de escisión de ADNbc para el sistema de CRISPR-Cas de tipo V-I2 (figuras 33 - 39)
Habiendo identificado computacionalmente los componentes mínimos de los sistemas de CRISPR-Cas de tipo V­ I, se investigó la actividad de escisión del ADN bicatenario (ADNbc) del sistema de tipo V-I2 que contiene el efector Cas12i2.
Cas12i1 expresado por IVTT en complejo con un ARNcr expresado en la cadena superior que selecciona como diana ADNbc dio como resultado una población de longitudes de diana truncadas que no están presentes en los controles apo (sólo efectores) tal como se muestra en la figura 33A-B. Las bibliotecas preparadas usando un adaptador de ligación en 5' y seleccionando la fiduciaria en 3' (tal como se muestra en la figura 24A) mostraron un producto de escisión no presente en el control Apo en la posición 24 dentro de la secuencia diana. Este resultado indica una mella en la cadena de ADNbc no diana o en ambas cadenas del ADNbc entre los nucleótidos 24 y 25 en relación con PAM. El análisis de la longitud de la diana muestra un pico en 24 que indica el truncamiento de la diana entre los nucleótidos 24 y 25 (figura 34A). Esta población de secuencias diana truncadas coincide con longitudes de sustrato que indican la escisión de la cadena de ADNbc no diana entre los nucleótidos 24 y 25 de la secuencia diana (figura 35A).
Las bibliotecas preparadas usando un adaptador de ligación en 3' y seleccionando la fiduciaria en 5' (tal como se muestra en la figura 33B) mostraron un producto de escisión no presente en el control Apo en la posición -7 (+24 dada una diana de 31 nt) dentro de la secuencia diana. Este resultado indica o bien una mella en la cadena de ADNbc diana o bien en ambas cadenas de ADNbc entre los nucleótidos 24 y 25 en relación con PAM. El análisis de la longitud de la diana muestra un pico a -7 nucleótidos de PAM (diana de longitud completa de 28 nt) que indica el truncamiento de la diana entre los nucleótidos 24 y 25 (figura 34B). Esta población de secuencias diana truncadas coincide con longitudes de sustrato que indican la escisión de la cadena de ADNbc diana entre los nucleótidos 24 y 25 de la secuencia diana (figura 35B).
El análisis de motivo de secuencia para sustratos que muestran escisión de cadena no diana entre los nucleótidos 24/+25 en relación con pAm reveló un motivo PAM TTN en 5' a la izquierda de la secuencia diana para Cas12i2 (figura 36). No se observó ningún requisito de secuencia PAM en el lado derecho de la diana Cas12i2. Tomados en conjunto, el cribado in vitro de Cas12i2 indica mellas predominantes entre los 24/+25 nucleótidos de la cadena no diana en relación con un PAM TTN con una fracción significativa de estos productos convertidos en roturas de doble cadena con un corte romo por escisión de la cadena diana entre los 24/+25 nucleótidos relativos al PAM (figura 37).
El direccionamiento de Cas12i2 en complejo con un ARNcr no diana expresado en la cadena superior dio como resultado que no se manipulara el pariente del ADNbc, lo que indica que la especificidad de escisión de Cas12i12 es conferida por el espaciador de ARNcr (figura 38A-B). Cas12i2 no mostró actividad de escisión en presencia de un ARNcr expresado en la cadena inferior dirigido al sustrato de ADNbc, lo que indica que se requiere el ARNcr orientado en la cadena superior para la formación del complejo Cas12i2 activo (figura 39A-B).
Ejemplo 7: Los sistemas de CRISPR Cas CLUST.029130 (tipo V-I) pueden usarse para silenciar genes in vitro
Se desarrolló un ensayo de silenciamiento génico in vitro (figuras 18A y 18B) para imitar la actividad de silenciamiento génico in vivo para la validación rápida de la actividad de un sistema de CRISPR-Cas novedoso. Este ensayo puede evaluar simultáneamente de manera imparcial diferentes mecanismos de actividad y parámetros funcionales fuera del entorno celular natural.
En primer lugar, un sistema de IVTT (transcripción y traducción in vitro) reconstituido se complementó con la enzima central de E. coli ARN polimerasa para permitir que se produjera la expresión génica (síntesis de proteínas) no sólo del promotor t7 sino también de cualquier promotor de E. coli, siempre que el correspondiente factor sigma de E. coli esté presente.
En segundo lugar, para facilitar la experimentación rápida y de alto rendimiento, se usaron directamente moldes de ADN lineal generados a partir de reacciones de pCr . Estos moldes de ADN lineal incluían los que codifican para el efector tipo V-I, una guía de ARN y factor sigma 28 de E. coli. La incubación de estos moldes de ADN con el reactivo IVTT reconstituido da como resultado la coexpresión del efector d tipo V-I y una guía de ARN, y la formación del RNP (complejo de ribonucleoproteína). El factor sigma 28 de E. coli también se expresó para la expresión posterior de GFP y RFP tal como se describe a continuación.
En tercer lugar, como sustrato diana, se incluyó en la reacción de incubación anterior un ADN lineal o plásmido que codifica para GFP expresado a partir del promotor del factor sigma 28, de manera que el RNP recién sintetizado tiene acceso inmediato al sustrato diana. Como control interno, también se incluyó un RFP codificante de ADN lineal no diana expresado a partir del promotor del factor 28 sigma. La enzima central ARN polimerasa sola no reconoce el promotor del factor 28 sigma hasta que se sintetiza suficiente proteína del factor 28 sigma. Este retraso en la expresión de GFP y RFP permite que el RNP recién sintetizado interfiera con el sustrato diana de GFP, lo que podría provocar una disminución en la expresión de GFP y un agotamiento de la fluorescencia de GFP. La expresión de RFP, por otro lado, no se vio afectada negativamente, lo que sirve como control interno para la síntesis de proteínas y la medición de fluorescencia.
Determinadas ventajas importantes del ensayo de silenciamiento génico in vitro descrito en el presente documento incluyen:
(1) Modularidad: el IVTT reconstituido es un sistema sintético que consiste en componentes purificados individualmente, lo que permite que el ensayo se diseñe a la medida para una variedad de controles y actividades. Cada componente del sistema de CRISPR-Cas está codificado en un molde de ADN lineal separado, lo que permite ensayos rápidos de una combinación de diferentes efectores, variantes de efectores y guías de ARN;
(2) Complejidad: el ensayo contiene todos los componentes esenciales para la transcripción del ARN y la síntesis de proteínas, lo que permite someter a prueba diversos mecanismos de interferencia en una sola reacción, tal como la escisión del ADN y el ARN, y la interferencia dependiente de la transcripción. Las lecturas de fluorescencia cinética del ensayo proporcionan significativamente más puntos de datos que los ensayos de actividad de punto final;
(3) Sensibilidad: el ensayo combina la síntesis del efector y la guía de ARN con la interferencia del sustrato, lo que permite que los RNP (complejos de ribonucleoproteína de proteína efectora y guía de ARN) recién sintetizados interactúen inmediatamente con el sustrato en la misma reacción. No hay etapas de purificación separadas, lo que potencialmente permite que pequeñas cantidades de RNP sean suficientes para generar la señal. Además, la interferencia de la expresión de GFP se amplifica debido a la transcripción y traducción acopladas de GFP que pueden generar >100 proteínas GFP por molde de ADN.
(4) Eficiencia: el ensayo está diseñado para ser altamente compatible con plataformas de alto rendimiento. Debido a su modularidad, todos los componentes del ensayo pueden añadirse en formatos de 96, 384 y 1536 pocillos mediante instrumentos de manejo de líquidos comúnmente disponibles, y la fluorescencia puede medirse mediante fluorómetros de placa comúnmente disponibles.
(5) Relevancia: el ensayo prueba la capacidad de una proteína efectora CRISPR-Cas para interferir con la expresión génica durante la transcripción y traducción en un sistema in vitro modificado por ingeniería genética fuera de su entorno celular natural. Es posible que un efector CRISPR-Cas altamente activo medido por este ensayo de silenciamiento génico también sea altamente eficiente para la edición de genes en células de mamíferos.
Este ensayo se ha usado para medir el efecto de silenciamiento génico de un complejo efector Cas12i, tal como se ilustra en ese caso, cuando se selecciona como diana GFP codificada en ADN plasmídico. Se diseñan múltiples guías de ARN de tipo V-I: una con una secuencia espaciadora complementaria a la cadena molde de la secuencia GFP y otra con una secuencia espaciadora complementaria a la cadena codificante de la secuencia GFP. A continuación, se comparó el grado de silenciamiento génico de la proteína efectora Cas12i1 con el de los mutantes Cas12i1 D647A, Cas12i1 E894A y Cas12i1 D948A.
La figura 19A representa el agotamiento en veces de cada uno de los cuatro efectores Cas12i sometidos a prueba cuando forman un complejo con una guía de ARN complementaria a la cadena molde. En este caso, la cadena no diana, preferentemente mellada, es la cadena codificante. Mientras que Cas12i1 muestra un agotamiento de aproximadamente el doble de la expresión de GFP después de 400 minutos, cada una de las tres formas mutantes muestra grados más pequeños de agotamiento.
La figura 19B representa el agotamiento en veces de cada uno de los cuatro efectores Cas12i1 sometidos a prueba cuando forman un complejo con una guía de ARN complementaria a la cadena codificante. En este caso, la cadena no diana, preferentemente mellada, es la cadena molde. La capacidad de la ARN polimerasa para producir un transcrito de ARN funcional parece verse significativamente afectada por Cas12i1 en esta configuración, con un agotamiento de más de 4 veces en el caso de Cas12i. La capacidad de silenciamiento génico de las tres formas mutantes parece significativamente disminuida.
En conjunto, los datos que se muestran en la figura 19A y la figura 19B indican que el ensayo es eficaz para detectar la actividad de silenciamiento génico de Cas12i1 cuando se usan guías de ARN que seleccionan como diana tanto la cadena codificante como la de molde. El agotamiento significativamente más alto cuando se selecciona como diana la cadena codificante que al seleccionar como diana la cadena de molde sugiere que Cas12i1 interfiere con la expresión de GFP al cortar preferentemente la cadena no diana. Los tres mutantes Cas12i1 sustituyen los residuos catalíticos postulados (ácido aspártico (D) y ácido glutámico (E)) con alanina (A). Las actividades de silenciamiento decrecientes de estos mutantes Cas12i1 respaldan aún más que la escisión del soporte del ADN, en lugar de solo la unión, subyace en el mecanismo del silenciamiento génico por Cas12i1.
Ejemplo 8. Los sistemas de CRISPR-Cas CLUST.029130 (tipo V-I) pueden usarse con un indicador fluorescente para la detección específica de especies de ácido nucleico
Las actividades nucleasa de las proteínas Cas12i (es decir, actividades ADNasa colaterales no específicas activadas por un sustrato de ADNmc diana complementario al espaciador de ARNcr) hacen que estos efectores sean candidatos prometedores para su uso en la detección de especies de ácidos nucleicos. Algunos de estos métodos se han descrito previamente (véase, por ejemplo, East-Seletsky et al. (“Two distinct RNase activities of CRISPR-C2c2 enable guide-RNA processing and RNA detection,” Nature. 13 de octubre de 2016; 538(7624):270-273), Gootenberg et al. (2017), Chen et al. 2018 y Gootenberg et al. (2018) “Multiplexed and portable nucleic acid detection platform with Cas13, Cas12a and Csm6” Science 15 febrero de 2018: eaaq0179), que describe el principio general de la detección de ARN usando Cas13a (East-Seletsky et al. (2016)), complementado con amplificación para aumentar la sensibilidad de detección y optimización de enzimas Cast 3a adicionales (Gootenberg et al. (2017)) y, más recientemente, la inclusión de dianas de ARN adicionales, enzimas ortólogas y parálogas y el activador Csm6 para permitir la detección multiplexada de ácidos nucleicos junto con un aumento en la sensibilidad de detección (Gootenberg et al. (2018)). La adición de Cas12i a este kit de herramientas proporciona un canal adicional de actividad ortogonal para la detección de ácidos nucleicos.
La actividad bioquímica in vitro de Cas 12i1 sugiere que puede ser prometedor en aplicaciones para la detección sensible de ácidos nucleicos, dado que un ADN colateral marcado con colorante se escindió de manera eficiente a bajas concentraciones de ADNmc diana y la actividad nucleasa de fondo se limitó con un sustrato no dirigido (figura 14). La adaptación de Cas12i1 hacia una aplicación de detección de ácido nucleico sensible requiere varias etapas, que incluyen, entre otras, optimizar el sustrato para una lectura sensible de la actividad colateral e identificar la tolerancia al apareamiento erróneo por bases entre el espaciador y el sustrato diana.
La identificación del sustrato óptimo para la detección de ácidos nucleicos puede notificarse realizando secuenciación de última generación (nGs ) en los productos de escisión de la actividad colateral de Cas12i en ambos sustratos de ADN. Es posible que sea necesario titular la concentración de enzima o ajustar el tiempo de incubación con el fin de producir fragmentos de escisión que tengan todavía un tamaño suficiente para prepararlos en una biblioteca de secuenciación de última generación. Los datos de NGS revelan los sitios de escisión de enzimas y las preferencias de bases adyacentes. Se ha demostrado que los efectores individuales dentro de las familias Cas13a y Cas13b tienen diferentes preferencias de bases de dinucleótidos para la escisión del ARN, lo que produce magnitudes de escisión y razones de señal con respecto a ruido marcadamente diferentes (Gootenberg et al. (2018)). Los datos de NGS colateral permiten una mejor comprensión de las preferencias de Cas12i. Un enfoque experimental separado para identificar la preferencia de dinucleótidos de la escisión colateral de Cas12i es crear un sustrato de ADN colateral con N degenerados en posiciones consecutivas para tener un espacio de secuencia más amplio que una secuencia definida. La preparación de la biblioteca y el análisis de los datos de NGS procederían de manera similar para identificar las preferencias de base para la escisión. Para verificar la preferencia, pueden introducirse sustratos colaterales que contengan ADN/ARN cortos sintetizados con un par de fluoróforo/extintor en los extremos 5' y 3' en una reacción de escisión para evaluar la razón de señal con respecto a ruido. Puede realizarse una optimización adicional en la longitud del sustrato colateral de ADN para determinar si Cas12i1 tiene una preferencia de longitud.
Habiendo identificado el sustrato preferido, otro parámetro importante que determinar es la tolerancia al apareamiento erróneo del sistema de Cas1ig, ya que tiene implicaciones para el diseño de guías que afecta a la capacidad de la enzima para distinguir apareamientos erróneos de un solo par de bases. La tolerancia al apareamiento erróneo puede determinarse mediante el diseño de un panel de dianas con diferentes posiciones y tipos de apareamientos erróneos (por ejemplo, inserciones/deleciones, apareamientos erróneos de un solo par de bases, apareamientos erróneos dobles adyacentes, apareamientos erróneos dobles separados, apareamientos erróneos triples y más). La tolerancia al apareamiento erróneo puede medirse evaluando la cantidad de escisión de ADN colateral para dianas que contienen cantidades variables de apareamientos erróneos. Como ejemplo, el sustrato de ADN colateral podría ser una sonda de ADNmc corta que contenga un fluoróforo y un extintor en lados opuestos. Para las reacciones que contienen el efector Cas12i, una guía de ARN y un sustrato diana que contiene diferentes números de apareamientos erróneos, inserciones y deleciones en la secuencia diana, la activación exitosa del sistema de Cas12i mediante la selección como diana de la secuencia de ADN diana alterada dará como resultado la escisión colateral de la sonda fluorescente. Por tanto, las mediciones fluorescentes resultantes que denotan sustrato colateral escindido pueden restarse del fondo usando muestras de control negativo y normalizarse a la señal de dianas perfectamente coincidentes para estimar el impacto de las alteraciones de la diana sobre la eficiencia de la escisión colateral por Cas12i. Los mapas resultantes de tolerancia al apareamiento erróneo, inserción y deleción por parte de la enzima Cas12i sobre la longitud de la diana en relación con el PAM pueden usarse para diseñar guías de ADN óptimas para distinguir entre diferentes secuencias de ARN o genotipos para detección específica o distinción entre diferentes especies de ácido nucleico. Usando la lectura de escisión fluorométrica y el sustrato colateral preferido, la actividad de fluorescencia se compararía con la secuencia completamente emparejada para determinar la posición y los tipos de apareamiento erróneo a los que la enzima es más sensible.
El proceso de optimización puede aplicar además a otros ortólogos de Cas12i para producir otros sistemas que pueden tener propiedades diferentes. Por ejemplo, las preferencias de dinucleótidos ortogonales de escisión colateral serían útiles para generar canales de detección separados.
Ejemplo 9. Los sistemas de CRISPR Cas CLUST.029130 (tipo V-I) pueden usarse para mellado emparejado para permitir la manipulación altamente específica de ADNbc
El efector de CLUST.029130 Cas12i puede manipular ADNbc cortando la cadena no diana (figuras 15, 16, 17A-B). También puede fusionarse Cas12i catalíticamente inactivado t con un dominio de nucleasa FokI para crear una proteína de fusión que puede unirse y cortar el ADNbc. Algunos de estos métodos se han descrito previamente. Ran et al. (2013) “Double Nicking by RNA-Guided CRISPR Cas9 for Enhanced Genome Editing Specificity” Science 29 de agosto de 2013 describe el principio general y la optimización de doble mellado usando Cas9; Guilinger et al. (2014) “Fusion of catalytically inactive Cas9 to Fokl nuclease improves the specificity of genome modification” Science 25 de abril de 2014 describió el principio de doble mellado usando una fusión FokI-dCas9.
El uso de Cas12i nickasas emparejadas permite la manipulación de ADNbc altamente específica tal como sigue. Un primer complejo de Cas12i con un ARNcr que selecciona como diana una cadena de una región diana de ADNbc y un segundo complejo Cas12i-ARNcr que selecciona como diana la cadena opuesta del ADNbc se introducen juntos para permitir una reacción de escisión de ADNbc. Al seleccionar como diana los complejos de Cas12i a diferentes cadenas de ADNbc, el primer y el segundo complejo de Cas12i escinden las cadenas opuestas de ADNbc, lo que da como resultado una rotura de doble cadena.
Para optimizar la eficacia de la formación de roturas de doble cadena de ADNbc mediante mellas dobles, se eligen pares de secuencias espaciadoras de ARNcr con diferentes longitudes que separan sus sitios de escisión de nucleasa esperados. La escisión de la cadena superior e inferior de ADNbc por Cas12i nickasas emparejadas con diferentes desplazamientos de diana produce proyecciones de secuencia de diferente longitud, lo que da como resultado diferentes eficiencias de formación de ruptura de doble cadena. Las dianas de nickasa emparejadas pueden seleccionarse con orientaciones específicas para generar proyecciones o bien en 3' o bien en 5', o roturas de doble cadena romas (longitud de proyección de 0).
Para aplicaciones de mellado con las enzimas Cas12i1 y Cas12i2-WT que contienen PAM TTN 5', la orientación de las dianas de nickasa emparejadas con PAM “fuera” (PAM en el exterior de las dianas emparejadas) da como resultado una proyección de 5', mientras que el emparejamiento de dianas de nickasa con pAm en el interior del par diana da como resultado una proyección en 3'. En algunos casos, las proyecciones en 3' y 5' oscilan entre 1 y 200 nt. En algunos casos, las proyecciones en 3' y 5' están entre 20 y 100 nt.
El procesamiento autónomo de pre-ARNcr facilita la administración de Cas12i para aplicaciones de doble mellado (figura 12), ya que dos loci genómicos separados pueden dirigirse a partir de una sola transcripción de ARNcr. En él, Cas12i y una matriz de CRISPR que contiene dos secuencias espaciadoras dirigidas a Cas12i para cortar cadenas opuestas de ADNbc pueden expresarse a partir de un solo vector viral o plásmido. Cas12i y la matriz de CRISPR también pueden administrarse en plásmidos o vectores virales separados. Luego, la proteína Cas12i procesa la matriz de CRISPR en dos ARNcr afines que dan como resultado la formación de complejos de mellado emparejados. Los vectores virales pueden incluir fagos o virus adenoasociados para la administración a bacterias o células de mamíferos, respectivamente.
Aparte de los métodos de administración de virus o plásmidos, los complejos de mella emparejados pueden administrarse directamente usando nanopartículas u otros métodos de administración directa de proteínas, de modo que los complejos que contienen ambos elementos de ARNcr emparejados se administran conjuntamente. Además, la proteína puede administrarse a las células mediante un vector viral o directamente, seguido de la administración directa de una matriz de CRISPR que contiene dos espaciadores emparejados para doble mellado. En algunos casos, para el suministro directo de ARN, el ARN puede conjugarse con al menos un resto de azúcar, como N-acetil galactosamina (GalNAc) (en particular, GalNAc triantenaria).
Ejemplo 10: Adaptación de efectores de sistema de CRISPR-Cas CLUST.029130 (tipo V-I) para actividad en eucariotas y mamíferos
Para desarrollar sistemas de CRISPR-Cas CLUST.029130 (tipo V-I) para aplicaciones eucarióticas, los constructos que codifican para los efectores proteicos se sometieron en primer lugar a optimización de codones para su expresión en células de mamíferos, y se añadieron etiquetas de localización específicas opcionalmente a cualquiera o ambos de los extremos N-terminal o C-terminal de la proteína efectora. Estas etiquetas de localización pueden incluir secuencias tales como secuencias de señal de localización nuclear (NLS), que localizan el efector en el núcleo para modificar el ADN genómico. Estas secuencias se describieron anteriormente en la sección “Mutaciones funcionales”. Algunos ejemplos de secuencias de nucleótidos diseñadas por ingeniería genética que no se producen de manera natural para codificar para efectores Cas12i de mamífero con codones optimizados con una etiqueta de localización se proporcionan en la tabla 10. Otras proteínas accesorias, tales como proteínas fluorescentes, pueden añadirse adicionalmente. Se ha demostrado que la adición de proteínas “superplegables” robustas, tales como proteína fluorescente verde (GFP) superplegable, puede aumentar la actividad de enzimas CRISPR en células de mamífero cuando se añaden al efector (Abudayyeh et al. (2017) Nature 550 (7675): 280-4, y Cox et al. (2017) Science 358(6366): 1019-27).
La secuencia con codones optimizados que codifica para Cas12i y las proteínas accesorias y señales de localización adjuntas se clonaron luego en un vector de expresión eucariota con la secuencia de inicio de la traducción eucariota 5' Kozak apropiada, promotores eucariotas y señales de poliadenilación. En los vectores de expresión de mamíferos, estos promotores pueden incluir, por ejemplo, promotores generales tales como CMV, EF1a, EFS, CAG, SV40 y promotores de ARN polimerasa II específicos de tipo celular tales como Syn y CamKIIa para la expresión neuronal y globulina fijadora de tiroxina (TBG) para la expresión en hepatocitos, por nombrar algunos. De manera similar, las señales de poliadenilación útiles incluyen, pero no se limitan a, SV40, hGH y BGH. Pueden usarse elementos de estabilización de transcritos o de exportación nuclear de transcritos adicionales, tales como WPRE, para aumentar la expresión de tales constructos. Para la expresión del pre-ARNcr o del ARNcr maduro, pueden usarse promotores de ARN polimerasa III tales como H1 o U6.
Dependiendo de la aplicación y el modo de empaquetamiento, el vector de expresión eucariota puede ser una estructura principal de plásmido lentiviral, una estructura principal de plásmido de virus adenoasociado (VAA) o una estructura principal de plásmido similar que puede usarse en la producción de vectores virales recombinantes. En particular, el pequeño tamaño de las proteínas efectoras de CRISPR-Cas CLUST.029130 (tipo V-I), por ejemplo, proteínas Cas12i, las hace idealmente adecuadas para empaquetarse junto con su ARNcr y secuencias de control apropiadas en una sola partícula de virus adenoasociado; el límite de tamaño de empaquetamiento de 4,7 kb para VAA puede impedir el uso de efectores más grandes, particularmente si se usan promotores específicos de tipo celular grandes para el control de la expresión.
Después de adaptar las secuencias, los vectores de administración y los métodos para su uso en eucariotas y mamíferos, se caracterizó el rendimiento de diferentes constructos de Cas12i tal como se describe en el presente documento. Se realizó una caracterización inicial por lipofección de constructos de ADN que expresan los componentes mínimos del sistema de Cas12i con las adaptaciones para su uso en eucariotas tal como se describió anteriormente. En una realización, el efector Cas12i tiene codones de mamíferos optimizados, y está unida una secuencia de localización nuclear de nucleoplasmina (npNLS) al extremo C-terminal de la proteína. La expresión del efector está impulsada por el promotor del factor de elongación 1 alfa corto (EFS) y se termina usando una señal de poli(A) bGH (tabla 10). Se usó un producto de PCR lineal bicatenario que contenía un promotor U6 para expresar las guías de ARN relacionadas para el sistema de Cas12i, según la adaptación de (Ran et al. “Genome engineering using the CRISPR-Cas9 system”, NatProtoc. Noviembre de 2013;8(11):2281-2308). Este enfoque es muy adecuado para someter a prueba un mayor número de ARNsg a lo largo de la clonación de plásmidos y la verificación de secuencias (figura 40). El plásmido efector y el fragmento de PCR guiado por U6 se cotransfectaron en células 293T a una razón molar de aproximadamente 1:2 de plásmido con respecto a producto de PCR con 400 ng de plásmido efector y 30 ng de producto de PCR guiado por U6 para un formato de placa de 24 pocillos. El evento de edición génica resultante se evaluó usando secuenciación de última generación de un amplicón de PCR dirigido que rodea el sitio diana (Hsu et al., “DNA targeting specificity of RNA-guided Cas9 nuclases”, NatBiotechnol. Septiembre de 2013;31(9):827-32.).
La evaluación inicial de Cas12i2 produjo una actividad de indel del 13 % en el locus de VEGFA en un sitio diana con un PAM TTC. Se sometieron a prueba diferentes diseños de guías de ARN tal como se describe en la figura 41, lográndose la eficiencia de indel más fuerte usando pre-ARNcr, y disminuyendo las tasas de indel con longitudes de espaciador más cortas. El examen de las indels creadas por Cas12i2 revela que la ubicación predominante de las indels se centra alrededor de 20 en relación con la secuencia de PAM.
La multiplexación de los efectores de tipo V-I se logra usando la capacidad de procesamiento de pre-ARNcr de los efectores, en los que pueden programarse múltiples dianas con diferentes secuencias en una sola guía de ARN. Como tal, múltiples genes o dianas de ADN pueden manipularse simultáneamente para aplicaciones terapéuticas. Una realización de un diseño de guía de ARN es un pre-ARNcr expresado a partir de una matriz de CRISPR que consiste en secuencias diana intercaladas por secuencias de DR sin procesar, repetidas para permitir la selección como diana de uno, dos o más loci simultáneamente mediante el procesamiento intrínseco de pre-ARNcr del efector.
Además de someter a prueba diversas configuraciones de constructo y secuencias accesorias en dianas individuales, se usan enfoques basados en bibliotecas agrupadas para determinar 1) cualquier dependencia de direccionamiento de proteínas Cas12i específicas en células de mamíferos, así como 2) el efecto de las ubicaciones y combinaciones de apareamientos erróneos a lo largo de la longitud del ARNcr de direccionamiento. Brevemente, la biblioteca agrupada incluye un plásmido que expresa un ADN diana que contiene diferentes secuencias flanqueantes, así como apareamientos erróneos con la guía o guías usadas en el experimento de cribado, de manera que el reconocimiento y la escisión exitosos de la diana dan como resultado el agotamiento de la secuencia de la biblioteca. Además, la secuenciación de indel dirigida o los ensayos de escisión de todo el genoma sin sesgos pueden usarse para evaluar la especificidad del sistema de CRISPR-Cas CLUST.029130 (tipo V-I) (Hsu et al. (2013), Tsai et al. “GUIDE-seq enables genome-wide profiling of off-target cleavage by CRISPR-Cas nucleases”. NatBiotechnol. Febrero de 2015;33(2):187-197, Kim et al. “Digenome-seq: genome-wide profiling of CRISPR-Cas9 off-target effects in human cells”, Nat Methods. Marzo de 2015;12(3):237-43, Tsai et al., “CIRCLE-seq: a highly sensitive in vitro screen for genome-wide CRISPR-Cas9 nuclease off-targets”, Methods Nat. Junio de 2017;14(6):607-614).
Además, se crean mutaciones para ampliar el intervalo funcional de las proteínas Cas12i. En alguna realización, pueden producirse proteínas Cas12i catalíticamente inactivas en las que los residuos conservados del dominio RuvC están mutados a alanina (tal como la mutación D647A para Cas12i1 y la mutación D599A para Cas12i2). Las versiones catalíticamente inactivas de Cas12i (denominadas dCas12i) conservan su actividad de unión a ADN programable, aunque ya no podrán escindir el ADNbc o ADNmc colateral o diana. Los usos directos de dCas12i incluyen inmunoprecipitación y represión transcripcional. Se proporciona más funcionalidad uniendo otros dominios a la proteína dCas12i.
Las actividades de estos dominios incluyen, pero no se limitan a, la modificación de bases del ADN (por ejemplo, ecTAD y sus formas evolucionadas, APOBEC), la mutilación del ADN (m6A metiltransferasas y desmetilasas), factores de localización (secuencia de retención KDEL, señal de direccionamiento mitocondrial), factores de modificación de la transcripción (por ejemplo: KRAB, VP64). Además, pueden unirse dominios para proporcionar un control adicional, tales como control activado por luz (criptocromos) y los componentes inducibles químicamente (dimerización inducible químicamente FκΒP-FRB).
La optimización de la actividad de tales proteínas de fusión requiere un modo sistemático de comparación de ligadores que conectan la dCas12i con el dominio adjunto. Estos ligadores pueden incluir, pero no se limitan a, ligadores flexibles de glicina-serina (GS) en diversas combinaciones y longitudes, ligadores rígidos tales como la secuencia EAAAK que forma una hélice alfa, ligador XTEN (Schellenberger V, et al. Nat. Biotechnol.
2009;27:1186-1190), así como diferentes combinaciones de los mismos (véase la tabla 11). Luego, los diversos diseños se analizan en paralelo sobre el mismo complejo diana de ARNcr y lectura funcional para determinar cuál produce las propiedades deseadas.
Para adaptar Cas12i para su uso en la modificación de bases del ADN específicas (véase, por ejemplo, Gaudelli et al. (2017) “Programmable base editing of A^T to G^C in genomic DNA without DNA cleavage”, Science 25 de octubre de 2017), se comenzó con el ortólogo Cas12i y la combinación de NLS que produjo la mayor actividad de escisión de ADN endógeno de mamíferos y se mutaron los residuos conservados del dominio RuvC para crear una enzima catalíticamente inactiva (dCas12i). A continuación, se usa un ligador para crear la proteína de fusión entre dCas12i-NLS y el dominio de edición de bases. Inicialmente, este dominio consistirá en el heterodímero ecTadA(wt)/ecTadA*(7.10) (denominado a continuación en el presente documento heterodímero dCas12i-TadA) diseñado por ingeniería genética previamente para hiperactividad y modificación de los dinucleótidos A^T de ADNbc a G^C (tabla 11). Dadas las probables diferencias estructurales entre la Cas12i más pequeña y los efectores Cas9 previamente caracterizados, diseños y longitudes de ligador alternativos pueden producir el diseño óptimo de la proteína de fusión de edición de bases.
Para evaluar la actividad de los editores de bases derivados de dCas12i, las células HEK 293T se transfectan transitoriamente con el constructo de heterodímero dCas12i-TadA, un plásmido que expresa el ARNcr y, opcionalmente, un plásmido indicador si se dirige al indicador y no a un locus endógeno. Las células se recogen 48 horas después de la transfección transitoria, el ADN se extrae y se prepara para la secuenciación de última generación. El análisis de la composición de bases de los loci de muestras que contienen los ARNcr de direccionamiento frente a los ARNcr de control negativo sin direccionamiento proporciona información sobre la eficiencia de edición, y el análisis de cambios más amplios en el transcriptoma proporcionará información sobre la actividad inespecífica.
Una ventaja particular de desarrollar un sistema de edición de bases de ADN usando Cas12i es que el tamaño pequeño, más pequeño que los efectores Cas9 y Cas12a existentes, permite un empaquetamiento más listo en VAA de heterodímero dCas12i-TadA junto con su ARNcr y elementos de control sin necesidad de truncamientos proteicos. Este vector de VAA todo en uno permite una mayor eficacia de edición de bases in vivo en tejidos, lo que es particularmente relevante como un camino hacia las aplicaciones terapéuticas de Cas12i.
Además de la edición usando Cas12i y una guía de ARN, pueden coadministrarse secuencias de ADN molde adicionales en un vector, tal como un vector viral de VAA, o como fragmentos de ADN lineales monocatenarios o bicatenarios. Para la inserción de ADN molde mediante reparación dirigida por homología (HDR), se diseñan secuencias molde que contienen una secuencia de carga útil que se insertará en el locus de interés, así como secuencias flanqueantes que son homólogas a las secuencias endógenas que flanquean el sitio de inserción deseado. En algunos casos, para la inserción de cargas útiles de ADN cortas de menos de (por ejemplo: menos de 1 kb de longitud), las secuencias homólogas flanqueantes pueden ser cortas (por ejemplo: de 15 a 200 nt de longitud). En otros casos, para la inserción de cargas útiles de ADN largas (por ejemplo: 1 kb o más de longitud), se requieren secuencias flanqueantes homólogas largas para facilitar una HDR eficiente (por ejemplo: más de 200 nt de longitud). La escisión de loci genómicos diana para HDR entre secuencias homólogas a regiones flanqueantes de ADN molde puede aumentar significativamente la frecuencia de HDR. Los eventos de escisión de Cas12i que facilitan la HDR incluyen, pero no se limitan a, escisión de ADNbc, doble mellado y actividad de mellado monocatenaria.
Los fragmentos de ADNbc pueden contener secuencias de proyección complementarias a las proyecciones resultantes del doble mellado usando Cas12i. El emparejamiento del inserto y las proyecciones de doble mellado y la ligación posterior mediante maquinaria de reparación de ADN endógeno dan como resultado la inserción perfecta del ADN molde en el sitio de doble mellado.
Tabla 10. Secuencias que permiten la expresión en mamíferos de los efectores Cas12i con la etiqueta mH6 N-terminal y la secuencia de NLS de nucleoplasmina C-terminal (en negrita) incluidas
Figure imgf000066_0001
Figure imgf000067_0001
Tabla 11. Secuencias de aminoácidos de motivos y dominios funcionales en variantes diseñadas por ingeniería genética de proteínas efectoras de CRISPR-Cas CLUST.029130 (tipo V-I)
Figure imgf000068_0001
Estos resultados sugieren que los miembros de la familia de CRISPR de tipo V-I compacta pueden diseñarse por ingeniería genética para la actividad en células eucariotas y, específicamente, para la edición del genoma en células de mamíferos. Un efector de tipo V-I funcional de mamífero permite el desarrollo de tecnologías adicionales basadas en ingeniería genética adicional sobre un armazón de unión de ADN.
Ejemplo 11. Los sistemas de CRISPR-Cas de tipo V-I pueden usarse para proporcionar control activado por genotipo de la replicación del genoma, la propagación viral, la propagación de plásmidos, la muerte celular o la latencia celular
La hibridación de la proteína efectora de CRISPR-Cas de tipo V-I y el ARNcr con una diana de ADNmc o ADNbc específica da como resultado el mellado o la escisión del sustrato. La dependencia de tal actividad de la presencia de una diana de ADN específica en una célula es valiosa ya que permite seleccionar como diana material genómico o poblaciones celulares específicos basándose en genotipos subyacentes específicos. Existen numerosas aplicaciones en entornos eucariotas, procariotas y virales/plasmídicos para tal control de la replicación del genoma, la muerte celular o la latencia celular.
Para aplicaciones procariotas, virales y plasmídicas, puede administrarse un sistema de CRISPR-Cas de tipo V-I (por ejemplo, que incluye un efector de tipo V-I y una guía de ARN) (por ejemplo, in vitro o in vivo) con el fin de detener la replicación del genoma y/o inducir la latencia o muerte celular de poblaciones procariotas específicas (por ejemplo, poblaciones bacterianas) de una manera específica de genotipo. Por ejemplo, el sistema de CRISPR-Cas de tipo V-I puede incluir una o más guías de ARN que se dirigen específicamente a un virus, plásmido o género, especie o cepa procariota en particular. Tal como se muestra en las figuras 5A-D, la escisión, el mellado o la interferencia con el genoma de E. coli o ADN plasmídico que confiere resistencia a los antibióticos en E. coli por un sistema de tipo V-I da como resultado el agotamiento específico de E. coli que contienen estas secuencias. El direccionamiento específico a virus, plásmidos o procariotas tiene muchos beneficios terapéuticos, ya que puede usarse para inducir la muerte o latencia de bacterias indeseables (por ejemplo, bacterias patógenas tales como Clostridium difficile). Además, los sistemas de tipo V-I proporcionados en el presente documento pueden usarse para dirigirse a células procariotas que tienen genotipos específicos. Dentro de la diversidad microbiana que coloniza a los seres humanos, sólo un pequeño número de cepas bacterianas pueden inducir patogénesis. Además, incluso dentro de cepas patógenas tales como Clostridium difficile, no todos los miembros de la población bacteriana existen continuamente en estados activos que provocan enfermedades. Por tanto, seleccionar como diana el sistema de tipo V-I basándose en el genotipo de un virus, un plásmido o una célula procariota permite el control específico de qué genomas o poblaciones celulares se seleccionan como diana sin alterar todo el microbioma.
Además, las cepas bacterianas pueden modificarse por ingeniería genética fácilmente con circuitos genéticos o elementos de expresión ambientalmente controlados para generar interruptores de destrucción genéticos que limiten el crecimiento, la colonización y/o la eliminación de las cepas bacterianas modificadas por ingeniería genética. Por ejemplo, la expresión de un efector de tipo V-I y ARNcr específico puede controlarse usando promotores derivados de las regiones reguladoras de genes que codifican para proteínas expresadas en respuesta a estímulos externos, tales como proteínas sensibles al frío (PcspA), proteínas de choque térmico (Hsp), sistemas químicamente inducibles (Tet, Lac, AraC). La expresión controlada de uno o más elementos del sistema de tipo V-I permite que el sistema funcional completo se exprese sólo tras la exposición a un estímulo ambiental, lo que da como resultado una actividad de interferencia de ADN específica de genotipo del sistema y, por tanto, induce la muerte o latencia celular. Los interruptores de destrucción que incluyen efectores Cas12i tales como los descritos en el presente documento pueden ser ventajosos con respecto a los diseños de interruptores de destrucción tradicionales, tales como los sistemas de toxina/antitoxina (por ejemplo, sistemas de toxina/antitoxina de CcdB/CcdA de tipo II), puesto que no son dependientes de las razones relativas de expresión de proteínas que pueden verse afectadas por expresión con fugas de un promotor (por ejemplo, un promotor dependiente de estímulo ambiental) y, por tanto, permite un control más preciso del interruptor de destrucción.
Otras realizaciones
Debe entenderse que aunque la invención se ha descrito junto con la descripción detallada de la misma, la descripción anterior pretende ilustrar y no limitar el alcance de la invención, que está definido por el alcance de las reivindicaciones adjuntas.

Claims (16)

REIVINDICACIONES
1. Sistema asociado a repeticiones palindrómicas cortas agrupadas y regularmente interespaciadas (CRISPR) (Cas) diseñado por ingeniería genética que no se produce de manera natural que comprende:
(a) una guía de ARN o un ácido nucleico que codifica para la guía de ARN, en el que la guía de ARN comprende una secuencia de repetición directa y una secuencia espaciadora; y
(b) una proteína efectora de CRISPR-Cas o un ácido nucleico que codifica para la proteína efectora, en el que la proteína efectora comprende una secuencia de aminoácidos con una identidad de al menos el 95 % con s Eq ID NO: 5, SEQ ID NO: 14 o SEQ ID NO: 16,
en el que la proteína efectora de CRISPR-Cas se une a la guía de ARN, y en el que la secuencia espaciadora se une a un ácido nucleico diana, y en el que el ácido nucleico diana es ADN.
2. Sistema según la reivindicación 1, en el que el sistema no incluye ningún ARNtracr.
3. Sistema según la reivindicación 1 ó 2, en el que:
(a) la proteína efectora de CRISPR-Cas comprende uno o más de:
(i) un dominio RuvC que comprende la secuencia de aminoácidos X1SHX4DX6X7 (SEQ ID NO: 200), en la que X1 es S o T, X4 es Q o L, X6 es P o S, y X7 es F o L,
(ii) un dominio RuvC que comprende la secuencia de aminoácidos X1XDXNX6X7XXXX11 (SEQ ID NO: 201), en la que X1 es A, G o S, X es cualquier aminoácido, X6 es Q o I, X7 es T, S o V, y X10 es T o A; y
(iii) un dominio RuvC que comprende la secuencia de aminoácidos X1X2X3E (SEQ ID NO: 210), en la que X1 es C, F, I, L, M, P, V, W o Y, X2 es C, F, I, L, M, P, R, V, W o Y, y X3 es C, F, G, I, L, M, P, V, W o Y; y
(b) la secuencia de repetición directa comprende una cualquiera de:
(i) 5'-CCGUCNNNNNNUGACGG-3' (SEQ ID NO: 202) proximal al extremo 3', en la que N es cualquier base nitrogenada;
(ii) 5'-GUGCCNNNNNNUGGCAC-3' (SEQ ID NO: 203) proximal al extremo 3', en la que N es cualquier base nitrogenada;
(iii) 5'-GUGUCN5-6UGACAX1-3' (SEQ ID NO: 204) proximal al extremo 3', en la que N5-6 es una secuencia contigua de 5 ó 6 bases nitrogenadas cualesquiera, y X1 es C o T o U;
(iv) 5’-UCXaUX5X6X7UUGACGG-3’ (SEQ ID NO: 205) proximal al extremo 3', en la que X3 es C, T o U, X5 es A, T o U, X6 es A, C o G, y X7 es A o G; o
(v) 5'-CCX3X4X5CX7UUGGCAC-3' (SEQ ID NO: 206) proximal al extremo 3', en la que X3 es C, T o U, X4 es A, T o U, X5 es C, T o U, y X7 es A o G.
4. Sistema según una cualquiera de las reivindicaciones 1 a 3, en el que:
(a) la secuencia de repetición directa que comprende una estructura de tallo-bucle proximal a un extremo 3' de la secuencia de repetición directa, en el que la estructura de tallo-bucle comprende:
(i) una primera cadena nucleotídica de tallo de 5 nucleótidos de longitud;
(ii) una segunda cadena nucleotídica de tallo de 5 nucleótidos de longitud, en el que las cadenas nucleotídicas de tallo primera y segunda pueden hibridarse entre sí; y
(iii) una cadena nucleotídica de bucle dispuesta entre las cadenas nucleotídicas de tallo primera y segunda, en el que la cadena nucleotídica de bucle comprende 6, 7 u 8 nucleótidos;
(b) la secuencia espaciadora comprende entre:
(i) 15 y 47 nucleótidos de longitud; o
(ii) 24 y 38 nucleótidos de longitud.
5. Sistema según una cualquiera de las reivindicaciones 1 a 4, en el que:
(a) la proteína efectora de CRISPR-Cas comprende una secuencia de aminoácidos con una identidad de al menos el 95 % con SEQ ID NO: 5, y la secuencia de repetición directa comprende una secuencia de nucleótidos con una identidad de al menos el 95 % con SEQ ID NO: 9 o SEQ ID NO: 10;
(b) la proteína efectora de CRISPR-Cas comprende una secuencia de aminoácidos con una identidad de al menos el 95 % con SEQ ID NO: 5, y la secuencia de repetición directa comprende una secuencia de nucleótidos expuesta en SEQ ID NO: 9 o SEQ ID NO: 10;
(c) la proteína efectora de CRISPR-Cas comprende una secuencia de aminoácidos con una identidad de al menos el 95 % con SEQ ID NO: 5, y la guía de ARN comprende una secuencia de nucleótidos con una identidad de al menos el 95 % con SEQ ID nO: 101;
(d) la proteína efectora de CRISPR-Cas comprende una secuencia de aminoácidos con una identidad de al menos el 95 % con SEQ ID NO: 5, y la guía de ARN comprende una secuencia de nucleótidos expuesta en SEQ ID NO: 101;
(e) la proteína efectora de CRISPR-Cas comprende una secuencia de aminoácidos con una identidad de al menos el 95 % con SEQ ID NO: 5, y la guía de ARN comprende una secuencia de nucleótidos con una identidad de al menos el 95 % con SEQ ID NO: 162 o SEQ ID NO: 163;
(f) la proteína efectora de CRISPR-Cas comprende una secuencia de aminoácidos con una identidad de al menos el 95 % con SEQ ID NO: 5, y la guía de ARN comprende una secuencia de nucleótidos expuesta en SEQ ID NO: 162 o SEQ ID NO: 163;
(g) la proteína efectora de CRISPR-Cas comprende una secuencia de aminoácidos con una identidad de al menos el 95 % con SEQ ID NO: 14, y la secuencia de repetición directa comprende una secuencia de nucleótidos con una identidad de al menos el 95 % con SEQ ID NO: 21;
(h) la proteína efectora de CRISPR-Cas comprende una secuencia de aminoácidos con una identidad de al menos el 95 % con SEQ ID NO: 14, y la secuencia de repetición directa comprende una secuencia de nucleótidos expuesta en SEQ ID NO: 21;
(i) la proteína efectora de CRISPR-Cas comprende una secuencia de aminoácidos con una identidad de al menos el 95 % con SEQ ID NO: 14, y la guía de ARN comprende una secuencia de nucleótidos con una identidad de al menos el 95 % con SEQ ID NO: 153;
(j) la proteína efectora de CRISPR-Cas comprende una secuencia de aminoácidos con una identidad de al menos el 95 % con SEQ ID NO: 14, y la guía de ARN comprende una secuencia de nucleótidos expuesta en SEQ ID NO: 153;
(k) la proteína efectora de CRISPR-Cas comprende una secuencia de aminoácidos con una identidad de al menos el 95 % con SEQ ID NO: 16, y la secuencia de repetición directa comprende una secuencia de nucleótidos con una identidad de al menos el 95 % con SEQ ID NO: 6;
(l) la proteína efectora de CRISPR-Cas comprende una secuencia de aminoácidos con una identidad de al menos el 95 % con SEQ ID NO: 16, y la secuencia de repetición directa comprende una secuencia de nucleótidos expuesta en SEQ ID NO: 6;
(m) la proteína efectora de CRISPR-Cas comprende una secuencia de aminoácidos con una identidad de al menos el 95 % con SEQ ID NO: 16, y la guía de ARN comprende una secuencia de nucleótidos con una identidad de al menos el 95 % con SEQ ID NO: 158; o
(n) la proteína efectora de CRISPR-Cas comprende una secuencia de aminoácidos con una identidad de al menos el 95 % con SEQ ID NO: 16, y la guía de ARN comprende una secuencia de nucleótidos expuesta en SEQ ID NO: 158.
6. Sistema según una cualquiera de las reivindicaciones 1 a 5, en el que la proteína efectora de CRISPR-Cas reconoce una secuencia de motivo adyacente al protoespaciador (PAM), en el que la secuencia de PAM comprende una secuencia de ácido nucleico expuesta como:
(a) 5'-TTN-3', en la que N es cualquier nucleótido;
(b) 5'-TTY-3', en la que Y es C o T; o
(c) 5'-TTH-3', en la que H es A, C o T.
7. Sistema según una cualquiera de las reivindicaciones 1 a 6, en el que:
(a) la proteína efectora de CRISPR-Cas comprende una secuencia de aminoácidos expuesta en SEQ ID NO: 5, SEQ ID NO: 14 o SEQ ID NO: 16; o
(b) la proteína efectora de CRISPR-Cas escinde el ácido nucleico diana.
8. Sistema según una cualquiera de las reivindicaciones 1 a 7, en el que la proteína efectora de CRISPR-Cas comprende:
(a) al menos una señal de localización nuclear (NLS), al menos una señal de exportación nuclear (NES), o al menos una NLS y al menos una NES; o
(b) una etiqueta peptídica, una proteína fluorescente, un dominio de edición de bases, un dominio de metilación de ADN, un dominio de modificación de residuos de histona, un factor de localización, un factor de modificación de la transcripción, un factor de control activado por luz, un factor químicamente inducible o un factor de visualización de cromatina.
9. Sistema según una cualquiera de las reivindicaciones 1 a 8, en el que el ácido nucleico que codifica para la proteína efectora de CRISPR-Cas:
(a) tiene codones optimizados para su expresión en una célula; o
(b) está unido operativamente a un promotor.
10. Sistema según la reivindicación 9, en el que el ácido nucleico que codifica para la proteína efectora de CRISPR-Cas de tipo V-I está en un vector, en el que el vector comprende opcionalmente un vector retroviral, un vector lentiviral, un vector de fago, un vector adenoviral, un vector de virus adenoasociado o un vector de herpes simple.
11. Sistema según una cualquiera de las reivindicaciones 1 a 10, en el que el sistema está presente en un sistema de administración que comprende una nanopartícula, un liposoma, un exosoma, una microvesícula o un cañón de genes.
12. Célula que comprende el sistema según una cualquiera de las reivindicaciones 1 a 11.
13. Célula según la reivindicación 12, en la que la célula es una célula procariota o una célula eucariota, en la que opcionalmente la célula eucariota es una célula de mamífero, una célula vegetal o una célula humana.
14. Método in vitro o ex vivo para modificar una molécula de ADN, comprendiendo el método poner en contacto la molécula de ADN con un sistema según una cualquiera de las reivindicaciones 1 a 11.
15. Método in vitro o ex vivo para seleccionar como diana un ácido nucleico diana, comprendiendo el método poner en contacto el ácido nucleico diana con un sistema según una cualquiera de las reivindicaciones 1 a 11, en el que el ácido nucleico diana es ADN.
16. Método según la reivindicación 14 ó 15, en el que poner en contacto el ADN con el sistema da como resultado:
(a) una modificación del ADN;
(b) la escisión del ADN; o
(c) la formación de una inserción o una deleción en el ADN.
ES19714925T 2018-03-14 2019-03-14 Sistemas y enzimas novedosos de direccionamiento a ADN de CRISPR Active ES2952978T3 (es)

Applications Claiming Priority (10)

Application Number Priority Date Filing Date Title
US201862642919P 2018-03-14 2018-03-14
US201862666397P 2018-05-03 2018-05-03
US201862672489P 2018-05-16 2018-05-16
US201862679628P 2018-06-01 2018-06-01
US201862703857P 2018-07-26 2018-07-26
US201862740856P 2018-10-03 2018-10-03
US201862746528P 2018-10-16 2018-10-16
US201862772038P 2018-11-27 2018-11-27
US201862775885P 2018-12-05 2018-12-05
PCT/US2019/022375 WO2019178427A1 (en) 2018-03-14 2019-03-14 Novel crispr dna targeting enzymes and systems

Publications (1)

Publication Number Publication Date
ES2952978T3 true ES2952978T3 (es) 2023-11-07

Family

ID=65995864

Family Applications (1)

Application Number Title Priority Date Filing Date
ES19714925T Active ES2952978T3 (es) 2018-03-14 2019-03-14 Sistemas y enzimas novedosos de direccionamiento a ADN de CRISPR

Country Status (17)

Country Link
US (6) US10808245B2 (es)
EP (2) EP3765615B1 (es)
JP (2) JP7457653B2 (es)
CN (1) CN112041444A (es)
AU (1) AU2019236210A1 (es)
CA (1) CA3093334A1 (es)
DE (1) DE202019005567U1 (es)
DK (1) DK3765615T3 (es)
ES (1) ES2952978T3 (es)
FI (1) FI3765615T3 (es)
HR (1) HRP20230828T1 (es)
HU (1) HUE063005T2 (es)
LT (1) LT3765615T (es)
PL (1) PL3765615T3 (es)
PT (1) PT3765615T (es)
SI (1) SI3765615T1 (es)
WO (1) WO2019178427A1 (es)

Families Citing this family (73)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2018201086A1 (en) 2017-04-28 2018-11-01 Editas Medicine, Inc. Methods and systems for analyzing guide rna molecules
WO2018227114A1 (en) 2017-06-09 2018-12-13 Editas Medicine, Inc. Engineered cas9 nucleases
WO2019014564A1 (en) 2017-07-14 2019-01-17 Editas Medicine, Inc. SYSTEMS AND METHODS OF TARGETED INTEGRATION AND GENOME EDITING AND DETECTION THEREOF WITH INTEGRATED PRIMING SITES
DE202019005567U1 (de) 2018-03-14 2021-02-16 Arbor Biotechnologies, Inc. Neue CRISPR-DNA-Targeting-Enzyme und -Systeme
WO2019222555A1 (en) 2018-05-16 2019-11-21 Arbor Biotechnologies, Inc. Novel crispr-associated systems and components
WO2020088450A1 (zh) * 2018-10-29 2020-05-07 中国农业大学 新型CRISPR/Cas12f酶和***
BR112021016019A2 (pt) * 2019-02-15 2021-10-05 Sigma-Aldrich Co. Llc Sistemas e proteínas de fusão crispr/cas
AU2020311438A1 (en) * 2019-07-11 2021-12-16 Arbor Biotechnologies, Inc. Novel CRISPR DNA targeting enzymes and systems
CN114423869A (zh) 2019-07-19 2022-04-29 旗舰先锋创新Vi有限责任公司 重组酶组合物和使用方法
EP4017872A1 (en) 2019-08-20 2022-06-29 Fred Hutchinson Cancer Center T-cell immunotherapy specific for wt-1
EP4077652A1 (en) * 2019-12-20 2022-10-26 Limagrain Europe Improving efficiency of base editing using typev crispr enzymes
WO2021188734A1 (en) * 2020-03-17 2021-09-23 The Broad Institute, Inc. Crispr system high throughput diagnostic systems and methods
IL296791A (en) * 2020-03-31 2022-11-01 Arbor Biotechnologies Inc Preparations containing a polypeptide variant of cas12i2 and uses thereof
CA3174111A1 (en) * 2020-04-06 2021-10-14 Nokia Technologies Oy Reporting beam failure
EP4139447A4 (en) * 2020-04-20 2024-05-29 The Regents Of The University Of California CRISPR SYSTEMS IN PLANTS
US20230193243A1 (en) * 2020-05-29 2023-06-22 Arbor Biotechnologies, Inc. Compositions comprising a cas12i2 polypeptide and uses thereof
WO2021257730A2 (en) * 2020-06-16 2021-12-23 Arbor Biotechnologies, Inc. Cells modified by a cas12i polypeptide
CN111690773B (zh) * 2020-06-17 2021-08-20 山东舜丰生物科技有限公司 利用新型Cas酶进行目标核酸检测的方法和***
CN111733216B (zh) * 2020-06-22 2023-03-28 山东舜丰生物科技有限公司 一种提高目标核酸检测效率的方法
JP2023542528A (ja) 2020-09-24 2023-10-10 フレッド ハッチンソン キャンサー センター Sox2抗原を標的とする免疫療法
WO2022066973A1 (en) 2020-09-24 2022-03-31 Fred Hutchinson Cancer Research Center Immunotherapy targeting pbk or oip5 antigens
WO2022076353A1 (en) 2020-10-06 2022-04-14 Fred Hutchinson Cancer Research Center Compositions and methods for treating mage-a1-expressing disease
KR20230093328A (ko) * 2020-10-30 2023-06-27 아버 바이오테크놀로지스, 인크. B2m을 표적화하는 rna 가이드를 포함하는 조성물 및 이의 용도
WO2022094313A1 (en) * 2020-10-30 2022-05-05 Arbor Biotechnologies, Inc. Compositions comprising an rna guide targeting trac and uses thereof
US20230416732A1 (en) * 2020-10-30 2023-12-28 Arbor Biotechnologies, Inc. Compositions comprising an rna guide targeting bcl11a and uses thereof
WO2022094329A1 (en) * 2020-10-30 2022-05-05 Arbor Biotechnologies, Inc. Compositions comprising an rna guide targeting pdcd1 and uses thereof
EP4244353A1 (en) * 2020-11-13 2023-09-20 Triplebar Bio, Inc. Multiparametric discovery and optimization platform
CN116601293A (zh) * 2020-12-07 2023-08-15 中国科学院动物研究所 工程化的Cas效应蛋白及其使用方法
CN113308451B (zh) * 2020-12-07 2023-07-25 中国科学院动物研究所 工程化的Cas效应蛋白及其使用方法
EP4259651A2 (en) 2020-12-14 2023-10-18 Fred Hutchinson Cancer Center Compositions and methods for cellular immunotherapy
WO2022140343A1 (en) 2020-12-22 2022-06-30 Vertex Pharmaceuticals Incorporated Compositions comprising an rna guide targeting dmpk and uses thereof
WO2022140340A1 (en) 2020-12-22 2022-06-30 Vertex Pharmaceuticals Incorporated Compositions comprising an rna guide targeting dmd and uses thereof
WO2022150608A1 (en) * 2021-01-08 2022-07-14 Arbor Biotechnologies, Inc. Compositions comprising a variant crispr nuclease polypeptide and uses thereof
TW202246497A (zh) * 2021-01-20 2022-12-01 美商阿伯生物技術公司 Cas12i2融合分子及其用途
WO2022174099A2 (en) * 2021-02-11 2022-08-18 Arbor Biotechnologies, Inc. Compositions comprising a variant cas12i4 polypeptide and uses thereof
CN113046355B (zh) * 2021-04-20 2023-04-07 上海交通大学 一种中温原核Argonaute蛋白PbAgo表征及应用
JP2024522112A (ja) * 2021-05-27 2024-06-11 中国科学院動物研究所 エンジニアリングされたCas12iヌクレアーゼ、エフェクタータンパク質及びその用途
CN113151215B (zh) * 2021-05-27 2022-11-18 中国科学院动物研究所 工程化的Cas12i核酸酶及其效应蛋白以及用途
EP4347818A2 (en) 2021-06-01 2024-04-10 Arbor Biotechnologies, Inc. Gene editing systems comprising a crispr nuclease and uses thereof
WO2022256619A2 (en) 2021-06-04 2022-12-08 Arbor Biotechnologies, Inc. Gene editing systems comprising an rna guide targeting transthyretin (ttr) and uses thereof
US20230032141A1 (en) 2021-06-04 2023-02-02 Arbor Biotechnologies, Inc. Gene editing systems comprising an rna guide targeting hydroxyacid oxidase 1 (hao1) and uses thereof
WO2022256655A2 (en) 2021-06-04 2022-12-08 Arbor Biotechnologies, Inc. Gene editing systems comprising an rna guide targeting lactate dehydrogenase a (ldha) and uses thereof
WO2022266849A1 (zh) * 2021-06-22 2022-12-29 中国科学院脑科学与智能技术卓越创新中心 新型CRISPR-Cas13蛋白的筛选及其应用
WO2023288281A2 (en) 2021-07-15 2023-01-19 Fred Hutchinson Cancer Center Chimeric polypeptides
EP4377456A2 (en) * 2021-07-30 2024-06-05 Arbor Biotechnologies, Inc. Gene editing systems comprising a nuclease and uses thereof
CA3228487A1 (en) 2021-08-11 2023-02-16 Arbor Biotechnologies, Inc. Gene editing systems comprising an rna guide targeting stathmin 2 (stmn2) and uses thereof
WO2023018856A1 (en) 2021-08-11 2023-02-16 Arbor Biotechnologies, Inc. Gene editing systems comprising an rna guide targeting polypyrimidine tract binding protein 1 (ptbp1) and uses thereof
WO2023019243A1 (en) * 2021-08-12 2023-02-16 Arbor Biotechnologies, Inc. Compositions comprising a variant cas12i3 polypeptide and uses thereof
WO2023029532A1 (en) * 2021-08-30 2023-03-09 Huigene Therapeutics Co., Ltd. Engineered cas6 protein and uses thereof
WO2023034475A1 (en) 2021-09-01 2023-03-09 Arbor Biotechnologies, Inc. Cells modified by a cas12i polypeptide
US20230287456A1 (en) * 2021-09-10 2023-09-14 Arbor Biotechnologies, Inc. Compositions comprising a cas12i polypeptide and uses thereof
WO2023070019A1 (en) 2021-10-21 2023-04-27 Vertex Pharmaceuticals Incorporated Hypoimmune cells
WO2023078314A1 (en) * 2021-11-02 2023-05-11 Huidagene Therapeutics Co., Ltd. Novel crispr-cas12i systems and uses thereof
CN114015674A (zh) 2021-11-02 2022-02-08 辉二(上海)生物科技有限公司 新型CRISPR-Cas12i***
CN116254246A (zh) * 2021-12-09 2023-06-13 北京干细胞与再生医学研究院 工程化cas12b效应蛋白及其使用方法
WO2023122805A1 (en) 2021-12-20 2023-06-29 Vestaron Corporation Sorbitol driven selection pressure method
WO2023122433A1 (en) 2021-12-22 2023-06-29 Arbor Biotechnologies, Inc. Gene editing systems targeting hydroxyacid oxidase 1 (hao1) and lactate dehydrogenase a (ldha)
CN118076730A (zh) * 2022-03-18 2024-05-24 山东舜丰生物科技有限公司 活性改善的Cas蛋白及其应用
CN114591983B (zh) * 2022-04-12 2023-07-21 中山大学 一种基于dna纳米技术的蛋白质邻近标记方法及其应用
WO2023204008A1 (ja) * 2022-04-21 2023-10-26 株式会社島津製作所 微生物判別用のデータベースを構築する方法および装置
CN117460822A (zh) * 2022-04-25 2024-01-26 辉大基因治疗(新加坡)私人有限公司 新型CRISPR-Cas12i***及其用途
WO2023215725A1 (en) 2022-05-02 2023-11-09 Fred Hutchinson Cancer Center Compositions and methods for cellular immunotherapy
CN114921439B (zh) * 2022-06-16 2024-04-26 尧唐(上海)生物科技有限公司 CRISPR-Cas效应子蛋白、其基因编辑***及应用
WO2024011173A1 (en) * 2022-07-07 2024-01-11 The Regents Of The University Of California Compositions and methods for editing cytoplasmic dna
WO2024008145A1 (zh) * 2022-07-07 2024-01-11 山东舜丰生物科技有限公司 Cas酶及其应用
WO2024017189A1 (en) * 2022-07-18 2024-01-25 Beijing Institute For Stem Cell And Regenerative Medicine Tnpb-based genome editor
US20240035010A1 (en) * 2022-07-22 2024-02-01 Arbor Biotechnologies, Inc. Compositions comprising a variant polypeptide and uses thereof
WO2024026406A2 (en) 2022-07-29 2024-02-01 Vestaron Corporation Next Generation ACTX Peptides
CN117721130A (zh) * 2022-09-22 2024-03-19 态创生物科技(广州)有限公司 体内靶向诱变的***
WO2024118747A1 (en) 2022-11-30 2024-06-06 Arbor Biotechnologies, Inc. Reverse transcriptase-mediated genetic editing of transthyretin (ttr) and uses thereof
CN115716880A (zh) * 2022-12-07 2023-02-28 云舟生物科技(广州)股份有限公司 一种核定位荧光蛋白及其应用
CN116590237B (zh) * 2023-05-29 2023-10-31 上海贝斯昂科生物科技有限公司 一种遗传修饰的自然杀伤细胞及其制备和用途
CN116854787B (zh) * 2023-09-05 2023-11-07 四川大学 一种Cas7-11蛋白的抑制剂及其应用

Family Cites Families (53)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4797368A (en) 1985-03-15 1989-01-10 The United States Of America As Represented By The Department Of Health And Human Services Adeno-associated virus as eukaryotic expression vector
US5703055A (en) 1989-03-21 1997-12-30 Wisconsin Alumni Research Foundation Generation of antibodies through lipid mediated DNA delivery
US5173414A (en) 1990-10-30 1992-12-22 Applied Immune Sciences, Inc. Production of recombinant adeno-associated virus vectors
US5587308A (en) 1992-06-02 1996-12-24 The United States Of America As Represented By The Department Of Health & Human Services Modified adeno-associated virus vector capable of expression from a novel promoter
US5593972A (en) 1993-01-26 1997-01-14 The Wistar Institute Genetic immunization
ATE527281T1 (de) 2004-07-16 2011-10-15 Us Gov Health & Human Serv Impfstoffe gegen aids umfassend cmv/r nucleinsäurekonstrukte
US20140113376A1 (en) 2011-06-01 2014-04-24 Rotem Sorek Compositions and methods for downregulating prokaryotic genes
ES2883590T3 (es) 2012-12-12 2021-12-09 Broad Inst Inc Suministro, modificación y optimización de sistemas, métodos y composiciones para la manipulación de secuencias y aplicaciones terapéuticas
WO2014093595A1 (en) 2012-12-12 2014-06-19 The Broad Institute, Inc. Crispr-cas component systems, methods and compositions for sequence manipulation
EP3064585B1 (en) * 2012-12-12 2020-02-05 The Broad Institute, Inc. Engineering and optimization of improved systems, methods and enzyme compositions for sequence manipulation
EP3060575B1 (en) 2013-10-11 2018-12-05 Massachusetts Eye & Ear Infirmary Methods of predicting ancestral virus sequences and uses thereof
WO2015070083A1 (en) 2013-11-07 2015-05-14 Editas Medicine,Inc. CRISPR-RELATED METHODS AND COMPOSITIONS WITH GOVERNING gRNAS
CA2943622A1 (en) 2014-03-25 2015-10-01 Editas Medicine Inc. Crispr/cas-related methods and compositions for treating hiv infection and aids
EP3981876A1 (en) 2014-03-26 2022-04-13 Editas Medicine, Inc. Crispr/cas-related methods and compositions for treating sickle cell disease
WO2015148860A1 (en) 2014-03-26 2015-10-01 Editas Medicine, Inc. Crispr/cas-related methods and compositions for treating beta-thalassemia
EP3498845B1 (en) 2014-04-01 2022-06-22 Editas Medicine, Inc. Crispr/cas-related methods and compositions for treating herpes simplex virus type 1 (hsv-1)
WO2015153791A1 (en) 2014-04-01 2015-10-08 Editas Medicine, Inc. Crispr/cas-related methods and compositions for treating herpes simplex virus type 2 (hsv-2)
EP3129485B2 (en) 2014-04-09 2022-12-21 Editas Medicine, Inc. Crispr/cas-related methods and compositions for treating cystic fibrosis
IL292512B1 (en) 2014-04-18 2024-03-01 Editas Medicine Inc CRISPR-CAS-related methods, compositions and components for cancer immunotherapy
EA039693B1 (ru) * 2014-06-16 2022-02-28 Дзе Джонс Хопкинс Юниверсити Композиции и способы для экспрессии рнк-проводников crispr с использованием промотора h1
WO2016094874A1 (en) 2014-12-12 2016-06-16 The Broad Institute Inc. Escorted and functionalized guides for crispr-cas systems
EP3230452A1 (en) 2014-12-12 2017-10-18 The Broad Institute Inc. Dead guides for crispr transcription factors
EP3234117B1 (en) * 2014-12-17 2021-03-03 DuPont US Holding, LLC Compositions and methods for efficient gene editing in e. coli using guide rna/cas endonuclease systems in combination with circular polynucleotide modification templates
WO2016106236A1 (en) 2014-12-23 2016-06-30 The Broad Institute Inc. Rna-targeting system
CA2981508A1 (en) 2015-04-01 2016-10-06 Editas Medicine, Inc. Crispr/cas-related methods and compositions for treating duchenne muscular dystrophy and becker muscular dystrophy
CA2985615A1 (en) 2015-05-11 2016-11-17 Editas Medicine, Inc. Crispr/cas-related methods and compositions for treating hiv infection and aids
EP4159856A1 (en) 2015-06-18 2023-04-05 The Broad Institute, Inc. Novel crispr enzymes and systems
US9790490B2 (en) 2015-06-18 2017-10-17 The Broad Institute Inc. CRISPR enzymes and systems
AU2016342038B2 (en) 2015-10-22 2022-09-08 Massachusetts Institute Of Technology Type VI-B CRISPR enzymes and systems
AU2016343991B2 (en) 2015-10-30 2022-12-01 Editas Medicine, Inc. CRISPR/CAS-related methods and compositions for treating herpes simplex virus
US20170145394A1 (en) 2015-11-23 2017-05-25 The Regents Of The University Of California Tracking and manipulating cellular rna via nuclear delivery of crispr/cas9
JP6914274B2 (ja) * 2016-01-22 2021-08-04 ザ・ブロード・インスティテュート・インコーポレイテッド Crisprcpf1の結晶構造
US11512311B2 (en) 2016-03-25 2022-11-29 Editas Medicine, Inc. Systems and methods for treating alpha 1-antitrypsin (A1AT) deficiency
US10337051B2 (en) 2016-06-16 2019-07-02 The Regents Of The University Of California Methods and compositions for detecting a target RNA
KR20230156150A (ko) 2016-06-17 2023-11-13 더 브로드 인스티튜트, 인코퍼레이티드 제vi형 crispr 오솔로그 및 시스템
WO2018035250A1 (en) 2016-08-17 2018-02-22 The Broad Institute, Inc. Methods for identifying class 2 crispr-cas systems
WO2018035388A1 (en) 2016-08-17 2018-02-22 The Broad Institute, Inc. Novel crispr enzymes and systems
US11041164B2 (en) * 2017-06-22 2021-06-22 Ut-Battelle, Llc Genes for enhancing drought and heat tolerance in plants and methods of use
FI3765616T3 (fi) 2018-03-14 2023-08-29 Arbor Biotechnologies Inc Uusia CRISPR-DNA- ja RNA-kohdennusentsyymejä ja -järjestelmiä
DE202019005567U1 (de) * 2018-03-14 2021-02-16 Arbor Biotechnologies, Inc. Neue CRISPR-DNA-Targeting-Enzyme und -Systeme
CN112004932B (zh) 2018-04-20 2023-01-10 中国农业大学 一种CRISPR/Cas效应蛋白及***
CA3100034A1 (en) 2018-05-11 2019-11-14 Beam Therapeutics Inc. Methods of editing single nucleotide polymorphism using programmable base editor systems
JP2021532794A (ja) * 2018-08-03 2021-12-02 ビーム セラピューティクス インク. マルチエフェクター核酸塩基エディターおよびそれを用いて核酸標的配列を改変する方法
WO2020088450A1 (zh) 2018-10-29 2020-05-07 中国农业大学 新型CRISPR/Cas12f酶和***
CN114190093A (zh) 2019-02-13 2022-03-15 比姆医疗股份有限公司 使用腺苷酸脱氨酶碱基编辑器破坏疾病相关基因的剪接受***点,包括用于治疗遗传性疾病
JP2022520080A (ja) 2019-02-13 2022-03-28 ビーム セラピューティクス インク. 遺伝的疾患の治療用を含めアデノシンデアミナーゼ塩基エディターを用いて疾患関連遺伝子を編集する方法
CA3128886A1 (en) 2019-02-13 2020-08-20 Beam Therapeutics Inc. Compositions and methods for treating glycogen storage disease type 1a
CA3129158A1 (en) 2019-02-13 2020-08-20 Beam Therapeutics Inc. Adenosine deaminase base editors and methods of using same to modify a nucleobase in a target sequence
SG11202108346WA (en) 2019-02-13 2021-08-30 Beam Therapeutics Inc Modified immune cells having adenosine deaminase base editors for modifying a nucleobase in a target sequence
EP4219700A1 (en) 2019-03-07 2023-08-02 The Regents of the University of California Crispr-cas effector polypeptides and methods of use thereof
AU2020279751A1 (en) 2019-05-21 2021-12-02 Beam Therapeutics Inc. Methods of editing a single nucleotide polymorphism using programmable base editor systems
CN111690720B (zh) 2020-06-16 2021-06-15 山东舜丰生物科技有限公司 利用修饰的单链核酸进行靶核酸检测的方法
CN113308451B (zh) 2020-12-07 2023-07-25 中国科学院动物研究所 工程化的Cas效应蛋白及其使用方法

Also Published As

Publication number Publication date
JP7457653B2 (ja) 2024-03-28
US20200407716A1 (en) 2020-12-31
EP4257696A3 (en) 2024-01-24
EP4257696A2 (en) 2023-10-11
US20200063126A1 (en) 2020-02-27
SI3765615T1 (sl) 2023-10-30
HUE063005T2 (hu) 2023-12-28
WO2019178427A1 (en) 2019-09-19
US20230183688A1 (en) 2023-06-15
LT3765615T (lt) 2023-10-10
US20200407715A1 (en) 2020-12-31
DE202019005567U1 (de) 2021-02-16
PL3765615T3 (pl) 2023-11-13
EP3765615A1 (en) 2021-01-20
JP2024019739A (ja) 2024-02-09
AU2019236210A1 (en) 2020-09-10
PT3765615T (pt) 2023-08-28
FI3765615T3 (fi) 2023-08-29
US20220098579A1 (en) 2022-03-31
US20210123047A1 (en) 2021-04-29
JP2021516970A (ja) 2021-07-15
US11912992B2 (en) 2024-02-27
CN112041444A (zh) 2020-12-04
EP3765615B1 (en) 2023-06-28
US10808245B2 (en) 2020-10-20
CA3093334A1 (en) 2019-09-19
HRP20230828T1 (hr) 2023-11-10
DK3765615T3 (da) 2023-08-21
US11168324B2 (en) 2021-11-09

Similar Documents

Publication Publication Date Title
ES2952978T3 (es) Sistemas y enzimas novedosos de direccionamiento a ADN de CRISPR
ES2953541T3 (es) Sistemas y enzimas novedosos de direccionamiento a ADN y ARN de CRISPR
US11225659B2 (en) Type VI-E and type VI-F CRISPR-Cas system and uses thereof
AU2018291496B2 (en) Novel CRISPR RNA targeting enzymes and systems and uses thereof
US20230407281A1 (en) Novel crispr-associated systems and components
CA3093580A1 (en) Novel crispr dna and rna targeting enzymes and systems
US20220315913A1 (en) Novel crispr dna targeting enzymes and systems
US20230058054A1 (en) Crispr/cas system and uses thereof
US20210139890A1 (en) Novel crispr rna targeting enzymes and systems and uses thereof