ES2940619T3

ES2940619T3 - Método para generar bibliotecas de edición de genoma de orden superior

Info

Publication number: ES2940619T3
Application number: ES17832242T
Authority: ES
Inventors: Manuel Kaulich; Andreas Ernst; Martin Wegner; Valentina Diehl; Bruyn Rahel De; Svenja Wiechmann
Original assignee: Goethe Universitaet Frankfurt am Main
Current assignee: Goethe Universitaet Frankfurt am Main
Priority date: 2016-12-29
Filing date: 2017-12-27
Publication date: 2023-05-09
Anticipated expiration: 2037-12-27
Also published as: JP7142637B2; AU2017385611A1; DK3562941T3; AU2017385611A2; WO2018122248A1; JP2020503044A; CA3048939A1; US20190330616A1; EP3562941A1; CN110249049A; AU2017385611B2; EP3562941B1

Abstract

La presente invención se refiere a un método novedoso para la generación de vectores y bibliotecas de vectores que expresan ARN muy diversos para su uso en enfoques de eliminación, eliminación y modificación de genes dirigidos. La invención se refiere a un método para generar tales bibliotecas de orden superior sin necesidad de tecnologías de clonación clásicas. Esto es particularmente útil para bibliotecas basadas en vectores grandes en los que una secuencia no se puede mutar fácilmente con métodos de mutagénesis clásicos. Los vectores y bibliotecas generados de acuerdo con los métodos de la invención son en particular para tecnologías de silenciamiento asistido por ARN tales como interferencia de ARN, y para la edición dirigida del genoma usando el sistema Cas/repeticiones palindrómicas cortas agrupadas regularmente interespaciadas (CRISPR) o sistemas similares de perturbación de genes codificados por ARN/ADN que usan ARN guía pequeños para dirigir el complejo CRISPR a una secuencia genómica específica. La invención proporciona también kits que comprenden los materiales para realizar los métodos de la invención. (Traducción automática con Google Translate, sin valor legal)

Description

DESCRIPCIÓN

Método para generar bibliotecas de edición de genoma de orden superior

La presente invención se refiere a un método novedoso para la generación de vectores y bibliotecas de vectores que expresan ARN muy diversos para su uso en enfoques de inactivación, reducción de la expresión de genes y modificación del genoma dirigidos. La invención se refiere a un método para generar tales bibliotecas de orden superior sin necesidad de tecnologías de clonación clásicas. Esto es particularmente útil para bibliotecas basadas en vectores grandes en donde una secuencia no se puede mutar fácilmente con métodos de mutagénesis clásicos. Los vectores y bibliotecas generados de acuerdo con los métodos de la invención son, en particular, para tecnologías de silenciamiento asistido por ARN, tales como la interferencia de ARN, y para la edición de genomas elegidos como diana utilizando el sistema de repeticiones palindrómicas cortas agrupadas regularmente interespaciadas (CRISPR)/Cas o sistemas de perturbación de genes codificados ARN/ADN similares que utilizan pequeños ARN guía para dirigir el complejo CRISPR a una secuencia genómica específica. La invención proporciona también kits que comprenden los materiales para realizar los métodos de la invención.

Descripción

El sistema de repeticiones palindrómicas cortas agrupadas regularmente interespaciadas (CRISPR)/Cas se descubrió inicialmente en especies bacterianas y arqueas como un mecanismo de defensa contra material genético foráneo (p. ej., plásmidos y bacteriófagos). Los sistemas CRISPR/Cas de origen natural se basan en la expresión de tres componentes: 1) una secuencia de ARN guía que es complementaria a una secuencia diana, 2) un ARN armazón que ayuda a reclutar el tercer componente, una endonucleasa, en el sitio. Aunque en muchas especies de bacterias y arqueas los sistemas CRISPR/Cas se utilizan para degradar material genético foráneo, el sistema se ha adaptado para su uso en una amplia variedad de organismos procarióticos y eucarióticos y se ha utilizado para muchos métodos, incluidos la inactivación de la expresión de genes, la mutagénesis y la activación o represión de la expresión (Hsu, et al. Cell (2014) 157(6): 1262-1278). En los sistemas CRISPR/Cas modificados genéticamente, el requisito de tres componentes independientes se puede eludir mediante la expresión de un pequeño ARN guía (ARNgs o simplemente ARN guía - ARNg) que contiene tanto la secuencia del ARN guía de CRISPR para unir una secuencia diana y el ARN armazón que en conjunto imita la estructura formada por la secuencia individual del ARN guía y la secuencia armazón y es suficiente para reclutar la endonucleasa al sitio diana apropiado (Jinek, et al. Science (2012) 337(6096): 816-821). Un requisito previo adicional para el direccionamiento satisfactorio del ADN del complejo Cas-ARNg es la presencia de una secuencia de ADN con motivo adyacente al protoespaciador (PAM) en el ADN diana, para lo que la secuencia exacta depende de la enzima Cas bacteriana (12-15). Para los más utilizados Streptococcus pyogenes Cas9 (SpCas9) esta secuencia tiene el formato de NGG, donde N puede ser cualquier nucleótido. Muy notablemente, la enzima Cas se puede expresar en células humanas y, al proporcionar un ARNg dirigido por ADN humano, inducir una ruptura de la doble hebra de ADN altamente específica que no se puede reparar, lo que lleva a mutaciones por inserción y deleción (InDel) (13, 16). Los fenotipos de las mutaciones InDel oscilan desde deleciones en el marco hasta la inactivación completa del gen. Recientemente, se ha demostrado que el sistema CRISPR/Cas corrige de manera eficiente una mutación responsable de la enfermedad de células falciformes mediante el uso de células madre y progenitoras obtenidas de pacientes (17). Por lo tanto, el sistema CRISPR/Cas es una herramienta programable de edición de genes con un potencial enorme, que varía desde la biología celular convencional hasta las aplicaciones terapéuticas (18).

Los cambios genéticos únicos se pueden utilizar para generar sistemas modelo bien controlados, pero estos no permiten evaluaciones imparciales. Para realizar escrutinios genéticos, se puede combinar una multitud de secuencias de ARNg para generar bibliotecas, dirigidas a regiones específicas en el genoma humano y otros (19-22). Las principales ventajas de estos escrutinios genéticos son su aplicación imparcial y su facilidad de uso. Hasta el momento, solo se han publicado un par de escrutinios de inactivación por CRISPR/Cas en todo el genoma, pero el ritmo al que se realizan estos experimentos y se informa sobre los resultados respectivos se ha acelerado enormemente. Además de los escrutinios de inactivación, un puñado de laboratorios ha demostrado los beneficios de los escrutinios de activación y represión transcripcionales por CRISPR/Cas en todo el genoma (23-27). Las áreas cubiertas por estos escrutinios incluyen la resistencia a los fármacos, el crecimiento celular, los genes recesivos y esenciales, los ARN largos no codificantes (ARNInc), así como los genes activadores/represores de NF-KB o los genes inductores de metástasis (28-30).

Las bibliotecas de ARNg actualmente disponibles difieren significativamente en su diseño y extensión. Las primeras bibliotecas publicadas se basaron en plásmidos lentiCRISPRv1 y -v2 del laboratorio de Feng Zhang (McGovern, Broad, MIT, Boston, EE.UU.) y se diseñaron sobre principios de presencia genómica de la secuencia PAM (19). Las bibliotecas más recientes están diseñadas en base a algoritmos de aprendizaje automático que optimizan la actividad del ARNg y minimizan los posibles efectos inespecíficos en el genoma humano (biblioteca Brunello) y de ratón (biblioteca Brie), lo que proporciona una mayor confianza en los resultados primarios (31,32). Dos principios básicos distinguen estas bibliotecas de todo el genoma: 1) los algoritmos utilizados para predecir y seleccionar ARNg funcionales, y 2) la complejidad general de las bibliotecas, que está determinada principalmente por la cantidad total de ARNg para elegir como diana un solo gen, que oscilan de 4 a 12 para Brunello y Toronto KnockOut (30, 32), respectivamente. Los métodos para generar estas bibliotecas se basan predominantemente en la digestión con enzimas de restricción convencionales o en la clonación dirigida por Ensamblaje de Gibson. Como tales, estas bibliotecas contienen un sesgo de hasta varios cientos de veces hacia un subconjunto de ARNg que impide directamente la escala y la calidad de las aplicaciones y los resultados posteriores (19, 32). Por lo tanto, existe una necesidad urgente de métodos novedosos para generar bibliotecas de perturbaciones de genes codificados por ARN/ADN de cualquier complejidad sin sesgos no deseados.

Koferle, A., Worf, K., Breunig, C. et al. CORALINA: A universal method for the generation of gRNA libraries for CRISPR-based screening. BMC Genomics 17, 917 (2016). https://doi.org/10.1186/s12864-016-3268-z divulga un método para la generación de bibliotecas de ARNg utilizando ADN genómico digerido.

El objeto de la invención se resuelve en un aspecto mediante un método para generar un pequeño vector de expresión o biblioteca de vectores de ARN/ADN basados en ADN circularizado cerrado covalentemente (ccc), comprendiendo el método las etapas de

(a) Proporcionar un vector fagémido de hebra sencilla (hs) que comprende (i) al menos un casete de expresión de ARN/ADN pequeño que comprende un promotor de ARN/ADN y un sitio de introducción de secuencia de ARN/ADN pequeño diana vacío o una secuencia codificante de ARN/ADN pequeño y/o una secuencia diana de ADN/ARN nucleasa, o una secuencia parcial de la misma, (ii) al menos un origen de replicación (ORI) de ADN de hebra sencilla tal como un ORI de fago, y en particular un origen f1, y

(b) Proporcionar al menos una especie de Cebador de ARN o ADN mutagénico, en donde el cebador de ARN o ADN mutagénico tiene la siguiente estructura en dirección 3' a 5': una primera región de homología, una región de secuencia diana que codifica un ARN/ADN pequeño que se va a expresar, y una segunda región de homología, en donde la primera región de homología es complementaria a, o es capaz de reasociarse con una secuencia de la construcción del vector fagémido hs que flanquea el sitio de introducción de la secuencia de ARN/ADN pequeño diana vacío o la secuencia codificante de ARN/ADN pequeño, o una secuencia parcial de la misma, en el lado 5', y en donde la segunda región de homología es complementaria a, o es capaz de reasociarse con una secuencia de la construcción del vector fagémido hs que flanquea el sitio de introducción de la secuencia de ARN/ADN pequeño diana vacío o la secuencia codificante de ARN/ADN pequeño, o una secuencia parcial de la misma, en el lado 3',

(c) Reasociar al menos una especie de cebador de ARN o ADN mutagénico con la construcción del vector fagémido hs y amplificar un ADNdh heterodúplex circularizado cerrado covalentemente (ccc) a partir del mismo,

(d) Eliminar el ADN del vector fagémido de tipo salvaje residual.

Para eliminar el ADN del vector fagémido de tipo salvaje residual, se puede aplicar la digestión con endonucleasa. Por ejemplo, se proporciona un sitio diana de endonucleasa en la construcción del vector fagémido de hebra sencilla (hs) dentro de su al menos un casete de expresión de ARN/ADN pequeño. Preferiblemente, el sitio diana de la endonucleasa se localiza en la construcción del vector fagémido de hebra sencilla (hs) entre las regiones que son complementarias a la primera región de homología del Cebador de ADN mutagénico y la región complementaria a la segunda región de homología del cebador mutagénico. Por lo tanto, el sitio diana de la endonucleasa está ubicado en una posición que no está duplicada en la síntesis de 3Cs y, por lo tanto, está presente solo en la construcción del vector fagémido hs de tipo salvaje. Por lo tanto, el método comprende aquí dentro de la etapa (d), digerir enzimáticamente el ADN de 3Cs con una endonucleasa específica para el sitio diana. Por ejemplo, como endonucleasas en algunas realizaciones se utilizan enzimas de restricción y sus sitios diana. Las enzimas de restricción ilustrativas y sus sitios diana son I-PpoI, SmaI, HpaI, I-SceI o I-CeuI. Puede utilizarse cualquier sitio de reconocimiento de restricción que no aparezca en el ADN hs molde ni en la secuencia introducida I en el cebador mutagénico. Además del uso de endonucleasas de restricción, también se puede utilizar cualquiera de las siguientes enzimas para eliminar el plásmido de tipo salvaje residual: I-CeuI, I-PpoI, I-SceI, se prefieren todas las endonucleasas autodirigidas, todas las endonucleasas no autodirigidas, el uso de secuencias diana de perturbación génica para, p. ej., TALEN, ZFN, CRISPR/Cas y enzimas similares, el uso de secuencias de nucleótidos tóxicos procarióticos y/o eucarióticos con el objetivo de suprimir la amplificación de tales secuencias y el uso de secuencias de clonación basadas en homología y/o recombinación.

Otra posibilidad para eliminar el vector de ADN de tipo salvaje es utilizar el método de Kunkel. Por lo tanto, el problema anterior se resuelve mediante la presente invención mediante un método para la generación de un vector pequeño que expresa (o codifica) ARN/ADN, o un método para introducir una secuencia codificante de ARN/ADN pequeño en un vector, utilizando el método de Kunkel para mutagénesis (método de Kunkel). Por lo tanto, los aspectos preferidos tienen que ver con un método para introducir una secuencia de ARN/ADN pequeño en un vector utilizando el método de Kunkel o la mutagénesis de Kunkel. El método de Kunkel o mutagénesis de Kunkel en el contexto de la invención se refieren al siguiente procedimiento: el fragmento de ADN que se va a mutar se inserta en un fagémido (cualquier vector que contenga f1 ori tal como M13mp18/19) y a continuación, se transforma en una cepa de E. colicon deficiencia de dos enzimas, dUTPasa (dut) y uracilo desglicosidasa (ung). Ambas enzimas forman parte de una vía de reparación del ADN que protege al cromosoma bacteriano de mutaciones por desaminación espontánea de dCTP a dUTP. La deficiencia de dUTPasa evita la descomposición de dUTP, lo que da como resultado un alto nivel de dUTP en la célula. La deficiencia de uracilo desglicosidasa impide la eliminación de uracilo del ADN recién sintetizado. Puesto que el doble mutante de E. coli replica el ADN del fago, su maquinaria enzimática puede, por lo tanto, incorporar incorrectamente dUTP en lugar de dTTP, dando como resultado un ADN de hebra sencilla que contiene algunos uracilos (ADNUhs). El ADNUhs se extrae del bacteriófago que se libera al medio y a continuación, se utiliza como molde para la mutagénesis. Se utiliza un oligonucleótido que contiene la mutación o el cambio en la secuencia de nucleótidos deseados para la extensión del cebador. El ADN heterodúplex formado consiste en una hebra parental no mutada que contiene dUTP y una hebra mutada que contiene dTTP. A continuación, el ADN se transforma en una cepa de E. coli portadora de los genes dut y ung de tipo salvaje. Aquí, la hebra de ADN parental que contiene uracilo se degrada, de modo que casi todo el ADN resultante consiste en la hebra mutada. El método de la invención es particularmente adecuado para introducir secuencias de ARN guía en un vector de edición del genoma para la edición del genoma elegido como diana.

Un "método de Kunkel" en el contexto de la invención es un método que comprende la amplificación con un cebador mutado utilizando un ADN uracilado de hebra sencilla como molde, preferiblemente un ADN uracilado de hebra sencilla circular. ''Uracilado'' se referirá a cualquier molécula de ADN que contenga una o más bases de uracilo en un nucleótido.

En realizaciones preferidas de la invención, el método anterior es un método para generar un vector de expresión o biblioteca de vectores de ARN/ADN pequeño basado en ADN circularizado cerrado covalentemente (ccc), comprendiendo el método las etapas de

(a) Proporcionar una construcción de vector fagémido de hebra sencilla (hs) que comprende al menos una base de uracilo y/o un sitio diana de nucleasa de ADN/ARN; comprendiendo la construcción del vector fagémido hs (i) al menos un casete de expresión de ARN/ADN pequeño que comprende un promotor de ARN/ADN y un sitio de introducción de secuencia de ARN/ADN pequeño diana vacío o una secuencia codificante de ARN/ADN pequeño, o secuencia parcial del mismo, (ii) al menos un origen de replicación (ORI) de ADN de hebra sencilla tal como un ORI de fago, y en particular un origen f1, y

(b) Proporcionar al menos una especie de cebador de ADN mutagénico, en donde el cebador de ADN mutagénico tiene la siguiente estructura en la dirección 3' a 5': una primera región de homología, una región de secuencia diana que codifica un ARN/ADN pequeño que se va a expresar, y una segunda región de homología, en donde la primera región de homología es complementaria a, o es capaz de reasociarse con, una secuencia de la construcción del vector fagémido hs que flanquea el sitio de introducción de secuencia de ARN/ADN pequeño diana vacío o la secuencia codificante de ARN/ADN pequeño, o una secuencia parcial de la misma, en el lado 5', y en donde la segunda región de homología es complementaria a, o es capaz de reasociarse con una secuencia de la construcción del vector fagémido hs que flanquea el sitio de introducción de la secuencia de ARN/ADN pequeño diana vacía o la secuencia codificante de ARN/ADN pequeño, o una secuencia parcial de la misma, en el lado 3',

(c) Reasociar al menos una especie de cebador de ADN mutagénico con la construcción del vector fagémido hs y amplificar un ADNdh heterodúplex circularizado cerrado covalentemente (ccc),

(d) Remplazar la hebra que contiene uracilo en el ADNdh heterodúplex ccc por una hebra de ADN complementaria que no contiene uracilo para obtener un vector de expresión o biblioteca de vectores de ARN/ADN pequeño basado en ADN ccc.

En el presente documento, el término "fagémido" se refiere a un genoma de fago que se ha convertido en un plásmido.

En una realización preferida, la construcción de vector fagémido de hebra sencilla (hs) comprende adicionalmente dentro de su al menos un casete de expresión de ARN/ADN pequeño un sitio de reconocimiento de enzima de restricción (sitio de restricción). Preferiblemente, el sitio de restricción está ubicado en la construcción del vector fagémido de hebra sencilla (hs) entre las regiones que son complementarias a la primera región de homología del Cebador de ADN mutagénico y la región complementaria a la segunda región de homología del cebador mutagénico. Por lo tanto, el sitio de restricción está ubicado en una posición que no está duplicada en la síntesis de 3Cs y, por lo tanto, está presente solo en la construcción del vector fagémido hs que contiene uracilo. La realización permite la digestión adicional de ADN de tipo salvaje uracilado residual. Por lo tanto, el método en una realización comprende adicionalmente una etapa (c') entre las etapas (c) y (d), que comprende digerir enzimáticamente el ADN de 3Cs con una enzima de restricción capaz de introducir selectivamente una rotura de la doble hebra en el sitio de restricción. En el contexto de la realización, se utilizan sitios de restricción y sus correspondientes enzimas que tienen sitios de reconocimiento que rara vez se encuentran en los genomas. Las enzimas de restricción ilustrativas y sus sitios diana son I-PpoI, SmaI, HpaI, I-SceI o I-CeuI. Puede utilizarse cualquier sitio de reconocimiento de restricción que no se presente en el ADN hs uricilado molde. Además del uso de endonucleasas de restricción, también se puede utilizar cualquiera de las siguientes enzimas para eliminar el plásmido salvaje residual: se prefieren I-CeuI, I-PpoI, I-SceI, todas las endonucleasas autodirigidas, todas las endonucleasas no autodirigidas, el uso de secuencias diana de perturbación génica para, p. ej., TALEN, ZFN, CRISPR/Cas y enzimas similares, el uso de secuencias de nucleótidos tóxicos procarióticos y/o eucarióticos con el objetivo de suprimir la amplificación de tales secuencias y el uso de secuencias de clonación basadas en homología y/o recombinación.

En una realización preferida, la invención proporciona una construcción de vector fagémido de hebra sencilla (hs) como se describió anteriormente, que comprende al menos dos casetes de expresión de ARN/ADN pequeño, más preferiblemente al menos tres, 4, 5, 6, 7, 8, 9, 10, 15, 20, 30 y más casetes de expresión de ARN/ADN pequeño como se describe anteriormente en el presente documento. En esta realización, denominada "múltiplex", la molécula del vector es capaz de generar una multitud de ARN/ADN pequeños para expresarse simultáneamente.

En una realización adicional, el al menos un casete de expresión de ARN/ADN pequeño es al menos dos o más casetes de expresión de ARN/ADN pequeño (expresión múltiple de ARNg u otro ARN/ADN pequeño). En otras realizaciones preferidas, los sitios de restricción utilizados dentro de los dos o más casetes de expresión de ARN/ADN pequeños son idénticos, similares o diferentes.

El término "ADN circularizado cerrado covalentemente" o "ADNccc" como se emplea en el presente documento se refiere a moléculas de ADN que han asumido una forma circular en contraste con moléculas de ADN lineal tales como ADN cromosómico eucariótico o ADN cromosómico bacteriano que comprenden una muesca o comprenden un extremo 3' o 5' libre. Por otra parte, la estructura circular de las moléculas de ADN mencionadas anteriormente está cerrada covalentemente. El ADNccc es bien conocido en la técnica y es descrito adicionalmente, por ejemplo, por KG. Hardy (ed) en "Plasmids, a practical approach", IRL Press Oxford U.K., Washington D.C., EE. u U., 1987.

Como se emplea en el presente documento, el término "biblioteca de vectores" se refiere a una pluralidad de vectores (o plásmidos) que comprenden una pluralidad de secuencias únicas de ARN/ADN pequeño que se van a expresar (p. ej., ARNip, ARNhc, ARNg o secuencias similares) insertadas en un casete de expresión de ARN/ADN. En realizaciones preferidas, las bibliotecas de vectores comprenden al menos 101 o 102, más preferiblemente, al menos 103, incluso más preferiblemente al menos 104, y aún más preferentemente, al menos 105, 106, 107, 108 o 109 secuencias de vectores únicas (es decir, secuencias de ARN/ADN contenidas en cada vector o plásmido).

En el contexto de la presente invención, se entenderá que un ARN pequeño incluye un ARNip, un ARNhc, un antimiR, un ARN guía (ARNg) o un ADN guía (ADNg). Lo más preferido es que el ARN pequeño sea un ARNg, y en donde la construcción del vector fagémido hs comprende adicionalmente, pero no se limita a la presencia de, una secuencia de expresión de nucleasa que edita el genoma, opcionalmente conectada operablemente a un promotor.

La presente invención en algunas realizaciones preferidas busca proporcionar un nuevo método para la generación de bibliotecas de orden superior de vectores que expresan ARN/ADN pequeño. En el contexto de la invención, el término "orden superior" significará que la biblioteca comprende múltiples especies de vectores que son diferentes en la secuencia del ARN/ADN pequeño que se va a expresar mediante/a través del vector. El presente método utiliza el cebador de ADN mutagénico para introducir tales secuencias en el vector de elección. Por lo tanto, en algunas realizaciones la al menos una especie de cebador de ADN mutagénico es al menos dos especies de cebador de ADN mutagénico, preferiblemente es al menos tres, más preferiblemente al menos 4, 5, 6, 10, 50, 100, 1000, 104, 105, 106, 107, 108, 109, 1010, 1011 o 1012, especies de cebador de ADN mutagénico, y en donde cada especie de ADNccc tiene una secuencia diferente en la secuencia codificante de ARN/ADN pequeño de elección.

En algunas realizaciones de la presente invención, la multitud de especies de secuencias de cebadores de ADN mutagénicos se proporcionan introduciendo en la secuencia codificante de ARN/ADN pequeño (tal como está contenida en el cebador de ADN mutagénico de la invención) de elección al menos uno o más bases codificadas de la IUPAC (p. ej., base degenerada). Una "base degenerada" o "posición degenerada" se denomina "n" en la nomenclatura de secuencia. En el contexto de la presente invención, una base degenerada no es un tipo de base de nucleótido, sino que denota la posibilidad de que en una preparación de ácidos nucleicos que tengan esencialmente la misma secuencia, la posición "n" en dicha secuencia permita la posibilidad de múltiples tipos de bases en esta posición. Por lo tanto, una preparación de ácidos nucleicos que tiene una secuencia que contiene al menos una posición "n" denota una mezcla de ácidos nucleicos que tienen adenina, guanina, timina o citosina (con igual probabilidad) en la posición n. Por ejemplo, si se sintetizan oligonucleótidos, la reacción en una o más posiciones puede llevarse a cabo utilizando como nucleótidos donadores una cantidad igual de nucleótidos que contienen adenina, guanina, timina y citosina. En tal reacción, cada uno de estos nucleótidos tiene la misma oportunidad de ser añadido a la cadena de oligonucleótidos en crecimiento y, por lo tanto, permite la creación de una mezcla de moléculas con diferentes bases en la posición "n". Se puede utilizar el mismo principio si en una posición sólo se pretende introducir dos o tres bases diferentes. En la presente divulgación se utiliza la siguiente nomenclatura: R = G, A (purina), Y = T, C (pirimidina), K = G, T (ceto), M = A, C (amino), B = G, T, C (todas menos A), D = G, A, T (todas menos C), H = A, C, T (todas menos G), V = G, C, A (todas menos T) y N = A, G, C, T (cualquiera).

En otras realizaciones de la presente invención, la secuencia codificante de ARN/ADN pequeño tiene una longitud de al menos 10 nucleótidos a 200 nucleótidos, más preferiblemente de 10 a 100, más preferiblemente de 10 a 50, más preferiblemente de 10 a 30, más preferiblemente de 15 a 30, más preferiblemente de 15 a 25, lo más preferiblemente de 17 a 23, lo más preferiblemente aproximadamente 20. La longitud de la secuencia puede ser ajustada por el experto en la técnica dependiendo del tipo de ARN/ADN pequeño que se deba expresar. La longitud preferida del ARN guía y el ARNhc o el ARNip es diferente, pero es bien conocida por los expertos en la técnica.

El cebador de ADN mutagénico de la invención comprende regiones de homología flanqueantes que se utilizan para reasociar el cebador con la molécula de vector uracilada circular hs utilizada en la reacción de la invención. Por lo tanto, las regiones flanqueantes son preferiblemente de una longitud que permite la reasociación del cebador de ADN mutagénico con el molde en condiciones adecuadas para la extensión del cebador. Las longitudes de las regiones de homología 3' o 5' pueden ser idénticas o diferentes. En algunas realizaciones, cada una de las regiones de homología tiene una longitud de al menos 5 nucleótidos, preferiblemente de al menos 10 nucleótidos, más preferiblemente de 5 a 40 nucleótidos, lo más preferiblemente de 10 a 30 o de 10 a 20, lo más preferiblemente de 13 a 18, e incluso más preferiblemente aproximadamente 15 nucleótidos. Lo más preferido es de 5 a 40 nucleótidos. En algunas otras realizaciones de la invención, el cebador de ADN mutagénico tiene una secuencia como se muestra en cualquiera de SEQ ID NO: 2 a 12.

En algunas realizaciones del método de la invención, la construcción del vector fagémido de hebra sencilla (hs) se proporciona mediante las siguientes etapas adicionales del método:

(aa) amplificación de un vector fagémido de ADNdh de la misma secuencia en una cepa bacteriana con deficiencia de dUTPasa y/o uracil glicosilasa, y/o sus homólogos, parálogos u ortólogos, preferiblemente en la cepa CJ236, para obtener vectores fagémidos de ADNdh heterodúplex que contienen uracilo y

(bb) generación de partículas de fago que comprenden un ADNhs que contiene uracilo, y

(cc) purificación a partir de dichas partículas de fago de dicho ADNhs que contiene uracilo para obtener la construcción de vector fagémido hs que comprende al menos una base de uracilo.

En otra realización preferida según la invención, la cepa bacteriana con deficiencia de dUTPasa y/o uracil glicosilasa, y/o sus homólogos, parálogos u ortólogos, preferiblemente la cepa CJ236, comprende un fagémido auxiliar, o en donde en la etapa (bb) dicha cepa bacteriana con deficiencia de dUTPasa y/o uracil glicosilasa, y/o sus homólogos, parálogos u ortólogos, preferiblemente en la cepa CJ236 infectada con un fago auxiliar, en donde el fagémido auxiliar o el fago auxiliar es preferentemente M13K07.

En algunas realizaciones, se prefiere que la etapa (d) del método de la invención se realice transformando y amplificando dicho ADNdh heterodúplex ccc en una bacteria que tiene una actividad funcional de dUTPasa y/o uracil glicosilasa, tal como XL1 o SS320, para obtener dicho ADNccc.

En algunas realizaciones, el método de la invención es para la generación de vectores adecuados para la edición del genoma. Tales vectores de edición del genoma usualmente se caracterizan por la presencia de un casete de expresión de ARN guía que comprende un sitio para la introducción de la secuencia de ARNg de elección que guiará el complejo de edición del genoma al sitio diana en el genoma. Como tal, el casete de expresión de ARNg comprende tanto la porción de ARNg para el direccionamiento como el segmento de ARNg para la unión a la nucleasa de edición del genoma (Cas). El casete de expresión de ARNg suele estar en conexión operable (control transcripcional) con un promotor de ARN tal como el promotor U6 humano o de ratón o el promotor 7SK humano o el promotor HI de ratón. Sin embargo, el experto en la técnica conoce otros promotores de ARN. El vector de edición del genoma usualmente incluye adicionalmente una nucleasa de edición del genoma expresable tal como Cas9.

Como se emplea en el presente documento, el término "ARN guía" generalmente se refiere a una secuencia o molécula de ARN (o un grupo de moléculas de ARN colectivamente) que puede unirse a una proteína Cas y ayudar a dirigir la proteína Cas a una ubicación específica dentro de un polinucleótido diana (p. ej., un ADN o ARN). Un ARN guía puede comprender un segmento de ARNcr y un segmento de ARNtracr. Como se emplea en el presente documento, el término "ARNcr" o "segmento de ARNcr" se refiere a una molécula de ARN o una porción de la misma que incluye una secuencia guía dirigida a polinucleótidos, una secuencia troncal y, opcionalmente, una secuencia sobresaliente en 5'. Como se emplea en el presente documento, el término "ARNtracr" o "segmento de ARNtracr" se refiere a una molécula de ARN o una porción de la misma que incluye un segmento de unión a proteínas (p. ej., el segmento de unión a proteínas es capaz de interactuar con una proteína asociada a CRISPR, tal como Cas9). El término "ARN guía" abarca un solo ARN guía (ARNgs), donde el segmento de ARNcr y el segmento de ARNtracr están ubicados en la misma molécula de ARN. El término "ARN guía" también abarca, colectivamente, un grupo de dos o más moléculas de ARN, donde el segmento de ARNcr y el segmento de ARNtracr están ubicados en moléculas de ARN separadas.

El término "armazón" se refiere a las porciones de moléculas de ARN guía que comprenden secuencias que son sustancialmente idénticas o están altamente conservadas entre especies biológicas naturales. Los armazones incluyen el segmento de ARNtracr y la porción del segmento de ARNcr que no sea la secuencia guía dirigida a polinucleótidos en o cerca del extremo 5' del segmento de ARNcr, excluyendo cualquier porción no natural que comprenda secuencias no conservadas en los ARNcr y ARNtracr nativos.

El vector de edición del genoma de la invención puede codificar un origen de replicación del bacteriófago f1, un promotor de ARN polimerasa, un armazón de ARN guía para el sistema CRISPR/Cas, una nucleasa guiada por ARN o cualquier otra alternativa adecuada de los mismos. Las construcciones preferidas son construcciones basadas en lentivirus. Los vectores CRISPR/Cas convencionales conocidos en la técnica que se pueden utilizar en el contexto de la invención, o que pueden servir como modelo para el desarrollo de otros vectores de edición del genoma, son los vectores conocidos como pLentiCRISPR, pLentiCRISPRv2 o pLentiGuide.

En algunas realizaciones de la presente invención, la amplificación de un ADNdh heterodúplex circularizado cerrado covalentemente (ccc) en la etapa (c) se realiza mediante el uso de una enzima que tiene actividad ADN polimerasa, por ejemplo, una ADN polimerasa de T7, opcionalmente junto con una ADN ligasa, tal como ADN ligasa de T4 o alternativas de las mismas, que son conocidas por los expertos en la técnica.

Además, se divulga un método de escrutinio de fenotipos celulares de todo el genoma, comprendiendo el método el uso de una biblioteca de vectores producida según un método de la invención.

El método de escrutinio puede comprender las etapas de introducción de la biblioteca de vectores de la invención, en particular la biblioteca de todo el genoma, en una población de células diana y fenotipificación de las células transducidas utilizando cualquier ensayo de interés. Cualquier célula que tenga un fenotipo de interés puede analizarse en la siguiente etapa para determinar la identidad del ARNg o ARNi transducidos, con el fin de identificar un gen o una región genómica implicados en la generación del fenotipo. Por ejemplo, las células pueden ponerse en contacto con un agente inductor de muerte celular, y las células supervivientes se analizan en busca del vector 3Cs transducido para identificar la perturbación genética responsable de la resistencia contra el agente inductor de muerte celular. En otro aspecto de la invención, se proporciona un kit para realizar el método como se describe en el presente documento anteriormente, comprendiendo el kit

(a) construcción del vector fagémido que comprende

(i) al menos un casete de expresión de ARN guía (ARNg)/ADN guía (ADNg) que comprende un promotor de ARNg/ADNg, un sitio de introducción de secuencia de direccionamiento de ARNg/ADNg vacío o una secuencia de direccionamiento de ARNg/ADNg,

(ii) al menos un origen de replicación del fago, y

(iii) al menos un casete de expresión que comprende una secuencia que codifica una nucleasa de edición del genoma bajo el control de una secuencia promotora;

(b) una ADN polimerasa, opcionalmente una ADN ligasa;

(c) una preparación de células bacterianas que tienen una actividad funcional dUTPasa y/o uracil glicosilasa, (d) e instrucciones de uso,

en donde el kit incluye adicionalmente al menos uno o más cebadores mutagénicos de ARN o ADN, en donde el cebador mutagénico de ARN o ADN tiene la siguiente estructura en dirección 3' a 5': una primera región de homología, una región de secuencia diana que codifica un ARN/ADN pequeño que se va a expresar, y una segunda región de homología, en donde la primera región de homología es complementaria a, o es capaz de reasociarse con una secuencia de la construcción del vector fagémido hs que flanquea el sitio de introducción de secuencia de ARN/ADN pequeño diana vacío o la secuencia codificante de ARN/ADN pequeño, o una secuencia parcial de la misma, en el lado 5', y en donde la segunda región de homología es complementaria a, o es capaz de reasociarse con una secuencia de la construcción del vector fagémido hs que flanquea el sitio de introducción de secuencia de ARN/ADN pequeño diana vacío o la secuencia codificante de ARN/ADN pequeño, o la secuencia parcial de la misma, en el lado 3'.

En algunas realizaciones, la ADN polimerasa es una ADN polimerasa de T7 y/o la ADN ligasa es una ADN ligasa de T4, o cualquiera de sus alternativas generalmente conocidas.

En otras realizaciones de la invención, la construcción de vector fagémido de la invención es una construcción de vector fagémido de hebra sencilla (hs) que comprende al menos una base de uracilo.

En realizaciones adicionales, el vector fagémido es un vector de ADNdh.

El kit de la invención puede comprender en algunas realizaciones una preparación, muestra o cultivo de células bacterianas con deficiencia de dUTPasa y/o uracil glicosilasa, y/o sus homólogos, parálogos u ortólogos, preferiblemente la cepa CJ236. Tales cepas son generalmente conocidas en la técnica pertinente.

En otras realizaciones relacionadas con el kit de la invención, las células bacterianas comprenden/contienen adicionalmente un fagémido auxiliar, preferiblemente M13K07.

En otras realizaciones de la invención, el kit según la invención comprende adicionalmente una preparación de fagémido auxiliar, o fagos auxiliares, en donde el fagémido auxiliar, o fagos auxiliares, son preferiblemente partículas M13K07. Otro aspecto más de la invención se refiere a una biblioteca de vectores producida con los métodos que se describen en el presente documento. Otro aspecto alternativo o adicional de la invención es una biblioteca de vectores que comprende al menos 101, 102, más preferiblemente, al menos 103, incluso más preferiblemente al menos 104, y aún más preferentemente, al menos 105, 106, 107, 108 o 109 secuencias de vector únicas (es decir, secuencias de ARN/ADN contenidas en cada vector o plásmido). Por lo tanto, las realizaciones preferidas de la invención se refieren a una biblioteca de vectores, que comprende una pluralidad de secuencias de vectores únicas, en donde la cadena principal del vector de cada vector en la biblioteca es un vector CRISPR/Cas9, o una alternativa funcional del mismo, y cada secuencia de vector única en la biblioteca comprende una secuencia de expresión de ARNg única. El número de secuencias únicas de ARNg en tal biblioteca es preferiblemente al menos 101 o 102, más preferiblemente, al menos 103, incluso más preferiblemente al menos 104, y aún más preferentemente, al menos 105, 106, 107, 108 o 109. Más preferiblemente, la biblioteca de vectores tiene una variación de secuencias de ARNg únicas en la biblioteca de modo que cada secuencia en un genoma dado puede ser objeto de edición del genoma y, por lo tanto, es una verdadera biblioteca de expresión de ARNg de todo el genoma. Realizaciones alternativas tienen que ver con una biblioteca de vectores de la invención basada en un vector de expresión de ARNip (o generalmente ARNi).

Adicionalmente, la invención se refiere a los siguientes elementos preferidos:

La presente invención se describirá ahora con más detalle en los siguientes ejemplos con referencia a las figuras y secuencias adjuntas, no obstante, sin limitarse a ellas. En las Figuras:

Figura 1:

Principio básico de generación de dU-ADNdh sintetizado circularizado cerrado covalentemente (3Cs). A) Gráfico que ilustra las etapas esenciales de la síntesis de ARNg de 3Cs. B) Los plásmidos CRISPR/Cas convencionales se pueden convertir en dU-ADNhs, resueltos mediante electroforesis en gel; C) La Secuenciación de Próxima Generación (NGS) de la biblioteca de ARNg de 3Cs dirigida a eGFP revela la ausencia de sesgo de secuencia de las reacciones/reactivos 3Cs. D) El análisis estadístico de los datos de NGS (biblioteca de ARNg de 3Cs de direccionamiento a eGFP) identifica que el coeficiente de variación es de 33,18%, lo que confirma la ausencia de sesgo de secuencia.

Figura 2:

Generación de ARNg de 3Cs dirigidos a eGFP. A) Determinación de la homología óptima de cebador 3Cs para generar dU-ADNdh de 3Cs. B) Reacción de 3Cs con 6 secuencias de ARNg dirigidas a eGFP. C) Razón de secuencias mutadas con respecto a secuencias de tipo salvaje después de la amplificación y la secuenciación clonal. D) Logotipo de secuencia de ARNg mutados y distribución de ARNg. E) Razón de secuencias mutadas con respecto a secuencias de tipo salvaje cuando se analizan sin y con uridina adicional en medios de cultivo CJ236.

Figura 3:

Los ARNg de 3Cs son funcionales en las células. A) Reducción dependiente de la dosis lentiviral en la señal fluorescente verde después de la transducción celular con ARNg de 3Cs dirigidos a eGFP. B) El ensayo Surveyor de endonucleasa I de T7 demuestra la edición de ADN genómico del locus eGFP estable (wt: locus eGFP de tipo salvaje, *: producto de PCR no específico).

Figura 4:

Distribución de sitios de direccionamiento de SpCas9 humano. AB) Número total y único de secuencias de ARNg de SpCas9 por cromosoma humano. C) Distancia media de la secuencia cromosómica SpCas9 PAM en nucleótidos (nts). D) Apariciones de ARNg agrupados como porcentaje de todos los ARNg humanos. E) Distribución de Pareto de apariciones de ARNg y ARNg que aparecen x veces en el genoma humano.

Figura 5:

Una biblioteca de ARNg de 3Cs fiel de todo el genoma de los ARNg de SpCas9 optimizados. A) Esquema que ilustra el diseño del cebador de ARNg de 3Cs desnaturalizado para ARNg altamente activos y optimizados.

B) Reacción de 3Cs con cebador 3Cs desnaturalizado y optimizado resuelta mediante electroforesis en gel. C) Razón de secuencias mutadas con respecto a secuencias de tipo salvaje después de la amplificación y la secuenciación clonal. D) Secuenciación de la biblioteca ARNg de 3Cs, resultados ilustrados en formato de mapa de calor. El porcentaje de nucleótidos individuales por posición de ARNg está codificado por colores.

Figura 6:

Identificación de la resistencia a la Doxorrubicina con una biblioteca optimizada de ARNg de 3Cs. A) Esquema experimental que ilustra el uso de células hTERT-RPE1, transducidas con partículas lentivirales (MOI=1) y seleccionadas con Doxorrubicina 1 pM durante tres semanas. B) Identificación basada en NGS y bioinformática de ARNg inductores de resistencia a la Doxorrubicina y su ubicación dentro del ADN genómico humano anotado. C) El gen CYSLTR2 es una alteración genética “hit” codificante de proteínas reproducible para el cual están disponibles comercialmente dos inhibidores químicos. Ambos inhibidores se valoran frente a concentraciones crecientes de Doxorrubicina e inducen resistencia a la Doxorrubicina.

Figura 7:

Principio general de la generación de reactivos de dU-ADNdh sintetizado covalentemente cerrado circularizado (3Cs) que contienen ARNg multiplexado. A) Gráfico que ilustra las etapas esenciales para generar reactivos de ARNg de 3Cs multiplexado. B) Ubicación, calidad y cantidad de ARNg que se dirigen a genes de eGFP y mCherry utilizados para la generación de reactivos ARNg de 3Cs multiplexado. C) Patrón típico de 3 bandas de reacciones satisfactorias de 3Cs, resueltas por electroforesis en gel (generación de bibliotecas de ARNg de 3Cs que se dirigen a eGFP, mCherry y eGFP mCherry). D) Control de calidad de la primera purificación de ADN después de la electroporación de los productos de síntesis de 3Cs. El ADN purificado se digiere enzimáticamente con I-CeuI, I-SceI o combinaciones de ambos para identificar reminiscencias de plásmidos de tipo salvaje (sin ARNg en el interior, sitio de corte de la enzima en el interior). A continuación, el ADN digerido enzimáticamente se somete a electroporación para eliminar las reminiscencias de tipo salvaje. E) El control de calidad de la segunda amplificación de ADN revela la ausencia de reminiscencias de tipo salvaje. F) La secuenciación de SANGER de bibliotecas de ARNg de 3Cs multiplexado identifica la integración selectiva de secuencias de ARNg dependientes de la homología 5' y 3' proporcionada durante las reacciones de 3Cs. G) Los reactivos de ARNg de 3Cs multiplexado son completamente funcionales en células humanas, como lo demuestra el agotamiento de GFP y/o mCherry, según la biblioteca lentiviral de ARNg de 3Cs que se transduce a células positivas para GFP/mCherry.

Figura 8:

3Cs es muy versátil y permite la generación de reactivos codificados por ARNhc. A) Los plásmidos que codifican ARNhc lentivirales convencionales (pLKO.1) se pueden convertir de manera eficaz en ADN de plásmido de hebra sencilla (como se muestra en las Figuras 1 y 4), resuelto mediante electroforesis en gel. B) Se muestra el principio de diseño del cebador de ARNhc de 3Cs. C) Patrón típico de 3 bandas de reacciones satisfactorias de 3Cs, resueltas por electroforesis en gel (generación de ARNhc de 3Cs dirigido a eGFP). D) La secuenciación de SANGER de colonias bacterianas derivadas de plásmidos generados por ARNhc de 3Cs confirma la integración satisfactoria de secuencias de ARNhc dirigidas a eGFP (resaltadas en color rojo).

Ejemplos

Ejemplo 1: Plásmidos CRISPR/Cas9 mutados sintetizados circularizados cerrados covalentemente

Si bien la mutagénesis dirigida al sitio convencional no funciona de manera eficaz en plásmidos que contienen elementos retrovirales grandes, se anticipó que la extensión del oligonucleótido 5' mediada por la ADN polimerasa de T7 y la ADN ligasa de T4 sobre la base de ADNhs sería un enfoque eficaz para generar bibliotecas de ARNg de alta calidad y sin sesgo (Figura 1A). Con este fin, se transformaron bacterias K12 de Escherichia coli CJ236 dut-/ung-, que contienen factor F, con los plásmidos CRISPR/Cas que contienen el origen f1 (f1 -ori) más ampliamente utilizados, pLentiGuide y pLentiCRISPRv2. A diferencia de las cepas de E. coli K12 convencionales, las bacterias CJ236 toleran la presencia de desoxiuridina en el ADN genómico y plasmídico debido a la falta de las enzimas dUTPasa (dut-) y uracil glicosilasa (ung-). La superinfección posterior de CJ236 transformadas con el bacteriófago M13K07 permite la producción de partículas de bacteriófago que empaquetan un molde de ADNhs que contiene desoxiuridina (dU-ADNhs) de pLentiGuide y pLentiCRISPRv2. En una etapa siguiente, el dU-ADNhs se purifica de las partículas de bacteriófago precipitadas (Figura 1B). En general, este enfoque se puede aplicar a cualquier plásmido que codifique un f1 -ori.

Para generar con éxito ADNdh sintetizado circularizado cerrado covalentemente, en forma de heterodúplex (ADNdh de 3Cs) a partir de moldes de dU-ADNhs, se probó la longitud óptima de cebador/homología comparando 10, 13, 15 y 18 nucleótidos (nts) de homología 5' y 3' en una reacción de 3Cs in vitro de 2 horas (Figura 2A). Los productos de reacción de dU-CCC-ADNdh se resolvieron mediante electroforesis en gel y se identificó el patrón típico de tres bandas de las reacciones de ADNdh heterodúplex (33, 34). La razón óptima entre los productos 3Cs correctamente extendidos, cortados y desplazados en la hebra se logró con 15 nts de homología de cebador (Figura 2A), por lo tanto, los autores de la presente invención usaron esta longitud para todas las reacciones posteriores.

A continuación, los autores de la presente invención probaron este protocolo para la generación de ARNg activos en la célula que se dirigen al gen de la proteína fluorescente verde mejorado (eGFP). Se diseñaron seis secuencias de ARNg utilizando el algoritmo del conjunto de reglas 2 (RS2) y se clonaron utilizando una reacción de 3Cs en pLentiGuide y pLentiCRISPRv2 que contenían una secuencia de control de direccionamiento no humana (NHT) bajo el control del promotor U6 y seguida por la secuencia de ADN del armazón de ARNg responsable de la unión a SpCas9 (Figura 2B) (32). El heterodúplex dU-CCC-ADNdh resultante se utilizó para transformar bacterias XL1 para determinar la razón de secuencias que contienen (NHT) correctamente mutadas con respecto a las de tipo salvaje. Los autores de la presente invención secuenciaron individualmente 20 clones y determinaron que 81% de pLentiGuide y 82% de pLentiCRISPRv2 se modificaron con ARNg dirigidos a eGFP (Figura 2C, D). La adición de uridina a los medios de cultivo de M13K07 redujo significativamente la tasa de tipo salvaje a aproximadamente 12%, lo que indica que la aparición de plásmido no modificado probablemente se deba a una incorporación insuficiente de dU al molde de dU-ADNhs (Figura 2E). Es importante destacar que los autores de la presente invención pudieron identificar varias copias de las 6 secuencias de ARNg dirigidas a eGFP (Figura 2D), aunque los autores de la presente invención secuenciaron solo 20 clones individuales, lo que sugiere que protocolo de los autores de la presente invención altamente eficaz es adecuado para la construcción de bibliotecas.

Para probar la funcionalidad en la célula de las construcciones de ARNg dirigidas a eGFP de los autores de la presente invención, se generaron partículas lentivirales infecciosas y se utilizaron para transducir células epiteliales pigmentadas de retina (RPE1) inmortalizadas con telomerasa humana positiva para eGFP. Después de 7 días sin ninguna presión selectiva, se analizó la presencia de células positivas y negativas para eGFP mediante citometría de flujo. La reducción de la fluorescencia verde utilizando las construcciones lentivirales de ARNg de 3Cs fue muy potente, mientras que el plásmido de control no tuvo efecto sobre la fluorescencia de eGFP (Figura 3A). Curiosamente, los autores de la presente invención observaron una reducción de la fluorescencia dependiente de la dosis, lo que indica que la transducción lentiviral de células RPE1 es igualmente eficaz que con partículas lentivirales CRISPR/Cas generadas convencionalmente (Figura 3A). La reducción dependiente de la dosis en la fluorescencia verde fue un resultado directo de la edición del ADN genómico por construcciones ARNg de 3Cs, demostrada por el ensayo Surveyor de T7 (Figura 3B). Por lo tanto, los ARNg de CRISPR/Cas sintetizados circularizados cerrados covalentemente se pueden generar rápidamente utilizando el enfoque 3C recientemente establecido de los autores de la presente invención y son completamente funcionales en las células.

Con el fin de reducir adicionalmente los plásmidos de tipo salvaje uracilados residuales, los autores de la presente invención modificaron pLentiGuide y pLentiCRISPRv2 mediante la inserción de un sitio de restricción de la enzima autodirigida para I-SceI en el casete de ARNg y repitieron la síntesis de 3Cs con los oligonucleótidos dirigidos a eGFP. La presencia de un sitio de corte I-SceI facilita la digestión y la eliminación del plásmido de tipo salvaje no modificado después de la reacción de 3Cs y redujo la aparición de plásmido de tipo salvaje por debajo de límite de detección de secuenciación de SANGER de los autores de la presente invención. La secuenciación de próxima generación (NGS) de la biblioteca ARNg de 3Cs para eGFP (cadena principal de pLentiCRISPRv2) reveló una tasa de tipo salvaje inferior a 1% y una presencia igual de los 6 ARNg sin sesgo de secuencia aparente (el coeficiente de variación (CV) es 33,18%) (Fig. 1c y d).

Ejemplo 2: Generación de bibliotecas ARNg de 3Cs altamente complejas

La mayoría de las bibliotecas de ARNg de SpCas9 de todo el genoma humano se dirigen al genoma codificante, que solo representa aproximadamente 1,5% de la secuencia genómica humana total. Por lo tanto, se planteó la hipótesis de que el método de la invención podría utilizarse para generar bibliotecas de ARNg de complejidad arbitraria, pero también ARNip u otras bibliotecas de ácidos nucleicos pequeños, incluida una escala verdaderamente amplia del genoma que no se limita a las regiones codificantes. Con este fin, los autores de la presente invención identificaron en una primera etapa todos los supuestos sitios diana de SpCas9 humanos y analizaron su distribución a través de los cromosomas individuales. El análisis demuestra que el tamaño del cromosoma y la aparición de PAM se correlacionan fuertemente, lo que sugiere una distribución aleatoria de los sitios diana de SpCas9 (Figura 4A, B) con una distancia media aparente de 9 nucleótidos (Figura 4C). Este resultado es coherente con la observación de que la distancia media de PAM en una secuencia aleatoria de nucleótidos es de aproximadamente 8 nucleótidos. Los autores de la presente invención identificaron un total de 248.985.973 (2,5x108) secuencias de ARNg independientes, de las cuales 98% son únicas en el genoma humano (Figura 4D). El número de apariciones y el número de ARNg que aparecen n veces en el genoma humano siguen una distribución directa de Pareto o ley de potencia (Figura 4E), lo que demuestra que la gran mayoría de todos los sitios diana de SpCas9 humanos son únicos y pueden ser elegidos como diana con una alta actividad sobre la diana mediante técnicas CRISPR/Cas establecidas.

Las preferencias del sitio diana de SpCas9 se han mapeado previamente y muestran una clara preferencia por las bases de puridina 3' mientras que los nucleótidos de timidina están desfavorecidos (31,32). Los autores de la presente invención tradujeron las preferencias de nucleótidos de SpCas9 a una secuencia de oligonucleótidos de 20 nts de longitud optimizada que se generó mediante la síntesis de un solo oligonucleótido siguiendo las normas de nomenclatura de la IUPAC (Figura 5A). En teoría, esta única secuencia de ARNg puede generar una biblioteca de ARNg SpCas9 altamente funcional que se dirige a todas las regiones codificantes y no codificantes posibles en el genoma humano. Usando principios de diseño establecidos por los autores de la presente invención para los ARNg dirigidos a eGFP, los autores de la presente invención realizaron la síntesis in vitro de esta biblioteca verdadera de ARNg de todo el genoma (Figura 5B, 2B). Las bacterias SS320 fueron sometidas a electroporación con el producto de síntesis in vitro y la diversidad de la biblioteca se determinó en función del número total de bacterias transformadas. En dos reacciones independientes, se logró una diversidad de biblioteca promedio de 1,92 x 109 dando como resultado una biblioteca combinada de 3,8 x 109 ARNg únicos. En consecuencia, la biblioteca de ARNg recién construida es 4 órdenes de magnitud más grande que todas las bibliotecas disponibles actualmente. La secuenciación de 200 clones individuales confirmó que la distribución mutacional corresponde al sesgo de nucleótidos introducido durante la síntesis del oligonucleótido degenerado (Figura 5C, D). Por lo tanto, la invención generó la primera biblioteca verdadera de ARNg de CRISPR/Cas de todo el genoma con una diversidad de 3800 millones de secuencias de ARNg únicas que superan todos los diseños de biblioteca actuales que están actualmente en uso. En consecuencia, esta biblioteca verdadera de todo el genoma se puede utilizar en enfoques de escrutinio para diseccionar las funciones de las regiones codificantes y no codificantes del genoma humano.

La invención presenta un método novedoso para generar eficazmente bibliotecas de perturbaciones de genes que se pueden utilizar para crear bibliotecas de cualquier escala y diversidad. Las bibliotecas de todo el genoma actuales varían en su complejidad individual, pero abarcan un rango de 7,6 x 104 a 1,8x105 para Brunello and Activity-Optimized CRISPR Knockout Library (29, 32), respectivamente. Sin embargo, a pesar de que estas bibliotecas son de alta calidad, contienen un sesgo de varias decenas a cientos de veces para ARNg seleccionados, causado principalmente por la clonación de ARNg convencional y la amplificación por PCR de secuencias de ARNg sintetizadas. El enfoque innovador de la presente invención utiliza la ADN polimerasa de T7 junto con la ADN ligasa de T4 para mediar una extensión 5' de oligonucleótidos reasociados sobre moldes de ADNhs de plásmidos CRISPR/Cas convencionales limitados solo por el número total de diferentes oligonucleótidos utilizados en la reacción de 3Cs. Por lo tanto, se evitan los inconvenientes de las estrategias de clonación convencionales.

El método de la invención puede lograr escalas de síntesis desde unas pocas secuencias hasta conjuntos de secuencias muy diversas. Por lo tanto, la invención establece un método que es aplicable en diferentes escenarios experimentales como, p. ej., la generación de líneas celulares de un solo KO, bibliotecas de tamaño intermedio y bibliotecas de todo el genoma no sesgadas. Además, para diversidades de hasta varios cientos de secuencias, el método de la invención genera formatos ordenados y agrupados simultáneamente; expandiendo los diseños experimentales incluso a escrutinios basados en imágenes ordenadas. Lo que es más importante, el método de la invención genera bibliotecas de perturbaciones génicas sin sesgo de secuencia. Por lo tanto, reduce significativamente la escala experimental general y los costes.

Ejemplo 4: Escrutinio de genes relacionados con la doxorrubicina utilizando la biblioteca de 3Cs

Para demostrar la funcionalidad celular, los autores de la presente invención transdujeron células RPE1 con la biblioteca verdadera de todo el genoma (TGW) para identificar mecanismos de resistencia codificantes y no codificantes al agente quimioterapéutico de primera línea Doxorrubicina. En condiciones imperturbables, la Doxorrubicina induce una reducción robusta y dependiente de la dosis de la viabilidad de las células RPE1 en 4 días. Para evitar que el fármaco escape de las células y para aumentar la tasa de hallazgos positivos verdaderos, se seleccionó 1 gM de Doxorrubicina como concentración de escrutinio. En un total de tres réplicas biológicas, los autores de la presente invención generaron sobrenadante lentiviral con un título promedio de 107 partículas infecciosas por ml y escrutaron aproximadamente 600 millones de células RPE1, transducidas con una MOI de 1. Después de 7 días iniciales de selección para la transducción lentiviral, las células se expusieron a Doxorrubicina 1 gM y se cultivaron durante 21 días adicionales antes de recolectar las células restantes, extraer y procesar su ADN genómico para la identificación de ARNg mediada por NGS (Fig. 6a). Curiosamente, entre todas las réplicas biológicas se identificó un solapamiento significativo de ARNg y diana. Esto sugiere que no es necesario investigar experimentalmente cada ARNg que contiene la biblioteca TGW para identificar la mayoría de las alteraciones genéticas biológicas relevantes.

A partir de células que sobrevivieron a la selección con Doxorrubicina, los autores de la presente invención identificaron ARNg de 3Cs de TGW que mostraban una alta reproducibilidad entre réplicas biológicas. Curiosamente, mientras que la biblioteca TGW tiene un fuerte sesgo hacia la elección como diana del genoma no codificante, los ARNg enriquecidos después de la selección con Doxorrubicina muestran un sesgo casi invertido hacia el genoma codificante de proteínas. De todos los ARNg restantes, 45,6% están ubicados en regiones codificantes, 22,2% están en intrones y 10,5% están en regiones no codificantes (codificantes de ARN) (Fig. 6b). Sin embargo, 21,7% de los ARNg se encuentran en regiones genómicas para las que no se pudo asignar ningún biotipo, lo que indica una brecha de conocimiento para esas regiones (Fig. 6b). Para validar algunos de los hallazgos de una manera independiente de CRISPR/Cas, se eligió el gen con alteraciones genéticas codificante de proteínas CYSLTR2 para el cual hay dos antagonistas químicos disponibles comercialmente. Los autores de la presente invención valoraron concentraciones crecientes de Doxorrubicina frente a concentraciones crecientes de los dos compuestos (BayCysLTR2 y Bay u9773) e incubaron células RPE1 expuestas al fármaco durante 4 días, después de lo cual se sometieron a los ensayos de viabilidad celular AlamarBlue. Curiosamente, ambos compuestos pudieron revertir el efecto citotóxico de la Doxorrubicina de una manera dependiente de la dosis, aunque Bay u9773 mostró un efecto reproduciblemente más fuerte (Fig. 6c). Esto confirma que la biblioteca de ARNg de 3Cs CRISPR/Cas verdadera de todo el genoma de la invención es funcional para identificar regiones genómicas asociadas con la resistencia a la doxorrubicina, y sugiere que también se puede aplicar a otras cuestiones biológicas.

Ejemplo 5: Bibliotecas de 3Cs Multiplex

Habiendo establecido un protocolo para generar reactivos de ARNg de 3Cs únicos, se razonó que el método 3Cs de la invención puede funcionar de manera eficaz en plásmidos que codifican dos o más ARNg siempre que se pueda generar una homología única suficiente entre los sitios de unión de cebadores individuales (casetes) (Fig. 7a). Con este fin, los autores de la presente invención identificaron bioinformáticamente y calcularon la puntuación RS2 para todos los posibles sitios diana de SpCas9 en el gen eGFP y mCherry (Fig. 7b). En total, se identificaron 119 ARNg dirigidos a eGFP y los autores de la presente invención añadieron homología 5' y 3' al promotor S7K humano y al armazón de ARNg SpCas9 de segunda generación, respectivamente. Los oligonucleótidos que codifican los 140 ARNg dirigidos al gen mCherry se complementaron con homología 5' y 3' con el promotor U6 humano y con el armazón de ARNg SpCas9 original, respectivamente. En tres reacciones de 3Cs individuales basándose de un plásmido múltiplex de ARNg SpCas9 lentiviral (pLenti-Multiplex), los autores de la presente invención generaron tres bibliotecas dirigidas a GFP, mCherry o una combinación de GFP y mCherry (16.600 combinaciones de ARNg) (Fig. 7c). La eficiencia de electroporación promedio para todas las reacciones de 3Cs independientes fue superior a 1,7*109, asegurando la amplificación completa de bibliotecas individuales y multiplexadas. Similar a la etapa de limpieza de I-Scel para reactivos ARNg de 3Cs individuales, los autores de la presente invención realizaron una limpieza de I-CeuI (casete GFP), I-SceI (casete mCherry) o una limpieza de I-CeuI/I-SceI combinados para eliminar molde que recuerda a las bibliotecas finales (Fig. 7d, e). Los autores de la presente invención secuenciaron con SANGER 10 colonias de plásmidos bacterianos de cada condición experimental e identificaron que la región de ARNg respectiva estaba altamente mutada, mientras que los nucleótidos ubicados adyacentes en 5' y 3' estaban libres de carga mutacional (Fig. 7f). Para validar funcionalmente los reactivos de ARNg de 3Cs multiplexados con GFP/mCherry, se indujeron partículas lentivirales infecciosas y se utilizaron para transducir una línea celular informadora RPE1 positiva para GFP/mCherry. La edición de ADN genómico se tradujo en un fuerte efecto negativo en el nivel de proteína de GFP y mCherry cuando se analizó mediante análisis FACS (Fig. 7g). Por lo tanto, se presenta el primer protocolo de una etapa para generar bibliotecas de ARNg de 3Cs de SpCas9 multiplexadas, donde las bibliotecas están libres de artefactos de clonación y potencialmente solo están limitadas por el número de diferentes secuencias de cebadores que codifican ARNg. Además, el protocolo de la invención puede combinarse potencialmente con cualquier sistema Cas/ARNg para fines de multiplexación de ARNg expandiendo los reactivos de multiplexación a la combinación de diferentes enzimas Cas.

Ejemplo 6: Generación de bibliotecas de ARNhc de 3Cs

Se demostró que la presente tecnología 3Cs es muy adecuada para generar reactivos de perturbación génica CRISPR/Cas individuales y multiplexados de alta calidad. Por lo tanto, la versatilidad de la tecnología 3Cs se probó adicionalmente con respecto a los reactivos de interferencia de ARN (ARNi) clásicos. Para probar esto, los autores de la presente invención utilizaron el plásmido de suministro de ARNhc lentiviral más convencional pLKO.1, del cual se obtienen la mayoría de los plásmidos CRISPR/Cas lentivirales, y generaron ADNhs de dos clones bacterianos CJ236 y los sobreinfectaron con bacteriófagos M13K07, seguido de precipitación de fagos y purificación de ADNhs y resolvieron el ADNhs por electroforesis en gel (Fig. 8a, calles 2 y 3). A continuación, los autores de la presente invención diseñaron un cebador de ARNhc de 3Cs, que contiene 15 nucleótidos de homología 3Cs 5' con el promotor de ARN U6, seguido de 21 nucleótidos que codifican un ARNhc efector dirigido a eGFP, seguido de la secuencia de horquilla de ARNhc de 6 nucleótidos, seguido de 21 nucleótidos de complemento inverso al ARNhc efector, y una homología 3Cs 3' de 15 nucleótidos (Fig. 8b). Los autores de la presente invención aplicaron el cebador de ARNhc de 3Cs a dos escalas de reacción 3Cs (60 y 120 ng de ADNhs) y separaron los productos 3Cs mediante electroforesis en gel y observaron el patrón típico de tres bandas, más pronunciado en la reacción de 120 ng de ADNhs (Fig. 8c). La transformación bacteriana, la purificación del ADN del plásmido junto con la secuenciación de SANGER del producto 3Cs de 120 ng reveló la integración de la secuencia de ARNhc dirigida a eGFP en el plásmido pKLO.1 (Fig. 8d). Esto demuestra que tecnología 3Cs de los autores de la presente invención no se limita a la generación de reactivos de ARNg de CRISPR/Cas, sino que es muy versátil y también puede utilizarse para generar reactivos de ARNhc de 3Cs para propósitos de ARNi.

Materiales y métodos

Amplificación de molde de dU-ADNhs en células CJ236

Se transformaron células de E. coli KCM competentes y dut-/ung (cepa K12 CJ236) con 500 ng de plásmido molde, 2 gl de 5xKCM y 7 gl de H2O y se sembraron en agar LB con suplemento de ampicilina. A la mañana siguiente, se recogieron las colonias, cada una en un cultivo de nueva aportación de 1 ml de medio 2YT que contenía 100 gg de ampicilina, 35 gg de cloranfenicol y fago auxiliar M13KO7 1:1000 (1e11 ufp). Después de 2 horas de incubación a 37°C y 200 rpm, se añadieron 25 gg de kanamicina y se continuó agitando durante otras 10 horas. Después de 10 horas, cada cultivo se transfirió a 30 ml de medio de cultivo 2YT que contenía 3000 gg de ampicilina, 750 gg de kanamicina y 187,5 gg de uridina. El medio de cultivo se incubó durante 20 h a 37°C y 200 rpm.

Purificación de dU-ADNhs

Después de 20 h, los cultivos se centrifugaron durante 10 min a 10000 rpm y 4°C en un rotor de ángulo fijo Beckman JA-12. El sobrenadante que contenía el fago se mezcló suavemente en un tubo Falcon de nueva aportación con 6 ml (1:5) de PEG/NaCl (polietilenglicol 8000 al 20%, NaCl 2,5 M) y se incubó durante 30 min a temperatura ambiente para precipitar los fagos. A continuación, la mezcla se centrifugó durante 10 min a 10.000 rpm y 4°C. Se descartó el sobrenadante y el sedimento de fago se centrifugó brevemente a 4000 rpm para eliminar el sobrenadante restante. El sobrenadante restante se aspiró y los sedimentos de fago se resuspendieron en 1 ml de PBS. A continuación, el sedimento de fagos resuspendido se centrifugó durante 5 min a 13.000 rpm para eliminar los restos celulares restantes. El sobrenadante se transfirió a un tubo de reacción de nueva aportación de 1,5 ml.

El ADN de hebra sencilla se purificó del sobrenadante utilizando E.Z.N.A. M13 DNA Mini Kit (Omega) según el protocolo del fabricante. Las concentraciones de ADN se determinaron utilizando NanoDrop, y el ADN se analizó mediante electroforesis de 500 ng de ADN de hebra sencilla en un gel de agarosa/TAE al 0,8%.

ARNg sintetizados circularizados cerrados covalentemente (ARNg de 3Cs): pequeña y gran escala

Se sintetizaron cuatro construcciones con cebadores de longitud creciente en experimentos individuales para probar la eficiencia de síntesis de diferentes longitudes de homología utilizando el protocolo para síntesis a pequeña escala (véase "Síntesis a pequeña escala del conjunto de eGFP y diferentes longitudes de homología"). Se sintetizaron 6 construcciones de eGFP-KO de forma agrupada utilizando el mismo protocolo.

Las construcciones de cebadores 20N y optimizado se sintetizaron utilizando un protocolo para síntesis a gran escala (véase "Síntesis a gran escala del cebador 20N y Opti"). Los plásmidos molde que se utilizaron para ambos enfoques, síntesis a pequeña y gran escala, fueron pLentiCRISPRv2 y pLentiGuide, cada uno con un ARNg de direccionamiento no humano (NHT) incorporado.

Los autores de la presente invención utilizaron la siguiente secuencia de ARNg de NHT:NHT: 5'-aaaacatcgaccgaaagcgt-3' (SEQ ID NO: 1)

Para probar diferentes longitudes de brazo de homología, los autores de la presente invención utilizaron el plásmido plentiGuide-NHT y los siguientes oligonucleótidos (todos en 5'-3'):

10 nts: gctctaaaac YBBNDHDNNNNDNNNNNHNN cGGTGTTTCG (SEQ ID NO: 2)

13 nts: Ctagctctaaaac YBBNDHDNNNNDNNNNNHNN cGGTGTTTCGTCC (SEQ ID NO: 3)

15 nts: TTCtagctctaaaac YBBNDHDNNNNDNNNNNHNN cGGTGTTTCGTCCTT (SEQ ID NO: 4)

18 nts: taTTTCtagctctaaaacYBBNDHDNNNNDNNNNNHNN cGGTGTTTCGTCCTTTCC (SEQ ID NO: 5) Para el conjunto de 6 construcciones de eGFP, los autores de la presente invención utilizaron pLentiGuide-NHT y pLentiCRISPRv2-NHT, cada uno con un conjunto de los siguientes oligonucleótidos (todos en 5'-3'):

eGFP-1: TTCtagctctaaaac aggtgaagttcgagggcgac cGGTGTTTCGTCCTT (SEQ ID NO: 6)

eGFP-2: TTCtagctctaaaac ccctgagcaaagaccccaac cGGTGTTTCGTCCTT (SEQ ID NO: 7)

eGFP-3: TTCtagctctaaaac tcgtgaccaccctgacctac cGGTGTTTCGTCCTT (SEQ ID NO: 8)

eGFP-4: TTCtagctctaaaac cggcgcgggtcttgtagttgC cGGTGTTTCGTCCTT (SEQ ID NO: 9)

eGFP-5: TTCtagctctaaaac ttcagctcgatgcggttcac cGGTGTTTCGTCCTT (SEQ ID NO: 10)

eGFP-6: TTCtagctctaaaac cggtgaacagctcctcgccc cGGTGTTTCGTCCTT

Para sintetizar el cebador 20N (20N) y el cebador optimizado (Opti), los autores de la presente invención utilizaron pLentiGuide y pLentiCRISPRv2, lo que dio como resultado cuatro condiciones: 20N en pLentiGuide-NHT, 20N en pLentiCRISPRv2-NHT, Opti en pLentiGuide-NHT y Opti en pLentiCRISPR-NHT. El cebador 20N era un cebador completamente aleatorio, es decir, cada nucleótido aparece con la misma probabilidad en cada posición. El cebador Opti se modeló a partir de un patrón publicado previamente (31, 32). En este cebador, varias posiciones estaban sujetas a restricciones con respecto a la elección de nucleótidos para reducir el tamaño de la biblioteca resultante (todas en 5'-3').

20N: TTCtagctctaaaac NNNNNNNNNNNNNNNNNNNN cGGTGTTTCGTCCTT (SEQ ID NO: 11) Opti: TTCtagctctaaaac YBBNDHDNNNNDNNNNNHNN cGGTGTTTCGTCCTT (SEQ ID NO: 12) Complementación con uridina del medio de cultivo

Para probar el efecto de la complementación con uridina sobre la eficiencia de la síntesis, los autores de la presente invención realizaron la síntesis a pequeña escala de un grupo de 6 construcciones de eGFP-KO con dos medios de cultivo diferentes. En un experimento, los autores de la presente invención complementaron los 30 ml de medio de cultivo con 187,5 gg (6,25 gg/ml) de uridina. El otro experimento se realizó sin complementación con uridina. Aparte de eso, los experimentos se realizaron de acuerdo con el protocolo de síntesis a pequeña escala. Los productos de síntesis se transformaron mediante choque térmico en células de E.coli competentes, se sembraron en placas de agar LB/ampicilina y se incubaron durante la noche a 37°C. Las razones de clones que contienen plásmido de tipo salvaje frente a clones que contienen ARNg de eGFP-KO en ambos experimentos se determinaron mediante secuenciación. Se seleccionaron 10 clones de cada experimento y se analizaron mediante secuenciación de Sanger.

Síntesis de ARNg de 3Cs a pequeña escala: Fosforilación de oligonucleótidos con polinucleótido quinasa de T4 Para fosforilar en 5' los oligonucleótidos, los autores de la presente invención combinaron 0,6 gg del oligonucleótido mutagénico, 2 gl de 10x tampón TM, 2 gl de ATP 10 mM, 1 gl de DTT 100 mM y 20 unidades de polinucleótido quinasa de T4. Se añadió H2O hasta un volumen total de 20 gl. Las mezclas se incubaron durante 1 hora a 37°C y se utilizaron inmediatamente para la reasociación. Para la agrupación de construcciones de eGFP-KO, los autores de la presente invención utilizaron 100 ng de cada cebador en una sola reacción. Las construcciones con diferentes longitudes de homología se sintetizaron individualmente.

Síntesis de ARNg de 3Cs a pequeña escala: Reasociación de oligonucleótido con el molde

Para reasociar los oligonucleótidos fosforilados con el molde dU-ADNhs, los autores de la presente invención añadieron 2,5 gl de 10x tampón TM y 2 gl de los oligonucleótidos fosforilados a 2 gg del molde dU-ADNhs y añadieron H2O hasta un volumen final de 25 gl. La mezcla se incubó durante 3 min a 90°C, 3 min a 50°C y 5 min a 20°C en un termociclador.

Síntesis de ARNg de 3Cs a pequeña escala: Síntesis enzimática de ARNg de 3Cs

Se sintetizó ADNdh de 3Cs añadiendo 1 gl de ATP 10 mM, 1 gl de mezcla de dNTP 10 mM, 1,5 gl de DTT 100 mM, 200 unidades de ligación o 3 unidades Weiss de ADN ligasa de T4 y 3 unidades de ADN polimerasa de T7 a la mezcla de oligonucleótido/molde reasociada. La mezcla de síntesis se incubó durante 2 horas a temperatura ambiente. Se analizaron 8 gl de los productos de reacción en un gel de agarosa/TAE al 0,8% (100 V, 5 min). Dos mililitros de los productos de reacción se transformaron mediante choque térmico en E.coli competente.

Síntesis de ARNg de 3Cs a pequeña escala: Secuenciación

Se sembraron E. coli transformadas en agar LB con suplemento de ampicilina. Las diferentes construcciones de longitud de brazo de homología se analizaron en un TAE/gel de agarosa. Se seleccionaron aleatoriamente 20 clones de bacterias transformadas con la agrupación de construcciones de eGFP y se analizaron mediante secuenciación de Sanger para determinar la distribución de secuencias de ARNg en la población.

Síntesis de ARNg de 3Cs a gran escala: Fosforilación de oligonucleótidos con polinucleótido quinasa de T4

Para fosforilar en 5' los oligonucleótidos, los autores de la presente invención combinaron 0,6 gg del oligonucleótido mutagénico, 2 gl de 10x tampón TM, 2 gl de ATP 10 mM, 1 gl de DTT 100 mM y 20 unidades de polinucleótido quinasa de T4. Se añadió H2O hasta un volumen total de 20 gl. Las mezclas se incubaron durante 1 hora a 37°C y se utilizaron inmediatamente para la reasociación. Los cebadores 20N y Opti se aplicaron en reacciones de síntesis separadas.

Síntesis de ARNg de 3Cs a gran escala: Reasociación de oligonucleótido con el molde

Para reasociar los oligonucleótidos fosforilados con el molde dU-ADNhs, los autores de la presente invención añadieron 25 gl de 10x tampón TM y 20 gl del oligonucleótido fosforilado a 20 gg del molde dU-ADNhs y añadió H2O hasta un volumen final de 250 gl. La mezcla se incubó durante 3 min a 90°C, 3 min a 50°C y 5 min a 20°C en un termociclador.

Síntesis de ARNg de 3Cs a gran escala: Síntesis enzimática de ARNg de 3Cs

Se sintetizó ADNhs de 3Cs añadiendo 10 gl de ATP 10 mM, 10 gl de mezcla de dNTP 10 mM, 15 gl de DTT 100 mM, 2000 unidades de ligación (o 30 unidades Weiss) de ADN ligasa de T4 y 30 unidades de ADN polimerasa de T7 a la mezcla oligonucleótido/molde reasociada. La mezcla de síntesis se incubó durante 2 horas a temperatura ambiente. Después de 2 h, la mezcla se purificó por afinidad y se desalinizó utilizando un kit de extracción de gel QIAquick de Qiagen. Se añadió a la mezcla 1 ml de tampón QG (Qiagen) y se mezcló. La muestra se aplicó a dos columnas giratorias QIAquick colocadas en tubos de microcentrífuga de 2 ml y se centrifugaron a 2500 rpm durante 3 min. Se utilizaron dos columnas giratorias porque la capacidad de unión de una sola columna era demasiado baja para la cantidad total de ADN en la mezcla de síntesis. A cada columna se le añadieron 750 gl de tampón PE (Qiagen) y se centrifugaron a 13.000 rpm durante 1 min. A continuación, la columna se transfirió a un tubo de microcentrífuga de nueva aportación de 1,5 ml y se centrifugó a 13.000 rpm durante 5 min con la tapa abierta. La columna se transfirió a un tubo de microcentrífuga de 1,5 ml de nueva aportación, se aplicaron 20 gl de agua destilada a la membrana. Después de 5 min, se añadieron otros 20 gl de agua destilada a la columna y se incubó durante 5 min. Para eluir el ADN, las columnas se centrifugaron a 13.000 rpm durante 1 min. Los eluyentes de los dos tubos se combinaron en un tubo de microcentrífuga de nueva aportación de 1,5 ml y se centrifugaron durante 15 min a 13.000 rpm con la tapa abierta para reducir el volumen total a aproximadamente 70 gl. Se sometió a electroforesis 1 gl del producto de reacción eluido junto con el molde de ADN de hebra sencilla en un gel de agarosa/TAE al 0,8% (100 V, 30 min).

Síntesis de ARNg de 3Cs a gran escala: Electroporación

Las bibliotecas guía optimizadas y 20N se sometieron a electroporación en E. coli electrocompetente (cepa SS320) con un Gene Pulser de Bio-Rad utilizando los siguientes ajustes: resistencia 200 ohmios, capacidad 25, voltaje 1,2 kV. Para transformar 100 gl de células se utilizaron 400 ng de ADN. Las células sometidas a electroporación se rescataron en 4 ml de medio SOC precalentado y se incubaron durante 1 hora a 37°C y 200 rpm.

Después de 1 h de incubación, se realizó una serie de diluciones para determinar la eficiencia de transformación y el número de bacterias transformadas. Se diluyeron 10 gl de cultivo de 10-1 a 10-12, se sembraron en placas de agar LB con ampicilina y se incubaron durante la noche a 37°C. Al día siguiente se determinó la eficiencia de la electroporación y el número de bacterias transformadas. El cultivo restante se añadió a 200 ml de medio LB con suplemento de ampicilina y se incubó durante la noche a 37°C. El ADN se purificó al día siguiente utilizando un Plasmid Maxi Kit de Qiagen.

Síntesis de ARNg de 3Cs a gran escala: Secuenciación de 96 pocillos

Las células XL1 Blue se transformaron mediante choque térmico con el ADN purificado de las bibliotecas guía optimizadas y 20N y se incubaron durante la noche a 37°C. Cada una de las colonias de células transformadas se inoculó en 450 gl de medio 2YT con suplemento de 100 gg/ml de ampicilina y fago auxiliar M13KO7 1:1000 (1e11 ufp) en una placa de 96 pocillos y se cultivaron durante la noche a 37°C a 200 rpm. Al día siguiente, las células se centrifugaron a 4000 rpm durante 5 min. El sobrenadante que contenía el fago se diluyó en una placa de nueva aportación de 96 pocillos 1:15 con tampón PBT. En una placa de nueva aportación de 96 pocillos, se añadieron 2 gl de fago diluido a la siguiente mezcla de PCR: 16,9 gl de agua destilada, 5 gl de 5x tampón de reacción convencional OneTaq (NEB), 0,5 gl de dNTP 10 mM, 0,5 unidades de ADN polimerasa OneTaq (NEB) y 0,25 gl de cada cebador 10 pM. El fragmento de ADN se amplificó con el siguiente programa de PCR: 5 min a 95°C, 30 ciclos de amplificación (30 s a 95°C, 30 s a 55°C, 40 s a 72°C), 7 min a 72°C, y almacenamiento a 4°C. Las reacciones representativas se analizaron en un TAE/gel de agarosa.

En cada pocillo de una placa de nueva aportación de 96 pocillos, se dispensaron 20,8 pl de mezcla de limpieza que contenía 20 pl de H2O destilada, 4 unidades de Exonucleasa I y 0,4 unidades de fosfatasa alcalina de camarón. Se transfirieron 6 pl del producto de PCR a cada pocillo y se mezclaron. Las reacciones de limpieza se incubaron a 37°C durante 15 min y 80°C durante 15 min. La placa se envió a secuenciar y se determinó la distribución de los diferentes ARNg.

Transducción lentiviral

Las células RPE1-H2B-eGFP se sembraron por triplicado en una placa de 6 pocillos con una densidad de 10.000 células por pocillo en medio DMEM-F12 con suplemento de 0,02 pg/ml de Higromicina, 110 unidades/ml de Penicilina, 100 pg/ml de Estreptomicina y 100 pl/ml de FBS. La transducción lentiviral se realizó al día siguiente con cantidades crecientes de lentivirus que albergaban la agrupación de 6 ARNg eGFP-KO. Un pocillo se transdujo con 400 uL de un ARNg diana no humano y sirvió como control negativo. El medio se cambió cada dos días en el transcurso de una semana. El séptimo día después de la transducción, se determinó el grado de agotamiento de eGFP mediante citometría de flujo.

Ensayo Surveyor de endonucleasa I de T7

Se sembraron células RPE1-H2B-eGFP con una densidad de 10.000 células por pocillo en medio DMEM/F12 con suplemento de 0,02 pg/ml de Higromicina, 110 unidades/ml de Penicilina, 100 pg/ml de Estreptomicina y 100 pl/ml de FBS. La transducción lentiviral de un pocillo se realizó al día siguiente con 200 pl de sobrenadante lentiviral que albergaba una agrupación de 6 ARNg contra eGFP. Otro pocillo se transdujo con un ARNg diana no humano y sirvió como control negativo. El tercer día después de la transducción, el medio se cambió a DMEM/F12 de nueva aportación con suplemento de 0,02 pg/ml de Higromicina, 110 unidades/ml de Penicilina, 100 pg/ml de Estreptomicina y 100 pl/ml de FBS. El séptimo día después de la transducción, se extrajo el ADN genómico utilizando extracción con fenolcloroformo. La amplificación por PCR se realizó con las muestras de ADN genómico en un volumen de reacción de 50 pL, que contenía 1 pg de ADN, 10 pL de tampón convencional OneTaq, 1 pL de dNTP 10 mM, 0,25 pL de ADN polimerasa OneTaq, 2,5 pL de los siguientes cebadores 10 pM:

GCGGGATCCTTACTTGTACAGCTCGTCCATGCCGAG (SEQ ID NO: 13)

CACATCCCGCGAGATCCAGACG (SEQ ID NO: 14),

y H2O destilada hasta 50 pL de volumen de reacción. Se utilizaron las siguientes condiciones de ciclo: desnaturalización inicial durante 2 min a 95°C, 30 ciclos de desnaturalización de 15 s a 95°C, reasociación de 15 s a 60°C y extensión de 30 s min a 72°C. La extensión final se realizó 1 min a 72°C. A continuación, las dos muestras amplificadas por PCR se desnaturalizaron utilizando el siguiente protocolo: desnaturalización inicial durante 5 min a 95°C, reasociación con la siguiente rampa: 85°C durante 10 s, 75°C durante 10 s, 50°C durante 10 s, y 25°C durante 1 min. Se digirieron 50 pL de los productos de PCR con 2,7 pL de Endonucleasa I de T7 y 5,5 pL de NEBuffer 2 en un volumen total de 58,2 pL. Las mezclas se incubaron durante 1 hora a 37°C y se analizaron en un gel de agarosa/TAE al 2,5%.

Referencias

1. R. Barrangou et al., CRISPR provides acquired resistance against viruses in prokaryotes. Science 315, 1709 1712 (2007).

2. J. E. Garneau et al., The CRISPR/Cas bacterial immune system cleaves bacteriophage and plasmid DNA. Nature 468, 67-71 (2010).

3. G. Gasiunas, R. Barrangou, P. Horvath, V. Siksnys, Cas9-crRNA ribonucleoprotein complex mediates specific DNA cleavage for adaptive immunity in bacteria. Proc Natl Acad Sci U S A 109, E2579-2586 (2012).

4. M. Jinek et al., A programmable dual-RNA-guided DNA endonuclease in adaptive bacterial immunity. Science 337, 816-821 (2012).

5. J. A. Doudna, E. Charpentier, Genome editing. The new frontier of genome engineering with CRISPR-Cas9. Science 346, 1258096 (2014).

6. R. Jansen, J. D. Embden, W. Gaastra, L. M. Schouls, Identification of genes that are associated with DNA repeats in prokaryotes. Molecular microbiology 43, 1565-1575 (2002).

7. A. Bolotin, B. Quinquis, A. Sorokin, S. D. Ehrlich, Clustered regularly interspaced short palindrome repeats (CRISPRs) have spacers of extrachromosomal origin. Microbiology 151,2551-2561 (2005).

8. F. J. Mojica, C. Diez-Villasenor, J. Garcia-Martinez, E. Soria, Intervening sequences of regularly spaced prokaryotic repeats derive from foreign genetic elements. Journal of molecular evolution 60, 174-182 (2005).

9. C. Pourcel, G. Salvignol, G. Vergnaud, CRISPR elements in Yersinia pestis acquire new repeats by preferential uptake of bacteriophage DNA, and provide additional tools for evolutionary studies. Microbiology 151, 653-663 (2005).

10. D. H. Haft, J. Selengut, E. F. Mongodin, K. E. Nelson, A guild of 45 CRISPR-associated (Cas) protein families and multiple CRISPR/Cas subtypes exist in prokaryotic genomes. PLoS computational biology 1, e60 (2005).

11. E. Deltcheva et al., CRISPR RNA maturation by trans-encoded small RNA and host factor RNase III. Nature 471,602-607 (2011).

12. F. A. Ran et al., Genome engineering using the CRISPR-Cas9 system. Nature protocols 8, 2281-2308 (2013).

13. P. Mali et al., RNA-guided human genome engineering via Cas9. Science 339, 823-826 (2013).

14. T. Gaj, C. A. Gersbach, C. F. Barbas, 3rd, ZFN, TALEN, and CRISPR/Cas-based methods for genome engineering. Trends Biotechnol 31,397-405 (2013).

15. S. W. Cho, S. Kim, J. M. Kim, J. S. Kim, Targeted genome engineering in human cells with the Cas9 RNA-guided endonuclease. Nat Biotechnol 31,230-232 (2013).

16. L. Cong et al., Multiplex genome engineering using CRISPR/Cas systems. Science 339, 819-823 (2013). 17. D. P. Dever et al., CRISPR/Cas9 beta-globin gene targeting in human haematopoietic stem cells. Nature, (2016).

18. P. Mali, K. M. Esvelt, G. M. Church, Cas9 as a versatile tool for engineering biology. Nature methods 10, 957 963 (2013).

19. O. Shalem et al., Genome-scale CRISPR-Cas9 knockout screening in human cells. Science 343, 84-87 (2014).

20. T. Wang, J. J. Wei, D. M. Sabatini, E. S. Lander, Genetic screens in human cells using the CRISPR-Cas9 system. Science 343, 80-84 (2014).

21. Y. Zhou et al., High-throughput screening of a CRISPR/Cas9 library for functional genomics in human cells. Nature, (2014).

22. C. Kuscu, S. Arslan, R. Singh, J. Thorpe, M. Adli, Genome-wide analysis reveals characteristics of off-target sites bound by the Cas9 endonuclease. Nat Biotechnol 32, 677-683 (2014).

23. P. Mali et al., CAS9 transcriptional activators for target specificity screening and paired nickases for cooperative genome engineering. Nat Biotechnol 31,833-838 (2013).

24. L. A. Gilbert et al., CRISPR-mediated modular RNA-guided regulation of transcription in eukaryotes. Cell 154, 442-451 (2013).

25. L. S. Qi et al., Repurposing CRISPR as an RNA-guided platform for sequence-specific control of gene expression. Cell 152, 1173-1183 (2013).

26. B. Chen et al., Dynamic imaging of genomic loci in living human cells by an optimized CRISPR/Cas system. Cell 155, 1479-1491 (2013).

27. A. W. Cheng et al., Multiplexed activation of endogenous genes by CRISPR-on, an RNA-guided transcriptional activator system. Cell research 23, 1163-1171 (2013).

28. F. Meitinger et al., 53BP1 and USP28 mediate p53 activation and G1 arrest after centrosome loss or extended mitotic duration. J Cell Biol 214, 155-166 (2016).

29. T. Wang et al., Identification and characterization of essential genes in the human genome. Science 350, 1096-1101 (2015).

30. T. Hart et al., High-Resolution CRISPR Screens Reveal Fitness Genes and Genotype-Specific Cancer Liabilities. Cell 163, 1515-1526 (2015).

31. J. G. Doench et al., Rational design of highly active sgRNAs for CRISPR-Cas9-mediated gene inactivation. Nat Biotechnol 32, 1262-1267 (2014).

32. J. G. Doench et al., Optimized sgRNA design to maximize activity and minimize off-target effects of CRISPR-Cas9. Nat Biotechnol, (2016).

33. R. Huang, P. Fang, B. K. Kay, Improvements to the Kunkel mutagenesis protocol for constructing primary and secondary phage-display libraries. Methods 58, 10-17 (2012).

34. T. A. Kunkel, Rapid and efficient site-specific mutagenesis without phenotypic selection. Proc Natl Acad Sci U S A 82, 488-492 (1985).

Claims

REIVINDICACIONES

1. Un método para generar un vector de expresión o biblioteca de vectores de ARN/ADN pequeño basado en ADN circularizado cerrado covalentemente (ccc), comprendiendo el método las etapas de

(a) Proporcionar un vector fagémido de hebra sencilla (hs) que comprende (i) al menos un casete de expresión de ARN/ADN pequeño que comprende un promotor de ARN/ADN y un sitio de introducción de secuencia de ARN/ADN pequeño diana vacío o una secuencia codificante de ARN/ADN pequeño y/o una secuencia diana de ADN/ARN nucleasa, o secuencia parcial de la misma, (ii) al menos un origen de replicación (ORI) de ADN de hebra sencilla tal como un ORI de fago, y en particular un origen f1, y

(b) Proporcionar al menos una especie de cebador de ARN o ADN mutagénico, en donde el cebador de ARN o ADN mutagénico tiene la siguiente estructura en dirección 3' a 5': una primera región de homología, una región de secuencia diana que codifica un ARN/ADN pequeño que se va a expresar, y una segunda región de homología, en donde la primera región de homología es complementaria a, o es capaz de reasociarse con, una secuencia de la construcción del vector fagémido hs que flanquea el sitio de introducción de secuencia de ARN/ADN pequeño diana vacío o la secuencia codificante de ARN/ADN pequeño, o una secuencia parcial de la misma, en el lado 5', y en donde la segunda región de homología es complementaria a, o es capaz de reasociarse con, una secuencia de la construcción del vector fagémido hs que flanquea el sitio de introducción de la secuencia de ARN/ADN pequeño diana vacío o la secuencia codificante de ARN/ADN pequeño, o una secuencia parcial de la misma, en el lado 3',

(d) Eliminar el ADN del vector fagémido de tipo salvaje residual.

2. El método según la reivindicación 1, en donde el ARN pequeño es un ARNip, un ARNhc, un anti-miR, un ARN guía (ARNg) o un ADN guía (ADNg) o cualquier otra secuencia de perturbación génica codificada por ARN/ADN.

3. El método de acuerdo con la reivindicación 2, en donde el ARN pequeño es un ARNg, y en donde la construcción del vector fagémido hs comprende adicionalmente una secuencia de expresión de ARN/ADN o nucleasa de edición del genoma en forma natural o manipulada, opcionalmente conectada operablemente a un promotor (estable o inducible).

4. El método según cualquiera de las reivindicaciones 1 a 3, en donde la al menos una especie de cebador de ADN mutagénico es al menos dos especies de cebador de ADN mutagénico, preferiblemente es al menos tres, más preferiblemente al menos 4, 5, 6, 10, 50, 100, 1000, 104, 105, 106, 107, 108, 109, 1010, 1011, o 1012, especies de cebador de ADN mutagénico, y en donde cada especie de ADNccc tiene una secuencia diferente en la secuencia codificante de ARN pequeño de elección.

5. El método según cualquiera de las reivindicaciones 1 a 4, en donde se proporciona una multitud de especies de cebadores de ADN mutagénicos introduciendo en la secuencia codificante de ARN pequeño de elección al menos una o más bases codificadas por la IUPAC (p. ej., N).

6. El método según una cualquiera de las reivindicaciones 1 a 5, en donde la secuencia codificante de ARN pequeño tiene una longitud de al menos 10 nucleótidos a 200 nucleótidos, más preferiblemente de 10 a 50, más preferiblemente de 10 a 30, más preferiblemente de 15 a 30, más preferiblemente de 15 a 25, lo más preferiblemente de 17 a 23, lo más preferiblemente aproximadamente 20.

7. El método según cualquiera de las reivindicaciones 1 a 6, en donde cada una de las regiones de homología tiene una longitud de al menos 5 nucleótidos, preferiblemente al menos 10 nucleótidos, más preferiblemente de 5 a 40 nucleótidos, lo más preferiblemente de 10 a 30 o de 10 a 20, lo más preferiblemente de 13 a 18, e incluso más preferiblemente aproximadamente 15 nucleótidos.

8. El método según cualquiera de las reivindicaciones anteriores, en donde el cebador de ADN mutagénico tiene una secuencia según cualquiera de SEQ ID NO: 1 a 12.

9. El método según una cualquiera de las reivindicaciones anteriores, comprendiendo el método las etapas de

(a) Proporcionar una construcción de vector fagémido de hebra sencilla (hs) que comprende al menos una base de uracilo; comprendiendo la construcción de vector de fagémido hs (i) al menos un casete de expresión de ARN/ADN pequeño que comprende un promotor de ARN/ADN y un sitio de introducción de secuencia de ARN/ADN pequeño diana vacío o una secuencia codificante de ARN/ADN pequeño y/o una secuencia diana de ARN/ADN nucleasa, o una secuencia parcial de la misma, (ii) al menos un origen de replicación (ORI) de ADN de hebra sencilla tal como un ORI de fago, y en particular un origen f1, y

(b) Proporcionar al menos una especie de cebador de ADN mutagénico, en donde el cebador de ADN mutagénico tiene la siguiente estructura en la dirección 3' a 5': una primera región de homología, una región de secuencia diana que codifica un ARN/ADN pequeño que se va a expresar, y una segunda región de homología, en donde la primera región de homología es complementaria a, o es capaz de reasociarse con una secuencia de la construcción del vector fagémido hs que flanquea el sitio de introducción de secuencia de ARN/ADN pequeño diana vacío o la secuencia codificante de ARN/ADN pequeño, o una secuencia parcial de la misma, en el lado 5', y en donde la segunda región de homología es complementaria a, o es capaz de reasociarse con, una secuencia de la construcción del vector fagémido hs que flanquea el sitio de introducción de la secuencia de ARN/ADN pequeño diana vacío o la secuencia codificante de ARN/ADN pequeño, o una secuencia parcial de la misma, en el lado 3',

(c) Reasociar al menos una especie de cebador de ADN mutagénico con la construcción del vector fagémido hs y amplificar un ADNdh heterodúplex circularizado cerrado (ccc) covalentemente a partir del mismo$,

(d) Reemplazar la hebra que contiene uracilo en el ADNdh heterodúplex ccc por una hebra de ADN complementaria que no contiene uracilo para obtener un vector de expresión o biblioteca de vectores de ARN/ADN pequeño basado en ADNccc.

10. El método según la reivindicación 9, en donde la construcción del vector fagémido de hebra sencilla (hs) se proporciona mediante

(aa) amplificación de un vector fagémido de ADNdh de la misma secuencia en una cepa bacteriana competente o con deficiencia de dUTPasa y/o uracil glicosilasa, y/o sus homólogos, parálogos u ortólogos, preferiblemente en la cepa CJ236, para obtener vectores fagémidos de ADNdh heterodúplex de tipo salvaje (que contienen timina) o que contienen uracilo y

(bb) generación de partículas de fago que comprenden un ADNhs de tipo salvaje o que contiene uracilo , y

(cc) purificación a partir de dichas partículas de fago de dicho ADNhs de tipo salvaje o que contiene uracilo para obtener la construcción de vector fagémido hs que comprende al menos una base de uracilo.

11. El método según la reivindicación 10, en donde la cepa bacteriana con deficiencia de dUTPasa y/o uracil glicosilasa, y/o sus homólogos, parálogos u ortólogos, preferiblemente en la cepa CJ236, comprende un fagémido auxiliar, o en donde en la etapa (bb) dicha cepa bacteriana con deficiencia de dUTPasa y/o uracil glicosilasa, y/o sus homólogos, parálogos u ortólogos, preferiblemente en la cepa CJ236 se infecta con un fago auxiliar, en donde el fagémido auxiliar o el fago auxiliar es preferentemente M13K07.

12. El método según cualquiera de las reivindicaciones 9 a 11, en donde la etapa (d) se realiza transformando y amplificando dicho ADNdh heterodúplex ccc en una bacteria que tiene una actividad funcional de dUTPasa y/o uracil glicosilasa, tal como XL1 o SS320, para obtener dicho ADN ccc.

13. El método según cualquiera de las reivindicaciones anteriores, en donde la amplificación de un ADNdh heterodúplex circularizado cerrado covalentemente (ccc) en la etapa (c) se realiza mediante el uso de una enzima que tiene actividad de ARN o ADN polimerasa, por ejemplo, una ADN polimerasa de T7, opcionalmente junto con una ARN o ADN ligasa , tal como ADN ligasa de T4.

14. Un kit para realizar el método según cualquiera de las reivindicaciones anteriores, comprendiendo el kit

(a) una construcción de vector fagémido que comprende

(ii) al menos un origen de replicación del fago, y

(b) una ADN polimerasa, opcionalmente una ADN ligasa;

(c) una preparación de células bacterianas que tienen una actividad funcional de dUTPasa y/o uracil glicosilasa,

(d) e instrucciones de uso;

en donde el kit incluye adicionalmente al menos uno o más Cebadores mutagénicos de ARN o ADN, en donde el cebador mutagénico de ARN o ADN tiene la siguiente estructura en dirección 3' a 5': una primera región de homología, una región de secuencia diana que codifica un ARN/ADN pequeño que se va a expresar, y una segunda región de homología, en donde la primera región de homología es complementaria a, o es capaz de reasociarse con, una secuencia de la construcción del vector fagémido hs que flanquea el sitio de introducción de secuencia de ARN/ADN pequeño diana vacío o la secuencia codificante de ARN/ADN pequeño, o una secuencia parcial de la misma, en el lado 5', y en donde la segunda región de homología es complementaria a, o es capaz de reasociarse con, una secuencia de la construcción del vector fagémido hs que flanquea el sitio de introducción de secuencia de ARN/ADN pequeño diana vacío o la secuencia codificante de ARN/ADN pequeño, o secuencia parcial de la misma, en el lado 3'.