EA040859B1 - METHOD FOR OBTAINING EUKARYOTIC CELLS WITH REDACTED DNA AND THE KIT USED IN THIS METHOD - Google Patents

METHOD FOR OBTAINING EUKARYOTIC CELLS WITH REDACTED DNA AND THE KIT USED IN THIS METHOD Download PDF

Info

Publication number
EA040859B1
EA040859B1 EA201992795 EA040859B1 EA 040859 B1 EA040859 B1 EA 040859B1 EA 201992795 EA201992795 EA 201992795 EA 040859 B1 EA040859 B1 EA 040859B1
Authority
EA
Eurasian Patent Office
Prior art keywords
cas3
crispr
sequence
dna
protein
Prior art date
Application number
EA201992795
Other languages
Russian (ru)
Inventor
Томодзи Масимо
Дзундзи ТАКЕДА
Хироюки Морисака
Кадзуто Йосими
Original Assignee
Осака Юниверсити
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Осака Юниверсити filed Critical Осака Юниверсити
Publication of EA040859B1 publication Critical patent/EA040859B1/en

Links

Description

Область техникиTechnical field

Настоящее изобретение относится к способу получения эукариотических клеток животных и растений с отредактированной ДНК и к набору, используемому в этом способе.The present invention relates to a method for obtaining DNA-edited eukaryotic animal and plant cells and to a kit used in this method.

Уровень техникиState of the art

Бактерии и архебактерии имеют адаптивные иммунные механизмы, которые специфически распознают и удаляют микроорганизмы, такие как чужеродные фаги, которые могут проникать из окружающей среды. Эти системы, называемые системами CRISPR-Cas, сначала вводят геномную информацию о чужеродных организмах в собственный геном (адаптация). Затем при повторном проникновении тех же самых чужеродных организмов эти системы расщепляют и удаляют чужеродные геномы с использованием дополнительной информации, поступаемой в собственный геном и в геномную последовательность (интерференция).Bacteria and archaebacteria have adaptive immune mechanisms that specifically recognize and eliminate microorganisms, such as foreign phages, that may enter from the environment. These systems, called CRISPR-Cas systems, first introduce genomic information about foreign organisms into their own genome (adaptation). Then, upon re-penetration of the same foreign organisms, these systems cleave and remove foreign genomes using additional information supplied to their own genome and genomic sequence (interference).

Недавно были разработаны методы редактирования генома (редактирования ДНК) с использованием вышеописанных систем CRISPR-Cas в качестве средств для редактирования ДНК (NPL 1).Recently, genome editing (DNA editing) techniques have been developed using the above-described CRISPR-Cas systems as DNA editing tools (NPL 1).

Системы CRISPR-Cas можно приблизительно подразделить на класс 1 и класс 2, где эффекторы, участвующие в процессе расщепления ДНК, состоят из множества Cas и одного Cas соответственно. Из этих систем широко известны системы CRISPR-Cas класса 1, а именно системы типа I, участвующие в образовании комплексов Cas3 и Cascade (обозначаемых комплексами Cascade-cr-РНК, и это относится к нижеследующим комплексам). Системы CRISPR-Cas класса 2 широко известны как системы типа II, включающие Cas9 (далее системы CRISPR-Cas класса 1 типа I и класса 2 типа II могут просто называться системами типа I и типа II соответственно). Кроме того, в стандартных методах редактирования ДНК широко используются системы CRISPR-Cas класса 2, включающие Cas9 (эти системы далее могут называться системами CRISPR-Cas9). Так, например, в NPL 1 описана система CRISPR-Cas класса 2, которая расщепляет ДНК посредством Cas9.CRISPR-Cas systems can be roughly classified into class 1 and class 2, where the effectors involved in the DNA cleavage process consist of many Cas and one Cas, respectively. Of these systems, class 1 CRISPR-Cas systems are widely known, namely type I systems involved in the formation of Cas3 and Cascade complexes (denoted as Cascade-cr-RNA complexes and this refers to the following complexes). Class 2 CRISPR-Cas systems are commonly known as Type II systems, including Cas9 (hereinafter, Class 1 Type I and Class 2 Type II CRISPR-Cas systems may simply be referred to as Type I and Type II systems, respectively). In addition, class 2 CRISPR-Cas systems, including Cas9, are widely used in standard DNA editing methods (these systems may be referred to as CRISPR-Cas9 systems hereinafter). For example, NPL 1 describes a class 2 CRISPR-Cas system that cleaves DNA via Cas9.

С другой стороны, что касается систем CRISPR-Cas класса 1, которые расщепляют ДНК посредством комплексов Cas3 и Cascade (которые далее могут также называться системами CRISPR-Cas3), то несмотря на ряд попыток, какого-либо успешного редактирования генома в эукариотических клетках не достигалось. Так, например, в NPL 1 и в NPL 3 сообщалось, что просто использование системы CRISPRCas3 может полностью разрушать ДНК-мишень в бесклеточной системе и селективно удалять специфические штаммы E. coli. Однако это не означает успешное редактирование генома, и вообще не было продемонстрировано в эукариотических клетках. Кроме того, в PTL 1 предлагается осуществлять редактирование генома с использованием нуклеазы FokI вместо Cas3 в эукариотических клетках (пример 7, фиг. 7 и 11), поскольку системы CRISPR-Cas3 разрушают ДНК-мишень в E. coli посредством геликазной активности и экзонуклеазной активности Cas3 (пример 5 и фиг. 6). Кроме того, в PTL 2 предлагается вносить делецию Cas3 и проводить повторную репрессию программируемого гена благодаря использованию инактивированного Cas3 (Cas3' и Cas3) (например, пример 15 и п.4(е)), поскольку системы CRISPR-Cas3 разрушают ДНК-мишень в E. coli (фиг. 4).On the other hand, with respect to class 1 CRISPR-Cas systems that cleave DNA via Cas3 and Cascade complexes (which may also be referred to as CRISPR-Cas3 systems in the following), despite a number of attempts, no successful genome editing has been achieved in eukaryotic cells. . Thus, for example, NPL 1 and NPL 3 reported that simply using the CRISPRCas3 system could completely disrupt target DNA in a cell-free system and selectively eliminate specific strains of E. coli. However, this does not imply successful genome editing, and has not been demonstrated in eukaryotic cells at all. In addition, PTL 1 proposes to perform genome editing using FokI nuclease instead of Cas3 in eukaryotic cells (Example 7, Figures 7 and 11), as CRISPR-Cas3 systems degrade target DNA in E. coli through helicase activity and exonuclease activity of Cas3 (Example 5 and Fig. 6). In addition, it is proposed to introduce deletion of Cas3 and re-repression of the programmable gene in PTL 2 by using inactivated Cas3 (Cas3' and Cas3) (e.g. E. coli (Fig. 4).

Список цитируемой литературыList of cited literature

Патентная литература.Patent Literature.

PTL 1. Опубликованный перевод японской международной заявки PCT No. 2015-503535.PTL 1. Published translation of Japanese International Application PCT No. 2015-503535.

PTL 2. Опубликованный перевод японской международной заявки PCT No. 2017-512481. Непатентная литература.PTL 2. Published Translation of Japanese International Application PCT No. 2017-512481. non-patent literature.

[NPL 1] Jinek М et al. (2012) A Programmable Dual-RNA Guided DNA Endonuclease in Adaptive Bacterial Immunity, Science, Vol. 337 (Issue 6096), pp. 816-821[NPL 1] Jinek M et al. (2012) A Programmable Dual-RNA Guided DNA Endonuclease in Adaptive Bacterial Immunity, Science, Vol. 337 (Issue 6096), pp. 816-821

[NPL 2] Mulepati S & Bailey S (2013) In Vitro Reconstitution of an Escherichia coli RNA-guided Immune System Reveals Unidirectional, ATP-dependent Degradation of DNA Target, Journal of Biological Chemistry, Vol. 288 (No. 31), pp. 22184-22192[NPL 2] Mulepati S & Bailey S (2013) In Vitro Reconstitution of an Escherichia coli RNA-guided Immune System Reveals Unidirectional, ATP-dependent Degradation of DNA Target, Journal of Biological Chemistry, Vol. 288 (No. 31), pp. 22184-22192

[NPL 3] Ahmed A. Gomaa et al. (2014) Programmable Reomoval of Bacterial Strains by[NPL 3] Ahmed A. Gomaa et al. (2014) Programmable Reomoval of Bacterial Strains by

Use of Genome Targeting CRISPR-Cas Systems, mbio.asm.org, Volume 5, Issue 1, e00928-13.Use of Genome Targeting CRISPR-Cas Systems, mbio.asm.org, Volume 5, Issue 1, e00928-13.

Сущность изобретенияThe essence of the invention

Техническая задача.Technical task.

Настоящее изобретение было разработано с учетом вышеупомянутых факторов, и его целью является создание системы CRISPR-Cas3 в эукариотических клетках.The present invention has been developed in view of the above factors, and its purpose is to create a CRISPR-Cas3 system in eukaryotic cells.

Решение задачи.The solution of the problem.

Авторами настоящего изобретения были проведены серьезные исследования для достижения вышеуказанной цели и, наконец, был достигнут успех в создании системы CRISPR-Cas3 в эукариотических клетках. Наиболее широко используемая система CRISPR-Cas9 позволяет успешно осуществлять редактирование генома в различных эукариотических клетках, но в этой системе в качестве cr-РНК обычно используют зрелую cr-РНК. Однако было неожиданно обнаружено, что в системах CRISPR-Cas3, редактирование генома в эукариотических клетках было затруднено в случае использования зрелой cr-РНК, и что эффективное редактирование генома было возможно только при использовании пре-cr-РНК, котораяThe inventors of the present invention have made serious studies to achieve the above goal, and finally, success has been achieved in creating the CRISPR-Cas3 system in eukaryotic cells. The most widely used CRISPR-Cas9 system allows successful genome editing in various eukaryotic cells, but this system usually uses mature cr-RNA as cr-RNA. However, it was surprisingly found that in CRISPR-Cas3 systems, genome editing in eukaryotic cells was difficult when mature crRNA was used, and that efficient genome editing was only possible using pre-crRNA, which

- 1 040859 обычно не используется как составной элемент системы. То есть для того чтобы сделать системы CRISPR-Cas3 функциональными в эукариотических клетках, было важно понять механизм расщепления cr-РНК белками, составляющими Cascade. Системы CRISPR-Cas3, использующие эту pre-cr-РНК, широко применялись не только к системе типа I-E, но также к системам типа I-F и типа I-G. Кроме того, присоединение сигнала локализации в ядре, а в частности, двухкомпонентного сигнала локализации в ядре, к Cas3, позволило дополнительно повысить эффективность редактирования генома для систем CRISPRCas3 в эукариотических клетках. Кроме того, авторами настоящего изобретения было обнаружено, что системы CRISPR-Cas3, в отличие от систем CRISPR-Cas9, могут давать крупную делецию в области, содержащей последовательность РАМ, или в вышерасположенной области. На основании этих результатов было создано настоящее изобретение.- 1 040859 is not normally used as part of the system. That is, in order to make the CRISPR-Cas3 systems functional in eukaryotic cells, it was important to understand the mechanism of cr-RNA cleavage by the proteins that make up Cascade. CRISPR-Cas3 systems using this pre-cr-RNA have been widely applied not only to the I-E type system, but also to the I-F and I-G type systems. In addition, the attachment of a nuclear localization signal, and in particular a two-component nuclear localization signal, to Cas3 further improved the efficiency of genome editing for CRISPRCas3 systems in eukaryotic cells. In addition, the authors of the present invention have found that CRISPR-Cas3 systems, in contrast to CRISPR-Cas9 systems, can give a large deletion in the region containing the PAM sequence or in the upstream region. Based on these results, the present invention was made.

В частности, настоящее изобретение относится к системе CRISPR-Cas3 в эукариотических клетках, а более конкретно к нижеследующим предметам изобретения.In particular, the present invention relates to the CRISPR-Cas3 system in eukaryotic cells, and more particularly to the following subjects of the invention.

1. Способ получения эукариотической клетки с отредактированной ДНК, включающий введение системы CRISPR-Cas3 в эукариотическую клетку, где система CRISPR-Cas3 включает следующие (А)(С):1. A method for producing a DNA-edited eukaryotic cell, comprising introducing a CRISPR-Cas3 system into a eukaryotic cell, wherein the CRISPR-Cas3 system includes the following (A)(C):

A) белок Cas3, полинуклеотид, кодирующий этот белок, или экспрессионный вектор, содержащий этот полинуклеотид,A) Cas3 protein, a polynucleotide encoding this protein, or an expression vector containing this polynucleotide,

B) белок Cascade, полинуклеотид, кодирующий этот белок, или экспрессионный вектор, содержащий этот полинуклеотид, иB) the Cascade protein, a polynucleotide encoding this protein, or an expression vector containing this polynucleotide, and

B) cr-РНК, полинуклеотид, кодирующий cr-РНК, или экспрессионный вектор, содержащий этот полинуклеотид.B) cr-RNA, a polynucleotide encoding cr-RNA, or an expression vector containing this polynucleotide.

2. Способ получения животного (за исключением человека) или растения с отредактированной ДНК, включающий: введение системы CRISPR-Cas3 животному (за исключением человека) или в растение, где система CRISPR-Cas3 включает следующее (А)-(С):2. A method for producing an animal (excluding humans) or plants with edited DNA, comprising: introducing the CRISPR-Cas3 system into an animal (excluding humans) or into a plant, where the CRISPR-Cas3 system includes the following (A)-(C):

A) белок Cas3, полинуклеотид, кодирующий этот белок, или экспрессионный вектор, содержащий этот полинуклеотид,A) Cas3 protein, a polynucleotide encoding this protein, or an expression vector containing this polynucleotide,

B) белок Cascade, полинуклеотид, кодирующий этот белок, или экспрессионный вектор, содержащий этот полинуклеотид, иB) the Cascade protein, a polynucleotide encoding this protein, or an expression vector containing this polynucleotide, and

C) cr-РНК, полинуклеотид, кодирующий cr-РНК, или экспрессионный вектор, содержащий этот полинуклеотид.C) cr-RNA, a polynucleotide encoding cr-RNA, or an expression vector containing this polynucleotide.

3. Способ в соответствии с п.1 или 2, дополнительно включающий расщепление cr-РНК белком, составляющим белок Cascade, после введения системы CRISPR-Cas3 в эукариотическую клетку.3. The method according to claim 1 or 2, further comprising cleaving the crRNA with the protein constituting the Cascade protein after introducing the CRISPR-Cas3 system into the eukaryotic cell.

4. Способ в соответствии с п.1 или 2, где cr-РНК представляет собой pre-cr-РНК.4. The method according to claim 1 or 2, wherein the crRNA is pre-crRNA.

5. Способ в соответствии с любым из пп.1-4, где сигнал локализации в ядре присоединяют к белку Cas3 и/или к белку Cascade.5. A method according to any one of claims 1 to 4, wherein the nuclear localization signal is attached to the Cas3 protein and/or the Cascade protein.

6. Способ в соответствии с п.5, где сигнал локализации в ядре представляет собой двухкомпонентный сигнал локализации в ядре.6. The method according to claim 5, wherein the nuclear localization signal is a two-component nuclear localization signal.

7. Набор для его применения в способе в соответствии с любым из пп.1-6, где набор включает следующие А) и В):7. A kit for its use in a method according to any one of claims 1 to 6, where the kit includes the following A) and B):

А) белок Cas3, полинуклеотид, кодирующий этот белок, или экспрессионный вектор, содержащий этот полинуклеотид,A) Cas3 protein, a polynucleotide encoding this protein, or an expression vector containing this polynucleotide,

В) белок Cascade, полинуклеотид, кодирующий этот белок, или экспрессионный вектор, содержащий этот полинуклеотид.C) Cascade protein, a polynucleotide encoding this protein, or an expression vector containing this polynucleotide.

8. Набор в соответствии с п.7, дополнительно содержащий cr-РНК, полинуклеотид, кодирующий crРНК или экспрессионный вектор, содержащий этот полинуклеотид.8. A kit according to claim 7, further comprising a crRNA, a polynucleotide encoding a crRNA, or an expression vector containing the polynucleotide.

9. Набор в соответствии с п.8, где cr-РНК представляет собой pre-cr-РНК.9. A kit according to claim 8, wherein the crRNA is pre-crRNA.

10. Набор в соответствии с любым из пп.7-9, где сигнал локализации в ядре присоединяют к белку Cas3 и/или к белку Cascade.10. A kit according to any one of claims 7 to 9, wherein the nuclear localization signal is attached to the Cas3 protein and/or the Cascade protein.

11. Набор в соответствии с п.10, где сигнал локализации в ядре представляет собой двухкомпонентный сигнал локализации в ядре.11. The set according to claim 10, wherein the nuclear localization signal is a two-component nuclear localization signal.

Следует отметить, что в настоящем описании термин полинуклеотид означает полимер, состоящий из нуклеотидов, и этот термин используется здесь как синоним термина ген, нуклеиновая кислота или молекула нуклеиновой кислоты. Полинуклеотид может также присутствовать в форме ДНК (например, к ДНК или геномной ДНК) или в форме РНК (например, мРНК). Используемый здесь термин белок также является синонимом термина пептид или полипептид.It should be noted that in the present description, the term polynucleotide means a polymer consisting of nucleotides, and this term is used here as a synonym for the term gene, nucleic acid or nucleic acid molecule. The polynucleotide may also be present in DNA form (eg cDNA or genomic DNA) or RNA form (eg mRNA). As used herein, the term protein is also synonymous with the term peptide or polypeptide.

Преимущественные эффекты изобретенияAdvantageous Effects of the Invention

Использование системы CRISPR-Cas3 согласно изобретению позволяет осуществлять редактирование ДНК в эукариотических клетках.The use of the CRISPR-Cas3 system according to the invention allows DNA editing in eukaryotic cells.

Краткое описание фигурBrief description of the figures

На фиг. 1 представлены результаты анализа SSA для измерения активности расщепления экзогенной ДНК.In FIG. 1 shows the results of the SSA assay to measure exogenous DNA cleavage activity.

На фиг. 2 схематически представлена диаграмма, иллюстрирующая положение последовательно- 2 040859 сти-мишени в гене CCR5.In FIG. 2 is a schematic diagram illustrating the position of the target sequence in the CCR5 gene.

На фиг. ЗА представлена диаграмма, иллюстрирующая ген CCR5 (клон 1), в котором часть последовательности нуклеиновой кислоты была делетирована с использованием системы CRISPR-Cas3.In FIG. 3A is a diagram illustrating the CCR5 gene (clone 1) in which a portion of the nucleic acid sequence has been deleted using the CRISPR-Cas3 system.

На фиг. 3В представлена диаграмма, иллюстрирующая ген CCR5 (клон 2), в котором часть последовательности нуклеиновой кислоты была делетирована с использованием системы CRISPR-Cas3.In FIG. 3B is a diagram illustrating the CCR5 gene (clone 2) in which a portion of the nucleic acid sequence was deleted using the CRISPR-Cas3 system.

На фиг. 3С представлена диаграмма, иллюстрирующая ген CCR5 (клон 3), в котором часть последовательности нуклеиновой кислоты была делетирована с использованием системы CRISPR-Cas3.In FIG. 3C is a diagram illustrating the CCR5 gene (clone 3) in which a portion of the nucleic acid sequence was deleted using the CRISPR-Cas3 system.

На фиг. 3D представлена диаграмма, иллюстрирующая ген CCR5 (клон 4), в котором часть последовательности нуклеиновой кислоты была делетирована с использованием системы CRISPR-Cas3.In FIG. 3D is a diagram illustrating the CCR5 gene (clone 4) in which a portion of the nucleic acid sequence was deleted using the CRISPR-Cas3 system.

На фиг. 4(а) схематически представлена диаграмма, иллюстрирующая структуру плазмиды Cascade.In FIG. 4(a) is a schematic diagram illustrating the structure of the Cascade plasmid.

На фиг. 4(b) схематически представлена диаграмма, иллюстрирующая структуру плазмиды Cas3.In FIG. 4(b) is a schematic diagram illustrating the structure of the Cas3 plasmid.

На фиг. 4(с) схематически представлена диаграмма, иллюстрирующая структуру плазмиды pre-crРНК.In FIG. 4(c) is a schematic diagram illustrating the structure of the pre-crRNA plasmid.

На фиг. 4(d) схематически представлена диаграмма, иллюстрирующая структуру репортерного вектора (включающего последовательность-мишень).In FIG. 4(d) is a schematic diagram illustrating the structure of a reporter vector (including the target sequence).

На фиг. 5 схематически представлена диаграмма, иллюстрирующая положение последовательности-мишени в гене EMX1.In FIG. 5 is a schematic diagram illustrating the position of the target sequence in the EMX1 gene.

На фиг. 6А представлена диаграмма, иллюстрирующая ген EMX1 (клон 1), делетированный в части последовательности нуклеиновой кислоты посредством системы CRISPR-Cas3.In FIG. 6A is a diagram illustrating the EMX1 gene (clone 1) deleted in part of the nucleic acid sequence by the CRISPR-Cas3 system.

На фиг. 6В представлена диаграмма, иллюстрирующая ген EMX1 (клон 2), делетированный в части последовательности нуклеиновой кислоты посредством системы CRISPR-Cas3.In FIG. 6B is a diagram illustrating the EMX1 gene (clone 2) deleted in part of the nucleic acid sequence by the CRISPR-Cas3 system.

На фиг. 7 схематически представлена диаграмма, иллюстрирующая структуру плазмиды Cas3/Cascade, присоединенной к bpNLS.In FIG. 7 is a schematic diagram illustrating the structure of the Cas3/Cascade plasmid attached to bpNLS.

На фиг. 8 схематически представлена диаграмма, иллюстрирующая структуру плазмиды Cascade (2A).In FIG. 8 is a schematic diagram illustrating the structure of the plasmid Cascade (2A).

На фиг. 9 представлены результаты анализа SSA для измерения активности расщепления экзогенной ДНК.In FIG. 9 shows the results of the SSA assay to measure exogenous DNA cleavage activity.

На фиг. 10А представлена диаграмма, иллюстрирующая структуры рге-cr-РНК (LRSR и RSR) и зрелой cr-РНК, используемой в примерах. На этой фигуре 5'-фланкирующая последовательность (фланкирующая последовательность Cas5) подчеркнута, а 3'-фланкирующая последовательность (фланкирующая последовательность Cas3) показана двойным подчеркиванием.In FIG. 10A is a diagram illustrating the structures of pro-crRNA (LRSR and RSR) and mature crRNA used in the examples. In this figure, the 5' flanking sequence (Cas5 flanking sequence) is underlined and the 3' flanking sequence (Cas3 flanking sequence) is shown with a double underline.

На фиг. 10В представлена диаграмма, иллюстрирующая результаты анализа SSA с использованием пре-cr-РНК (LRSR и RSR) и зрелой cr-РНК.In FIG. 10B is a diagram illustrating the results of SSA analysis using pre-crRNA (LRSR and RSR) and mature crRNA.

На фиг. 11 показаны результаты анализа SSA с использованием одного NLS или двух NLS (bpNLS) в плазмиде для экспрессии гена Cas3/Cascade.In FIG. 11 shows the results of SSA analysis using one NLS or two NLSs (bpNLS) in a Cas3/Cascade gene expression plasmid.

На фиг. 12 представлена диаграмма, иллюстрирующая влияние последовательности РАМ на активность расщепления ДНК системой CRISPR-Cas3.In FIG. 12 is a diagram illustrating the effect of the PAM sequence on DNA cleavage activity by the CRISPR-Cas3 system.

На фиг. 13 представлена диаграмма, иллюстрирующая влияние одного ошибочного спаривания спейсера на активность расщепления ДНК системой CRISPR-Cas3.In FIG. 13 is a diagram illustrating the effect of a single spacer mismatch on DNA cleavage activity by the CRISPR-Cas3 system.

На фиг. 14 представлена диаграмма, иллюстрирующая эффекты мутации Cas3 в нуклеазном домене HD (H74A), в мотиве 1 домена геликазы SF2 (K320A) и в мотиве 3 (S483/T485A).In FIG. 14 is a diagram illustrating the effects of a Cas3 mutation in the HD nuclease domain (H74A), in SF2 helicase domain motif 1 (K320A), and in motif 3 (S483/T485A).

На фиг. 15 показано сравнение активности расщепления ДНК системами типа I-Е, типа I-F и типа IG CRISPR-Cas3.In FIG. 15 shows a comparison of the DNA cleavage activity of type I-E, type I-F, and type IG CRISPR-Cas3 systems.

На фиг. 16 представлена диаграмма, иллюстрирующая величину делеции, вносимой системой CRISPR-Cas3, детектируемой путем секвенирования образца ПНР-продукта для клонирования TA.In FIG. 16 is a graph illustrating the amount of deletion introduced by the CRISPR-Cas3 system detected by sequencing a sample of the TA cloning NRP product.

На фиг. 17 представлена диаграмма, иллюстрирующая положение делеции, вносимой системой CRISPR-Cas3, детектируемой путем крупномасштабной обработки в процессе секвенирования клона ТА (n=49).In FIG. 17 is a diagram illustrating the position of the deletion introduced by the CRISPR-Cas3 system detected by large-scale processing in the TA clone sequencing process (n=49).

На фиг. 18А представлена диаграмма, где показано число для каждого размера делеции, детектируемой системой CRISPR-Cas3 с использованием последовательности для захвата на основе микромассивов размером 1000 т.п.о. или более, вокруг локуса-мишени EMX1.In FIG. 18A is a graph showing the number for each deletion size detected by the CRISPR-Cas3 system using a capture sequence based on 1000 kb microarrays. or more, around the EMX1 target locus.

На фиг. 18В представлена диаграмма, где показано число для каждого размера делеции, детектируемой системой CRISPR-Cas3 с использованием последовательности для захвата на основе микромассивов размером 1000 т.п.о. или более, вокруг локуса-мишени CCR5.In FIG. 18B is a graph showing the number for each deletion size detected by the CRISPR-Cas3 system using a capture sequence based on 1000 kb microarrays. or more, around the CCR5 target locus.

Описание вариантов осуществления изобретенияDescription of embodiments of the invention

1. Способ получения эукариотических клеток, животных и растений с отредактированной ДНК.1. Method for obtaining eukaryotic cells, animals and plants with edited DNA.

Способ согласно изобретению включает введение системы CRISPR-Cas3 в эукариотическую клетку, где система CRISPR-Cas3 включает следующие А)-С).The method according to the invention includes the introduction of the CRISPR-Cas3 system into a eukaryotic cell, where the CRISPR-Cas3 system includes the following A)-C).

A) белок Cas3, полинуклеотид, кодирующий этот белок, или экспрессионный вектор, содержащий этот полинуклеотид,A) Cas3 protein, a polynucleotide encoding this protein, or an expression vector containing this polynucleotide,

B) белок Cascade, полинуклеотид, кодирующий этот белок, или экспрессионный вектор, содержащий этот полинуклеотид, иB) the Cascade protein, a polynucleotide encoding this protein, or an expression vector containing this polynucleotide, and

- 3 040859- 3 040859

C) cr-РНК, полинуклеотид, кодирующий cr-РНК, или экспрессионный вектор, содержащий этот полинуклеотид.C) cr-RNA, a polynucleotide encoding cr-RNA, or an expression vector containing this polynucleotide.

Системы CRISPR-Cas класса 1 подразделяются на тип I и тип III, и в зависимости от типа белков, составляющих Cascade (далее называемых просто Cascade или белками Cascade), тип I дополнительно подразделяется на шесть типов: тип I-A, тип I-B, тип I-C, тип I-D, тип I-Е и тип I-F, а также типа I-G, подтип типа I-B (см., например, van der Oost J. et al. (2014) Unravelling the structural and mechanistic basis of CRISPR-Cas systems, Nature Reviews Microbiologym, Vol. 12 (No. 7), pp. 479-492 и Jackson R.N. et al. (2014) Fitting CRISPR-associated Cas3 into the Helicase Family Tree, Current Opinion in Structural Biology, Vol. 24, pp. 106-114).Class 1 CRISPR-Cas systems are subdivided into type I and type III, and depending on the type of proteins that make up the Cascade (hereinafter referred to simply as Cascade or Cascade proteins), type I is further subdivided into six types: type I-A, type I-B, type I-C, type I-D, type I-E, and type I-F, and type I-G, a subtype of type I-B (see, e.g., van der Oost J. et al. (2014) Unraveling the structural and mechanistic basis of CRISPR-Cas systems, Nature Reviews Microbiologym, Vol. 12 (No. 7), pp. 479-492 and Jackson R. N. et al. (2014) Fitting CRISPR-associated Cas3 into the Helicase Family Tree, Current Opinion in Structural Biology, Vol. 24, pp. 106- 114).

Системы CRISPR-Cas типа I выполняют функцию расщепления ДНК посредством совместного действия Cas3 (белка, обладающего нуклеазной активностью и геликазной активностью), Cascade и crРНК. В настоящем изобретении они упоминаются как система CRISPR-Cas3, поскольку Cas3 используется в качестве нуклеазы.Type I CRISPR-Cas systems perform the function of DNA cleavage through the combined action of Cas3 (a protein with nuclease activity and helicase activity), Cascade, and crRNA. In the present invention, they are referred to as the CRISPR-Cas3 system because Cas3 is used as the nuclease.

Использование системы CRISPR-Cas3 согласно изобретению позволяет получить, например, следующие преимущества.The use of the CRISPR-Cas3 system according to the invention provides, for example, the following advantages.

Во-первых, cr-РНК, используемая в системе CRISPR-Cas3, обычно распознает последовательностьмишень размером 32-37 оснований (Ming Li et al., Nucleic Acids Res. 2017 May 5; 45(8): 4642-4654). С другой стороны, cr-РНК, используемая в системе CRISPR-Cas9, обычно распознает последовательностьмишень размером 18-24 оснований. Следовательно, считается, что система CRISPR-Cas3 может распознавать последовательности-мишени более точно, чем система CRISPR-Cas9.First, the crRNA used in the CRISPR-Cas3 system typically recognizes a 32-37 base target sequence (Ming Li et al., Nucleic Acids Res. 2017 May 5; 45(8): 4642-4654). On the other hand, the crRNA used in the CRISPR-Cas9 system usually recognizes a target sequence of 18-24 bases. Therefore, it is believed that the CRISPR-Cas3 system can recognize target sequences more accurately than the CRISPR-Cas9 system.

Кроме того, последовательность PAM системы класса 2 типа II системы CRISPR-Cas9 представляет собой NGG (N означает произвольно выбранное основание), смежную с 3'-стороной последовательности-мишени. Кроме того, последовательность PAM системы класса 2 типа V системы CRISPR-Cpf1 представляет собой AA, смежную с 5'-стороной последовательности-мишени. С другой стороны, последовательность PAM системы CRISPR-Cas3 согласно изобретению представляет собой AAG, смежную с 5'-стороной последовательности-мишени или последовательности нуклеиновой кислоты, подобной этой последовательности (например, AGG, GAG, TAC, ATG, TAG и т.п.) (фиг. 12). Таким образом, считается, что с использованием системы CRISPR-Cas3 согласно изобретению области, которые не могут распознаваться обычными способами, могут быть подвергнуты редактированию ДНК.In addition, the PAM sequence of the class 2 type II system of the CRISPR-Cas9 system is NGG (N is an arbitrary base) adjacent to the 3' side of the target sequence. In addition, the PAM sequence of the class 2 type V system of the CRISPR-Cpf1 system is AA adjacent to the 5' side of the target sequence. On the other hand, the PAM sequence of the CRISPR-Cas3 system according to the invention is an AAG adjacent to the 5' side of the target sequence or a nucleic acid sequence similar to this sequence (e.g., AGG, GAG, TAC, ATG, TAG, etc. ) (Fig. 12). Thus, it is believed that using the CRISPR-Cas3 system according to the invention, regions that cannot be recognized by conventional methods can be subjected to DNA editing.

Кроме того, в отличие от вышеупомянутых систем CRISPR-Cas класса 2, система CRISPR-Cas3 расщепляет ДНК во многих положениях. Следовательно, использование системы CRISPR-Cas3 согласно изобретению позволяет получить делеционные мутации широкого спектра в интервале от ста до нескольких тысяч оснований и возможно даже более (фиг. 3, 6 и 16-18). Считается, что эту функцию можно использовать для нокаута длинной геномной области или для нокина длинной ДНК. При осуществлении нокина обычно используется донорная ДНК, и эта донорная ДНК также представляет собой молекулу, составляющую систему CRISPR-Cas3 согласно изобретению.In addition, unlike the aforementioned class 2 CRISPR-Cas systems, the CRISPR-Cas3 system cleaves DNA at many positions. Therefore, the use of the CRISPR-Cas3 system according to the invention makes it possible to obtain broad spectrum deletion mutations ranging from one hundred to several thousand bases and possibly even more (FIGS. 3, 6 and 16-18). It is believed that this function can be used to knock out a long genomic region or to knock out a long DNA. Donor DNA is typically used in the implementation of knockin, and this donor DNA is also the molecule constituting the CRISPR-Cas3 system of the invention.

Следует отметить, что если в описании изобретения приводится просто обозначение Cas3, то это означает белок Cas3. To же самое относится и к белкам Cascade.It should be noted that if in the description of the invention the designation Cas3 is given simply, then this means the Cas3 protein. The same applies to the Cascade proteins.

Система CRISPR-Cas3 согласно изобретению включает все шесть подтипов типа I. То есть хотя белки, составляющие систему CRISPR-Cas3, могут незначительно отличаться по структуре и т.п. в зависимости от подтипа (например, белки, составляющие Cascade, отличаются друг от друга), однако настоящее изобретение включает все эти белки. Действительно, в настоящем примере было обнаружено, что редактирование генома возможно не только для систем типа I-Е, но также для систем типа I-G и типа I-F (фиг. 15).The CRISPR-Cas3 system of the invention includes all six type I subtypes. depending on the subtype (for example, the proteins that make up Cascade differ from each other), but the present invention includes all of these proteins. Indeed, in the present example, genome editing was found to be possible not only for type I-E systems, but also for type I-G and type I-F systems (FIG. 15).

Система CRISPR-Cas3 типа I-Е, которая является самой распространенной среди систем CRISPRCas3 типа I, расщепляет ДНК, если cr-РНК взаимодействует с Cas3 и Cascade (Cse1 (Cas8), Cse2 (Cas11), Cas5, Cas6 и Cas7).The type I-E CRISPR-Cas3 system, which is the most common of the type I CRISPRCas3 systems, cleaves DNA if crRNA interacts with Cas3 and Cascade (Cse1 (Cas8), Cse2 (Cas11), Cas5, Cas6 and Cas7).

Система типа I-A имеет составные элементы Cascade Cas8a1, Csa5 (Cas11), Cas5, Cas6 и Cas7, тип IB имеет составные элементы Cascade Cas8b1, Cas5, Cas6 и Cas7, тип I-C имеет составные элементы Cascade Cas8c, Cas5 и Cas7, тип I-D имеет составные элементы Cascade Cas10d, Csc1 (Cas5), Cas6 и Csc2 (Cas7), тип I-F имеет составные элементы Cascade Csy1 (Cas8f), Csy2 (Cas5), Cas6 и Csy3 (Cas7), а система типа I-G имеет составные элементы Cascade Cst1 (Cas8a1), Cas5, Cas6 и Cst2 (Cas7). В настоящем изобретении Cas3 и Cascade называется общим термином группа белков Cas.Type I-A system has Cascade components Cas8a1, Csa5 (Cas11), Cas5, Cas6 and Cas7, Type IB has Cascade components Cas8b1, Cas5, Cas6 and Cas7, Type I-C has Cascade components Cas8c, Cas5 and Cas7, Type I-D has Cascade elements Cas10d, Csc1 (Cas5), Cas6 and Csc2 (Cas7), Type I-F has Cascade elements Csy1 (Cas8f), Csy2 (Cas5), Cas6 and Csy3 (Cas7), and Type I-G system has Cascade elements Cst1 (Cas8a1 ), Cas5, Cas6 and Cst2 (Cas7). In the present invention, Cas3 and Cascade are collectively referred to as a group of Cas proteins.

Далее система CRISPR-Cas3 типа I-Е описана в качестве репрезентативного примера. Для систем CRISPR-Cas3 других типов Cascade, составляющий эти системы, может быть интерпретирован соответствующим образом.In the following, the CRISPR-Cas3 type I-E system is described as a representative example. For other types of CRISPR-Cas3 systems, the Cascade constituting those systems can be interpreted accordingly.

Группа белков Cas.Cas protein group.

В системе CRISPR-Cas3 согласно изобретению группа белков Cas может быть введена в эукариотические клетки в форме белка, в форме полинуклеотида, кодирующего белок, или в форме экспрессионного вектора, содержащего полинуклеотид. Если группа белков Cas вводится в эукариотические клетки в форме белка, то можно получить соответствующее количество и т.п. каждого белка, что является превосходным с точки зрения обработки. Кроме того, принимая во внимание, например, эффективностьIn the CRISPR-Cas3 system of the invention, the Cas group of proteins can be introduced into eukaryotic cells in the form of a protein, in the form of a polynucleotide encoding the protein, or in the form of an expression vector containing the polynucleotide. If a group of Cas proteins is introduced into eukaryotic cells in the form of a protein, an appropriate amount can be obtained, and the like. of each protein, which is excellent in terms of processing. In addition, taking into account, for example, the efficiency

- 4 040859 расщепления в клетках, можно также сначала получить комплекс группы белков Cas, а затем ввести его в эукариотические клетки.- 4 040859 cleavage in cells, it is also possible to first obtain a complex of the Cas protein group and then introduce it into eukaryotic cells.

В настоящем изобретении предпочтительно присоединить сигнал локализации в ядре к группе белков Cas. Сигнал локализации в ядре может быть присоединен к N-концевой стороне и/или к С-концевой стороне группы белков Cas (к 5'-концевой стороне и/или к 3'-концевой стороне полинуклеотида, кодирующего каждую группу белков Cas). Таким образом, присоединение сигнала локализации в ядре к группе белков Cas стимулирует локализацию в ядре клетки, что, в результате, позволяет эффективно осуществлять редактирование ДНК.In the present invention, it is preferable to attach a nuclear localization signal to a group of Cas proteins. The nuclear localization signal may be attached to the N-terminal side and/or the C-terminal side of the Cas protein group (to the 5' end and/or to the 3' end of the polynucleotide encoding each Cas protein group). Thus, the addition of a nuclear localization signal to a group of Cas proteins stimulates nuclear localization, which, as a result, allows efficient DNA editing.

Вышеописанный сигнал локализации в ядре представляет собой пептидную последовательность, состоящую из нескольких основных аминокислот до нескольких десятков основных аминокислот, и такая последовательность не имеет конкретных ограничений при условии, что белки будут перенесены в ядро. Конкретный пример такого сигнала локализации в ядре описан, например, в литературе [Wu J. et al. (2009) The Intracellular Mobility of Nuclear Import Receptors and NLS Cargoes, Biophysical journal, Vol. 96 (Issue 9), pp. 3840-3849]. В настоящем изобретении может быть использован любой сигнал локализации в ядре, обычно применяемый в данной области техники.The above-described nuclear localization signal is a peptide sequence consisting of several basic amino acids to several tens of basic amino acids, and such a sequence is not particularly limited as long as the proteins are transferred to the nucleus. A specific example of such a nuclear localization signal is described, for example, in the literature [Wu J. et al. (2009) The Intracellular Mobility of Nuclear Import Receptors and NLS Cargoes, Biophysical journal, Vol. 96 (Issue 9), pp. 3840-3849]. Any nuclear localization signal commonly used in the art can be used in the present invention.

Сигнал локализации в ядре может представлять собой, например, PKKKRKV (SEQID NO. 52) (кодируется последовательностью нуклеиновой кислоты CCCAAGAAGAAGCGGAAGGTG (SEQ ГО NO: 53)).The nuclear localization signal may be, for example, PKKKRKV (SEQID NO. 52) (encoded by the nucleic acid sequence CCCAAGAAGAAGCGGAAGGTG (SEQ ID NO: 53)).

Если используется вышеуказанный сигнал локализации в ядре, то предпочтительно, чтобы он представлял собой, например, полинуклеотид, состоящий из последовательности нуклеиновой кислоты с SEQ ID NO: 53 на 5'-концевой стороне полинуклеотида, кодирующего каждую группу белков Cas. Кроме того, сигналом локализации в ядре может быть, например, KRTADGSEFESPKKKRKVE (SEQ ID NO: 54) (кодируемый последовательностью нуклеиновой кислоты AAGCGGACTGCTGATGGCAGTGAATTTGAGTCCCCAAAGAAGAAGAGAAAGGTGG АА (SEQ ГО NO: 55)If the above nuclear localization signal is used, it is preferably, for example, a polynucleotide consisting of the nucleic acid sequence of SEQ ID NO: 53 at the 5' end of the polynucleotide encoding each group of Cas proteins. In addition, the nuclear localization signal may be, for example, KRTADGSEFESPKKKRKVE (SEQ ID NO: 54) (encoded by the nucleic acid sequence AAGCGGACTGCTGATGGCAGTGAATTTGAGTCCCCAAAGAAGAAGAGAAAGGTGG AA (SEQ GO NO: 55)

Если используется вышеуказанный сигнал локализации в ядре, то предпочтительно, чтобы он представлял собой, например, полинуклеотиды, состоящие из последовательностей нуклеиновой кислоты с SEQ ID NO: 55, на обеих сторонах полинуклеотида, кодирующего каждую группу белков Cas (в частности, для использования двукомпонентного сигнала локализации в ядре (bpNLS)).If the above nuclear localization signal is used, it is preferred that it be, for example, polynucleotides consisting of the nucleic acid sequences of SEQ ID NO: 55 on both sides of the polynucleotide encoding each group of Cas proteins (particularly to use a two-component signal kernel localization (bpNLS)).

Такие модификации играют важную роль в экспрессии системы CRISPR-Cas3 согласно изобретению и в ее эффективном функционировании в эукариотических клетках вместе с использованием пре-crРНК, описанных ниже.Such modifications play an important role in the expression of the CRISPR-Cas3 system of the invention and in its efficient functioning in eukaryotic cells, together with the use of the pre-crRNAs described below.

Один предпочтительный вариант группы белков Cas, используемой в настоящем изобретении, представлен ниже.One preferred embodiment of the Cas protein group used in the present invention is shown below.

Cas3; белок, кодируемый полинуклеотидом, состоящим из последовательности нуклеиновой кислоты, представленной SEQ ID NO: 1 или SEQ ID NO: 7;Cas3; a protein encoded by a polynucleotide consisting of the nucleic acid sequence represented by SEQ ID NO: 1 or SEQ ID NO: 7;

Cse1 (Cas8); белок, кодируемый полинуклеотидом, состоящим из последовательности нуклеиновой кислоты, представленной SEQ ID NO: 2 или SEQ ID NO: 8;Cse1 (Cas8); a protein encoded by a polynucleotide consisting of the nucleic acid sequence represented by SEQ ID NO: 2 or SEQ ID NO: 8;

Cse2 (Cas11); белок, кодируемый полинуклеотидом, состоящим из последовательности нуклеиновой кислоты, представленной SEQ ID NO: 3 или SEQ ID NO: 9;Cse2 (Cas11); a protein encoded by a polynucleotide consisting of the nucleic acid sequence represented by SEQ ID NO: 3 or SEQ ID NO: 9;

Cas5; белок, кодируемый полинуклеотидом, состоящим из последовательности нуклеиновой кислоты, представленной SEQ ID NO: 4 или SEQ ID NO: 10;Cas5; a protein encoded by a polynucleotide consisting of the nucleic acid sequence represented by SEQ ID NO: 4 or SEQ ID NO: 10;

Cas6; белок, кодируемый полинуклеотидом, состоящим из последовательности нуклеиновой кислоты, представленной SEQ ID NO: 5 или SEQ ID NO: 11;Cas6; a protein encoded by a polynucleotide consisting of the nucleic acid sequence represented by SEQ ID NO: 5 or SEQ ID NO: 11;

Cas7; белок, кодируемый полинуклеотидом, состоящим из последовательности нуклеиновой кислоты, представленной SEQ ID NO: 6 или SEQ ID NO: 12.Cas7; a protein encoded by a polynucleotide consisting of the nucleic acid sequence represented by SEQ ID NO: 6 or SEQ ID NO: 12.

Вышеуказанная группа белков Cas представляет собой (1) белок, полученный путем присоединения PKKKRKV (SEQ ID NO: 52) в качестве сигнала локализации в ядре к N-концам Cas3, Cse1 (Cas8), Cse2 (Cas11), Cas5, Cas6 и Cas7 E.coli дикого типа, или (2) белок, полученный путем присоединения KRTADGSEFESPKKKRKVE (SEQ ID NO. 54) в качестве сигнала локализации в ядре к N-концам и С-концам Cas3, Cse1 (Cas8), Cse2 (Cas11), Cas5, Cas6 и Cas7 E. coli дикого типа. В случае белков, имеющих такие аминокислотные последовательности, вышеуказанная группа белков Cas может быть перенесена в ядро эукариотической клетки. Указанная выше группа белков Cas, перенесенная в ядро таким образом, расщепляет ДНК-мишень. Кроме того, можно редактировать ДНК-мишень даже в области ДНК, имеющей стерическую структуру, которая, как считается, трудно поддается расщеплению системой CRISPAR-Cas9 (гетерохроматин и т.п.).The above group of Cas proteins is (1) a protein obtained by attaching PKKKRKV (SEQ ID NO: 52) as a nuclear localization signal to the N-terminus of Cas3, Cse1 (Cas8), Cse2 (Cas11), Cas5, Cas6 and Cas7 E .coli wild-type, or (2) a protein obtained by attaching KRTADGSEFESPKKKRKVE (SEQ ID NO. 54) as a nuclear localization signal to the N-terminus and C-terminus of Cas3, Cse1 (Cas8), Cse2 (Cas11), Cas5, Cas6 and Cas7 E. coli wild type. In the case of proteins having such amino acid sequences, the above group of Cas proteins can be transferred to the nucleus of a eukaryotic cell. The above group of Cas proteins, transferred to the nucleus in this way, cleaves the target DNA. In addition, it is possible to edit the target DNA even in a region of DNA having a steric structure, which is considered difficult to be cleaved by the CRISPAR-Cas9 system (heterochromatin, etc.).

Другой вариант белков в группе белков Cas, используемых в настоящем изобретении, представляет собой белок, кодируемый последовательностью нуклеиновой кислоты, которая на 90% или более идентична последовательности нуклеиновой кислоты вышеуказанной группы белков Cas. Другой вариант белков в группе белков Cas, используемых в настоящем изобретении, является белок, кодируемый полинуклеотидом, который гибридизуется с полинуклеотидом, состоящим из последовательности нуклеино- 5 040859 вой кислоты, комплементарной последовательности нуклеиновой кислоты группы белка Cas, описанной выше, в жестких условиях. Каждый из вышеуказанных белков обладает активностью расщепления ДНК при образовании комплекса с другим белком, составляющим группу белков Cas. Значения таких терминов, как идентичность последовательностей и условия жесткости, описаны ниже.Another variant of the proteins in the group of Cas proteins used in the present invention is a protein encoded by a nucleic acid sequence that is 90% or more identical to the nucleic acid sequence of the above group of Cas proteins. Another variant of the proteins in the Cas protein group used in the present invention is a protein encoded by a polynucleotide that hybridizes to a polynucleotide consisting of a nucleic acid sequence complementary to the nucleic acid sequence of the Cas protein group described above under stringent conditions. Each of the above proteins has DNA cleavage activity upon complex formation with another protein constituting the Cas protein group. The meanings of terms such as sequence identity and stringency conditions are described below.

Полинуклеотид, кодирующий группу белков Cas.A polynucleotide encoding a group of Cas proteins.

Полинуклеотиды, кодирующие белки дикого типа, составляющие систему CRISPR-Cas типа I-Е, включают полинуклеотиды, модифицированные для эффективной экспрессии в эукариотических клетках. То есть можно использовать полинуклеотид, который кодирует группу белков Cas, и который был модифицирован. Одним предпочтительным вариантом модификации полинуклеотидов является модификация последовательности нуклеиновой кислоты, подходящей для экспрессии в эукариотических клетках, например, оптимизация кодона, экспрессируемого в эукариотических клетках.The polynucleotides encoding the wild-type proteins constituting the type I-E CRISPR-Cas system include polynucleotides modified for efficient expression in eukaryotic cells. That is, a polynucleotide which encodes a group of Cas proteins and which has been modified can be used. One preferred option for modifying polynucleotides is to modify a nucleic acid sequence suitable for expression in eukaryotic cells, for example, optimization of a codon expressed in eukaryotic cells.

Один предпочтительный вариант полинуклеотидов, кодирующих группу белков Cas, используемых в настоящем изобретении, представляет собой следующие варианты:One preferred embodiment of the polynucleotides encoding the Cas group of proteins used in the present invention are the following:

Cas3; полинуклеотид, состоящий из последовательности нуклеиновой кислоты, представленной SEQ ID NO: 1 или SEQ ID NO: 7;Cas3; a polynucleotide consisting of a nucleic acid sequence represented by SEQ ID NO: 1 or SEQ ID NO: 7;

Cse1 (Cas8); полинуклеотид, состоящий из последовательности нуклеиновой кислоты, представленной SEQ ID NO: 2 или SEQ ID NO: 8;Cse1 (Cas8); a polynucleotide consisting of a nucleic acid sequence represented by SEQ ID NO: 2 or SEQ ID NO: 8;

Cse2 (Cas11); полинуклеотид, состоящий из последовательности нуклеиновой кислоты, представ ленной SEQ ID NO: 3 или SEQ ID NO: 9;Cse2 (Cas11); a polynucleotide consisting of the nucleic acid sequence represented by SEQ ID NO: 3 or SEQ ID NO: 9;

Cas5; полинуклеотид, состоящий из последовательности нуклеиновой кислоты, представленной SEQ ID NO: 4 или SEQ ID NO: 10;Cas5; a polynucleotide consisting of a nucleic acid sequence represented by SEQ ID NO: 4 or SEQ ID NO: 10;

Cas6; полинуклеотид, состоящий из последовательности нуклеиновой кислоты, представленной SEQ ID NO: 5 или SEQ ID NO: 11;Cas6; a polynucleotide consisting of a nucleic acid sequence represented by SEQ ID NO: 5 or SEQ ID NO: 11;

Cas7; полинуклеотид, состоящий из последовательности нуклеиновой кислоты, представленной SEQ ID NO: 6 или SEQ ID NO: 12.Cas7; a polynucleotide consisting of a nucleic acid sequence represented by SEQ ID NO: 6 or SEQ ID NO: 12.

Каждый из них представляет собой полинуклеотид, полученный так, чтобы он функционировал и экспрессировался в клетках млекопитающих, путем искусственной модификации последовательностей нуклеиновой кислоты, кодирующих группу белков Cas дикого типа E.coli (Cas3; SEQ ID NO: 13, Cse1 (Cas8); SEQ ID NO 14: Cse2 (Cas11); SEQ ID NO: 15, Cas5; SEQ ID NO: 16, Cas6; SEQ ID NO: 17, Cas7; SEQ ID NO: 18).Each is a polynucleotide made to function and be expressed in mammalian cells by artificially modifying the nucleic acid sequences encoding the E. coli wild-type Cas group of proteins (Cas3; SEQ ID NO: 13, Cse1 (Cas8); SEQ ID NO 14: Cse2 (Cas11); SEQ ID NO: 15, Cas5; SEQ ID NO: 16, Cas6; SEQ ID NO: 17, Cas7; SEQ ID NO: 18).

Вышеуказанная искусственная модификация полинуклеотидов предназначена для модификации последовательности нуклеиновой кислоты, подходящей для ее экспрессии в эукариотических клетках, и для присоединения сигнала локализации в ядре. Модификация последовательности нуклеиновой кисло ты и присоединение сигнала локализации в ядре являются такими, как описано выше. В результате можно ожидать, что для группы белков Cas уровень экспрессии будет достаточно увеличен, а функции будут улучшены.The above artificial modification of polynucleotides is intended to modify the nucleic acid sequence suitable for its expression in eukaryotic cells and to attach a nuclear localization signal. Modification of the nucleic acid sequence and attachment of the nuclear localization signal are as described above. As a result, it can be expected that for the Cas protein group, the expression level will be sufficiently increased and the functions will be improved.

Другим вариантом полинуклеотидов, кодирующих группу белков Cas, используемую в настоящем изобретении, является полинуклеотид, образованный путем модификации последовательности нуклеиновой кислоты, кодирующей группу белков Cas дикого типа, и состоящий из последовательности нуклеиновой кислоты, которая на 90% или более идентична последовательности нуклеиновой кислоты вышеуказанной группы белков Cas. Белки, экспрессируемые из этих полинуклеотидов, обладают активностью расщепления ДНК при образовании комплекса с белками, экспрессируемыми из других полинуклеотидов, составляющих группу белков Cas.Another embodiment of polynucleotides encoding a group of Cas proteins used in the present invention is a polynucleotide formed by modifying a nucleic acid sequence encoding a group of wild-type Cas proteins, and consisting of a nucleic acid sequence that is 90% or more identical to the nucleic acid sequence of the above group. Cas proteins. Proteins expressed from these polynucleotides have DNA cleavage activity when complexed with proteins expressed from other polynucleotides that make up the Cas protein group.

Идентичность последовательностей нуклеиновых кислот может составлять по меньшей мере 90% или более, а более предпочтительно 95% или более (например, 95%, 96%, 97%, 98% и 99% или более) по всей последовательности нуклеиновой кислоты (или области, кодирующей сайт, необходимый для функционироания Cse3). Идентичность последовательностей нуклеиновых кислот можно определить с помощью такой программы, как BLASTN (см. Altschul SF (1990) Basic local alignment search tool, Journal of Molecular Biology, Vol. 215 (Issue 3), pp. 403-410). Примеры параметров для анализа последовательностей нуклеиновых кислот с помощью BLASTN включают число баллов=100 и длину слова=12. Специалистам в данной области известны конкретные методы анализа с помощью BLASTN. Добавление или удаление (пробел и т.п.) могут быть допустимы при выравнивании последовательностей нуклеиновых кислот для оптимального сравнения.Nucleic acid sequence identity may be at least 90% or more, and more preferably 95% or more (e.g., 95%, 96%, 97%, 98%, and 99% or more) over the entire nucleic acid sequence (or region, coding site required for Cse3 function). Nucleic acid sequence identity can be determined using a program such as BLASTN (see Altschul SF (1990) Basic local alignment search tool, Journal of Molecular Biology, Vol. 215 (Issue 3), pp. 403-410). Example parameters for analysis of nucleic acid sequences using BLASTN include score=100 and word length=12. Specialists in this field are aware of specific methods of analysis using BLASTN. Addition or deletion (space, etc.) may be allowed when aligning nucleic acid sequences for optimal comparison.

Более того, термин обладающий активностью расщепления ДНК означает способность расщеплять по меньшей мере один сайт полинуклеотидной цепи.Moreover, the term having DNA cleavage activity means the ability to cleave at least one site of a polynucleotide chain.

Предпочтительно, чтобы система CRISPR-Cas3 согласно изобретению расщепляла ДНК посредством специфического распознавания последовательности-мишени. Так, например, двойной люциферазный анализ, описанный в примере A-1, позволяет определить, может ли система CRISPR-Cas3 специфически распознавать последовательность-мишень.Preferably, the CRISPR-Cas3 system of the invention cleaves DNA by specific target sequence recognition. For example, the dual luciferase assay described in Example A-1 can determine if the CRISPR-Cas3 system can specifically recognize a target sequence.

Другой вариант полинуклеотидов, кодирующих группу белков Cas, используемую в настоящем изобретении, представляет собой полинуклеотид, который гибридизуется с полинуклеотидом, состоящим из последовательности нуклеиновой кислоты, комплементарной последовательности нуклеиновойAnother variant of the polynucleotides encoding the Cas group of proteins used in the present invention is a polynucleotide that hybridizes to a polynucleotide consisting of a nucleic acid sequence complementary to a nucleic acid sequence.

- 6 040859 кислоты группы белков Cas, описанной выше, в жестких условиях. Белки, экспрессируемые из этих полинуклеотидов, обладают активностью расщепления ДНК при образовании комплекса с белками, экспрессируемыми из других полинуклеотидов, составляющих группу белков Cas.- 6 040859 acids of the Cas protein group described above under harsh conditions. Proteins expressed from these polynucleotides have DNA cleavage activity when complexed with proteins expressed from other polynucleotides that make up the Cas protein group.

Используемый здесь термин жесткие условия относятся к условиям, при которых две полинуклеотидных цепи образуют двухцепочечный полинуклеотид, специфичный к последовательности нуклеиновой кислоты, но не образуют неспецифический двухцепочечный полинуклеотид. Другими словами, выражение гибридизуется в жестких условиях может означать условия, гибридизации при температуре в пределах от температуры плавления (значения Tm) нуклеиновых кислот с высокой идентичностью последовательности (например, идеально соответствующих гибридов) до температуры ниже на 15°С, предпочтительно на 10°С, а более предпочтительно на 5°С.As used herein, stringent conditions refer to conditions under which two polynucleotide strands form a double-stranded polynucleotide specific for a nucleic acid sequence, but do not form a non-specific double-stranded polynucleotide. In other words, the term hybridizes under stringent conditions may mean conditions hybridizing at a temperature ranging from the melting point (Tm value) of nucleic acids with high sequence identity (e.g., perfectly matched hybrids) to temperatures as low as 15°C, preferably 10°C. , and more preferably 5°C.

Примеры жестких условий приведены ниже. Во-первых, два типа полинуклеотидов гибридизуются в течение 16-24 ч при температуре от 60 до 68°С (предпочтительно 65°С, а более предпочтительно 68°С) в буферном растворе (pH 7,2), состоящем из 0,25М Na2HPO4, 7% ДСН, 1 мМ EDTA и 1храствора Денхардта. После этого промывку проводят два раза в течение 15 мин в буферном растворе (pH 7,2), состоящем из 20 мМ Na2HPO4, 1% ДСН и 1 мМ EDTA при температуре от 60 до 68°С (предпочтительно 65°С, а более предпочтительно 68°С).Examples of stringent conditions are shown below. First, the two types of polynucleotides are hybridized for 16-24 hours at 60 to 68°C (preferably 65°C, and more preferably 68°C) in a buffer solution (pH 7.2) consisting of 0.25M Na 2 HPO 4 , 7% SDS, 1 mM EDTA and 1x Denhardt's solution. After that, washing is carried out twice for 15 min in a buffer solution (pH 7.2) consisting of 20 mm Na 2 HPO 4 , 1% SDS and 1 mm EDTA at a temperature of from 60 to 68°C (preferably 65°C, and more preferably 68°C).

Другие примеры включают следующий метод.Other examples include the following method.

Во-первых, предварительную гибридизацию проводят в течение ночи при 42°С в растворе для гибридизации, содержащем 25% формамида (50% формамида в более жестких условиях), 4xSSC (хлорид натрия/цитрат натрия), 50 мМ Hepes (pH 7,0), 10храствора Денхардта и 20 мкг/мл денатурированной ДНК спермы лосося. После этого добавляют меченые зонды и проводят инкубирование в течение ночи при 42°С для гибридизации полинуклеотидов двух типов.First, pre-hybridization was performed overnight at 42° C. in a hybridization solution containing 25% formamide (50% formamide under more stringent conditions), 4xSSC (sodium chloride/sodium citrate), 50 mM Hepes (pH 7.0 ), 10x Denhardt's solution, and 20 μg/ml denatured salmon sperm DNA. Thereafter, labeled probes are added and incubated overnight at 42° C. to hybridize the two types of polynucleotides.

Далее проводят промывку в любых из нижеследующих условий. Нормальные условия: 1xSSC и 0,1% ДСН используют в качестве промывочных жидкостей для промывки при температуре приблизительно 37°С. Жесткие условия: 0,5xSSC и 0,1% ДСН используются в качестве промывочных жидкостей для промывки при температуре приблизительно 42°С. Более жесткие условия: 0,2xSSC и 0,1% ДСН используются в качестве промывочных жидкостей для промывки при температуре приблизительно 65°С.Next, washing is carried out under any of the following conditions. Normal conditions: 1xSSC and 0.1% SDS are used as washing liquids for washing at a temperature of approximately 37°C. Stringent conditions: 0.5xSSC and 0.1% SDS are used as wash fluids for washing at approximately 42°C. More stringent conditions: 0.2xSSC and 0.1% SDS are used as washing liquids for washing at a temperature of approximately 65°C.

По мере того как условия промывки для гибридизации становятся более жесткими, специфичность гибридизации возрастает. Следует отметить, что вышеуказанная комбинация условий SSC, ДСН и температур приводится лишь в иллюстративных целях. Жесткость, аналогичная приведенной выше, может быть достигнута путем соответствующего сочетания вышеупомянутых элементов для определения жесткости гибридизации или других элементов (например, концентрации зонда, длины зонда и времени реакции гибридизации). Это описано, например, в литературе Joseph Sambrook & David W. Russell, Molecular cloning: a laboratory manual 3rd Ed., New York: Cold Spring Harbor Laboratory Press, 2001.As washing conditions for hybridization become more stringent, the specificity of hybridization increases. It should be noted that the above combination of SSC conditions, SDS and temperatures is for illustrative purposes only. Stringency similar to the above can be achieved by an appropriate combination of the aforementioned elements for hybridization stringency or other elements (eg, probe concentration, probe length, and hybridization reaction time). This is described, for example, in the literature Joseph Sambrook & David W. Russell, Molecular cloning: a laboratory manual 3rd Ed., New York: Cold Spring Harbor Laboratory Press, 2001.

Экспрессионный вектор, содержащий полинуклеотид, кодирующий группу белков Cas.An expression vector containing a polynucleotide encoding a group of Cas proteins.

В настоящем изобретении можно использовать экспрессионный вектор для экспрессии группы белков Cas. Что касается экспрессионного вектора, то в качестве основного вектора могут быть использованы различные типы обычно используемых векторов, и эти векторы могут быть соответствующим образом выбраны в зависимости от клеток для введения или способа введения. Конкретными примерами, подходящими для использования, являются плазмиды, фаги, космиды и т.п. Тип вектора не имеет конкретных ограничений, и достаточно выбрать соответствующий вектор, который может быть экспрессирован в клетке-хозяине.In the present invention, an expression vector can be used to express a group of Cas proteins. As for the expression vector, various types of commonly used vectors can be used as the main vector, and these vectors can be appropriately selected depending on the cells to be administered or the method of administration. Specific examples suitable for use are plasmids, phages, cosmids, and the like. The type of vector is not particularly limited, and it is sufficient to select an appropriate vector that can be expressed in the host cell.

Примерами описанных выше экспрессионных векторов являются фаговые векторы, плазмидные векторы, вирусные векторы, ретровирусные векторы, хромосомные векторы, эписомные векторы, векторы, происходящие от вируса (бактериальные плазмиды, бактериофаги, дрожжевые эписомы и т.п.), дрожжевые хромосомные элементы и вирусы (бакуловирусы, паповавирусы, вирусы осповакцины, аденовирусы, трехвалентные поксвирусы, вирусы псевдобешенства, герпесвирусы, лентивирусы, ретровирусы и т.п.) и векторы, полученные из их комбинаций (космиды, фагмиды и т.п.).Examples of the expression vectors described above are phage vectors, plasmid vectors, viral vectors, retroviral vectors, chromosomal vectors, episomal vectors, virus-derived vectors (bacterial plasmids, bacteriophages, yeast episomes, etc.), yeast chromosomal elements, and viruses ( baculoviruses, papovaviruses, vaccinia viruses, adenoviruses, trivalent poxviruses, pseudorabies viruses, herpesviruses, lentiviruses, retroviruses, etc.) and vectors derived from their combinations (cosmids, phagemids, etc.).

Предпочтительно экспрессионный вектор также содержит сайт инициации транскрипции и сайт терминации транскрипции, а также сайт связывания с рибосомой в области транскрипции. Кодирующая область зрелого транскрипта в векторе будет содержать кодон инициации транскрипции AUG в начале и соответствующим образом расположенный стоп-кодон в конце транслируемого полипептида.Preferably, the expression vector also contains a transcription initiation site and a transcription termination site, as well as a ribosome binding site in the transcription region. The coding region of the mature transcript in the vector will contain the transcription initiation codon AUG at the beginning and an appropriately placed stop codon at the end of the translated polypeptide.

В настоящем изобретении экспрессионный вектор для экспрессии группы белков Cas может содержать промоторную последовательность. Вышеуказанная промоторная последовательность может быть соответствующим образом выбрана в зависимости от типа эукариотической клетки, служащей в качестве хозяина. Кроме того, экспрессионный вектор может содержать последовательность для усиления транскрипции ДНК, например энхансерную последовательность. Примерами энхансеров являются энхансер SV40 (который расположен на 100-270 п.о. ниже ориджина репликации), энхансер раннего промотора цитомегаловируса, энхансер полиомы и энхансер аденовируса, расположенный ниже ориджина репликации. Кроме того, экспрессионный вектор может содержать последовательность для стабилизации транскрибированной РНК, например последовательность присоединения poly(A) (последовательность поли- 7 040859 аденилирования, poly(A)). Примерами последовательностей присоединения poly(A) являются последовательности присоединения poly(A), происходящие от гена гормона роста; последовательности присоединения poly(A), происходящие от гена бычьего гормона роста; последовательности присоединения poly(A), происходящие от гена человеческого гормона роста; последовательности присоединения poly(A), происходящие от вируса SV40; и последовательности присоединения poly(A), происходящие от человеческого или кроличьего гена β-глобина.In the present invention, an expression vector for expressing a group of Cas proteins may contain a promoter sequence. The above promoter sequence may be appropriately selected depending on the type of eukaryotic cell serving as the host. In addition, the expression vector may contain a sequence for enhancing DNA transcription, such as an enhancer sequence. Examples of enhancers are the SV40 enhancer (which is located 100-270 bp downstream of the replication origin), the cytomegalovirus early promoter enhancer, the polyoma enhancer, and the adenovirus enhancer downstream of the replication origin. In addition, the expression vector may contain a sequence for stabilizing the transcribed RNA, such as a poly(A) attachment sequence (adenylation sequence, poly(A)). Examples of poly(A) attachment sequences are poly(A) attachment sequences derived from the growth hormone gene; poly(A) addition sequences derived from the bovine growth hormone gene; poly(A) attachment sequences derived from the human growth hormone gene; poly(A) attachment sequences derived from the SV40 virus; and poly(A) attachment sequences derived from the human or rabbit β-globin gene.

Количество полинуклеотидов, кодирующих группу белков Cas, которые должны быть включены в один и тот же вектор, не имеет конкретных ограничений, при условии, что они могут выполнять функции систем CRISPR-Cas в клетке-хозяине, в которую был введен экспрессионный вектор. Так, например, можно создать конструкцию, в которой полинуклеотид, кодирующий группу белков Cas, будет присутствовать на векторах одного типа (одного и того же типа). Кроме того, можно также создать такую конструкцию, в которой весь полипептид или некоторые его части, кодирующие группы белков Cas, будут присутствовать на отдельных векторах. Так, например, можно создать такую конструкцию, в которой полинуклеотид, кодирующий белки Cascade, будет раположен на векторах одного типа (одного и того же типа), а полинуклеотид, кодирующий Cas3, будет присутствовать на других векторах. С точки зрения эффективности экспрессии и т.п., предпочтительно использовать метод создания полинуклеотида, кодирующего группы белков Cas, на векторах шести различных типов.The number of polynucleotides encoding a group of Cas proteins to be included in the same vector is not particularly limited, as long as they can function as CRISPR-Cas systems in the host cell into which the expression vector has been introduced. For example, it is possible to create a construct in which a polynucleotide encoding a group of Cas proteins will be present on vectors of the same type (of the same type). In addition, it is also possible to create such a construct in which all or some of its parts encoding groups of Cas proteins will be present on separate vectors. For example, a construct can be created in which a polynucleotide encoding Cascade proteins is located on vectors of the same type (same type), and a polynucleotide encoding Cas3 is present on other vectors. From the viewpoint of expression efficiency and the like, it is preferable to use the method of generating a polynucleotide encoding groups of Cas proteins on six different types of vectors.

В другом случае, несколько полинуклеотидов, кодирующих одни и те же белки, могут быть встроены в одни и те же векторы для регуляции уровня экспрессии и т.п. Так, например, можно создать такую конструкцию, в которой полинуклеотиды, кодирующие Cas3, будут располагаться в двух сайтах векторов одного типа (одного и того же типа).Alternatively, multiple polynucleotides encoding the same proteins may be inserted into the same vectors to regulate the level of expression, and the like. So, for example, you can create a design in which polynucleotides encoding Cas3 will be located in two sites of vectors of the same type (of the same type).

Кроме того, можно использовать экспрессионный вектор, который содержит множество последовательностей нуклеиновых кислот, кодирующих группу белков Cas, и который имеет последовательности нуклеиновых кислот, встроенные между этими множественными последовательностями нуклеиновых кислот и кодирующие аминокислотные последовательности (пептиды 2А и т.п.), расщепляемые внутриклеточными протеазами (см., например, структуру вектора на фиг. 8). Если полинуклеотиды, имеющие такие последовательности нуклеиновых кислот, транскрибируются и транслируются, то в клетках экспрессируются связанные полипептидные цепи. Впоследствии, благодаря действию внутриклеточных протеаз группы белков Cas разделяются, становятся отдельными белками, а затем образуют функциональные комплексы. Это позволяет регулировать соотношение количества групп белков Cas, экспрессируемых внутри клеток. Так, например, было предсказано, что Cas3 и Cse1 (Cas8) будут экспрессироваться в равных количествах из ''экспрессионного вектора, содержащего одну последовательность нуклеиновой кислоты, кодирующую Cas3, и одну последовательность нуклеиновой кислоты, кодирующую Cse1 (Cas8). Кроме того, можно экспрессировать множество групп белков Cas с помощью экспрессионного вектора одного типа вектора, что дает преимущества с точки зрения технологических свойств. С другой стороны, обычно лучшим является вариант, в котором группы белков Cas экспрессируются различными экспрессионными векторами с точки зрения высокой активности расщепления ДНК.In addition, an expression vector which contains a plurality of nucleic acid sequences encoding a group of Cas proteins and which has nucleic acid sequences inserted between these plural nucleic acid sequences and encoding amino acid sequences (2A peptides and the like) cleavable by intracellular proteases (see, for example, the structure of the vector in Fig. 8). When polynucleotides having such nucleic acid sequences are transcribed and translated, the linked polypeptide chains are expressed in cells. Subsequently, due to the action of intracellular proteases, groups of Cas proteins are separated, become separate proteins, and then form functional complexes. This makes it possible to regulate the ratio of the number of Cas protein groups expressed inside cells. For example, Cas3 and Cse1 (Cas8) were predicted to be expressed in equal amounts from an 'expression vector containing one nucleic acid sequence encoding Cas3 and one nucleic acid sequence encoding Cse1 (Cas8). In addition, multiple groups of Cas proteins can be expressed with an expression vector of one type of vector, which is advantageous in terms of processing properties. On the other hand, the variant in which the groups of Cas proteins are expressed by different expression vectors is usually better in terms of high DNA cleavage activity.

Экспрессионные векторы, используемые в настоящем изобретении, можно получить известными методами. Примеры таких методов включают метод, описанный в руководстве, прилагаемом к набору для получения векторов, а также методы, описанные в различных руководствах. Примером исчерпывающего руководства является руководство Joseph Sambrook & David W. Russell, Molecular cloning: a laboratory manual 3rd Ed., New York: Cold Spring Harbor Laboratory Press, 2001.Expression vectors used in the present invention can be obtained by known methods. Examples of such methods include the method described in the manual supplied with the vector acquisition kit, as well as the methods described in various manuals. An example of a comprehensive manual is Joseph Sambrook & David W. Russell, Molecular cloning: a laboratory manual 3rd Ed., New York: Cold Spring Harbor Laboratory Press, 2001.

Экспрессионный вектор, содержащий cr-РНК, полинуклеотид, кодирующий cr-РНК, или полинуклеотид.An expression vector containing a crRNA, a polynucleotide encoding a crRNA, or a polynucleotide.

Система CRISPR-Cas3 согласно изобретению включает cr-РНК, полинуклеотид, кодирующий crРНК, или экспрессионный вектор, содержащий полинуклеотид, для нацеливания на ДНК в целях редактирования генома.The CRISPR-Cas3 system of the invention includes a crRNA, a polynucleotide encoding a crRNA, or an expression vector containing the polynucleotide for DNA targeting for genome editing.

cr-РНК представляет собой РНК, которая образует часть системы CRISPR-Cas и имеет последовательность нуклеиновой кислоты, комплементарную последовательности-мишени. Система CRISPR-Cas3 согласно изобретению позволяет с помощью cr-РНК специфически распознавать последовательностьмишень и расщеплять эту последовательность. В системах CRISPR-Cas, типированных системой CRISPR-Cas9, в качестве cr-РНК обычно используются зрелые cr-РНК. Хотя причина этого не ясна, однако было обнаружено, что использование зрелой cr-РНК нежелательно, если система CRISPR-Cas3 предназначена для функционирования в эукариотических клетках. Более того, неожиданно было обнаружено, что высокоэффективное редактирование генома может быть осуществлено в эукариотических клетках с использованием pre-cr-РНК вместо зрелой cr-РНК. Этот факт был очевиден из эксперимента по сравнению зрелой cr-РНК и pre-cr-РНК (фиг. 10). Поэтому особенно предпочтительно использовать пресг-РНК в качестве cr-РНК согласно изобретению.crRNA is an RNA that forms part of the CRISPR-Cas system and has a nucleic acid sequence that is complementary to the target sequence. The CRISPR-Cas3 system according to the invention makes it possible, with the help of cr-RNA, to specifically recognize the target sequence and cleave this sequence. In CRISPR-Cas systems typed by the CRISPR-Cas9 system, mature crRNAs are usually used as crRNAs. Although the reason for this is not clear, however, it has been found that the use of mature cr-RNA is undesirable if the CRISPR-Cas3 system is intended to function in eukaryotic cells. Moreover, it has surprisingly been found that highly efficient genome editing can be performed in eukaryotic cells using pre-cr-RNA instead of mature cr-RNA. This fact was evident from the experiment comparing mature crRNA and pre-crRNA (FIG. 10). It is therefore particularly preferred to use presgRNA as the crRNA according to the invention.

Pre-cr-РНК, используемые в настоящем изобретении, обычно имеют структуры лидерная последовательность-повторяющаяся последовательность-спейсерная последовательность-повторяющаяся последовательность (структура LRSR) и повторяющаяся последовательность-спейсерная последовательность-повторяющаяся последовательность (структура RSR). Лидерная последовательность представляетThe pre-crRNAs used in the present invention typically have a leader sequence-repeating sequence-spacer sequence-repeating sequence (LRSR structure) and a repeat-spacer-repeating sequence (RSR structure) structures. The leader sequence represents

- 8 040859 собой АТ-богатую последовательность и функционирует как промотор для экспрессии пре-сг-РНК. Повторяющаяся последовательность представляет собой повторяющуюся последовательность со спейсерной последовательностью между повторами, а спейсерная последовательность представляет собой последовательность, сконструированную в настоящем изобретении как последовательность, комплементарную ДНК-мишени (по своей природе, она представляет собой последовательность, происходящую из чужеродной ДНК, включенной в процессе адаптиции). Pre-cr-РНК становится зрелой cr-РНК при расщеплении белками, составляющими Cascade (например, Cas6 для типов I-A, В и D-E и Cas5 для типа I-C).- 8 040859 is an AT-rich sequence and functions as a promoter for the expression of pre-sg-RNA. A repeat sequence is a repeat sequence with a spacer sequence between repeats, and a spacer sequence is a sequence designed in the present invention as a sequence complementary to the target DNA (by its nature, it is a sequence derived from foreign DNA included in the adaptation process) . Pre-cr-RNA becomes mature cr-RNA when cleaved by the proteins that make up the Cascade (eg Cas6 for types I-A, B and D-E and Cas5 for type I-C).

Как правило, длина цепи лидерной последовательности составляет 86 оснований, а длина цепи повторяющейся последовательности составляет 29 оснований. Длина цепи спейсерной последовательности составляет, например, 10-60 оснований, предпочтительно 20-50 оснований, более предпочтительно 25-40 оснований и обычно 32-37 оснований. Таким образом, в случае структуры LRSR, pre-cr-РНК, используемая в настоящем изобретении, имеет длину цепи, например, 154-204 оснований, предпочтительно 164194 оснований, более предпочтительно 169-184 оснований, а обычно 176-181 оснований. Кроме того, в случае структуры RSR длина цепи составляет, например, 68-118 оснований, предпочтительно 78-108 оснований, более предпочтительно 83-98 оснований, а обычно 90-95 оснований.Typically, the chain length of the leader sequence is 86 bases and the chain length of the repeat sequence is 29 bases. The chain length of the spacer sequence is, for example, 10-60 bases, preferably 20-50 bases, more preferably 25-40 bases, and typically 32-37 bases. Thus, in the case of the LRSR structure, the pre-cr RNA used in the present invention has a chain length of, for example, 154-204 bases, preferably 164194 bases, more preferably 169-184 bases, and usually 176-181 bases. In addition, in the case of the RSR structure, the chain length is, for example, 68-118 bases, preferably 78-108 bases, more preferably 83-98 bases, and usually 90-95 bases.

Для того чтобы система CRISPR-Cas3 согласно изобретению функционировала в эукариотических клетках, считается, что важную роль играет процесс, посредством которого повторяющиеся последовательности pre-cr-РНК расщепляются белками, составляющими Cascade. Таким образом, следует отметить, что вышеупомянутые повторяющиеся последовательности могут быть короче или длиннее, чем указанная выше длина цепи, при условии, что будет происходить такое расщепление. В частности, можно сказать, что pre-cr-РНК представляет собой cr-РНК, образованную путем присоединения последовательностей, достаточных для расщепления белками, составляющими Cascade, к обоим концам зрелой crРНК, описанной ниже. Таким образом, предпочтительный вариант осуществления способа согласно изобретению включает стадию расщепления сг-РНК белками, составляющими Cascade, после введения системы CRISPR-Cas3 в эукариотические клетки.In order for the CRISPR-Cas3 system of the invention to function in eukaryotic cells, the process by which repetitive pre-crRNA sequences are cleaved by the proteins constituting the Cascade is believed to play an important role. Thus, it should be noted that the aforementioned repeat sequences may be shorter or longer than the above chain length, provided that such cleavage occurs. In particular, a pre-crRNA can be said to be a crRNA formed by adding sequences sufficient for cleavage by the proteins constituting Cascade to both ends of a mature crRNA, described below. Thus, a preferred embodiment of the method of the invention comprises the step of cleavage of the srRNA by the proteins constituting Cascade after the introduction of the CRISPR-Cas3 system into eukaryotic cells.

С другой стороны, зрелая cr-РНК, образованная расщеплением pre-cr-РНК, имеет структуру 5'фланкирующая последовательность - спейсерная последовательность - 3'-фланкирующая последовательность. Обычно 5'-фланкирующая последовательность состоит из 8 оснований в положениях 22-29 повторяющейся последовательности и содержится в Cas5. Кроме того, 3'-фланкирующая последовательность обычно состоит из 21 основания в положениях 1-21 в повторяющейся последовательности, образует структуру стебель-петля с основаниями в положениях 6-21 и сохраняется в Cas6. Таким образом, длина цепи зрелой cr-РНК обычно составляет 61-66 оснований. Следует отметить, что, поскольку существуют также зрелые cr-РНК, не имеющие 3'-фланкирующей последовательности, то в зависимости от типа системы CRISPR-Cas3, длина цепи в этом случае сокращается на 21 основание.On the other hand, mature crRNA formed by cleavage of pre-crRNA has the structure 5' flanking sequence - spacer sequence - 3' flanking sequence. Typically, the 5' flanking sequence consists of 8 bases at positions 22-29 of the repeat sequence and is contained in Cas5. In addition, the 3' flanking sequence typically consists of 21 bases at positions 1-21 in a repeat sequence, forms a stem-loop structure with bases at positions 6-21, and is conserved in Cas6. Thus, the chain length of a mature cr-RNA is typically 61-66 bases. It should be noted that, since there are also mature cr-RNAs that do not have a 3'-flanking sequence, depending on the type of CRISPR-Cas3 system, the chain length in this case is reduced by 21 bases.

Следует отметить, что последовательность РНК может быть соответствующим образом сконструирована в соответствии с последовательностью-мишенью, в которой желательно осуществлять редактирование ДНК. Кроме того, можно синтезировать РНК с применением любого метода, известного специалистам в данной области.It should be noted that the RNA sequence can be appropriately designed according to the target sequence in which it is desirable to carry out DNA editing. In addition, RNA can be synthesized using any method known to those skilled in the art.

Эукариотическая клетка.eukaryotic cell.

Примеры эукариотических клеток в настоящем изобретении включают клетки животных, клетки растений, клетки водорослей и клетки грибов. Кроме того, примеры клеток животных включают клетки млекопитающих, а также, например, клетки рыб, птиц, рептилий, амфибий и насекомых.Examples of eukaryotic cells in the present invention include animal cells, plant cells, algae cells and fungal cells. In addition, examples of animal cells include mammalian cells, as well as fish, bird, reptile, amphibian, and insect cells, for example.

Примеры клеток животных включают клетки, составляющие организм животных; клетки, составляющие органы/ткани, вырезанные у животных; и культивируемые клетки, полученные из тканей животных. Конкретными примерами являются зародышевые клетки, такие как ооциты и сперма; эмбриональные клетки эмбрионов на различных стадиях развития (такие как 1-клеточные эмбрионы, 2клеточные эмбрионы, 4-клеточные эмбрионы, 8-клеточные эмбрионы, 16-клеточные эмбрионы и эмбрионы на стадии морулы); стволовые клетки, такие как индуцированные плюрипотентные стволовые (iPS) клетки; эмбриональные стволовые (ES) клетки; и соматические клетки, такие как фибробласты, гемопоэтические клетки, нейроны, мышечные клетки, костные клетки, клетки печени, клетки поджелудочной железы, клетки головного мозга и клетки почек. Ооциты можно использовать до оплодотворения и после оплодотворения в качестве ооцитов, используемых для создания животных с отредактированным геномом, а предпочтительно ооцитов после оплодотворения, т.е. оплодотворенных яйцеклеток. Особенно предпочтительно, чтобы оплодотворенные эмбриональные яйцеклетки происходили от клеток на стадии пронуклеуса. Ооциты могут быть оттаяны и использованы после замораживания.Examples of animal cells include cells constituting the body of animals; cells constituting organs/tissues excised from animals; and cultured cells derived from animal tissues. Specific examples are germ cells such as oocytes and sperm; embryonic cells of embryos at various stages of development (such as 1-cell embryos, 2-cell embryos, 4-cell embryos, 8-cell embryos, 16-cell embryos, and morula-stage embryos); stem cells such as induced pluripotent stem (iPS) cells; embryonic stem (ES) cells; and somatic cells such as fibroblasts, hematopoietic cells, neurons, muscle cells, bone cells, liver cells, pancreatic cells, brain cells, and kidney cells. The oocytes can be used before fertilization and after fertilization as oocytes used to create genome-edited animals, and preferably post-fertilization oocytes, i. fertilized eggs. It is particularly preferred that the fertilized embryonic oocytes are derived from cells at the pronuclear stage. Oocytes can be thawed and used after freezing.

В настоящем изобретении млекопитающее представляет собой понятие, включающее человека и млекопитающих, не являющихся человеком. Примеры млекопитающих, не являющихся человеком, включают парнокопытных млекопитающих, таких как крупный рогатый скот, кабаны, свиньи, овцы и козы, непарнокопытных млекопитающих, таких как лошади, грызуны, такие как мыши, крысы, морские свинки, хомяки и белки, зайцеобразные, такие как кролики, и плотоядные животные, такие как собаки, кошки и хорьки. Описанные выше млекопитающие, не являющиеся человеком, могут представлять собой крупный рогатый скот или животных-компаньонов (домашние питомцы) или диких животных.In the present invention, a mammal is a concept including a human and non-human mammals. Examples of non-human mammals include artiodactyl mammals such as cattle, wild boars, pigs, sheep and goats, equid mammals such as horses, rodents such as mice, rats, guinea pigs, hamsters and squirrels, lagomorphs such as like rabbits, and carnivores like dogs, cats, and ferrets. The non-human mammals described above may be cattle or companion animals (pets) or wild animals.

- 9 040859- 9 040859

Примеры клеток растений включают клетки зерновых культур, масличных культур, кормовых культур, плодовых и овощных культур. Примеры клеток растений включают клетки, составляющие организм растения; клетки, составляющие органы и ткани, отделенные от растений, и культивируемые клетки, полученные из тканей растений. Примеры органов и тканей растений включают листья, стебли, верхушки побегов (точки роста), корни, клубни и каллусы. Примерами растений являются рис, кукуруза, банан, арахис, подсолнечник, томат, рапс, табак, пшеница, ячмень, картофель, соя, хлопчатник и гвоздика, а также материалы для их размножения (например, семена, клубневидные корни и клубни).Examples of plant cells include those of cereals, oilseeds, fodder crops, fruits and vegetables. Examples of plant cells include cells that make up the body of a plant; cells constituting organs and tissues separated from plants; and cultured cells obtained from plant tissues. Examples of plant organs and tissues include leaves, stems, shoot tips (growth points), roots, tubers, and calli. Examples of plants are rice, corn, banana, peanut, sunflower, tomato, rapeseed, tobacco, wheat, barley, potato, soybean, cotton and cloves, as well as materials for their propagation (for example, seeds, tuberous roots and tubers).

Редактирование ДНК.DNA editing.

В настоящем изобретении редактирование ДНК эукариотических клеток может представлять собой стадию, на которой ДНК эукариотической клетки редактируется in vivo или in vitro. Кроме того, редактирование ДНК означает процессы, представленные нижеследующими типами (включая их комбинации).In the present invention, DNA editing of eukaryotic cells may be a step in which the DNA of a eukaryotic cell is edited in vivo or in vitro. In addition, DNA editing means processes of the following types (including combinations thereof).

Следует отметить, что в настоящем описании ДНК, используемая в вышеупомянутом контексте, включает не только ДНК, присутствующую в ядре клетки, но также экзогенную ДНК и ДНК, присутствующую не в ядре клетки, такую как митохондриальная ДНК.It should be noted that, in the present specification, DNA used in the above context includes not only DNA present in the nucleus of a cell, but also exogenous DNA and DNA present outside the nucleus of a cell, such as mitochondrial DNA.

1. Расщепление цепи ДНК в сайте-мишени.1. Cleavage of the DNA strand at the target site.

2. Делеция основания цепи ДНК в сайте-мишени.2. Deletion of the base of the DNA chain at the target site.

3. Инсерция основания в цепь ДНК в сайте-мишени.3. Insertion of a base into the DNA strand at the target site.

4. Замена основания цепи ДНК в сайте-мишени.4. Replacement of the base of the DNA chain in the target site.

5. Модификация основания цепи ДНК в сайте-мишени.5. Modification of the base of the DNA chain at the target site.

6. Модуляция транскрипции ДНК (гена) в сайте-мишени.6. Modulation of DNA (gene) transcription at the target site.

В одном варианте системы CRISPR-Cas3 согласно изобретению используется белок, обладающий ферментативной активностью, для модификации ДНК-мишени другим способом, кроме расщепления ДНК. Этот вариант осуществления изобретения может быть достигнут, например, путем присоединения Cas3 или Cascade к гетерологичному белку, имеющему желаемую ферментативную активность, с образованием химерного белка. Таким образом, Cas3 и Cascade согласно изобретению также включают такие гибридные белки. Примерами ферментативной активности гибридного белка являются, но не ограничиваются ими, дезаминазная активность (например, цитидин-дезаминазная активность и аденозиндезаминазная активность), метилтрансферазная активность, активность деметилирующего фермента, ДНК-репарирующая активность, ДНК-повреждающая активность, дисмутазная активность, алкилирующая активность, депуринизирующая активность, окисляющая активность, активность образования пиримидинового димера, интегразная активность, транспозазная активность, рекомбиназная активность, полимеразная активность, лигазная активность, активность фотореактивирующего фермента и гликозилазная активность. В этом случае нуклеазная активность или геликазная активность Cas3 является необязательной. По этой причине в качестве Cas3 можно использовать мутант, в котором некоторые или все эти активности были удалены (например, мутант домена D H74A (dnCas3), мутант K320N с мотивом 1 домена SF2 (dhCas3) и двойной мутант S483A/T485A с мотивом 3 домена SF2 (dh2Cas3)). Точное редактирование генома можно осуществить путем замены оснований без какой-либо крупной делеции в сайтемишени, если, например, гибридный белок деаминазы и мутант, в котором некоторые или все нуклеазные активности Cas3 были удалены, используются в качестве составого элемента системы CRISPR-Cas3 согласно изобретению. Способ применения деаминазы к системам CRISPR-Cas хорошо известен (Nishida K. et al., Targeted nucleotide editing using hybrid prokaryotic and vertebrate adaptive immune systems, Science, DOI: 10.1126/science.aaf8729, (2016)), и достаточно просто применить его к системе CRISPR-Cas3 согласно изобретению.In one embodiment of the CRISPR-Cas3 system of the invention, a protein having enzymatic activity is used to modify a target DNA in a manner other than DNA cleavage. This embodiment of the invention can be achieved, for example, by attaching Cas3 or Cascade to a heterologous protein having the desired enzymatic activity to form a chimeric protein. Thus, Cas3 and Cascade according to the invention also include such fusion proteins. Examples of enzymatic activity of the fusion protein include, but are not limited to, deaminase activity (e.g., cytidine deaminase activity and adenosine deaminase activity), methyl transferase activity, demethylating enzyme activity, DNA repair activity, DNA damaging activity, dismutase activity, alkylating activity, depurinating activity, oxidizing activity, pyrimidine dimer formation activity, integrase activity, transposase activity, recombinase activity, polymerase activity, ligase activity, photoreactivating enzyme activity, and glycosylase activity. In this case, nuclease activity or helicase activity of Cas3 is optional. For this reason, a mutant in which some or all of these activities have been deleted can be used as Cas3 (e.g., the H74A D domain mutant (dnCas3), the SF2 domain motif 1 mutant K320N (dhCas3), and the S483A/T485A double mutant with domain motif 3 SF2 (dh2Cas3)). Accurate genome editing can be accomplished by base substitution without any major deletion at the target site if, for example, a deaminase fusion protein and a mutant in which some or all of the Cas3 nuclease activities have been removed are used as a constituent element of the CRISPR-Cas3 system of the invention. The method of applying deaminase to CRISPR-Cas systems is well known (Nishida K. et al., Targeted nucleotide editing using hybrid prokaryotic and vertebrate adaptive immune systems, Science, DOI: 10.1126/science.aaf8729, (2016)), and it is quite simple to apply it to the CRISPR-Cas3 system according to the invention.

Другой вариант системы CRISPR-Cas3 согласно изобретению регулирует транскрипцию гена в сайте связывания системы согласно изобретению без расщепления ДНК. Этот вариант может быть достигнут, например, путем присоединения Cas3 или Cascade к нужному белку регуляции транскрипции с получением химерного белка. Таким образом, Cas3 и Cascade согласно изобретению также включают такие гибридные белки. Примерами белка регуляции транскрипци являются, но не ограничиваются ими, регуляторы транскрипции, индуцируемые излучением; регуляторы транскрипции, чувствительные к небольшим молекулам/лекарственным средствам, факторы транскрипции и репрессоры транскрипции. В этом случае нуклеазная активность или геликазная активность Cas3 является необязательной. По этой причине в качестве Cas3 можно использовать мутант, в котором некоторые или все эти активности удалены (например, мутант домена DH74A (dnCas3), мутант K320N с мотивом 1 домена SF2 (dhCas3) и двойной мутант S483A/T485A с мотивом 3 домена SF2 (dh2Cas3)). Способы использования белка регуляции транскрипции в системах CRISPR-Cas известны специалистам в данной области.Another variant of the CRISPR-Cas3 system according to the invention regulates gene transcription at the binding site of the system according to the invention without DNA cleavage. This variant can be achieved, for example, by attaching Cas3 or Cascade to the desired transcription regulation protein to produce a chimeric protein. Thus, Cas3 and Cascade according to the invention also include such fusion proteins. Examples of a transcription regulation protein include, but are not limited to, radiation-induced transcription regulators; small molecule/drug sensitive transcription regulators, transcription factors and transcriptional repressors. In this case, nuclease activity or helicase activity of Cas3 is optional. For this reason, a mutant in which some or all of these activities are removed can be used as Cas3 (e.g., the DH74A domain mutant (dnCas3), the K320N mutant with SF2 domain motif 1 (dhCas3), and the S483A/T485A double mutant with SF2 domain motif 3 ( dh2Cas3)). Methods for using a transcription regulation protein in CRISPR-Cas systems are known to those skilled in the art.

Кроме того, в системе CRISPR-Cas3 согласно изобретению рассматривается случай, например, использования мутанта, в котором некоторые или все нуклеазные активности Cas3 были удалены. Белки, обладающие другими нуклеазными активностями, могут быть присоединены к Cas3 или Cascade. Такой вариант входит в объем настоящего изобретения.In addition, the CRISPR-Cas3 system of the invention considers, for example, the use of a mutant in which some or all of the Cas3 nuclease activities have been removed. Proteins with other nuclease activities can be attached to Cas3 or Cascade. Such an option is within the scope of the present invention.

Кроме того, в системе CRISPR-Cas3 согласно изобретению рассматривается случай использования мутанта, в котором некоторые или все нуклеазные активности Cas3 были удалены, и использования ак- 10 040859 тивностей других белков при редактировании ДНК. В настоящем описании активность расщепленияIn addition, the CRISPR-Cas3 system of the invention considers the use of a mutant in which some or all of the Cas3 nuclease activities have been removed and the use of activities of other proteins in DNA editing. In the present description, the cleavage activity

ДНК соответствующим образом интерпретируется как различные активности, которыми обладают эти белки.The DNA is appropriately interpreted as the various activities that these proteins possess.

Кроме того, редактирование ДНК может быть осуществлено на ДНК, содержащейся в конкретной клетке индивидуума. Такое редактирование ДНК может быть осуществлено, например, на конкретной клетке, выбранной в качестве мишени из клеток, составляющих организм животного или растения.In addition, DNA editing can be performed on the DNA contained in a particular cell of an individual. Such DNA editing can be carried out, for example, on a particular cell selected as a target from the cells that make up the animal or plant body.

Метод введения молекул, составляющих систему CRISPR-Cas3 согласно изобретению, в эукариотические клетки в форме полинуклеотида или экспрессионного вектора, содержащего полинуклеотид, не имеет ограничений. Примеры такого метода включают электропорацию, метод с использованием фосфата кальция, липосомный метод, метод с использованием DEAE-декстрана, метод микроинжекции, трансфекцию, опосредованную катионными липидами, электропорацию, трансдукцию и инфицирование вирусными векторами. Такие методы описаны во многих стандартных лабораторных руководствах, таких как Leonard G. Davis et al., Basic methods in molecular biology, New York: Elsevier, 1986.The method of introducing the molecules constituting the CRISPR-Cas3 system according to the invention into eukaryotic cells in the form of a polynucleotide or an expression vector containing a polynucleotide is not limited. Examples of such a method include electroporation, calcium phosphate method, liposome method, DEAE-dextran method, microinjection method, cationic lipid-mediated transfection, electroporation, transduction, and infection with viral vectors. Such methods are described in many standard laboratory manuals such as Leonard G. Davis et al., Basic methods in molecular biology, New York: Elsevier, 1986.

Метод введения молекул системы CRISPR-Cas3 согласно изобретению в эукариотические клетки в форме белка не имеет ограничений. Примерами являются электропорация, трансфекция, опосредованная катионными липидами, и микроинжекция.The method of introducing the molecules of the CRISPR-Cas3 system according to the invention into eukaryotic cells in the form of a protein is not limited. Examples are electroporation, cationic lipid mediated transfection, and microinjection.

Редактирование ДНК согласно изобретению может применяться в различных областях. Примеры применения включают генотерапию, улучшение породы животных, получение трансгенных животных или клеток, получение полезных веществ и исследования в области биологических наук.DNA editing according to the invention can be applied in various fields. Examples of applications include gene therapy, animal breeding, transgenic animals or cells, useful substances, and research in the life sciences.

В качестве методов выращивания особей, не являющихся человеком, из клеток, могут быть применены известные методы. Зародышевые клетки или плюрипотентные стволовые клетки обычно используются в случае выращивания особей, не являющихся человеком, из клеток животных. Так, например, молекулы, составляющие систему CRISPR-Cas3 согласно изобретению, вводят в ооцит. Полученный ооцит затем трансплантируют в матку самки млекопитающего, не являющейся человеком, которая находится в состоянии псевдобеременности. После этого получают помет. Трансплантация может быть проведена в оплодотворенной яйцеклетке 1-клеточного эмбриона, 2-клеточного эмбриона, 4-клеточного эмбриона, 16-клеточного эмбриона или эмбриона на стадии морула. При желании, ооцит можно культивировать до трансплантации в подходящих условиях. Трансплантация и культивирование ооцитов могут быть проведены общеизвестным методом (Nagy A. et al., Manipulation Mouse Embryo, Cold Spring Harbor, New York: Cold Spring Harbor Laboratory Press, 2003). Из индивидуума, не являющегося человеком, также можно получить клоны или потомство, у которых была отредактирована желаемая ДНК.As methods for growing non-humans from cells, known methods can be applied. Germ cells or pluripotent stem cells are commonly used in the case of growing non-humans from animal cells. Thus, for example, the molecules constituting the CRISPR-Cas3 system according to the invention are introduced into an oocyte. The resulting oocyte is then transplanted into the uterus of a non-human female mammal that is in a state of pseudo-pregnancy. After that, a litter is obtained. Transplantation can be performed in a fertilized egg from a 1-cell embryo, 2-cell embryo, 4-cell embryo, 16-cell embryo, or a morula embryo. If desired, the oocyte can be cultured prior to transplantation under suitable conditions. Transplantation and culturing of oocytes can be carried out by a well-known method (Nagy A. et al., Manipulation Mouse Embryo, Cold Spring Harbor, New York: Cold Spring Harbor Laboratory Press, 2003). It is also possible to obtain clones or offspring from a non-human individual in which the desired DNA has been edited.

Кроме того, давно известно, что соматические клетки растений обладают тотипотентностью к дифференцировке, и были разработаны способы регенерации растений из клеток различных полученных растений. Следовательно, может быть получено растение, в котором нужная ДНК была подвергнута нокину путем введения молекул, составляющих систему CRISPR-Cas3 согласно изобретению, в клетки растения и последующей регенерации растений из полученных клеток растений. Также могут быть получены потомство, клоны или материалы для размножения, в которых была отредактирована желаемая ДНК. В качестве метода редифференцировки ткани растения путем культивирования ткани для выращивания особи может быть применен метод, хорошо известный в данной области техники (Protocols for Plant Transformation, edited by TABEI Yutaka, Kagaku-Dojin, pp. 340-347 (2012)).In addition, plant somatic cells have long been known to have totipotency for differentiation, and methods have been developed to regenerate plants from cells of various derived plants. Therefore, a plant in which the desired DNA has been knocked out can be obtained by introducing the molecules constituting the CRISPR-Cas3 system of the invention into plant cells and then regenerating the plants from the obtained plant cells. Progeny, clones or propagation materials can also be obtained in which the desired DNA has been edited. As a method for redifferentiating plant tissue by culturing tissue to grow an individual, a method well known in the art (Protocols for Plant Transformation, edited by TABEI Yutaka, Kagaku-Dojin, pp. 340-347 (2012)) can be applied.

2. Набор, используемый в системе CRISPR-Cas3.2. Kit used in the CRISPR-Cas3 system.

Набор, используемый в системе CRISPR-Cas3 согласно изобретению, включает следующие (А) и (В):The kit used in the CRISPR-Cas3 system according to the invention includes the following (A) and (B):

A) белок Cas3, полинуклеотид, кодирующий этот белок, или экспрессионный вектор, содержащий этот полинуклеотид, иA) a Cas3 protein, a polynucleotide encoding this protein, or an expression vector containing this polynucleotide, and

B) белок Cascade, полинуклеотид, кодирующий этот белок, или экспрессионный вектор, содержащий этот полинуклеотид.B) Cascade protein, a polynucleotide encoding this protein, or an expression vector containing this polynucleotide.

Набор может дополнительно содержать cr-РНК, полинуклеотид, кодирующий cr-РНК, или экспрессионный вектор, содержащий этот полинуклеотид.The kit may further comprise a crRNA, a polynucleotide encoding the crRNA, or an expression vector containing the polynucleotide.

Составные элементы набора согласно изобретению могут представлять собой вариант, в котором все или некоторые из этих элементов являются смешанными, или могут представлять собой вариант, в котором каждый из них является независимым.The constituent elements of the set according to the invention may be a variant in which all or some of these elements are mixed, or may be a variant in which each of them is independent.

Набор согласно изобретению может быть использован в таких областях, как приготовление фармацевтических препаратов, пищевая промышленность, животноводство, рыболовство, различные отрасли промышленности, биотехнология и биологические исследования.The kit according to the invention can be used in fields such as pharmaceutical preparation, food processing, animal husbandry, fisheries, various industries, biotechnology and biological research.

Здесь и далее набор согласно изобретению описан с точки зрения приготовления фармацевтических препаратов (лекарственных средств). Следует отметить, что в случае использования вышеописанного набора в таких областях, как животноводство, биотехнология и биологические исследования, такой набор может быть использован после ознакомления с нижеследующим объяснением на основе общих технических знаний в этих областях.Hereinafter, the kit according to the invention is described from the point of view of the preparation of pharmaceutical preparations (drugs). It should be noted that in the case of using the above-described kit in such fields as animal husbandry, biotechnology and biological research, such a kit can be used after reading the following explanation based on general technical knowledge in these fields.

Фармацевтический препарат для редактирования ДНК клеток животных, включая человека, может быть приготовлен обычными методами с использованием системы CRISPR-Cas3 согласно изобретению.A pharmaceutical preparation for editing the DNA of animal cells, including humans, can be prepared by conventional methods using the CRISPR-Cas3 system of the invention.

- 11 040859- 11 040859

Более конкретно фармацевтический препарат может быть приготовлен путем получения молекул, составляющих систему CRISPR-Cas3 согласно изобретению, например, с использованием добавок к фармацевтическому препарату.More specifically, the pharmaceutical preparation may be prepared by obtaining the molecules constituting the CRISPR-Cas3 system of the invention, for example, using additives to the pharmaceutical preparation.

Используемый здесь термин добавка к фармацевтическому препарату означает вещество, отличающееся от активных ингредиентов, содержащихся в фармацевтическом препарате. Добавка к фармацевтическому препарату представляет собой вещество, содержащееся в фармацевтическом препарате и вводимое для облегчения приготовления, стабилизации качества, повышения эффективности и т.п. Примеры добавок к фармацевтическому препарату, описанных выше, могут включать наполнители, связующие вещества, дезинтеграторы, лубриканты, псевдоожижители (твердые антистатики), красители, покрытия для капсул, агенты для нанесений покрытий, пластификаторы, вкусовые добавки, подсластители, ароматизаторы, растворители, агенты, стимулирующие растворение, эмульгаторы, суспендирующие агенты (чувствительные к давлению адгезивы), загустители, регуляторы pH (подкислители, подщелачивающие агенты и буферы), увлажнители (солюбилизаторы), антибактериальные консерванты, хелатообразующие агенты, основы для суппозиториев, основы для мази, отвердители, мягчители, медицинская вода, пропелленты, стабилизаторы и консерванты. Эти добавки к фармацевтическим препаратам могут быть легко выбраны специалистами в данной области в соответствии с предполагаемой лекарственной формой и способом введения, а также в соответствии со стандартной фармацевтической практикой.As used herein, the term pharmaceutical additive means a substance other than the active ingredients contained in a pharmaceutical preparation. An additive to a pharmaceutical preparation is a substance contained in a pharmaceutical preparation and administered to facilitate preparation, stabilize quality, improve efficiency, and the like. Examples of pharmaceutical additives described above may include fillers, binders, disintegrants, lubricants, fluidizers (solid antistatic agents), colorants, capsule coatings, coating agents, plasticizers, flavoring agents, sweeteners, flavorings, solvents, agents, dissolution promoters, emulsifiers, suspending agents (pressure-sensitive adhesives), thickeners, pH adjusters (acidifiers, alkalizing agents and buffers), humectants (solubilizers), antibacterial preservatives, chelating agents, suppository bases, ointment bases, hardeners, emollients, medical water, propellants, stabilizers and preservatives. These pharmaceutical additives can be readily selected by those skilled in the art according to the intended dosage form and route of administration, as well as standard pharmaceutical practice.

Кроме того, фармацевтический препарат для редактирования ДНК клеток животных с использованием системы CRISPR-Cas3 согласно изобретению может содержать дополнительные активные ингредиенты. Дополнительные активные ингредиенты не имеет конкретных ограничений и могут быть соответствующим образом разработаны специалистами в данной области.In addition, the pharmaceutical preparation for editing DNA of animal cells using the CRISPR-Cas3 system according to the invention may contain additional active ingredients. Additional active ingredients are not particularly limited and may be suitably developed by those skilled in the art.

Конкретные примеры активных ингредиентов и добавок к фармацевтическим препаратам, описанные выше, могут быть изучены в соответствии со стандартами, установленными, например, Управлением по контролю и качеству продуктов и лекарственных средств США (FDA), Европейским агенством по лекарственным средствам (ЕМА), Министерством здравоохранения, труда и благосостояния Японии.Specific examples of active ingredients and pharmaceutical additives described above may be examined in accordance with standards set by, for example, the US Food and Drug Administration (FDA), the European Medicines Agency (EMA), the Department of Health , labor and welfare of Japan.

Примеры способов доставки фармацевтического препарата к желаемым клеткам включают способы с использованием вирусных векторов, нацеленных на клетки (аденовирусных векторов, аденоассоциированных вирусных векторов, лентивирусных векторов, векторов на основе вируса Сендай и т.п.) или антител, специфически распознающих клетки. Фармацевтический препарат может быть приготовлен в любой лекарственной форме в зависимости от цели. Кроме того, вышеуказанный фармацевтический препарат, как и положено, назначается врачом или медицинским работником.Examples of methods for delivering a pharmaceutical preparation to desired cells include methods using cell-targeting viral vectors (adenoviral vectors, adeno-associated viral vectors, lentiviral vectors, Sendai virus vectors, etc.) or antibodies specifically recognizing cells. The pharmaceutical preparation may be formulated into any dosage form depending on the purpose. In addition, the above pharmaceutical preparation, as it should be, is prescribed by a doctor or medical professional.

Набор согласно изобретению предпочтительно включает также инструкцию по его применению.The kit according to the invention preferably also includes instructions for its use.

ПримерыExamples

Настоящее изобретение более подробно описано ниже со ссылкой на примеры, но оно не ограничивается только этими нижеследующими примерами.The present invention is described in more detail below with reference to examples, but is not limited to only these following examples.

А. Создание системы CRISPR-Cas3 в эукариотической клетке.A. Creation of the CRISPR-Cas3 system in a eukaryotic cell.

Материал и метод.Material and method.

1. Получение репортерных векторов, содержащих последовательности-мишени.1. Obtaining reporter vectors containing target sequences.

Последовательности-мишени представляют собой последовательность, происходящую от человеческого гена CCR5 человека (SEQ ID NO: 19), и спейсерную последовательность CRISPR E.coli (SEQ ID NO: 22).The target sequences are a sequence derived from the human human CCR5 gene (SEQ ID NO: 19) and an E. coli CRISPR spacer sequence (SEQ ID NO: 22).

Для встраивания последовательностей-мишеней в векторы были получены синтетический полинуклеотид (SEQ ID NO: 20), содержащий последовательность-мишень, происходящую от человеческого гена CCR5 (SEQ ID NO: 19), и синтетический полинуклеотид (SEQ ID NO: 21), содержащий последовательность, комплементарную вышеуказанной последовательности-мишени (SEQ ID NO: 19). Аналогичным образом были получены синтетический полинуклеотид (SEQ ID NO: 23), содержащий последовательность-мишень, происходящую от спейсерной последовательности CRISPR E.coli (SEQ ID NO: 22), и синтетический полинуклеотид (SEQ ID NO: 24), содержащий последовательность, комплементарную вышеуказанной последовательности-мишени (SEQ ID NO: 22). Все вышеперечисленные синтетические полинуклеотиды были получены от Hokkaido System Science Co., Ltd.To insert target sequences into vectors, a synthetic polynucleotide (SEQ ID NO: 20) containing a target sequence derived from the human CCR5 gene (SEQ ID NO: 19) and a synthetic polynucleotide (SEQ ID NO: 21) containing the sequence complementary to the above target sequence (SEQ ID NO: 19). Similarly, a synthetic polynucleotide (SEQ ID NO: 23) containing a target sequence derived from the E. coli CRISPR spacer sequence (SEQ ID NO: 22) and a synthetic polynucleotide (SEQ ID NO: 24) containing a sequence complementary to the above target sequence (SEQ ID NO: 22). All of the above synthetic polynucleotides were obtained from Hokkaido System Science Co., Ltd.

Вышеуказанные полинуклеотиды были встроены в репортерные векторы методом, описанным в литературе Sakuma T. et al. (2013) Efficient TALEN construction and evaluation methods for human cell and animal applications, Genes to Cells, Vol. 18 (Issue 4), pp. 315-326. Описание этого метода приводится ниже. Сначала полинуклеотиды, имеющие последовательности, комплементарные друг другу (полинуклеотид SEQ ID NO: 20 и полинуклеотид SEQ ID NO: 21; полинуклеотид SEQ ID NO: 23 и полинуклеотид SEQ ID NO: 24), нагревали при 95°С в течение 5 мин, а затем охлаждали до комнатной температуры и гибридизовали. Для вышеуказанной стадии использовали блочный инкубатор (BI-515A, Astec). Затем полинуклеотид, гибридизованный с образованием двухцепочечной структуры, встраивали в базовый вектор с получением репортерного вектора.The above polynucleotides were inserted into reporter vectors by the method described in the literature by Sakuma T. et al. (2013) Efficient TALEN construction and evaluation methods for human cell and animal applications, Genes to Cells, Vol. 18 (Issue 4), pp. 315-326. This method is described below. First, polynucleotides having sequences complementary to each other (polynucleotide of SEQ ID NO: 20 and polynucleotide of SEQ ID NO: 21; polynucleotide of SEQ ID NO: 23 and polynucleotide of SEQ ID NO: 24) were heated at 95°C for 5 min, and then cooled to room temperature and hybridized. For the above step, a block incubator (BI-515A, Astec) was used. The double-stranded hybridized polynucleotide was then inserted into a base vector to form a reporter vector.

Последовательности полученных репортерных векторов представлены в SEQ ID NO: 31 (репортерный вектор, содержащий последовательность-мишень, происходящую от человеческого гена CCR5) и SEQ ID NO: 32 (репортерный вектор, содержащий последовательность-мишень, происходящую от спей- 12 040859 серной последовательности CRISPR Е. сой). Кроме того, структура репортерного вектора показана на фиг. 4(d).The sequences of the resulting reporter vectors are shown in SEQ ID NO: 31 (reporter vector containing a target sequence derived from the human CCR5 gene) and SEQ ID NO: 32 (reporter vector containing a target sequence derived from the CRISPR spacer sequence). E. soy). In addition, the reporter vector structure is shown in FIG. 4(d).

2. Получение экспрессионных векторов Csel (Cas8), Cse2 (Casl 1), Cas5, Cas6, Cas7 и cr-PHK.2. Obtaining expression vectors Csel (Cas8), Cse2 (Casl 1), Cas5, Cas6, Cas7 and cr-RNA.

Амплификация и получение вставок.Amplification and preparation of inserts.

В данном случае рассматриваются полинуклеотиды, имеющие модифицированные последовательности нуклеиновых кислот, кодирующие Csel (Cas8), Cse2 (Casll), Cas5, Cas6 и Cas7 (c SEQ ID NO: 2, SEQ ID NO: 3, SEQ ID NO: 4, SEQ ID NO: 5, и SEQ ID NO: 6 соответственно). Сначала продуцирование полинуклеотидов, связанных с SEQ ID NO: 2-SEQ ID NO: 3-SEQ ID NO: 6-SEQ ID NO: 4-SEQ ID NO: 5 в порядке следования (полинуклеотидов, имеющих связанные последовательности нуклеиновых кислот для кодирования Csel (Cas8)-Cse2 (Casl 1)-Cas7-Cas5-Cas6 в этом порядке), было передано Корпорации GenScript как заказ на приобретение. Последовательности нуклеиновых кислот, кодирующие белки Csel (Cas8)-Cse2 (Casl 1)-Cas7-Cas5-Cas6, были связаны с пептидами 2А (аминокислотная последовательность GSGATNFSLLKQAGDVEENPGP (SEQ ID NO: 58)).In this case, polynucleotides having modified nucleic acid sequences encoding Csel (Cas8), Cse2 (Casll), Cas5, Cas6 and Cas7 (c SEQ ID NO: 2, SEQ ID NO: 3, SEQ ID NO: 4, SEQ ID NO: 5 and SEQ ID NO: 6, respectively). First, the production of polynucleotides linked to SEQ ID NO: 2-SEQ ID NO: 3-SEQ ID NO: 6-SEQ ID NO: 4-SEQ ID NO: 5 in sequential order (polynucleotides having linked nucleic acid sequences for encoding Csel ( Cas8)-Cse2 (Casl 1)-Cas7-Cas5-Cas6 in that order) has been submitted to the GenScript Corporation as a purchase order. Nucleic acid sequences encoding Csel (Cas8)-Cse2 (Casl 1)-Cas7-Cas5-Cas6 proteins were linked to 2A peptides (amino acid sequence GSGATNFSLLKQAGDVEENPGP (SEQ ID NO: 58)).

Следует отметить, что последовательности нуклеиновой кислоты, кодирующие пептиды 2А, слегка различались в зависимости от сайтов связывания белка Cas и представляли собой следующие последовательности.It should be noted that the nucleic acid sequences encoding the 2A peptides differed slightly depending on the binding sites of the Cas protein and were the following sequences.

Последовательность между Csel (Cas8) и Cse2 (Casll)Sequence between Csel (Cas8) and Cse2 (Casll)

GGAAGCGGAGCAACCAACTTCAGCCTGCTGAAGCAGGCCGGCGATGTGGAGGAGA ATCCAGGCCCC (SEQ Ш NO: 59).GGAAGCGGAGCAACCAACTTCAGCCTGCTGAAGCAGGCCGGCGATGTGGAGGAGA ATCCAGGCCCC (SEQ W NO: 59).

Последовательность между Cse2 (Casl 1) и Cas7Sequence between Cse2 (Casl 1) and Cas7

GGCTCCGGCGCCACCAATTTTTCTCTGCTGAAGCAGGCAGGCGATGTGGAGGAGAA CCCAGGACCT (SEQ ID NO: 60).GGCTCCGGCGCCACCAATTTTTCTCTGCTGAAGCAGGCAGGCGATGTGGAGGAGAA CCCAGGACCT (SEQ ID NO: 60).

Последовательность между Cas7 и Cas5Sequence between Cas7 and Cas5

GGATCTGGAGCCACCAATTTCAGCCTGCTGAAGCAAGCAGGCGACGTGGAAGAAAA CCCAGGACCA (SEQ ID NO: 61).GGATCTGGAGCCACCAATTTCAGCCTGCTGAAGCAAGCAGGCGACGTGGAAGAAAA CCCAGGACCA (SEQ ID NO: 61).

Последовательность между Cas5 и Cas6Sequence between Cas5 and Cas6

GGATCTGGGGCTACTAATTTTTCTCTGCTGAAGCAAGCCGGCGACGTGGAAGAGAA TCCAGGACCG (SEQ ID NO: 62).GGATCTGGGGCTACTAATTTTTCTCTGCTGAAGCAAGCCGGCGACGTGGAAGAGAA TCCAGGACCG (SEQ ID NO: 62).

Затем каждый из полинуклеотидов амплифицировали в условиях ПЦР (праймер и период времени), как показано в следующей таблице. Для ПЦР использовали термоячейку 2720 Thermal cycler (прикладные биосистемы).Then, each of the polynucleotides was amplified under PCR conditions (primer and time period) as shown in the following table. For PCR, a 2720 Thermal cycler (applied biosystems) was used.

Таблица 1Table 1

Праймер primer Последовательность Subsequence Время Time Csel-U Csel-U GCAAAGAATTCAGATCTCCACCATGCCTAAGAA GAAGAGAAAAGTGAACCTGCTGATTGAC (SEQ ID NO: 36) GCAAAGAATTCAGATCTCCACCATGCCTAAGAA GAAGAGAAAAGTGAACCTGCTGATTGAC (SEQ ID NO: 36) 98°C (10 сек.) 68°C (1 мин.) 35 циклов 98°C (10 sec.) 68°C (1 min.) 35 cycles Csel-L Csel-L TCATCGATGCATCTCGAGTTATCCATTAGAAGG TCCTCCCTGTGGCTTC (SEQ ID NO: 37) TCATCGATGCATCTCGAGTTATCCATTAGAAGG TCCTCCCTGTGGCTTC (SEQ ID NO: 37) Cse2 - U Cse2-U GCAAAGAATTCAGATCTCCACCATGCCCAAGAA GAAGCGGAAGGTGGCCGATGAGATCGAC (SEQ ID NO: 38) GCAAAGAATTCAGATCTCCACCATGCCCAAGAA GAAGCGGAAGGTGGCCGATGAGATCGAC (SEQ ID NO: 38) 98°C (10 сек.) -+ 68°C (1 мин. ) 35 ЦИКЛОВ8 98°C (10 sec.) -+ 68°C (1 min) 35 CYCLES8 Cse2 - L Cse2-L TCATCGATGCATCTCGAGTTAGGCGTTCTTATTT GTGGTCAGCACGAAG (SEQ ID NO: 39) TCATCGATGCATCTCGAGTTAGGCGTTTCTTATTT GTGGTCAGCACGAAG (SEQ ID NO: 39) Cas5 - U Cas5-U GCAAAGAATTCAGATCTCCACCATGCCCAAGAA GAAGCGGAAGGTGTCCAATTTCATCAAC (SEQ GCAAAGAATTCAGATCTCCACCATGCCCAAGAA GAAGCGGAAGGTGTCCAATTTCATCAAC (SEQ

- 13 040859- 13 040859

ID NO: 40) ID NO: 40) Cas5 - L Cas5-L TCATCGATGCATCTCGAGTTATGCCTCTCCATTG TTCCGCACCCAGCTC (SEQ ID NO: 41) TCATCGATGCATCTCGAGTTATGCCTCTCCATTG TTCCGCACCCAGCTC (SEQ ID NO: 41) Cas6 - U Cas6-U GCAAAGAATTCAGATCTCCACCATGCCCAAGAA GAAGCGGAAAGTGTACCTGAGCAAAGTG (SEQ ID NO: 42) GCAAAGAATTCAGATCTCCACCATGCCCAAGAA GAAGCGGAAAGTGTACCTGAGCAAAGTG (SEQ ID NO: 42) Cas6 - L Cas6-L TCATCGATGCATCTCGAGTTACAGAGGTGCCAG TGACAGCAGCCCAC (SEQ ID NO: 43) TCATCGATGCATCTCGAGTTACAGAGGTGCCAG TGACAGCAGCCCAC (SEQ ID NO: 43) Cas7 - U Cas7-U GCAAAGAATTCAGATCTCCACCATGCCCAAGAA GAAGCGGAAGGTGCGCTCCTACCTGATC (SEQ ID NO: 44) GCAAAGAATTCAGATCTCCACCATGCCCAAGAA GAAGCGGAAGGTGCGCTCCTACCTGATC (SEQ ID NO: 44) 98°C (10 сек.) 68°C (1 мин. 40 сек.) 35 циклов 98°C (10 sec.) 68°C (1 min 40 sec) 35 cycles Cas7 - L Cas7-L TCATCGATGCATCTCGAGTTACTGGCTCACGTC CATTCCTCCCTTGATC (SEQ ID NO: 45) TCATCGATGCATCTCGAGTTACTGGCTCACGTC CATTCCTCCTTGATC (SEQ ID NO: 45)

Полинуклеотиды, имеющие следующие комплементарные последовательности, были получены в виде полинуклеотидов, имеющих последовательности нуклеиновых кислот для экспрессии cr-РНК.Polynucleotides having the following complementary sequences were obtained as polynucleotides having nucleic acid sequences for crRNA expression.

1. Полинуклеотиды для экспрессии cr-РНК, соответствующие последовательности, происходящей от человеческого гена CCR5 (SEQ ID NO: 25 и 26, полученные от Hokkaido System Science Co., Ltd.).1. Polynucleotides for the expression of crRNA corresponding to a sequence derived from the human CCR5 gene (SEQ ID NOs: 25 and 26 obtained from Hokkaido System Science Co., Ltd.).

2. Полинуклеотиды для экспрессии cr-РНК, соответствующие спейсерной последовательности CRISPR E.coli (SEQ ID NO: 27 и 28, полученные от Hokkaido System Science Co., Ltd.).2. Polynucleotides for the expression of crRNA corresponding to the E. coli CRISPR spacer sequence (SEQ ID NOs: 27 and 28, obtained from Hokkaido System Science Co., Ltd.).

3. Полинуклеотиды для экспрессии cr-РНК, соответствующие последовательности, происходящей от человеческого гена EMX1 (SEQ ID NO: 29 и 30, полученные от Pharmac).3. Polynucleotides for the expression of cr-RNA corresponding to the sequence derived from the human EMX1 gene (SEQ ID NOS: 29 and 30 obtained from Pharmac).

Лигирование и трансформация.Ligation and transformation.

В качестве субстратной плазмиды использовали pPB-CAG-EBNXN (поставляемый от Sanger Center). В NEB-буфере смешивали 1,6 мкг субстратной плазмиды, 1 мкл рестриктирующего фермента BgIII (New England Biolabs) и 0,5 мкл XhoI (New England Biolabs) и подвергали реакции при 37°С в течение 2 ч. Расщепленные субстратные плазмиды очищали с помощью набора для гель-экстракции (Qiagen).pPB-CAG-EBNXN (supplied from Sanger Center) was used as the substrate plasmid. 1.6 μg of substrate plasmid, 1 μl of restriction enzyme BgIII (New England Biolabs) and 0.5 μl of XhoI (New England Biolabs) were mixed in NEB buffer and reacted at 37°C for 2 h. Digested substrate plasmids were purified with using a gel extraction kit (Qiagen).

Полученные таким образом субстратные плазмиды и вышеуказанные вставки лигировали с помощью системы сборки Г ибсона. Лигирование осуществляли в соответствии с протоколом системы сборки Гибсона с отношением субстратных плазмид к вставкам, равным 1:1 (при 50°С в течение 25 мин, общий объем реакционного раствора: 8 мкл).The substrate plasmids thus obtained and the above inserts were ligated using the Gibson assembly system. Ligation was performed according to the protocol of the Gibson assembly system with a ratio of substrate plasmids to inserts equal to 1:1 (at 50° C. for 25 min, total volume of reaction solution: 8 μl).

Затем 6 мкл раствора плазмид, полученного, как описано выше (раствора для реакции лигирования), и компетентных клеток (приготовленных в лаборатории Takeda) использовали для проведения трансформации обычным методом.Then, 6 µl of the plasmid solution prepared as described above (ligation solution) and competent cells (prepared by Takeda laboratory) were used to carry out the transformation in the usual manner.

После этого плазмидные векторы очищали от трансформированной E. coli с применением препаративного щелочного метода. Вкратце, плазмидные векторы выделяли с использованием набора QIAprep Spin Miniprep (Qiagen), и выделенные плазмидные векторы очищали методом преципитации этанолом, а затем доводили до концентрации 1 мкг/мкл в ТЕ-буферном растворе.Thereafter, plasmid vectors were purified from transformed E. coli using a preparative alkaline method. Briefly, plasmid vectors were isolated using the QIAprep Spin Miniprep Kit (Qiagen) and the isolated plasmid vectors were purified by ethanol precipitation and then adjusted to 1 μg/μl in TE buffer.

Структура каждого плазмидного вектора показана на фиг. 4(а)-4(с). Кроме того, последовательности нуклеиновых кислот экспрессионных векторов pre-cr-РНК показаны в SEQ ID NO: 33 (экспрессионный вектор для экспрессии cr-РНК, соответствующий последовательности, происходящей от человеческого гена CCR5), SEQ ID NO: 34 (экспрессионный вектор для экспрессии cr-РНК, соответствующий спейсерной последовательности CRISPR E. coli) и SEQ ID NO: 35 (экспрессионный вектор для экспрессии cr-РНК, соответствующий последовательности, происходящей от человеческого гена EMX1).The structure of each plasmid vector is shown in FIG. 4(a)-4(c). In addition, the nucleic acid sequences of the pre-cr RNA expression vectors are shown in SEQ ID NO: 33 (expression vector for expression of cr RNA corresponding to the sequence derived from the human CCR5 gene), SEQ ID NO: 34 (expression vector for expression of cr RNA corresponding to the E. coli CRISPR spacer sequence) and SEQ ID NO: 35 (expression vector for the expression of crRNA corresponding to the sequence derived from the human EMX1 gene).

3. Получение экспрессионного вектора Cas3.3. Obtaining the Cas3 expression vector.

Полинуклеотид, имеющий модифицированную последовательность нуклеиновой кислоты, кодирующую Cas3 (SEQ ID NO: 1), был получен от Genscript. В частности, вектор pUC57, включающий полинуклеотид, описанный выше, был получен от Genscript.A polynucleotide having a modified nucleic acid sequence encoding Cas3 (SEQ ID NO: 1) was obtained from Genscript. In particular, the pUC57 vector comprising the polynucleotide described above was obtained from Genscript.

Вышеуказанный вектор расщепляли рестриктирующим ферментом NotI. Затем для выравнивания края фрагмента использовали 2 ед. фрагмента Кленова (Takara Bio Inc.) и 1 мкл 2,5 мМ смеси dNTP (Takara Bio Inc.). После этого указанный фрагмент очищали путем гель-экстракции (Qiagen). Очищенный фрагмент дополнительно расщепляли рестриктирующим ферментом XhoI и очищали путем гельэкстракции (Qiagen).The above vector was digested with restriction enzyme NotI. Then, 2 units were used to align the edge of the fragment. Klenow fragment (Takara Bio Inc.) and 1 μl of 2.5 mM dNTP mix (Takara Bio Inc.). This fragment was then purified by gel extraction (Qiagen). The purified fragment was further digested with restriction enzyme XhoI and purified by gel extraction (Qiagen).

Очищенный фрагмент лигировали с использованием субстратной плазмиды (вектора pTL2-CAGIRES-NEO, приготовленного в лаборатории Takeda) и набора для лигирования (Mighty Mix, Takara Bio Inc.). После этого трансформацию и очистку проводили так же, как описано в п.2. Выделенный плазмидный вектор получали так, чтобы он имел концентрацию 1 мкг/мкл в ТЕ-буферном растворе.The purified fragment was ligated using a substrate plasmid (pTL2-CAGIRES-NEO vector prepared by Takeda lab) and a ligation kit (Mighty Mix, Takara Bio Inc.). After that, the transformation and purification was carried out in the same way as described in paragraph 2. An isolated plasmid vector was prepared to have a concentration of 1 μg/μl in TE buffer.

4. Получение плазмидного вектора, содержащего BPNLS.4. Obtaining a plasmid vector containing BPNLS.

- 14 040859- 14 040859

Были получены экспрессионные векторы Cas3, Csel (Cas8), Cse2 (Cas11), Cas5, Cas6 и Cas7, в которых BPNLS были связаны с 5'-концом и 3'-концом (см. фиг. 7).Expression vectors Cas3, Csel (Cas8), Cse2 (Cas11), Cas5, Cas6 and Cas7 were generated in which BPNLS were linked to the 5' end and 3' end (see Fig. 7).

Получение вставки для каждой группы белков Cas, содержащих BPNLS на обоих концах, было заказано Thermo Fisher Scientific. Конкретная последовательность вышеуказанной вставки представляет собой (AGATCTTAATACGACTCACTATAGGGAGAGCCGCCACCATGGCC: SEQ ID NO: 56) . (любая из SEQ ID NO: 7-12) - (TAATATCCTCGAG: SEQ ID NO: 57). SEQ ID NO: 56 представляет собой последовательность, снабженную сайтом расщепления ферментов BgIII. SEQ ID NO: 57 представляет собой последовательность, снабженную сайтом расщепления ферментом XhoI.The preparation of an insert for each group of Cas proteins containing BPNLS at both ends was commissioned by Thermo Fisher Scientific. The specific sequence of the above insert is (AGATCTTAATACGACTCACTATAGGGAGAGCCGCCACCATGGCC: SEQ ID NO: 56) . (any one of SEQ ID NO: 7-12) - (TAATATCCTCGAG: SEQ ID NO: 57). SEQ ID NO: 56 is the sequence provided with the BgIII enzyme cleavage site. SEQ ID NO: 57 is the sequence provided with the XhoI cleavage site.

Вектор рМК, включающий вышеуказанную последовательность, расщепляли рестриктирующими ферментами BgIII и XhoI и очищали путем гель-экстракции (Qiagen). Очищенный фрагмент лигировали с использованием субстратной плазмиды (pPB-CAG-EBNXN, поставляемой от Sanger Center) и набора для лигирования (Mighty Mix, Takara Bio Inc.). После этого трансформацию и очистку проводили, как описано в п.2. Выделенный плазмидный вектор получали так, чтобы он имел концентрацию 1 мкг/мкл в ТЕбуферном растворе.The pMK vector containing the above sequence was digested with restriction enzymes BgIII and XhoI and purified by gel extraction (Qiagen). The purified fragment was ligated using a substrate plasmid (pPB-CAG-EBNXN, available from Sanger Center) and a ligation kit (Mighty Mix, Takara Bio Inc.). After that, the transformation and purification was carried out as described in paragraph 2. An isolated plasmid vector was prepared to have a concentration of 1 μg/μl in TE buffer.

5. Получение плазмидного вектора, содержащего Cascade (2A).5. Obtaining a plasmid vector containing Cascade (2A).

Был получен экспрессионный вектор, в котором последовательность нуклеиновой кислоты имела Csel (Cas8), Cse2 (Cas11), Cas7, Cas5 и Cas6, связанные в указанном порядке. Более конкретно был получен экспрессионный вектор, имеющий следующую структуру: (NLS-Cse1 (Cas8): SEQ ID NO: 2)-2A(NLS-Cse2 (Cas11): SEQ ID NO: 3)-2A-(NLS-Cas7: SEQ ID NO: 6)-2A-(NLS-Cas5: SEQ ID NO: 4)-2A(NLS-Cas6: SEQ ID NO: 5) (см. фиг. 8). Следует отметить, что аминокислотная последовательность NLS представляет собой PKKKRKV (SEQ ID NO: 52), а последовательность нуклеиновой кислоты представляет собой CCCAAGAAGAAGCGGAAGGTG (SEQ Ш NO: 53).An expression vector was obtained in which the nucleic acid sequence had Csel (Cas8), Cse2 (Cas11), Cas7, Cas5 and Cas6 linked in that order. More specifically, an expression vector was obtained having the following structure: (NLS-Cse1 (Cas8): SEQ ID NO: 2)-2A(NLS-Cse2 (Cas11): SEQ ID NO: 3)-2A-(NLS-Cas7: SEQ ID NO: 6)-2A-(NLS-Cas5: SEQ ID NO: 4)-2A(NLS-Cas6: SEQ ID NO: 5) (see Fig. 8). Note that the amino acid sequence of NLS is PKKKRKV (SEQ ID NO: 52) and the nucleic acid sequence is CCCAAGAAGAAGCGGAAGGTG (SEQ III NO: 53).

Кроме того, аминокислотная последовательность пептида 2А представляет собой GSGATNFSLLKQAGDVEENPGP (SEQ ID NO: 58) (соответствующие последовательности нуклеиновых кислот представляют собой SEQ ID NO: 59-62).In addition, the amino acid sequence of peptide 2A is GSGATNFSLLKQAGDVEENPGP (SEQ ID NO: 58) (corresponding nucleic acid sequences are SEQ ID NO: 59-62).

Полипептид, имеющий вышеуказанную последовательность нуклеиновой кислоты, был получен от GenScript. Вектор pUC57, включающий вышеуказанную последовательность, расщепляли рестриктирующим ферментом EcoRI-HF и очищали путем гель-экстракции (Qiagen). Очищенный фрагмент лигировали с использованием субстратной плазмиды (вектор pTL2-CAG-IRES-Puro, полученный в лаборатории Takeda), и набора для лигирования (Mighty Mix, Takara Bio Inc.). После этого трансформацию и очистку проводили так же, как в п.2. Выделенный плазмидный вектор получали так, чтобы он имел концентрацию 1 мкг/мкл в ТЕ-буферном растворе.A polypeptide having the above nucleic acid sequence was obtained from GenScript. The pUC57 vector containing the above sequence was digested with restriction enzyme EcoRI-HF and purified by gel extraction (Qiagen). The purified fragment was ligated using a substrate plasmid (vector pTL2-CAG-IRES-Puro obtained from Takeda laboratory) and a ligation kit (Mighty Mix, Takara Bio Inc.). After that, the transformation and purification was carried out in the same way as in paragraph 2. An isolated plasmid vector was prepared to have a concentration of 1 μg/μl in TE buffer.

Пример А-1.Example A-1.

Активность расщепления последовательности-мишени экзогенной ДНК оценивали следующим образом. cr-РНК и Cas3, Cse1 (Cas8), Cse2 (Cas11), Cas5, Cas6 и Cas7, присоединенные к сигналам локализации в ядре для получения модифицированной последовательности нуклеиновой кислоты, были экспрессированы в клетках 293Т HEK (эмбриональных клетках почек человека).The cleavage activity of the exogenous DNA target sequence was evaluated as follows. crRNA and Cas3, Cse1 (Cas8), Cse2 (Cas11), Cas5, Cas6 and Cas7, attached to nuclear localization signals to obtain a modified nucleic acid sequence, were expressed in HEK 293T cells (human kidney embryonic cells).

Перед трансфекцией клетки HEK 293Т культивировали в 10 см-чашке. Культивирование клеток HEK 293Т проводили в среде EF (GIBCO) при 37°С в атмосфере 5% CO2. Плотность клеток HEK 293Т в среде EF доводили до 3x104/100 мкл.Prior to transfection, HEK 293T cells were cultured in a 10 cm dish. Cultivation of HEK 293T cells was performed in EF medium (GIBCO) at 37°C in an atmosphere of 5% CO 2 . The density of HEK 293T cells in EF medium was adjusted to 3x104/100 µl.

Кроме того, 100 нг указанного выше репортерного вектора, 200 нг каждой из плазмиды Cas3, плазмиды Cse1 (Cas8), плазмиды Cse2 (Cas11), плазмиды Cas5, плазмиды Cas6, плазмиды Cas7 и плазмиды cr-РНК; 60 нг вектора pRL-TK (способного экспрессировать люциферазу Renilla, Promega); и 300 нг вектора pBluecscript II KS (+) (Agilent Technologies) смешивали в 25 мкл Opti-MEM (Thermo Fisher Scientific). Условия с использованием репортерного вектора, имеющего последовательность-мишень, происходящую от CCR5 в качестве репортерного вектора, соответствуют условиям 1 на фиг. 1, а условия с использованием репортерного вектора, имеющего спейсерную последовательность CRISPR E. coli, соответствуют условиям 10 на фиг. 1.In addition, 100 ng of the above reporter vector, 200 ng each of Cas3 plasmid, Cse1 (Cas8) plasmid, Cse2 (Cas11) plasmid, Cas5 plasmid, Cas6 plasmid, Cas7 plasmid, and cr-RNA plasmid; 60 ng pRL-TK vector (capable of expressing Renilla luciferase, Promega); and 300 ng of pBluecscript II KS (+) vector (Agilent Technologies) were mixed in 25 μl of Opti-MEM (Thermo Fisher Scientific). Conditions using a reporter vector having a target sequence derived from CCR5 as a reporter vector correspond to conditions 1 in FIG. 1, and conditions using a reporter vector having an E. coli CRISPR spacer sequence correspond to conditions 10 in FIG. 1.

Затем 1,5 мкл липофектамина 2000 (Thermo Fisher Scientific) и 25 мкл OptiMEM (Thermo Fisher Scientific) смешивали и инкубировали при комнатной температуре в течение 5 мин. После этого вышеуказанную смесь плазмида+OptiMEM и смесь липофектамин 2000+OptiMEM смешивали и инкубировали при комнатной температуре в течение 20 мин. Полученную смесь смешивали с 1 мл вышеуказанной среды EF, содержащей клетки HEK 293Т, и высевали в 96-луночный планшет (высевали всего в 12 лунок, по 1 лунке на комбинацию векторов).Then 1.5 µl of Lipofectamine 2000 (Thermo Fisher Scientific) and 25 µl of OptiMEM (Thermo Fisher Scientific) were mixed and incubated at room temperature for 5 minutes. Thereafter, the above plasmid+OptiMEM mixture and Lipofectamine 2000+OptiMEM mixture were mixed and incubated at room temperature for 20 minutes. The resulting mixture was mixed with 1 ml of the above EF medium containing HEK 293T cells and seeded in a 96-well plate (sown in a total of 12 wells, 1 well per combination of vectors).

После культивирования при 37°С в атмосфере 5% CO2 в течение 24 ч проводили двойной анализ на люциферазу в соответствии с протоколом двойного анализа люциферазной системы Dual-Glo (Promega). Для оценки люциферазы и люциферазы Renilla использовали Centra XS3 LB 960 (BERTHOLD TECHNOLOGIES).After culturing at 37° C. in 5% CO 2 for 24 h, a dual assay for luciferase was performed according to the dual assay protocol of the Dual-Glo luciferase system (Promega). Centra XS 3 LB 960 (BERTHOLD TECHNOLOGIES) was used to evaluate luciferase and Renilla luciferase.

Такой же эксперимент был проведен в следующих условиях в качестве контрольного эксперимента.The same experiment was carried out under the following conditions as a control experiment.

1. Вместо любой плазмиды Cas3, плазмиды Cse1 (Cas8), плазмиды Cse2 (Cas11), плазмиды Cas5, плазмиды Cas6 и плазмиды Cas7, то же самое количество вектора pBluecscript II KS (+) (Agilent Tech-1. Instead of any Cas3 plasmid, Cse1 (Cas8) plasmid, Cse2 (Cas11) plasmid, Cas5 plasmid, Cas6 plasmid, and Cas7 plasmid, the same amount of pBluecscript II KS (+) vector (Agilent Tech-

- 15 040859 nologies) смешивали для экспрессии (2-7 на фиг. 1).- 15 040859 nologies) were mixed for expression (2-7 in Fig. 1).

2. Вместо плазмиды cr-РНК, используемой в вышеуказанной процедуре, были смешаны плазмиды для экспрессии cr-РНК, не комплементарной последовательности-мишени. В частности, в целях проведения экспрессии плазмиды для экспрессии cr-РНК, соответствующие спейсерной последовательности CRISPR E. coli, смешивали для нацеливания на последовательность, происходящую от гена CCR5 (8 на фиг. 1), а плазмиды для экспрессии cr-РНК, соответствующей последовательности, происходящей от гена CCR5, смешивали в случае нацеливания на спейсерную последовательность CRISPR E. coli (11 на фиг. 1).2. Instead of the crRNA plasmid used in the above procedure, plasmids were mixed to express crRNA not complementary to the target sequence. In particular, in order to carry out the expression, cr-RNA expression plasmids corresponding to the E. coli CRISPR spacer sequence were mixed to target the sequence derived from the CCR5 gene (8 in Fig. 1), and cr-RNA expression plasmids corresponding to the sequence derived from the CCR5 gene was confounded when targeting the E. coli CRISPR spacer sequence (11 in FIG. 1).

3. В качестве негативного контроля экспрессировали только репортерный вектор, имеющий последовательность-мишень, происходящую от CCR5 (9 на фиг. 1), и только репортерный вектор, имеющий спейсерную последовательность CRISPR E. coli (12 на фиг. 1).3. As a negative control, only a reporter vector having a target sequence derived from CCR5 (9 in Fig. 1) and only a reporter vector having an E. coli CRISPR spacer sequence (12 in Fig. 1) were expressed.

Результаты.Results.

Результаты двойного анализа на люциферазу представлены на графике на фиг. 1, а условия эксперимента показаны в нижней таблице на фиг. 1. На фиг. 1 CCR5-мишень и спейсер-мишень означают последовательность-мишень, происходящую от CCR5, и спейсерную последовательность CRISPR E. coli соответственно. Кроме того, CCR5-cr-РНК и спейсер-cr-РНК представляют собой последовательность, комплементарную CCR5-мишени, и последовательность, комплементарную спейсеру-мишени, соответственно.The results of the dual luciferase assay are plotted in FIG. 1, and the experimental conditions are shown in the bottom table in FIG. 1. In FIG. 1 CCR5 target and spacer target mean the target sequence derived from CCR5 and the E. coli CRISPR spacer sequence, respectively. In addition, CCR5-cr-RNA and spacer-cr-RNA are the sequence complementary to the CCR5 target and the sequence complementary to the target spacer, respectively.

На фиг. 1 система, в которую вводили плазмиду cr-РНК, комплементарную последовательностимишени, и все плазмиды Cas3, Cse1 (Cas8), Cse2 (Cas11), Cas5, Cas6 и Cas7 обладали более высокой активностью расщепления, чем другие системы (при сравнении 1 и 2-8, и 10 и 11). Следовательно, было обнаружено, что Cas3, Cse1 (Cas8), Cse2 (Cas11), Cas5, Cas6 и Cas7 могут экспрессироваться в человеческих клетках посредством экспрессионных векторов в соответствии с вариантом осуществления настоящего изобретения.In FIG. 1 system, into which a cr-RNA plasmid complementary to the target sequence was introduced, and all plasmids Cas3, Cse1 (Cas8), Cse2 (Cas11), Cas5, Cas6 and Cas7 had higher cleavage activity than other systems (comparing 1 and 2- 8, and 10 and 11). Therefore, it has been found that Cas3, Cse1 (Cas8), Cse2 (Cas11), Cas5, Cas6 and Cas7 can be expressed in human cells via expression vectors according to an embodiment of the present invention.

Кроме того, было высказано предположение, что введение указанных выше экспрессионных векторов в человеческие клетки приводит к образованию комплексов Cas3, Cascade и cr-РНК в человеческих клетках и к расщеплению последовательности-мишени.In addition, it has been suggested that the introduction of the above expression vectors into human cells results in the formation of Cas3, Cascade and cr-RNA complexes in human cells and cleavage of the target sequence.

Кроме того, на фиг. 1 сравнение между 8 и 9 и между 11 и 12 показало, что активность расщепления была эквивалентна активности негативных контролен в системе, экспрессирующей cr-РНК, которая не комплементарна последовательности-мишени. Другими словами, было высказано предположение, что система CRISPR-Cas3 согласно изобретению может специфически расщеплять последовательности, комплементарные кРРНК, в клетках млекопитающих.In addition, in FIG. 1 comparison between 8 and 9 and between 11 and 12 showed that the cleavage activity was equivalent to that of the negative controls in a system expressing a crRNA that is not complementary to the target sequence. In other words, it has been suggested that the CRISPR-Cas3 system of the invention can specifically cleave cRRNA complementary sequences in mammalian cells.

Пример А-2.Example A-2.

Был проведен эксперимент для того, чтобы определить, возможно ли расщепление эндогенной ДНК человеческих клеток с помощью систем CRISPR-Cas типа I с применением метода, описанного в примере А-1.An experiment was carried out to determine whether it is possible to cleave the endogenous DNA of human cells using CRISPR-Cas type I systems using the method described in example A-1.

В частности, последовательность нуклеиновой кислоты в человеческих клетках была модифицирована для экспрессии pre-cr-РНК, и Cas3, Cse1 (Cas8), Cse2 (Cas11), Cas5, Cas6 и Cas7, присоединенных к сигналам локализации в ядре, и был проведен анализ на расщепление последовательности эндогенного гена CCR5 клеток.In particular, the nucleic acid sequence in human cells was modified to express pre-cr-RNA, and Cas3, Cse1 (Cas8), Cse2 (Cas11), Cas5, Cas6 and Cas7 attached to nuclear localization signals, and analyzed for cleavage of the sequence of the endogenous CCR5 gene of cells.

Те же самые клетки HEK 239Т, как и в примере А-1, высевали в 24-луночный планшет с плотностью 1x105 клеток/лунку и культивировали в течение 24 ч.The same HEK 239T cells as in Example A-1 were plated in a 24-well plate at a density of 1x105 cells/well and cultured for 24 hours.

мкл Opti-MEM (Thermo Fisher Scientific) смешавали с 1 мкг плазмиды Cas3, 1,3 мкг плазмиды Cse1 (Cas8), 1,3 мкг плазмиды Cse2 (Cas11), 1,1 мкг плазмиды Cas5, 0,8 мкг плазмиды Cas6, 0,3 мкг плазмиды Cas7 и 1 мкг плазмиды cr-РНК. Затем к вышеуказанной смеси ДНК добавляли смесь 5 мкл липофектамина (зарегистрированный товарный знак) 2000 (Thermo Fisher Scientific), 50 мкл Opti-MEM (Thermo Fisher Scientific) и 1 мл среды EF. После этого 1 мл полученной смеси добавляли в вышеуказанный 24-луночный планшет.µl Opti-MEM (Thermo Fisher Scientific) was mixed with 1 µg Cas3 plasmid, 1.3 µg Cse1 (Cas8) plasmid, 1.3 µg Cse2 (Cas11) plasmid, 1.1 µg Cas5 plasmid, 0.8 µg Cas6 plasmid, 0.3 µg Cas7 plasmid and 1 µg cr-RNA plasmid. Then, a mixture of 5 µl of Lipofectamine (registered trademark) 2000 (Thermo Fisher Scientific), 50 µl of Opti-MEM (Thermo Fisher Scientific) and 1 ml of EF medium was added to the above DNA mixture. Thereafter, 1 ml of the resulting mixture was added to the above 24-well plate.

После культивирования при 37°С в атмосфере 5% CO2 в течение 24 ч среду заменяли на 1 мл среды EF. Через 48 ч после трансфекции (через 24 ч после замены среды) клетки собирали и доводили до концентрации 1x104 клеток/5 мкл в PBS.After cultivation at 37°C in an atmosphere of 5% CO 2 for 24 h, the medium was replaced with 1 ml of EF medium. 48 hours after transfection (24 hours after medium change) the cells were collected and brought to a concentration of 1x10 4 cells/5 μl in PBS.

Вышеуказанные клетки нагревали при 95°С в течение 10 мин. Затем добавляли 10 мг протеиназы К и инкубировали при 55°С в течение 70 мин. Кроме того, продукт, подвергнутый термообработке при 95°С в течение 10 мин, использовали в качестве матрицы для ПЦР.The above cells were heated at 95°C for 10 min. Then 10 mg of proteinase K was added and incubated at 55°C for 70 min. In addition, the product heat-treated at 95° C. for 10 min was used as a template for PCR.

мкл вышеуказанной матрицы амплифицировали путем провыедения 35 циклов 2-стадийной ПЦР. В данном случае праймеры, имеющие последовательности SEQ ID NO: 47 и 48, были использованы в качестве праймеров для ПЦР. Кроме того, в качестве ДНК-полимеразы использовали KOD FX (Toyobo Co., Ltd.), а процедуру 2-стадийной ПЦР проводили в соответствии с протоколом, прилагаемым к KOD FX. Продукт, амплифицированный с помощью ПЦР, очищали с использованием набора для ПЦРочистки QIAquick (QIAGEN). Конкретная процедура была проведена в соответствии с протоколом, прилагаемым к вышеуказанному набору.μl of the above template was amplified by 35 cycles of 2-step PCR. In this case, primers having the sequences of SEQ ID NOs: 47 and 48 were used as PCR primers. In addition, KOD FX (Toyobo Co., Ltd.) was used as the DNA polymerase, and the 2-step PCR procedure was performed according to the protocol attached to KOD FX. The PCR amplified product was purified using the QIAquick PCR Purification Kit (QIAGEN). The specific procedure was carried out in accordance with the protocol attached to the above kit.

- 16 040859 dA присоединяли к З'-концу очищенной ДНК, полученной с использованием ДНК-полимеразы rTaq (Toyobo Co., Ltd.). Очищенную ДНК подвергали электрофорезу в 2% агарозном геле и вырезали полосу размером приблизительно от 500 до 700 п.о. Затем ДНК экстрагировали из разрезанного геля и очищали с использованием набора для гель-экстракции (QIAGEN). После этого проводили клонирование ТА с использованием векторной системы Easy pGEM-T (Promega), и вышеуказанную ДНК клонировали. Наконец, ДНК, клонированную щелочным препаративным методом, экстрагировали и анализировали с помощью последовательности Сэнгера. Для анализа использовали набор для секвенирования, который включал терминирующий краситель BigDye (зарегистрированный товарный знак) и реагент для проведения цикла 3.1 (Thermo Fisher Scientific), и анализатор ДНК Applied Biosystems 3730 (Thermo Fisher Scientific).- 16 040859 dA was attached to the 3' end of the purified DNA prepared using rTaq DNA polymerase (Toyobo Co., Ltd.). The purified DNA was subjected to 2% agarose gel electrophoresis and a band of approximately 500 to 700 bp was excised. The DNA was then extracted from the cut gel and purified using a gel extraction kit (QIAGEN). Thereafter, TA was cloned using the Easy pGEM-T vector system (Promega) and the above DNA was cloned. Finally, alkaline preparatively cloned DNA was extracted and analyzed by Sanger sequencing. A sequencing kit was used for analysis, which included a BigDye termination dye (registered trademark) and Run Reagent 3.1 (Thermo Fisher Scientific), and an Applied Biosystems 3730 DNA analyzer (Thermo Fisher Scientific).

Описание эндогенной последовательности гена CCR5, которая является мишенью для системы CRISPR-Cas в этом примере, приводится на фиг. 2. На фиг. 2 экзоны указаны заглавными буквами, а интроны - строчными.A description of the endogenous sequence of the CCR5 gene, which is the target of the CRISPR-Cas system in this example, is shown in FIG. 2. In FIG. 2 exons are indicated in capital letters, and introns in lowercase.

В этом примере мишень представляет собой последовательность в гене CCR5, локализованном в области 21 третьего хромосомного короткого плеча (P) (фиг. 2; вся длина последовательности нуклеиновой кислоты CCR5 показана в SEQ ID NO: 46). В частности, последовательность в экзоне 3 гена CCR5 была использована в качестве последовательности-мишени. В качестве контроля использовали последовательность-мишень Cas9, которая также находилась приблизительно в том же положении. Точнее говоря, вся подчеркнутая последовательность представляет собой последовательность-мишень для системы CRISPR-Cas типа I (AAG и следующие 32 основания), а последовательность с двойным подчеркиванием представляет собой последовательность-мишень для Cas9 (CGG и предыдущие 20 оснований). Последовательность cr-РНК была сконструирована так, чтобы она была нацелена на последовательность-мишень для системы CRISPR-Cas типа I (AAG и следующие 32 основания).In this example, the target is a sequence in the CCR5 gene located in region 21 of the third chromosome short arm (P) (FIG. 2; the entire length of the CCR5 nucleic acid sequence is shown in SEQ ID NO: 46). In particular, a sequence in exon 3 of the CCR5 gene was used as a target sequence. The Cas9 target sequence was used as a control, which was also approximately in the same position. More specifically, the entire underlined sequence is the target sequence for CRISPR-Cas type I (AAG and the next 32 bases), and the double underlined sequence is the target sequence for Cas9 (CGG and the previous 20 bases). The crRNA sequence was designed to target the CRISPR-Cas type I target sequence (AAG and the next 32 bases).

Результаты.Results.

Результаты вышеописанного эксперимента показали, что были получены клон 1 с делетированными 401 п.о., клон 2 с делетированными 341 п.о., клон 3 с делетированными 268 п.о. и клон 4 с делетированными 344 п.о. по сравнению с исходными последовательностями нуклеиновых кислот (фиг. 3A-3D). Это указывает на то, что эндогенная ДНК человеческих клеток может быть делетирована посредством системы CRISPR-Cas3 согласно изобретению. В частности, было высказано предположение, что вышеуказанная система CRISPR-Cas позволяет редактировать ДНК человеческих клеток.The results of the above experiment showed that clone 1 with 401 bp deleted, clone 2 with 341 bp deleted, clone 3 with 268 bp deleted were obtained. and clone 4 with 344 bp deleted. compared to the original nucleic acid sequences (Fig. 3A-3D). This indicates that the endogenous DNA of human cells can be deleted by the CRISPR-Cas3 system of the invention. In particular, it has been suggested that the above CRISPR-Cas system allows editing the DNA of human cells.

В этом примере наблюдали клоны с делециями пар оснований. Этот факт подтверждает, что расщепление ДНК посредством системы CRISPR-Cas3 согласно изобретению происходит в нескольких сайтах.In this example clones with base pair deletions were observed. This fact confirms that DNA cleavage by the CRISPR-Cas3 system according to the invention occurs at several sites.

ДНК из нескольких сотен пар оснований (от 268 до 401 п.о.) была делетирована посредством системы CRISPR-Cas3 согласно изобретению. Эта делеция была более крупной, чем делеция, полученная посредством системы CRISPR-Cas с использованием Cas9 (обычно расщепляющей только в одном сайте ДНК).DNA of several hundred base pairs (from 268 to 401 bp) was deleted using the CRISPR-Cas3 system of the invention. This deletion was larger than the one generated by the CRISPR-Cas system using Cas9 (usually cleaving at only one DNA site).

Пример А-3.Example A-3.

Был проведен эксперимент для того, чтобы определить, может ли эндогенная ДНК человеческих клеток расщепляться системой CRISPR-Cas3 с применением метода, описанного в примере А-1.An experiment was conducted to determine whether endogenous human cell DNA could be cleaved by the CRISPR-Cas3 system using the method described in Example A-1.

В частности, последовательность нуклеиновой кислоты в человеческих клетках была модифицирована для экспрессии pre-cr-РНК и Cas3, Cse1 (Cas8), Cse2 (Cas11), Cas5, Cas6 и Cas7, присоединенных к сигналам локализации в ядре, и был проведен анализ на расщепление последовательности эндогенного гена EMX1 клеток.Specifically, the nucleic acid sequence in human cells was modified to express pre-cr-RNA and Cas3, Cse1 (Cas8), Cse2 (Cas11), Cas5, Cas6, and Cas7 attached to nuclear localization signals, and a cleavage assay was performed. sequences of the endogenous EMX1 gene of cells.

Те же самые клетки HEK 239Т, как и в примере А-1, высевали в 24-луночный планшет с плотностью 1 х 105 клеток/лунку и культивировали в течение 24 ч.The same HEK 239T cells as in Example A-1 were seeded in a 24-well plate at a density of 1 x 105 cells/well and cultured for 24 hours.

мкл Opti-MEM (Thermo Fisher Scientific) смешивали с 500 нг плазмиды Cas3, 500 нг плазмиды Cse1 (Cas8), 1 мкг плазмиды Cse2 (Cas11), 1 мкг плазмиды Cas5, 1 мкг плазмиды Cas6, 3 мкг плазмиды Cas7 и 500 мкг плазмиды cr-РНК. Затем к вышеуказанной смеси добавляли 4 мкл липофектамина (зарегистрированный товарный знак) 2000 (Thermo Fisher Scientific) и 50 мкл Opti-MEM (Thermo Fisher Scientific) и смешивали. Полученную смеси инкубировали при комнатной температуре в течение 20 мин, а затем добавляли к клеткам HEK 293Т.µl Opti-MEM (Thermo Fisher Scientific) was mixed with 500 ng plasmid Cas3, 500 ng plasmid Cse1 (Cas8), 1 µg plasmid Cse2 (Cas11), 1 µg plasmid Cas5, 1 µg plasmid Cas6, 3 µg plasmid Cas7 and 500 µg plasmid cr-RNA. Then, 4 µl of Lipofectamine (registered trademark) 2000 (Thermo Fisher Scientific) and 50 µl of Opti-MEM (Thermo Fisher Scientific) were added to the above mixture and mixed. The resulting mixture was incubated at room temperature for 20 min and then added to HEK 293T cells.

В данном случае структура экспрессионного вектора группы белков Cas, используемой в примере А-3, показана на фиг. 7. Как показано на фиг. 7, вышеупомянутый экспрессионный вектор получают путем объединения последовательности, кодирующей группу белков Cas, с BPNLS (двухкомпонентными NLS) (см. Suzuki K. et al. (2016) In vivo genome editing via CRISPR/Cas9 mediated homology-independent targeted integration, Nature, Vol. 540 (Issue 7631), pp. 144-149). Аминокислотная последовательность BPNLS представляет собой KRTADGSEFESPKKKRKVE (SEQ ID NO: 54), а последовательность нуклеиновой кислоты представляет собой AAGCGGACTGCTGATGGCAGTGAATTTGAGTCCCCAAAGAAGAAGAGAAAGGTGGIn this case, the structure of the expression vector of the Cas group of proteins used in Example A-3 is shown in FIG. 7. As shown in FIG. 7, the above expression vector is obtained by combining a sequence encoding a group of Cas proteins with BPNLS (two-component NLS) (see Suzuki K. et al. (2016) In vivo genome editing via CRISPR/Cas9 mediated homology-independent targeted integration, Nature, Vol.540 (Issue 7631), pp. 144-149). The amino acid sequence of BPNLS is KRTADGSEFESPKKKRKVE (SEQ ID NO: 54) and the nucleic acid sequence is AAGCGGACTGCCTGATGGCAGTGAATTTGAGTCCCCAAAGAAGAAGAGAAAGGTGG

АА (SEQ ID NO: 55).AA (SEQ ID NO: 55).

После культивирования вышеуказанных клеток HEK 293T при 37°С в атмосфере 5% CO2 в течениеAfter culturing the above HEK 293T cells at 37°C in 5% CO2 for

- 17 040859 ч, среду заменяли на 1 мл среды EF (1 мл на 1 лунку). Через 48 ч после трансфекции (через 24 ч после замены среды) клетки собирали и доводили до концентрации 1х104клеток/5 мкл в PBS.- 17 040859 h, the medium was replaced with 1 ml of EF medium (1 ml per 1 well). 48 hours after transfection (24 hours after medium change) the cells were collected and adjusted to a concentration of 1x10 4 cells/5 μl in PBS.

Вышеописанные клетки нагревали при 95°С в течение 10 мин. Затем добавляли 10 мг протеиназы К и инкубировали при 55°С в течение 70 мин. Кроме того, продукт, подвергнутый термообработке приThe cells described above were heated at 95°C for 10 min. Then 10 mg of proteinase K was added and incubated at 55°C for 70 min. In addition, the product subjected to heat treatment at

95°С в течение 10 мин, использовали в качестве матрицы для ПЦР.95°C for 10 min, used as template for PCR.

мкл вышеуказанной матрицы амплифицировали путем проведения 40 циклов 3-стадийной ПЦР. В данном случае праймеры, имеющие последовательности SEQ ID NO: 50 и 51, были использованы в качестве праймеров для ПЦР. Кроме того, в качестве ДНК-полимеразы использовали метку горячей точки (QIAGEN), и проводили процедуру трехстадийной ПЦР в соответствии с протоколом по использованию метки горячей точки. Продукт, амплифицированный с помощью ПЦР, подвергали электрофорезу в 2% агарозном геле и вырезали полосу от около 900 до 1100 п.о. Затем ДНК экстрагировали из разрезанного геля и очищали с использованием набора для гель-экстракции (QIAGEN). Конкретную процедуру осуществляли в соответствии с протоколом, прилагаемым к вышеуказанному набору.μl of the above matrix was amplified by performing 40 cycles of 3-step PCR. In this case, primers having the sequences of SEQ ID NOs: 50 and 51 were used as PCR primers. In addition, a hot spot mark (QIAGEN) was used as a DNA polymerase, and a three-step PCR procedure was performed according to the hot spot mark protocol. The PCR-amplified product was subjected to 2% agarose gel electrophoresis and a band of about 900 to 1100 bp was excised. The DNA was then extracted from the cut gel and purified using a gel extraction kit (QIAGEN). The specific procedure was carried out in accordance with the protocol attached to the above kit.

После этого проводили клонирование ТА с использованием векторной системы Easy pGEM-T (Promega), и вышеуказанную ДНК клонировали. И наконец, ДНК, клонированную щелочным препаративным методом, экстрагировали и анализировали с помощью последовательности Сэнгера. Для анализа использовали набор для секвенирования, который включал терминирующий краситель BigDye (зарегистрированный товарный знак) и реагент для проведения цикла 3.1 (Thermo Fisher Scientific), и анализатор ДНК Applied Biosystems 3730 (Thermo Fisher Scientific).Thereafter, TA was cloned using the Easy pGEM-T vector system (Promega) and the above DNA was cloned. Finally, alkaline preparatively cloned DNA was extracted and analyzed by Sanger sequence. A sequencing kit was used for analysis, which included a BigDye termination dye (registered trademark) and Run Reagent 3.1 (Thermo Fisher Scientific), and an Applied Biosystems 3730 DNA Analyzer (Thermo Fisher Scientific).

Описание эндогенной последовательности гена EMX1, которая является мишенью для системы CRISPR-Cas в примере А-3, приводится на фиг. 5. На фиг. 5 экзоны указаны заглавными буквами, а интроны - строчными.A description of the endogenous sequence of the EMX1 gene that is the target of the CRISPR-Cas system in Example A-3 is shown in FIG. 5. In FIG. Exons 5 are indicated in capital letters, and introns in lowercase.

В примере А-3 мишень представляет собой последовательность в гене EMX1, локализованном в области 13 третьего хромосомного короткого плеча (Р) (фиг. 5; вся длина последовательности нуклеиновой кислоты EMX1 показана в SEQ ID NO: 49). В частности, последовательность в экзоне 3 гена EMX1 была использована в качестве последовательности-мишени. В качестве контроля использовали последовательность-мишень Cas9, которая также находилась приблизительно в том же положении. Точнее говоря, вся подчеркнутая расположенная выше последовательность представляет собой последовательностьмишень для системы CRISPR-Cas типа I (AAG и следующие 32 основания), а подчеркнутая нижерасположенная последовательность представляет собой последовательность-мишень для Cas9 (TGG и предыдущие 20 оснований). Последовательность cr-РНК, используемая в примере А-3, была сконструирована так, чтобы она была нацелена на последовательность-мишень для системы CRISPR-Cas (AAG и следующие 32 основания).In Example A-3, the target is a sequence in the EMX1 gene located in region 13 of the third chromosome short arm (P) (FIG. 5; the entire length of the EMX1 nucleic acid sequence is shown in SEQ ID NO: 49). In particular, a sequence in exon 3 of the EMX1 gene was used as a target sequence. The Cas9 target sequence was used as a control, which was also approximately in the same position. More specifically, the entire underlined sequence above is the CRISPR-Cas type I target sequence (AAG and the next 32 bases), and the underlined sequence below is the Cas9 target sequence (TGG and the previous 20 bases). The crRNA sequence used in Example A-3 was designed to target the target sequence for the CRISPR-Cas system (AAG and the next 32 bases).

Результаты.Results.

Результаты вышеописанного эксперимента показали, что были получены клон 1 с двумя делегированными сайтами 513 и.о. и 363 и.о. и клон 2 с делегированными 694 и.о., по сравнению с исходными последовательностями нуклеиновых кислот (фиг. 6А и 6В). Эти результаты эксперимента также показали, что эндогенная ДНК человеческих клеток может быть делетирована посредством системы CRISPRCas3 согласно изобретению. В частности, было высказано предположение, что вышеуказанная система CRISPR-Cas позволяет редактировать ДНК человеческих клеток.The results of the above experiment showed that clone 1 with two delegated 513 a.i. sites was obtained. and 363 acting and clone 2 with 694 bp delegated compared to the original nucleic acid sequences (FIGS. 6A and 6B). These experimental results also showed that the endogenous DNA of human cells can be deleted by the CRISPRCas3 system of the invention. In particular, it has been suggested that the above CRISPR-Cas system allows editing the DNA of human cells.

Кроме того, аналогично примеру А-2 расщепление происходило в двух или более сайтах двухцепочечной ДНК, и ДНК из нескольких сотен пар оснований была делетирована. Следовательно, результаты примера А-3 более убедительно подтверждают предположения, полученные в примере А-2.In addition, similarly to Example A-2, cleavage occurred at two or more sites in the double stranded DNA and DNA of several hundred base pairs was deleted. Therefore, the results of example A-3 more convincingly confirm the assumptions obtained in example A-2.

Пример А-4.Example A-4.

Активность расщепления последовательности-мишени экзогенной ДНК оценивали следующим образом. Клетки HEK 293Т получали так, чтобы они экспрессировали систему CRISPR-Cas3, в которой последовательности нуклеиновой кислоты были модифицированы, а последовательности нуклеиновой кислоты, кодирующие белки Cascade, были связаны.The cleavage activity of the exogenous DNA target sequence was evaluated as follows. HEK 293T cells were prepared to express the CRISPR-Cas3 system in which nucleic acid sequences were modified and nucleic acid sequences encoding Cascade proteins were linked.

В примере А-4 100 нг репортерного вектора; 200 нг каждой из плазмид Cas3, Cascade (2А) и cr-РНК; 60 нг вектора pRL-TK (способного экспрессировать люциферазу Renilla, Promega) и 300 нг вектора pBluecscript II KS (+) (Agilent Technologies) смешивали в 25 мкл Opti-MEM (Thermo Fisher Scientific). Условия использования репортерного вектора, имеющего последовательность-мишень, происходящую от CCR5, в качестве репортерного вектора, соответствуют условиям 1 в (b) на фиг. 9, а условия использования репортерного вектора, имеющего спейсерную последовательность CRISPR E. coli, соответствуют условиям 6 в (b) на фиг. 9.In example A-4, 100 ng of reporter vector; 200 ng each of Cas3, Cascade (2A) and cr-RNA plasmids; 60 ng of pRL-TK vector (capable of expressing Renilla luciferase, Promega) and 300 ng of pBluecscript II KS (+) vector (Agilent Technologies) were mixed in 25 μl of Opti-MEM (Thermo Fisher Scientific). The conditions for using a reporter vector having a target sequence derived from CCR5 as a reporter vector are as per conditions 1 in (b) in FIG. 9, and the conditions for using a reporter vector having an E. coli CRISPR spacer sequence are those of 6 in (b) of FIG. 9.

В данном случае в качестве вышеописанных репортерных векторов были использованы два вида репортерных векторов, полученных в п.1 препаративного примера (т.е. векторы, имеющие структуру, показанную на фиг. 4(d)). Кроме того, в качестве вышеуказанной плазмиды Cascade (2A) были использованы экспрессионные векторы, полученные в п.4 препаративного примера (т.е. вектор, имеющий структуру, показанную на фиг. 8).Here, as the above-described reporter vectors, two kinds of reporter vectors obtained in Preparative Example 1 (i.e., vectors having the structure shown in Fig. 4(d)) were used. In addition, as the above plasmid Cascade (2A), the expression vectors obtained in step 4 of the preparative example (ie, the vector having the structure shown in Fig. 8) were used.

Двойной люциферазный анализ проводили методом, описанным в примере А-1, за исключением того, что использовали вышеуказанные экспрессионные векторы.A dual luciferase assay was performed as described in Example A-1, except that the above expression vectors were used.

- 18 040859- 18 040859

Более того, такой же эксперимент был проведен при следующих условиях в качестве контрольного эксперимента.Moreover, the same experiment was carried out under the following conditions as a control experiment.

1. Вместо любой из плазмид Cas3 и Cascade (2A) то же самое количество вектора pBluecscript II KS (+) (Agilent Technologies) смешивали для экспрессии (2 и 3 на фиг. 9).1. Instead of either of the Cas3 and Cascade (2A) plasmids, the same amount of pBluecscript II KS (+) vector (Agilent Technologies) was mixed for expression (2 and 3 in FIG. 9).

2. Вместо плазмиды cr-РНК, используемой в вышеуказанной процедуре, были смешаны плазмиды для экспрессии cr-РНК, не комплементарной последовательности-мишени. В частности, в целях проведения экспрессии плазмиды для экспрессии cr-РНК, соответствующие спейсерной последовательности CRISPR E. coli, смешивали для нацеливания на последовательность, происходящую от гена CCR5 (4 на фиг. 9), а плазмиды для экспрессии рРНК, соответствующей последовательности, происходящей от гена CCR5, смешивали в случае нацеливания на спейсерную последовательность CRISPR E. coli (7 на фиг. 9).2. Instead of the crRNA plasmid used in the above procedure, plasmids were mixed to express crRNA not complementary to the target sequence. In particular, in order to carry out expression, plasmids for the expression of crRNA corresponding to the E. coli CRISPR spacer sequence were mixed to target a sequence derived from the CCR5 gene (4 in Fig. 9), and rRNA expression plasmids corresponding to a sequence derived from from the CCR5 gene were mixed when targeting the E. coli CRISPR spacer sequence (7 in Fig. 9).

3. В качестве негативного контроля экспрессировали только репортерный вектор, имеющий последовательность-мишень, происходящую от CCR5 (5 на фиг. 9), и только репортерный вектор, имеющий спейсерную последовательность CRISPR E. coli (8 на фиг. 9).3. As a negative control, only a reporter vector having a target sequence derived from CCR5 (5 in Fig. 9) and only a reporter vector having an E. coli CRISPR spacer sequence (8 in Fig. 9) was expressed.

Результаты.Results.

Результаты двойного анализа на люциферазу представлены на графике фиг. 9, а условия эксперимента показаны в нижней таблице на фиг. 9. На фиг. 9 CCR5-мишень и спейсер-мишень означают последовательность-мишень, происходящую от CCR5, и спейсерную последовательность CRISPR E. coli, соответственно. Кроме того, CCR5-cr-РНК и спейсер-cr-РНК представляют собой последовательность, комплементарную CCR5-мишени, и последовательность, комплементарную спейсеру-мишени, соответственно.The results of the dual assay for luciferase are plotted in FIG. 9, and the experimental conditions are shown in the bottom table in FIG. 9. In FIG. 9 CCR5 target and spacer target means the target sequence derived from CCR5 and the E. coli CRISPR spacer sequence, respectively. In addition, CCR5-cr-RNA and spacer-cr-RNA are the sequence complementary to the CCR5 target and the sequence complementary to the target spacer, respectively.

Как показано на фиг. 9, система, в которую вводили плазмиду cr-РНК, комплементарную последовательности-мишени, и обе плазмиды Cas3 и Cascade (2A), обладали значительно более высокой активностью расщепления, чем другие системы (при сравнении 1 и 2-5 и 6, 7 и 8). Следовательно, было обнаружено, что даже в системе, в которой последовательности нуклеиновых кислот, кодирующие Cascade, были связаны для экспрессии, последовательности, комплементарные cr-РНК в клетках млекопитающих, могут специфически расщепляться посредством системы CRISPR-Cas в соответствии с вариантом осуществления настоящего изобретения.As shown in FIG. 9, the system into which the cr-RNA plasmid complementary to the target sequence and both Cas3 and Cascade (2A) plasmids were introduced had significantly higher cleavage activity than the other systems (comparing 1 and 2-5 and 6, 7 and 8). Therefore, it has been found that even in a system in which nucleic acid sequences encoding Cascade have been linked for expression, sequences complementary to crRNA in mammalian cells can be specifically cleaved by the CRISPR-Cas system according to an embodiment of the present invention.

В. Исследование факторов и т.п., влияющих на редактирование генома системой CRISPR-Cas3 в эукариотической клетке.B. Investigation of factors and the like affecting genome editing by the CRISPR-Cas3 system in a eukaryotic cell.

Материал и метод.Material and method.

1. Конфигурация гена Cas и cr-РНК.1. Configuration of the Cas gene and cr-RNA.

Гены, составляющие Cas3 и Cascade (Cse1, Cse2, Cas5, Cas6 и Cas7), происходящие от штамма E. coli K-12, к которым были присоединены bpNLS с 5'-стороны и с 3'-стороны, были сконструированы и клонированы путем оптимизации кодонов для клеток млекопитающих с последующим синтезом генов. Эти гены были субклонированы ниже промотора CAG pPB-CAG. Плазмида EBNXN была подарена институтом Сэнгера. Мутанты Cas3, такие как Н74А (инактивированная никаза; dn), K320N (инактивированная геликаза; dh), и двойные мутанты S483A и Т485А (инактивированная геликаза, вариант 2; dh2) получали путем аутолигирования ПЦР-продуктов Prime STAR MAX. Что касается плазмиды, экспрессирующей cr-РНК, то была синтезирована последовательность cr-РНК, имеющая два сайта рестриктирующих ферментов BbsI в положении спейсера под контролем промотора U6. Все плазмиды, экспрессирующие cr-РНК, получали путем встраивания двухцепочечных олигонуклеотидов последовательностимишени с 32 парами оснований в сайты рестриктирующего фермента BbsI.The genes constituting Cas3 and Cascade (Cse1, Cse2, Cas5, Cas6, and Cas7) derived from E. coli K-12 strain, to which bpNLS were attached at the 5' side and at the 3' side, were constructed and cloned by codon optimization for mammalian cells followed by gene synthesis. These genes were subcloned downstream of the pPB-CAG CAG promoter. The EBNXN plasmid was donated by the Sanger Institute. Cas3 mutants such as H74A (inactivated nickase; dn), K320N (inactivated helicase; dh), and double mutants S483A and T485A (inactivated helicase variant 2; dh2) were generated by autoligation of Prime STAR MAX PCR products. With regard to the cr-RNA expression plasmid, a cr-RNA sequence was synthesized having two BbsI restriction enzyme sites at the spacer position under the control of the U6 promoter. All crRNA expression plasmids were generated by inserting double-stranded oligonucleotides of the 32 base pair target sequence into BbsI restriction enzyme sites.

Экспрессионная плазмида Cas9-оцрРНК pX330-U6-Chimeric_BB-CBh-hSpCas9 была получена от Addgene. При конструировании рРНК с использованием пакета web-программ для CRISPR, программ для конструирования CRISPR и/или CRISPRdirect были предсказаны уникальные сайты-мишени в геноме человека. Последовательность-мишень клонировали в каркас оцрРНК pX330 в соответствии с протоколом лаборатории Feng Zhang.The Cas9-ssrRNA expression plasmid pX330-U6-Chimeric_BB-CBh-hSpCas9 was obtained from Addgene. Unique target sites in the human genome were predicted when rRNA was constructed using the CRISPR web package, the CRISPR construction software, and/or CRISPRdirect. The target sequence was cloned into the pX330 ssrRNA framework according to the Feng Zhang laboratory protocol.

Репортерная плазмида SSA, содержащая два сайта рестриктирующего фермента BsaI, была подарена профессором YAMAMOTO Takashi из Университета Хиросимы. Последовательность-мишень геномной области была встроена в сайты BsaI. В качестве люциферазного вектора Renilla был получен pRL-TK (Promega). Все плазмиды получали методом Midiprep или Maxiprep с использованием набора для очистки плазмид PureLink HiPure (Thermo Fisher).The SSA reporter plasmid containing two BsaI restriction enzyme sites was donated by Professor YAMAMOTO Takashi of the University of Hiroshima. The target sequence of the genomic region was inserted into the BsaI sites. pRL-TK (Promega) was obtained as the Renilla luciferase vector. All plasmids were prepared by the Midiprep or Maxiprep method using the PureLink HiPure Plasmid Purification Kit (Thermo Fisher).

2. Оценка активности расщепления ДНК в клетках HEK 293T.2. Assessment of DNA cleavage activity in HEK 293T cells.

Анализ SSA проводили, как в примере А, для детектирования активности расщепления ДНК в клетках млекопитающих. Клетки HEK 293Т культивировали при 37°С в 5% CO2 с модифицированной по способу Дульбекко средой Игла с высоким содержанием глюкозы, в которую была добавлена 10% фетальная бычья сыворотка (Thermo fisher). В лунки 96-луночного планшета высевали 0,5х104 клеток. Через 24 ч плазмиды, экспрессирующие Cas3, Cse1, Cse2, Cas7, Cas5, Cas6 и cr-РНК (каждая по 100 нг), репортерные векторы SSA (100 нг) и векторы люциферазы Renilla (60 нг) переносили в клетки HEK 293Т с использованием липофектамина 2000 и OptiMEM (Life Technologies) в соответствии с несколько измененным протоколом. Через двадцать четыре часа после трансфекции проводили двойной анализ люциферазной системы Dual-Glo (Promega) в соответствии с протоколом.SSA analysis was performed as in Example A to detect DNA cleavage activity in mammalian cells. HEK 293T cells were cultured at 37° C. in 5% CO 2 with Dulbecco's Modified High Glucose Eagle's Medium supplemented with 10% fetal bovine serum (Thermo fisher). 0.5x10 4 cells were seeded in the wells of a 96-well plate. After 24 h, plasmids expressing Cas3, Cse1, Cse2, Cas7, Cas5, Cas6, and cr-RNA (100 ng each), SSA reporter vectors (100 ng), and Renilla luciferase vectors (60 ng) were transferred into HEK 293T cells using lipofectamine 2000 and OptiMEM (Life Technologies) according to a slightly modified protocol. Twenty-four hours after transfection, a dual analysis of the Dual-Glo luciferase system (Promega) was performed according to the protocol.

- 19 040859- 19 040859

3. Детектирование INDEL в клетках HEK 293T.3. INDEL detection in HEK 293T cells.

В лунки 24-луночного планшета высевали 6,5х104 клеток. Через 24 ч плазмиды, экспрессирующие Cas3, Cse1, Cse2, Cas7, Cas5, Cas6 и cr-PHK (каждая, 250 нг), переносили в клетки HEK 293T с использованием липофектамина 2000 и OptiMEM (Life Technologies) в соответствии с несколько измененным протоколом. Через два дня после трансфекции общую ДНК экстрагировали из собранных клеток с использованием набора Tissue XS (Takara-bio Inc.) в соответствии с протоколом. Локус-мишень амплифицировали с использованием Gflex (Takara bio Inc.) или Quick Taq HS DyeMix (TOYOBO Co., Ltd.) с последующим электрофорезом в агарозном геле. Для детектирования небольших инсерционных/делеционных мутаций в продуктах ПЦР использовали набор для детектирования мутации SURVEYOR (Integrated DNA Technologies) в соответствии с протоколом. Для клонирования ТА использовали плазмидный вектор pCR4Blunt-TOPO (Life Technologies) в соответствии с протоколом. Для анализа последовательности использовали набор для секвенирования путем проведения циклов с терминацией красителем BigDye Terminator и генетический анализатор ABI PRISM 3130 (Life Technologies).6.5x10 4 cells were seeded in the wells of a 24-well plate. After 24 h, plasmids expressing Cas3, Cse1, Cse2, Cas7, Cas5, Cas6, and cr-RNA (each, 250 ng) were transferred into HEK 293T cells using Lipofectamine 2000 and OptiMEM (Life Technologies) according to a slightly modified protocol. Two days after transfection, total DNA was extracted from harvested cells using the Tissue XS kit (Takara-bio Inc.) according to the protocol. The target locus was amplified using Gflex (Takara bio Inc.) or Quick Taq HS DyeMix (TOYOBO Co., Ltd.) followed by agarose gel electrophoresis. To detect small insertion/deletion mutations in PCR products, the SURVEYOR mutation detection kit (Integrated DNA Technologies) was used according to the protocol. TA was cloned using the pCR4Blunt-TOPO plasmid vector (Life Technologies) according to the protocol. Sequence analysis was performed using a BigDye Terminator sequencing kit and an ABI PRISM 3130 genetic analyzer (Life Technologies).

Для выявления различных необычных мутаций была получена библиотека ДНК продуктов ПЦРамплификации с использованием набора для получения библиотеки ДНК TruSeq Nano DNA Library Prep Kit (Illumina), а секвенирование ампликона осуществляли с использованием MiSeq (2x50 п.о.) в соответствии со стандартной процедурой Macrogen. Необработанные риды образцов картировали на человеческом геноме hg38 с помощью BWA-MEM. Данные охвата были визуализированы с помощью программы визуализации Integrative Genomics Viewer (IGV), и была построена гистограмма для области-мишени.To detect various unusual mutations, a DNA library of PCR products was generated using the TruSeq Nano DNA Library Prep Kit (Illumina), and amplicon sequencing was performed using MiSeq (2x50 bp) according to the standard Macrogen procedure. Raw sample reads were mapped to the human hg38 genome using BWA-MEM. Coverage data was visualized using the Integrative Genomics Viewer (IGV) visualization program and a histogram was plotted for the target region.

Репортерные клетки HEK 293T, имеющие mCherry-P2A-EGFP c321C>G для детекции SNP-KI (SNIP-нокина) в клетках млекопитающих, были подарены профессором NAKADA Shin-ichiro. Репортерные клетки культивировали с 1 мкг/мл пуромицина. Одноцепочечную ДНК или 500 нг донорной плазмиды вводили совместно с CRISPR-Cas3 способом, описанным выше. Все клетки собирали через 5 дней после трансфекции и проводили FACS-анализ с использованием AriaIIIu (BD). GFP-позитивные клетки отсортировывали, и общую ДНК экстрагировали способом, описанным выше. Обмен SNP в геноме детектировали с помощью ПЦР-амплификации с использованием ДНК-полимеразы HiDi (myPOLS Biotec).HEK 293T reporter cells having mCherry-P2A-EGFP c321C>G for SNP-KI (SNIP knockin) detection in mammalian cells were donated by NAKADA Professor Shin-ichiro. Reporter cells were cultured with 1 μg/ml puromycin. Single stranded DNA or 500 ng of donor plasmid was co-administered with CRISPR-Cas3 in the manner described above. All cells were harvested 5 days post-transfection and FACS analyzed using AriaIIIu (BD). GFP positive cells were sorted out and total DNA was extracted as described above. SNP exchange in the genome was detected by PCR amplification using HiDi DNA polymerase (myPOLS Biotec).

4. Детектирование сайтов-кандидатов, не являющихся мишенями.4. Detection of candidate sites that are not targets.

Кандидаты CRISPR типа I-Е, не являющиеся мишенями, детектировали в геноме человека hg38 с использованием GGGenome в соответствии с двумя различными процедурами. В качестве последовательностей-кандидатов PAM были выбраны AAG, ATG, AGG, GAG, TAG и ААС в соответствии с имеющимися отчетами (Leenay, R.T, et al. Mol. Cell 62, 137-147 (2016), Jung, et al. Mol. Cell. 2017 Jung et al., Cell 170, 35-47 (2017)). Положения с меньшим количеством ошибочных спариваний были выбраны в первом подходе для 32 пар оснований последовательности-мишени, исключая положения, кратные 6, поскольку сообщалось, что такие положения не распознаются как сайты-мишени. В следующем подходе области, полностью совпадающие с 5'-концом стороны PAM последовательности-мишени, были детектированы и перечислены в порядке убывания.Non-target type I-E CRISPR candidates were detected in the human hg38 genome using GGGenome according to two different procedures. AAG, ATG, AGG, GAG, TAG and AAC were selected as candidate PAM sequences according to available reports (Leenay, R.T, et al. Mol. Cell 62, 137-147 (2016), Jung, et al. Mol Cell 2017 Jung et al., Cell 170, 35-47 (2017)). Positions with fewer mismatches were chosen in the first approach for the 32 base pairs of the target sequence, excluding positions that are multiples of 6, as such positions were reported not to be recognized as target sites. In the next approach, regions that matched exactly the 5' end of the PAM side of the target sequence were detected and listed in descending order.

5. Глубокое секвенирование с помощью анализа сайтов, не являющихся мишенями.5. Deep sequencing through analysis of non-target sites.

При секвенировании всего генома геномную ДНК экстрагировали из трансфицированных клеток HEK 293T и расщепляли с использованием ультразвукового устройства Covaris. Библиотеку ДНК получали с использованием набора для получения библиотеки ДНК без ПЦР TruSeq DNA PC-Free LT Prep Prep Kit (Illumina), и секвенирование генома проводили с использованием HiSeq X (2x150 п.о.) в соответствии со стандартной процедурой Takara Bio Inc. Исходные риды образцов картировали на человеческом геноме hg38 BWA-MEM и идентифицировали с помощью программы Trimmomatic. Несоответствующие пары ридов и расщепленные риды были исключены с помощью программ samtools и Lumpy-sv, соответственно. В целях обнаружения только крупных делеций в одной и той же хромосоме, пары ридов, картированные на различных хромосомах, удаляли с помощью программы BadMateFilter, входящей в пакет программ для анализа генома. Общее количество несоответствующих пар ридов или расщепленных ридов в области 100 т.п.о. подсчитывали с помощью Bedtools для вычисления частоты встречаемости ошибок с негативным контролем. Специально изготовленные ДНК-зонды SureSelectXT были сконструированы с использованием SureDesign в условиях умеренной жесткости и получены методами Agilent для обогащения кандидатов, не являющихся мишенями, перед секвенированием. Области-мишени отбирали следующим образом. Зонды, находящиеся поблизости от областей-мишеней, охватывали 800 т.п.о. выше PAM и 200 т.п.о. ниже PAM. В непосредственной близости от областей CRISPR-Cas3, не являющихся мишенями, присутствовали кандидаты PAM, расположенные на 9 т.п.о. выше и на 1 т.п.о. ниже. В непосредственной близости от областей CRISPR-Cas9, не являющихся мишенями, присутствовали кандидаты PAM, расположенные на 1 т.п.о. выше и на 1 т.п.о. ниже. После получения библиотеки ДНК с использованием набора реагентов SureSelectXT и специального набора зондов, секвенирование генома проводили с помощью Hiseq 2500 (2x150 п.о.) в соответствии со стандартной процедурой Takara Bio Inc. Несоответствующие пары ридов и расщепленные риды на одной и той же хромосоме исключали методом, описанным выше. Общее количество несоответствующих пар ридов или расщепленных ридов в области 10 т.п.о. подсчитывали с помощью Bedtools для вычисления частоты встречаемости ошибок с негативнымIn whole genome sequencing, genomic DNA was extracted from transfected HEK 293T cells and digested using a Covaris sonicator. A DNA library was prepared using the TruSeq DNA PC-Free LT PC-Free LT Prep Prep Kit (Illumina), and genome sequencing was performed using HiSeq X (2x150 bp) according to the standard procedure of Takara Bio Inc. Initial sample reads were mapped onto the human hg38 BWA-MEM genome and identified using the Trimmomatic program. Mismatched read pairs and split reads were eliminated using the samtools and Lumpy-sv programs, respectively. In order to detect only large deletions in the same chromosome, pairs of reads mapped on different chromosomes were removed using the BadMateFilter program included in the genome analysis software package. The total number of mismatched read pairs or split reads in the 100 kb region. were calculated using Bedtools to calculate the error rate with the negative control. Custom-made SureSelectXT DNA probes were designed using SureDesign under moderate stringency conditions and generated by Agilent methods to enrich non-target candidates prior to sequencing. Target areas were selected as follows. Probes located in the vicinity of target areas covered 800 kb. above PAM and 200 kb. below PAM. In close proximity to non-targeted CRISPR-Cas3 regions, PAM candidates located at 9 kb were present. higher and 1 kb. below. In close proximity to non-targeted CRISPR-Cas9 regions, PAM candidates located at 1 kb were present. higher and 1 kb. below. After obtaining a DNA library using the SureSelectXT reagent kit and a special probe kit, genome sequencing was performed using Hiseq 2500 (2x150 bp) according to the standard procedure of Takara Bio Inc. Mismatched pairs of reads and split reads on the same chromosome were excluded by the method described above. The total number of mismatched read pairs or split reads in the 10 kb region. were calculated using Bedtools to calculate the frequency of occurrence of errors with negative

- 20 040859 контролем.- 20 040859 control.

Пример В-1.Example B-1.

Влияние типов cr-РНК и сигнала локализации в ядре на активность расщепления ДНК.Effect of cr-RNA types and nuclear localization signal on DNA cleavage activity.

В примере А редактирование генома в эукариотических клетках случайно было достигнуто благодаря использованию системы CRISPR-Cas3, содержащей pre-cr-РНК (LRSR; лидерная последовательность-повторяющаяся последовательность-спейсерная последовательность-повторяющаяся последовательность) в качестве cr-РНК. В данном случае авторы настоящего изобретения предположили, что причина, по которой редактирование генома в эукариотических клетках с использованием системы CRISPRCas3 не было успешным в течение многих лет, связана с тем, что в качестве cr-РНК была использована зрелая cr-РНК. Исходя из вышесказанного, помимо pre-cr-РНК (LRSR) в качестве cr-РНК были получены pre-cr-РНК (RSR; повторяющаяся последовательность-спейсерная последовательность-повторяющаяся последовательность) и зрелая cr-РНК (5'-фланкирующая последовательность-спейсерная последовательность-3'-фланкирующая последовательность), и эффективность редактирования генома оценивали с использованием репортерной системы примера А (фиг. 10А и 10В). Последовательности нуклеиновых кислот pre-cr-РНК (LRSR), pre-cr-РНК (RSR) и зрелой cr-РНК показаны в SEQ ID NO: 63, 64 и 65 соответственно.In example A, genome editing in eukaryotic cells was accidentally achieved by using the CRISPR-Cas3 system containing pre-cr-RNA (LRSR; leader-repeated sequence-spacer-repeated sequence) as the crRNA. In this case, the present inventors have suggested that the reason why genome editing in eukaryotic cells using the CRISPRCas3 system has not been successful for many years is due to the fact that mature crRNA has been used as the crRNA. Based on the foregoing, in addition to pre-cr-RNA (LRSR), pre-cr-RNA (RSR; repeat sequence-spacer sequence-repeat sequence) and mature cr-RNA (5'-flanking sequence-spacer sequence-3'-flanking sequence), and the efficiency of genome editing was evaluated using the reporter system of example A (Fig. 10A and 10B). The nucleic acid sequences of pre-cr RNA (LRSR), pre-cr RNA (RSR), and mature cr RNA are shown in SEQ ID NOs: 63, 64 and 65, respectively.

Следовательно, если в системе CRISPR-Cas3c использовалась зрелая cr-РНК, то активности расщепления ДНК-мишени не наблюдалось. С другой стороны, удивительно то, что в случае использования pre-cr-РНК (LRSR и RSR) наблюдалась очень высокая активность расщепления ДНК-мишени. Эти результаты для системы CRISPR-Cas3 контрастируют с результатами для системы CRISPR-Cas9, которая обладала высокой активностью расщепления ДНК при использовании зрелой cr-РНК. Кроме того, этот факт говорит о том, что использование зрелой cr-РНК является одной из причин, по которой редактирование генома с использованием системы CRISPR-Cas3 в эукариотических клетках не удавалось.Therefore, if mature cr-RNA was used in the CRISPR-Cas3c system, no target DNA cleavage activity was observed. On the other hand, surprisingly, in the case of using pre-cr-RNA (LRSR and RSR), a very high cleavage activity of the target DNA was observed. These results for the CRISPR-Cas3 system contrast with those for the CRISPR-Cas9 system, which had high DNA cleavage activity when mature crRNA was used. In addition, this fact suggests that the use of mature cr-RNA is one of the reasons why genome editing using the CRISPR-Cas3 system failed in eukaryotic cells.

Кроме того, исследование также проводили с использованием сигнала локализации в ядре SV40 и двухкомпонетного сигнала транслокации в ядро в качестве сигналов локализации в ядре, присоединенных к Cas3 (фиг. 11). В результате, при использовании двухкомпонетного сигнала транслокации в ядро наблюдалась более высокая активность расщепления ДНК-мишени.In addition, the study was also performed using the SV40 nuclear localization signal and the two-component nuclear translocation signal as nuclear localization signals attached to Cas3 (Fig. 11). As a result, when using a two-component translocation signal into the nucleus, a higher activity of target DNA cleavage was observed.

Поэтому в следующих экспериментах pre-cr-PHK (LRSR) использовали в качестве cr-РНК, а двухкомпонетный сигнал транслокации в ядро использовали в качестве сигнала локализации в ядре.Therefore, in the following experiments, pre-cr-RNA (LRSR) was used as the crRNA and the two-component nuclear translocation signal was used as the nuclear localization signal.

Пример В-2.Example B-2.

Влияние последовательности PAM на активность расщепления ДНК.Effect of PAM sequence on DNA cleavage activity.

В целях подтверждения специфичности системы CRISPR-Cas3 к мишени было исследовано влияние различных последовательностей PAM на активность расщепления ДНК (фиг. 12). В анализе SSA активность расщепления ДНК давала различные результаты для различных последовательностей PAM. Наивысшая активность наблюдалась для 5'-AAG PAM, и заметную активность также проявляли AGG, GAG, TAC, ATG и TAG.In order to confirm the target specificity of the CRISPR-Cas3 system, the effect of various PAM sequences on DNA cleavage activity was examined (FIG. 12). In the SSA assay, DNA cleavage activity gave different results for different PAM sequences. The highest activity was observed for 5'-AAG PAM, and AGG, GAG, TAC, ATG, and TAG also exhibited notable activity.

Пример В-3.Example B-3.

Влияние ошибочного спаривания последовательности cr-РНК и спейсерной последовательности на активность расщепления ДНК.Effect of mismatch between cr-RNA sequence and spacer sequence on DNA cleavage activity.

Ранее проводимые исследования кристаллической структуры Cascade E. coli показали, что между cr-РНК и спейсерной ДНК образуется гетеродуплекс из 5 основных частей. Это происходит из-за нарушения спаривания оснований в каждом шестом положении посредством элемента SAM эффектора Cas7 (фиг. 13). Было оценено влияние ошибочного спаривания последовательности cr-РНК и спейсерной последовательности на активность расщепления ДНК. Активность расщепления резко снижалась при любом одном ошибочном спаривании в инициирующей области (положения 1-8), за исключением оснований, не распознаваемых в качестве мишени (положение 6).Previous studies of the crystal structure of Cascade E. coli showed that a heteroduplex of 5 main parts is formed between cr-RNA and spacer DNA. This is due to base pairing disruption at every sixth position by the Cas7 effector SAM element (FIG. 13). The effect of mismatch between the cr-RNA sequence and the spacer sequence on the activity of DNA cleavage was evaluated. Cleavage activity was drastically reduced for any single mismatch in the initiation region (positions 1-8), except for bases not recognized as targets (position 6).

Пример В-4.Example B-4.

Исследование необходимости участия доменов Cas3 в активности расщепления ДНК.Investigation of the need for the participation of Cas3 domains in the activity of DNA cleavage.

Характеризация in vitro каталитических свойств белка Cas3 показала, что N-концевой нуклеазный домен HD расщепляет одноцепочечную область субстрата ДНК, а затем геликазный домен SF2 у С-конца раскручивает ДНК-мишень АТФ-зависимым образом в направлении 3'-5'. Были получены три мутанта Cas3, а именно мутант домена HD H74A (dnCas3), мутант K320N с мотивом домена SF2 1 (dhCas3) и двойной мутант S483A/T485A с мотивом домена SF2 3 (dh2Cas3) для того, чтобы определить, необходим ли домен Cas3 для расщепления ДНК (фиг. 14). В результате, активность расщепления ДНК полностью исчезала в случае всех трех мутантов белка Cas3, что свидетельствует о том, что Cas3 может расщеплять ДНК-мишень посредством нуклеазного домена HD и геликазного домена SF2.In vitro characterization of the catalytic properties of the Cas3 protein showed that the HD N-terminal nuclease domain cleaves the single-stranded region of the DNA substrate, and then the SF2 helicase domain at the C-terminus unwinds the target DNA in an ATP-dependent manner in the 3'-5' direction. Three Cas3 mutants were generated, namely HD domain mutant H74A (dnCas3), SF2 domain motif 1 mutant K320N (dhCas3), and SF2 domain motif 3 double mutant S483A/T485A (dh2Cas3) in order to determine if a Cas3 domain is needed. for DNA cleavage (Fig. 14). As a result, DNA cleavage activity completely disappeared in the case of all three mutants of the Cas3 protein, indicating that Cas3 can cleave the target DNA through the HD nuclease domain and the SF2 helicase domain.

Пример В-5.Example B-5.

Исследование активности расщепления ДНК системами CRISPR-Cas3 различных типов.Investigation of the activity of DNA cleavage by CRISPR-Cas3 systems of various types.

Системы CRISPR-Cas3 типа 1 имеют высокую степень вариабельности (от А до G типа 1, всего семь типов). В приведенных выше примерах оценена активность расщепления ДНК в эукариотических клетках системой CRISPR-Cas3 типа I-Е. С другой стороны, в этом примере оценивали активность расщепления ДНК системами CRISPR-Cas3 других типов 1 (тип I-F и тип I-G). В частности, Cas3 и Cas5-7Type 1 CRISPR-Cas3 systems have a high degree of variability (from A to G type 1, seven types in total). In the examples above, the activity of DNA cleavage in eukaryotic cells was evaluated by the CRISPR-Cas3 type I-E system. On the other hand, DNA cleavage activity of other types 1 CRISPR-Cas3 systems (type I-F and type I-G) was evaluated in this example. In particular, Cas3 and Cas5-7

- 21 040859- 21 040859

Shewanella putrefaciens типа I-F и Cas5-8 из Pyrococcus furiosus типа I-G были оптимизированы по кодонам и клонированы (фиг. 15). В результате, активность расщепления ДНК была также обнаружена для этих систем CRISPR-Cas3 типа 1 в анализе SSA с использованием клеток 293Т, хотя в эффективности активности расщепления ДНК наблюдались некоторые различия.Shewanella putrefaciens type I-F and Cas5-8 from Pyrococcus furiosus type I-G were codon optimized and cloned (FIG. 15). As a result, DNA cleavage activity was also detected for these CRISPR-Cas3 type 1 systems in the SSA assay using 293T cells, although some differences were observed in the efficiency of DNA cleavage activity.

Пример В-6.Example B-6.

Исследование мутаций, вводимых в эндогенные гены системой CRISPR-Cas3.Study of mutations introduced into endogenous genes by the CRISPR-Cas3 system.

Мутации, введенные в эндогенные гены системой CRISPR-Cas3, были исследованы с использованием системы типа I-Е. Ген EMX1 и ген CCR5 были выбраны в качестве генов-мишеней для получения плазмид pre-cr-РНК (LRSR). Клетки 293Т подвергали липофекции плазмидами, кодирующими pre-crРНК и шесть эффекторов Cas (3, 5-8 и 11). В результате, оценка CRISPR-Cas3 показала, что делеция от нескольких сотен до нескольких тысяч пар оснований происходила, главным образом, в направлении выше 5'-PAM спейсерной последовательности области-мишени (фиг. 16). Была подтверждена микрогомология от 5 до 10 пар оснований в репарированном стыке, что, возможно, было вызвано отжигом комплементарных цепей по пути репарации, зависимого от отжига. Следует отметить, что в зрелых плазмидах cr-РНК, редактирование генома в областях EMX1 и CCR5 не наблюдалось.Mutations introduced into endogenous genes by the CRISPR-Cas3 system were investigated using the type I-E system. The EMX1 gene and the CCR5 gene were selected as target genes for the preparation of pre-cr-RNA (LRSR) plasmids. 293T cells were lipofected with plasmids encoding pre-crRNA and six Cas effectors (3, 5-8 and 11). As a result, CRISPR-Cas3 evaluation showed that a deletion of several hundred to several thousand base pairs occurred mainly upstream of the 5'-PAM spacer sequence of the target region (FIG. 16). Microhomology of 5 to 10 base pairs in the repaired junction was confirmed, which may have been caused by annealing of the complementary strands along an anneal-dependent repair pathway. It should be noted that in mature cr-RNA plasmids, genome editing in the EMX1 and CCR5 regions was not observed.

Было отобрано девяносто шесть клонов ТА и их последовательности сравнивали с последовательностями EMX1 дикого типа путем секвенирования в целях дополнительной характеризации редактирования генома посредством Cas3 путем секвенирования по Сэнгеру и клонирования ТА продуктов ПЦР (фиг. 17). В 24 из 49 клонов наблюдалась делеция как минимум 596 пар оснований, максимум 1447 пар оснований, а в среднем 985 пар оснований, что подтверждает вставку последовательности (эффективность 46,3%). Половина клонов (n=12) имела крупные делеции, включая последовательности PAM и спейсерные последовательности, а другая половина была делетирована перед PAM.Ninety-six TA clones were selected and their sequences compared with wild-type EMX1 sequences by sequencing to further characterize Cas3 genome editing by Sanger sequencing and cloning of TA PCR products (FIG. 17). Twenty-four of the 49 clones had a deletion of at least 596 base pairs, a maximum of 1447 base pairs, and an average of 985 base pairs, confirming the insertion of the sequence (46.3% efficiency). Half of the clones (n=12) had large deletions, including PAM sequences and spacer sequences, and the other half were deleted before PAM.

Дальнейшую характеризацию Cas3 осуществляли путем секвенирования следующего поколения с помощью продуктов амплификации ПНР с набором праймеров в более широких областях, таких как 3,8 т.п.о. гена EMX1 и 9,7 т.п.о. CCR5. Также оценивали множество сайтов PAM (AAG, ATG и TTT) для нацеливания с использованием CRISPR типа I-Е. При секвенировании ампликона, AAG составлял 38,2%, a ATG - 56,4%. По сравнению с 86,4% TTT и 86,4% Cas9, нацеленными на EMX1, уровень охвата в широкой геномной области перед сайтом PAM был значительно снижен. Снижение охвата было аналогичным при нацеливании на область CCR 5. В отличие от этого Cas9 индуцировал небольшие инсерции и небольшие делеции (INDEL) в сайтах-мишенях, тогда как Cas3 не имел небольших мутаций INDEL в PAM или в сайте-мишени. Эти результаты свидетельствуют о том, что система CRISPR-Cas3 вызывает делеции в широком диапазоне перед сайтом-мишенью в клетках человека.Further characterization of Cas3 was performed by next generation sequencing with NRP amplification products with a primer set in broader regions such as 3.8 kb. gene EMX1 and 9.7 kb. CCR5. Multiple PAM sites (AAG, ATG and TTT) were also evaluated for targeting using CRISPR type I-E. When sequencing the amplicon, AAG was 38.2% and ATG was 56.4%. Compared to 86.4% of TTT and 86.4% of Cas9 targeting EMX1, the level of coverage in a wide genomic region upstream of the PAM site was significantly reduced. The reduction in coverage was similar when targeting the CCR 5 region. In contrast, Cas9 induced small insertions and small deletions (INDELs) at target sites, while Cas3 did not have small INDEL mutations at PAM or at the target site. These results indicate that the CRISPR-Cas3 system induces deletions in a wide range upstream of the target site in human cells.

Принимая во внимание ограничения анализа ПЦР, такие как амплификация менее 10 т.п.о. и сильное смещение в пользу более коротких ПЦР-фрагментов, была использована последовательность для захвата на основе микромассивов 1000 т.п.о. или более вокруг локусов-мишеней EMX1 и CCR5 (фиг. 18А и 18В). Также наблюдалось делеция до 24 т.п.о. для локуса EMX1 и до 43 т.п.о. для локуса CCR5. Однако, 90% мутаций в EMX1 и 95% мутаций в CCR5 составляли менее, чем 10 т.п.о. Эти результаты позволяют предположить, что система CRISPR-Cas3 может обладать мощной нуклеазной и геликазной активностями в геноме эукариотов.Considering the limitations of the PCR assay, such as amplification of less than 10 kb. and a strong bias towards shorter PCR fragments, a 1000 kb microarray-based capture sequence was used. or more around the EMX1 and CCR5 target loci (FIGS. 18A and 18B). A deletion up to 24 kb was also observed. for the EMX1 locus and up to 43 kb. for the CCR5 locus. However, 90% of the mutations in EMX1 and 95% of the mutations in CCR5 were less than 10 kb. These results suggest that the CRISPR-Cas3 system may have potent nuclease and helicase activities in the eukaryotic genome.

Следует отметить, что вероятность индуцирования нежелательных мутаций в геномных областях, не являющихся мишенями, создает серьезные проблемы, особенно для клинических применений, как было продемонстрировано для системы CRISPR-Cas9. Но, тем не менее, в случае использования системы CRISPR-Cas3 каких-либо значимых нежелательных эффектов не наблюдалось.It should be noted that the likelihood of inducing unwanted mutations in non-target genomic regions poses serious problems, especially for clinical applications, as has been demonstrated for the CRISPR-Cas9 system. But, nevertheless, in the case of using the CRISPR-Cas3 system, no significant undesirable effects were observed.

Промышленное применениеIndustrial Application

Система CRISPR-Cas3 согласно изобретению позволяет редактировать ДНК эукариотических клеток и, следовательно, может широко применяться в областях, требующих редактирования генома, таких как медицина, сельское хозяйство, лесное хозяйство и рыболовство, различные отрасти промышленности, биологические науки, биотехнология и генотерапия.The CRISPR-Cas3 system according to the invention allows DNA editing of eukaryotic cells and therefore can be widely applied in fields requiring genome editing, such as medicine, agriculture, forestry and fisheries, various industries, biological sciences, biotechnology and gene therapy.

Claims (8)

ФОРМУЛА ИЗОБРЕТЕНИЯCLAIM 1. Способ получения эукариотической клетки с отредактированной эндогенной ДНК, включающий введение системы CRISPR-Cas3 в эукариотическую клетку, где система CRISPR-Cas3 включает следующие (А)-(С):1. A method for obtaining a eukaryotic cell with edited endogenous DNA, which includes introducing the CRISPR-Cas3 system into the eukaryotic cell, where the CRISPR-Cas3 system includes the following (A)-(C): (A) белок Cas3, полинуклеотид, кодирующий этот белок, или экспрессионный вектор, содержащий этот полинуклеотид, (B) белок Cascade, полинуклеотид, кодирующий этот белок, или экспрессионный вектор, содержащий этот полинуклеотид, и (C) пре-cr-РНК, которая нацелена на эндогенную ДНК, полинуклеотид, кодирующий пре-cr-РНК, или экспрессионный вектор, содержащий этот полинуклеотид.(A) a Cas3 protein, a polynucleotide encoding this protein, or an expression vector containing this polynucleotide, (B) a Cascade protein, a polynucleotide encoding this protein, or an expression vector containing this polynucleotide, and (C) pre-cr-RNA, which targets endogenous DNA, a pre-crRNA encoding polynucleotide, or an expression vector containing the polynucleotide. 2. Способ создания животного (за исключением человека) или растения с отредактированной эндогенной ДНК, включающий2. A method for creating an animal (excluding humans) or a plant with edited endogenous DNA, including - 22 040859 введение системы CRISPR-Cas3 животному (за исключением человека) или в растение, где система- 22 040859 administration of the CRISPR-Cas3 system to an animal (excluding humans) or to a plant, where the system CRISPR-Cas3 включает следующеие (А)-(С):CRISPR-Cas3 includes the following (A)-(C): (A) белок Cas3, полинуклеотид, кодирующий этот белок, или экспрессионный вектор, содержащий этот полинуклеотид, (B) белок Cascade, полинуклеотид, кодирующий этот белок, или экспрессионный вектор, содержащий этот полинуклеотид, и (C) пре-cr-РНК, которая нацелена на эндогенную ДНК, полинуклеотид, кодирующий пре-ег-РНК, или экспрессионный вектор, содержащий этот полинуклеотид.(A) a Cas3 protein, a polynucleotide encoding this protein, or an expression vector containing this polynucleotide, (B) a Cascade protein, a polynucleotide encoding this protein, or an expression vector containing this polynucleotide, and (C) pre-cr-RNA, which targets endogenous DNA, a polynucleotide encoding a pre-er RNA, or an expression vector containing the polynucleotide. 3. Способ по п.1 или 2, дополнительно включающий расщепление пре-ег-РНК, которая нацелена на эндогенную ДНК, белком, составляющим белок Cascade, после введения системы CRISPR-Cas3 в эукариотическую клетку.3. The method of claim 1 or 2, further comprising cleaving the pre-er RNA that targets endogenous DNA with the protein constituting the Cascade protein after introducing the CRISPR-Cas3 system into the eukaryotic cell. 4. Способ по любому из пп.1-3, где сигнал локализации в ядре присоединяют к белку Cas3 и/или к белку Cascade.4. The method according to any one of claims 1 to 3, wherein the nuclear localization signal is attached to the Cas3 protein and/or to the Cascade protein. 5. Способ по п.4, где сигнал локализации в ядре представляет собой двухкомпонентный сигнал локализации в ядре.5. The method of claim 4, wherein the nuclear localization signal is a two-component nuclear localization signal. 6. Применение набора в способе по любому из пп.1-5, где набор включает следующие (A)-(C):6. Use of the kit in the method of any one of claims 1-5, wherein the kit includes the following (A)-(C): (A) белок Cas3, полинуклеотид, кодирующий этот белок, или экспрессионный вектор, содержащий этот полинуклеотид, (B) белок Cascade, полинуклеотид, кодирующий этот белок, или экспрессионный вектор, содержащий этот полинуклеотид, и (C) пре-ег-РНК, которая нацелена на эндогенную ДНК, полинуклеотид, кодирующий пре-ег-РНК, или экспрессионный вектор, содержащий этот полинуклеотид.(A) Cas3 protein, a polynucleotide encoding this protein, or an expression vector containing this polynucleotide, (B) Cascade protein, a polynucleotide encoding this protein, or an expression vector containing this polynucleotide, and (C) pre-er-RNA, which targets endogenous DNA, a polynucleotide encoding a pre-er RNA, or an expression vector containing the polynucleotide. 7. Применение по п.6, где сигнал локализации в ядре присоединяют к белку Cas3 и/или к белку Cascade.7. Use according to claim 6, wherein the nuclear localization signal is attached to the Cas3 protein and/or to the Cascade protein. 8. Применение по п.7, где сигнал локализации в ядре представляет собой двухкомпонентный сигнал локализации в ядре.8. Use according to claim 7, wherein the nuclear localization signal is a two-component nuclear localization signal.
EA201992795 2017-06-08 2018-06-08 METHOD FOR OBTAINING EUKARYOTIC CELLS WITH REDACTED DNA AND THE KIT USED IN THIS METHOD EA040859B1 (en)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2017-113747 2017-06-08

Publications (1)

Publication Number Publication Date
EA040859B1 true EA040859B1 (en) 2022-08-08

Family

ID=

Similar Documents

Publication Publication Date Title
JP7430358B2 (en) Method for producing eukaryotic cells with edited DNA, and kits used in the method
CN107208078B (en) Methods and compositions for targeted genetic modification using paired guide RNAs
CN111471719A (en) Efficient non-meiotic allele introgression
JP6958917B2 (en) How to make gene knock-in cells
US20230125704A1 (en) Modified bacterial retroelement with enhanced dna production
EP3546575A1 (en) Genome editing method
US20190223417A1 (en) Genetically modified animals having increased heat tolerance
JP2018531003A6 (en) Genetically modified animals with improved heat resistance
WO2020198541A1 (en) Porcine reproductive and respiratory syndrome virus (prrsv) resistant swine
KR20180021135A (en) Humanized heart muscle
EA040859B1 (en) METHOD FOR OBTAINING EUKARYOTIC CELLS WITH REDACTED DNA AND THE KIT USED IN THIS METHOD
TW202233695A (en) Foki nuclease domain variant
WO2022050377A1 (en) Method for editing target dna, method for producing cell having edited target dna, and dna edition system for use in said methods
WO2021171688A1 (en) Gene knock-in method, method for producing gene knock-in cell, gene knock-in cell, canceration risk evaluation method, cancer cell production method, and kit for use in same
Lucas Toca Edición genómica en ratón basada en la electroporación de CRISPR/Cas9 en cigotos. Aplicación al estudio del síndrome de mano hendida
JP2023131616A (en) Dna editing system, and method of editing target dna using the same, and method of producing cell whose target dna is edited
Shi-Hui et al. The targeting study of human serum albumin gene