CN117866924A - 多sgRNA介导的EXPERTplus先导基因编辑***及其应用 - Google Patents
多sgRNA介导的EXPERTplus先导基因编辑***及其应用 Download PDFInfo
- Publication number
- CN117866924A CN117866924A CN202311581379.5A CN202311581379A CN117866924A CN 117866924 A CN117866924 A CN 117866924A CN 202311581379 A CN202311581379 A CN 202311581379A CN 117866924 A CN117866924 A CN 117866924A
- Authority
- CN
- China
- Prior art keywords
- sgrna
- sequence
- sites
- sequences
- rna
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000010362 genome editing Methods 0.000 title abstract description 26
- 230000001404 mediated effect Effects 0.000 title abstract description 6
- 108091027544 Subgenomic mRNA Proteins 0.000 claims abstract description 116
- 108091032973 (ribonucleotides)n+m Proteins 0.000 claims abstract description 78
- 102100031780 Endonuclease Human genes 0.000 claims description 46
- 238000010839 reverse transcription Methods 0.000 claims description 41
- 108090000623 proteins and genes Proteins 0.000 claims description 39
- 239000013598 vector Substances 0.000 claims description 39
- 238000000034 method Methods 0.000 claims description 29
- 230000008685 targeting Effects 0.000 claims description 29
- 108010092799 RNA-directed DNA polymerase Proteins 0.000 claims description 27
- 102000004169 proteins and genes Human genes 0.000 claims description 21
- 108010042407 Endonucleases Proteins 0.000 claims description 20
- 239000012634 fragment Substances 0.000 claims description 19
- 239000012620 biological material Substances 0.000 claims description 7
- 239000003153 chemical reaction reagent Substances 0.000 claims description 7
- 239000003795 chemical substances by application Substances 0.000 claims description 6
- 108020001507 fusion proteins Proteins 0.000 claims description 5
- 102000037865 fusion proteins Human genes 0.000 claims description 5
- 238000002360 preparation method Methods 0.000 claims description 5
- 238000012216 screening Methods 0.000 claims description 5
- 244000005700 microbiome Species 0.000 claims description 2
- 102100035102 E3 ubiquitin-protein ligase MYCBP2 Human genes 0.000 claims 1
- 230000005782 double-strand break Effects 0.000 abstract description 5
- 102000040650 (ribonucleotides)n+m Human genes 0.000 abstract description 4
- 210000004027 cell Anatomy 0.000 description 55
- 108020004414 DNA Proteins 0.000 description 42
- 238000006467 substitution reaction Methods 0.000 description 33
- 230000035772 mutation Effects 0.000 description 28
- 238000002474 experimental method Methods 0.000 description 25
- 102000053602 DNA Human genes 0.000 description 23
- 230000014509 gene expression Effects 0.000 description 21
- 238000012217 deletion Methods 0.000 description 20
- 101000808011 Homo sapiens Vascular endothelial growth factor A Proteins 0.000 description 19
- 102100039037 Vascular endothelial growth factor A Human genes 0.000 description 19
- 102100024630 Asc-type amino acid transporter 1 Human genes 0.000 description 17
- 108020005004 Guide RNA Proteins 0.000 description 17
- 101150081875 Slc7a10 gene Proteins 0.000 description 17
- 230000037430 deletion Effects 0.000 description 17
- 238000003776 cleavage reaction Methods 0.000 description 14
- 230000007017 scission Effects 0.000 description 14
- 230000000295 complement effect Effects 0.000 description 12
- 239000002773 nucleotide Substances 0.000 description 12
- 125000003729 nucleotide group Chemical group 0.000 description 12
- 238000003780 insertion Methods 0.000 description 11
- 230000037431 insertion Effects 0.000 description 11
- 239000013604 expression vector Substances 0.000 description 10
- 238000012986 modification Methods 0.000 description 10
- 230000004048 modification Effects 0.000 description 10
- RXWNCPJZOCPEPQ-NVWDDTSBSA-N puromycin Chemical compound C1=CC(OC)=CC=C1C[C@H](N)C(=O)N[C@H]1[C@@H](O)[C@H](N2C3=NC=NC(=C3N=C2)N(C)C)O[C@@H]1CO RXWNCPJZOCPEPQ-NVWDDTSBSA-N 0.000 description 10
- 238000010276 construction Methods 0.000 description 9
- 102100023823 Homeobox protein EMX1 Human genes 0.000 description 8
- 101001048956 Homo sapiens Homeobox protein EMX1 Proteins 0.000 description 8
- 125000003275 alpha amino acid group Chemical group 0.000 description 8
- 239000013612 plasmid Substances 0.000 description 8
- 102000004190 Enzymes Human genes 0.000 description 7
- 108090000790 Enzymes Proteins 0.000 description 7
- 238000013461 design Methods 0.000 description 7
- 230000008439 repair process Effects 0.000 description 7
- 230000037429 base substitution Effects 0.000 description 6
- 238000006243 chemical reaction Methods 0.000 description 6
- 108010043471 Core Binding Factor Alpha 2 Subunit Proteins 0.000 description 5
- 108091028043 Nucleic acid sequence Proteins 0.000 description 5
- 102100025373 Runt-related transcription factor 1 Human genes 0.000 description 5
- 101150066299 cas6f gene Proteins 0.000 description 5
- 238000010367 cloning Methods 0.000 description 5
- 230000000694 effects Effects 0.000 description 5
- 239000012139 lysis buffer Substances 0.000 description 5
- 229950010131 puromycin Drugs 0.000 description 5
- 238000001890 transfection Methods 0.000 description 5
- 238000011144 upstream manufacturing Methods 0.000 description 5
- 101100274464 Arabidopsis thaliana CSY4 gene Proteins 0.000 description 4
- 241000196324 Embryophyta Species 0.000 description 4
- 102100039289 Glial fibrillary acidic protein Human genes 0.000 description 4
- 101710193519 Glial fibrillary acidic protein Proteins 0.000 description 4
- 238000012404 In vitro experiment Methods 0.000 description 4
- 241001465754 Metazoa Species 0.000 description 4
- 238000012408 PCR amplification Methods 0.000 description 4
- 230000009471 action Effects 0.000 description 4
- 101150063416 add gene Proteins 0.000 description 4
- 210000005046 glial fibrillary acidic protein Anatomy 0.000 description 4
- 238000013518 transcription Methods 0.000 description 4
- 230000035897 transcription Effects 0.000 description 4
- 108010008532 Deoxyribonuclease I Proteins 0.000 description 3
- 102000007260 Deoxyribonuclease I Human genes 0.000 description 3
- 101000874160 Homo sapiens Succinate dehydrogenase [ubiquinone] iron-sulfur subunit, mitochondrial Proteins 0.000 description 3
- 102100039087 Peptidyl-alpha-hydroxyglycine alpha-amidating lyase Human genes 0.000 description 3
- 102100035726 Succinate dehydrogenase [ubiquinone] iron-sulfur subunit, mitochondrial Human genes 0.000 description 3
- 241000700605 Viruses Species 0.000 description 3
- 125000000539 amino acid group Chemical group 0.000 description 3
- 230000008859 change Effects 0.000 description 3
- 238000000338 in vitro Methods 0.000 description 3
- -1 iscB Proteins 0.000 description 3
- 239000000203 mixture Substances 0.000 description 3
- 229920002401 polyacrylamide Polymers 0.000 description 3
- 108091033409 CRISPR Proteins 0.000 description 2
- 239000001749 Calcium fumarate Substances 0.000 description 2
- 241000701489 Cauliflower mosaic virus Species 0.000 description 2
- 241000124008 Mammalia Species 0.000 description 2
- 101710145242 Minor capsid protein P3-RTD Proteins 0.000 description 2
- 101150038500 cas9 gene Proteins 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 238000001502 gel electrophoresis Methods 0.000 description 2
- 210000001985 kidney epithelial cell Anatomy 0.000 description 2
- 210000004962 mammalian cell Anatomy 0.000 description 2
- 230000037361 pathway Effects 0.000 description 2
- 241000894006 Bacteria Species 0.000 description 1
- 102000004533 Endonucleases Human genes 0.000 description 1
- 241000588724 Escherichia coli Species 0.000 description 1
- 101100341000 Escherichia coli (strain K12) insQ gene Proteins 0.000 description 1
- 101000957437 Homo sapiens Mitochondrial carnitine/acylcarnitine carrier protein Proteins 0.000 description 1
- 102100038738 Mitochondrial carnitine/acylcarnitine carrier protein Human genes 0.000 description 1
- 241000713869 Moloney murine leukemia virus Species 0.000 description 1
- 208000009869 Neu-Laxova syndrome Diseases 0.000 description 1
- 108010077850 Nuclear Localization Signals Proteins 0.000 description 1
- 108010038807 Oligopeptides Proteins 0.000 description 1
- 102000015636 Oligopeptides Human genes 0.000 description 1
- 108020004682 Single-Stranded DNA Proteins 0.000 description 1
- 241001479493 Sousa Species 0.000 description 1
- 230000006978 adaptation Effects 0.000 description 1
- 230000003321 amplification Effects 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 210000004102 animal cell Anatomy 0.000 description 1
- 229910001566 austenite Inorganic materials 0.000 description 1
- 230000001580 bacterial effect Effects 0.000 description 1
- 230000015572 biosynthetic process Effects 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 239000003814 drug Substances 0.000 description 1
- 230000009977 dual effect Effects 0.000 description 1
- 238000001976 enzyme digestion Methods 0.000 description 1
- 206010016256 fatigue Diseases 0.000 description 1
- 238000009472 formulation Methods 0.000 description 1
- 238000012165 high-throughput sequencing Methods 0.000 description 1
- 230000006801 homologous recombination Effects 0.000 description 1
- 238000002744 homologous recombination Methods 0.000 description 1
- 230000005764 inhibitory process Effects 0.000 description 1
- 208000032839 leukemia Diseases 0.000 description 1
- 239000007788 liquid Substances 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 230000033607 mismatch repair Effects 0.000 description 1
- 238000003199 nucleic acid amplification method Methods 0.000 description 1
- 102000039446 nucleic acids Human genes 0.000 description 1
- 108020004707 nucleic acids Proteins 0.000 description 1
- 150000007523 nucleic acids Chemical class 0.000 description 1
- 230000001124 posttranscriptional effect Effects 0.000 description 1
- 108090000765 processed proteins & peptides Proteins 0.000 description 1
- 238000003259 recombinant expression Methods 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000012163 sequencing technique Methods 0.000 description 1
- 238000003786 synthesis reaction Methods 0.000 description 1
- 230000002194 synthesizing effect Effects 0.000 description 1
- 101150044011 tnpB gene Proteins 0.000 description 1
Landscapes
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
Abstract
本发明公开了多sgRNA介导的EXPERTplus先导基因编辑***及其应用。本发明为了提升EXPERT***的编辑效率,在EXPERT***的基础上,在ori‑sgRNA与expegRNA间增设了多条sgRNA。结果显示,EXPERTplus***可以进一步提高编辑效率。相比于PE***,EXPERTplus***可编辑的范围更广,可以实现88bp的精确替换,且编辑效率更高。此外,由于开发的EXPERTplus***仅仅只在一条链上产生切口,没有产生DNA双链断裂,相比于PE3与twin PE***均可能会产生DNA双链断裂,其将产生更低的indels,因此更为安全。
Description
技术领域
本发明属于生物技术领域,具体涉及多sgRNA介导的EXPERTplus先导基因编辑***及其应用。
背景技术
基因编辑技术在医药与农业具有广泛的应用前景,而先导编辑(Prime editor,PE)***是目前最先进的基因编辑技术,其理论上可实现碱基替换,***与删除等任意形式编辑,原理是:将nCas9(Nickase cas9,H840A)与逆转录酶(reverse transcriptase,RT)进行融合,同时在sgRNA上引入一段用于进行修复的RNA模板(后称为pegRNA)。在nCas9-pegRNA复合物将pegRNA的基因组非靶向链切开后,pegRNA的3’末端结合至基因组非靶向链被nCas9切开的末端单链DNA(nick的5’端),然后RT以pegRNA的3’末端延伸RNA为模板进行逆转录,将RNA模板中的突变,***亦或删除信息引入至新合成的DNA中,在细胞机体修复作用下,新合成的DNA单链被整合进基因组,实现定点精确编辑。初代开发的PE2***主要包含一个nCas9-RT融合蛋白与一条pegRNA,在动植物中都得到了成功的应用。
初代PE2***编辑效率极低,为了提高PE2***的效率,科学家对其进行了一系列的改进,比如PE3***,其主要原理通过引入额外一条sgRNA切割pegRNA的靶向链,虽然极大地提高了效率,但同时也增加了indels;David Liu等发现pegRNA的3’端易被降解,于是开发出了epegRNA,进一步提高了PE***的编辑效率;其他科学家,也通过优化核定位信号或者pegRNA的组成等,提高了PE***的效率。2021年David Liu团队开发了PE4与PE5***,其主要原理为:研究发现MMR修复通路对PE***的效率具有显著抑制作用,在引入MLH1突变体后可抑制细胞错配修复通路,PE4与PE5编辑***分别是在PE2与PE3基础上引入MLH1突变体而开发出来的,相比于PE2和PE3***,PE4和PE5显著提高了编辑效率。虽然这些技术大大提高了PE***的编辑效率,但是在这些方法中,pegRNA的3’端均是结合至nCas9-pegRNA产生的切口的5’端,即引物结合位点(PBS)位于pegRNA靶向链的互补区域。这使得PE***仅能编辑切口位置的3’端方向的DNA,大大限制了PE***的编辑范围,使得PE***无法做到中长片段的编辑。
发明内容
本发明要解决的技术问题是如何提高EXPERT的编辑效率。
为了解决上述技术问题,本发明首先提供了一种生物体或生物细胞基因组序列的编辑方法。
本发明提供的生物体或生物细胞基因组序列的编辑方法包括如下步骤:使生物体或生物细胞表达反转录酶、核酸内切酶、ori-sgRNA、expegRNA和m个Mid sgRNA;
所述expegRNA依次包括靶点序列甲、sgRNA骨架、逆转录模板序列、引物结合位点序列;
所述ori-sgRNA依次包括靶点序列乙和所述sgRNA骨架;
所述expegRNA的3’末端结合至所述ori-sgRNA产生切口的5’端;
所述靶点序列甲与所述靶点序列乙之间的片段(该片段不包含靶点序列甲与靶点序列乙)大小为23-100bp且存在PAM序列(即应是sgRNA可以靶向的区域);
每个Mid sgRNA均依次包括靶点序列和所述sgRNA骨架,且其靶向区域位于所述expegRNA靶向区域和所述ori-sgRNA靶向区域之间;所述m为等于或大于1的整数;
所述核酸内切酶在所述expegRNA、所述ori-sgRNA和所述Mid sgRNA引导下可在靶标区域的非靶向链上产生多个DNA切口。
上述方法中,所述核酸内切酶可为现有技术中公知的各种Cas9n或其变体,包括来源于细菌的Cas9n(如SpCas9n、SaCas9n、SaCas9n-KKH等),识别不同PAM的SpCas9变体切刻酶(如xCas9n、Cas9n-NG、Cas9n-VQR、Cas9n-VRER等),Cas9高保真酶变体切刻酶(如HypaCas9n、eSpCas9(1.1)n、Cas9-HF1n等),具有与Cas9功能类似的其他基因编辑核酸内切酶(如IscB,TnpB)等。
进一步的,所述核酸内切酶为nCas9(H840A);所述nCas9(H840A)为A1)或A2):
A1)氨基酸序列是序列1所示的蛋白质;
A2)将序列1所示的氨基酸序列经过一个或几个氨基酸残基的取代和/或缺失和/或添加且具有相同功能的蛋白质;
更进一步的,所述nCas9(H840A)的编码基因为a1)或a2)或a3):
a1)序列2所示的DNA分子;
a2)与a1)限定的核苷酸序列具有75%或75%以上同一性,且编码所述nCas9(H840A)的DNA分子;
a3)在严格条件下与a1)或a2)限定的核苷酸序列杂交,且编码所述nCas9(H840A)的DNA分子。
所述反转录酶可为来源于病毒的反转录酶,如来源于莫洛尼小鼠白血病病毒(Moloney murine leukemia virus,M-MLV)的反转录酶、来源于花椰菜花叶病毒(CaMV)的反转录酶等,也可为来源于细菌的病毒,如来源于大肠杆菌中的反转录酶等。
进一步的,所述反转录酶为M-MLV RT;所述M-MLV RT为B1)或B2):
B1)氨基酸序列是序列3所示的蛋白质;
B2)将序列3所示的氨基酸序列经过一个或几个氨基酸残基的取代和/或缺失和/或添加且具有相同功能的蛋白质;
更进一步的,所述M-MLV RT的编码基因为b1)或b2)或b3):
b1)序列4所示的DNA分子;
b2)与b1)限定的核苷酸序列具有75%或75%以上同一性,且编码所述M-MLV RT的DNA分子;
b3)在严格条件下与b1)或b2)限定的核苷酸序列杂交,且编码所述M-MLV RT的DNA分子;
所述sgRNA骨架的核苷酸序列如序列7所示。
上述方法还包括如下步骤:使生物体或生物细胞表达反转录酶、核酸内切酶、ori-sgRNA、expegRNA、m个Mid sgRNA和筛选剂抗性蛋白。
进一步的,所述筛选剂抗性蛋白为puromycin抗性蛋白;所述puromycin抗性蛋白为D1)或D2):
D1)氨基酸序列是序列5所示的蛋白质;
D2)将序列5所示的氨基酸序列经过一个或几个氨基酸残基的取代和/或缺失和/或添加且具有相同功能的蛋白质。
更进一步的,所述puromycin抗性蛋白的编码基因为d1)或d2)或d3):
d1)序列6所示的DNA分子;
d2)与d1)限定的核苷酸序列具有75%或75%以上同一性,且编码所述puromycin抗性蛋白的DNA分子;
d3)在严格条件下与d1)或d2)限定的核苷酸序列杂交,且编码所述puromycin抗性蛋白的DNA分子。
上述方法中,所述expegRNA可为突变expegRNA;所述突变expegRNA为在所述expegRNA中的RT序列3’端或5’端(在所述expegRNA与DNA 3’端或5’端悬突碱基互补的区域)引入突变碱基后得到的RNA分子。
进一步的,当编辑区域靠近ori-sgRNA产生的nick,且离expegRNA产生的nick较远时,在所述expegRNA中的RT序列3’末端引入突变碱基。
当编辑区域靠近expegRNA产生的nick,且离ori-sgRNA产生的nick较远时,在所述expegRNA中的RT序列5’末端引入突变碱基。
再进一步的,所述引入突变碱基的方式可为碱基替换,将引入突变位点的碱基替换为其它任意一种碱基均可,如将碱基T突变为碱基C、碱基C突变为碱基A、碱基G突变为碱基T、碱基A突变为碱基G等。
更进一步的,所述引入突变碱基的数量可为1-15个,优选10-11个。
在实际应用中,可根据实际需要,选择合适的位点引入合适的突变碱基,如仅期望目标突变位点的碱基发生突变后引起氨基酸序列的改变,而额外引入的突变位点的碱基发生突变后不引起氨基酸序列的改变时,可通过设计对额外引入的突变碱基进行同义突变。
上述方法还包括如下步骤:使生物体或生物细胞表达由核酸内切酶和反转录酶融合而成的融合蛋白、expegRNA、ori-sgRNA、m个Mid sgRNA、筛选剂抗性蛋白,其中,所述expegRNA、所述ori-sgRNA和所述Mid sgRNA由相同或不同的启动子分别驱动进行表达。
进一步的,所述expegRNA、所述ori-sgRNA和所述Mid sgRNA均由U6启动子驱动表达。所述U6启动子的核苷酸序列如序列10所示。
更进一步的,所述expegRNA3’端还包括evopreQ1基序。所述evopreQ1基序的核苷酸序列如序列8所示。
上述方法中,所述m为1。
上述方法还包括如下步骤:将上述反转录酶的编码基因、上述核酸内切酶的编码基因、转录上述ori-sgRNA的DNA分子、转录上述expegRNA的DNA分子、转录上述Mid sgRNA的DNA分子导入生物体或生物细胞中。
进一步的,所述反转录酶的编码基因、所述核酸内切酶的编码基因、所述转录上述ori-sgRNA的DNA分子、所述转录上述expegRNA的DNA分子和转录上述Mid sgRNA的DNA分子通过重组表达载体导入生物体或生物细胞中。所述反转录酶的编码基因、所述核酸内切酶的编码基因、所述转录上述ori-sgRNA的DNA分子、所述转录上述expegRNA的DNA分子和所述转录上述Mid sgRNA的DNA分子可通过同一个重组载体导入生物体或生物细胞中,也可通过两个或者多个重组载体共同导入目的植物中。
更进一步的,所述反转录酶的编码基因、所述核酸内切酶的编码基因、所述转录上述ori-sgRNA的DNA分子、所述转录上述expegRNA的DNA分子和和所述转录上述Mid sgRNA的DNA分子通过同一个重组载体导入生物体或生物细胞中。
在本发明的一个具体实施方式中,所述重组载体含有由核酸内切酶和反转录酶融合而成的融合蛋白的表达盒、expegRNA表达盒、ori-sgRNA表达盒、Mid sgRNA表达盒、筛选剂抗性蛋白表达盒。其中,所述expegRNA表达盒、所述ori-sgRNA表达盒、所述Mid sgRNA表达盒均由U6启动子驱动表达。
上述方法在如下A1)-A3)中任一种中的应用也属于本发明的保护范围:
A1)拓展生物体或生物细胞基因组序列的编辑范围;
A2)提高生物体或生物细胞基因组序列的编辑效率;
A3)制备生物或生物细胞突变体。
为了解决上述技术问题,本发明还提供了成套试剂或与所述成套试剂相关的生物材料。
本发明提供的成套试剂包括上述反转录酶、上述核酸内切酶、上述ori-sgRNA、上述expegRNA和m个上述Mid sgRNA;所述m为所述m为等于或大于1的整数;
本发明提供的与所述成套试剂相关的生物材料为表达所述成套试剂的载体、重组微生物或重组细胞。
进一步的,所述成套试剂还包括上述筛选剂抗性蛋白。
更进一步的,所述m为1,所述成套试剂由上述反转录酶、上述核酸内切酶、上述ori-sgRNA、上述expegRNA和上述Mid sgRNA组成。
上述成套试剂或上述生物材料在如下B1)-B7)任一种中的应用也属于本发明的保护范围:
B1)生物体或生物细胞基因组序列的编辑;
B2)拓展生物体或生物细胞基因组序列的编辑范围;
B3)提高生物体或生物细胞基因组序列的编辑效率;
B4)制备生物体或生物细胞基因组序列的编辑的产品;
B5)制备拓展生物体或生物细胞基因组序列的编辑范围的产品;
B6)制备提高生物体或生物细胞基因组序列的编辑效率的产品;
B7)制备生物或生物细胞突变体。
上述任一所述基因组序列的编辑可为基因组序列的单碱基编辑和/或多碱基编辑,具体包括基因组序列的单碱基替换和/或多碱基替换和/或单碱基***和/或多碱基***和/或单碱基删除和多碱基删除。其中,所述多碱基编辑包括小片段的编辑(如0-10bp的片段编辑)和中长片段的编辑(如10-100bp的片段编辑)。所述中长片段的编辑具体可为88bp的多碱基替换。
上述任一所述生物体可为植物或动物。所述动物可为哺乳动物。所述哺乳动物包括人。
所述生物细胞为可为植物细胞或动物细胞。所述动物可为哺乳动物细胞。所述哺乳动物细胞具体可为人肾上皮细胞系,如人肾上皮细胞系293T。
基于现有PE***的不足,本发明在传统PE***的pegRNA靶向区域的上游(5’方向)设计了另一条靶向与pegRNA相同链的sgRNA(ori-sgRNA),开发了一种新型EXPERT(EXtended Prime EditoR sysTem)先导基因编辑***。该***的工作原理如下:在ori-sgRNA靶向的区域,非靶向链在nCas9-sgRNA的作用下,会产生另一个切口。然后在设计pegRNA时,使pegRNA的3’端结合至sgRNA所在区域的nick的5’端(即PBS位于sgRNA靶向链的互补区域),理论上,ori-sgRNA的切口处至expegRNA的切口处之间的基因组区域,均可被编辑。再加上原本PE***可编辑pegRNA nick的3’端,EXPERT即可实现同时编辑pegRNA nick的5’端和3’端,这极大地拓展了PE的编辑范围。此外,本发明研究发现ori-sgRNA切口和expegRNA切口之间的第一个碱基的突变对该***效率影响较大,在对这两个碱基进行突变后,可大幅度提升EXPERT的编辑效率。接下来鉴于逆转录酶的合成能力有限,EXPERT的编辑范围受限,为了提升EXPERT***的编辑效率,本发明进一步又开发了EXPERTplus编辑***,该***主要原理是在EXPERT的基础上,在ori-sgRNA与expegRNA间***多条sgRNA,结果显示,EXPERTplus***可以进一步提高编辑效率。
相比于PE***,EXPERTplus***可编辑的范围更广,***可到100bp,也可以实现88bp的精确替换,而传统PE编辑***有效编辑范围往往只有40bp左右,且编辑范围越大,效率越低。此外,由于开发的EXPERTplus***仅仅只在一条链上产生切口,没有产生DNA双链断裂,相比于PE3与twin PE***均可能会产生DNA双链断裂,其将产生更低的indels,因此更为安全。
附图说明
图1为EXPERT***的工作原理。
图2为体外实验证明,EXPERT***可以编辑pegRNA nick的5’端。
图3为细胞实验证明,EXPERT***可以实现精确编辑,编辑PE产生的nick的5’端。其中,intended edits是指精确编辑,indels是指非精确的***与缺失。
图4为细胞实验证明,EXPERT***引入突变可显著提高编辑效率。其中,intendededits是指精确编辑,indels是指非精确的***与缺失。
图5为细胞实验证明,相比于csy4***介导的gRNA串联策略,U6串联表达gRNA的EXPERT***效率更高。
图6为细胞实验证明,EXPERT***可实现同时编辑pegRNA靶向区域的nick的5’端和3’端。其中,intended edits是指精确编辑,indels是指非精确的***与缺失。
图7为细胞实验证明,EXPERT***可实现同时删除37bp并且***100bp的组合编辑,也可实现88bp的精确替换。其中,intended edits是指精确编辑,indels是指非精确的***与缺失。
图8为细胞实验证明,EXPERTplus可极大提高EXPERT的编辑效率。其中,intendededits是指精确编辑,indels是指非精确的***与缺失。
具体实施方式
下面结合具体实施方式对本发明进行进一步的详细描述,给出的实施例仅为了阐明本发明,而不是为了限制本发明的范围。以下提供的实施例可作为本技术领域普通技术人员进行进一步改进的指南,并不以任何方式构成对本发明的限制。
下述实施例中的实验方法,如无特殊说明,均为常规方法,按照本领域内的文献所描述的技术或条件或者按照产品说明书进行。下述实施例中所用的材料、试剂等,如无特殊说明,均可从商业途径得到。
下述实施例中的nCas9(H840A)蛋白是Novoprotein的产品,货号为E367。
下述实施例中的RT蛋白是NEB的产品,货号为M0368S。
下述实施例中的载体PE2-U6-puro的构建方法如下:以载体pCMV-PE2(Addgene,货号为132775)为出发载体,采用Nru1(NEB,#R3192L)和Mlu1(NEB,#R3198L)双酶切载体,回收骨架载体备用。然后分别以载体pU6-pegRNA-GG-acceptor(Addgene,货号为132777)、载体pKLV2-U6gRNA5(BbsI)-PGKpuro2AZsG-W(Addgene,货号为67975)和载体pGL3-U6-sgRNA-EGFP(Addgene,货号为107721)为模板,分别采用引物对pU6-Aar1-mRFP1-Aar1-F/pU6-Aar1-mRFP1-Aar1-R、PGK-puro-F/PGK-puro-R、sv40polyA-F/sv40polyA-R进行PCR扩增,分别扩增得到pU6-Aar1-mRFP1-Aar1片段、PGK-puro片段和sv40polyA片段。再将三个片段同时与骨架载体进行同源重组,即得到PE2-U6-puro。引物序列如下:
pU6-Aar1-mRFP1-Aar1-F:aggcgttttgcgctgcttcgcgagagggcctatttcccatgattccttcatatttgcatatacgata caaggctgttagagagataattagaattaatttgactgtaaacacaaagatattagtacaaaatacgtgacgtagaaagtaataatttcttgggtagtt tgcagttttaaaattatgttttaaaatggactatcatatgcttaccgtaacttgaaagtatttcgatttcttggctttatatatcttgtggaaaggacgaaac accATGCGCAGGTGgtagtcaaaagcctccggtc;
pU6-Aar1-mRFP1-Aar1-R:gaaaagcgcctcccctacccCACCTGCaaaaaaaacgagacctccctatcagtga;
PGK-puro-F:gggtaggggaggcgcttttc;
PGK-puro-R:ggcaccgggcttgcgggtca;
sv40polyA-F:tgacccgcaagcccggtgccTAAAGCGCTaacttgtttattgcagctta;
sv40polyA-R:tagtcaataatcaatgtcaacgcgttaagatacattgatgagttt。
下述实施例中的载体PE2-U6-puro-csy4的构建方法如下:委托金斯瑞生物科技有限公司合成序列11所示的“csy4蛋白-P2A自剪切肽”的核苷酸序列,然后将其克隆至PE2-U6-puro载体的Xho1酶切位点,得到PE2-U6-puro-csy4载体。
实施例1、EXPERT基因编辑***的工作原理、主要元件与表达载体的设计
一、EXPERT基因编辑***的工作原理
本发明在传统PE***的5’基因组区域,增设了一条sgRNA(本发明中记作为ori-sgRNA),得到EXPERT基因编辑***。ori-sgRNA和传统PE***中的pegRNA(本发明中记作为expegRNA)靶向基因组序列的同一条链,再通过设计expegRNA的3’末端延伸序列,使得expegRNA的3’末端结合至ori-sgRNA切口的5’端,即将ori-sgRNA靶向区域的互补链作为expegRNA的PBS区域。理论上,ori-sgRNA的切口处至expegRNA的切口处之间的基因组区域,均可被编辑。再加上传统PE***可编辑pegRNA nick的3’端,EXPERT基因编辑***即可实现同时编辑pegRNA nick的5’端和3’端,与现有技术中的仅能编辑切口位置的3’端方向的DNA的传统PE***相比,大大拓展了可编辑范围。具体工作原理的示意图如图1所示。
二、EXPERT基因编辑***的主要元件设计
本发明中的EXPERT基因编辑***的主要元件包括核酸内切酶(如nCas9(H840A))、逆转录酶(如M-MLV RT)、ori-sgRNA、expegRNA。
其中,expegRNA依次包括靶点序列(本发明中记作靶点序列甲)、sgRNA骨架、逆转录模板序列(RT序列)、引物结合位点序列(PBS序列)。
ori-sgRNA为在expegRNA靶向区域的上游(5’方向)设计的另一条sgRNA,其依次包括靶点序列(本发明中记作靶点序列乙)和sgRNA骨架。
ori-sgRNA靶向与expegRNA相同的链,且在ori-sgRNA靶向的区域,非靶向链在nCas9-ori-sgRNA的作用下,会产生另一个切口。
expegRNA中的RT序列为靶点序列乙3’端倒数第3个碱基开始及其后连续的一段与编辑后的基因组序列反向的互补序列,作为反转录酶的反转录模板,反转录出cDNA,然后作为修复模板,对基因组DNA进行修复。RT序列大小可为10-150bp。
expegRNA中的PBS序列为靶点序列乙5’端第n个碱基到第17个碱基靶点序列的反向互补序列(1≤n<17)。expegRNA的3’端结合至ori-sgRNA所在区域的nick的5’端,即expegRNA中的PBS序列位于ori-sgRNA靶向链的互补区域。
上述靶点序列甲和上述靶点序列乙之间的片段大小为10-100bp。
三、EXPERT基因编辑***表达载体的设计
本发明中的EXPERT基因编辑***表达载体包括nCas9(H840A)&M-MLV RT表达盒、ori-sgRNA&expegRNA表达盒和CSY4&PuroR表达盒。
其中,nCas9(H840A)&M-MLV表达盒由pCMV启动子驱动表达,依次包括pCMV启动子序列、nCas9(H840A)编码基因序列、M-MLV编码基因序列。
ori-sgRNA&expegRNA表达盒由pU6启动子驱动表达,依次包括pU6启动子序列、ori-sgRNA编码基因序列、CSY4位点、expegRNA编码基因序列。
CSY4&PuroR表达盒由pPGK启动子驱动表达,依次包括pPGK启动子序列、CSY4蛋白编码基因序列、自切割寡肽P2A编码基因和PuroR编码基因序列。
实施例2、体外实验证明EXPERT***可以编辑pegRNAnick的5’端
一、expegRNA、ori-sgRNA、pegRNA的制备
1、委托擎科生物有限公司合成expegRNA序列并克隆至pUC57质粒中,得到EXPERTexpegRNA的质粒。expegRNA序列如下:GATGTCTGCAGGCCAGATGAgttttagagctagaaatagcaagttaaaataaggctagtccgttatcaacttgaaaaagtggca ccgagtcggtgcAATGTGCCATCTGGAGCCCTCAtgatggccatgttatcctcctcgcccttgctcaccatGGCTGGA GTGA。
2、将T7启动子加至引物上,再以上述EXPERT expegRNA的质粒为模板分别采用expegRNA-F/expegRNA-R、ori-sgRNA-F/ori-sgRNA-R和pegRNA-F/pegRNA-R进行PCR扩增,分别得到expegRNA、ori-sgRNA和pegRNA(使用ori-sgRNA做PE)的体外转录所需的DNA双链模板。扩增引物序列如下:
expegRNA-F:GGATCCTAATACGACTCACTATAGGGATGTCTGCAGGCCA。
expegRNA-R:TCACTCCAGCCatggtgagc。
ori-sgRNA-F:GGATCCTAATACGACTCACTATAGGCCCCAGTCACTCCAGCCTGTgttttagagctagaa。
ori-sgRNA-R:gcaccgactcggtgccactt。
pegRNA-F:GGATCCTAATACGACTCACTATAGGCCCCAGTCACTCCAGCCTGTgttttagagctagaa。
pegRNA-R:TCACTCCAGCCatggtgagc。
3、使用T7体外转录试剂盒(NEB,E2040S),按说明书进行体外转录,得到转录后gRNA。
expegRNA序列如下:GATGTCTGCAGGCCAGATGAgttttagagctagaaatagcaagttaaaataaggctagtccgttatcaacttgaaaaagtggca ccgagtcggtgcAATGTGCCATCTGGAGCCCTCAtgatggccatgttatcctcctcgcccttgctcaccatGGCTGGA GTGA。
ori-sgRNA序列如下:CCCCAGTCACTCCAGCCTGTgttttagagctagaaatagcaagttaaaataaggctagtccgttatcaacttgaaaaagtggca ccgagtcggtgc。
pegRNA序列如下:CCCCAGTCACTCCAGCCTGTgttttagagctagaaatagcaagttaaaataaggctagtccgttatcaacttgaaaaagtggca ccgagtcggtgcAATGTGCCATCTGGAGCCCTCAtgatggccatgttatcctcctcgcccttgctcaccatGGCTGGA GTGA。
二、体外实验
1、使用商品化的nCas9(H840A)蛋白(Novoprotein,E367)和RT蛋白(NEB,M0368S),替代PE***的融合蛋白,使用的lysis buffer配方如下:0.5mM dNTPs+1*rCutsmart(NEB),根据反应体系中的组分不同,分为如下三组:
第1组:nCas9(H840A)2μL+lysis buffer 8μL+H2O 6μL。
第2组:nCas9(H840A)2μL+lysis buffer 8μL+H2O 3μL+pegRNA3μL。
第3组:nCas9(H840A)2μL+lysis buffer 8μL+expegRNA4.5μL+ori-sgRNA 1.5μL。
2、完成步骤1后,将各组反应体系25度孵育20分钟,得到反应液;然后按照如下比例向各组反应液中加入RT酶和靶标质粒(靶标质粒的核苷酸序列如序列9所示)至总体积为36μL:反应液16μL,靶标质粒300ng(1μL),RT酶1μL,lysis buffer 18μL。
3、完成步骤2后,将各组反应体系在37度孵育30分钟,然后42度孵育30分钟,最后80度孵育2分钟。
4、完成步骤3后,纯化产物并使用设计的上游引物(与靶标质粒中的靶标上游序列结合)和下游引物(与新合成的DNA链上的序列结合)进行PCR扩增,得到PCR产物。引物序列如下所示:
primer_196bp_F:TGCATACGTGGGCTCCAACA;
primer_196bp_F:tgatggccatgttatcctcc。
5、凝胶电泳检测PCR产物。
凝胶电泳结果显示:第2组和第3组均能扩增出目的条带,且测序结果也完全正确(图2),证明在体外实验中,本发明开发的EXPERT基因编辑***确实能编辑PE nick的5’端,而传统PE***只能编辑PE nick的3’端。
实施例3、细胞实验证明EXPERT***可以实现精确编辑,编辑PE产生的nick的5’端
一、实验方法
1、EXPERT基因编辑***表达载体的构建
将传统PE***产生的nick的位置记作0(图1)(Anzalone AV,Randolph PB,DavisJR,Sousa AA,Koblan LW,Levy JM,Chen PJ,Wilson C,Newby GA,Raguram A,LiuDR.Search-and-replace genome editing without double-strand breaks or donorDNA.Nature.2019Dec;576(7785):149-157.doi:10.1038/s41586-019-1711-4.Epub2019Oct 21.PMID:31634902;PMCID:PMC6907074.),针对VEGFA位点,共设计如下编辑类型:-37到0位置的37个碱基的替换,-37到0位置的37个碱基的删除,-24到0位置的24个碱基的替换(替换为Flag标签),-34到-17位置的17个碱基的删除。针对HEK4_1位点,共设计如下编辑类型:-32到0位置的32个碱基的替换,-32到0位置的32个碱基的删除,-18到0位置的18个碱基的替换(替换为6*His标签),-32到-14位置的18个碱基的替换(替换为6*His标签)。
针对不同位点的不同编辑类型设计相对应的expegRNA以及ori-sgRNA,并利用csy4串联gRNA的策略,由擎科生物有限公司合成相对应的序列(本发明中记作expegRNA-csy4-ori-sgRNA)。然后将PE2-U6-puro-csy4载体中Aar1酶切位点中间序列分别替换为针对不同位点的不同编辑类型设计的expegRNA-csy4-ori-sgRNA(即将PE2-U6-puro-csy4载体核苷酸序列中第9980-10804位所示的DNA分子分别替换为针对不同位点的不同编辑类型设计的expegRNA-csy4-ori-sgRNA),分别得到针对不同位点的不同编辑类型的EXPERT基因编辑***表达载体。
针对VEGFA位点设计的如下编辑类型:-37到0位置的37个碱基的替换(VEGFA_-37to+0replace 37bp)的expegRNA-csy4-ori-sgRNA序列如下:GATGTCTGCAGGCCAGATGAgttttagagctagaaatagcaagttaaaataaggctagtccgttatcaacttgaaaaagtggcaccgagtcggtgcAATGTGCCATCTGGAGCCCTCAtgatggccatgttatcctcctcgcccttgctcaccatGGCTGGAGTGAgttcactgccgtataggcagCCCCAGTCACTCCAGCCTGTgttttagagctagaaatagcaagttaaaataaggctagtccgttatcaacttgaaaaagtggcaccgagtcggtgc。其中,第1-20位为靶点序列甲,第21-96位为sgRNA骨架序列,第97-155位为逆转录模板序列(RT序列),第156-166位为引物结合位点序列(PBS序列),第167-186位为csy4位点,第187-206位为靶点序列乙,第207-282位为sgRNA骨架。
针对VEGFA位点设计的如下编辑类型:-37到0位置的37个碱基的删除(VEGFA_-37to+0del 37bp)的expegRNA-csy4-ori-sgRNA序列如下:GATGTCTGCAGGCCAGATGAgttttagagctagaaatagcaagttaaaataaggctagtccgttatcaacttgaaaaagtggcaccgagtcggtgcAATGTGCCATCTGGAGCCCTCAGGCTGGAGTGAgttcactgccgtataggcagCCCCAGTCACTCCAGCCTGTgttttagagctagaaatagcaagttaaaataaggctagtccgttatcaacttgaaaaagtggcaccgagtcggtgc。其中,第1-20位为靶点序列甲,第21-96位为sgRNA骨架序列,第97-118位为逆转录模板序列(RT序列),第119-129位为引物结合位点序列(PBS序列),第130-149位为csy4位点,第150-169位为靶点序列乙,第170-245位为sgRNA骨架。
针对VEGFA位点设计的如下编辑类型:-24到0位置的24个碱基的替换(VEGFA_-24to+0replace Flag)的expegRNA-csy4-ori-sgRNA序列如下:GATGTCTGCAGGCCAGATGAgttttagagctagaaatagcaagttaaaataaggctagtccgttatcaacttgaaaaagtggcaccgagtcggtgcAATGTGCCATCTGGAGCCCTCACTTATCGTCGTCATCCTTGTAATCGCGGCAGCCAACAGGCTGGAGTGAgttcactgccgtataggcagCCCCAGTCACTCCAGCCTGTgttttagagctagaaatagcaagttaaaataaggctagtccgttatcaacttgaaaaagtggcaccgagtcggtgc。其中,第1-20位为靶点序列甲,第21-96位为sgRNA骨架序列,第97-155位为逆转录模板序列(RT序列),第156-166位为引物结合位点序列(PBS序列),第167-186位为csy4位点,第187-206位为靶点序列乙,第207-282位为sgRNA骨架。
针对VEGFA位点设计的如下编辑类型:-34到-17位置的17个碱基的删除(VEGFA_-34to-17del 17bp)的expegRNA-csy4-ori-sgRNA序列如下:GATGTCTGCAGGCCAGATGAgttttagagctagaaatagcaagttaaaataaggctagtccgttatcaacttgaaaaagtggcaccgagtcggtgcAATGTGCCATCTGGAGCCCTCATCTGGCCTGCAGACATCACAGGCTGGAGTGAgttcactgccgtataggcagCCCCAGTCACTCCAGCCTGTgttttagagctagaaatagcaagttaaaataaggctagtccgttatcaacttgaaaaagtggcaccgagtcggtgc。其中,第1-20位为靶点序列甲,第21-96位为sgRNA骨架序列,第97-138位为逆转录模板序列(RT序列),第139-149位为引物结合位点序列(PBS序列),第150-169位为csy4位点,第170-189位为靶点序列乙,第190-265位为sgRNA骨架。
针对HEK4_1位点设计的如下编辑类型:-32到0位置的32个碱基的替换(HEK4_1_-32to+0replace 32bp)的expegRNA-csy4-ori-sgRNA的序列如下:GGCACTGCGGCTGGAGGTGGgttttagagctagaaatagcaagttaaaataaggctagtccgttatcaacttgaaaaagtggcaccgagtcggtgcTTAACCCCCAgccatgttatcctcctcgcccttgctcaccatTGCCCCTGCCgttcactgccgtataggcagGATGACAGGCAGGGGCACCGgttttagagctagaaatagcaagttaaaataaggctagtccgttatcaacttgaaaaagtggcaccgagtcggtgc。其中,第1-20位为靶点序列甲,第21-96位为sgRNA骨架序列,第97-138位为逆转录模板序列(RT序列),第139-148位为引物结合位点序列(PBS序列),第149-168位为csy4位点,第169-188位为靶点序列乙,第189-264位为sgRNA骨架。
针对HEK4_1位点设计的如下编辑类型:-32到0位置的32个碱基的删除(HEK4_1_-32to+0del 32bp)的expegRNA-csy4-ori-sgRNA序列如下:GGCACTGCGGCTGGAGGTGGgttttagagctagaaatagcaagttaaaataaggctagtccgttatcaacttgaaaaagtggc accgagtcggtgcTTAACCCCCATGCCCCTGCCgttcactgccgtataggcagGATGACAGGCAGGGGCAC CGgttttagagctagaaatagcaagttaaaataaggctagtccgttatcaacttgaaaaagtggcaccgagtcggtgc。其中,第1-20位为靶点序列甲,第21-96位为sgRNA骨架序列,第97-106位为逆转录模板序列(RT序列),第107-116位为引物结合位点序列(PBS序列),第117-136位为csy4位点,第137-156位为靶点序列乙,第157-232位为sgRNA骨架。
针对HEK4_1位点设计的如下编辑类型:-18到0位置的18个碱基的替换(HEK4_1_-18to+0replace 6*His)的expegRNA-csy4-ori-sgRNA序列如下:GGCACTGCGGCTGGAGGTGGgttttagagctagaaatagcaagttaaaataaggctagtccgttatcaacttgaaaaagtggcaccgagtcggtgcTTAACCCCCAATGATGGTGATGATGGTGCCGGGGCGCCGCGGTGCCCCTGCCgttcactgccgtataggcagGATGACAGGCAGGGGCACCGgttttagagctagaaatagcaagttaaaataaggctagtccgttatcaacttgaaaaagtggcaccgagtcggtgc。其中,第1-20位为靶点序列甲,第21-96位为sgRNA骨架序列,第97-138位为逆转录模板序列(RT序列),第139-148位为引物结合位点序列(PBS序列),第149-168位为csy4位点,第169-188位为靶点序列乙,第189-264位为sgRNA骨架。
针对HEK4_1位点设计的如下编辑类型:-32到-14位置的18个碱基的替换(HEK4_1_-32to-14replace 6*His)的expegRNA-csy4-ori-sgRNA序列如下:GGCACTGCGGCTGGAGGTGGgttttagagctagaaatagcaagttaaaataaggctagtccgttatcaacttgaaaaagtggcaccgagtcggtgcTTAACCCCCACCTCCAGCCGCAGTATGATGGTGATGATGGTGTGCCCCTGCCgttcactgccgtataggcagGATGACAGGCAGGGGCACCGgttttagagctagaaatagcaagttaaaataaggctagtccgttatcaacttgaaaaagtggcaccgagtcggtgc。其中,第1-20位为靶点序列甲,第21-96位为sgRNA骨架序列,第97-138位为逆转录模板序列(RT序列),第139-148位为引物结合位点序列(PBS序列),第149-168位为csy4位点,第169-188位为靶点序列乙,第189-264位为sgRNA骨架。
2、细胞转染
293T细胞(中国科学院上海细胞库,货号为SCSP-502)铺板6孔板,待细胞密度达至70-80%,每孔转染2.5ug质粒,24h加puro传代富集,72h继续加puro换液,96h收细胞样,裂解细胞并提取裂解后细胞的基因组DNA进行PCR扩增,最后送高通量测序(测出每条DNA单链的核酸组成),使用CRISPResso2在线网站分析精确编辑的效率(含有目标编辑的DNA单链的条数/总的DNA单链的条数*100%=精确编辑效率),后续EXPERT***所有细胞实验都是按照此流程进行检测。PCR扩增引物序列如下:
VEGFA_HTS_F:CCCGTTCTCAGCTCCACAAA。
VEGFA_HTS_R:TTGGGACTGGAGTTGCTTCA。
HEK4-1_HTS_F:AGATGGCTGACAAAGGCCG。
HEK4-1_HTS_R:TTCAACCCGAACGGAGACAC。
二、实验结果
结果如图3所示,结果表明:在VEGFA位点,高效实现了-37到0位置的37个碱基的替换,-37到0位置的37个碱基的删除,-24到0位置的24个碱基的替换;在HEK4_1位点,高效实现了-32到0位置的32个碱基的替换,-32到0位置的32个碱基的删除。同时,也实现了17bp的删除(VEGFA位点)和不同位置His标签蛋白的替换(HEK4_1位点)的编辑,虽然效率较低。综合而言,EXPERT***可以在细胞中实现精确编辑,编辑PE产生的nick的5’端,大大拓宽了传统PE的编辑范围。
实施例4、细胞实验证明EXPERT***引入突变可显著提高编辑效率
在实施例2中,已初步证明EXPERT***可以在细胞中实现精确编辑,拓宽传统PE的编辑范围。为了进一步提高编辑效率,进行了如下分析与细胞实验:
一、当编辑区域靠近ori-sgRNA产生的nick,且离expegRNA产生的nick较远时
当编辑区域靠近ori-sgRNA产生的nick,且离expegRNA产生的nick较远时,expegRNA nick这边的悬突的DNA 3’末端会与expegRNA模板互补结合,阻碍EXPERT***中RT酶正常发挥逆转录功能,从而导致最终编辑效率低下(图4A)。基于此,本发明通过在expegRNA中引入突变,突变位于与DNA 3’端悬突碱基互补的区域,进行细胞实验验证是否能提高精确编辑效率。具体载体构建方法同实施例3,由擎科生物有限公司合成相对应的expegRNA-csy4-ori-sgRNA序列并克隆至PE2-U6-puro-csy4载体。
1、针对VEGFA位点-34到-17位置的17个碱基的删除(VEGFA_-34to-17del 17bp)的expegRNA-csy4-ori-sgRNA的突变序列分别如下:
mismatch 0即为实施例3中的针对VEGFA位点-34到-17位置的17个碱基的删除的expegRNA-csy4-ori-sgRNA序列,具体如下:GATGTCTGCAGGCCAGATGAgttttagagctagaaatagcaagttaaaataaggctagtccgttatcaacttgaaaaagtggcaccgagtcggtgcAATGTGCCATCTGGAGCCCTCAtgatggccatgttatcctcctcgcccttgctcaccatGGCTGGAGTGAgttcactgccgtataggcagCCCCAGTCACTCCAGCCTGTgttttagagctagaaatagcaagttaaaataaggctagtccgttatcaacttgaaaaagtggcaccgagtcggtgc。
mismatch 1为将mismatch 0第119位的T突变为C后得到的序列。
mismatch 2为将mismatch 0第119-120位的TC突变为CA后得到的序列。
mismatch 3为将mismatch 0第119-121位的TCT突变为CAC后得到的序列。
mismatch 4为将mismatch 0第119-122位的TCTG突变为CACT后得到的序列。
mismatch 5为将mismatch 0第119-123位的TCTGG突变为CACTT后得到的序列。
mismatch 6为将mismatch 0第119-124位的TCTGGC突变为CACTTA后得到的序列。
mismatch 7为将mismatch 0第119-125位的TCTGGCC突变为CACTTAA后得到的序列。
mismatch 8为将mismatch 0第119-126位的TCTGGCCT突变为CACTTAAC后得到的序列。
mismatch 9为将mismatch 0第119-127位的TCTGGCCTG突变为CACTTAACT后得到的序列。
mismatch 10为将mismatch 0第119-128位的TCTGGCCTGC突变为CACTTAACTA后得到的序列。
mismatch 11为将mismatch 0第119-129位的TCTGGCCTGCA突变为CACTTAACTAG后得到的序列。
mismatch 12为将mismatch 0第119-130位的TCTGGCCTGCAG突变为CACTTAACTAGT后得到的序列。
mismatch 13为将mismatch 0第119-131位的TCTGGCCTGCAGA突变为CACTTAACTAGTG后得到的序列。
mismatch 14为将mismatch 0第119-132位的TCTGGCCTGCAGAC突变为CACTTAACTAGTGA后得到的序列。
mismatch 15为将mismatch 0第119-133位的TCTGGCCTGCAGACA突变为CACTTAACTAGTGAG后得到的序列。
mismatch 16为将mismatch 0第119-134位的TCTGGCCTGCAGACAT突变为CACTTAACTAGTGAGC后得到的序列。
mismatch 17为将mismatch 0第119-135位的TCTGGCCTGCAGACATC突变为CACTTAACTAGTGAGCA后得到的序列。
2、针对HEK4_1位点-32到-14位置的18个碱基的替换(HEK4_1_-32to-14replace6*His)的expegRNA-csy4-ori-sgRNA的突变序列分别如下:
mismatch 0即为实施例3中HEK4_1位点-32到-14位置的18个碱基的替换的expegRNA-csy4-ori-sgRNA序列,具体如下:GGCACTGCGGCTGGAGGTGGgttttagagctagaaatagcaagttaaaataaggctagtccgttatcaacttgaaaaagtggcaccgagtcggtgcTTAACCCCCACCTCCAGCCGCAGTATGATGGTGATGATGGTGTGCCCCTGCCgttcactgccgtataggcagGATGACAGGCAGGGGCACCGgttttagagctagaaatagcaagttaaaataaggctagtccgttatcaacttgaaaaagtggcaccgagtcggtgc。
mismatch 1为将mismatch 0第107位的C突变为A后得到的序列。
mismatch 2为将mismatch 0第107-108位的CC突变为AA后得到的序列。
mismatch 3为将mismatch 0第107-109位的CCT突变为AAC后得到的序列。
mismatch 4为将mismatch 0第107-110位的CCTC突变为AACA后得到的序列。
mismatch 5为将mismatch 0第107-111位的CCTCC突变为AACAA后得到的序列。
mismatch 6为将mismatch 0第107-112位的CCTCCA突变为AACAAG后得到的序列。
mismatch 7为将mismatch 0第107-113位的CCTCCAG突变为AACAAGT后得到的序列。mismatch 8为将mismatch 0第107-114位的CCTCCAGC突变为AACAAGTA后得到的序列。
mismatch 9为将mismatch 0第107-115位的CCTCCAGCC突变为AACAAGTAA后得到的序列。
mismatch 10为将mismatch 0第107-116位的CCTCCAGCCG突变为AACAAGTAAT后得到的序列。
mismatch 11为将mismatch 0第107-117位的CCTCCAGCCGC突变为AACAAGTAATA后得到的序列。
mismatch 12为将mismatch 0第107-118位的CCTCCAGCCGCA突变为AACAAGTAATAG后得到的序列。
mismatch 13为将mismatch 0第107-119位的CCTCCAGCCGCAG突变为AACAAGTAATAGT后得到的序列。
mismatch 14为将mismatch 0第107-120位的CCTCCAGCCGCAGT突变为AACAAGTAATAGTC后得到的序列。
分别将上述构建的EXPERT***的编辑载体进行细胞实验,具体步骤同实施例3中的步骤一中的2。
结果显示,在RT序列的3’末端引入突变极大的提高了EXPERT的编辑效率;突变碱基的个数为10-11个碱基时,编辑效率达到最高(图4B)。
二、当编辑区域靠近expegRNA产生的nick,且离ori-sgRNA产生的nick较远时
当编辑区域靠近expegRNA产生的nick,且离ori-sgRNA产生的nick较远时,ori-sgRNA nick这边的悬突的DNA 5’末端会与expegRNA模板互补结合,同样也会阻碍EXPERT***中RT酶正常发挥逆转录功能,从而导致最终编辑效率低下(图4C)。同样,本发明通过在expegRNA中引入突变,突变位于与DNA 5’端悬突碱基互补的区域,进行细胞实验验证是否能提高精确编辑效率。具体载体构建方法同实施例3,由擎科生物有限公司合成相对应的expegRNA-csy4-ori-sgRNA序列并克隆至PE2-U6-puro-csy4载体。
1、针对VEGFA位点-24到0位置的24个碱基的替换(VEGFA_-24to+0replace Flag)的expegRNA-csy4-ori-sgRNA的突变序列分别如下:
mismatch 0即为实施例3中的VEGFA位点-24到0位置的24个碱基的替换的expegRNA-csy4-ori-sgRNA的序列,具体如下:GATGTCTGCAGGCCAGATGAgttttagagctagaaatagcaagttaaaataaggctagtccgttatcaacttgaaaaagtggcaccgagtcggtgcAATGTGCCATCTGGAGCCCTCACTTATCGTCGTCATCCTTGTAATCGCGGCAGCCAACAGGCTGGAGTGAgttcactgccgtataggcagCCCCAGTCACTCCAGCCTGTgttttagagctagaaatagcaagttaaaataaggctagtccgttatcaacttgaaaaagtggcaccgagtcggtgc。
mismatch 1为将mismatch 0第155位的A突变成G后得到的序列。
mismatch 2为将mismatch 0第154-155位的CA突变成AG后得到的序列。
mismatch 3为将mismatch 0第153-155位的ACA突变成GAG后得到的序列。
mismatch 4为将mismatch 0第152-155位的AACA突变成GGAG后得到的序列。
mismatch 5为将mismatch 0第151-155位的CAACA突变成AGGAG后得到的序列。
mismatch 6为将mismatch 0第150-155位的CCAACA突变成AAGGAG后得到的序列。
mismatch 7为将mismatch 0第149-155位的GCCAACA突变成TAAGGAG后得到的序列。
mismatch 8为将mismatch 0第148-155位的AGCCAACA突变成GTAAGGAG后得到的序列。
mismatch 9为将mismatch 0第147-155位的CAGCCAACA突变成AGTAAGGAG后得到的序列。
mismatch 10为将mismatch 0第146-155位的GCAGCCAACA突变成TAGTAAGGAG后得到的序列。
mismatch 11为将mismatch 0第145-155位的GGCAGCCAACA突变成TTAGTAAGGAG后得到的序列。
mismatch 12为将mismatch 0第144-155位的CGGCAGCCAACA突变成ATTAGTAAGGAG后得到的序列。
mismatch 13为将mismatch 0第143-155位的GCGGCAGCCAACA突变成TATTAGTAAGGAG后得到的序列。
2、针对HEK4_1位点-18到0位置的18个碱基的替换(HEK4_1_-18to+0replace 6*His)的expegRNA-csy4-ori-sgRNA的突变序列分别如下:
mismatch 0即为实施例3中HEK4_1位点-18到0位置的18个碱基的替换的expegRNA-csy4-ori-sgRNA的序列,具体序列如下:GGCACTGCGGCTGGAGGTGGgttttagagctagaaatagcaagttaaaataaggctagtccgttatcaacttgaaaaagtggcaccgagtcggtgcTTAACCCCCAATGATGGTGATGATGGTGCCGGGGCGCCGCGGTGCCCCTGCCgttcactgccgtataggcagGATGACAGGCAGGGGCACCGgttttagagctagaaatagcaagttaaaataaggctagtccgttatcaacttgaaaaagtggcaccgagtcggtgc。
mismatch 1为将mismatch 0第138位的G突变成T后得到的序列。
mismatch 2为将mismatch 0第137-138位的GG突变成TT后得到的序列。
mismatch 3为将mismatch 0第136-138位的CGG突变成ATT后得到的序列。
mismatch 4为将mismatch 0第135-138位的GCGG突变成TATT后得到的序列。
mismatch 5为将mismatch 0第134-138位的CGCGG突变成ATATT后得到的序列。
mismatch 6为将mismatch 0第133-138位的CCGCGG突变成AATATT后得到的序列。
mismatch 7为将mismatch 0第132-138位的GCCGCGG突变成TAATATT后得到的序列。
mismatch 8为将mismatch 0第131-138位的CGCCGCGG突变成ATAATATT后得到的序列。
mismatch 9为将mismatch 0第130-138位的GCGCCGCGG突变成TATAATATT后得到的序列。
mismatch 10为将mismatch 0第129-138位的GGCGCCGCGG突变成TTATAATATT后得到的序列。
mismatch 11为将mismatch 0第128-138位的GGGCGCCGCGG突变成TTTATAATATT后得到的序列。
mismatch 12为将mismatch 0第127-138位的GGGGCGCCGCGG突变成TTTTATAATATT后得到的序列。
mismatch 13为将mismatch 0第126-138位的CGGGGCGCCGCGG突变成ATTTTATAATATT后得到的序列。
mismatch 14为将mismatch 0第125-138位的CCGGGGCGCCGCGG突变成AATTTTATAATATT后得到的序列。
分别将上述构建的EXPERT***的编辑载体进行细胞实验,具体步骤同实施例3中的步骤一中的2。
结果显示,在RT序列的5’末端引入突变同样极大提高了EXPERT的编辑效率;突变碱基个数为10-11个碱基时,编辑效率同样达到最高。同时,在HEK4_1位点,随着突变越多,理想编辑相比于indels的比例越高,当突变到9-10个碱基时,indel已经降到极低(图4D)。
综上所述,当使用EXPERT基因编辑***进行特定的编辑时,需要考虑编辑所在的区域,在expegRNA中合适的位置引入突变提高EXPERT基因编辑***的编辑效率,同时也能提高产物纯度。
实施例5、细胞实验证明相比于csy4***介导的gRNA串联策略,U6串联表达gRNA的EXPERT***效率更高
一、实验方法
1、EXPERT基因编辑***表达载体的构建
针对EXPERT***中的csy4串联gRNA的策略(简称csy4),推测EXPERT***的expegRNA的长度较长,可能会自身形成二级结构,或者与csy4序列形成新的二级结构,从而导致expegRNA不能发挥作用,降低EXPERT***的编辑效率。基于此,本发明尝试采用双U6***(用2个U6启动子分别启动expegRNA和ori-sgRNA,简称double U6)这一策略在4个内源位点进行了细胞实验。进一步地,又尝试采用双U6***加上evopreQ1 motif这一策略(简称double U6+evopreQ1)进行了细胞实验。所有改进均进行如下编辑类型:“Flag标签+Asc1酶切位点”的大于32bp(大于32bp是指Flag和Asc1之间用不同长度的序列连接起来。每个位点编辑的具体长度是:APP位点是43bp,Flag和Asc1之间用11bp的序列(atggtgagcaa)连接;GFAP位点是43bp,Flag和Asc1之间用11bp的序列(atggtgagcaa)连接;RUNX1位点是55bp,Flag和Asc1之间用23bp的序列(atggtgagcaagggcgaggagga)连接;RUNX1位点是42bp,Flag和Asc1之间用10bp的序列(atggtgagcaa)连接)的替换。
针对不同位点设计相对应的expegRNA以及ori-sgRNA,并分别利用csy4串联gRNA策略、双U6策略和双U6+evopreQ1 motif策略,由擎科生物有限公司合成相对应的expegRNA-csy4-ori-sgRNA序列、expegRNA-U6-ori-sgRNA序列和expegRNA-evopreQ1-U6-ori-sgRNA序列,然后将expegRNA-csy4-ori-sgRNA序列克隆至PE2-U6-puro-csy4载体,具体步骤同实施例3,将expegRNA-U6-ori-sgRNA序列或expegRNA-evopreQ1-U6-ori-sgRNA序列克隆至PE2-U6-puro载体(即将PE2-U6-puro载体序列中第9980-10804位所示的DNA分子替换为expegRNA-U6-ori-sgRNA序列或expegRNA-evopreQ1-U6-ori-sgRNA序列),分别得到针对不同位点、同一编辑类型的EXPERT基因编辑***表达载体。
针对不同内源位点采用不同策略设计的如下编辑类型:“Flag标签+Asc1酶切位点”的大于32bp的替换的expegRNA和ori-sgRNA串联表达的序列具体如下:
针对APP位点“Flag标签+Asc1酶切位点”的大于32bp的替换设计的expegRNA-csy4-ori-sgRNA序列如下:GGAGATCTCTGAAGTGAAGAgttttagagctagaaatagcaagttaaaataaggctagtccgttatcaacttgaaaaagtggcaccgagtcggtgcGGAATTCTGCATCCATCTGGCGCGCCttgctcaccatCTTATCGTCGTCATCCTTGTAATCACCTGTATTACATCATAgttcactgccgtataggcagTATGATGTAATACAGGTTCTgttttagagctagaaatagcaagttaaaataaggctagtccgttatcaacttgaaaaagtggcaccgagtcggtgc,其中,第1-20位为靶点序列甲,第21-96位为sgRNA骨架序列,第97-157位为逆转录模板序列(RT序列),第158-174位为引物结合位点序列(PBS序列),第175-194位为csy4位点,第195-214位为靶点序列乙,第215-290位为sgRNA骨架;针对APP位点“Flag标签+Asc1酶切位点”的大于32bp的替换设计的expegRNA-U6-ori-sgRNA序列如下:GGAGATCTCTGAAGTGAAGAgttttagagctagaaatagcaagttaaaataaggctagtccgttatcaacttgaaaaagtggcaccgagtcggtgcGGAATTCTGCATCCATCTGGCGCGCCttgctcaccatCTTATCGTCGTCATCCTTGTAATCACCTGTATTACATCATAttttttttgagggcctatttcccatgattccttcatatttgcatatacgatacaaggctgttagagagataattagaattaatttgactgtaaacacaaagatattagtacaaaatacgtgacgtagaaagtaataatttcttgggtagtttgcagttttaaaattatgttttaaaatggactatcatatgcttaccgtaacttgaaagtatttcgatttcttggctttatatatcttgtggaaaggacgaaacaccGTATGATGTAATACAGGTTCTgttttagagctagaaatagcaagttaaaataaggctagtccgttatcaacttgaaaaagtggcaccgagtcggtgc,其中,第1-20位为靶点序列甲,第21-96位为sgRNA骨架序列,第97-157位为逆转录模板序列(RT序列),第158-174位为引物结合位点序列(PBS序列),第183-423位为U6启动子序列,第433-452位为靶点序列乙,第453-528位为sgRNA骨架;针对APP位点“Flag标签+Asc1酶切位点”的大于32bp的替换设计的expegRNA-evopreQ1-U6-ori-sgRNA序列如下:GGAGATCTCTGAAGTGAAGAgttttagagctagaaatagcaagttaaaataaggctagtccgttatcaacttgaaaaagtggcaccgagtcggtgcGGAATTCTGCATCCATCTGGCGCGCCttgctcaccatCTTATCGTCGTCATCCTTGTAATCACCTGTATTACATCATATTGACGCGGTTCTATCTAGTTACGCGTTAAACCAACTAGAAAttttttttgagggcctatttcccatgattccttcatatttgcatatacgatacaaggctgttagagagataattagaattaatttgactgtaaacacaaagatattagtacaaaatacgtgacgtagaaagtaataatttcttgggtagtttgcagttttaaaattatgttttaaaatggactatcatatgcttaccgtaacttgaaagtatttcgatttcttggctttatatatcttgtggaaaggacgaaacaccGTATGATGTAATACAGGTTCTgttttagagctagaaatagcaagttaaaataaggctagtccgttatcaacttgaaaaagtggcaccgagtcggtgc,其中,第1-20位为靶点序列甲,第21-96位为sgRNA骨架序列,第97-157位为逆转录模板序列(RT序列),第158-174位为引物结合位点序列(PBS序列),第175-216为evopreQ1基序序列,第225-465位为U6启动子序列,第475-494位为靶点序列乙,第495-570位为sgRNA骨架。
针对GFAP位点“Flag标签+Asc1酶切位点”的大于32bp的替换设计的expegRNA-csy4-ori-sgRNA序列如下:gAGCCTGTGTCCATATAAAGGgttttagagctagaaatagcaagttaaaataaggctagtccgttatcaacttgaaaaagtggcaccgagtcggtgcTTCCAACTCCTCCTGGCGCGCCttgctcaccatCTTATCGTCGTCATCCTTGTAATCGTCACAAAGCCCAgttcactgccgtataggcagTGGCTGGGCTTTGTGACTGTgttttagagctagaaatagcaagttaaaataaggctagtccgttatcaacttgaaaaagtggcaccgagtcggtgc,其中,第2-21位为靶点序列甲,第22-97位为sgRNA骨架序列,第98-154位为逆转录模板序列(RT序列),第155-167位为引物结合位点序列(PBS序列),第168-187位为csy4位点,第188-207位为靶点序列乙,第208-283位为sgRNA骨架;针对GFAP位点“Flag标签+Asc1酶切位点”的大于32bp的替换设计的expegRNA-U6-ori-sgRNA序列如下:gAGCCTGTGTCCATATAAAGGgttttagagctagaaatagcaagttaaaataaggctagtccgttatcaacttgaaaaagtggcaccgagtcggtgcTTCCAACTCCTCCTGGCGCGCCttgctcaccatCTTATCGTCGTCATCCTTGTAATCGTCACAAAGCCCAttttttttgagggcctatttcccatgattccttcatatttgcatatacgatacaaggctgttagagagataattagaattaatttgactgtaaacacaaagatattagtacaaaatacgtgacgtagaaagtaataatttcttgggtagtttgcagttttaaaattatgttttaaaatggactatcatatgcttaccgtaacttgaaagtatttcgatttcttggctttatatatcttgtggaaaggacgaaacaccgTGGCTGGGCTTTGTGACTGTgttttagagctagaaatagcaagttaaaataaggctagtccgttatcaacttgaaaaagtggcaccgagtcggtgc,其中,第2-21位为靶点序列甲,第22-97位为sgRNA骨架序列,第98-154位为逆转录模板序列(RT序列),第155-167位为引物结合位点序列(PBS序列),第176-416位为U6启动子序列,第426-445位为靶点序列乙,第446-521位为sgRNA骨架;针对GFAP位点“Flag标签+Asc1酶切位点”的大于32bp的替换设计的expegRNA-evopreQ1-U6-ori-sgRNA序列如下:gAGCCTGTGTCCATATAAAGGgttttagagctagaaatagcaagttaaaataaggctagtccgttatcaacttgaaaaagtggcaccgagtcggtgcTTCCAACTCCTCCTGGCGCGCCttgctcaccatCTTATCGTCGTCATCCTTGTAATCGTCACAAAGCCCATTGACGCGGTTCTATCTAGTTACGCGTTAAACCAACTAGAAAttttttttgagggcctatttcccatgattccttcatatttgcatatacgatacaaggctgttagagagataattagaattaatttgactgtaaacacaaagatattagtacaaaatacgtgacgtagaaagtaataatttcttgggtagtttgcagttttaaaattatgttttaaaatggactatcatatgcttaccgtaacttgaaagtatttcgatttcttggctttatatatcttgtggaaaggacgaaacaccgTGGCTGGGCTTTGTGACTGTgttttagagctagaaatagcaagttaaaataaggctagtccgttatcaacttgaaaaagtggcaccgagtcggtgc,其中,第2-21位为靶点序列甲,第22-97位为sgRNA骨架序列,第98-154位为逆转录模板序列(RT序列),第155-167位为引物结合位点序列(PBS序列),第168-209为evopreQ1基序序列,第218-458位为U6启动子序列,第468-487位为靶点序列乙,第488-563位为sgRNA骨架。
针对RUNX1位点“Flag标签+Asc1酶切位点”的大于32bp的替换设计的expegRNA-csy4-ori-sgRNA序列如下:gTACCCACAGTGCTTCATGAGgttttagagctagaaatagcaagttaaaataaggctagtccgttatcaacttgaaaaagtggcaccgagtcggtgcGTACTCACCTCTCGGCGCGCCtcctcctcgcccttgctcaccatCTTATCGTCGTCATCCTTGTAATCCTTCCTCCTGAAAATgttcactgccgtataggcagGCATTTTCAGGAGGAAGCGAgttttagagctagaaatagcaagttaaaataaggctagtccgttatcaacttgaaaaagtggcaccgagtcggtgc,其中,第2-21位为靶点序列甲,第22-97位为sgRNA骨架序列,第98-165位为逆转录模板序列(RT序列),第166-180位为引物结合位点序列(PBS序列),第181-200位为csy4位点,第201-220位为靶点序列乙,第221-296位为sgRNA骨架;针对RUNX1位点“Flag标签+Asc1酶切位点”的大于32bp的替换设计的expegRNA-U6-ori-sgRNA序列如下:gTACCCACAGTGCTTCATGAGgttttagagctagaaatagcaagttaaaataaggctagtccgttatcaacttgaaaaagtggcaccgagtcggtgcGTACTCACCTCTCGGCGCGCCtcctcctcgcccttgctcaccatCTTATCGTCGTCATCCTTGTAATCCTTCCTCCTGAAAATttttttttgagggcctatttcccatgattccttcatatttgcatatacgatacaaggctgttagagagataattagaattaatttgactgtaaacacaaagatattagtacaaaatacgtgacgtagaaagtaataatttcttgggtagtttgcagttttaaaattatgttttaaaatggactatcatatgcttaccgtaacttgaaagtatttcgatttcttggctttatatatcttgtggaaaggacgaaacaccGCATTTTCAGGAGGAAGCGAgttttagagctagaaatagcaagttaaaataaggctagtccgttatcaacttgaaaaagtggcaccgagtcggtgc,其中,第2-21位为靶点序列甲,第22-97位为sgRNA骨架序列,第98-165位为逆转录模板序列(RT序列),第166-180位为引物结合位点序列(PBS序列),第189-429位为U6启动子序列,第438-457位为靶点序列乙,第458-533位为sgRNA骨架;针对RUNX1位点“Flag标签+Asc1酶切位点”的大于32bp的替换设计的expegRNA-evopreQ1-U6-ori-sgRNA序列如下:gTACCCACAGTGCTTCATGAGgttttagagctagaaatagcaagttaaaataaggctagtccgttatcaacttgaaaaagtggcaccgagtcggtgcGTACTCACCTCTCGGCGCGCCtcctcctcgcccttgctcaccatCTTATCGTCGTCATCCTTGTAATCCTTCCTCCTGAAAATTTGACGCGGTTCTATCTAGTTACGCGTTAAACCAACTAGAAAttttttttgagggcctatttcccatgattccttcatatttgcatatacgatacaaggctgttagagagataattagaattaatttgactgtaaacacaaagatattagtacaaaatacgtgacgtagaaagtaataatttcttgggtagtttgcagttttaaaattatgttttaaaatggactatcatatgcttaccgtaacttgaaagtatttcgatttcttggctttatatatcttgtggaaaggacgaaacaccGCATTTTCAGGAGGAAGCGAgttttagagctagaaatagcaagttaaaataaggctagtccgttatcaacttgaaaaagtggcaccgagtcggtgc,其中,第2-21位为靶点序列甲,第22-97位为sgRNA骨架序列,第98-165位为逆转录模板序列(RT序列),第166-180位为引物结合位点序列(PBS序列),第181-222为evopreQ1基序序列,第231-471位为U6启动子序列,第480-499位为靶点序列乙,第500-575位为sgRNA骨架。
针对SDHB位点“Flag标签+Asc1酶切位点”的大于32bp的替换设计的expegRNA-csy4-ori-sgRNA序列如下:gCTCAGGTAATCCACCTGCCTgttttagagctagaaatagcaagttaaaataaggctagtccgttatcaacttgaaaaagtggcaccgagtcggtgcTTGGGAGGCCGAGGGGCGCGCCtgctcaccatCTTATCGTCGTCATCCTTGTAATCCAACACGGTGAgttcactgccgtataggcagGGGGTTTCACCGTGTTGGCCgttttagagctagaaatagcaagttaaaataaggctagtccgttatcaacttgaaaaagtggcaccgagtcggtgc,其中,第2-21位为靶点序列甲,第22-97位为sgRNA骨架序列,第98-153位为逆转录模板序列(RT序列),第154-164位为引物结合位点序列(PBS序列),第165-184位为csy4位点,第185-204位为靶点序列乙,第205-280位为sgRNA骨架;针对SDHB位点“Flag标签+Asc1酶切位点”的大于32bp的替换设计的expegRNA-U6-ori-sgRNA序列如下:gCTCAGGTAATCCACCTGCCTgttttagagctagaaatagcaagttaaaataaggctagtccgttatcaacttgaaaaagtggcaccgagtcggtgcTTGGGAGGCCGAGGGGCGCGCCtgctcaccatCTTATCGTCGTCATCCTTGTAATCCAACACGGTGAttttttttgagggcctatttcccatgattccttcatatttgcatatacgatacaaggctgttagagagataattagaattaatttgactgtaaacacaaagatattagtacaaaatacgtgacgtagaaagtaataatttcttgggtagtttgcagttttaaaattatgttttaaaatggactatcatatgcttaccgtaacttgaaagtatttcgatttcttggctttatatatcttgtggaaaggacgaaacaccGGGGTTTCACCGTGTTGGCCgttttagagctagaaatagcaagttaaaataaggctagtccgttatcaacttgaaaaagtggcaccgagtcggtgc,其中,第2-21位为靶点序列甲,第22-97位为sgRNA骨架序列,第98-153位为逆转录模板序列(RT序列),第154-164位为引物结合位点序列(PBS序列),第173-413位为U6启动子序列,第422-441位为靶点序列乙,第442-517位为sgRNA骨架;针对SDHB位点“Flag标签+Asc1酶切位点”的大于32bp的替换设计的expegRNA-evopreQ1-U6-ori-sgRNA序列如下:gCTCAGGTAATCCACCTGCCTgttttagagctagaaatagcaagttaaaataaggctagtccgttatcaacttgaaaaagtggcaccgagtcggtgcTTGGGAGGCCGAGGGGCGCGCCtgctcaccatCTTATCGTCGTCATCCTTGTAATCCAACACGGTGATTGACGCGGTTCTATCTAGTTACGCGTTAAACCAACTAGAAAttttttttgagggcctatttcccatgattccttcatatttgcatatacgatacaaggctgttagagagataattagaattaatttgactgtaaacacaaagatattagtacaaaatacgtgacgtagaaagtaataatttcttgggtagtttgcagttttaaaattatgttttaaaatggactatcatatgcttaccgtaacttgaaagtatttcgatttcttggctttatatatcttgtggaaaggacgaaacaccGGGGTTTCACCGTGTTGGCCgttttagagctagaaatagcaagttaaaataaggctagtccgttatcaacttgaaaaagtggcaccgagtcggtgc,其中,第2-21位为靶点序列甲,第22-97位为sgRNA骨架序列,第98-153位为逆转录模板序列(RT序列),第154-164位为引物结合位点序列(PBS序列),第165-206为evopreQ1基序序列,第215-455位为U6启动子序列,第464-483位为靶点序列乙,第484-559位为sgRNA骨架。
2、细胞转染
分别将上述构建的EXPERT***的编辑载体进行细胞实验,具体步骤同实施例3中的步骤一中的2。
二、实验结果
结果如图5所示,结果显示:相比于csy4***,双U6***的编辑效率更高。进一步地,双U6加上evopreQ1 motif这一形式展示出最高的编辑效率。所以csy4串联gRNA策略可能会影响长的gRNA的转录和表达,基于此,后续实验都用双U6加evopreQ1形式来进行EXPERT实验。
实施例6、细胞实验证明EXPERT***可实现同时编辑pegRNA靶向区域的nick的5’端和3’端
相比于传统PE***只能编辑pegRNA靶向区域的nick的3’端,EXPERT***理论上可以实现编辑pegRNA nick的5’端和3’端,基于此,本发明对两个内源位点分别进行编辑,以验证本发明EXPERT***的编辑效果。
一、实验方法
1、EXPERT基因编辑***表达载体的构建
针对VEGFA位点,使用EXPERT***在nick的5’端-37到+0的位置替换了延长的loxp序列,同时在nick的3’端+1位置做了一个T>C的点突变。在擎科生物有限公司合成如下EXPERT***所需的expegRNA-evopreQ1-U6-ori-sgRNA序列:GATGTCTGCAGGCCAGATGAgttttagagctagaaatagcaagttaaaataaggctagtccgttatcaacttgaaaaagtggcaccgagtcggtgcAATGTGCCATCTGGAGCCCTCgATAACTTCGTATAATGTATGCTATACGAAGTTATcgcGGCTGGAGTGATTGACGCGGTTCTATCTAGTTACGCGTTAAACCAACTAGAAAttttttttgagggcctatttcccatgattccttcatatttgcatatacgatacaaggctgttagagagataattagaattaatttgactgtaaacacaaagatattagtacaaaatacgtgacgtagaaagtaataatttcttgggtagtttgcagttttaaaattatgttttaaaatggactatcatatgcttaccgtaacttgaaagtatttcgatttcttggctttatatatcttgtggaaaggacgaaacaccgCCCCAGTCACTCCAGCCTGTgttttagagctagaaatagcaagttaaaataaggctagtccgttatcaacttgaaaaagtggcaccgagtcggtgc,其中,第1-20位为靶点序列甲,第21-96位为sgRNA骨架序列,第97-155位为逆转录模板序列(RT序列),第156-166位为引物结合位点序列(PBS序列),第167-208为evopreQ1基序序列,第217-457位为U6启动子序列,第467-486位为靶点序列乙,第487-562位为sgRNA骨架。同时合成针对VEGFA位点nick的3’端+1位置做一个T到C的点突变的PE2和PE3所需的gRNA序列(PE2-gRNA序列和PE3-gRNA序列),PE2-gRNA序列如下:GATGTCTGCAGGCCAGATGAgttttagagctagaaatagcaagttaaaataaggctagtccgttatcaacttgaaaaagtggca ccgagtcggtgcAATGTGCCATCTGGAGCCCTCgTCTGGCCTGCAGATTGACGCGGTTCTATCTAGTTACGCGTTAAACCAACTAGAAA,其中,第1-20位为PE所用pegRNA靶点序列,第21-96位为sgRNA骨架序列,第97-118位为逆转录模板序列(RT序列),第119-131位为引物结合位点序列(PBS序列),第132-173为evopreQ1基序序列;PE3-gRNA序列如下:GATGTCTGCAGGCCAGATGAgttttagagctagaaatagcaagttaaaataaggctagtccgttatcaacttgaaaaagtggcaccgagtcggtgcAATGTGCCATCTGGAGCCCTCgTCTGGCCTGCAGATTGACGCGGTTCTATCTAGTTACGCGTTAAACCAACTAGAAAttttttttgagggcctatttcccatgattccttcatatttgcatatacgatacaaggctgttagagagataattagaattaatttgactgtaaacacaaagatattagtacaaaatacgtgacgtagaaagtaataatttcttgggtagtttgcagttttaaaattatgttttaaaatggactatcatatgcttaccgtaacttgaaagtatttcgatttcttggctttatatatcttgtggaaaggacgaaacaccgATGTACAGAGAGCCCAGGGCgttttagagctagaaatagcaagttaaaataaggctagtccgttatcaacttgaaaaagtggcaccgagtcggtgc,其中,第1-20位为PE所用pegRNA靶点序列,第21-96位为sgRNA骨架序列,第97-118位为逆转录模板序列(RT序列),第119-131位为引物结合位点序列(PBS序列),第132-173为evopreQ1基序序列,第182-422位为U6启动子序列,第432-451位为PE3所用nick sgRNA靶点序列,第452-527位为sgRNA骨架。
针对EMX1位点,使用EXPERT***在nick的5’端-34到+0的位置替换了loxp序列,同时在nick的3’端+5位置做了一个G>T的点突变。在擎科生物有限公司合成如下EXPERT***所需的expegRNA-evopreQ1-U6-ori-sgRNA序列:GAGTCCGAGCAGAAGAAGAAgttttagagctagaaatagcaagttaaaataaggctagtccgttatcaacttgaaaaagtggcaccgagtcggtgcGTGATGGGAGCaCTTCATAACTTCGTATAATGTATGCTATACGAAGTTATGCTTCTGCCGTTTTTGACGCGGTTCTATCTAGTTACGCGTTAAACCAACTAGAAAttttttttgagggcctatttcccatgattccttcatatttgcatatacgatacaaggctgttagagagataattagaattaatttgactgtaaacacaaagatattagtacaaaatacgtgacgtagaaagtaataatttcttgggtagtttgcagttttaaaattatgttttaaaatggactatcatatgcttaccgtaacttgaaagtatttcgatttcttggctttatatatcttgtggaaaggacgaaacaccGTACAAACGGCAGAAGCTGGgttttagagctagaaatagcaagttaaaataaggctagtccgttatcaacttgaaaaagtggcaccgagtcggtgc,其中,第1-20位为靶点序列甲,第21-96位为sgRNA骨架序列,第97-146位为逆转录模板序列(RT序列),第147-159位为引物结合位点序列(PBS序列),第160-201为evopreQ1基序序列,第210-450位为U6启动子序列,第459-478位为靶点序列乙,第479-554位为sgRNA骨架。同时合成EMX1位点nick的3’端+5位置做一个G到T的点突变的PE2和PE3所需的gRNA序列(PE2-gRNA序列和PE3-gRNA序列),PE2-gRNA序列如下:GAGTCCGAGCAGAAGAAGAAgttttagagctagaaatagcaagttaaaataaggctagtccgttatcaacttgaaaaagtggc accgagtcggtgcGTGATGGGAGCACTTCTTCTTCTGCTCGGATTGACGCGGTTCTATCTAGTTA CGCGTTAAACCAACTAGAAA,其中,第1-20位为PE所用pegRNA靶点序列,第21-96位为sgRNA骨架序列,第97-112位为逆转录模板序列(RT序列),第113-126位为引物结合位点序列(PBS序列),第127-168为evopreQ1基序序列;PE3-gRNA序列如下:GAGTCCGAGCAGAAGAAGAAgttttagagctagaaatagcaagttaaaataaggctagtccgttatcaacttgaaaaagtggcaccgagtcggtgcGTGATGGGAGCACTTCTTCTTCTGCTCGGATTGACGCGGTTCTATCTAGTTACGCGTTAAACCAACTAGAAAttttttttgagggcctatttcccatgattccttcatatttgcatatacgatacaaggctgttagagagataattagaattaatttgactgtaaacacaaagatattagtacaaaatacgtgacgtagaaagtaataatttcttgggtagtttgcagttttaaaattatgttttaaaatggactatcatatgcttaccgtaacttgaaagtatttcgatttcttggctttatatatcttgtggaaaggacgaaacaccgACATCGATGTCCTCCCCATgttttagagctagaaatagcaagttaaaataaggctagtccgttatcaacttgaaaaagtggcaccgagtcggtgc,其中,第1-20位为PE所用pegRNA靶点序列,第21-96位为sgRNA骨架序列,第97-112位为逆转录模板序列(RT序列),第113-126位为引物结合位点序列(PBS序列),第127-168为evopreQ1基序序列,第177-417位为U6启动子序列,第427-445位为PE3所用nick sgRNA靶点序列,第446-521位为sgRNA骨架。
将上述合成序列(expegRNA-evopreQ1-U6-ori-sgRNA序列、PE3-gRNA序列、PE2-gRNA序列)分别克隆至PE2-U6-puro载体,具体方法同实施例5,分别得到EXPERT***、PE2***和PE3***的编辑载体。
2、细胞转染
分别将上述构建的EXPERT***、PE2***和PE3***的编辑载体进行细胞实验,具体步骤同实施例3中的步骤一中的2。
二、实验结果
结果如图6所示,结果显示:针对VEGFA位点,在pegRNA产生nick的5’端-37到+0的位置替换了延长的loxp序列,在3’端+1位置做了一个T>C的点突变,EXPERT***的编辑效率能达到10.7%;针对EMX1位点,本发明在5’端-34到+0的位置替换了loxp序列,在3’端+5位置做了一个G>T的点突变,EXPERT***的编辑效率能达到8.15%(图6)。虽然在这两个位点,PE2***和PE3***在pegRNAnick 3’端的编辑效率都极高(VEGFA_+1TtoC,EMX1_+5GtoT),但是相比于它们,EXPERT***可以编辑pegRNAnick的5’端和3’端,极大地拓展了传统PE的编辑范围。
综上所述,在细胞中EXPERT***可实现同时编辑pegRNAnick的5’端和3’端。
实施例7、细胞实验证明EXPERT***可实现同时删除37bp并且***100bp的组合编辑,也可实现88bp的精确替换
为了探究EXPERT***编辑长度的极限。本发明采用EXPERT***分别尝试对如下两种编辑类型的编辑效果:同时删除37bp并且***100bp的组合编辑和88bp的精确替换。
一、实验方法
1、EXPERT基因编辑***表达载体的构建
针对VEGFA位点设计的如下编辑类型:-37到+0之间37bp的删除,同时***了100bp的expegRNA-evopreQ1-U6-ori-sgRNA序列:GATGTCTGCAGGCCAGATGAgttttagagctagaaatagcaagttaaaataaggctagtccgttatcaacttgaaaaagtggcaccgagtcggtgcAATGTGCCATCTGGAGCCCTCAtctcgaactcgtggccgttcacggagccctccatgtgcaccttgaagcgcatgaactccttgatgatggccatgttatcctcctcgcccttgctcaccatGGCTGGAGTGATTGACGCGGTTCTATCTAGTTACGCGTTAAACCAACTAGAAAttttttttgagggcctatttcccatgattccttcatatttgcatatacgatacaaggctgttagagagataattagaattaatttgactgtaaacacaaagatattagtacaaaatacgtgacgtagaaagtaataatttcttgggtagtttgcagttttaaaattatgttttaaaatggactatcatatgcttaccgtaacttgaaagtatttcgatttcttggctttatatatcttgtggaaaggacgaaacaccgCCCCAGTCACTCCAGCCTGTgttttagagctagaaatagcaagttaaaataaggctagtccgttatcaacttgaaaaagtggcaccgagtcggtgc,其中,第1-20位为靶点序列甲,第21-96位为sgRNA骨架序列,第97-218位为逆转录模板序列(RT序列),第219-229位为引物结合位点序列(PBS序列),第230-271为evopreQ1基序序列,第280-520位为U6启动子序列,第530-549位为靶点序列乙,第550-625位为sgRNA骨架。
针对EMX1位点设计的如下编辑类型:-88到0之间88bp的替换的expegRNA-evopreQ1-U6-ori-sgRNA序列:GAGTCCGAGCAGAAGAAGAAgttttagagctagaaatagcaagttaaaataaggctagtccgttatcaacttgaaaaagtggcaccgagtcggtgcGTGATGGGAGCCCTTCggccgttcacggagccctccatgtgcaccttgaagcgcatgaactccttgatgatggccatgttatcctcctcgcccttgctcaccatCCAGGGAGTTGACGCGGTTCTATCTAGTTACGCGTTAAACCAACTAGAAAttttttttgagggcctatttcccatgattccttcatatttgcatatacgatacaaggctgttagagagataattagaattaatttgactgtaaacacaaagatattagtacaaaatacgtgacgtagaaagtaataatttcttgggtagtttgcagttttaaaattatgttttaaaatggactatcatatgcttaccgtaacttgaaagtatttcgatttcttggctttatatatcttgtggaaaggacgaaacaccgTGCCCCTCCCTCCCTGGCCCgttttagagctagaaatagcaagttaaaataaggctagtccgttatcaacttgaaaaagtggcaccgagtcggtgc,其中,第1-20位为靶点序列甲,第21-96位为sgRNA骨架序列,第97-200位为逆转录模板序列(RT序列),第201-208位为引物结合位点序列(PBS序列),第209-250为evopreQ1基序序列,第259-499位为U6启动子序列,第509-528位为靶点序列乙,第529-604位为sgRNA骨架。
分别将上述expegRNA-evopreQ1-U6-ori-sgRNA序列克隆至PE2-U6-puro载体,具体方法同实施例5,分别得到EXPERT***的编辑载体。
2、细胞转染
分别将上述构建的EXPERT***的编辑载体进行细胞实验,具体步骤同实施例3中的步骤一中的2。
二、实验结果
结果如图7所示,结果显示:在VEGFA位点,EXPERT***可以实现同时删除37bp并且***100bp的组合编辑,编辑效率高达5.97%,且只存在0.1%的indels。同时,在EMX1位点,EXPERT***可以实现高达88bp的精确替换,编辑效率达到了0.21%。
由此可见,本发明EXPERT***成功实现了100bp左右的精确***,且可以实现100bp左右的精确替换,这都是传统PE***难以实现的,特别是单pegRNA***难以实现。
实施例8、细胞实验证明,EXPERTplus可极大提高EXPERT的编辑效率
一、EXPERTplus***的工作原理及主要元件设计
1、EXPERTplus***的工作原理
虽然,EXPERT***可以实现高达88bp的精确替换,但是效率只达到0.21%,为了进一步提高编辑效果。本发明在ori-sgRNA和expegRNA之间又增加一条或多条sgRNA(本发明中记作Mid sgRNA),继续和ori-sgRNA和expegRNA靶向相同的一条链,并将EXPERT加MidsgRNA这种策略命名为EXPERTplus。EXPERTplus***的工作原理示意图如图8A所示,由于Mid sgRNA的引入可给gRNA非靶向链增加nick,通过多个RT的“接力工作”,以及给非靶向链增加的nick,让其更易被降解这两方面,以进一步提高EXPERT***的效率。
2、EXPERTplus***的主要元件设计
本发明中的EXPERTplus基因编辑***的主要元件包括Cas9切刻酶(如Cas9n(H840A))、逆转录酶(如M-MLV RT)、ori-sgRNA、Mid sgRNA、expegRNA。
其中,expegRNA依次包括靶点序列(本发明中记作靶点序列甲)、sgRNA骨架、逆转录模板序列(RT序列)、引物结合位点序列(PBS序列)。
ori-sgRNA为在expegRNA靶向区域的上游(5’方向)设计的另一条sgRNA,其依次包括靶点序列(本发明中记作靶点序列乙)和sgRNA骨架。
Mid sgRNA为在expegRNA靶向区域和ori-sgRNA靶向区域之间增加的sgRNA,MidsgRNA可为m条(m为大于或等于1的整数),每条Mid sgRNA依次包括靶点序列和sgRNA骨架。
ori-sgRNA和Mid sgRNA靶向与expegRNA相同的链,且在ori-sgRNA和Mid sgRNA靶向的区域,非靶向链在nCas9-ori-sgRNA的作用下,会产生多个切口。
expegRNA中的RT序列为靶点序列乙3’端倒数第3个碱基开始及其后连续的一段与编辑后的基因组序列反向的互补序列,作为反转录酶的反转录模板,反转录出cDNA,然后作为修复模板,对基因组DNA进行修复。RT序列大小可为10-150bp。
expegRNA中的PBS序列为靶点序列乙5’端第n个碱基到第17个碱基靶点序列的反向互补序列(1≤n<17)。expegRNA的3’端结合至ori-sgRNA所在区域的nick的5’端,即expegRNA中的PBS序列位于ori-sgRNA靶向链的互补区域。
上述靶点序列甲和靶点序列乙之间的片段大小为23-100bp,且存在PAM序列(即应是sgRNA可以靶向的区域)。
二、EXPERTplus***和EXPERT***的编辑效率比较
为了比较EXPERTplus和EXPERT***的编辑效率,分别采用EXPERTplus和EXPERT***尝试对如下两种编辑类型的编辑效果:EMX1位点进行88bp大片段替换,VEGFA位点进行75bp大片段替换。
1、表达载体的构建
EXPERTplus***相比EXPERT***,增加了1条sgRNA(Mid sgRNA)。
针对EMX1位点设计的如下编辑类型:-88到+0位置的88bp的替换的EXPERT***所需的gRNA序列如下:GAGTCCGAGCAGAAGAAGAAgttttagagctagaaatagcaagttaaaataaggctagtccgttatcaacttgaaaaagtggcaccgagtcggtgcGTGATGGGAGCCCTTCggccgttcacggagccctccatgtgcaccttgaagcgcatgaactccttgatgatggccatgttatcctcctcgcccttgctcaccatCCAGGGAGTTGACGCGGTTCTATCTAGTTACGCGTTAAACCAACTAGAAAttttttttgagggcctatttcccatgattccttcatatttgcatatacgatacaaggctgttagagagataattagaattaatttgactgtaaacacaaagatattagtacaaaatacgtgacgtagaaagtaataatttcttgggtagtttgcagttttaaaattatgttttaaaatggactatcatatgcttaccgtaacttgaaagtatttcgatttcttggctttatatatcttgtggaaaggacgaaacaccgTGCCCCTCCCTCCCTGGCCCgttttagagctagaaatagcaagttaaaataaggctagtccgttatcaacttgaaaaagtggcaccgagtcggtgc,其中,第1-20位为靶点序列甲,第21-96位为sgRNA骨架序列,第97-200位为逆转录模板序列(RT序列),第201-208位为引物结合位点序列(PBS序列),第209-250为evopreQ1基序序列,第259-499位为U6启动子序列,第509-528位为靶点序列乙,第529-604位为sgRNA骨架;EXPERTplus所需的gRNA序列如下:GAGTCCGAGCAGAAGAAGAAgttttagagctagaaatagcaagttaaaataaggctagtccgttatcaacttgaaaaagtggcaccgagtcggtgcGTGATGGGAGCCCTTCggccgttcacggagccctccatgtgcaccttgaagcgcatgaactccttgatgatggccatgttatcctcctcgcccttgctcaccatCCAGGGAGTTGACGCGGTTCTATCTAGTTACGCGTTAAACCAACTAGAAAttttttttgagggcctatttcccatgattccttcatatttgcatatacgatacaaggctgttagagagataattagaattaatttgactgtaaacacaaagatattagtacaaaatacgtgacgtagaaagtaataatttcttgggtagtttgcagttttaaaattatgttttaaaatggactatcatatgcttaccgtaacttgaaagtatttcgatttcttggctttatatatcttgtggaaaggacgaaacaccgTGCCCCTCCCTCCCTGGCCCgttttagagctagaaatagcaagttaaaataaggctagtccgttatcaacttgaaaaagtggcaccgagtcggtgcTTTTTTTTgagggcctatttcccatgattccttcatatttgcatatacgatacaaggctgttagagagataattagaattaatttgactgtaaacacaaagatattagtacaaaatacgtgacgtagaaagtaataatttcttgggtagtttgcagttttaaaattatgttttaaaatggactatcatatgcttaccgtaacttgaaagtatttcgatttcttggctttatatatcttgtggaaaggacgaaacaccGTACAAACGGCAGAAGCTGGgttttagagctagaaatagcaagttaaaataaggctagtccgttatcaacttgaaaaagtggcaccgagtcggtgc,其中,第1-20位为靶点序列甲,第21-96位为sgRNA骨架序列,第97-200位为逆转录模板序列(RT序列),第201-208位为引物结合位点序列(PBS序列),第209-250为evopreQ1基序序列,第259-499位为U6启动子序列,第509-528位为靶点序列乙,第529-604位为sgRNA骨架,第613-853位为U6启动子序列,第862-881为Mid sgRNA的靶点序列,第882-957位为sgRNA骨架。
针对VEGFA位点设计的如下编辑类型:-75到+0位置的75bp的替换的EXPERT***所需的gRNA序列如下:GATGTCTGCAGGCCAGATGAgttttagagctagaaatagcaagttaaaataaggctagtccgttatcaacttgaaaaagtggcaccgagtcggtgcAATGTGCCATCTGGAGCCCTCAgccctccatgtgcaccttgaagcgcatgaactccttgatgatggccatgttatcctcctcgcccttgctcaccatATGCTTCCCAGTTGACGCGGTTCTATCTAGTTACGCGTTAAACCAACTAGAAAttttttttgagggcctatttcccatgattccttcatatttgcatatacgatacaaggctgttagagagataattagaattaatttgactgtaaacacaaagatattagtacaaaatacgtgacgtagaaagtaataatttcttgggtagtttgcagttttaaaattatgttttaaaatggactatcatatgcttaccgtaacttgaaagtatttcgatttcttggctttatatatcttgtggaaaggacgaaacaccgTCTCCCCTGGGAAGCATCCCgttttagagctagaaatagcaagttaaaataaggctagtccgttatcaacttgaaaaagtggcaccgagtcggtgc,其中,第1-20位为靶点序列甲,第21-96位为sgRNA骨架序列,第97-193位为逆转录模板序列(RT序列),第194-204位为引物结合位点序列(PBS序列),第205-246为evopreQ1基序序列,第255-495位为U6启动子序列,第505-524位为靶点序列乙,第525-600位为sgRNA骨架;EXPERTplus所需的gRNA序列如下:GATGTCTGCAGGCCAGATGAgttttagagctagaaatagcaagttaaaataaggctagtccgttatcaacttgaaaaagtggcaccgagtcggtgcAATGTGCCATCTGGAGCCCTCAgccctccatgtgcaccttgaagcgcatgaactccttgatgatggccatgttatcctcctcgcccttgctcaccatATGCTTCCCAGTTGACGCGGTTCTATCTAGTTACGCGTTAAACCAACTAGAAAttttttttgagggcctatttcccatgattccttcatatttgcatatacgatacaaggctgttagagagataattagaattaatttgactgtaaacacaaagatattagtacaaaatacgtgacgtagaaagtaataatttcttgggtagtttgcagttttaaaattatgttttaaaatggactatcatatgcttaccgtaacttgaaagtatttcgatttcttggctttatatatcttgtggaaaggacgaaacaccgTCTCCCCTGGGAAGCATCCCgttttagagctagaaatagcaagttaaaataaggctagtccgttatcaacttgaaaaagtggcaccgagtcggtgcTTTTTTTTgagggcctatttcccatgattccttcatatttgcatatacgatacaaggctgttagagagataattagaattaatttgactgtaaacacaaagatattagtacaaaatacgtgacgtagaaagtaataatttcttgggtagtttgcagttttaaaattatgttttaaaatggactatcatatgcttaccgtaacttgaaagtatttcgatttcttggctttatatatcttgtggaaaggacgaaacaccgCCCCAGTCACTCCAGCCTGTgttttagagctagaaatagcaagttaaaataaggctagtccgttatcaacttgaaaaagtggcaccgagtcggtgc,其中,第1-20位为靶点序列甲,第21-96位为sgRNA骨架序列,第97-193位为逆转录模板序列(RT序列),第194-204位为引物结合位点序列(PBS序列),第205-246为evopreQ1基序序列,第255-495位为U6启动子序列,第505-524位为靶点序列乙,第525-600位为sgRNA骨架,第609-849位为U6启动子序列,第859-878位为Mid sgRNA的靶点序列,第879-954位为sgRNA骨架。
分别将上述gRNA序列克隆至PE2-U6-puro载体,具体方法同实施例5,分别得到针对两个位点的EXPERT和EXPERTplus***的编辑载体。
2、细胞转染
分别将上述构建的EXPERT和EXPERTplus***的编辑载体进行细胞实验,具体步骤同实施例3中的步骤一中的2。
结果如图8所示,结果显示:对于在EMX1位点替换88bp的片段,EXPERTplus相比EXPERT(效率为0.21%),编辑效率提高了15倍,达到了3.1%(图8A);对于在VEGFA位点替换75bp的片段,EXPERTplus相比EXPERT(效率为1.13%),编辑效率提高了6.1倍,达到了6.86%(图8B)。
综上所述,EXPERTplus***可极大提高EXPERT的编辑效率,且并没有提高indels,说明在EXPERT***的基础上增加Mid sgRNA,能进一步提高EXPERT***的效率,且拓宽EXPERT的编辑范围。
以上对本发明进行了详述。对于本领域技术人员来说,在不脱离本发明的宗旨和范围,以及无需进行不必要的实验情况下,可在等同参数、浓度和条件下,在较宽范围内实施本发明。虽然本发明给出了特殊的实施例,应该理解为,可以对本发明作进一步的改进。总之,按本发明的原理,本申请欲包括任何变更、用途或对本发明的改进,包括脱离了本申请中已公开范围,而用本领域已知的常规技术进行的改变。按以下附带的权利要求的范围,可以进行一些基本特征的应用。
Claims (10)
1.一种生物体或生物细胞基因组序列的编辑方法,包括如下步骤:使生物体或生物细胞表达反转录酶、核酸内切酶、ori-sgRNA、expegRNA和m个Mid sgRNA;
所述expegRNA依次包括靶点序列甲、sgRNA骨架、逆转录模板序列、引物结合位点序列;
所述ori-sgRNA依次包括靶点序列乙和所述sgRNA骨架;
所述expegRNA的3’末端结合至所述ori-sgRNA产生切口的5’端;
所述靶点序列甲与所述靶点序列乙之间的片段大小为23-100bp且存在PAM序列;
每个Mid sgRNA均依次包括靶点序列和所述sgRNA骨架,且其靶向区域位于所述expegRNA靶向区域和所述ori-sgRNA靶向区域之间;所述m为等于或大于1的整数;
所述核酸内切酶在所述expegRNA、所述ori-sgRNA和所述Mid sgRNA引导下可在靶标区域的非靶向链上产生多个DNA切口。
2.根据权利要求1所述的方法,其特征在于:所述方法包括如下步骤:使生物体或生物细胞表达反转录酶、核酸内切酶、ori-sgRNA、expegRNA、m个Mid sgRNA和筛选剂抗性蛋白。
3.根据权利要求1或2所述的方法,其特征在于:所述expegRNA为突变expegRNA;所述突变expegRNA为在所述expegRNA中的RT序列3’端或5’端引入突变碱基后得到的RNA分子。
4.根据权利要求1-3任一所述的方法,其特征在于:所述方法包括如下步骤:使生物体或生物细胞表达由核酸内切酶和反转录酶融合而成的融合蛋白、expegRNA、ori-sgRNA、m个Mid sgRNA、筛选剂抗性蛋白,其中,所述expegRNA、所述ori-sgRNA和所述Mid sgRNA由相同或不同的启动子分别驱动进行表达。
5.根据权利要求1-4任一所述的方法,其特征在于:所述expegRNA3’端还包括evopreQ1基序。
6.根据权利要求1-5任一所述的方法,其特征在于:所述m为1。
7.权利要求1-6任一所述的方法在如下A1)-A3)中任一种中的应用:
A1)拓展生物体或生物细胞基因组序列的编辑范围;
A2)提高生物体或生物细胞基因组序列的编辑效率;
A3)制备生物或生物细胞突变体。
8.成套试剂或与所述成套试剂相关的生物材料,所述成套试剂包括权利要求1-6中任一所述的反转录酶、权利要求1-6中任一所述的核酸内切酶、权利要求1-6中任一所述的ori-sgRNA、权利要求1-6中任一所述的expegRNA和m个权利要求1-6中任一所述的MidsgRNA。
9.根据权利要求8所述的生物材料,其特征在于:所述生物材料为表达所述成套试剂的载体、重组微生物或重组细胞。
10.权利要求8或9所述的成套试剂或生物材料在如下B1)-B7)任一种中的应用:
B1)生物体或生物细胞基因组序列的编辑;
B2)拓展生物体或生物细胞基因组序列的编辑范围;
B3)提高生物体或生物细胞基因组序列的编辑效率;
B4)制备生物体或生物细胞基因组序列的编辑的产品;
B5)制备拓展生物体或生物细胞基因组序列的编辑范围的产品;
B6)制备提高生物体或生物细胞基因组序列的编辑效率的产品;
B7)制备生物或生物细胞突变体。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311581379.5A CN117866924A (zh) | 2023-11-24 | 2023-11-24 | 多sgRNA介导的EXPERTplus先导基因编辑***及其应用 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311581379.5A CN117866924A (zh) | 2023-11-24 | 2023-11-24 | 多sgRNA介导的EXPERTplus先导基因编辑***及其应用 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN117866924A true CN117866924A (zh) | 2024-04-12 |
Family
ID=90588935
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202311581379.5A Pending CN117866924A (zh) | 2023-11-24 | 2023-11-24 | 多sgRNA介导的EXPERTplus先导基因编辑***及其应用 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117866924A (zh) |
-
2023
- 2023-11-24 CN CN202311581379.5A patent/CN117866924A/zh active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11713471B2 (en) | Class II, type V CRISPR systems | |
US20180195089A1 (en) | CRISPR Oligonucleotides and Gene Editing | |
CN109136248B (zh) | 多靶点编辑载体及其构建方法和应用 | |
CN109306361B (zh) | 一种新的a/t到g/c碱基定点转换的基因编辑*** | |
US20240209332A1 (en) | Enzymes with ruvc domains | |
CN113728098A (zh) | 具有ruvc结构域的酶 | |
CN109880851B (zh) | 用于富集CRISPR/Cas9介导的同源重组修复细胞的筛选报告载体及筛选方法 | |
CN108707635B (zh) | 用于核苷酸序列修饰的组合物、方法与应用 | |
WO2022007959A1 (zh) | 一种编辑核酸的***及方法 | |
CN106636199A (zh) | 用CRISPR/Cas9技术易于筛选获得目的基因敲除细胞系的方法及产品 | |
CN110835635A (zh) | 不同启动子启动多个串联sgRNA表达的质粒构建方法 | |
CN113728097A (zh) | 具有ruvc结构域的酶 | |
CN111876422B (zh) | 可用于富集CRISPR/Cas9介导的精确NHEJ修复细胞的筛选报告*** | |
WO2023230991A1 (zh) | 新型闭合线性双链dna的体外制备技术 | |
WO2023016021A1 (zh) | 一种碱基编辑工具及其构建方法 | |
CN117866924A (zh) | 多sgRNA介导的EXPERTplus先导基因编辑***及其应用 | |
EP4227409A1 (en) | Technique for modifying target nucleotide sequence using crispr-type i-d system | |
CN111019946B (zh) | 一种短小型小核rna启动子及其构建方法和在基因组编辑中的应用 | |
CN116004716A (zh) | 一种复制型dCas9-FokI***进行高效基因编辑的方法 | |
CN113151277A (zh) | 鸡DF-1细胞IHH基因敲除稳定细胞株的构建方法及其特异性sgRNA | |
Dong et al. | CT5, a subtle in vitro DNA assembling method based on the combination of FnCas12a and T5 exonuclease | |
CN110551763A (zh) | CRISPR/SlutCas9基因编辑***及其应用 | |
CN116751763B (zh) | 一种Cpf1蛋白、V型基因编辑***及应用 | |
CN116179579A (zh) | 需钠弧菌单碱基编辑***及其应用 | |
CN116536309A (zh) | 一种改造后的先导编辑***及其应用 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |