CN110343724B - 用于筛选和鉴定功能性lncRNA的方法 - Google Patents

用于筛选和鉴定功能性lncRNA的方法 Download PDF

Info

Publication number
CN110343724B
CN110343724B CN201810284463.3A CN201810284463A CN110343724B CN 110343724 B CN110343724 B CN 110343724B CN 201810284463 A CN201810284463 A CN 201810284463A CN 110343724 B CN110343724 B CN 110343724B
Authority
CN
China
Prior art keywords
crispr
sequence
rna
cell
cas
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201810284463.3A
Other languages
English (en)
Other versions
CN110343724A (zh
Inventor
魏文胜
刘莹
曹中正
王轶楠
郭昱
袁鹏飞
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Peking University
Edigene Biotechnology Inc
Original Assignee
Peking University
Edigene Biotechnology Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Peking University, Edigene Biotechnology Inc filed Critical Peking University
Priority to CN201810284463.3A priority Critical patent/CN110343724B/zh
Publication of CN110343724A publication Critical patent/CN110343724A/zh
Application granted granted Critical
Publication of CN110343724B publication Critical patent/CN110343724B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/87Introduction of foreign genetic material using processes not otherwise provided for, e.g. co-transformation
    • C12N15/90Stable introduction of foreign DNA into chromosome
    • C12N15/902Stable introduction of foreign DNA into chromosome using homologous recombination
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/16Hydrolases (3) acting on ester bonds (3.1)
    • C12N9/22Ribonucleases RNAses, DNAses
    • CCHEMISTRY; METALLURGY
    • C40COMBINATORIAL TECHNOLOGY
    • C40BCOMBINATORIAL CHEMISTRY; LIBRARIES, e.g. CHEMICAL LIBRARIES
    • C40B40/00Libraries per se, e.g. arrays, mixtures
    • C40B40/04Libraries containing only organic compounds
    • C40B40/06Libraries containing nucleotides or polynucleotides, or derivatives thereof

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Chemical & Material Sciences (AREA)
  • Organic Chemistry (AREA)
  • Molecular Biology (AREA)
  • Engineering & Computer Science (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Wood Science & Technology (AREA)
  • Zoology (AREA)
  • Biotechnology (AREA)
  • General Engineering & Computer Science (AREA)
  • Biochemistry (AREA)
  • Biomedical Technology (AREA)
  • Medicinal Chemistry (AREA)
  • Microbiology (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • Plant Pathology (AREA)
  • Mycology (AREA)
  • Biophysics (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • General Chemical & Material Sciences (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

本发明涉及通过靶向真核细胞基因组剪接位点对非编码RNA(lncRNA)进行基因干扰的方法。

Description

用于筛选和鉴定功能性lncRNA的方法
发明领域
本发明涉及通过靶向真核细胞基因组中的剪接位点对长非编码RNA(lncRNA)进行基因干扰,从而筛选和鉴定功能性lncRNA。
发明背景
作为强大的基因组编辑工具,CRISPR-Cas9***已用于通过大规模筛选鉴别基因功能1-4。即使在基因组规模,基因干扰大多通过外显子内生成的移码突变实现。在人类基因组中除约2%的蛋白编码基因,更多的证据表明剩余的大量转录物为非编码RNA5。其中,>200核苷酸的lncRNA代表无明显蛋白编码潜力的大多数基因6-7。之前的研究表明人类lncRNA的总数超过了蛋白编码基因的总数且该数字持续攀升8
lncRNA通过顺式或反式调节基因表达在转录或转录后水平,并在多种细胞过程中起关键作用9。尽管人类基因组中数万基因座已被标注为编码长非编码RNA(lncRNA),但其功能大多尚未人所知,主要是由于缺乏可扩展的导致该种基因功能丧失的方法。一般而言,由于lncRNA对阅读框的改变并不敏感,因此难以以常规的方式应用CRISPR-Cas9***来破坏其表达,更不必说在大的规模范围内应用CRISPR-Cas9***破坏其表达了。我们之前开发了通过pgRNA文库用于lncRNA的功能丧失筛选的缺失策略9,但扩大其规模仍是艰难的。尽管有研究证明基于RNA干扰10,11或CRISPR12的筛选对于lncRNA功能的鉴别有效,但RNAi方法具有潜在的脱靶问题13,且两种方法都受到转录敲低的有效性的限制。因此,本领域存在寻找筛选和鉴定功能性长非编码RNA的有效方法和以大规模方式干扰非编码RNA功能的有效方法。
发明概述
本发明提供用于研究基因组区域的功能、以及用于筛选和鉴定具有调节功能的lncRNA的方法。这些方法部分依赖于本文提供的以新开发的CRISPR/Cas***为基础的文库筛选。
具体地,本发明涉及:
1.用于在真核细胞基因组中干扰长非编码RNA的CRISPR/Cas指导RNA构建体,其包含与启动子可操作连接的靶向长非编码RNA剪接位点周围的基因组序列的指导序列和指导发夹序列。
2.项1的CRISPR/Cas指导RNA构建体,其中所述真核基因组是人基因组。
3.项1或2的CRISPR/Cas指导RNA构建体,其中所述指导序列长度为19-21个核苷酸。
4.项1-3任一项的CRISPR/Cas指导RNA构建体,其中所述发夹序列长度为约40个核苷酸且一旦转录其可与CRISPR/Cas核酸酶结合。
5.项1-4任一项的CRISPR/Cas指导RNA构建体,其中所述指导序列靶向长非编码RNA的SD位点或SA位点周围跨越-50-bp至+75-bp的区域内的基因组序列。
6.项5的CRISPR/Cas指导RNA构建体,其中所述指导序列靶向长非编码RNA的SD位点或SA位点周围跨越-30-bp至+30-bp的区域内的基因组序列。
7.项6的CRISPR/Cas指导RNA构建体,其中所述指导序列靶向长非编码RNA的SD位点或SA位点周围跨越-10-bp至+10-bp的区域内的基因组序列。
8.项1-7任一项的CRISPR/Cas指导RNA构建体,其为病毒载体或质粒。
9.一种文库,其包含多个项1-8任一项的CRISPR/Cas指导RNA构建体。
10.一种存储液体,其包含项1-8任一项的CRISPR/Cas指导RNA构建体或项9的文库。
11.一种宿主细胞,其包含项1-8任一项的CRISPR/Cas指导RNA构建体。
12.项11的宿主细胞,其进一步包含CRISPR/Cas核酸酶和/或CRISPR/Cas核酸酶的编码序列。
13.项11或12的宿主细胞,其进一步包含Cas9核酸酶。
14.项11-13任一项的宿主细胞,其进一步包含整合入其基因组的报告基因构建体。
15.项11-14任一项的宿主细胞群。
16.一种方法,其包括:
将CRISPR/Cas指导RNA构建体引入宿主细胞,所述CRISPR/Cas指导RNA构建体包含与启动子可操作连接的靶向长非编码RNA剪接位点周围的基因组序列的引导序列和指导发夹序列,
在所述宿主细胞中表达靶向所述基因组序列的所述指导RNA,并在CRISPR/Cas核酸酶存在下在所述长非编码RNA中引进外显子跳跃和/或内含子保留,并确定所述长非编码RNA的功能概貌。
17.项16的方法,其中所述指导序列靶向长非编码RNA的SD位点或SA位点周围跨越-50-bp至+75-bp的区域内的基因组序列。
18.项17的方法,其中指导序列靶向长非编码RNA的SD位点或SA位点周围跨越-30-bp至+30-bp的区域内的基因组序列。
19.项18的方法,其中所述指导序列靶向长非编码RNA的SD位点或SA位点周围跨越-10-bp至+10-bp的区域内的基因组序列。
20.项15-19任一项的方法,其中所述功能概貌包括细胞表型变化和/或编码基因或非编码基因表达的增加或减少。
21.项20的方法,其中所述编码基因是外源的报告基因或基因组中的天然编码基因。
22.项16-21任一项的方法,其中所述宿主细胞处于宿主细胞群中且每种宿主细胞独立地包含专一的指导RNA构建体。
23.项22的方法,其为用于在真核细胞基因组中筛选或鉴定长非编码RNA的高通量方法。
24.用于调节细胞生长或增殖的lncRNA,其选自下组:XXbac-B135H6.15、RP11-848P1.5、AC005330.2、AP001062.9、AP005135.2、RP11-867G23.4、LINC01049、DGCR5、RP11-509A17.3、CTB-25J19.1、CTD-2517M22.17、CROCCP2、AC016629.8、CTC-490G23.4、RP11-117D22.1、AC067969.2、RP11-251M1.1、AC004471.9、AC004471.10、AC002472.11、RP11-429J17.7、RP11-56N19.5、TMEM191A、LL22NC03-102D1.18、LINC00410、LL22NC03-23C6.13、RP11-83J21.3、RP11-544A12.4、ANKRD62P1-PARP4P3、CTD-2031P19.5、XXbac-B444P24.8、RP11-464F9.21、TPTEP1、MIR17HG和BMS1P20。
25.用于干扰或消除真核细胞中长非编码RNA的功能的方法,其包括将靶向长非编码RNA的一个或多个剪接位点周围的一个或多个多核苷酸序列的一种或多种CRISPR/Cas指导RNA引入真核细胞,由此所述一种或多种指导RNA靶向长非编码RNA的一个或多个剪接位点周围的一个或多个多核苷酸序列且在Cas蛋白的存在下切割所述一个或多个多核苷酸序列,导致长非编码RNA的内含子保留和/或外显子跳跃并因此干扰或消除该长非编码RNA的功能。
26.项25的方法,所述指导RNA靶向长非编码RNA的SD位点或SA位点周围跨越-50-bp至+75-bp的区域内的多核苷酸序列。
27.项26的方法,所述指导RNA靶向长非编码RNA的SD位点或SA位点周围跨越-30-bp至+30-bp的区域内的多核苷酸序列。
28.项27的方法,所述指导RNA靶向长非编码RNA的SD位点或SA位点周围跨越-10-bp至+10-bp的区域内的多核苷酸序列。
29.项25-28任一项的方法,其中所述Cas蛋白是Cas9酶。
30.项25-29任一项的方法,其中通过递送***实现向所述细胞的引入,所述递送***包括病毒颗粒、脂质体、电穿孔、显微注射、偶联、纳米颗粒、外来体、微泡或基因枪。
31.项30的方法,其中通过包括慢病毒颗粒的递送***实施向所述细胞的引入。
32.一种通过靶向剪接干扰和鉴定基因功能的方法,其包括:
将CRISPR/Cas指导RNA构建体引入宿主细胞,所述CRISPR/Cas指导RNA构建体包含与启动子可操作连接的靶向目的基因剪接位点周围的基因组序列的引导序列和指导发夹序列,
在所述宿主细胞中表达靶向所述基因组序列的所述指导RNA,并在CRISPR/Cas核酸酶存在下在所述目的基因中引进外显子跳跃和/或内含子保留,并确定所述目的基因的功能概貌。
33.项32的方法,其中所述目的基因为具有保守编码序列的基因或非编码基因。
34.项33的方法,其中所述指导序列靶向目的基因的SD位点或SA位点周围跨越-50-bp至+75-bp的区域内的基因组序列。
35.项34的方法,其中指导序列靶向目的基因的SD位点或SA位点周围跨越-30-bp至+30-bp的区域内的基因组序列。
36.项35的方法,其中所述指导序列靶向目的基因的SD位点或SA位点周围跨越-10-bp至+10-bp的区域内的基因组序列。
37项32-36任一项的方法,其中所述功能概貌包括细胞表型变化和/或编码基因或非编码基因表达的增加或减少。
38.项37的方法,其中所述编码基因是外源的报告基因或基因组中的天然编码基因。
39.一种通过干扰长非编码RNA(lncRNA)的功能抑制肿瘤细胞生长或增殖的方法,包括利用项16-23中任一项的方法鉴定和破坏对肿瘤细胞生长或增殖必需的lncRNA,从而抑制肿瘤细胞生长或增殖。
40.项39的方法,其中所述对肿瘤细胞生长或增殖必需的lncRNA选自XXbac-B135H6.15、RP11-848P1.5、AC005330.2、AP001062.9、AP005135.2、RP11-867G23.4、LINC01049、DGCR5、RP11-509A17.3、CTB-25J19.1、CTD-2517M22.17、CROCCP2、AC016629.8、CTC-490G23.4、RP11-117D22.1、AC067969.2、RP11-251M1.1、AC004471.9、AC004471.10、AC002472.11、RP11-429J17.7、RP11-56N19.5、TMEM191A、LL22NC03-102D1.18、LINC00410、LL22NC03-23C6.13、RP11-83J21.3、RP11-544A12.4、ANKRD62P1-PARP4P3、CTD-2031P19.5、XXbac-B444P24.8、RP11-464F9.21、TPTEP1、MIR17HG和BMS1P20。
一方面,本发明的方法利用CRISPR/Cas***切割围绕lncRNA剪切位点的特定基因组序列的能力诱导产生lncRNA的内含子保留或外显子跳跃,从而干扰或消除lncRNA的功能。靶向的基因组位点具体是在基因组基因的剪接位点周围,特别是编码长非编码RNA(lncRNA)的基因组基因的剪接位点周围,特别是跨越SD位点或SA位点周围-50-bp至+75-bp的区域内,更优选跨越-30-bp至+30-bp的区域内,最优选地,跨越-10-bp至+10-bp的区域内。靶向的lncRNA剪接位点周围的序列被切割并通过宿主细胞中的细胞非同源末端连接(NHEJ)机制突变,且这样的突变导致外显子跳跃和/或内含子保留且因此基本上消除lncRNA的活性功能。
如本领域已知,CRISPR/Cas***核酸酶需要指导RNA以切割基因组DNA。这些指导RNA由下述构成:(1)使CRISPR/Cas***核酸酶以序列特异性的方式靶向基因组位置的不同序列的、19-21个核苷酸的间隔子序列(引导序列),和(2)位于引导RNA之间并允许指导RNA与CRISPR/Cas***核酸酶结合的发夹序列。
本文的方法涉及将CRISPR/Cas指导RNA构建体引入宿主细胞,所述CRISPR/Cas指导RNA构建体包含与启动子可操作连接的靶向长非编码RNA剪接位点周围的基因组序列的引导序列和发夹序列,在所述宿主细胞中表达靶向所述基因组序列的所述指导RNA(guideRNA)。在一个实施方案中,所述指导序列靶向长非编码RNA的SD位点或SA位点周围跨越-50-bp至+75-bp的区域内的基因组序列,更优选地,靶向长非编码RNA的SD位点或SA位点周围跨越-30-bp至+30-bp的区域内的基因组序列,最优选地,靶向长非编码RNA的SD位点或SA位点周围跨越-10-bp至+10-bp的区域内的基因组序列。
在一些情况中,所述方法进一步包括确定所述长非编码RNA的功能概貌。基因组基因(编码基因或非编码基因)的表达的变化或其基因产物(编码的蛋白)的功能活性的变化可用作该lncRNA调节功能的指示。可替换地,用于报告基因的编码序列可***基因组(例如通过替换天然编码序列的形式)且其表达或其基因产物的功能活性的变化可用作该长非编码RNA的功能概貌的指示。在一些情况中,报告基因的编码序列与天然编码序列融合,且所述指示是mRNA或所获融合蛋白的蛋白表达或所述融合蛋白的功能活性。
在一个具体方面,本文公开的方法可用于筛选和鉴定参与除转录以外的细胞过程,包括例如细胞存活、细胞***、细胞代谢、细胞凋亡、细胞循环、核小体组装、信号转导、多细胞生物体发育、免疫反应、细胞粘附、血管生成等的lncRNA。在一些实施方案中,所述方法可用于鉴定导致细胞过程变化的lncRNA,所述细胞过程选自下组:细胞存活、细胞***、细胞代谢、细胞凋亡、细胞循环、核小体组装、信号转导、多细胞生物体发育、免疫反应、细胞粘附和血管生成。在一些实施方案中,所述方法可用于鉴定导致细胞表型变化的lncRNA,所述细胞表型变化例如功能的丧失或功能的获得。在一些实施方案中,所述方法可用于鉴定导致编码基因和/或非编码基因的转录的减少或增加的lncRNA。所述方法可用于同时或顺序鉴定一种或多种lncRNA的作用,或者单个鉴定lncRNA的功能或鉴定不同组合的多个lncRNA的功能。
例如,以CRISPR/Cas指导RNA文库转染细胞群,所述CRISPR/Cas指导RNA分别编码靶向lncRNA剪接位点周围的基因组序列的指导RNA的不同序列,且在所述细胞中表达所述指导RNA,并在CRISPR/Cas存在下,所述指导RNA诱导发生lncRNA的外显子跳跃和/或内含子保留。每个细胞的RNA概貌和转录组可使用例如但不限于单细胞RNA测序(RNA-Seq)技术来进行分析。所述分析将揭示细胞基因组突变对RNA概貌的影响,包括RNA分子的类型和丰度。所述方法还可用于鉴定实现外显子跳跃和或内含子保留的指导RNA的性质(例如序列)。因此,可通过在单细胞中的实验在整个细胞转录组上立即观察到外显子跳跃或内含子保留的作用。
本发明提供CRISPR/Cas指导RNA构建体,其包含与启动子可操作连接的靶向长非编码RNA剪接位点周围的基因组序列的指导序列和发夹序列。
在一些实施方案中,真核基因组可以是人基因组,且因此CRISPR/Cas指导构建体可旨在于人细胞中使用。
指导序列的长度可以是19-21个核苷酸。发夹序列长度可以少于100个核苷酸、少于90、80、70、60、50、40或30个核苷酸,例如约20、30、40、50、60个核苷酸。在其他实施方案中,发夹序列长度可为约20-60个或20-40个核苷酸。一旦转录,发夹序列可与CRISPR/Cas核酸酶结合。
CRISPR/Cas指导构建体在本质上是DNA且当转录时产生指导RNA。
本发明还提供细胞群,其中包含任何上述宿主细胞。宿主细胞群可以是同源或异源的。
在一些实施方案中,所述细胞进一步包含CRISPR/Cas核酸酶和/或CRISPR/Cas核酸酶的编码序列。在一些实施方案中,所述细胞进一步包含Cas9核酸酶和/或Cas9核酸酶的编码序列。
在一些实施方案中,将报告蛋白或包含报告蛋白的融合蛋白的编码序列整合入宿主细胞的基因组。
在一些实施方案中,所述宿主细胞处在宿主细胞群中,且每种宿主细胞独立地包含专一的指导RNA构建体。
在一些实施方案中,每个宿主细胞表达专一的功能性指导RNA,且该宿主细胞相对于所述群中的其他宿主细胞在不同的基因组序列中发生由该指导RNA参与的突变。
本发明还提供在真核细胞基因组中用于筛选或鉴定长非编码RNA的高通量方法,包括向宿主细胞群引入靶向lncRNA剪接位点周围的基因组序列的CRISPR/Cas指导RNA文库,其中所述细胞群中的每个宿主细胞独立包含专一的指导RNA,并表达该专一的指导RNA,且在CRISPR/Cas核酸酶的存在下,切割并突变靶向的基因组序列,且因此导致lncRNA的外显子跳跃和/或内含子保留。
在一些实施方案中,所述高通量方法进一步包括鉴别鉴定lncRNA对细胞表型或编码基因或非编码基因的表达的影响。在一些实施方案中,每个宿主细胞表达专一的指导RNA且相对于所述群中的其他宿主细胞在不同的基因组序列中发生突变。在一些实施方案中,所述编码基因对于所述细胞的基因组为外源或内源的。在一些实施方案中,细胞表型的改变包括功能的丧失或功能的获得。在一些实施方案中,编码基因或非编码基因的表达的改变为编码基因或非编码基因转录的增加或减少。
本发明还提供通过本文公开的高通量方法筛选或鉴定的lncRNA。这些lncRNA包括但不限于XXbac-B135H6.15、RP11-848P1.5、AC005330.2、AP001062.9、AP005135.2、RP11-867G23.4、LINC01049、DGCR5、RP11-509A17.3、CTB-25J19.1、CTD-2517M22.17、CROCCP2、AC016629.8、CTC-490G23.4、RP11-117D22.1、AC067969.2、RP11-251M1.1、AC004471.9、AC004471.10、AC002472.11、RP11-429J17.7、RP11-56N19.5、TMEM191A、LL22NC03-102D1.18、LINC00410、LL22NC03-23C6.13、RP11-83J21.3、RP11-544A12.4、ANKRD62P1-PARP4P3、CTD-2031P19.5、XXbac-B444P24.8、RP11-464F9.21、TPTEP1、MIR17HG和BMS1P20,其可用于调节细胞生长或增殖。
本发明还提供用于干扰或消除真核细胞中长非编码RNA功能的方法,其包括向真核细胞引入一个或多个靶向长非编码RNA的一个或多个剪接位点周围的一个或多个多核苷酸序列的CRISPR/Cas指导RNA,由此所述一个或多个指导RNA靶向所述长非编码RNA的一个或多个剪接位点周围的一个或多个多核苷酸序列且在Cas蛋白的存在下,切割所述一个或多个多核苷酸序列,导致长非编码RNA的内含子保留和/或外显子跳跃并因此干扰或消除该长非编码RNA的功能。在一些实施方案中,所述指导RNA靶向长非编码RNA的SD位点或SA位点周围跨越-50-bp至+75-bp的区域内的多核苷酸序列。在一些实施方案中,所述指导RNA靶向长非编码RNA的SD位点或SA位点周围跨越-30-bp至+30-bp的区域内的多核苷酸序列。在一些实施方案中,所述指导RNA靶向长非编码RNA的SD位点或SA位点周围跨越-10-bp至+10-bp的区域内的多核苷酸序列。在一些实施方案中,所述CRISPR/Cas核酸酶是Cas9或Cpfl。在一些实施方案中,通过递送***实施向所述细胞的引入,所述递送***包括病毒颗粒、脂质体、电穿孔、显微注射、偶联、纳米颗粒、外来体、微泡或基因枪,优选地,通过包含慢病毒颗粒的递送***实施向所述细胞的引入。
附图简述
图1a-b.a,人类中剪接位点的基因组序列特征和碱基特异性。y轴表明每个基因座碱基的概率。b,由靶向剪接供体(SD)或剪接受体(SA)位点周围的sgRNA诱导的内含子保留或外显子跳跃的示意图。
图2a-b.该图显示关于必需核糖体基因的sgRNA文库筛选中重复实验间的相关性。HeLa细胞系(a)和Huh7.5细胞系(b)中包括第0天对照样品(Ctrl)和第15天实验样品(Exp)的靶向剪接的文库中标准化sgRNA读取计数的散点图。还报告了每个样品的两个重复实验间的Spearman相关(Spearman corr.)。
图3.该图体现了靶向HeLa和Huh7.5细胞系中核糖体基因的sgRNA文库的CRISPR筛选的深度测序分析。设计sgRNA饱和诱变文库以靶向79个核糖体基因的5’SD位点周围的-50-bp至+75-bp区和3’SA位点周围的-75-bp至+50-bp区。收集的质粒文库通过慢病毒分别转导入表达Cas9蛋白的HeLa和Huh7.5细胞。以标准化读取计数的log2(Exp:Ctrl)计算每个表示的基因座处全部sgRNA的下降,且黑色条形代表每个基因座处全部sgRNA的平均倍数变化。虚线表明剪接位点的位置。
图4a-c.该图显示生成剪接位点破坏的sgRNA靶向区的鉴定。a,HeLa和Huh7.5细胞系中每个基因座处高效sgRNA的标准化。通过将具有多于4倍下降的sgRNA的数目除以在所示基因座处设计的sgRNA的总数计算数据。b,HeLa和Huh7.5细胞系中靶向内含子、5’SD位点和外显子的高效sgRNA的比较。每个条形图代表具有在不同的区中具有大于2倍或4倍下降的sgRNA的百分比。数据表示为平均值±s.e.m。c,靶向HeLa和Huh7.5细胞系中内含子、3’SA位点和外显子的高效sgRNA的比较。数据表示为平均值±s.e.m。
图5a-e.该图阐述了CRISPR***的构建和基因组规模的筛选以鉴别对于细胞生长和增殖必需的lncRNA。a,CRISPR***的构建。b,靶向剪接的sgRNA文库的构建、筛选和数据分析的流程。c,两个独立重复间sgRNA倍数变化的散点图。d,非靶向sgRNA、靶向必需基因和lncRNA的sgRNA的log2(倍数变化)分布。通过t检验将每组的倍数变化与非靶向sgRNA进行了比较。***P<0.001。e,通过剪接靶向的CRISPR筛选的阴性选择的lncRNA的筛选评分,通过Wilcox检验将全部靶向sgRNA的倍数变化与阴性对照sgRNA进行了比较且生成的P值进一步由阴性对照基因的零分布(其通过随机取样阴性对照sgRNA获得)矫正。从平均倍数变化和矫正的P值计算筛选评分(参见方法部分)。最高的10个lncRNA采样和阴性选择的必需基因分别标记。
图6a-f.该图显示了候选lncRNA功能的验证。a-c,所示sgRNA在K562和GM12878细胞中对细胞增殖的效果,其包括三种对照sgRNA、非靶向sgRNA、靶向AAVS1基因座的sgRNA、靶向RPL18(一种对于细胞生长必需的基因)剪接位点的sgRNA(a)和两种阴性选择的lncRNA(b,c)。将每个包含CMV启动子驱动的EGFP标记物的sgRNA的慢病毒表达载体分别转导入K562和GM12878细胞。每3天通过FACS测量EGFP阳性细胞的百分比,指示sgRNA感染的细胞。第一次FACS分析在感染后3天开始(标记为第0天),随后对收集的细胞传代达12天。通过将在所示时间点EGFP阳性细胞的百分比除以第0天的百分比确定每个样品的细胞增殖。数据表示为三个生物重复实验的平均值和标准差。星号(*)代表在测定终点(第12天)与靶向AAVS1的sgRNA所比较的P值,其使用t检验计算并使用Benjamini-Hochberg方法调整。*P<0.05;**P<0.01;***P<0.001;****P<0.0001;NS,不显著。d,通过靶向剪接的策略,K562细胞中相比GM12878细胞中35种排名最高的候选lncRNA的细胞增殖。35种排名最高的候选lncRNA为XXbac-B135H6.15、RP11-848P1.5、AC005330.2、AP001062.9、AP005135.2、RP11-867G23.4、LINC01049、DGCR5、RP11-509A17.3、CTB-25J19.1、CTD-2517M22.17、CROCCP2、AC016629.8、CTC-490G23.4、RP11-117D22.1、AC067969.2、RP11-251M1.1、AC004471.9、AC004471.10、AC002472.11、RP11-429J17.7、RP11-56N19.5、TMEM191A、LL22NC03-102D1.18、LINC00410、LL22NC03-23C6.13、RP11-83J21.3、RP11-544A12.4、ANKRD62P1-PARP4P3、CTD-2031P19.5、XXbac-B444P24.8、RP11-464F9.21、TPTEP1、MIR17HG、BMS1P20。将阈值设置为80%,即第12天sgRNA感染细胞的标准化的百分比。浅灰点表示仅在K562细胞中必需的lncRNA且深灰点表示在K562和GM12878细胞中都呈现生长表型的那些。e,在K562细胞中lncRNA XXbac-B135H6.15的大片段缺失对细胞增殖的影响。设计了4对gRNA以缺失启动子和第一外显子。还自包含EGFP标记物的骨架表达了pgRNA并如图3实施了细胞增殖测定(a-c)。数据表示为三个生物重复实验的平均值和标准差。星号代表在第15天与AAVS1_p1比较的P值,其使用t检验计算并使用Benjamini-Hochberg方法调整。*P<0.05;**P<0.01;***P<0.001;****P<0.0001;NS,不显著。f,显示剪接靶向和pgRNA介导的缺失方法间对排名最高的lncRNA候选物的敲除效果的相关性。
图7-图12.这些附图提供了通过剪接靶向策略获得的排名最高的lncRNA的验证证据。
图13a-b.该图提供了通过大片段缺失对候选lncRNA的验证。a,在K562细胞中通过AAVS1基因座和必需基因RPL19、RPL23A的大片段缺失实施的细胞增殖测定。针对AAVS1基因座设计了2对gRNA,且针对每个必需基因都设计了一对gRNA以缺失启动子和第一外显子。pgRNA的设计原则和用于确定生长效果的方法与图3和剩下的附图中所述相同。数据表示为三个生物重复实验的平均值和标准差。星号代表在第15天与AAVS1_p1比较的P值,其使用t检验计算并使用Benjamini-Hochberg方法调整。*P<0.05;**P<0.01;***P<0.001;****P<0.0001;NS,不显著。b,还通过剪接靶向的策略验证了5种候选lncRNA的大片段缺失对细胞生长的效果。
图14.该图提供通过大片段缺失对候选lncRNA的验证,其中在K562细胞中6种候选lncRNA未通过剪接靶向的策略验证。
图15a-f.该图证明了K562和GM12878细胞系中lncRNAs MIR17HG和BMS1P20的功能性剖析。a,在MIR17HG-和BMS1P20-KO(敲除)细胞间显示最高变化的最高排名的500种基因及其相应的对照的表达模式。b,K562和GM12878细胞中排名最高的100种必需lncRNA候选的表达水平。c,MIR17HG-和BMS1P20-KO细胞中相比野生型K562细胞下调的必需基因的表达水平。d,在MIR17HG-和BMS1P20-KO K562细胞间显示下调的必需基因的维恩图。e,感染剪接靶向BMS1P20的sgRNA后在K562细胞中相比GM12878细胞中的差异表达的火山图。黑色和灰色的点分别代表全部基因和差异表达的基因。f,K562细胞中下调(上图)和上调(下图)的基因的基因本体论(GO)术语和KEGG注释。
图16a-e.该图阐述了K562和GM12878细胞中MIR17HG和BMS1P20的lncRNA敲除的RNA-seq概貌。a,MIR17HG-KO(敲除)、BMS1P20-KO和野生型K562细胞间基因表达水平的配对散点图。b,MIR17HG敲除、BMS1P20敲除和野生型GM12878细胞间基因表达水平的配对散点图。c,K562细胞中感染剪接靶向MIR17HG和BMS1P20的sgRNA后显示下调的保守必需基因的基因本体和KEGG注释。d,BMS1P20-KO和野生型K562细胞间差异表达的火山图。e,BMS1P20-KO和野生型GM12878细胞间差异表达的火山图。
发明详述
定义
本发明基于特定的实施方案并参照附图进行说明,但本发明不限于此,但保护范围由权利要求限定。权利要求中的任何参考标记不应该理解为是对范围的限制。在附图中,为了说明的目的,一些元素的尺寸可能被夸大并且不按比例绘制。在本说明书和权利要求书中使用术语“包含”的情况下,其不排除其它元素或步骤。当提及单数名词时使用冠词例如“一个”、“一种”或“这个”、“这种”等表述方式,但该表述方式通常也包括该名词的复数情况,除非明确说明。
本发明还提供以下术语或定义用于帮助理解本发明。除非在本文中具体定义,本文使用的所有术语具有与本发明技术领域的技术人员相同的含义。对于这些本领域的定义和术语,具体实践者可具体参考Sambrook等人,Molecular Cloning:A LaboratoryManual,2nd ed.,Cold Spring Harbor Press,Plainsview,New York(1989);and Ausubel等人,Current Protocols in Molecular Biology(Supplement 47),John Wiley&Sons,New York(1999)。本文提供的定义不应理解为具有小于本领域的技术人员所理解的范围。
术语“多核苷酸”、“核苷酸”、“核苷酸序列”、“核酸”和“寡核苷酸”可互换使用。其指任何长度的多聚形式的核苷酸,可以为脱氧核糖核苷酸或核糖核苷酸或其类似物。多核苷酸可具有三维结构,且可履行已知或未知的任何功能。下述为多核苷酸的非限制性实例:基因或基因片段的编码或非编码区、基因座、外显子、内含子、信使RNA(mRNA)、长非编码RNA(lncRNA)、转运RNA、核糖体RNA、短干扰RNA(siRNA)、短发夹RNA(shRNA)、微小RNA(miRNA)、核酶、cDNA、重组多核苷酸、支链多核苷酸、质粒、载体、任何序列的分离的DNA、任何序列的分离的RNA、核酸探针和引物。多核苷酸可包含一种或多种经修饰的核苷酸,如甲基化的核苷酸和核苷酸类似物。如果存在,对核苷酸结构的修饰可在多聚体组装之前或之后赋予。核苷酸的序列可由非核苷酸组分中断。多核苷酸可进一步在多聚化后修饰,如通过与标记组分的偶联。
在本发明的一方面,术语“嵌合RNA”、“嵌合指导RNA”、“指导RNA”、“单指导RNA”和“合成的指导RNA”可互换使用且指包含指导序列、tracr序列和tracr伴侣序列的多核苷酸序列。术语“指导序列”指在指定靶向位点的指导RNA内约20bp的序列,且可与术语“引导序列”或“间隔子”互换使用。
如本文使用,“表达”指多核苷酸从DNA模板转录(如成为mRNA或其他RNA转录物)的过程和/或转录的mRNA随后翻译成为肽、多肽或蛋白的过程。转录物和编码的多肽可统称为“基因产物”。如果多核苷酸源自基因组DNA,表达可包括真核细胞中mRNA的剪接。
除非另外说明,本发明的实践采用免疫学、生物化学、化学、分子生物学、微生物学、细胞生物学、基因组学和重组DNA的常规技术,其在本领域的技术范围内。参见Sambrook,Fritsch and Maniatis,MOLECULAR CLONING:A LABORATORY MANUAL,2ndedition(1989);CURRENT PROTOCOLS IN MOLECULAR BIOLOGY(F.M.Ausubel,等人eds.,(1987));the series METHODS IN ENZYMOLOGY(Academic Press,Inc.):PGR 2:APRACTICAL APPROACH(M.J.MacPherson,B.D.Hames and G.R.Taylor eds.(1995)),Harlowand Lane,eds.(1988)ANTIBODIES,A LABORATORY MANUAL,and ANIMAL CELL CULTURE(R.LFreshney,ed.(1987))14-18
本发明的数个方面涉及包含一种或多种载体的载体***,或这样的载体。可设计载体用于在原核或真核细胞中表达CRISPR转录物(例如核酸转录物、蛋白或酶)。例如,CRISPR转录物可在细菌细胞如大肠杆菌、昆虫细胞、酵母细胞或哺乳动物细胞中表达。适当的宿主细胞在Goeddel,GENE EXPRESSION TECHNOLOGY:METHODS IN ENZYMOLOGY 185,Academic Press,San Diego,Calif.(1990)19也有详细记载。可替换地,重组表达载体可在体外转录和翻译,例如,使用T7启动子调节序列和T7聚合酶。
在一些实施方案中,使用哺乳动物细胞载体,载体能够驱动哺乳动物细胞中一种或多种序列的表达。哺乳动物表达载体的实例包括pCDM820和pMT2PC21。当在哺乳动物细胞中使用时,表达载体的调控功能主要通过一种或多种调节元件提供。例如,常用的启动子源自多瘤病毒、腺病毒2、巨细胞病毒、猿猴病毒40和本文中公开以及本领域中已知的其他启动子。用于原核和真核细胞二者中的其他适当的表达***参见例如Chapters 16 and 17of Sambrook,等人,MOLECULAR CLONING:A LABORATORY MANUAL.2nd ed.,Cold SpringHarbor Laboratory,Cold Spring Harbor Laboratory Press,Cold Spring Harbor,N.Y.,198914
一般而言,“CRISPR***”共同地指参与CRISPR相关(“Cas”)基因的表达或指导其活性的转录物或其它元件,包括编码Cas基因的序列、tracr(trans–活化CRISPR)序列(例如tracrRNA或部分活化tracrRNA)、tracr-伴侣序列(在内源CRISPR***的背景下涵盖“同向重复”和tracrRNA-加工的部分同向重复)、指导序列(在内源CRISPR***的背景下还称为“间隔子”)或来自CRISPR基因座的其它序列和转录物。在一些实施方案中,CRISPR***的一个或多个元件源自I型、II型或III型CRISPR***。
在形成CRISPR复合物的背景下,“靶序列”指指导序列经设计以具有互补性的序列,其中靶序列和指导序列间的杂交促进CRISPR复合物的形成。假设存在引起杂交并促进CRISPR复合物形成的足够的互补性,完全互补不是必须的。
通常,在内源CRISPR***的背景下,CRISPR复合物的形成(包括指导序列与靶序列杂交并与一种或多种Cas蛋白复合)导致靶序列中或靶序列附近(例如,距离靶序列1、2、3、4、5、6、7、8、9、10、20、50或更多碱基对的范围内)的一条链或两条链的切割。不希望受理论所限,tracr序列可包含野生型tracr序列的全部或其一部分(例如野生型tracr序列约或大于约20、23、26、29、32、35、38、41、44、47、50、53、56、59、62、65、70、75、80、85或更多个核苷酸)或由上述组成的tracr序列还可形成CRISPR复合物的一部分,例如通过沿tracr序列的至少一部分与指导序列可操作连接的tracr伴侣序列的全部或一部分杂交。
在一些实施方案中,tracr序列与tracr伴侣序列具有足够的互补性以杂交并参与CRISPR复合物的形成。与靶序列相同,完全互补并不是必须的,只要足以发挥其功能即可。在一些实施方案中,在最佳对齐的情况下,tracr序列沿tracr伴侣序列的长度具有至少50%、60%、70%、80%、90%、95%或99%的互补性。
在一些实施方案中,将驱动CRISPR***的一个或多个元件表达的一个或多个载体引入宿主细胞进而CRISPR***元件的表达指导CRISPR复合物在一个或多个靶位点形成。在另一实施方案中,宿主细胞经工程化以稳定表达Cas9和/或OCT1。
一般而言,指导序列是与靶多核苷酸序列具有足够的互补性以与靶序列杂交并指导CRISPR复合物与靶序列的序列特异性结合的任何多核苷酸序列。在一些实施方案中,当使用适当的比对算法最佳比对时,指导序列及其相应靶序列间的互补程度为约或大于约50%,60%、75%、80%、85%、90%、95%、97.5%、99%或更多。最佳比对可使用用于比对序列的任何适当的算法确定,其非限制性实例包括Smith-Waterman算法、Needleman-Wimsch算法、基于Burrows-Wheeler Transform的算法(例如Burrows Wheeler Aligner)、ClustalW、Clustai X、BLAT、Novoalign(Novocraft Technologies,ELAND((Illumina,SanDiego,CA)、SOAP(可在soap.genomics.org.cn获得)和Maq(可在maq.sourceforge.net获得)。在一些实施方案中,指导序列长度可以为约或大于约5、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、35、40、45、50、55、60、65、70、75或更多个核苷酸。在一些实施方案中,指导序列长度少于约75、70、65、60、55、50、45、40、35、30、25、20、15、12或更少的核苷酸。指导序列指导CR1SPR复合物与靶序列的序列特异性结合的能力可通过任何适当的测定方法评估。例如,可向具有相应靶序列的宿主细胞提供足以形成CRISPR复合物的CRISPR***的组件(包括待测试的指导序列),如可通过使用编码CRISPR序列组件的载体转染,随后评估靶序列内的优先切割(如通过如本文所述的Surveyor测定)来进行。同样地,靶多核苷酸序列的切割可在测试管中通过提供靶序列、CRISPR复合物(包含待测试的指导序列和不同于指导序列的对照指导序列)的组件,并比较测试和对照指导序列反应间在靶序列的结合或切割率来评估。其他测定也是可能的,并且会是本领域的技术人员可知的。
在一些实施方案中,CRISPR酶是包含一个或多个异源蛋白结构域的融合蛋白的一部分(例如,除CRISPR酶外约或大于约1、2、3、4、5、6、7、8、9、10或更多结构域)。CRISPR酶融合蛋白可包含任何额外的蛋白序列,且任选地任何两个结构域间的接头序列。可与CRISPR酶融合的蛋白结构域的实例包括但不限于表位标签、报告基因序列和具有一种或多种下述活性的蛋白结构域:甲基化酶活性、脱甲基酶活性、转录活化活性、转录抑制活性、转录释放因子活性、RNA切割活性和核酸结合活性。
在一些方面,本发明提供包括向宿主细胞递送一种或多种多核苷酸的方法,所述一种或多种多核苷酸为例如一种或多种如本文所述的构建体,例如载体,其一种或多种转录物和/或由其转录的一种或多种蛋白。本发明可作为基于DNA的基因组的靶向修饰的基础平台使用。其可与任何递送***接口,包括但不限于病毒、脂质体、电穿孔、微注射和偶联。在一些方面,本发明进一步提供由这样的方法产生的细胞,和包含这些细胞或由这些细胞产生的生物体(如动物、植物或真菌)。在一些实施方案中,将与指导序列组合(和任选地复合)的CRISPR酶递送至细胞。可使用常规的病毒和不基于病毒的基因转移方法将核酸引入哺乳动物细胞或靶组织。这样的方法可用于施用编码CRISPR***组件的核酸至培养基中或宿主生物体中的细胞。非病毒载体递送***包括DNA质粒、RNA(例如本文所述的载体转录物)、裸核酸和与递送媒介物复合的核酸如脂质体。病毒载体递送***包括DNA和RNA病毒,其具有用于递送至细胞的游离或整合的基因组。
核酸的非病毒递送方法包括脂质体转染、核转染、微注射、基因枪、病毒颗粒、脂质体、免疫脂质体、聚阳离子或脂质:核酸偶联物、裸DNA和人工病毒粒子。
使用基于RNA或DNA的***用于递送核酸具有使病毒靶向机体特定细胞并将病毒载荷运输到细胞核的高效优势。
在优选的实施方案中,本发明的靶标包括长非编码RNA(lncRNA),其代表一类长转录RNA分子,例如长度超过200个核苷酸的RNA分子。其大小使lncRNA与小调节性RNA如微小RNA(miRNA)、短干扰(miRNA)、Piwi-相互作用RNA(piRNA)、小核仁RNA(snoRNA)、短发夹RNA(shRNA)和其它短RNA的lncRNA区分开。lncRNA可以序列特异性的方式通过与DNA或RNA结合或通过与蛋白结合发挥功能。与miRNA相反,lncRNA看起来并非以通常的作用模式起作用,但可以以多种方式调节基因表达和蛋白合成。
基于其相对蛋白编码基因的位置可将lncRNA分为下述基因座生物型。基因间lncRNA,其在遗传上从两条链转录;内含子lncRNA,其完全由蛋白编码基因的内含子转录;正义lncRNA,其从蛋白编码基因的正义链转录并包含与蛋白编码基因部分重叠的来自蛋白编码的基因的外显子或通过内含子覆盖蛋白编码基因的完整序列;和反义lncRNA,其从与外显子或内含子区重叠的蛋白编码基因的反义链转录,或通过内含子覆盖完整的蛋白编码序列。人转录组分析的近期研究显示蛋白编码序列仅占小部分的基因组转录物。主要的人基因组转录物为非编码RNA(lncRNA)。
术语“lncRNA”取其广义,指本发明的靶标并包括“lncRNA基因”以及其产生的“lncRNA转录物”。
如本文使用的术语“外显子”指将编码最终成熟RNA(由RNA剪接去除内含子后的基因产生)的一部分的基因的任何部分。术语外显子指基因内的DNA序列以及RNA转录物中相应的序列。在RNA剪接中,去除内含子且外显子彼此作为生成成熟信使RNA的部分共价接合。
“内含子”是最终的RNA产物成熟过程中由RNA剪接去除的基因内的任何核苷酸序列。术语内含子指基因内的DNA序列和RNA转录物中的相应序列。RNA剪接后在最终成熟的RNA中序列接合在一起。在大多数生物体和多种病毒的基因中发现了内含子,且存在于多种基因中,包括生成蛋白、核糖体RNA(rRNA)、长非编码RNA (lncRNA)和运输RNA(tRNA)的那些基因中。当从包含内含子的基因生成蛋白时,RNA剪接作为转录后的RNA加工通路的一部分并先于翻译发生。
如本文使用的术语“剪接”意为将新生的前体信使(pre-mRNA)转录物编辑成为成熟的信使RNA(mRNA)。对于大多真核内含子,剪接在由剪接体(小核核糖核蛋白(snRNP)的复合物)催化的一系列反应中实施。剪接体内含子通常位于真核生物蛋白编码基因的序列之内。在内含子之内,对于剪接必须的是供***点(内含子的5'末端)、分支位点(靠近内含子的3'末端)和受***点(内含子的3'末端)。在更大的、较不保守的区之内,剪接供体(SD)位点包括内含子5'末端几乎不变的序列GT。内含子3'末端的剪接受体(SA)位点以几乎不变的AG序列终止内含子。AG的上游(5'-方向)存在富含嘧啶(C和T)或多聚嘧啶束的区。多聚嘧啶束更上游是分支点,其包含参与套索形成的腺嘌呤核苷酸22,23
核pre-mRNA内含子特征在于位于内含子和外显子边界处的特定内含子序列。当初始剪接反应时,这些序列由剪接体RNA分子识别。主要的剪接体剪接在5'剪接位点处包含GT和在3'剪接位点包含AG的内含子,且该类剪接称为规范剪接或称为套索通路,99%以上的剪接是这样的剪切方式。相比之下,当内含子侧翼序列不遵循GT-AG规则时,据称发生非规范剪接,占不到1%的比例24
我们使用Weblogo3工具的生物信息学分析显示人基因组中约99%的内含子区在5’位点侧翼为GT且在3’位点侧翼为AG。这些内含子区适用于编码基因和非编码RNA。
外显子跳跃是RNA剪接的形式,其引起一个或多个外显子“跳过”最终的RNA,而内含子保留则是其中内含子在剪接后仍保留在最终的RNA中的RNA剪接形式。
剪接由pre-mRNA上的反式作用蛋白(阻遏蛋白和活化蛋白)和相应的顺式作用调节位点(沉默子和增强子)调节。然而,作为选择性剪接复杂性的一部分,应该注意的是剪接因子的效应经常是位置依赖性的。也就是说,在外显子的背景中,当与内含子增强子元件结合时,作为剪接活化蛋白发挥作用的剪接因子在预期剪接元件结合时可作为阻遏蛋白发挥作用,反之亦然25。pre-mRNA转录物的二级结构也在调节剪接中起作用,如通过将剪接元件汇集在一起或通过掩蔽一种序列起作用,所述序列如果不被掩蔽的话会作为剪接因子的结合元件发挥作用26。总之,这些元件形成控制在不同细胞条件下剪接如何发生的“剪接密码”27
真核细胞中基因的修饰
本发明的方法涉及有效递送靶向剪接位点的sgRNA以产生外显子跳跃和/或内含子保留来干扰基因,包括例如编码基因或非编码基因。对于编码lncRNA的基因,所述方法可有效影响lncRNA的功能。
为评估CRISPR筛选中剪接靶向的效力,我们设计了靶向79个核糖体基因的剪接位点的饱和文库,其中大多数对于多种细胞系中的细胞生长是必需的。该文库包含5,788个sgRNA,其切割位点在这79个基因的每个5’SD(剪切供体)位点周围的50-bp至+75-bp和每个3’SA(剪切受体)位点周围的50-bp至+75-bp内。显然,影响剪接位点的sgRNA优于仅靶向外显子区域的sgRNA,并且从sgRNA切割位点到剪接位点的距离越接近,其破坏基因的效果越好,对于SD和SA的情况,峰点略微朝向外显子。
CRISPR/Cas9作用机制和文库筛选原理
本发明的方法利用CRISPR/Cas***。Cas9是来自微生物II型CRISPR(聚集规则间隔的短回文重复)***,其已显示当与单指导RNA(gRNA)配对时切割DNA。gRNA包含17-21bp的序列,其指导Cas9至基因组中的互补区域,因此允许特异性生成双链断裂(DSB)位点,其通过细胞非同源末端连接(NHEJ)机制以易错的方式修复。Cas9首要切割其后为PAM序列(-NGG)的gRNA的基因组位点。NHEJ-介导的Cas9诱导的DSB修复诱导切割位点处初始的宽范围的突变,所述切割位点通常为较小(<10bp)的***/缺失(indel)但可包括较大的(>100bp)***/缺失(indel)和单个碱基改变。
本发明剪接靶向的方法可用于筛选基因组中的多个(例如数千个)序列,由此阐明这些序列的功能。在一些实施方案中,本发明的剪接靶向方法涉及通过使用CRISPR/Cas9***对非编码RNA的高通量筛选以鉴定存活、增殖或耐药性等所需的基因。在筛选中,例如通过慢病毒载体将靶向感兴趣基因内数万剪接位点的gRNA作为集合与Cas9共同递送入靶细胞。选择预期的表型后通过鉴别在细胞内富集或消耗的gRNA,可以***性鉴别该表型所需的基因。
在以上述高通量CRISPR/Cas9为基础的方式中,可将gRNA文库克隆入慢病毒载体。在该情况中,需要降低感染复数(MOI)以限制单个细胞中指导RNA的数目,通常每个细胞仅具有单个指导RNA。在每个细胞中整合gRNA是随机的,从而允许每个细胞仅表达一种gRNA的合并筛选(pool screen)。值得注意的是,本发明的靶向剪接位点的基因组上基于gRNA的高通量筛选也可用于其他针对编码基因和调节基因的基于CRISPR的高通量筛选。
指导RNA
如本领域已知,CRISPR/Cas***核酸酶需要指导(引导)RNA以切割基因组DNA。这些指导RNA由下述构成:(1)使CRISPR/Cas***核酸酶以序列特异性的方式靶向基因组位置的多个序列的、包含19-21个核苷酸的间隔子(指导序列),和(2)在引导RNA之间并允许指导RNA与CRISPR/Cas***核酸酶结合的发夹序列。在CRISPR/Cas核酸酶的存在下,指导RNA触发细胞中基于CRISPR/Cas的基因组切割事件。
基于预期的靶序列选择或设计指导序列。在一些实施方案中,靶序列是剪接位点周围的序列,例如编码细胞基因组内lncRNA的基因的SD位点周围-50-bp至+75-bp的区域,优选SD位点周围-30-bp至+30-bp的区域,且最优选为SD位点周围-10-bp至+10-bp的区域;SA位点周围-50-bp至+75-bp的区域,优选SA位点周围-30-bp至+30-bp的区域,且最优选为SA位点周围-10-bp至+10-bp的区域。示例性的靶序列包括靶基因组中特有的那些序列。
例如,对于化脓性链球菌(S.pyogenes)Cas9,基因组中特有的靶系列可包括形式为M8N12XGG的Cas9靶位点,其中N12XGG(N是A、G、T或C;且X可以为任一种)在基因组中具有单发生率。基因组中的特有靶序列可包括形式M9N11XGG的化脓性链球菌Cas9靶位点,其中N11XGG(N是A、G、T或C;且X可以为任一种)在基因组中具有单发生率。
对于嗜热链球菌(S.thermophilus)CRISPR1Cas9,基因组中的特有靶序列可包括形式M8N12XXAGAAW的Cas靶位点,其中N12XXAGAAW(N是A、G、T或C;且X可以为任一种,且W为A或T)在基因组中具有单发生率。基因组中的特有靶序列可包括M9N11XXAGAAW形式的嗜热链球菌CRISPR1Cas9靶位点,其中N12XXAGAAW(N是A、G、T或C;且X可以为任一种,且W为A或T)在基因组中具有单发生率。
对于化脓性链球菌Cas9,基因组中的特有靶序列可包括形式M8N12XGGXG的靶位点,其中N12XGGXG(N是A、G、T或C;且X可以为任一种)在基因组中具有单发生率。基因组中特有靶序列可包括M9N11XGGXG形式的化脓性链球菌Cas9靶位点,其中N12XGGXG(N是A、G、T或C;且X可以为任一种)在基因组中具有单发生率。在这些序列的每一种中,“M”可以是A、G、T或C,且在将序列认定为特有序列时无需考虑。
应当理解的是,可使用任何发夹序列,只要其可由CRISPR/Cas核酸酶识别和结合。
指导RNA构建体
在一些实施方案中,本发明涉及指导RNA构建体。指导RNA构建体可包含(1)指导序列和(2)指导RNA发夹序列,和任选的(3)能够初始指导RNA转录的启动子序列。指导RNA发夹序列的非限制性实例为Chen等人Cell.2013Dec 19;155(7):1479-91中所述的FE发夹序列。启动子的实例为人U6启动子。
在一些实施方案中,本发明涉及CRISPR/Cas指导构建体,其包含(1)指导序列和(2)指导RNA发夹序列,和任选的(3)能够初始指导RNA转录的启动子序列,其中所述指导序列靶向真核细胞基因组中剪接位点周围的序列,例如所述指导序列靶向编码lncRNA的基因的SD位点或SA位点周围-50-bp至+75-bp的区域,优选SD位点或SA位点周围-30-bp至+30-bp的区域,且最优选SD位点或SA位点周围-10-bp至+10-bp的区域。在一些实施方案中,指导序列靶向编码真核细胞基因组中长非编码RNA的基因的剪接位点以诱导外显子跳跃和/或内含子保留,并因此破坏所述长非编码RNA。在一些实施方案中,真核细胞基因组是人基因组。在一些实施方案中,指导序列长度为19-21个核苷酸。在一些实施方案中,发夹序列长度为约40个核苷酸且一旦转录可与CRISPR/Cas核酸酶结合。
CRISPR/Cas***核酸酶
在一些实施方案中,CRISPR/Cas核酸酶是II型CRISPR/Cas核酸酶。在一些实施方案中,CRISPR/Cas核酸酶是Cas9核酸酶。在一些实施方案中,Cas9核酸酶是肺炎链球菌,化脓性链球菌或嗜热链球菌Cas9,且可包括源自这些生物体的突变的Cas9。所述核酸酶可以是Cas9的功能性等价变体。在一些实施方案中,CRISPR/Cas核酸酶对于真核细胞中的表达是密码子优化的。在一些实施方案中,CRISPR/Cas核酸酶指导靶序列位置处一条或两条链的切割。CRISPR/Cas***核酸酶包括但不限于Cas9和Cpfl。
报告基因和蛋白,以及读取
在一些实施方案中,报告基因可使用CRISPR/Cas机制整合入细胞。例如,可使用其中整合了所述报告构建体的包含启动子(例如U6启动子)、指导RNA发夹序列和靶向预期基因组基因座的指导序列的表达载体如质粒。这样的表达载体可通过将指导序列克隆入包含其它元件的表达构建体来制备。可制备包含报告蛋白编码序列的DNA片段并随后修饰以包含在报告蛋白编码序列侧翼的同源臂。将指导RNA表达载体,包含编码报告蛋白的序列的扩增的DNA片段和CRISPR/Cas核酸酶(或编码核酸酶的表达载体)引入宿主细胞(例如经由电穿孔)。表达载体可进一步包含额外的选择标记物如抗生素抗性标记物以富集成功传染有表达载体的细胞。可进一步选择表达报告蛋白的细胞。
报告基因用于鉴别被潜在转染的细胞并用于评估调节序列的功能。一般而言,报告基因是对于宿主细胞非内源或天然并编码可容易测定的蛋白的基因。编码容易测定的蛋白的报告基因为本领域已知,其包括但不限于绿色荧光蛋白(GFP)、谷胱甘肽S转移酶(GST)、辣根过氧化物酶(HRP)、氯霉素乙酰转移酶(CAT)β-半乳糖苷酶、β-葡糖苷酸酶、荧光素酶、HcRed、DsRed、青色荧光蛋白(CFP)、黄色荧光蛋白(YFP)和自体荧光蛋白,包括蓝色荧光蛋白(BFP)、细胞表面标记物、抗生素抗性基因如neo等。
表达载体
术语“载体”指能够运输其所连接的另一核酸的核酸分子。载体包括但不限于为单链、双链或部分双链的核酸分子;包含一个或多个自由末端、无自由末端(例如环形)的核酸分子;包含DNA、RNA或二者的核酸分子;以及其他多种本领域已知的多核苷酸。一种类型的载体为“质粒”,其指其中如通过标准分子克隆技术***额外DNA区段的环状双链DNA环。一些载体能够在其所引入的宿主细胞中自我复制(例如,具有细菌的复制起始的细菌载体和附加型哺乳动物载体)。当引入宿主细胞时,其它载体(例如非附加型哺乳动物载体)整合入宿主细胞的基因组,并由此与宿主基因组共同复制。此外,一些载体能够指导其可操作连接的基因的表达。这样的载体在本文称为“表达载体”。重组DNA技术中的表达载体经常采取质粒的形式。
重组表达载体可包含适于宿主细胞中核酸表达的形式的本发明的核酸,其意为所述重组表达载体包含与待表达的核酸序列可操作连接的一个或多个调节元件,其可在用于表达的宿主细胞的基础上选择。在重组表达载体内,“可操作连接”旨在将感兴趣的核苷酸序列与调节元件以允许核苷酸表达的方式连接(例如在体外转录/翻译***或当所述载体引入宿主细胞时在宿主细胞中表达)。
宿主细胞
实上,任何真核细胞类型都可以用作宿主细胞,只要其可在体外培养并如本文所述进行修饰。优选,宿主细胞为预先建立的细胞系。宿主细胞和细胞系可以是人细胞或细胞系,或其可以为非人、哺乳动物细胞或细胞系。
实施例
材料和方法
1.细胞和试剂
来自Z.Jiang实验室(北京大学)的HeLa细胞系培养于Dulbecco’s modifiedEagle’s培养基(DMEM,Gibco C11995500BT)中。来自S.Cohen实验室(斯坦福大学医学院)的Huh 7.5细胞系培养于补充有1%MEM非必需氨基酸(NEAA,Gibco 1140-050)的DMEM(Gibco)中。来自H.Wu实验室(北京大学)的K562细胞和来自Coriell细胞库的GM12878细胞培养于RPMI1640培养基(Gibco11875-093)中。全部细胞都补充有10%的胎牛血清(FBS,CellMaxBL102-02)和1%青霉素/链霉素,在37℃的5%CO2中培养。
2.用于测试内含子保留或外显子跳跃的逆转录PCR(RT-PCR)
将sgRNA克隆入携带CMV启动子驱动的mCherry标记物的慢病毒表达载体,随后以MOI<1通过病毒感染转导HeLaOC细胞1-4,感染后72小时,FACS分选mCherry阳性细胞并使用RNAprep纯化细胞/细菌试剂盒(TIANGEN DP430)提取每个样品的总RNA。使用QuantscriptRT试剂盒(TIANGEN KR103-04)从2μg的总RNA合成cDNA,并使用TransTaq HiFi DNA聚合酶(TransGen AP131-13)实施RT-PCR反应。
靶向RPL18或RPL11基因的sgRNA序列:
sgRNA1RPL18:5’-GGACCAGCCACTCACCATCC(SEQ ID No.1)
sgRNA2RPL18:5’-AGCTTCATCTTCCGGATCTT(SEQ ID No.2)
sgRNA3RPL11:5’-TCCTTGTGACTACTCACCTT(SEQ ID No.3)
sgRNA4RPL11:5’-AACTCATACTCCCGCACCTG(SEQ ID No.4)
用于RT-PCR的引物:
1F:5’-CTGGGTCTTGTCTGTCTGGAA(SEQ ID No.5);
1R:5’-CTGGTGTTTACATTCAGCCCC(SEQ ID No.6);
2F:5’-GGCCAGAAGAACCAACTCCA(SEQ ID No.7);
2R:5’-GACAGTGCCACAGCCCTTAG(SEQ ID No.8);
3F:5’-TCAAGATGGCGTGTGGGATT(SEQ ID No.9);
3R:5’-GACCAGCAAATGGTGAAGCC(SEQ ID No.10);
4F:5’-GATCCTTTGGCATCCGGAGA(SEQ ID No.11);
4R:5’-GCTGATTCTGTGTTTGGCCC(SEQ ID No.12)。
3.剪接靶向必需核糖体基因的sgRNA文库的构建和筛选
从NCBI检索了79个核糖体基因。我们扫描了靶向这79个基因的每个5’SD位点周围-50-bp至+75-bp和每个3’SA位点周围-75-bp至+50-bp的全部潜在的sgRNA,所述基因包括:
RPL10、RPL10A、RPL11、RPL12、RPL13、RPL13A、RPL14、RPL15、RPL17、RPL18、RPL18A、RPL19、RPL21、RPL22、RPL22L1、RPL23、RPL23A、RPL24、RPL26、RPL26L1、RPL27、RPL27A、RPL28、RPL29、RPL3、RPL30、RPL31、RPL32、RPL34、RPL35、RPL35A、RPL36、RPL36A、RPL36AL、RPL37、RPL37A、RPL38、RPL39、RPL39L、RPL3L、RPL4、RPL41、RPL5、RPL6、RPL7、RPL7A、RPL7L1、RPL8、RPL9、RPS10、RPS11、RPS12、RPS13、RPS14、RPS15、RPS15A、RPS16、RPS19、RPS2、RPS20、RPS21、RPS23、RPS24、RPS25、RPS26、RPS27、RPS27A、RPS27L、RPS28、RPS29、RPS3、RPS3A、RPS4X、RPS4Y1、RPS4Y2、RPS5、RPS6、RPS7、RPS8。我们确保全部sgRNA与人类基因组的任何其他基因座具有至少2个错配。为呈现文库中sgRNA的天然切割效力,设计中不考虑GC含量。使用CustmoArray 12K阵列芯片(CustmoArray,Inc.)合成靶向79个核糖体基因的共5,788个sgRNA。此处以79个核糖体基因中的RPL18基因为例阐述sgRNA的设计。
Figure GDA0001742471170000251
Figure GDA0001742471170000261
Figure GDA0001742471170000271
在表达Cas9的HeLa和Huh7.5细胞中以<0.3的MOI通过慢病毒递送构建了含有这些sgRNA的细胞文库28,最小覆盖为400×。病毒感染后72小时,通过FACS(BD)对所述细胞根据mCherry+进行分选。使用DNeasy Blood和Tissue试剂盒(QIAGEN 69506)收集每个文库的对照细胞(2.4×106)用于基因组DNA提取,且在提取基因组DNA前持续培养实验细胞达15天。对于每个重复,通过TransTaq HiFi DNA聚合酶(TransGen AP131-13)PCR扩增慢病毒整合的sgRNA编码区,并如之前所述进一步使用DNA Clean&Concentrator-25(Zymo ResearchCorporation D4034)纯化4,9。使用用于Illumina(NEB E7370L)的NEBNext Ultra DNALibrary Prep试剂盒制备获得的文库用于高通量测序分析(Illumina HiSeq2500)。
4.基因组规模的人类lncRNA文库的设计和构建
从包含14,470个lncRNA的GENCODE数据集V20检索lncRNA。在该数据集中,在第一过滤步骤中去除了无剪接位点的2477个lncRNA。对于剩余的lncRNA,设计了靶向每个5’SD位点和3’SA位点周围-10-bp至+10-bp区的全部潜在的20-nt sgRNA。为确保切割效率和特异性,我们仅保留与基因组中其他基因座具有至少2个错配的sgRNA,其GC含量在20%-80%,且去除了那些包含≥4-bp的T核苷酸同聚合物的sgRNA。为实现最佳覆盖,保留了一些与其它基因座具有1-bp或0-bp错配的sgRNA,只要其不靶向K562细胞系的任何必需基因15且错配位点的总数少于2。最终合成了靶向10,996lncRNA的共126,773个sgRNA。在该文库中,我们还包括了500个人基因组中非靶向的sgRNA作为阴性对照,和350个靶向36个必需核糖体基因的sgRNA作为阳性对照。使用CustmoArray 90K阵列芯片(CustmoArray,Inc.)合成了寡核苷酸,且文库构建如上文所述。
5.基因组规模的lncRNA筛选
将共5×108个K562细胞铺板于175cm2烧瓶(Corning 431080),每种两个重复。以在24小时中小于0.3(1000x覆盖)的MOI使用sgRNA文库慢病毒感染细胞。感染后48小时,将文库细胞进行嘌呤霉素处理(3μg/ml;Solarbio P8230)达2天。对于每个重复,收集共1.3×108个细胞作为第0天的对照样品用于基因组提取。病毒感染后30天,分离1.3×108个实验细胞用于基因组提取和NGS分析4,9
6.筛选的计算机分析
将测序读取映射至hg38参照基因组并通过自制脚本解码。从两个复制中标准化定量sgRNA计数,随后计算了实验和对照组间的平均计数和倍数变化。通过每个基因的替换随机化取样10个阴性对照sgRNA生成1000个阴性对照基因。随后基于下述标准过滤了噪音sgRNA:如果在一个重复中sgRNA的倍数变化低于阳性对照sgRNA中的平均倍数变化且在另一个重复中高于阴性对照sgRNA的平均倍数变化,则将sgRNA视为过滤的噪音sgRNA。噪音过滤后对于每个lncRNA,我们通过Wilcox测试与阴性对照比较了sgRNA的倍数变化,并使用通过阴性对照生成的经验分布校正了p值以减少假阳性率。我们最终将筛选评分定义为:筛选评分=规模(-log10(调整的p-值))+|规模(log2(sgRNA倍数变化))|。我们指定具有高于2的筛选评分的那些命中者为必需lncRNA。
7.lncRNA采样数的确认
自文库选择两个排名前列的sgRNA用于剪接策略的确认,所述sgRNA对基因组中的任何其它基因座具有至少2个错配。对于pgRNA缺失策略,设计pgRNA以缺失每个lncRNA的启动子和第一外显子。我们根据下述原则设计了gRNA对:(1)一个sgRNA靶向转录起始位点(TSS)上游2.5-3.5kb区且另一个靶向TSS下游0.2-1.5kb区;(2)避免与任何编码或非编码基因的外显子或启动子重叠。对于所述pgRNA对的每个sgRNA,我们进一步确保(1)GC含量为45%-70%,(2)sgRNA不包括≥4-bp的同聚物,且(3)sgRNA包含与人基因座中的任何其它基因座多于2个的错配。我们将一些与其它基因座具有2个错配但脱靶位点少于2的sgRNA包括在内。
将待确认的靶向所选lncRNA的全部sgRNA或pgRNA单独克隆入具有CMV启动子驱动的带EGFP标记的慢病毒载体。病毒包装后,将sgRNA或pgRNA慢病毒以<1.0的MOI转导入K562或GM12878细胞。细胞增殖测定如之前文献的描述9
8.RNA测序和数据分析
将靶向lncRNA MIR17HG和BMS1P20的剪接位点的两种sgRNA分别克隆入具有EGFP标记的慢病毒载体。将sgRNA通过慢病毒感染(MOI<1)递送入K562或GM12878细胞。感染后5天通过FACS分选2×106个EGFP阳性K562或GM12878细胞。使用RNeasy Mini试剂盒(QIAGEN79254)提取每个样品的总RNA,并依照NEBNext PolyA mRNA Magnetic Isolation Module(NEB E7490S)、NEBNext RNA First Strand Synthesis Module(NEB E7525S)、NEBNextmRNA Second Strand Synthesis Module(NEB E6111S)和用于Illumina的NEBNext UltraDNA Library Prep试剂盒(NEB E7370L)制备了RNA-seq文库。使用Illumina HiSeq X Ten平台(Genetron Health)对全部样品进行NGS分析。将深度测序读数映射至hg38参照基因组并通过RSEM v1.2.2530量化基因的表达。通过EBSeq版本1.10.031实施差异表达分析且差异表达的基因选自已调整P值<0.05且绝对log2(倍数变化)>3的那些。通过DAVID 6.832实施基因本体(Gene Ontology)和KEGG分析。
结果
与公知常识一致,存在形成剪接位点的保守序列,我们使用Weblogo3工具33的生物信息学分析显示,人基因组中约99%的内含子区在5’剪接供体(SD)位点侧翼为GT且在3’剪接受体(SA)位点侧翼为AG。值得注意的是,AG序列主要作为SD位点直接上游的外显子的最后两个碱基存在(图1a)。为确认sgRNA在产生外显子跳跃和/或内含子保留中的有效性,我们设计了靶向两种核糖体基因RPL18和RPL11的SD或SA位点的sgRNA,所述基因对于细胞生长和增殖都是不可或缺的。在稳定表达Cas9和OCT1基因4的HeLa细胞中,靶向SD位点的sgRNA1RPL18和靶向SA位点的sgRNA2RPL18在基因组中RPL18基因座上分别生成了内含子3保留和外显子4跳跃,其通过逆转录PCR(RT-PCR)和Sanger测序分析均得以确认。
从在RPL11基因上的相似尝试获得了相同的结果,其中sgRNA3RPL11和sgRNA4RPL11在RPL11基因座上分别产生了内含子2保留和外显子4跳跃。图1b显示了由靶向剪接供体(SD)或剪接受体(SA)位点的sgRNA诱导的内含子保留和外显子跳跃的模式图。
为进一步评估CRISPR扫描中靶向剪接的效力,我们设计了靶向79个核糖体基因的剪接位点的饱和库,所述79个核糖体基因在多种细胞系中对于细胞生长是必需的29。该文库包含5,788种sgRNA,其切割位点在这79个基因每个5’SD位点周围的-50-bp至+75-bp内和每个3’SA位点的-75-bp至+50-bp内,sgRNA的示例参见表1。
在表达Cas9的HeLa细胞和Huh7.5细胞中,以<0.3的MOI(感染复数)通过慢病毒递送构建了含有这些sgRNA的细胞文库。通过长达15天的文库细胞的细胞培养进行筛选,并且基于NGS分析,破译导致细胞活力下降的sgRNA。
通过计算15-天实验样品(Exp)和对照样品(Ctrl)间sgRNA的倍数变化,我们对全部sgRNA进行了排序并根据sgRNA切割位点和其相应的SD或SA位点间的距离(多少个碱基对)进行了比对。HeLa和Huh7.5两种细胞中Ctrl和Exp生物重复实验间的Spearman相关性显示,全部结果都是高度可重复的(图2)。为体现剪接靶向对基因破坏的有效性,我们合并了全部靶向SD位点的数据和靶向SA位点的数据,并根据其相对于SD或SA位点的物理距离对其进行了排列(图3)。明显的是,在HeLa和Huh7.5细胞二者中,影响剪接位点的sgRNA优于仅靶向外显子区的那些。sgRNA的切割位点与剪接位点的距离越近,其对基因破坏的效果越好,其中对于SD和SA两种情况,高峰点都略微朝向外显子(图3)。相比之下,靶向内含子的大量sgRNA在筛选过程中很少耗尽,表明其对基因破坏和因该基因功能丧失对细胞活力的影响很小。仅有的例外是靶向这样的内含子区的那些sgRNA34,35,所述内含子区靠近SA位点、包括分支点,随后是已知参与RNA剪接的多聚嘧啶核苷束。
由于针对任何基因座设计的sgRNA的数目并不相等,为公平比较,我们比较了每个基因座的高效sgRNA(超过4倍下降的sgRNA)的百分比。通过如此标准化,我们进一步确认了靶向SD和SA的sgRNA大大优于仅靶向外显子区的那些(图4a)。为更好量化我们的结果,我们将全部sgRNA分为三类:靶向内含子的sgRNA(sgRNA的切割位点在内含子内且距离SD或SA位点至少30-bp)、靶向外显子的sgRNA(sgRNA的切割位点在外显子内且距离SD或SA位点至少30-bp)和靶向剪接的sgRNA(sgRNA的切割位点在SD或SA位点侧翼-10-bp至+10-bp间,且-和+分别指内含子和外显子方向)。在HeLa和Huh7.5细胞二者中,导致超过2或4倍下降的sgRNA的百分比在靶向剪接的sgRNA中比其它两类中高得多(图4b,4c)。
基于上述结果,我们推断该策略应普遍适用于编码基因和非编码RNA,这是由于RNA剪接在二者中都是非常保守的机制。假设靶向剪接位点将可能使得人细胞中的lncRNA功能通过外显子跳跃和/或内含子保留被破坏,我们设计并构建了特别靶向剪接的sgRNA文库以建立lncRNA在基因组规模的功能性筛选。从GENCODE数据库V20检索的14470中lncRNA中,我们首先过滤掉2,477中缺乏剪接位点的。我们还遵循了数项其它规则:全部sgRNA切割位点都在剪接位点周围-10-bp至+10-bp内,且预测sgRNA具有高切割活性29,36,37而没有对任何已知必需基因的脱靶15(参见方法部分)。我们最终制备了包含126,773种sgRNA的文库,其靶向10,996种特有的lncRNA。与500种非靶向的对照sgRNA和350种靶向必需核糖体基因的sgRNA一起,我们构建了细胞文库,其中工程化改造的K562细胞稳定表达Cas9蛋白(图5a和图2a)。通过以<0.3的低MOI进行慢病毒转导制备了细胞文库。感染后我们连续培养文库细胞达30天以筛选影响细胞生长和增殖的那些lncRNA。随后采用NGS分析用于sgRNA解码4,9(图5b)。
培养30天后,靶向lncRNA和必需基因的sgRNA相比非靶向的sgRNA都有所消耗(图5c、5d,图2b),表明其对细胞存活或增殖的影响。对于每种lncRNA,我们通过与非靶向sgRNA比较经由Wilcoxon检验计算了sgRNA的倍数并获得了其P值。我们随机对非靶向sgRNA进行了取样以生成“阴性对照基因”,由此通过其分布校正了lncRNA的P值。对于每种lncRNA,通过组合平均倍数变化和校正的P值计算了筛选评分(参见方法部分)。由此基于筛选评分为2的阈值选择了共243种候选lncRNA,其消耗将在K562细胞系中导致细胞生长抑制或细胞死亡(图5e)。根据筛选评分,明显富集了阴性选择的基因的排名列表中的全部36种必需基因,表明了筛选方式和数据分析方法的可靠性。
从其对应的sgRNA在两个重复中始终消耗的阴性选择的lncRNA中,我们选择了35个高排名的lncRNA基因用于进一步验证。对于每个候选者,我们将获得自文库筛选的两种高排名sgRNA克隆入具有EGFP选择标记的慢病毒骨架。选择非靶向sgRNA和靶向非功能性腺病毒相关病毒整合位点1(AAVS1)基因座的sgRNA作为阴性对照,并包括了靶向核糖体基因RPL18的sgRNA作为阳性对照(图6a图3)。将每种sgRNA转导入K562细胞,并基于EGFP阳性细胞变化百分比量化了细胞增殖。为进一步考察癌细胞和正常细胞间lncRNA功能的差异,我们将淋巴样干细胞GM12878包括在内用于验证,该细胞具有相对正常的核型并属于1级ENCODE细胞系,如K562一样24,25。值得注意的是,靶向35种最高排名的lncRNA基因座的全部sgRNA都有效导致了K562细胞的细胞增殖(图6b,c图3,和图7-12)。其中,18种lncRNA对于GM12878的生长也表现为必需(图6b和图7-10图3),而6个和11个lncRNA采样在GM12878中对细胞活力分别显示了较弱的可检测效果(图10)和无可检测效果(图6c和图11-12图3)。这些结果表明存在细胞类型特异性。总之,约一半的对K562必需的lncRNA对GM12878细胞的生长不具有显著效果,表明具有治疗潜力的癌细胞的独特生物标志物(图6d图3)。
为进一步确认我们的验证测定以及筛选策略(其均依赖于剪接干扰),我们选择了pgRNA介导的缺失方法9以独立地研究来自我们筛选的lncRNA采样的作用。我们从已验证的35个采样中选择了6种lncRNA,而另6种来自排名靠前的采样的候选物由于其高排名的靶向剪接的sgRNA具有一定的脱靶可能性而未包括在上述验证中。针对这12种lncRNA的每一种设计了四对pgRNA,缺失了其启动子和第一外显子(参见方法部分)。选择AAVS1基因座或核糖体基因RPL19和RPL23A分别作为pgRNA靶向的阴性对照或阳性对照(图13a)。通过细胞增殖测定,来自35种经验证的采样的6种lncRNA显示了如通过靶向剪接的策略所验证的可重复表型(图6e和图13b图3)。来自靶向剪接的验证结果与来自缺失策略的结果具有很好的相关性(相关系数=0.93,P=0.002)(图6f图3),表明靶向剪接的策略对于lncRNA基因破坏而言是可靠且强效的方法。同样,我们证实了其它6种候选lncRNA对于K562细胞的生长也是重要的(图14)。至此,确认了全部41种lncRNA对于K562细胞的生长和增殖都是至关重要的。
为更好地理解在K562和GM12878细胞中导致这些不同表现的机制,我们进一步考察了对于两种细胞系都必需的lncRNA MIR17HG(图6b图3)和仅对于K562的细胞存活必需而在GM12878(图6c图3)非必需的BMS1P20的功能。我们实施了具有或不具有MIR17HG或BMS1P20敲除的K562和GM12878两种细胞的RNA-seq分析。我们以靶向其剪接位点的两种sgRNA破坏了每种lncRNA,其有效性在验证测定中得到了确认(图6b,c图3)。我们评估了在对照和sgRNA靶向的样品间显示变化的排名最高的500种基因的表达水平并在敲除了两种lncRNA后观察了不同表达模式(图15a图4a)。对于在每种细胞系中的两种lncRNA,显示了在表达模式具有相似变化的靶向相同剪接位点的两种sgRNA(图16a,b)。自K562细胞鉴定的排名最高的100种必需lncRNA的整体表达水平在野生型K562细胞中高于GM12878细胞(P=0.03,图15b图4b)。
在K562细胞系中,改变MIR17HG的剪接模式下调了179种已知影响细胞生长和增殖的必需基因15(P=0.01,图15c图4c),且破坏BMS1P20下调了178种已知的必需基因15(P=0.05,图15c图4c),表明这两种lncRNA如何影响K562细胞生长的可能机制。出乎意料的是,MIR17HG和BMS1P20影响K562细胞中140种常见的必需基因(图15d),尽管其在GM12878细胞中起不同作用。这些保守基因富集于数个必需的通路中,如调节翻译起始、细胞***和DNA修复的通路(图16c)。对于BMS1P20,相比对照细胞,破坏该lncRNA上调或下调K562和GM12878细胞二者中一系列编码基因的表达(图16d-e)。我们进一步研究了在K562中相比在GM12878中敲除该lncRNA后差异表达的基因(图15e)。这些在K562中下调的基因富集于如p53信号通路和PI3K-Akt信号通路的过程中,其可影响细胞生长和增殖(图15f)。还存在上调的基因(图15f),且这些差异表达的基因在这两种细胞系中在影响细胞生长方面全部与BMS1P20敲除导致的表型变化有关。
总之,编码蛋白的基因和lncRNA二者的基因干扰可通过靶向剪接位点得到实质性增强。除在编码蛋白的基因中生成阅读框移码突变,靶向剪接为基因破坏提供了额外的机会。该特征对于经由sgRNA方式敲除阅读框不敏感的非编码RNA是不可替代的。此外,当难以设计靶向具有保守编码序列的基因的适当sgRNA时,破坏剪接位点的该策略可能是特别有效的。
已采用CRISPR-Cas9***通过两种策略(配对的gRNA(pgRNA)缺失9和CRISPRi12)大规模鉴定功能性lncRNA。尽管使用CRISPRi策略相比pgRNA介导的基因组缺失在技术上易于扩大规模,CRISPRi以及CRISPRa方法一般在所靶向的转录起始位点(TSS)约1-kb的窗口发挥作用12,26,通过该方法技术人员将面临的风险是无意中影响几乎60%lncRNA基因座的邻近基因的表达27。靶向剪接的策略可以有效避免使用单指导RNA切割大多数的重叠区,且避免影响邻近基因的机会大很多,进而减少假阳性比率。而CRISPRi,由于其仅减少基因表达水平而非完全敲除靶基因座,因此为假阳性结果保留了空间。
基于实验数据,证实了本发明中描述的新方法在编码基因的阴性CRISPR筛选中具有显著优势,该方法与常规靶向外显子的方法是互补的,而且本发明的方法还允许使用单指导RNA-CRISPR文库对非编码基因进行大规模功能缺失性筛选。此外,由剪接位点破坏生成的外显子跳跃或内含子保留为单个非编码RNA的功能性验证提供了便利的方法。
参考文献
1.Shalem,O.et al.Genome-scale CRISPR-Cas9 knockout screening in humancells.Science 343,84-87(2014).
2.Wang,T.,Wei,J.J.,Sabatini,D.M.&Lander,E.S.Genetic screens in humancells using the CRISPR-Cas9 system.Science 343,80-84(2014).
3.Koike-Yusa,H.,Li,Y.,Tan,E.P.,Velasco-Herrera Mdel,C.&Yusa,K.Genome-wide recessive genetic screening in mammalian cells with a lentiviral CRISPR-guide RNA library.Nat Biotechnol 32,267-273(2014).
4.Zhou,Y.et al.High-throughput screening of a CRISPR/Cas9 library forfunctional genomics in human cells.Nature 509,487-491(2014).
5.Ezkurdia,I.et al.Multiple evidence strands suggest that there maybe as few as 19,000 human protein-coding genes.Hum Mol Genet 23,5866-5878(2014).
6.Rinn,J.L.&Chang,H.Y.Genome regulation by long noncoding RNAs.AnnuRev Biochem 81,145-166(2012).
7.Quinn,J.J.&Chang,H.Y.Unique features of long non-coding RNAbiogenesis and function.Nat Rev Genet 17,47-62(2016).
8.Kretz,M.et al.Control of somatic tissue differentiation by the longnon-coding RNA TINCR.Nature 493,231-235(2013).
9.Zhu,S.et al.Genome-scale deletion screening of human long non-coding RNAs using a paired-guide RNA CRISPR-Cas9 library.Nat Biotechnol 34,1279-1286(2016).
10.Guttman,M.et al.lincRNAs act in the circuitry controllingpluripotency and differentiation.Nature 477,295-300(2011).
11.Lin,N.et al.An evolutionarily conserved long noncoding RNA TUNAcontrols pluripotency and neural lineage commitment.Mol Cell 53,1005-1019(2014).
12.Liu,S.J.et al.CRISPRi-based genome-scale identification offunctional long noncoding RNA loci in human cells.Science 355(2017).
13.Adamson,B.,Smogorzewska,A.,Sigoillot,F.D.,King,R.W.&Elledge,S.J.Agenome-wide homologous recombination screen identifies the RNA-bindingprotein RBMX as a component of the DNA-damage response.Nat Cell Biol 14,318-328(2012).
14.Sambrook,Fritsch and Maniatis,MOLECULAR CLONING:A LABORATORYMANUAL,2nd edition(1989).
15.F.M.Ausubel,et al.eds.,CURRENT PROTOCOLS IN MOLECULAR BIOLOGY(1987).
16.M.J.MacPherson,B.D.Hames and G.R.Taylor eds.,METHODS IN ENZYMOLOGY(Academic Press,Inc.):PGR 2:A PRACTICAL APPROACH(1995).
17.Harlow and Lane,eds.ANTIBODIES,A LABORATORY MANUAL,(1988).
18.R.L Freshney,ed.,ANIMAL CELL CULTURE(1987).
19.Goeddel,GENE EXPRESSION TECHNOLOGY:METHODS IN ENZYMOLOGY 185,Academic Press,San Diego,Calif.(1990).
20.Seed,1987.Nature 329:840(Seed,B.An LFA-3 cDNA encodes aphospholipid-linked membrane protein homologous to its receptor CD2.Nature(1987)329:840–842.)
21.Kaufman,et al.,1987.EMBO J.6:187-195(Randal J,Kaufman,etal.Translational efficiency of polycistronic mRNAs and their utilization toexpress heterologous genes in mammalian cells.The EMBO Journal(1987)6:187-195)
22.Clancy,Suzanne.RNA Splicing:Introns and exons andSpliceosome.Nature Education.1,31(2008).
23.Black,Douglas L.Mechanisms of Alternative Pre-Messenger RNASplicing.Annual Review of Biochemistry.72:291–336(2003).
24.Ng,Bernard;Yang,Fan;et al.Increased noncanonical splicing ofautoantigen transcripts provides the structural basis for expression ofuntolerized epitopes.Journal of Allergy and Clinical Immunology.114:1463–70(2004).
25.Lim,KH;Ferraris,L;et al.Using positional distribution to identifysplicing elements and predict pre-mRNA processing defects in human genes.Proc.Natl.Acad.Sci.USA.108:11093–11098(2011).
26.Warf,MB;Berglund,JA.Role of RNA structure in regulating pre-mRNAsplicing.Tr端s Biochem.Sci.35:169–178(2010).
27.Warf,MB;Berglund,JA.Role of RNA structure in regulating pre-mRNAsplicing.Tr端s Biochem.Sci.35(3):169–178(2010).
28.Ren,Q.et al.A Dual-Reporter System for Real-Time Monitoring andHigh-throughput CRISPR/Cas9 Library Screening of the Hepatitis CVirus.Scientific reports 5,8865(2015).
29.Wang,T.et al.Identification and characterization of essentialgenes in the human genome.Science 350,1096-1101(2015).
30.Li,B.&Dewey,C.N.RSEM:accurate transcript quantification from RNA-Seq data with or without a reference genome.BMC bioinformatics 12,323(2011).
31.Leng,N.et al.EBSeq:an empirical Bayes hierarchical model forinference in RNA-seq experiments.Bioinformatics 29,1035-1043(2013).
32.Jiao,X.et al.DAVID-WS:a stateful web service to facilitate gene/protein list analysis.Bioinformatics 28,1805-1806(2012).
33.Crooks,G.E.,Hon,G.,Chandonia,J.M.&Brenner,S.E.WebLogo:a sequencelogo generator.Genome Res 14,1188-1190(2004).
34.Matlin,A.J.,Clark,F.&Smith,C.W.Understanding alternative splicing:towards a cellular code.Nat Rev Mol Cell Biol 6,386-398(2005).
35.Taggart,A.J.,DeSimone,A.M.,Shih,J.S.,Filloux,M.E.&Fairbrother,W.G.Large-scale mapping of branchpoints in human pre-mRNA transcripts invivo.Nat Struct Mol Biol 19,719-721(2012).
36.Hsu,P.D.et al.DNA targeting specificity of RNA-guidedCas9nucleases.Nat Biotechnol 31,827-832(2013).
37.Xu,H.et al.Sequence determinants of improved CRISPR sgRNAdesign.Genome Res 25,1147-1157(2015).
38.Heidari,N.et al.Genome-wide map of regulatory interactions in thehuman genome.Genome Res 24,1905-1917(2014).
39.Muller,R.Y.,Hammond,M.C.,Rio,D.C.&Lee,Y.J.An Efficient Method forElectroporation of Small Interfering RNAs into ENCODE Project Tier 1 GM12878and K562 Cell Lines.J Biomol Tech 26,142-149(2015).
40.Joung,J.et al.Genome-scale activation screen identifies a lncRNAlocus regulating a gene neighbourhood.Nature(2017).
41.Goyal,A.et al.Challenges of CRISPR/Cas9applications for long non-coding RNA genes.Nucleic Acids Res 45,e12(2017).
序列表
<110> 北京大学
博雅缉因(北京)生物科技有限公司
<120> 用于筛选和鉴定功能性lncRNA的方法
<130> PA00044
<141> 2018-04-02
<160> 12
<170> SIPOSequenceListing 1.0
<210> 1
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 1
ggaccagcca ctcaccatcc 20
<210> 2
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 2
agcttcatct tccggatctt 20
<210> 3
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 3
tccttgtgac tactcacctt 20
<210> 4
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 4
aactcatact cccgcacctg 20
<210> 5
<211> 21
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 5
ctgggtcttg tctgtctgga a 21
<210> 6
<211> 21
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 6
ctggtgttta cattcagccc c 21
<210> 7
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 7
ggccagaaga accaactcca 20
<210> 8
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 8
gacagtgcca cagcccttag 20
<210> 9
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 9
tcaagatggc gtgtgggatt 20
<210> 10
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 10
gaccagcaaa tggtgaagcc 20
<210> 11
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 11
gatcctttgg catccggaga 20
<210> 12
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 12
gctgattctg tgtttggccc 20

Claims (17)

1.用于在真核细胞基因组中干扰长非编码RNA的CRISPR/Cas指导RNA构建体,其包含与启动子可操作连接的靶向长非编码RNA剪接位点周围的基因组序列的指导序列和指导发夹序列,
其中所述指导序列靶向长非编码RNA的SD位点或SA位点周围跨越-10-bp至+10-bp的区域内的基因组序列。
2.权利要求1的CRISPR/Cas指导RNA构建体,其中所述真核基因组是人基因组。
3.权利要求1或2的CRISPR/Cas指导RNA构建体,其中所述指导序列长度为19-21个核苷酸。
4.权利要求1或2的CRISPR/Cas指导RNA构建体,其中所述发夹序列长度为40个核苷酸且一旦转录其可与CRISPR/Cas核酸酶结合。
5.权利要求1或2的CRISPR/Cas指导RNA构建体,其为病毒载体或质粒。
6.一种文库,其包含多个权利要求1-5任一项的CRISPR/Cas指导RNA构建体。
7.一种存储液体,其包含权利要求1-5任一项的CRISPR/Cas指导RNA构建体或权利要求6的文库。
8.一种宿主细胞,其包含项1-5任一项的CRISPR/Cas指导RNA构建体。
9.权利要求8的宿主细胞,其进一步包含CRISPR/Cas核酸酶和/或CRISPR/Cas核酸酶的编码序列。
10.权利要求8或9的宿主细胞,其进一步包含Cas9核酸酶。
11.权利要求8或9的宿主细胞,其进一步包含整合入其基因组的报告基因构建体。
12.用于干扰或消除真核细胞中长非编码RNA的功能的方法,其包括将靶向长非编码RNA的一个或多个剪接位点周围的一个或多个多核苷酸序列的一种或多种CRISPR/Cas指导RNA引入真核细胞,由此所述一种或多种指导RNA靶向长非编码RNA的一个或多个剪接位点周围的一个或多个多核苷酸序列且在Cas蛋白的存在下切割所述一个或多个多核苷酸序列,导致长非编码RNA的内含子保留和/或外显子跳跃并因此干扰或消除该长非编码RNA的功能,
所述指导RNA靶向长非编码RNA的SD位点或SA位点周围跨越-10-bp至+10-bp的区域内的多核苷酸序列。
13.权利要求12的方法,其中所述Cas蛋白是Cas9酶。
14.权利要求12-13任一项的方法,其中通过递送***实现向所述细胞的引入,所述递送***包括病毒颗粒、脂质体、电穿孔、显微注射、偶联、纳米颗粒、外来体、微泡或基因枪。
15.权利要求14的方法,其中通过包括慢病毒颗粒的递送***实施向所述细胞的引入。
16.一种通过干扰长非编码RNA的功能抑制肿瘤细胞生长或增殖的方法,包括利用权利要求12-15中任一项的方法鉴定和破坏对肿瘤细胞生长或增殖必需的lncRNA,从而抑制肿瘤细胞生长或增殖。
17.权利要求16的方法,其中对K562细胞生长或增殖必需的lncRNA选自XXbac-B135H6.15、RP11-848P1.5、AC005330.2、AP001062.9、AP005135.2、RP11-867G23.4、LINC01049、DGCR5、RP11-509A17.3、CTB-25J19.1、CTD-2517M22.17、CROCCP2、AC016629.8、CTC-490G23.4、RP11-117D22.1、AC067969.2、RP11-251M1.1、AC004471.9、AC004471.10、AC002472.11、RP11-429J17.7、RP11-56N19.5、TMEM191A、LL22NC03-102D1.18、LINC00410、LL22NC03-23C6.13、RP11-83J21.3、RP11-544A12.4、ANKRD62P1-PARP4P3、CTD-2031P19.5、XXbac-B444P24.8、RP11-464F9.21、TPTEP1、MIR17HG和BMS1P20。
CN201810284463.3A 2018-04-02 2018-04-02 用于筛选和鉴定功能性lncRNA的方法 Active CN110343724B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810284463.3A CN110343724B (zh) 2018-04-02 2018-04-02 用于筛选和鉴定功能性lncRNA的方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810284463.3A CN110343724B (zh) 2018-04-02 2018-04-02 用于筛选和鉴定功能性lncRNA的方法

Publications (2)

Publication Number Publication Date
CN110343724A CN110343724A (zh) 2019-10-18
CN110343724B true CN110343724B (zh) 2021-10-12

Family

ID=68173534

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810284463.3A Active CN110343724B (zh) 2018-04-02 2018-04-02 用于筛选和鉴定功能性lncRNA的方法

Country Status (1)

Country Link
CN (1) CN110343724B (zh)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111088357B (zh) * 2019-12-31 2022-09-20 深圳大学 针对escc的肿瘤标志物及其应用
CN112704737B (zh) * 2021-01-15 2021-11-16 青岛市第九人民医院 一种冠状动脉内皮细胞血管生成促进剂
CN114807126A (zh) * 2021-01-22 2022-07-29 清华大学深圳国际研究生院 一种沉默长非编码rna表达的方法及其应用
CN113327645B (zh) * 2021-04-15 2022-11-29 四川大学华西医院 一种长非编码rna及其在诊断治疗胆管癌中的应用
TW202309299A (zh) * 2021-07-12 2023-03-01 大陸商北京輯因醫療科技有限公司 鑒定癌細胞中藥物敏感基因和耐藥基因的方法
CN113539360B (zh) * 2021-07-21 2023-03-31 西北工业大学 一种基于相关性优化和免疫富集的lncRNA特征识别方法

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2016142719A1 (en) * 2015-03-12 2016-09-15 Genome Research Limited Biallelic genetic modification
CN107849581A (zh) * 2015-05-19 2018-03-27 Kws种子欧洲股份公司 用于植物中的特异性核酸编辑的方法和构建体

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2016142719A1 (en) * 2015-03-12 2016-09-15 Genome Research Limited Biallelic genetic modification
CN107849581A (zh) * 2015-05-19 2018-03-27 Kws种子欧洲股份公司 用于植物中的特异性核酸编辑的方法和构建体

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
Correction of diverse muscular dystrophy mutations in human engineered heart muscle by single-site genome editing;Chengzu Long;《SCIENCE ADVANCES》;20180131;摘要、图1、图1注释、第2页结论、图2注释B *
DGCR5,lncRNA;Shin SY;《genbank》;20161008;第1-2页 *
Genome-scale deletion screening of human long non-coding RNAs using a paired-guide RNA CRISCRISCRISCRISPR–Cas9 library;Shiyou Zhu;《nature biotechnology》;20161109;摘要、结论 *

Also Published As

Publication number Publication date
CN110343724A (zh) 2019-10-18

Similar Documents

Publication Publication Date Title
CN110343724B (zh) 用于筛选和鉴定功能性lncRNA的方法
Giuliano et al. Generating single cell–derived knockout clones in mammalian cells with CRISPR/Cas9
US11535863B2 (en) RNA-guided human genome engineering
CN106637421B (zh) 双sgRNA文库的构建及其应用于高通量功能性筛选研究的方法
Ishizu et al. Somatic primary piRNA biogenesis driven by cis-acting RNA elements and trans-acting Yb
JP7244885B2 (ja) 機能的なIncRNAをスクリーニングおよび同定するための方法
AU2019408503B2 (en) Compositions and methods for highly efficient genetic screening using barcoded guide rna constructs
US20180127745A1 (en) Cell sorting
US11667904B2 (en) CRISPR-associated systems and components
JP2018532419A (ja) CRISPR−Cas sgRNAライブラリー
Zhao et al. CRISPR–Cas9-mediated functional dissection of 3′-UTRs
EP2479278A1 (en) Method for the construction of specific promoters
Lemp et al. Cryptic transcripts from a ubiquitous plasmid origin of replication confound tests for cis-regulatory function
US11946163B2 (en) Methods for measuring and improving CRISPR reagent function
Wu et al. Massively parallel characterization of CRISPR activator efficacy in human induced pluripotent stem cells and neurons
US20220017895A1 (en) Gramc: genome-scale reporter assay method for cis-regulatory modules
AU2022381188A1 (en) Serine recombinases
CN111334531A (zh) 高信噪比阴性遗传筛选方法
Mitschka et al. Generation of 3′ UTR knockout cell lines by CRISPR/Cas9-mediated genome editing
CN113151265A (zh) 基于CRISPR-dCase9***抑制细胞核内lncRNA表达的方法
Zhu et al. RNA circuits and RNA-binding proteins in T cells
Guay et al. Unbiased genome-scale identification of cis-regulatory modules in the human genome by GRAMc
Liu et al. Multiplexed pooled library screening with Cpf1
Kornienko et al. A human haploid gene trap collection to study lncRNAs with unusual RNA biology
Erard Optimization of molecular tools for high-throughput genetic screening

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant