本申请要求于2021年3月9日提交的国际专利申请号PCT/CN2021/079821、于2021年9月29日提交的国际专利申请号PCT/CN2021/121926、和于2021年8月22日提交的国际专利申请号PCT/CN2021/113929的优先权;将以上引用的每个申请的全部内容(包括所有附图和序列表)通过引用并入本文。
本申请含有已经以ASCII格式电子递交的序列表,并且所述序列表通过引用以其全文特此并入。所述ASCII副本创建于2022年2月25日,名称为132045-00819_SL.txt,并且大小为81,050字节。
具体实施方式
1.概述
本文描述的本发明提供用于在经由RNA敲低或编辑疗法策略治疗疾病(例如,靶向VEGFA以治疗湿性AMD)中使用的试剂和方法。
特别地,本文描述的本发明提供工程化Cas13家族效应酶(本文称为Cas13X效应酶)(如示例性hfCas13X.1),所述工程化Cas13家族效应酶是一类旁切效应基本上减少/消除的更小、更安全且更特异的RNA编辑子。编码这样的工程化Cas13X效应酶的多核苷酸可以包装在AAV9血清型衣壳中,用于递送(例如,视网膜下注射)至疾病部位以敲低或编辑靶基因(例如,VEGFA)的表达。
本发明的示例性构建体,即本发明AA9-EFS-hfCas13X.1-sgVEGFA构建体(如图2中示意性显示的构建体)已经证明了治疗湿性AMD和/或减少CNV面积的功效(参见图1)。该等结果显示,本发明Cas13X构建体可以在培养细胞和实验动物(例如,小鼠和NHP(非人灵长类动物))的眼睛两者中敲低靶基因(如VEGFA)的表达,并且本发明AAV9递送的Cas13X.1构建体(例如,AAV9-hfCas13X.1-sg-VEGFA)在小鼠和NHP(非人灵长类动物,如猴)疾病模型两者中有效抑制了CNV的生长,从而为基因疗法治疗湿性AMD开启了大门。
本发明工程化Cas13X效应酶与它们各自的天然形式一样,展现出前所未有的灵敏度以识别异质非靶RNA群内的特异性靶RNA——据信,所述本发明工程化Cas13X效应酶能够以飞摩尔级灵敏度检测靶RNA。
衍生本发明工程化Cas13X效应酶的野生型或天然2类VI型酶或Cas13为基因疗法敲低靶基因产物(例如,mRNA)提供了巨大的机会,但它们的使用本质上受限于所谓的旁切活性,所述旁切活性带来显著的细胞毒性风险。
特别地,在2类VI型***中,在靶RNA结合后,Cas13中的高等真核生物和原核生物核苷酸结合(HEPN)结构域赋予指导序列非特异性RNA切割,称为“旁切活性”。与结合的crRNA互补的同源靶ssRNA的结合导致Cas13效应酶发生实质性的构象变化,从而导致形成单一的复合催化位点,用于非指导序列依赖性“旁切”RNA切割,从而将Cas13转化为序列非特异性核糖核酸酶。这个新形成的高度可及的活性位点不仅会以顺式降解靶RNA(如果所述靶RNA足够长,能够到达这个新的活性位点),而且还会基于这种混杂的RNA酶活性以反式降解非靶RNA。
大多数RNA似乎容易受到Cas13这种混杂的RNA酶活性的影响,并且大多数(如果不是全部)Cas13效应酶具有这种旁切的内切核酸酶活性。最近已证明,Cas13介导的敲低带来的旁切效应存在于哺乳动物细胞和动物中(已提交稿件),这表明Cas13介导的靶RNA敲低的临床应用在旁切效应存在的情况下将面临重大挑战。
因此,为了在基因疗法中使用Cas13酶特异性敲低靶RNA,显然必须严格控制这种指导序列非特异性旁切活性,以防止不必要的自发性细胞毒性。
本文描述的本发明提供使用工程化2类VI型或Cas13(例如,Cas13X,如基于Cas13e的那些(例如,Cas13X.1))治疗眼睛疾病(例如,年龄相关性黄斑变性(AMD),例如湿性AMD)的组合物和方法。
在一个方面,本发明提供工程化2类VI型或Cas13(例如,Cas13e,例如Cas13X.1)效应酶,所述效应酶大部分保持其针对靶RNA(例如,血管内皮生长因子A(VEGFA))的序列特异性内切核酸酶活性,但减弱(如果未消除)针对非靶RNA的非指导序列特异性内切核酸酶活性。这样的工程化Cas13X(例如,Cas13X.1)效应酶(其基本上缺乏旁切效应)为在基于靶RNA敲低的效用(如基因疗法)中使用Cas13铺平道路。这样的工程化Cas13X效应酶(其基本上缺乏旁切效应)也可用于RNA碱基编辑,因为这样的工程化Cas13的核酸酶死亡版本(或“dCas13”)也减少了脱靶效果,这种效果仍然存在于没有本发明工程化Cas13的突变的dCas13中。
尽管不希望受任何特定理论的束缚,但野生型Cas13不仅具有通过crRNA的指导序列与靶RNA结合的能力,而且还在HEPN催化结构域附近具有针对任何RNA的非特异性RNA结合位点。一旦指导序列识别到靶RNA,Cas13的构象变化就会激活其催化活性,并且互补指导序列和非特异性RNA结合位点两者所结合的靶RNA会受到切割。一旦经激活,Cas13也会非特异性地切割不与指导序列结合的非靶RNA,部分原因是这样的非靶RNA与Cas13上的非特异性RNA结合位点结合。非特异性RNA结合基序的突变降低/消除Cas13结合RNA的能力,从而降低/消除针对非靶RNA的旁切活性而不显著影响靶RNA切割,因为指导序列仍然结合靶RNA。
根据该模型,也可以减少或消除使用工程化Cas13的核酸酶缺陷型(dCas13)版本的RNA碱基编辑中的脱靶效果,因为工程化dCas13中非特异性RNA结合的丧失减少/消除由于RNA碱基编辑结构域(例如,ADAR或CDAR)和脱靶RNA底物的接近而导致的基于RNA的非预期编辑。
更特别地,本发明的一个方面提供工程化2类VI型成簇的规律间隔的短回文重复序列(CRISPR)-Cas效应酶,如Cas13(例如,Cas13e,例如,Cas13X.1),其中所述工程化2类VI型Cas效应酶:(1)包含在空间上接近对应的野生型效应酶的内切核酸酶催化结构域的区域中的突变;(2)基本上保存所述野生型效应酶对与指导序列互补的靶RNA(如VEGFA mRNA)的指导序列特异性内切核酸酶切割活性;并且(3)基本上缺乏所述野生型效应酶对基本上不与所述指导序列互补/不与其结合的非靶RNA的非指导序列依赖性旁切内切核酸酶切割活性。
如本文所用,“Cas13”是2类VI型CRISPR-Cas效应酶,其作为野生型酶在结合与其crRNA的指导序列互补的同源靶RNA后显示出旁切活性。野生型2类VI型效应酶的旁切活性使其能够针对非靶RNA切割RNA酶或内切核酸酶活性,所述非靶RNA不与crRNA的指导序列互补或基本上不与其互补。所述野生型2类VI型效应酶还可以展现出一个或多个以下特征:具有一个或两个保守的HEPN样RNA酶结构域,如具有保守的RXXXXH基序(其中X是任何氨基酸)(例如,下文所述的RXXXXH基序)的HEPN结构域;当所述2类VI型效应酶(例如,Cas13)与同源crRNA结合时,具有“握紧拳头”样结构;具有带有核酸酶(NUC)叶和crRNA识别(REC)叶的双叶结构,任选地,所述REC叶具有可变的N-末端结构域(NTD),然后是螺旋结构域(Helical-1),并且/或者任选地,所述NUC叶由两个HEPN结构域(HEPN-1和HEPN-2)组成,这两个HEPN结构域由接头结构域(Helical-3)隔开,其中所述HEPN-1结构域任选地经另一螺旋结构域(Helical-2)拆分成两个亚结构域;将pre-crRNA转录物加工成crRNA;不需要反式激活crRNA(tracrRNA)或其他宿主因子来进行pre-crRNA加工;并且展现出飞摩尔级灵敏度以识别异质非靶RNA群内的指导序列特异性靶RNA。
在某些实施方式中,所述2类VI型效应酶(例如,Cas13,例如,Cas13X.1)在HEPN样结构域中的其中一个RXXXXN基序位于或接近(例如,在50-160个残基内,或在50、60、70、80、90、100、110、120、130、140、150或160个残基内)N-末端。在某些实施方式中,所述2类VI型效应酶(例如,Cas13,例如,Cas13X.1)在HEPN样结构域中的其中一个RXXXXN基序位于或接近(例如,在50-160个残基内,或在50、60、70、80、90、100、110、120、130、140、150或160个残基内)C-末端。在某些实施方式中,所述2类VI型效应酶(例如,Cas13,例如,Cas13X.1)的HEPN样结构域的其中一个RXXXXN基序位于或接近(例如,在50-160个残基内,或在50、60、70、80、90、100、110、120、130、140、150或160个残基内)N-末端,同时HEPN样结构域的另一个RXXXXN基序位于或接近(例如,在50-160个残基内,或在50、60、70、80、90、100、110、120、130、140、150或160个残基内)C-末端。如果RXXXXN基序的R或N残基位于或接近N-末端或C-末端,则所述RXXXXN基序“位于或接近”N-末端或C-末端。
基于生物学和细胞实验数据,所述工程化2类VI型效应酶(例如,Cas13,特别是Cas13e,例如,Cas13X.1)效应酶显著降低了针对非靶RNA的非序列特异性内切核酸酶活性,但同时展现出基本上相同(如果不是更高)的针对靶RNA的序列特异性内切核酸酶活性,所述靶RNA与crRNA的指导序列基本上互补。所述工程化效应酶可实现高保真RNA靶向/编辑。
在某些实施方式中,所述2类VI型效应酶是Cas13a、Cas13b、Cas13c、Cas13d、Cas13e(包括工程化变体Cas13X.1)或Cas13f,或基本上保持指导序列特异性内切核酸酶活性的其直系同源物、旁系同源物、同源物、天然的或工程化变体或其功能性片段。
在某些实施方式中,其变体或功能性片段保持对应的野生型效应酶的至少一种功能。这样的功能包括但不限于结合本发明的指导RNA/crRNA(下文描述)以形成复合物的能力、指导序列特异性RNA酶活性、以及在与靶RNA至少部分互补的crRNA的指导下在特定位点处结合并切割所述靶RNA的能力。
在一些实施方式中,所述工程化Cas13X蛋白是工程化Cas13e蛋白,例如,Cas13X.1。在一些实施方式中,所述Cas13e蛋白来自浮霉菌门(Planctomycetes)属的物种。
在某些实施方式中,所述野生型Cas13e.1蛋白的多核苷酸编码序列具有SEQ IDNO:1的多核苷酸序列。所述编码的野生型Cas13e.1蛋白具有SEQ ID NO:4的氨基酸序列。
在某些实施方式中,所述工程化Cas13e.1(例如,Cas13X.1)蛋白具有SEQ ID NO:2的氨基酸序列,例如,具有在Y672、Y676和I751的1-3个残基处的取代的其他方面的野生型Cas13e.1。在某些实施方式中,所述取代基本上降低或消除wt Cas13e.1的旁切活性。
例如,所述野生型Cas13e.1蛋白序列SEQ ID NO:4可以包含在残基Y672、Y676和I751中的任一者处的一个点突变。
在某些实施方式中,所述野生型Cas13e.1蛋白序列SEQ ID NO:4可以包含在残基Y672、Y676和I751中的任两者处(如在Y672和Y676处)的两个点突变。
在某些实施方式中,所述野生型Cas13e.1蛋白序列SEQ ID NO:4可以包含在所有三个残基Y672、Y676和I751处的三个点突变。
在所述突变的任一者中,天然残基(例如,在672和676处的Y,以及在751处的I)可以经除天然序列之外的任何氨基酸取代。
在某些实施方式中,可以将Y672改变为不是Tyr(Y)的19种其他氨基酸中的任一种氨基酸,如Ala(A)、Cys(C)、Asp(D)、Glu(E)、Phe(F)、Gly(G)、His(H)、Ile(I)、Lys(K)、Leu(L)、Met(M)、Asn(N)、Pro(P)、Gln(Q)、Arg(R)、Ser(S)、Thr(T)、Val(V)、或Trp(W)。在某些实施方式中,可以将Y672改变为A、C、D、E、G、H、I、K、L、M、N、Q、R、S、T、或V。在某些实施方式中,可以将Y672改变为A、G、I、L、或V。在某些实施方式中,可以将Y672改变为A。
在某些实施方式中,可以将Y676改变为不是Tyr(Y)的19种其他氨基酸中的任一种氨基酸,如Ala(A)、Cys(C)、Asp(D)、Glu(E)、Phe(F)、Gly(G)、His(H)、Ile(I)、Lys(K)、Leu(L)、Met(M)、Asn(N)、Pro(P)、Gln(Q)、Arg(R)、Ser(S)、Thr(T)、Val(V)、或Trp(W)。在某些实施方式中,可以将Y676改变为A、C、D、E、G、H、I、K、L、M、N、P、Q、R、S、T、或V。在某些实施方式中,可以将Y676改变为A、G、I、L、或V。在某些实施方式中,可以将Y676改变为A。
在某些实施方式中,可以将I751改变为不是Ile(I)的19种其他氨基酸中的任一种氨基酸,如Ala(A)、Cys(C)、Asp(D)、Glu(E)、Phe(F)、Gly(G)、His(H)、Lys(K)、Leu(L)、Met(M)、Asn(N)、Pro(P)、Gln(Q)、Arg(R)、Ser(S)、Thr(T)、Val(V)、Trp(W)、或Tye(Y)。在某些实施方式中,可以将I751改变为A、C、D、E、G、H、K、L、M、N、P、Q、R、S、T、或V。在某些实施方式中,可以将I751改变为A、G、I、L、或V。在某些实施方式中,可以将I751改变为A。
在某些实施方式中,Y672和Y676两者独立地经不是Tyr(Y)的19种其他氨基酸中的任一种氨基酸(如Ala(A)、Cys(C)、Asp(D)、Glu(E)、Phe(F)、Gly(G)、His(H)、Ile(I)、Lys(K)、Leu(L)、Met(M)、Asn(N)、Pro(P)、Gln(Q)、Arg(R)、Ser(S)、Thr(T)、Val(V)、或Trp(W))取代。在某些实施方式中,Y672和Y676两者独立地经A、C、D、E、G、H、I、K、L、M、N、Q、R、S、T、或V取代。在某些实施方式中,Y672和Y676两者独立地经A、G、I、L、或V取代。在某些实施方式中,Y672和Y676两者经A取代。
因此,在SEQ ID NO:2中,(1)在残基672处的Xaa定义为:任何氨基酸,当在676处的Xaa为Y且在751处的Xaa为I时,Y除外;(2)在残基676处的Xaa定义为:任何氨基酸,当在672处的Xaa为Y且在751处的Xaa为I时,Y除外;并且(3)在残基751处的Xaa定义为:任何氨基酸,当在672处的Xaa以及在676处的Xaa均为Y时,I除外。
在某些实施方式中,在残基672和676处的Xaa均为Ala(A),并且在残基751处的Xaa为Ile(I)(例如,SEQ ID NO:3的工程化Cas13X.1)。
除了在Y672、Y676、和I751的1-3个残基处的强制性突变外,所述工程化Cas13e.1还可以进一步包含一个或多个额外的取代、缺失或***,所述取代、缺失或***共同导致工程化Cas13e.1蛋白:(1)具有与SEQ ID NO:4基本上相同(例如,至少约80%、90%、95%、99%或更多)的指导RNA特异性核酸酶活性,并且(2)基本上没有(例如,最多20%、15%、10%、5%)SEQ ID NO:4的旁切(非指导RNA依赖性)核酸酶活性。
如本文所用,“同向重复序列”可指CRISPR基因座中的DNA编码序列,或指在crRNA中由其编码的RNA。因此,当在RNA分子(如crRNA)的上下文中提到SEQ ID NO:6时,每个T应理解为代表U。
在某些实施方式中,本发明的工程化Cas13X效应蛋白可以是:(i)包含在Y672、Y676和/或I751处的1-3个取代的SEQ ID NO:2;(ii)包含在Y672、Y676和/或I751处的取代的SEQ ID NO:2的直系同源物、旁系同源物、同源物;或(iii)与包含在Y672、Y676和/或I751处的取代的SEQ ID NO:2中的任一者相比具有至少约80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的氨基酸序列同一性的2类VI型效应酶。
在某些实施方式中,在空间上接近对应的野生型Cas13效应酶的内切核酸酶催化结构域的区域包括距离所述Cas13的一级序列中的内切核酸酶催化结构域(例如,RXXXXH结构域)的任何残基120、110、100、90、或80个氨基酸内的残基。
在某些实施方式中,在空间上接近对应的野生型Cas13效应酶的内切核酸酶催化结构域的区域包括距离所述Cas13的一级序列中的内切核酸酶催化结构域的任何残基超过100、110、120或130个残基,但在空间上在所述内切核酸酶催化结构域的残基的1-10或5埃内的残基。
在某些实施方式中,所述内切核酸酶催化结构域是HEPN结构域,任选地是包含RXXXXH基序的HEPN结构域。
在某些实施方式中,所述RXXXXH基序包含R{N/H/K}X1X2X3H序列。
在某些实施方式中,在所述R{N/H/K}X1X2X3H序列中,X1是R、S、D、E、Q、N、G、或Y;X2是I、S、T、V或L;并且X3是L、F、N、Y、V、I、S、D、E或A。
在某些实施方式中,所述RXXXXH基序是包含RNXXXH序列,如RN{Y/F}{F/Y}SH序列(SEQ ID NO:55)的N-末端RXXXXH基序。在某些实施方式中,所述N-末端RXXXXH基序具有RNYFSH序列(SEQ ID NO:56)。在某些实施方式中,所述N-末端RXXXXH基序具有RNFYSH序列(SEQ ID NO:57)。在某些实施方式中,所述RXXXXH基序是包含R{N/A/R}{A/K/S/F}{A/L/F}{F/H/L}H序列的C-末端RXXXXH基序。例如,所述C-末端RXXXXH基序可以具有RN(A/K)ALH序列(SEQ ID NO:58),或RAFFHH(SEQ ID NO:59)或RRAFFH序列(SEQ ID NO:60)。
在某些实施方式中,区域包含以下、基本上由以下组成、或由以下组成:对应于在SEQ ID NO:2的残基2-187、227-242、或634-755之间的残基的残基。在某些实施方式中,区域包含以下、基本上由以下组成、或由以下组成:对应于在SEQ ID NO:2的残基35-51、52-67、156-171、666-682、或712-727之间的残基的残基。
在某些实施方式中,所述突变包含在所述区域内的15-20个连续氨基酸的延伸段内的以下取代、基本上由其组成、或由其组成:一个或多个带电荷的或极性残基至电荷中性的短链脂肪族残基(如A)。例如,在一些实施方式中,所述延伸段为约16或17个残基。
在某些实施方式中,所述延伸段内除了至多1、2或3个之外的基本上所有带电荷的和极性残基都经取代。
在某些实施方式中,所述延伸段内总共约7、8、9或10个带电荷的和极性残基经取代。
在某些实施方式中,所述延伸段的N-末端和C-末端的2个残基经取代为编码序列含有限制酶识别序列的氨基酸。例如,在一些实施方式中,所述N-末端的两个残基可以是VF,并且所述C-末端的2个残基可以是ED,并且所述限制酶是BpiI。其他合适的RE位点很容易想到。N-末端和C-末端的RE位点可以相同,但不必相同。
在某些实施方式中,所述一个或多个带电荷的或极性残基包含N、Q、R、K、H、D、E、Y、S和T残基。在某些实施方式中,所述一个或多个带电荷的或极性残基包含R、K、H、N、Y和/或Q残基。
在某些实施方式中,所述延伸段内的一个或多个Y残基经取代。在某些实施方式中,所述一个或多个Y残基对应于野生型Cas13e.1(SEQ ID NO:4)的Y672和Y676。在某些实施方式中,所述延伸段是SEQ ID NO:4的残基35-51、52-67、156-171、666-682、或712-727。
在某些实施方式中,所述突变导致非指导序列依赖性旁切RNA酶活性的减少或消除。
在某些实施方式中,降低/消除旁切活性的取代包括电荷中性的短链脂肪族残基(如A、I、L、V、或G)的取代。在某些实施方式中,所述电荷中性的短链脂肪族残基是Ala(A)。
在某些实施方式中,降低/消除旁切活性的突变包含在所述区域内的2、3、4或5个所述15-20个连续氨基酸的延伸段内的取代、基本上由其组成、或由其组成。
在某些实施方式中,所述工程化Cas13保存所述野生型Cas13对所述靶RNA的至少约50%、60%、70%、80%、85%、90%、95%、96%、97%、98%或99%的指导序列特异性内切核酸酶切割活性。
在某些实施方式中,所述工程化Cas13缺乏所述野生型Cas13对所述非靶RNA的至少约80%、85%、90%、95%、96%、97%、98%、99%或100%的非指导序列依赖性旁切内切核酸酶切割活性。
在某些实施方式中,所述工程化Cas13保存所述野生型Cas13对所述靶RNA(例如,VEGFA)的至少约80%-90%的指导序列特异性内切核酸酶切割活性,并且缺乏所述野生型Cas13对所述非靶RNA的至少约95%-100%的非指导序列依赖性旁切内切核酸酶切割活性。
在某些实施方式中,本发明的工程化Cas13具有与SEQ ID NO:2或3中的任一者具有至少80%、85%、90%、95%、96%、97%、98%、99%、99.1%、99.2%、99.3%、99.4%、99.5%、99.6%、99.7%、99.8%或99.86%同一性的氨基酸序列,并且包含基本上降低/消除旁切活性的、SEQ ID NO:2或3中的相同突变。也就是说,所述工程化Cas13在不是对应于Cas13e.1的Y672、Y676和I751的位置/除了所述位置以外的位置处具有序列变化,并且这样的额外的序列变化不会对指导序列特异性内切核酸酶活性产生实质性的负面影响,并且/或者不会增加非指导序列依赖性旁切效应。
在某些实施方式中,所述氨基酸序列含有至多1、2、3、4或5个差异(不包括在Y672、Y676和/或I751处的取代)而不会对指导序列特异性内切核酸酶活性产生实质性的负面影响,并且/或者不会增加非指导序列依赖性旁切效应。
在某些实施方式中,本发明的工程化Cas13具有SEQ ID NO:2或3中的任一者的氨基酸序列。在某些实施方式中,本发明的工程化Cas13具有SEQ ID NO:3的氨基酸序列。
在某些实施方式中,本发明的工程化Cas13具有编码多核苷酸,所述多核苷酸编码SEQ ID NO:2或3中的任一者的氨基酸序列。在某些实施方式中,本发明的工程化Cas13具有编码多核苷酸,所述多核苷酸编码SEQ ID NO:3的氨基酸序列。在某些实施方式中,所述编码多核苷酸具有SEQ ID NO:5的多核苷酸序列。
在某些实施方式中,本发明的工程化Cas13X进一步包含核定位信号(NLS)序列或核输出信号(NES)。例如,在某些实施方式中,所述工程化Cas13X可包含N-末端和/或C-末端NLS。
在相关方面,本发明提供本发明工程化Cas13(例如基本上缺乏旁切内切核酸酶活性的那些,如基于SEQ ID NO:2或3中的任一者的Cas13e效应蛋白)或其上述直系同源物、同源物、衍生物和功能性片段的额外的衍生物,所述额外的衍生物包含另一共价或非共价连接的蛋白或多肽或其他分子(如NLS)。这样的其他蛋白/多肽/其他分子可以通过例如化学偶联、基因融合或其他非共价连接(如生物素-链霉亲和素结合)来连接。这样的衍生的蛋白不影响原始蛋白的功能,如结合本发明的指导RNA/crRNA(下文描述)以形成复合物的能力、RNA酶活性、以及在与靶RNA至少部分互补的crRNA的指导下在特定位点处结合并切割所述靶RNA的能力。此外,这样的衍生的蛋白确实保留了本发明工程化Cas13缺乏旁切内切核酸酶活性的特征。
也就是说,在某些实施方式中,在本发明工程化Cas13(或其衍生物)的RNP复合物与所述靶RNA结合后,所述工程化Cas13不会展现出实质性的(或可检测的)旁切RNA酶活性。
例如,这样的衍生可用于添加核定位信号(NLS,如SV40大T抗原NLS)以增强本发明工程化Cas13(例如,工程化Cas13e)效应蛋白进入细胞核的能力。这样的衍生也可用于添加靶向分子或部分,以将本发明Cas13X(例如,工程化Cas13e)效应蛋白引导至特定的细胞或亚细胞位置。这样的衍生还可用于添加可检测标记,以促进本发明Cas13X(例如,工程化Cas13e)效应蛋白的检测、监测或纯化。这样的衍生可进一步用于添加脱氨基酶部分(如具有腺嘌呤或胞嘧啶脱氨基活性的酶部分)以促进RNA碱基编辑。
衍生可以通过在本发明Cas13X效应蛋白的N-末端或C-末端处或在内部(例如,通过内部氨基酸的侧链进行内部融合或连接)添加任一额外的部分来进行。
在相关方面,本发明提供本发明工程化Cas13的缀合物。这样的缀合的部分可包括但不限于定位信号、报告基因(例如,GST、HRP、CAT、GFP、HcRed、DsRed、CFP、YFP、BFP)、标记(例如,荧光染料,如FITC或DAPI)、NLS、靶向部分、DNA结合结构域(例如,MBP、Lex A DBD、Gal4 DBD)、表位标签(例如,His、myc、V5、FLAG、HA、VSV-G、Trx等)、转录激活结构域(例如,VP64或VPR)、转录抑制结构域(例如,KRAB部分或SID部分)、核酸酶(例如,FokI)、脱氨基结构域(例如,ADAR1、ADAR2、APOBEC、AID或TAD)、甲基化酶、去甲基化酶、转录释放因子、HDAC、ssRNA切割活性、dsRNA切割活性、ssDNA切割活性、dsDNA切割活性、DNA或RNA连接酶、其任何组合等。
例如,所述缀合物可包括一个或多个NLS,其可以位于或接近N-末端、C-末端、内部、或其组合。连接可以通过氨基酸(如D或E、或S或T)、氨基酸衍生物(如Ahx、β-Ala、GABA或Ava)或PEG连接来进行。
在某些实施方式中,缀合不影响原始工程化蛋白(例如基本上缺乏旁切效应的那些)的功能,如结合本发明的指导RNA/crRNA(下文描述)以形成复合物的能力、以及在与靶RNA至少部分互补的crRNA的指导下在特定位点处结合并切割所述靶RNA的能力。
在相关方面,本发明提供本发明工程化Cas13(例如基本上缺乏旁切内切核酸酶活性的那些,如基于SEQ ID NO:2和3中的任一者的Cas13e效应蛋白)或其上述直系同源物、同源物、衍生物和功能性片段的融合物,所述融合物具有如下部分,如定位信号、报告基因(例如,GST、HRP、CAT、GFP、HcRed、DsRed、CFP、YFP、BFP)、NLS、蛋白靶向部分、DNA结合结构域(例如,MBP、Lex A DBD、Gal4 DBD)、表位标签(例如,His、myc、V5、FLAG、HA、VSV-G、Trx等)、转录激活结构域(例如,VP64或VPR)、转录抑制结构域(例如,KRAB部分或SID部分)、核酸酶(例如,FokI)、脱氨基结构域(例如,ADAR1、ADAR2、APOBEC、AID或TAD)、甲基化酶、去甲基化酶、转录释放因子、HDAC、ssRNA切割活性、dsRNA切割活性、ssDNA切割活性、dsDNA切割活性、DNA或RNA连接酶、其任何组合等。
例如,所述融合物可包括一个或多个NLS,其可以位于或接近N-末端、C-末端、内部、或其组合。在某些实施方式中,缀合不影响原始工程化Cas13蛋白(例如基本上缺乏旁切活性的那些)的功能,如结合本发明的指导RNA/crRNA(下文描述)以形成复合物的能力、RNA酶活性、以及在与靶RNA至少部分互补的crRNA的指导下在特定位点处结合并切割所述靶RNA的能力。
在另一方面,本发明提供多核苷酸,所述多核苷酸编码本发明的工程化Cas13(Cas13X)。所述多核苷酸可以包含:(i)编码以下中的任一者的多核苷酸:工程化Cas13(Cas13X)多肽(例如基本上缺乏旁切效应的那些,例如基于SEQ ID NO:2和3的Cas13e效应蛋白的那些)或其直系同源物、同源物、衍生物、功能性片段、融合物;(ii)编码sgRNA的多核苷酸,所述sgRNA靶向感兴趣的基因(如感兴趣的眼睛疾病基因,包括湿性AMD基因,如VEGFA);或(iii)包含(i)和(ii)的多核苷酸。
在某些实施方式中,本发明的多核苷酸在AAV载体基因组内,侧翼为功能性AAV(如AAV2)5'和3'ITR序列。在某些实施方式中,所述AAV载体基因组进一步包含以下中的一种或多种(例如,全部)(不一定按此顺序):启动子(如EFS启动子),所述启动子与以下可操作地连接并驱动其表达:本发明Cas13X多肽(如SEQ ID NO:5)及其3'的polyA信号序列的编码序列;第二启动子,所述第二启动子与以下可操作地连接并驱动其表达:与靶向靶基因(如VEGFA)的一个或多个sgRNA编码序列可操作地连接的一个或多个DR序列(如SEQ ID NO:6);以及在序列元件之间的任何任选的填充物、接头、或间隙序列。
在某些实施方式中,所述AAV载体基因组进一步包含第3转录单元,其中第3启动子与报告基因(如荧光蛋白报告子(例如,mCherry或GFP等))可操作地连接。
在某些实施方式中,所述AAV载体基因组包含以下、基本上由以下组成、或由以下组成:SEQ ID NO:17或与其具有至少约90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.2%、99.4%、99.6%、99.8%、或99.9%同一性的多核苷酸。
在某些实施方式中,本发明的多核苷酸经密码子优化以在真核生物、哺乳动物(如人或非人哺乳动物)、植物、昆虫、鸟、爬行动物、啮齿动物(例如,小鼠、大鼠)、鱼、蠕虫/线虫或酵母中表达。
在相关方面,本发明提供多核苷酸,所述多核苷酸(i)与上文描述的本发明多核苷酸(例如,SEQ ID NO:5或17)相比具有一个或多个(例如,1、2、3、4、5、6、7、8、9或10个)核苷酸添加、缺失或取代;(ii)与上文描述的本发明多核苷酸(例如,SEQ ID NO:5或17)具有至少50%、60%、70%、80%、90%、95%或97%的序列同一性;(iii)在严格条件下与上文描述的本发明多核苷酸、或(i)和(ii)中的任一者杂交;或(iv)是(i)-(iii)中的任一者的互补序列。
在另一相关方面,本发明提供载体,所述载体包含或涵盖本文描述的本发明的任一多核苷酸。所述载体可以是克隆载体、病毒载体(例如,AAV、HSV、或杆状病毒载体)或表达载体。仅举几例,所述载体可以是质粒、噬菌粒或粘粒。在某些实施方式中,所述载体可用于表达哺乳动物细胞(如人细胞)中的多核苷酸、工程化Cas13(例如基本上缺乏旁切活性的那些,例如基于SEQ ID NO:2和3的本发明工程化Cas13e或Cas13f效应蛋白)或其直系同源物、同源物、衍生物、功能性片段、融合物中的任一者;或本发明的任一多核苷酸;或本发明的任一复合物。
在某些实施方式中,所述多核苷酸与启动子和任选的增强子可操作地连接。例如,在一些实施方式中,所述启动子是组成型启动子、诱导型启动子、泛素启动子或组织特异性启动子。在某些实施方式中,所述载体是质粒。在某些实施方式中,所述载体是逆转录病毒载体、噬菌体载体、腺病毒载体、单纯疱疹病毒(HSV)载体、AAV载体或慢病毒载体。在某些实施方式中,所述AAV载体是血清型AAV1、AAV2、AAV4、AAV5、AAV6、AAV7、AAVrh74、AAV8、AAV9、AAV10、AAV 11、AAV 12或AAV 13的重组AAV载体。在某些实施方式中。
本发明的另一方面提供递送***,所述递送***包含(1)递送溶媒,和(2)本发明的工程化Cas13、本发明的多核苷酸、或本发明的载体。
在某些实施方式中,所述递送溶媒是纳米颗粒、脂质体、外泌体、微泡或基因枪。
本发明的另外的方面提供细胞或其后代,所述细胞或其后代包含本发明的工程化Cas13、本发明的多核苷酸、或本发明的载体。所述细胞可以是原核生物(如大肠杆菌)或来自真核生物(如酵母、昆虫、植物、动物(例如,哺乳动物,包括人和小鼠))的细胞。所述细胞可以是分离的原代细胞(如用于离体疗法的骨髓细胞)或已建立的细胞系,如肿瘤细胞系、293T细胞或干细胞、iPC等。
在某些实施方式中,所述细胞或其后代是真核细胞(例如,非人哺乳动物细胞、人细胞或植物细胞)或原核细胞(例如,细菌细胞)。
本发明的另外的方面提供非人多细胞真核生物,所述非人多细胞真核生物包含本发明的细胞。
在某些实施方式中,所述非人多细胞真核生物是针对人遗传障碍的动物(例如,啮齿动物或灵长类动物——例如,NHP)模型。在某些实施方式中,所述NHP是猴,如食蟹猴(食蟹猕猴)。
在另一方面,本发明提供复合物,所述复合物包含:(i)以下中的任一者的蛋白组合物:本发明工程化Cas13X(例如,基本上缺乏旁切内切核酸酶活性的那些,例如,工程化Cas13e效应蛋白),或其直系同源物、同源物、衍生物、缀合物、功能性片段、其缀合物、或其融合物;以及(ii)包含分离的多核苷酸以及与靶RNA(例如,VEGFA靶mRNA)的至少一部分互补的间隔序列/指导序列的多核苷酸组合物,所述分离的多核苷酸包含针对所述工程化Cas13效应酶的同源DR序列。
在某些实施方式中,所述DR序列在所述间隔序列的3'端。
在某些实施方式中,所述DR序列在所述间隔序列的5'端。
在一些实施方式中,所述多核苷酸组合物是本发明工程化Cas13(例如基本上缺乏旁切活性的那些,例如,工程化Cas13e***)的指导RNA/crRNA,其不包括tracrRNA。
在某些实施方式中,为了与本发明工程化Cas13(例如基本上缺乏旁切活性的那些,例如,本发明工程化Cas13e效应蛋白)、其同源物、直系同源物、衍生物、融合物、缀合物或具有指导序列特异性RNA酶活性的功能性片段一起使用,所述间隔序列为至少约10个核苷酸,或在10-60、15-50、20-50、25-40、25-50或19-50个核苷酸之间。
在相关方面,本发明提供真核细胞,所述真核细胞包含含有本发明工程化Cas13的本发明复合物,所述复合物包含:(1)RNA指导序列,其包含能够与靶RNA(例如,VEGFA靶mRNA)杂交的间隔序列以及在所述间隔序列的5’或3'的同向重复(DR)序列;以及(2)本发明工程化Cas13(例如基本上缺乏旁切活性的那些,如基于具有SEQ ID NO:4的氨基酸序列的野生型的本发明工程化Cas13e效应酶(如SEQ ID NO:2和3))、或所述Cas的衍生物或功能性片段;其中所述Cas、所述Cas的衍生物和功能性片段能够(i)与所述RNA指导序列结合,并且(ii)靶向所述靶RNA(例如,VEGFA靶mRNA)。
在另一方面,本发明提供组合物,所述组合物包含:(i)选自以下中的任一者的第一(蛋白)组合物:工程化Cas13(例如基本上缺乏旁切活性的那些,例如,基于SEQ ID NO:2和3的工程化Cas13e效应蛋白)或其直系同源物、同源物、衍生物、缀合物、功能性片段、融合物;和(ii)包含RNA的第二(核苷酸)组合物,所述RNA涵盖指导RNA/crRNA、特别是间隔序列或其编码序列。所述指导RNA可包含DR序列和可与靶RNA(例如,VEGFA靶mRNA)互补或杂交的间隔序列。所述指导RNA可以与(i)的第一(蛋白)组合物形成复合物。在一些实施方式中,所述DR序列可以是本发明的多核苷酸(如SEQ ID NO:6)。在一些实施方式中,所述DR序列可以在所述指导RNA的5或3'端。在一些实施方式中,所述组合物(如(i)和/或(ii))是非天然存在的或从天然存在的组合物修饰而来。在一些实施方式中,所述靶序列是VEGFA基因(如人VEGFA)的RNA转录物。所述靶RNA可以存在于细胞内,如在胞质溶胶中或在细胞器内。在一些实施方式中,所述蛋白组合物可以具有可位于其N-末端或C-末端或内部的NLS。
在另一方面,本发明提供组合物,所述组合物包含本发明的一种或多种载体,所述一种或多种载体包含:(i)编码以下中的任一者的第一多核苷酸(如SEQ ID NO:5):工程化Cas13(例如基本上缺乏旁切活性的那些,如基于SEQ ID NO:2和3的本发明工程化Cas13e效应蛋白)或其直系同源物、同源物、衍生物、功能性片段、融合物;所述第一多核苷酸任选地与第一调节元件(如EF1a启动子或其功能性片段,例如,EFS启动子)可操作地连接;和(ii)编码本发明的指导RNA的第二多核苷酸;所述第二多核苷酸任选地与第二调节元件(如U6启动子)可操作地连接。所述第一多核苷酸和所述第二多核苷酸可以在不同的载体上或在相同的载体上(例如,在相同的AAV载体基因组上)。所述指导RNA可与由所述第一多核苷酸编码的蛋白产物形成复合物,并包含DR序列(如第4方面的任一DR序列)和可与靶RNA(如VEGFA的mRNA)结合/互补的间隔序列。在一些实施方式中,所述第一调节元件是启动子,如组成型启动子或诱导型启动子。在一些实施方式中,所述第二调节元件是启动子,如组成型启动子(如Pol III启动子,像U6)或诱导型启动子。在一些实施方式中,所述靶序列是来自原核生物或真核生物的RNA,如哺乳动物(例如,人)VEGFA mRNA。所述靶RNA可以存在于细胞内,如在胞质溶胶中或在细胞器内。在一些实施方式中,所述蛋白组合物可以具有可位于其N-末端和/或C-末端或内部的NLS。
在一些实施方式中,所述载体是质粒。在一些实施方式中,所述载体是病毒载体,所述病毒载体基于逆转录病毒、不能复制的逆转录病毒、腺病毒、不能复制的腺病毒或AAV。在一些实施方式中,所述载体可以在宿主细胞中自我复制(例如,具有细菌复制起点序列)。在一些实施方式中,所述载体可以整合到宿主基因组中并与其一起复制。在一些实施方式中,所述载体是克隆载体。在一些实施方式中,所述载体是表达载体。
本发明进一步提供用于递送以下的递送组合物:本发明的工程化Cas13(例如基本上缺乏旁切活性的那些,例如,基于SEQ ID NO:2和3的本发明工程化Cas13e效应蛋白)或其直系同源物、同源物、衍生物、缀合物、功能性片段、融合物中的任一者;本发明的多核苷酸;本发明的复合物;本发明的载体;本发明的细胞;以及本发明的组合物。递送可以使用溶媒(如一种或多种脂质体、一种或多种纳米颗粒、一种或多种外泌体、一种或多种微泡、基因枪或一种或多种病毒载体)通过本领域已知的任何一种方式,如转染、脂质转染、电穿孔、基因枪、显微注射、超声、磷酸钙转染、阳离子转染、病毒载体递送等来进行。
本发明进一步提供试剂盒,所述试剂盒包含以下中的任一者或多者:本发明的工程化Cas13(例如基本上缺乏旁切活性的那些,例如,基于SEQ ID NO:2和3的本发明工程化Cas13e或Cas13f效应蛋白)或其直系同源物、同源物、衍生物、缀合物、功能性片段、融合物中的任一者;本发明的多核苷酸;本发明的复合物;本发明的载体;本发明的细胞;以及本发明的组合物。在一些实施方式中,所述试剂盒可进一步包括关于如何使用试剂盒组分和/或如何从第3方获得用于与所述试剂盒组分一起使用的其他组分的说明。所述试剂盒的任何组分都可以储存在任何合适的容器中。
上文大体描述了本发明,本发明各个方面的更详细描述在下文的单独部分中提供。然而,应理解,为了简洁和减少冗余,本发明的某些实施方式仅在一个部分下描述或仅在权利要求或实施例中描述。因此,还应理解,本发明的任何一个实施方式,包括仅在一个方面、部分下或仅在权利要求或实施例中描述的那些实施方式,可以与本发明的任何其他实施方式组合,除非特别否认或组合不当。
2.代表性工程化2类VI型Cas及其衍生物
本发明的一个方面提供工程化Cas13,例如基本上缺乏旁切活性的那些。
在某些实施方式中,Cas13效应酶是2类VI型效应酶,其具有两个严格保守的RX4-6H(RXXXXH)样基序,这是高等真核生物和原核生物核苷酸结合(HEPN)结构域的特征。在某些实施方式中,2类VI型CRISPR效应子含有两个HEPN结构域,例如CRISPR Cas13e(包括工程化变体Cas13X.1)。
HEPN结构域经证明是RNA酶结构域并赋予结合和切割靶RNA分子的能力。所述靶RNA可以是任何合适形式的RNA,包括但不限于mRNA、tRNA、核糖体RNA、非编码RNA、lncRNA(长链非编码RNA)和核RNA。例如,在一些实施方式中,所述工程化Cas13蛋白识别并切割位于开放阅读框(ORF)的编码链上的RNA靶标。
在一个实施方式中,所述2类VI型Cas13效应酶属于VI-E亚型、或是Cas13e(如SEQID NO:2和3)。野生型VI-E型CRISPR-Cas效应蛋白与这些其他***的效应子的直接比较显示出VI-E型CRISPR-Cas效应蛋白甚至比先前识别的最小的VI-D型/Cas13d效应子显著更小(例如,氨基酸少约20%),并且在与其他先前描述的效应蛋白(包括***发育上最接近的亲属Cas13b)的一对一序列比对中具有小于30%的序列相似性。
像其他Cas13蛋白一样,2类VI-E亚型效应子可用于多种应用中,并且特别适用于治疗性应用,因为它们比其他效应子(例如,CRISPR Cas13a、Cas13b、Cas13c和Cas13d/CasRx效应子)显著更小,这允许将编码效应子的核酸及它们的指导RNA编码序列包装到具有大小限制的递送***(如AAV载体)中。此外,在指导序列特异性RNA酶活性激活后,本发明工程化Cas13的可检测的旁切/非特异性RNA酶活性的缺乏使这些工程化Cas13效应子在希望不受破坏的靶细胞中较不易于(如果不能免于)产生潜在危险的普遍脱靶RNA消化。
示例性VI-E型CRISPR-Cas效应蛋白在下表中提供。
在上面的序列中,每个效应子中的两个RX4-6H(RXXXXH)基序加双下划线。在Cas13e.1中,由于基序侧翼的RR和HH序列,C-末端基序可具有两种可能性。在一个或两个这样的结构域处的突变可能产生Cas13e和Cas13f效应蛋白、其同源物、直系同源物、融合物、缀合物、衍生物或功能性片段的RNA酶死亡版本(或“dCas”),同时基本上保持它们结合指导RNA和与所述指导RNA互补的靶RNA的能力。
Cas效应子的对应DR编码序列在下面列出:
在一些实施方式中,本发明工程化Cas13效应酶(例如基本上缺乏旁切活性的那些)基于野生型VI-E型CRISPR-Cas效应蛋白的“衍生物”,所述衍生物具有如下氨基酸序列,所述氨基酸序列与上述SEQ ID NO:2和3中的任一者的氨基酸序列具有至少约80%的序列同一性(例如,81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%),包括具有在Y672/Y676/I751处的相同突变。与SEQ ID NO:2和3中的任一者共享显著的蛋白序列同一性的这样的衍生性Cas效应子保留SEQ ID NO:2和3的Cas的至少一种功能(参见下文),例如与包含SEQ ID NO:6的DR序列中的至少一个的crRNA结合并形成复合物的能力。例如,Cas13e.1衍生物可分别与SEQ ID NO:2和3共享85%的氨基酸序列同一性,并保留分别与具有SEQ ID NO:6的DR序列的crRNA结合并形成复合物的能力。
在一些实施方式中,所述衍生物包含保守的氨基酸残基取代。在一些实施方式中,所述衍生物仅包含保守的氨基酸残基取代(即,所述衍生物中的所有氨基酸取代都是保守取代,并且没有不保守的取代)。
在一些实施方式中,与SEQ ID NOs:2或3相比,所述衍生物包含不超过1、2、3、4、5、6、7、8、9或10个氨基酸的额外***或缺失。只要保留SEQ ID NOs:2或3序列的至少一种功能,***和/或缺失就可以聚集在一起,或在序列的整个长度上分开。这样的功能可以包括结合指导/crRNA的能力、RNA酶活性、结合和/或切割与指导/crRNA互补的靶RNA的能力。在一些实施方式中,***和/或缺失不存在于RXXXXH基序中,或距RXXXXH基序5、10、15或20个残基内。
在一些实施方式中,所述衍生物保留结合指导RNA/crRNA的能力。
在一些实施方式中,所述衍生物保留指导/crRNA激活的RNA酶活性。
在一些实施方式中,在所结合的在序列方面与至少一部分靶RNA互补的指导/crRNA存在下,所述衍生物保留结合靶RNA和/或切割所述靶RNA的能力。
在其他实施方式中,由于例如RNA指导的RNA酶的一个或多个催化残基的突变,所述衍生物完全或部分丧失指导/crRNA激活的RNA酶活性。这样的衍生物有时称为dCas,如dCas13X.1。
在某些实施方式中,如本文描述的效应蛋白是“死”效应蛋白,如死Cas13e效应蛋白(即dCas13e)。在某些实施方式中,所述效应蛋白在HEPN结构域1(N-末端)中具有一个或多个突变。在某些实施方式中,所述效应蛋白在HEPN结构域2(C-末端)中具有一个或多个突变。在某些实施方式中,所述效应蛋白在HEPN结构域1和HEPN结构域2中具有一个或多个突变。
灭活的Cas或其衍生物或功能性片段可以与一个或多个异源/功能性结构域融合或缔合(例如,经由融合蛋白、接头肽、“GS”接头等)。这些功能性结构域可以具有多种活性,例如,甲基化酶活性、去甲基化酶活性、转录激活活性、转录抑制活性、转录释放因子活性、组蛋白修饰活性、RNA切割活性、DNA切割活性、核酸结合活性、碱基编辑活性和开关活动(例如,光诱导型)。在一些实施方式中,所述功能性结构域是Krüppel相关盒(KRAB)、SID(例如SID4X)、VP64、VPR、VP16、Fok1、P65、HSF1、MyoD1、作用于RNA的腺苷脱氨酶(如ADAR1、ADAR2)、APOBEC、胞苷脱氨酶(AID)、TAD、小型-SOG、APEX和生物素-APEX。
在一些实施方式中,所述功能性结构域是碱基编辑结构域,例如,ADAR1(包括野生型或其ADAR2DD版本,具有或不具有E1008Q和/或E488Q突变)、ADAR2(包括野生型或其ADAR2DD版本,具有或不具有E1008Q和/或E488Q突变)、APOBEC或AID。
在一些实施方式中,所述功能性结构域可以包含一个或多个核定位信号(NLS)结构域。所述一个或多个异源功能性结构域可以包含至少两个或更多个NLS结构域。所述一个或多个NLS结构域可位于或接近或邻近所述效应蛋白(例如,Cas13e/效应蛋白)的末端处,并且如果有两个或更多个NLS,则两者中的每一个可位于或接近或邻近所述效应蛋白(例如,Cas13e效应蛋白)的末端处。
在一些实施方式中,至少一个或多个异源功能性结构域可以位于或接近所述效应蛋白的氨基末端处,并且/或者其中至少一个或多个异源功能性结构域位于或接近所述效应蛋白的羧基末端处。所述一个或多个异源功能性结构域可以与所述效应蛋白融合。所述一个或多个异源功能性结构域可以与所述效应蛋白相连。所述一个或多个异源功能性结构域可以通过接头部分与所述效应蛋白连接。
在一些实施方式中,存在多个(例如,两个、三个、四个、五个、六个、七个、八个或更多个)相同或不同的功能性结构域。
在一些实施方式中,所述功能性结构域(例如,碱基编辑结构域)进一步与RNA结合结构域(例如,MS2)融合。
在一些实施方式中,所述功能性结构域与接头序列(例如,柔性接头序列或刚性接头序列)缔合或经由接头序列(例如,柔性接头序列或刚性接头序列)融合。示例性接头序列和功能性结构域序列在下表中提供。
VI-E型CRISPR Cas效应子的工程化变体中基序和功能性结构域的氨基酸序列
在一些实施方式中,可以不使用全长野生型或衍生性VI-E型和VI-F型Cas效应子,而使用其“功能性片段”。
如本文所用,“功能性片段”是指具有小于全长序列的、功能性Cas13蛋白(如SEQID NO:2和3中的任一者)或其衍生物的片段。所述功能性片段中缺失的残基可以在N-末端、C-末端和/或内部。所述功能性片段保留原始功能性VI-E或VI-F Cas的至少一种功能、或其衍生物的至少一种功能。因此,功能性片段相对于所讨论的功能而特别定义。在某些实施方式中,本发明的工程化Cas13(包括工程化Cas13的功能性片段)基本上保留对应的原始Cas13(例如Cas13e.1)的指导序列依赖性RNA酶活性,但基本上缺乏旁切活性。
在一些实施方式中,与全长野生型序列相比,所述工程化2类VI型效应蛋白或其衍生物或其功能性片段缺乏来自N-末端的约30、60、90、120、150或约180个残基。
在一些实施方式中,与全长野生型序列相比,所述工程化2类VI型效应蛋白或其衍生物或其功能性片段缺乏来自C-末端的约30、60、90、120或约150个残基。
在一些实施方式中,与全长野生型序列相比,所述工程化2类VI型效应蛋白或其衍生物或其功能性片段缺乏来自N-末端的约30、60、90、120、150或约180个残基,并且缺乏来自C-末端的约30、60、90、120或约150个残基。
在一些实施方式中,所述工程化2类VI型Cas13效应蛋白或其衍生物或其功能性片段具有RNA酶活性,例如,指导/crRNA激活的特异性RNA酶活性。
在一些实施方式中,所述工程化2类VI型Cas13效应蛋白或其衍生物或其功能性片段不具有实质性的/可检测的旁切RNA酶活性。
本披露还提供本文描述的工程化2类VI型Cas13效应酶的拆分版本(例如,VI-E型或VI-F型CRISPR-Cas效应蛋白)。所述工程化Cas13的拆分版本可有利于递送。在一些实施方式中,将所述工程化Cas13拆分成酶的两个部分,所述酶的两个部分合在一起基本上构成有功能的工程化2类VI型Cas13。
所述拆分能以一个或多个催化结构域不受影响的方式进行。所述CRISPR相关蛋白可以作为核酸酶发挥作用,或者可以是灭活的酶,所述灭活的酶本质上是具有非常小的催化活性或没有催化活性(例如,由于其催化结构域中的一个或多个突变)的RNA结合蛋白。拆分型酶描述于例如Wright等人,“Rational design of a split-Cas9 enzyme complex[拆分型Cas9酶复合物的合理设计],”Proc.Nat'l.Acad.Sci.[美国国家科学院院刊]112(10):2984-2989,2015中,将所述文献通过引用以其全文并入本文。
例如,在一些实施方式中,核酸酶叶(nuclease lobe)和α-螺旋叶(α-helicallobe)经表达为单独的多肽。尽管所述叶自身并不相互作用,但crRNA将它们募集到三元复合物中,所述复合物重现全长CRISPR相关蛋白的活性并催化位点特异性切割。使用经修饰的crRNA通过防止二聚化来消除拆分型酶的活性,从而允许开发诱导型二聚化***。
在一些实施方式中,可以例如通过采用雷帕霉素敏感性二聚化结构域将拆分型CRISPR相关蛋白与二聚化配偶体融合。这允许生成用于对蛋白活性进行时间控制的化学诱导型CRISPR相关蛋白。因此,所述CRISPR相关蛋白可以通过拆分成两个片段而成为化学诱导性,并且雷帕霉素敏感性二聚化结构域可以用于蛋白的受控重组。
拆分点典型地经由计算机模拟设计并克隆到构建体中。在此过程期间,可以将突变引入拆分型CRISPR相关蛋白中,并且可以去除非功能性结构域。
在一些实施方式中,所述拆分型CRISPR相关蛋白的两个部分或片段(即,N-末端和C-末端片段)可以形成完整的CRISPR相关蛋白,其包含野生型CRISPR相关蛋白的例如至少70%、至少80%、至少90%、至少95%或至少99%的序列。
本文描述的CRISPR相关蛋白(例如,VI-E型或VI-F型CRISPR-Cas效应蛋白)可以设计为自我激活或自我灭活。例如,可以将靶序列引入所述CRISPR相关蛋白的编码构建体中。因此,所述CRISPR相关蛋白可以切割所述靶序列以及编码所述蛋白的构建体,从而自我灭活它们的表达。构建自我灭活CRISPR***的方法描述于例如Epstein和Schaffer,Mol.Ther.[分子疗法]24:S50,2016中,将所述文献通过引用以其全文并入本文。
在一些其他实施方式中,在弱启动子(例如,7SK启动子)的控制下表达的额外的crRNA可以靶向编码所述CRISPR相关蛋白的核酸序列以防止和/或阻断其表达(例如,通过防止所述核酸的转录和/或翻译)。用表达所述CRISPR相关蛋白、所述crRNA、和靶向编码所述CRISPR相关蛋白的核酸的crRNA的载体转染细胞,可导致编码所述CRISPR相关蛋白的核酸的高效破坏并降低所述CRISPR相关蛋白的水平,从而限制其活性。
在一些实施方式中,所述CRISPR相关蛋白的活性可以通过哺乳动物细胞中的内源性RNA特征(例如,miRNA)来调节。可以通过在编码所述CRISPR相关蛋白的mRNA的5'-UTR中使用miRNA互补序列来制造CRISPR相关蛋白开关。所述开关选择性地并且高效地响应靶细胞中的miRNA。因此,所述开关可以通过感应异质细胞群内的内源性miRNA活性来对Cas活性进行差异控制。因此,开关***可以为基于细胞内miRNA信息的细胞类型选择性活性和细胞工程化提供框架(参见例如,Hirosawa等人,Nucl.Acids Res.[核酸研究]45(13):e118,2017)。
所述工程化2类VI型Cas13效应子(例如基本上缺乏旁切活性的那些,例如,工程化VI-E型和VI-F型CRISPR-Cas效应蛋白)可以经诱导表达,例如,它们的表达可以是光诱导的或化学诱导的。这种机制允许激活所述CRISPR相关蛋白中的功能性结构域。光诱导性可以通过本领域已知的各种方法来实现,例如,通过设计如下融合复合物来实现,其中将CRY2PHR/CIBN配对用于拆分型CRISPR相关蛋白中(参见例如,Konermann等人,“Opticalcontrol of mammalian endogenous transcription and epigenetic states[哺乳动物内源性转录和表观遗传状态的光学控制],”Nature[自然]500:7463,2013)。
化学诱导性可以例如通过设计如下融合复合物来实现,其中将FKBP/FRB(FK506结合蛋白/FKBP雷帕霉素结合结构域)配对用于拆分型CRISPR相关蛋白中。需要雷帕霉素来形成融合复合物,从而激活所述CRISPR相关蛋白(参见例如,Zetsche等人,“A split-Cas9architecture for inducible genome editing and transcription modulation[用于诱导型基因组编辑和转录调节的拆分型Cas9架构],”Nature Biotech.[自然生物技术]33:2:139-42,2015)。
此外,所述工程化2类VI型Cas13效应子(例如基本上缺乏旁切活性的那些)的表达可以通过诱导型启动子,例如四环素或强力霉素控制的转录激活(Tet-开和Tet-关表达***)、激素诱导型基因表达***(例如,蜕皮素诱导型基因表达***)和***糖诱导型基因表达***来调节。当作为RNA递送时,RNA靶向效应蛋白的表达可以经由核糖开关进行调节,所述核糖开关可以感应小分子(像四环素)(参见例如,Goldfless等人,“Direct andspecific chemical control of eukaryotic translation with a synthetic RNA-protein interaction[通过合成的RNA-蛋白相互作用对真核生物的翻译进行直接和特异性的化学控制],”Nucl.Acids Res.[核酸研究]40:9:e64-e64,2012)。
诱导型CRISPR相关蛋白和诱导型CRISPR***的各种实施方式描述于例如美国专利号8,871,445、美国公布号2016/0208243和国际公布号WO 2016/205764中,将各个文献通过引用以其全文并入本文。
在一些实施方式中,所述工程化2类VI型Cas13效应子(例如基本上缺乏旁切活性的那些)包括至少一个(例如,1、2、3、4、5、6、7、8、9或10个)附接至所述蛋白的N-末端或C-末端的核定位信号(NLS)。NLS的非限制性实例包括源自以下的NLS序列:SV40病毒大T抗原的NLS,其具有氨基酸序列PKKKRKV(SEQ ID NO:20);来自核质蛋白的NLS(例如,具有序列KRPAATKKAGQAKKKK(SEQ ID NO:21)的核质蛋白二分NLS);c-myc NLS,其具有氨基酸序列PAAKRVKLD(SEQ ID NO:22)或RQRRNELKRSP(SEQ ID NO:23);hRNPA1 M9 NLS,其具有序列NQSSNFGPMKGGNFGGRSSGPYGGGGQYFAKPRNQGGY(SEQ ID NO:24);来自输入蛋白-α的IBB结构域的序列RMRIZFKNKGKDTAELRRRRVEVSVELRKAKKDEQILKRRNV(SEQ ID NO:25);肌瘤T蛋白的序列VSRKRPRP(SEQ ID NO:26)和PPKKARED(SEQ ID NO:27);人p53的序列PQPKKKPL(SEQ IDNO:28);小鼠c-abl IV的序列SALIKKKKKMAP(SEQ ID NO:53);流感病毒NS1的序列DRLRR(SEQ ID NO:29)和PKQKKRK(SEQ ID NO:30);肝炎病毒δ抗原的序列RKLKKKIKKL(SEQ IDNO:31);小鼠Mx1蛋白的序列REKKKFLKRR(SEQ ID NO:32);人聚(ADP-核糖)聚合酶的序列KRKGDEVDGVDEVAKKKSKK(SEQ ID NO:33);人糖皮质激素受体的序列RKCLQAGMNLEARKTKK(SEQ ID NO:34);VACM-1/CUL5的序列PKLKRQ(SEQ ID NO:35);CXCR4的序列RPRK(SEQ IDNO:36);VP1的序列RRARRPRG(SEQ ID NO:37);53BP1的序列GKRKLITSEEERSPAKRGRKS(SEQID NO:38);ING4的序列KGKKGRTQKEKKAARARSKGKN(SEQ ID NO:39);IER5的序列RKRCAAGVGGGPAGCPAPGSTPLKKPRR(SEQ ID NO:40);ERK5的序列RKPVTAQERQREREEKRRRRQERAKEREKRRQERER(SEQ ID NO:41);Hrp1的序列RSGGNHRRNGRGGRGGYNRRNNGYHPY(SEQ ID NO:42);UL79的序列TLLLRETMNNLGVSDHAVLSRKTPQPY(SEQ ID NO:43);EWS的序列PGKMDKGEHRQERRDRPY(SEQ ID NO:44);PTHrP的序列GKKKKGKPGKRREQRKKKRRT(SEQ ID NO:45);Pho4的序列SANKVTKNKSNSSPYLNKRKGKPGPDS(SEQ ID NO:46);rpL23a的序列VHSHKKKKIPTSPTFTTPKTLTLRRQPKYPRKSAPRRNKLDHY(SEQ ID NO:47);MSX1的序列RKHKTNRKPR(SEQ IDNO:48);以及NLS-RARα的序列RNKKKK(SEQ ID NO:54)。
在一些实施方式中,所述CRISPR相关蛋白包含至少一个(例如,1、2、3、4、5、6、7、8、9或10个)附接所述蛋白的N-末端或C-末端的核输出信号(NES)。在优选的实施方式中,附接C-末端和/或N-末端NLS或NES,用于在真核细胞(例如,人细胞)中进行最佳表达和核靶向。
在一些实施方式中,所述工程化2类VI型Cas13效应子(例如基本上缺乏旁切活性的那些)在一个或多个氨基酸残基处突变以改变一种或多种功能性活性。
例如,在一些实施方式中,所述工程化2类VI型Cas13效应子(例如基本上缺乏旁切活性的那些)在一个或多个氨基酸残基处突变以改变其解旋酶活性。
在一些实施方式中,所述工程化2类VI型Cas13效应子(例如基本上缺乏旁切活性的那些)在一个或多个氨基酸残基处突变以改变其核酸酶活性(例如,内切核酸酶活性或外切核酸酶活性),如不依赖于指导序列的旁切核酸酶活性。
在一些实施方式中,所述工程化2类VI型Cas13效应子(例如基本上缺乏旁切活性的那些)在一个或多个氨基酸残基处突变以改变其与指导RNA功能性缔合的能力。
在一些实施方式中,所述工程化2类VI型Cas13效应子(例如基本上缺乏旁切活性的那些)在一个或多个氨基酸残基处突变以改变其与靶核酸(如VEGFA mRNA)功能性缔合的能力。
在一些实施方式中,本文描述的工程化2类VI型Cas13效应子(例如基本上缺乏旁切活性的那些)能够切割靶RNA分子(如VEGFA mRNA)。
在一些实施方式中,所述工程化2类VI型Cas13效应子(例如基本上缺乏旁切活性的那些)在一个或多个氨基酸残基处突变以改变其切割活性。例如,在一些实施方式中,所述工程化2类VI型Cas13效应子(例如基本上缺乏旁切活性的那些)可以包含一个或多个突变,所述突变使酶不能切割靶核酸(如VEGFA mRNA)。
在一些实施方式中,所述工程化2类VI型Cas13效应子(例如基本上缺乏旁切活性的那些)能够切割与指导RNA杂交的链互补的靶核酸链。
在一些实施方式中,本文描述的工程化2类VI型Cas13效应子(例如基本上缺乏旁切活性的那些)可以经工程化以具有一个或多个氨基酸残基的缺失,以减小酶的大小,同时保留一种或多种所希望的功能性活性(例如,核酸酶活性和与指导RNA功能上相互作用的能力)。截短的工程化2类VI型Cas13效应子(例如基本上缺乏旁切活性的那些)可以有利地与具有负载限制的递送***组合使用。
在一些实施方式中,本文描述的工程化2类VI型Cas13效应子(例如基本上缺乏旁切活性的那些)可以与一种或多种肽标签,包括His标签、GST标签、V5标签、FLAG标签、HA标签、VSV-G标签、Trx标签或myc标签融合。
在一些实施方式中,本文描述的工程化2类VI型Cas13效应子(例如基本上缺乏旁切活性的那些)可以与可检测部分,例如GST、荧光蛋白(例如GFP、HcRed、DsRed、CFP、YFP或BFP)或酶(如HRP或CAT)融合。
在一些实施方式中,本文描述的工程化2类VI型Cas13效应子(例如基本上缺乏旁切活性的那些)可以与MBP、LexA DNA结合结构域或Gal4 DNA结合结构域融合。
在一些实施方式中,本文描述的工程化2类VI型Cas13效应子(例如基本上缺乏旁切活性的那些)可以与可检测标记(如荧光染料,包括FITC和DAPI)连接或缀合。
在本文的任一实施方式中,本文描述的工程化2类VI型Cas13效应子(例如基本上缺乏旁切活性的那些)与其他部分之间的连接可以经由共价化学键在所述CRISPR相关蛋白的N-末端或C-末端处,并且有时甚至在内部。所述连接可以通过本领域已知的任何化学连接来实现,所述化学连接例如肽连接、通过氨基酸(如D、E、S、T)的侧链或氨基酸衍生物(Ahx、β-Ala、GABA或Ava)连接、或PEG连接。
3.多核苷酸和AAV载体基因组
本发明的一个方面提供重组腺相关病毒(rAAV)载体基因组,所述rAAV载体基因组包含(1)Cas13X多核苷酸,所述Cas13X多核苷酸编码本发明的工程化Cas13X多肽(其基本上缺乏非指导RNA依赖性旁切核酸酶活性,但基本上保留衍生这样的工程化Cas13X多肽的原始Cas13蛋白的指导RNA依赖性核酸酶活性);以及(2)用于转录指导RNA的表达盒,所述指导RNA靶向靶基因转录物(如VEGFA mRNA),其中所述指导RNA包括用于与所述Cas13X多肽形成复合物的功能性连接的DR序列。
更特别地,本发明的一个方面提供重组腺相关病毒(rAAV)载体基因组,所述rAAV载体基因组包含:(1)编码Cas13X多肽的Cas13X多核苷酸(如SEQ ID NO:5),所述Cas13X多核苷酸与SEQ ID NO:1具有至少80%、85%、90%、95%、96%、97%、98%、99%、99.2%、99.4%、99.6%、99.8%、或99.9%同一性,所述Cas13X多肽包含在SEQ ID NO:4(由SEQ IDNO:1编码的wt蛋白)的Y672、Y676、和/或I751处的1-3个取代,并且具有与SEQ ID NO:4基本上相同(例如,至少约80%、90%、95%、99%或更多)的指导RNA特异性核酸酶活性并且基本上没有(例如,最多20%、15%、10%、5%)SEQ ID NO:4的旁切(非指导RNA依赖性)核酸酶活性;以及(2)在所述Cas13X多核苷酸的3'的polyA信号序列;任选地,所述Cas13X多肽具有SEQ ID NO:2或3的氨基酸序列。
反向末端重复(ITR)序列对于病毒DNA复制的启动和腺相关病毒基因组的环化很重要。在ITR序列内,二级结构(例如,由回文序列形成的茎和环)在病毒复制和/或包装中是重要的一种或多种ITR功能。这样的序列元件包括RBE序列(Rep结合元件)、RBE'序列和trs(末端分解序列(terminal resolution sequence))。
在某些实施方式中,所述rAAV载体基因组包含5'AAV ITR序列和3'AAV ITR序列。
在某些实施方式中,所述5'AAV ITR序列和所述3'AAV ITR序列都是来自以下的野生型AAV ITR序列:AAV1、AAV2、AAV3A、AAV3B、AAV4、AAV5、AAV6、AAV7、AAVrh74、AAV8、AAV9、AAV10、AAV11、AAV12、AAV13、或所述AAV1-AAV13中的任一者所属的进化枝的成员。
在某些实施方式中,所述5'AAV ITR序列和所述3'AAV ITR序列都是来自AAV2的野生型AAV ITR序列。
在某些实施方式中,所述5'ITR序列和/或3'ITR序列是经修饰的ITR序列。例如,可以缺失野生型ITR序列(例如,AAV2 ITR序列)的最5'端或最3'端。缺失可以为至多18、17、16、15、14、13、12、11、10、9、8、7、6、5、4、3、2、或1个核苷酸。
在某些实施方式中,可以缺失野生型AAV2 ITR序列的最5'端核苷酸的至多15个(如正好15个)核苷酸、和/或最3'端核苷酸的至多15个(如正好15个)核苷酸。
因此,所述5'和/或3'经修饰的ITR可包含145个nt的野生型AAV ITR序列的至多144、143、142、141、140、139、138、137、136、135、134、133、132、131、130、129、128、或127个nt(如130个核苷酸)。
在某些实施方式中,所述经修饰的ITR序列包含wt ITR序列的RBE序列、RBE'序列、和/或trs。
在某些实施方式中,所述经修饰的ITR序列包含RBE序列和RBE'序列两者。
在某些实施方式中,所述经修饰的ITR序列赋予本发明的包含AAV载体基因组的质粒(参见下文)在细菌中的稳定性,例如在质粒产生期间的稳定性。
在某些实施方式中,所述经修饰的ITR不干扰本发明的包含AAV载体基因组的质粒的测序验证。
在某些实施方式中,所述经修饰的5'ITR序列包含不是野生型AAV 5'ITR序列的一部分的5'异源序列。在某些实施方式中,所述经修饰的3'ITR序列包含不是野生型AAV 3'ITR序列的一部分的3'异源序列。
在某些实施方式中,所述经修饰的5'ITR序列包含不是野生型AAV(例如,wt AAV2)5'ITR序列的一部分的5'异源序列,并且所述经修饰的3'ITR序列包含不是野生型AAV(例如,wt AAV2)3'ITR序列的一部分的3'异源序列,其中所述5'异源序列和所述3'异源序列彼此互补。
在某些实施方式中,所述5'异源序列和所述3'异源序列各自包含II型限制性内切核酸酶识别序列,如Sse8387I的识别序列(CCTGCAGG)或PacI的识别序列(TTAATTAA)。
在某些实施方式中,所述5'异源序列包含CCTGCAGGCAG(SEQ ID NO:88)、基本上由其组成、或由其组成,并且所述3'异源序列包含SEQ ID NO:88的反向互补序列、基本上由其组成、或由其组成。包含SEQ ID NO:88的示例性5'ITR是SEQ ID NO:10。包含SEQ ID NO:88的反向互补序列的示例性3'ITR是SEQ ID NO:11。
在某些实施方式中,所述5'异源序列包含TTAATTAAGG(SEQ ID NO:89)、基本上由其组成、或由其组成,并且所述3'异源序列包含SEQ ID NO:89的反向互补序列、基本上由其组成、或由其组成。
在某些实施方式中,所述5'ITR和所述3'ITR都是flip ITR。
在某些实施方式中,所述5'ITR和所述3'ITR都是flop ITR。
在某些实施方式中,所述5'ITR和所述3'ITR独立地是flip ITR或flop ITR。
在某些实施方式中,所述5'ITR是flip ITR,并且所述3'ITR是flop ITR。
在某些实施方式中,所述5'ITR是flop ITR,并且所述3'ITR是flip ITR。
在某些实施方式中,所述5'ITR是flip ITR,并且所述3'ITR是flip ITR。
在某些实施方式中,所述5'ITR是flop ITR,并且所述3'ITR是flop ITR。
如本文所用,5'flip ITR的B:B'区段比C:C'区段更靠近5'末端。3'flip ITR的B:B'区段比C:C'区段更靠近3'末端。5'flop ITR的C:C'区段比B:B'区段更靠近5'末端。3'flop ITR的C:C'区段比B:B'区段更靠近3'末端。
在某些实施方式中,所述经修饰的5'ITR和所述经修饰的3'ITR都是flop ITR,所述经修饰的5'ITR包含不是野生型AAV2 5'ITR序列的一部分的5'异源序列(如SEQ ID NO:88或89),并且所述经修饰的3'ITR序列包含不是野生型AAV2 3'ITR序列的一部分的3'异源序列,其中所述5'异源序列和所述3'异源序列彼此互补并且各自包含II型限制性内切核酸酶识别序列,如Sse8387I或PacI的识别序列;任选地,所述经修饰的5'ITR序列进一步包含C:C'区段中的缺失,如11个nt缺失AAAGCCCGGGC(SEQ ID NO:90)。
在某些实施方式中,所述5'ITR包含145个nt的wt AAV2 5'ITR的最3'核苷酸的至多141个nt(例如,145个nt的wt AAV2 5'ITR的最5'端的4个或更多个的缺失)。
在某些实施方式中,所述5'ITR包含145个nt的wt AAV2 5'ITR的最3'核苷酸的至多130个nt(例如,145个nt的wt AAV2 5'ITR的最5'端的15个或更多个的缺失)。
在某些实施方式中,所述3'ITR包含145个nt的wt AAV2 3'ITR的最5'核苷酸的至多141个nt(例如,145个nt的wt AAV2 3'ITR的最3'端的4个或更多个的缺失)。
在某些实施方式中,所述3'ITR包含145个nt的wt AAV2 3'ITR的最5'核苷酸的至多130个nt(例如,145个nt的wt AAV2 3'ITR的最3'端的15个或更多个的缺失)。
在某些实施方式中,所述5'ITR序列和3'ITR序列对基于三重转染在哺乳动物细胞中的AAV生产兼容。
在某些实施方式中,所述5'ITR序列和3'ITR序列对基于杆状病毒载体(参见下文)在昆虫细胞(例如,Sf9)中的AAV生产兼容。
在某些实施方式中,所述5'ITR序列和3'ITR序列对基于HSV载体(参见下文)在哺乳动物细胞中的AAV生产兼容。
在一些实施方式中,所述Cas13X多核苷酸与调节元件(例如,启动子)可操作地连接以控制所述Cas13X多肽的表达。在一些实施方式中,所述启动子是泛素启动子。在一些实施方式中,所述启动子是组成型启动子。在一些实施方式中,所述启动子是诱导型启动子。在一些实施方式中,所述启动子是细胞特异性启动子。在一些实施方式中,所述启动子是生物特异性启动子,例如组织特异性启动子。
合适的启动子是本领域已知的并且包括例如pol I启动子、pol II启动子、polIII启动子、T7启动子、U6启动子、H1启动子、逆转录病毒劳斯肉瘤病毒LTR启动子、巨细胞病毒(CMV)启动子、SV40启动子、二氢叶酸还原酶启动子、β-肌动蛋白启动子、延伸因子1α短(EFS)启动子、β葡萄糖醛酸酶(GUSB)启动子、巨细胞病毒(CMV)即早(Ie)增强子和/或启动子、鸡β-肌动蛋白(CBA)启动子或其衍生物如CAG启动子、CB启动子、(人)延伸因子1α-亚基(EF1α)启动子、泛素C(UBC)启动子、朊病毒启动子、神经元特异性烯醇化酶(NSE)、神经丝轻链(NFL)启动子、神经丝重链(NFH)启动子、血小板衍生生长因子(PDGF)启动子、血小板衍生生长因子B链(PDGF-β)启动子、突触蛋白(Syn)启动子、突触蛋白1(Syn1)启动子、甲基-CpG结合蛋白2(MeCP2)启动子、Ca2+/钙调蛋白依赖性蛋白激酶II(CaMKII)启动子、代谢型谷氨酸受体2(mGluR2)启动子、神经丝轻链(NFL)启动子、神经丝重链(NFH)启动子、β-珠蛋白小基因nβ2启动子、前脑啡肽原(PPE)启动子、脑啡肽(Enk)启动子、兴奋性氨基酸转运蛋白2(EAAT2)启动子、胶质纤维酸性蛋白(GFAP)启动子、髓鞘碱性蛋白(MBP)启动子。例如,U6启动子可用于调节本文描述的指导RNA分子的表达。在一些实施方式中,所述延伸因子1α短(EFS)启动子可用于调节本文描述的Cas13效应蛋白的表达。
在某些实施方式中,所述启动子是所述延伸因子1α短(EFS)启动子,如SEQ ID NO:12。
在某些实施方式中,本发明的rAAV载体基因组进一步包含与所述Cas13X多肽的N-末端、C-末端、和/或内部融合的核定位序列(NLS)的编码序列,和/或与所述Cas13X多肽的N-末端、C-末端、和/或内部融合的核输出信号(NES)的编码序列。
在某些实施方式中,本发明的rAAV载体基因组包含在所述Cas13X多核苷酸的5'的第一NLS编码序列、和/或在所述Cas13X多核苷酸的3'的第二NLS编码序列(例如,包含所述第一NLS编码序列和所述第二NLS编码序列两者)。
在某些实施方式中,所述NLS、所述第一NLS和所述第二NLS独立地选自SEQ ID NO:20-48或53-54。
在某些实施方式中,本发明的rAAV载体基因组进一步包含Kozak序列或其功能性变体。在某些实施方式中,所述Kozak序列是SEQ ID NO:13;或包含与SEQ ID NO:13相差最多1、2、3或4个核苷酸的序列(除了所述Kozak序列内的ATG起始密码子之外),其中最后三个核苷酸任选地是ACC或GCC。
在某些实施方式中,本发明的rAAV载体基因组进一步包含聚腺苷酸化(polyA)信号序列。在某些实施方式中,所述polyA信号序列选自生长激素聚腺苷酸化信号(bGHpolyA)、小polyA信号(SPA)、人生长激素聚腺苷酸化信号(hGH polyA)、SV40 polyA信号(SV40 polyA)、兔β珠蛋白polyA信号(rBG polyA)、或其变体。在某些实施方式中,所述polyA信号序列是SV40 polyA信号序列或其功能性变体(如SEQ ID NO:15)。
在某些实施方式中,用于转录靶向靶基因转录物(例如,VEGFA mRNA)的指导RNA的表达盒包含RNA pol III启动子,其中所述第二转录单元在所述Cas13X多核苷酸的3'。
在某些实施方式中,所述RNA pol III启动子是U6(如SEQ ID NO:16)、H1、7SK、或其变体。
在某些实施方式中,用于转录靶向靶基因转录物的指导RNA的表达盒编码一个或多个(例如,2个或3个)单个指导RNA(sgRNA),每个sgRNA与靶RNA序列(例如,VEGFA mRNA)互补,并且各自能够引导所述Cas13X多肽切割所述靶RNA;任选地,每个所述sgRNA包含与所述Cas13X多肽结合的同向重复(DR)序列。DR序列和sgRNA/crRNA的更详细描述在下文的单独部分(通过引用并入本文)中提供。
在某些实施方式中,所述一个或多个sgRNA包含SEQ ID NO:7和8。
在某些实施方式中,所述DR序列是与SEQ ID NO:6具有至少90%同一性,与SEQ IDNO:6相差最多1、2、3、4或5个核苷酸,和/或与SEQ ID NO:6具有基本上相同的二级结构的核酸序列。
在某些实施方式中,所述DR序列包含SEQ ID NO:6、基本上由其组成、或由其组成。
在某些实施方式中,所述靶RNA是与眼睛疾病或障碍相关的靶基因的转录物(例如,mRNA)。
在某些实施方式中,所述眼睛疾病或障碍是阿米巴角膜炎、真菌性角膜炎、细菌性角膜炎、病毒性角膜炎、盘尾丝虫性角膜炎、角膜结膜炎、细菌性角膜结膜炎、病毒性角膜结膜炎、春季角膜结膜炎、特应性角膜结膜炎、角膜营养不良性疾病、富克斯内皮营养不良、干燥综合征、史-约综合征、自身免疫性干眼病、环境性干眼病、角膜新生血管形成疾病、角膜移植后排斥反应的预防和治疗、自身免疫性葡萄膜炎、感染性葡萄膜炎、非感染性葡萄膜炎、前葡萄膜炎、后葡萄膜炎(包括弓形虫病)、泛葡萄膜炎、玻璃体或视网膜的炎性疾病、眼内炎的预防和治疗、黄斑水肿、黄斑变性、湿性年龄相关性黄斑变性(湿性AMD)、干性年龄相关性黄斑变性(干性AMD)、糖尿病性黄斑水肿(DME)、过敏性结膜炎、增殖性和非增殖性糖尿病性视网膜病变、高血压性视网膜病变、视网膜的自身免疫性疾病、原发性和转移性眼内黑素瘤、其他眼内转移性肿瘤、开角型青光眼、斯特格氏病、眼底黄色斑点症、闭角型青光眼、色素性青光眼、视网膜色素变性(RP)、莱伯氏先天性黑矇(LCA)、厄舍综合征、无脉络膜、视杆-视锥细胞或视锥-视杆细胞营养不良、纤毛病、线粒体障碍、进行性视网膜萎缩、退行性视网膜疾病、地图状萎缩、家族性或获得性黄斑病变、视网膜光感受器疾病、基于视网膜色素上皮的疾病、黄斑囊样水肿、视网膜脱离、外伤性视网膜损伤、医源性视网膜损伤、黄斑裂孔、黄斑毛细血管扩张、神经节细胞疾病、视神经细胞疾病、视神经病变、缺血性视网膜疾病、早产儿视网膜病变、视网膜血管阻塞、家族性大动脉瘤、视网膜血管疾病、眼血管疾病、血管疾病、缺血性视神经病变疾病、糖尿病性视网膜水肿、由视网膜下新生血管形成引起的老年性黄斑变性、近视性视网膜病变、视网膜缺血、脉络膜血管功能不全、脉络膜血栓形成和由颈动脉缺血引起的新生血管性视网膜病变、角膜新生血管形成、伴有渗出性或炎性组分的角膜疾病或混浊、弥漫性板层角膜炎、由于眼睛穿透伤或挫伤性眼损伤导致的新生血管形成、红斑虹膜炎、富克斯异色性虹膜睫状体炎、慢性葡萄膜炎、前葡萄膜炎、由手术如LASIK、LASEK、屈光手术、IOL植入引起的炎性病症;作为白内障手术并发症的不可逆角膜水肿、损伤或外伤引起的水肿、炎症、感染性和非感染性结膜炎、虹膜睫状体炎、虹膜炎、巩膜炎、巩膜外层炎、浅表点状角膜炎、圆锥角膜、后部多形性营养不良、富克斯营养不良、无晶状体性和假晶状体性大泡性角膜病变、角膜水肿、巩膜疾病、眼瘢痕性类天疱疮、睫状体扁平部炎、青光眼睫状体炎综合征、白塞病、福格特-小柳-原田综合征、超敏性反应、眼表障碍、结膜水肿、弓形虫病脉络膜视网膜炎、眼眶炎性假瘤、球结膜水肿、结膜静脉充血、眶周蜂窝组织炎、急性泪囊炎、非特异性血管炎、结节病、巨细胞病毒感染、及其组合。
在某些实施方式中,所述眼睛疾病或障碍是湿性年龄相关性黄斑变性(湿性AMD)。
在某些实施方式中,所述靶基因选自血管内皮生长因子A(VEGFA)、补体因子H(CFH)、年龄相关性黄斑病变易感因子2(ARMS2)、HtrA丝氨酸肽酶1(HTRA1)、ATP结合盒亚家族A成员4(ABCA4)、外周蛋白2(PRPH2)、腓骨蛋白-5(FBLN5)、ERCC切除修复6染色质重塑因子(ERCC6)、视网膜和前神经折叠同源框2(RAX2)、补体C3(C3)、Toll样受体4(TLR4)、胱抑素C(CST3)、CX3C趋化因子受体1(CX3CR1)、补体因子I(CFI)、补体C2(C2)、补体因子B(CFB)、补体C9(C9)、线粒体编码的TRNA亮氨酸1(UUA/G)(MT-TL-1)、补体因子H相关蛋白1(CFHR1)、补体因子H相关蛋白3(CFHR3)、睫状神经营养因子(CNTF)、色素上皮衍生因子(PEDF)、视杆细胞衍生的视锥细胞活力因子(RdCVF)、胶质细胞源性神经营养因子(GDNF)、肌球蛋白VIIA(MYO7A);中心体蛋白290(CEP290)、钙粘蛋白相关蛋白23(CDH23)、闭眼同源物(EYS)、Usherin蛋白(USH2A)、粘附G蛋白偶联受体V1(ADGRV1)、ALMS1中心体和基底体相关蛋白(ALMS1)、类视黄醇异构水解酶65kDa(RPE65)、芳基-烃相互作用蛋白样1(AIPL1)、鸟苷酸环化酶2D、视网膜(GUCY2D)、莱伯氏先天性黑矇5蛋白(LCA5)、视锥-视杆细胞同源框(CRX)、Clarin蛋白(CLRN1)、ATP结合盒亚家族A成员4(ABCA4)、视黄醇脱氢酶12(RDH12)、肌苷一磷酸脱氢酶1(IMPDH1)、碎屑细胞极性复合物组分1(CRB1)、卵磷脂视黄醇酰基转移酶(LRAT)、烟酰胺核苷酸腺苷酰基转移酶1(NMNAT1)、TUB样蛋白1(TULP1)、MER原癌基因、酪氨酸激酶(MERTK)、色素性视网膜炎GTP酶调节剂(RPGR)、ARL3 GTP酶的RP2激活剂(RP2)、X连锁色素性视网膜炎GTP酶调节剂相互作用蛋白1(RPGRIP)、环状核苷酸门控通道亚基α3(CNGA3)、环状核苷酸门控通道亚基β3(CNGB3)、G蛋白亚基α转导素2(GNAT2)、成纤维细胞生长因子2(FGF2)、***(EPO)、BCL2细胞凋亡调节剂(BCL2)、BCL2样1(BCL2L1)、核因子κB(NFκB)、内皮抑素、血管抑素、fms样酪氨酸激酶受体(sFlt)、色素分散因子受体(Pdfr)、白细胞介素10(IL10)、可溶性白细胞介素17(sIL17R)、白细胞介素1受体拮抗剂(IL1-ra)、TNF受体超家族成员1A(TNFRSF1A)、TNF受体超家族成员1B(TNFRSF1B)、和白细胞介素4(IL4)。
在某些实施方式中,所述靶基因是VEGFA。
在某些实施方式中,所述靶RNA是与神经退行性疾病或障碍相关的靶基因的转录物(例如,mRNA)。
在某些实施方式中,所述神经退行性疾病或障碍是酒精中毒、亚历山大病、阿尔珀斯病、阿尔茨海默病、肌萎缩侧索硬化(ALS)、共济失调毛细血管扩张症、神经元蜡样质脂褐质沉积症、巴滕病、牛海绵状脑病(BSE)、卡纳万病、脑性瘫痪、科凯恩综合征、皮质基底节变性、克罗伊茨费尔特-雅各布病、额颞叶变性、亨廷顿病、HIV相关性痴呆、肯尼迪病、路易体痴呆、神经疏螺旋体病、原发性年龄相关性tau蛋白病(PART)/神经原纤维缠结优势型老年性痴呆、马查多-约瑟夫病、多***萎缩、多发性硬化、多发性硫酸酯酶缺乏症、粘脂贮积病、发作性睡病、尼曼皮克病、帕金森病、皮克病、庞贝病、原发性侧索硬化、朊病毒病、神经元丧失、认知缺陷、运动神经元疾病、杜氏肌营养不良(DMD)、额颞叶痴呆、17号染色体相关的额颞叶痴呆合并帕金森综合征、Lytico-Bodig病(关岛帕金森-痴呆复合征)、神经轴索营养不良、雷夫叙姆病、希德氏病、继发于恶性贫血的亚急性脊髓联合变性、斯皮尔梅伊尔-沃格特-肖格伦-巴滕病、17号染色体相关的帕金森综合征(FTDP-17)、普瑞德威利综合征、强直性肌营养不良、慢性创伤性脑病包括拳击性痴呆、脊髓小脑性共济失调、脊髓性肌萎缩、斯蒂尔-理查森-奥尔谢夫斯基病、脊髓痨、C型尼曼皮克病(NPC1和/或NPC2缺陷)、史-莱-奥综合征(SLOS)、先天性胆固醇合成障碍、丹吉尔病、佩利措伊斯-梅茨巴赫病、神经元蜡样质脂褐质沉积症、原发性鞘糖脂沉积症、法伯病或多发性硫酸酯酶缺乏症、戈谢病、法布里病、GM1神经节苷脂沉积症、GM2神经节苷脂沉积症、克拉伯病、异染性脑白质营养不良(MLD)、NPC、GM1神经节苷脂沉积症、法布里病、神经退行性粘多糖贮积症、MPS I、MPS IH、MPS IS、MPS II、MPS III、MPS IIIA、MPS IIIB、MPS IIIC、MPS HID、MPS、IV、MPS IV A、MPS IV B、MPS VI、MPS VII、MPS IX、继发性溶酶体受累疾病、SLOS、丹吉尔病、神经节细胞胶质瘤、神经节细胞瘤、脑膜血管瘤病、脑炎后帕金森综合征、亚急性硬化性全脑炎、铅中毒性脑病、结节性硬化、哈勒沃登-施帕茨病、脂褐质沉积症、小脑性共济失调、帕金森综合征、路-巴综合征、多***萎缩、额颞叶痴呆或下肢帕金森综合征、尼曼皮克病、C型尼曼皮克病、A型尼曼皮克病、泰-萨克斯病、小脑型多***性萎缩(MSA-C)、伴有帕金森综合征的额颞叶痴呆、进行性核上性麻痹、小脑下跳性眼震、桑霍夫病或II型粘脂沉积症、或其组合。
在某些实施方式中,所述靶RNA是与癌症相关的靶基因的转录物(例如,mRNA)。
在某些实施方式中,所述癌症是癌、肉瘤、骨髓瘤、白血病、淋巴瘤和混合型肿瘤。可以通过本文描述的方法和组合物治疗的癌症的非限制性实例包括来自以下的癌细胞:膀胱、血液、骨、骨髓、脑、乳腺、结肠、食道、胃肠道、牙龈、头、肾、肝、肺、鼻咽、颈、卵巢、***、皮肤、胃、睾丸、舌、或子宫。此外,所述癌症可以特别地属于以下组织学类型,但不限于这些:恶性赘生物;癌;未分化的癌;巨细胞癌和梭形细胞癌;小细胞癌;***状癌;鳞状细胞癌;淋巴上皮癌;基底细胞癌;毛母质癌;移行细胞癌;***状移行细胞癌;腺癌;恶性胃泌素瘤;胆管癌;肝细胞癌;混合型肝细胞癌和胆管癌;小梁腺癌;腺样囊性癌;腺瘤性息肉中的腺癌;家族性结肠息肉病性腺癌;实体癌;恶性类癌肿瘤;细支气管-肺泡腺癌;***状腺癌;嫌色细胞癌;嗜酸细胞癌;嗜酸性腺癌;嗜碱细胞癌;透明细胞腺癌;颗粒细胞癌;滤泡状腺癌;***状和滤泡状腺癌;非包裹性硬化型癌;肾上腺皮质癌;子宫内膜样癌;皮肤附件癌;大汗腺癌;皮脂腺癌;耵聍腺癌;粘液表皮样癌;囊腺癌;***状囊腺癌;***状浆液性囊腺癌;粘液性囊腺癌;粘液性腺癌;印戒细胞癌;浸润性导管癌;髓样癌;小叶癌;炎性癌;乳腺佩吉特病;腺泡细胞癌;腺鳞癌;腺癌伴鳞状化生;恶性胸腺瘤;恶性卵巢间质瘤;恶性卵泡膜细胞瘤;恶性颗粒细胞瘤;和恶性成纤维细胞瘤;支持细胞癌;恶性***细胞瘤;恶性脂质细胞瘤;恶性副神经节瘤;恶性乳腺外副神经节瘤;嗜铬细胞瘤;血管球肉瘤;恶性黑素瘤;无黑素性黑素瘤;浅表扩散性黑素瘤;巨大色素痣中的恶性黑素瘤;上皮样细胞黑素瘤;恶性蓝痣;肉瘤;纤维肉瘤;恶性纤维组织细胞瘤;粘液肉瘤;脂质肉瘤;平滑肌肉瘤;横纹肌肉瘤;胚胎性横纹肌肉瘤;肺泡横纹肌肉瘤;间质肉瘤;恶性混合瘤;苗勒管混合瘤;肾母细胞瘤;肝母细胞瘤;癌肉瘤;恶性间叶瘤;恶性布伦纳瘤;恶性叶状瘤;滑膜肉瘤;恶性间皮瘤;无性细胞瘤;胚胎癌;恶性畸胎瘤;恶性卵巢甲状腺肿;绒毛膜癌;恶性中肾瘤;血管肉瘤;恶性血管内皮瘤;卡波西肉瘤;恶性血管外皮细胞瘤;***肉瘤;骨肉瘤;骨旁骨肉瘤;软骨肉瘤;恶性软骨母细胞瘤;间叶性软骨肉瘤;骨巨细胞瘤;尤因肉瘤;恶性牙源性肿瘤;成釉细胞牙肉瘤;恶性成釉细胞瘤;成釉细胞纤维肉瘤;恶性松果体瘤;脊索瘤;恶性胶质瘤;室管膜瘤;星形细胞瘤;原生质星形细胞瘤;纤维型星形细胞瘤;星形母细胞瘤;胶质母细胞瘤;少突神经胶质瘤;成少突神经胶质细胞瘤;原始神经外胚瘤;小脑肉瘤;神经节神经母细胞瘤;成神经细胞瘤;视网膜母细胞瘤;嗅觉神经源性肿瘤;恶性脑膜瘤;神经纤维肉瘤;恶性神经鞘瘤;恶性颗粒细胞瘤;恶性淋巴瘤;霍奇金病;霍奇金淋巴瘤;副肉芽肿;小淋巴细胞性恶性淋巴瘤;弥漫性大细胞性恶性淋巴瘤;滤泡性恶性淋巴瘤;蕈样肉芽肿;其他指定的非霍奇金淋巴瘤;恶性组织细胞增生症;多发性骨髓瘤;肥大细胞肉瘤;免疫增殖性小肠疾病;白血病;淋巴样白血病;浆细胞白血病;红白血病;淋巴肉瘤细胞白血病;髓性白血病;嗜碱性粒细胞白血病;嗜酸性粒细胞白血病;单核细胞白血病;肥大细胞白血病;巨核细胞白血病;髓性肉瘤;浆细胞瘤、结直肠癌、直肠癌、和毛细胞白血病。
在某些实施方式中,本发明的rAAV载体基因组包含ITR至ITR多核苷酸(如SEQ IDNO:17),所述ITR至ITR多核苷酸从5'到3'包含:(a)来自AAV2的5'ITR(如SEQ ID NO:10);(b)EFS启动子(如SEQ ID NO:12);(c)Kozak序列(如SEQ ID NO:13);(d)第一SV40 NLS编码序列(如SEQ ID NO:14);(e)编码SEQ ID NO:2或3的Cas13X多肽的Cas13X多核苷酸(如SEQID NO:5);(f)第二SV40 NLS编码序列(如SEQ ID NO:14);(g)SV40 polyA信号序列(如SEQID NO:15);(h)U6启动子(如SEQ ID NO:16);(i)第一同向重复序列(如SEQ ID NO:6);(j)对VEGFA具有特异性的sg1编码序列(如SEQ ID NO:7);(k)第二同向重复序列(如SEQ IDNO:6);(l)对VEGFA具有特异性的sg2编码序列(如SEQ ID NO:8);(m)第三同向重复序列(如SEQ ID NO:6);以及(n)来自AAV2的3'ITR(如SEQ ID NO:11);或与所述ITR至ITR多核苷酸具有至少约90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%、99.6%、99.7%、99.8%、99.9%同一性的多核苷酸。
在某些实施方式中,所述重组AAV(rAAV)载体基因组包含以下、基本上由以下组成、或由以下组成:SEQ ID NO:17或与其具有至少90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%、99.6%、99.7%、99.8%、99.9%同一性的多核苷酸,其中所述多核苷酸编码与SEQ ID NO:4具有至少80%、85%、90%、95%、96%、97%、98%或99%同一性的Cas13X多肽以及对VEGFA具有特异性的sgRNA,其中所述Cas13X多肽包含在SEQ ID NO:4的Y672、Y676、和/或I751处的1-3个取代,并且其中所述sgRNA与所述Cas13X多肽形成复合物并引导所述Cas13X多肽以如下方式切割VEGFA mRNA转录物:具有与SEQ ID NO:4基本上相同(例如,至少约80%、90%、95%、99%或更多)的指导RNA特异性核酸酶活性并且基本上没有(例如,最多20%、15%、10%、5%)SEQ ID NO:4的旁切(非指导RNA依赖性)核酸酶活性。
在某些实施方式中,所述rAAV载体基因组是SEQ ID NO:17或与其具有至少95%或99%同一性的多核苷酸。在某些实施方式中,所述rAAV载体基因组是SEQ ID NO:17。
在一些实施方式中,所述rAAV载体基因组存在于载体(例如,病毒载体或噬菌体,如HSV载体、杆状病毒载体、或AAV载体)中。所述载体可以是克隆载体或表达载体。所述载体可以是质粒、噬菌粒、粘粒等。所述载体可以包括一个或多个允许所述载体在感兴趣的细胞(例如,细菌细胞、昆虫细胞或哺乳动物细胞)中繁殖的调节元件。在一些实施方式中,所述载体包括编码本文描述的CRISPR相关(Cas)***的单个组分的核酸。在一些实施方式中,所述载体包括多个核酸,每个核酸编码本文描述的CRISPR相关(Cas)***的组分。
在一个方面,本披露提供与本文描述的核酸序列具有至少50%、55%、60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%同一性的核酸序列,例如,编码如下的核酸序列(如ITR至ITR序列,例如,SEQ ID NO:17):基本上缺乏旁切活性的工程化2类VI型Cas13蛋白、衍生物、功能性片段,并且包含指导/crRNA(包括DR序列)的转录盒。
在某些实施方式中,本发明的Cas13X多核苷酸序列编码如下氨基酸序列,所述氨基酸序列与基本上缺乏旁切活性的本发明工程化2类VI型Cas13蛋白的氨基酸序列(例如,SEQ ID NO:2或3)具有至少50%、55%、60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%同一性。
在一些实施方式中,所述核酸序列具有至少一部分(例如,至少1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、20、30、40、50、60、70、80、90或100个核苷酸,例如,连续或非连续核苷酸)与本文描述的序列相同。在一些实施方式中,所述核酸序列具有至少一部分(例如,至少1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、20、30、40、50、60、70、80、90或100个核苷酸,例如,连续或非连续核苷酸)与本文描述的序列不同。
在相关的实施方式中,本发明提供如下氨基酸序列,所述氨基酸序列具有至少一部分(例如,至少1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、20、30、40、50、60、70、80、90或100个氨基酸残基,例如,连续或非连续氨基酸残基)与本文描述的序列相同。在一些实施方式中,所述氨基酸序列具有至少一部分(例如,至少1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、20、30、40、50、60、70、80、90或100个氨基酸残基,例如,连续或非连续氨基酸残基)与本文描述的序列不同。
为了确定两个氨基酸序列或两个核酸序列的同一性百分比,出于最佳比较目的对序列进行比对(例如,可以在第一和第二氨基酸或核酸序列的一者或两者中引入空位以用于最佳比对,并且出于比较目的可以忽略非同源序列)。一般来说,出于比较目的而比对的参考序列的长度应是参考序列长度的至少80%,并且在一些实施方式中是参考序列长度的至少90%、95%或100%。然后比较对应的氨基酸位置或核苷酸位置处的氨基酸残基或核苷酸。当第一序列中的位置被与第二序列中的对应位置相同的氨基酸残基或核苷酸占据时,则分子在该位置处是相同的。将空位的数量和每个空位的长度考虑在内,两个序列之间的同一性百分比是所述序列共享的相同位置的数量的函数,需要引入所述空位以进行所述两个序列的最佳比对。出于本披露的目的,序列的比较和两个序列之间同一性百分比的确定可以使用具有空位罚分12、空位延伸罚分4、以及移码空位罚分5的Blosum 62评分矩阵来完成。
本文描述的蛋白(例如,基本上缺乏旁切活性的工程化2类VI型Cas13蛋白)可以作为核酸分子或多肽递送或使用。
在某些实施方式中,编码所述工程化2类VI型Cas13蛋白(例如基本上缺乏旁切活性的那些)、其衍生物或功能性片段的核酸分子经密码子优化以在宿主细胞或生物中表达。所述宿主细胞可以包括已建立的细胞系(如HeLa、293、或293T细胞)或分离的原代细胞。所述核酸可以经密码子优化以用于在任何感兴趣的生物(特别是人细胞或细菌)中使用。例如,所述核酸可以针对以下进行密码子优化:任何原核生物(如大肠杆菌)或任何真核生物,如人和其他非人真核生物,包括酵母、蠕虫、昆虫、植物和藻类(包括粮食作物、稻、玉米、蔬菜、水果、树木、草)、脊椎动物、鱼、非人哺乳动物(例如,小鼠、大鼠、兔子、狗、鸟(如鸡)、牲畜(母牛或牛、猪、马、绵羊、山羊等)、或非人灵长类动物)。密码子使用表易于获得,例如在www.kazusa.orjp/codon/上可获得的“密码子使用数据库(Codon Usage Database)”中,并且这些表能以多种方式进行调整。参见Nakamura等人,Nucl.Acids Res.[核酸研究]28:292,2000(将所述文献通过引用以其全文并入本文)。用于密码子优化特定序列以在特定宿主细胞中表达的计算机算法也是可获得的,如基因制造(Gene Forge)(Aptagen公司;宾夕法尼亚州雅各布斯(Jacobus,Pa))。
在这种情况下,经密码子优化的序列的实例是经优化以在以下中表达的序列:真核生物,例如人(即,经优化以在人中表达),或如本文所讨论的另一真核生物、动物或哺乳动物;参见例如,WO 2014/093622(PCT/US2013/074667)中的经SaCas9人密码子优化的序列。尽管这是优选的,但应理解其他实例是可能的,并且针对人以外的宿主物种的密码子优化或针对特定器官的密码子优化是已知的。一般来说,密码子优化是指在维持天然氨基酸序列的情况下通过以下方式修饰核酸序列以增强在感兴趣的宿主细胞中的表达的方法:用该宿主细胞的基因中更频繁使用或最频繁使用的密码子替代天然序列的至少一个密码子(例如,约或超过约1、2、3、4、5、10、15、20、25、50或更多个密码子)。多种物种对特定氨基酸的某些密码子展现出特定偏倚。密码子偏倚(生物之间密码子使用的差异)通常与信使RNA(mRNA)的翻译效率相关,而所述信使RNA(mRNA)的翻译效率又被认为尤其依赖于经翻译的密码子的特性和特定的转移RNA(tRNA)分子的可获得性。选定的tRNA在细胞中的优势通常反映出肽合成中最频繁使用的密码子。相应地,可以对基因进行定制以基于密码子优化在给定生物中实现最佳基因表达。密码子使用表易于获得,例如在http://www.kazusa.orjp/codon/上可获得的“密码子使用数据库”中,并且这些表能以多种方式进行调整。参见Nakamura,Y.等人“Codon usage tabulated from the international DNA sequencedatabases:status for the year 2000[从国际DNA序列数据库中制表的密码子使用:2000年的状态]”Nucl.Acids Res.[核酸研究]28:292(2000)。用于密码子优化特定序列以在特定宿主细胞中表达的计算机算法也是可获得的,如基因制造(Aptagen公司;宾夕法尼亚州雅各布斯)也是可获得的。在一些实施方式中,编码Cas的序列中的一个或多个密码子(例如,1、2、3、4、5、10、15、20、25、50或更多个或所有密码子)对应于特定氨基酸最频繁使用的密码子。
4.RNA指导物或crRNA
在一些实施方式中,本文描述的CRISPR***包括至少RNA指导物(例如,gRNA或crRNA)。这样的指导RNA可以由编码工程化Cas13X多肽的相同AAV载体基因组编码(参见图2)。
多种RNA指导物的架构是本领域已知的(参见例如,国际公布号WO 2014/093622和WO 2015/070083,将各个文献的全部内容通过引用并入本文)。
在一些实施方式中,本文描述的CRISPR***包括多种RNA指导物(例如,一种、两种、三种、四种、五种、六种、七种、八种或更多种RNA指导物)。
在一些实施方式中,所述RNA指导物包括crRNA。在一些实施方式中,所述RNA指导物包括crRNA,但不包括tracrRNA。
来自多个CRISPR***的指导RNA的序列在本领域中通常是已知的,参见例如Grissa等人(Nucleic Acids Res.[核酸研究]35(网页服务器议题):W52-7,2007;Grissa等人,BMC Bioinformatics[BMC生物信息学]8:172,2007;Grissa等人,Nucleic Acids Res.[核酸研究]36(网页服务器议题):W145-8,2008;以及Moller和Liang,PeerJ[同行评审科学期刊]5:e3788,2017;在crispr.i2bc.paris-saclayfr/crispr/BLAST/CRISPRsBlast.php处的CRISPR数据库;以及在github.com/molleraj/MetaCRAST处可获得的MetaCRAST)。将所有文献通过引用并入本文。
在一些实施方式中,所述crRNA包括同向重复(DR)序列和间隔序列。在某些实施方式中,所述crRNA包含如下同向重复序列、基本上由其组成或由其组成,所述同向重复序列与指导序列或间隔序列(优选地在所述间隔序列的3'端处)连接。
一般来说,工程化2类VI型Cas13蛋白(例如基本上缺乏旁切活性的那些)与成熟的crRNA形成复合物,所述成熟的crRNA的间隔序列引导所述复合物与靶RNA序列特异性结合,所述靶RNA与所述间隔序列互补和/或与所述间隔序列杂交。所得的复合物包含所述工程化2类VI型Cas13蛋白(例如基本上缺乏旁切活性的那些)和与所述靶RNA结合的成熟的crRNA。
所述Cas13***的同向重复序列通常非常保守,尤其是在末端处,例如,在5'端处的Cas13e的GCTG和Cas13f的GCTGT与在3'端处的Cas13e的CAGC和Cas13f的ACAGC反向互补。这种保守表明潜在地与基因座中的一种或多种蛋白相互作用的RNA茎环结构的强碱基配对。
在一些实施方式中,当在RNA中时,同向重复序列包含5'-S1a-Ba-S2a-L-S2b-Bb-S1b-3'的一般二级结构,其中区段S1a和S1b是反向互补序列并形成第一茎(S1),所述第一茎(S1)具有在Cas13e中的4个核苷酸和在Cas13f中的5个核苷酸;区段Ba和Bb不相互碱基配对,并形成对称的或接近对称的凸起(B),并且各具有在Cas13e中的5个核苷酸、以及分别在Cas13f中的5个(Ba)和4个(Bb)或6个(Ba)和5个(Bb)核苷酸;区段S2a和S2b是反向互补序列并形成第二茎(S2),所述第二茎(S2)具有在Cas13e中的5个碱基对和在Cas13f中的6或5个碱基对;并且L是在Cas13e中的8个核苷酸的环和在Cas13f中的5个核苷酸的环。
在某些实施方式中,S1a具有在Cas13e中的GCUG序列和在Cas13f中的GCUGU序列。
在某些实施方式中,S2a具有在Cas13e中的GCCCC序列和在Cas13f中的A/G CCUCG/A序列(其中第一个A或G可以不存在)。
在一些实施方式中,所述同向重复序列包含SEQ ID NO:6的核酸序列或由其组成。
如本文所用,“同向重复序列”可指CRISPR基因座中的DNA编码序列,或指在crRNA中由其编码的RNA。因此,当在RNA分子(如crRNA)的上下文中提到任一SEQ ID NO:6时,每个T应理解为代表U。
在一些实施方式中,所述同向重复序列包含如下核酸序列或由其组成,所述核酸序列具有SEQ ID NO:6的至多1、2、3、4、5、6、7或8个核苷酸的缺失、***或取代。在一些实施方式中,所述同向重复序列包含如下核酸序列或由其组成,所述核酸序列与SEQ ID NO:6具有至少80%、85%、90%、95%或97%的序列同一性(例如,由于SEQ ID NO:6中核苷酸的缺失、***或取代)。在一些实施方式中,所述同向重复序列包含如下核酸序列或由其组成,所述核酸序列与SEQ ID NO:6中的任一者不同,但可以在严格杂交条件下与SEQ ID NO:6中的任一者的互补序列杂交,或者可以在生理条件下与SEQ ID NO:6中的任一者的互补序列结合。
在某些实施方式中,所述缺失、***或取代不改变SEQ ID NO:6的总体二级结构(例如,茎和凸起及环的相对位置和/或大小不显著偏离原始茎、凸起和环的相对位置和/或大小)。例如,所述缺失、***或取代可以在所述凸起或环区中,使得所述凸起的总体对称性大致保持相同。所述缺失、***或取代可以在所述茎中,使得所述茎的长度不显著偏离原始茎的长度(例如,在两个茎的每一个中添加或缺失一个碱基对对应于总共4个碱基变化)。
在某些实施方式中,所述缺失、***或取代导致衍生性DR序列,所述衍生性DR序列可在一个或两个茎中具有±1或2个碱基对,在所述凸起的一条或两条单链中具有±1、2或3个碱基,和/或在所述环区中具有±1、2、3或4个碱基。
在某些实施方式中,与SEQ ID NO:6中的任一者不同的任一上述同向重复序列保留在所述Cas13e蛋白中作为同向重复序列(作为SEQ ID NO:6的DR序列)发挥作用的能力。
在一些实施方式中,所述同向重复序列包含如下核酸或由其组成,所述核酸具有SEQ ID NO:6中的任一者的核酸序列,且具有初始三个、四个、五个、六个、七个或八个3'核苷酸的截短。
在经典的CRISPR***中,指导序列(例如,crRNA)与其对应的靶序列之间的互补程度可以是约50%、60%、75%、80%、85%、90%、95%、97.5%、99%或100%。在一些实施方式中,所述互补程度是90%-100%。
指导RNA的长度可以是约5、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、35、40、45、50、75、100、125、150、175、200或更多个核苷酸。例如,为了在功能性工程化Cas13e效应蛋白、或其同源物、直系同源物、衍生物、融合物、缀合物或功能性片段中使用,间隔子可以在10-60个核苷酸、20-50个核苷酸、25-45个核苷酸、25-35个核苷酸之间,或为约27、28、29、30、31、32或33个核苷酸。然而,为了在上述任一者的dCas版本中使用,间隔子可以在10-200个核苷酸、20-150个核苷酸、25-100个核苷酸、25-85个核苷酸、35-75个核苷酸、45-60个核苷酸之间,或为约46、47、48、49、50、51、52、53、54或55个核苷酸。
为了减少脱靶相互作用,例如,为了减少指导物与具有低互补性的靶序列相互作用,可以将突变引入所述CRISPR***中,使得所述CRISPR***可以区分具有大于80%、85%、90%或95%互补性的靶序列与脱靶序列。在一些实施方式中,所述互补程度为从80%至95%,例如,约83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%或95%(例如,区分具有18个核苷酸的靶标与具有1、2或3个错配的18个核苷酸的脱靶)。相应地,在一些实施方式中,指导序列与其对应的靶序列之间的互补程度大于94.5%、95%、95.5%、96%、96.5%、97%、97.5%、98%、98.5%、99%、99.5%或99.9%。在一些实施方式中,所述互补程度是100%。
本领域已知不需要完全的互补性,前提是有足够的互补性发挥作用。可以通过引入错配(例如,间隔序列与靶序列之间的一个或多个错配,如1或2个错配(包括沿着间隔子/靶标的错配的位置))来利用对切割效率的调节。错配(例如,双错配)位于越中心的位置(即,不在3'端或5'端处),切割效率受到的影响越大。相应地,通过选择沿着所述间隔序列的错配位置,可以调节切割效率。例如,如果希望靶标切割小于100%(例如,在细胞群中),可以在所述间隔序列中引入在间隔子和靶序列之间的1或2个错配。
已证明VI型CRISPR-Cas效应子采用多于一种RNA指导物,从而使这些效应子以及包括它们的***和复合物能够实现靶向多个核酸的能力。在一些实施方式中,如本文描述的包含所述工程化2类VI型Cas13蛋白(例如基本上缺乏旁切活性的那些)的CRISPR***包括多种RNA指导物(例如,两种、三种、四种、五种、六种、七种、八种、九种、十种、十五种、二十种、三十种、四十种或更多种RNA指导物)。在一些实施方式中,本文描述的CRISPR***包括单条RNA链或编码单条RNA链的核酸,其中所述RNA指导物串联排列。所述单条RNA链可以包括相同RNA指导物的多个拷贝、不同RNA指导物的多个拷贝、或其组合。本文描述的VI-E型和VI-F型CRISPR-Cas效应蛋白的加工能力使这些效应子能够靶向多个靶核酸(例如,靶RNA)而不丧失活性。在一些实施方式中,所述VI-E型和VI-F型CRISPR-Cas效应蛋白可以与针对不同靶RNA的多种RNA指导物复合进行递送。在一些实施方式中,所述工程化2类VI型Cas13蛋白(例如基本上缺乏旁切活性的那些)可以与多种RNA指导物共同递送,每种RNA指导物对不同的靶核酸具有特异性。使用CRISPR相关蛋白进行多重复合(multiplexing)的方法描述于例如美国专利号9,790,490 B2和EP 3009511 B1中,将各个文献的全部内容通过引用明确并入本文。
crRNA的间隔子长度可以在约10-50个核苷酸的范围内,如15-50个核苷酸、20-50个核苷酸、25-50个核苷酸或19-50个核苷酸。在一些实施方式中,指导RNA的间隔子长度为至少16个核苷酸、至少17个核苷酸、至少18个核苷酸、至少19个核苷酸、至少20个核苷酸、至少21个核苷酸、或至少22个核苷酸。在一些实施方式中,所述间隔子长度为从15至17个核苷酸(例如,15、16或17个核苷酸)、从17至20个核苷酸(例如,17、18、19或20个核苷酸)、从20至24个核苷酸(例如,20、21、22、23或24个核苷酸)、从23至25个核苷酸(例如,23、24或25个核苷酸)、从24至27个核苷酸、从27至30个核苷酸、从30至45个核苷酸(例如,30、31、32、33、34、35、36、37、38、39、40、41、42、43、44或45个核苷酸)、从30或35至40个核苷酸、从41至45个核苷酸、从45至50个核苷酸(例如,45、46、47、48、49或50个核苷酸)或更长。在一些实施方式中,所述间隔子长度为从约15至约42个核苷酸。
在一些实施方式中,所述指导RNA的同向重复序列长度为15-36个核苷酸、为至少16个核苷酸、为从16至20个核苷酸(例如,16、17、18、19或20个核苷酸)、为20-30个核苷酸(例如,20、21、22、23、24、25、26、27、28、29或30个核苷酸)、为30-40个核苷酸(例如,30、31、32、33、34、35、36、37、38、39或40个核苷酸)、或为约36个核苷酸(例如,33、34、35、36、37、38或39个核苷酸)。在一些实施方式中,所述指导RNA的同向重复序列长度为36个核苷酸。
在一些实施方式中,所述crRNA/指导RNA的总体长度比上文任一间隔序列长度长约36个核苷酸。例如,所述crRNA/指导RNA的总体长度可以在45-86个核苷酸、或60-86个核苷酸、62-86个核苷酸、或63-86个核苷酸之间。
所述crRNA序列可以按以下方式修饰:允许在所述crRNA与所述工程化2类VI型Cas13蛋白(例如基本上缺乏旁切活性的那些)之间形成复合物并与靶标成功结合,同时不允许成功的核酸酶活性(即,没有核酸酶活性/没有导致***缺失)。这些经修饰的指导序列称为“死crRNA”、“死指导物”或“死指导序列”。关于核酸酶活性,这些死指导物或死指导序列可以是无催化活性的或无构象活性的。死指导序列典型地比导致活性RNA切割的相应指导序列短。在一些实施方式中,死指导物比具有核酸酶活性的相应指导RNA短5%、10%、20%、30%、40%或50%。指导RNA的死指导序列的长度可以为从13至15个核苷酸(例如,长度为13、14或15个核苷酸)、长度为从15至19个核苷酸、或长度为从17至18个核苷酸(例如,长度为17个核苷酸)。
在一些实施方式中,指导RNA包含SEQ ID NO:7和/或8。
因此,在一个方面,本披露提供非天然存在的或工程化CRISPR***,所述CRISPR***包括如本文描述的功能性工程化2类VI型Cas13蛋白(例如基本上缺乏旁切活性的那些)和crRNA,其中所述crRNA包含死crRNA序列,由此所述crRNA能够与靶序列杂交,使得将所述CRISPR***引导至细胞中的感兴趣的靶RNA而没有可检测的核酸酶活性(例如,RNA酶活性)。
对死指导物的详细描述例如在国际公布号WO 2016/094872中进行描述,将所述文献通过引用以其全文并入本文。
可以生成作为诱导型***的组分的指导RNA(例如,crRNA)。所述***的诱导型性质允许对基因编辑或基因表达进行时空控制。在一些实施方式中,用于所述诱导型***的刺激包括例如电磁辐射、声能、化学能和/或热能。
在一些实施方式中,指导RNA(例如,crRNA)的转录可以通过诱导型启动子,例如四环素或强力霉素控制的转录激活(Tet-开和Tet-关表达***)、激素诱导型基因表达***(例如,蜕皮素诱导型基因表达***)和***糖诱导型基因表达***来调节。诱导型***的其他实例包括例如小分子双杂交转录激活***(FKBP、ABA等)、光诱导型***(光敏色素、LOV结构域或隐花色素)或光诱导型转录效应子(LITE)。这些诱导型***描述于例如WO2016205764和美国专利号8,795,965中,将所述两个文献通过引用以其全文并入本文。
可以优化本文描述的RNA指导物(例如,crRNA)的序列和长度。在一些实施方式中,RNA指导物的优化长度可以通过识别crRNA的加工形式(即,成熟的crRNA)或通过对crRNA四环的经验长度研究来确定。
所述crRNA还可以包括一个或多个适配序列。适配子是具有特定的三维结构并可以与特定的靶分子结合的寡核苷酸或肽分子。所述适配子可以对基因效应子、基因激活子或基因阻遏子具有特异性。在一些实施方式中,所述适配子可以对蛋白具有特异性,而所述蛋白又对特定的基因效应子、基因激活子或基因阻遏子具有特异性并对其进行募集和/或与其结合。所述效应子、激活子或阻遏子能够以融合蛋白的形式存在。在一些实施方式中,所述指导RNA具有对相同的衔接蛋白具有特异性的两个或更多个适配序列。在一些实施方式中,所述两个或更多个适配序列对不同的衔接蛋白具有特异性。所述衔接蛋白可以包括例如MS2、PP7、Qβ、F2、GA、fr、JP501、M12、R17、BZ13、JP34、JP500、KU1、M11、MX1、TW18、VK、SP、FI、ID2、NL95、TW19、AP205、φkCb5、φkCb8r、φkCb12r、φkCb23r、7s和PRR1。相应地,在一些实施方式中,所述适配子选自特异性结合如本文描述的任一种衔接蛋白的结合蛋白。在一些实施方式中,所述适配序列是MS2结合环(5’-ggcccAACAUGAGGAUCACCCAUGUCUGCAGgggcc-3’(SEQ ID NO:70))。在一些实施方式中,所述适配序列是Qβ结合环(5’-ggcccAUGCUGUCUAAGACAGCAUgggcc-3’(SEQ ID NO:71))。在一些实施方式中,所述适配序列是PP7结合环(5’-ggcccUAAGGGUUUAUAUGGAAACCCUUAgggcc-3’(SEQ ID NO:72))。对适配子的详细描述可见于例如Nowak等人,“Guide RNA engineering for versatile Cas9functionality[针对多种Cas9功能的指导RNA工程化],”Nucl.Acid.Res.[核酸研究],44(20):9555-9564,2016;和WO 2016205764中,将所述文献通过引用以其全文并入本文。
本发明还涵盖用于递送多种核酸组分的方法,其中每种核酸组分对不同的感兴趣的靶基因座具有特异性,从而修饰多种感兴趣的靶基因座(例如,可以在本发明的构建体中采用两个不同的sgRNA,每个sgRNA靶向相同VEGFA mRNA内的不同靶序列)。复合物的核酸组分可以包含一个或多个蛋白结合RNA适配子。所述一个或多个适配子能够结合噬菌体外壳蛋白。所述噬菌体外壳蛋白可以选自Qβ、F2、GA、fr、JP501、MS2、M12、R17、BZ13、JP34、JP500、KU1、M11、MX1、TW18、VK、SP、FI、ID2、NL95、TW19、AP205、φCb5、φCb8r、φCb12r、φCb23r、7s和PRR1。在某些实施方式中,所述噬菌体外壳蛋白是MS2。
5.靶RNA
所述靶RNA可以是任何感兴趣的RNA分子,包括天然存在的和工程化RNA分子。所述靶RNA可以是mRNA、tRNA、核糖体RNA(rRNA)、微小RNA(miRNA)、干扰RNA(siRNA)、核酶、核糖开关、卫星RNA、微开关、微酶(microzyme)或病毒RNA。
在一些实施方式中,所述靶核酸与病症或疾病(例如,感染性疾病或癌症)相关。
在某些实施方式中,所述靶核酸是编码VEGFA(如人VEGFA)的mRNA。
在某些实施方式中,所述VEGFA mRNA靶标是17种已知的转录物或同种型中的任一种,所述转录物或同种型通过可变启动子的使用、可变剪接和/或可变启动产生。
在某些实施方式中,所述VEGFA mRNA靶标是具有以下RefSeq编号中的任一种靶标:NM_001025366.2[P15692-14]、NM_001025367.2[P15692-16]、NM_001025368.2[P15692-11]、NM_001025369.2[P15692-17]、NM_001025370.2[P15692-12]、NM_001033756.2[P15692-15]、NM_001171622.1[P15692-18]、NM_001171623.1[P15692-1]、NM_001171624.1[P15692-2]、NM_001171625.1[P15692-3]、NM_001171626.1[P15692-4]、NM_001171627.1[P15692-5]、NM_001171628.1[P15692-9]、NM_001171629.1[P15692-8]、NM_001171630.1[P15692-10]、NM_001204384.1[P15692-6]、NM_001204385.1NM_001287044.1、NM_001317010.1、NM_003376.5[P15692-13]。将所有核苷酸序列通过引用并入本文。
因此,在一些实施方式中,本文描述的***可用于通过靶向这些核酸(例如,VEGFA)来治疗病症或疾病(如湿性AMD)。例如,与病症或疾病相关的靶核酸可以是在患病细胞(例如,湿性AMD患者的眼睛中的患病细胞)中过表达的RNA分子。所述靶核酸也可以是毒性RNA和/或突变的RNA(例如,具有剪接缺陷或突变的mRNA分子)。所述靶核酸还可以是对特定微生物(例如,致病性细菌)具有特异性的RNA。
6.复合物和细胞
本发明的一个方面提供工程化2类VI型Cas13蛋白(例如基本上缺乏旁切活性的那些)的复合物(如CRISPR/Cas13e复合物),所述复合物包含(1)工程化2类VI型Cas13蛋白,例如基本上缺乏旁切活性的那些(例如,如本文描述的工程化Cas13e效应蛋白、其同源物、直系同源物、融合物、衍生物、缀合物、或功能性片段)中的任一者,和(2)本文描述的任一指导RNA,每个指导RNA包括设计为与靶RNA至少部分互补的间隔序列和与以下相容的DR序列:所述工程化2类VI型Cas13蛋白,例如基本上缺乏旁切活性的那些(例如,Cas13e效应蛋白)、其同源物、直系同源物、融合物、衍生物、缀合物、或功能性片段。
在某些实施方式中,所述复合物进一步包含所述指导RNA结合的靶RNA(如VEGFAmRNA)。
在相关方面,本发明还提供细胞,所述细胞包含本发明的任一复合物。在某些实施方式中,所述细胞是原核生物。在某些实施方式中,所述细胞是真核生物。
7.治疗性应用
本文描述的CRISPR***可以具有多种治疗性应用。这样的应用可基于本发明工程化Cas13(例如,工程化CRISPR/Cas13e或Cas13f***)的以下一种或多种体外和体内能力。
在一些实施方式中,新的工程化CRISPR***可用于治疗各种疾病和障碍,例如遗传障碍(例如,单基因疾病)、可通过核酸酶活性(例如,Pcsk9靶向、杜氏肌营养不良(DMD)、BCL11a靶向)治疗的疾病、以及多种癌症等。
在一些实施方式中,本文描述的CRISPR***可用于编辑靶核酸以修饰所述靶核酸(例如,通过***、缺失或突变一个或多个核酸残基)。
在一个方面,本文描述的CRISPR***可用于治疗由RNA、毒性RNA和/或突变RNA(例如,剪接缺陷或截短)的过表达引起的疾病。例如,毒性RNA的表达可以与核包涵体的形成以及脑、心脏或骨骼肌的迟发型退行性变化相关。在一些实施方式中,所述障碍是强直性肌营养不良。在强直性肌营养不良中,所述毒性RNA的主要致病作用是隔离(sequester)结合蛋白并损害可变剪接的调节(参见例如,Osborne等人,“RNA-dominant diseases[RNA显性疾病],”Hum.Mol.Genet.[人类分子遗传学],2009年4月15日;18(8):1471-81)。遗传学家对强直性肌营养不良(营养不良性肌强直(DM))特别感兴趣,因为它产生极其广泛的临床特征。DM的经典形式(现在称为1型DM(DM1))由编码细胞溶质蛋白激酶的基因DMPK的3'-非翻译区(UTR)中CTG重复序列的扩增引起。如本文描述的CRISPR***可以靶向过表达的RNA或毒性RNA,例如DMPK基因或DM1骨骼肌、心脏或脑中的任一错误调节的可变剪接。
本文描述的CRISPR***还可以靶向影响RNA依赖性功能的反式作用突变,所述突变导致多种疾病,例如像普瑞德威利综合征、脊髓性肌萎缩(SMA)和先天性角化不良。可以使用本文描述的CRISPR***治疗的疾病列表汇总于Cooper等人,“RNA and disease[RNA和疾病],”Cell[细胞],136.4(2009):777-793和WO 2016/205764 A1中,将所述两个文献通过引用以全文并入本文。本领域的技术人员将理解如何使用新的CRISPR***治疗这些疾病。
本文描述的CRISPR***还可用于治疗各种tau蛋白病,包括例如原发性和继发性tau蛋白病,如原发性年龄相关性tau蛋白病(PART)/神经原纤维缠结(NFT)优势型老年性痴呆(其中NFT类似于在阿尔茨海默病(AD)中见到的那些,但没有斑块)、拳击性痴呆(慢性创伤性脑病)和进行性核上性麻痹。tau蛋白病的可用列表和治疗这些疾病的方法描述于例如WO 2016205764中,将所述文献通过引用以其全文并入本文。
本文描述的CRISPR***还可用于靶向破坏顺式作用剪接代码的突变,所述突变可导致剪接缺陷和疾病。这些疾病包括例如,由SMN1基因的缺失导致的运动神经元退行性疾病(例如,脊髓性肌萎缩)、杜氏肌营养不良(DMD)、17号染色体相关的额颞叶痴呆合并帕金森综合征(FTDP-17)、以及囊性纤维化。
本文描述的CRISPR***可进一步用于抗病毒活性,特别是抗RNA病毒。所述CRISPR相关蛋白可以使用经选择以靶向病毒RNA序列的合适的指导RNA来靶向病毒RNA。
本文描述的CRISPR***还可用于在受试者(例如,人受试者)中治疗癌症。例如,本文描述的CRISPR相关蛋白可以用靶向RNA分子的crRNA编程,所述RNA分子是异常的(例如,包含点突变或者经可变剪接)并见于癌细胞中,以诱导癌细胞中的细胞死亡(例如,经由细胞凋亡)。
本文描述的CRISPR***还可用于在受试者(例如,人受试者)中治疗自身免疫疾病或障碍。例如,本文描述的CRISPR相关蛋白可以用靶向RNA分子的crRNA编程,所述RNA分子是异常的(例如,包含点突变或者经可变剪接)并见于负责引起自身免疫疾病或障碍的细胞中。
此外,本文描述的CRISPR***还可用于在受试者中治疗感染性疾病。例如,本文描述的CRISPR相关蛋白可以用靶向RNA分子的crRNA编程,所述RNA分子由感染原(例如,细菌、病毒、寄生物或原生动物)表达,以靶向并诱导感染原细胞中的细胞死亡。所述CRISPR***还可用于治疗细胞内感染原感染宿主受试者细胞的疾病。通过对所述CRISPR相关蛋白进行编程以靶向由感染原基因编码的RNA分子,可以靶向受感染原感染的细胞并诱导细胞死亡。
此外,体外RNA感应测定可用于检测特定RNA底物。所述CRISPR相关蛋白可用于活细胞中基于RNA的感应。应用的实例是通过感应例如疾病特异性RNA进行的诊断。
本文描述的CRISPR***的治疗性应用的详细描述可见于例如美国专利号8,795,965、EP 3009511、WO 2016205764和WO 2017070605中;将各个文献通过引用以其全文并入本文。
在某些实施方式中,本发明的方法可用于治疗眼睛疾病或障碍。在一些实施方式中,所述眼睛疾病或障碍是阿米巴角膜炎、真菌性角膜炎、细菌性角膜炎、病毒性角膜炎、盘尾丝虫性角膜炎、角膜结膜炎、细菌性角膜结膜炎、病毒性角膜结膜炎、春季角膜结膜炎、特应性角膜结膜炎、角膜营养不良性疾病、富克斯内皮营养不良、干燥综合征、史-约综合征、自身免疫性干眼病、环境性干眼病、角膜新生血管形成疾病、角膜移植后排斥反应的预防和治疗、自身免疫性葡萄膜炎、感染性葡萄膜炎、非感染性葡萄膜炎、前葡萄膜炎、后葡萄膜炎(包括弓形虫病)、泛葡萄膜炎、玻璃体或视网膜的炎性疾病、眼内炎的预防和治疗、黄斑水肿、黄斑变性、湿性年龄相关性黄斑变性(湿性AMD)、干性年龄相关性黄斑变性(干性AMD)、糖尿病性黄斑水肿(DME)、过敏性结膜炎、增殖性和非增殖性糖尿病性视网膜病变、高血压性视网膜病变、视网膜的自身免疫性疾病、原发性和转移性眼内黑素瘤、其他眼内转移性肿瘤、开角型青光眼、斯特格氏病、眼底黄色斑点症、闭角型青光眼、色素性青光眼、视网膜色素变性(RP)、莱伯氏先天性黑矇(LCA)、厄舍综合征、无脉络膜、视杆-视锥细胞或视锥-视杆细胞营养不良、纤毛病、线粒体障碍、进行性视网膜萎缩、退行性视网膜疾病、地图状萎缩、家族性或获得性黄斑病变、视网膜光感受器疾病、基于视网膜色素上皮的疾病、黄斑囊样水肿、视网膜脱离、外伤性视网膜损伤、医源性视网膜损伤、黄斑裂孔、黄斑毛细血管扩张、神经节细胞疾病、视神经细胞疾病、视神经病变、缺血性视网膜疾病、早产儿视网膜病变、视网膜血管阻塞、家族性大动脉瘤、视网膜血管疾病、眼血管疾病、血管疾病、缺血性视神经病变疾病、糖尿病性视网膜水肿、由视网膜下新生血管形成引起的老年性黄斑变性、近视性视网膜病变、视网膜缺血、脉络膜血管功能不全、脉络膜血栓形成和由颈动脉缺血引起的新生血管性视网膜病变、角膜新生血管形成、伴有渗出性或炎性组分的角膜疾病或混浊、弥漫性板层角膜炎、由于眼睛穿透伤或挫伤性眼损伤导致的新生血管形成、红斑虹膜炎、富克斯异色性虹膜睫状体炎、慢性葡萄膜炎、前葡萄膜炎、由手术如LASIK、LASEK、屈光手术、IOL植入引起的炎性病症;作为白内障手术并发症的不可逆角膜水肿、损伤或外伤引起的水肿、炎症、感染性和非感染性结膜炎、虹膜睫状体炎、虹膜炎、巩膜炎、巩膜外层炎、浅表点状角膜炎、圆锥角膜、后部多形性营养不良、富克斯营养不良、无晶状体性和假晶状体性大泡性角膜病变、角膜水肿、巩膜疾病、眼瘢痕性类天疱疮、睫状体扁平部炎、青光眼睫状体炎综合征、白塞病、福格特-小柳-原田综合征、超敏性反应、眼表障碍、结膜水肿、弓形虫病脉络膜视网膜炎、眼眶炎性假瘤、球结膜水肿、结膜静脉充血、眶周蜂窝组织炎、急性泪囊炎、非特异性血管炎、结节病、巨细胞病毒感染、及其组合。在某些实施方式中,所述眼睛疾病或障碍是年龄相关性黄斑变性。在一些实施方式中,所述眼睛疾病或障碍是湿性年龄相关性黄斑变性(湿性AMD)或干性年龄相关性黄斑变性(干性AMD)。在一些实施方式中,所述眼睛疾病或障碍是湿性年龄相关性黄斑变性(湿性AMD)。
在某些实施方式中,本发明的方法可用于治疗神经退行性疾病或障碍。在一些实施方式中,所述神经退行性疾病或障碍是酒精中毒、亚历山大病、阿尔珀斯病、阿尔茨海默病、肌萎缩侧索硬化(ALS)、共济失调毛细血管扩张症、神经元蜡样质脂褐质沉积症、巴滕病、牛海绵状脑病(BSE)、卡纳万病、脑性瘫痪、科凯恩综合征、皮质基底节变性、克罗伊茨费尔特-雅各布病、额颞叶变性、亨廷顿病、HIV相关性痴呆、肯尼迪病、路易体痴呆、神经疏螺旋体病、原发性年龄相关性tau蛋白病(PART)/神经原纤维缠结优势型老年性痴呆、马查多-约瑟夫病、多***萎缩、多发性硬化、多发性硫酸酯酶缺乏症、粘脂贮积病、发作性睡病、尼曼皮克病、帕金森病、皮克病、庞贝病、原发性侧索硬化、朊病毒病、神经元丧失、认知缺陷、运动神经元疾病、杜氏肌营养不良(DMD)、额颞叶痴呆、17号染色体相关的额颞叶痴呆合并帕金森综合征、Lytico-Bodig病(关岛帕金森-痴呆复合征)、神经轴索营养不良、雷夫叙姆病、希德氏病、继发于恶性贫血的亚急性脊髓联合变性、斯皮尔梅伊尔-沃格特-肖格伦-巴滕病、17号染色体相关的帕金森综合征(FTDP-17)、普瑞德威利综合征、强直性肌营养不良、慢性创伤性脑病包括拳击性痴呆、脊髓小脑性共济失调、脊髓性肌萎缩、斯蒂尔-理查森-奥尔谢夫斯基病、脊髓痨、C型尼曼皮克病(NPC1和/或NPC2缺陷)、史-莱-奥综合征(SLOS)、先天性胆固醇合成障碍、丹吉尔病、佩利措伊斯-梅茨巴赫病、神经元蜡样质脂褐质沉积症、原发性鞘糖脂沉积症、法伯病或多发性硫酸酯酶缺乏症、戈谢病、法布里病、GM1神经节苷脂沉积症、GM2神经节苷脂沉积症、克拉伯病、异染性脑白质营养不良(MLD)、NPC、GM1神经节苷脂沉积症、法布里病、神经退行性粘多糖贮积症、MPS I、MPS IH、MPS IS、MPS II、MPS III、MPSIIIA、MPS IIIB、MPS IIIC、MPS HID、MPS、IV、MPS IV A、MPS IV B、MPS VI、MPS VII、MPSIX、继发性溶酶体受累疾病、SLOS、丹吉尔病、神经节细胞胶质瘤、神经节细胞瘤、脑膜血管瘤病、脑炎后帕金森综合征、亚急性硬化性全脑炎、铅中毒性脑病、结节性硬化、哈勒沃登-施帕茨病、脂褐质沉积症、小脑性共济失调、帕金森综合征、路-巴综合征、多***萎缩、额颞叶痴呆或下肢帕金森综合征、尼曼皮克病、C型尼曼皮克病、A型尼曼皮克病、泰-萨克斯病、小脑型多***性萎缩(MSA-C)、伴有帕金森综合征的额颞叶痴呆、进行性核上性麻痹、小脑下跳性眼震、桑霍夫病或II型粘脂沉积症、或其组合。
在一些实施方式中,所述神经退行性疾病或障碍是阿尔茨海默病、肌萎缩侧索硬化(ALS)、共济失调毛细血管扩张症、脑性瘫痪、科凯恩综合征、皮质基底节变性、克罗伊茨费尔特-雅各布病、额颞叶变性、亨廷顿病、路易体痴呆、多发性硬化、帕金森病、皮克病、庞贝病、杜氏肌营养不良(DMD)、普瑞德威利综合征、脊髓性肌萎缩、或其组合。
在某些实施方式中,本发明的方法可用于治疗癌症。如本文所用,“癌症”是指所有类型的癌症或赘生物或恶性肿瘤,包括白血病、癌和肉瘤,无论是新发的还是复发的。癌症的特定实例是:癌、肉瘤、骨髓瘤、白血病、淋巴瘤和混合型肿瘤。可以通过本文描述的方法和组合物治疗的癌症的非限制性实例包括来自以下的癌细胞:膀胱、血液、骨、骨髓、脑、乳腺、结肠、食道、胃肠道、牙龈、头、肾、肝、肺、鼻咽、颈、卵巢、***、皮肤、胃、睾丸、舌、或子宫。此外,所述癌症可以特别地属于以下组织学类型,但不限于这些:恶性赘生物;癌;未分化的癌;巨细胞癌和梭形细胞癌;小细胞癌;***状癌;鳞状细胞癌;淋巴上皮癌;基底细胞癌;毛母质癌;移行细胞癌;***状移行细胞癌;腺癌;恶性胃泌素瘤;胆管癌;肝细胞癌;混合型肝细胞癌和胆管癌;小梁腺癌;腺样囊性癌;腺瘤性息肉中的腺癌;家族性结肠息肉病性腺癌;实体癌;恶性类癌肿瘤;细支气管-肺泡腺癌;***状腺癌;嫌色细胞癌;嗜酸细胞癌;嗜酸性腺癌;嗜碱细胞癌;透明细胞腺癌;颗粒细胞癌;滤泡状腺癌;***状和滤泡状腺癌;非包裹性硬化型癌;肾上腺皮质癌;子宫内膜样癌;皮肤附件癌;大汗腺癌;皮脂腺癌;耵聍腺癌;粘液表皮样癌;囊腺癌;***状囊腺癌;***状浆液性囊腺癌;粘液性囊腺癌;粘液性腺癌;印戒细胞癌;浸润性导管癌;髓样癌;小叶癌;炎性癌;乳腺佩吉特病;腺泡细胞癌;腺鳞癌;腺癌伴鳞状化生;恶性胸腺瘤;恶性卵巢间质瘤;恶性卵泡膜细胞瘤;恶性颗粒细胞瘤;和恶性成纤维细胞瘤;支持细胞癌;恶性***细胞瘤;恶性脂质细胞瘤;恶性副神经节瘤;恶性乳腺外副神经节瘤;嗜铬细胞瘤;血管球肉瘤;恶性黑素瘤;无黑素性黑素瘤;浅表扩散性黑素瘤;巨大色素痣中的恶性黑素瘤;上皮样细胞黑素瘤;恶性蓝痣;肉瘤;纤维肉瘤;恶性纤维组织细胞瘤;粘液肉瘤;脂质肉瘤;平滑肌肉瘤;横纹肌肉瘤;胚胎性横纹肌肉瘤;肺泡横纹肌肉瘤;间质肉瘤;恶性混合瘤;苗勒管混合瘤;肾母细胞瘤;肝母细胞瘤;癌肉瘤;恶性间叶瘤;恶性布伦纳瘤;恶性叶状瘤;滑膜肉瘤;恶性间皮瘤;无性细胞瘤;胚胎癌;恶性畸胎瘤;恶性卵巢甲状腺肿;绒毛膜癌;恶性中肾瘤;血管肉瘤;恶性血管内皮瘤;卡波西肉瘤;恶性血管外皮细胞瘤;***肉瘤;骨肉瘤;骨旁骨肉瘤;软骨肉瘤;恶性软骨母细胞瘤;间叶性软骨肉瘤;骨巨细胞瘤;尤因肉瘤;恶性牙源性肿瘤;成釉细胞牙肉瘤;恶性成釉细胞瘤;成釉细胞纤维肉瘤;恶性松果体瘤;脊索瘤;恶性胶质瘤;室管膜瘤;星形细胞瘤;原生质星形细胞瘤;纤维型星形细胞瘤;星形母细胞瘤;胶质母细胞瘤;少突神经胶质瘤;成少突神经胶质细胞瘤;原始神经外胚瘤;小脑肉瘤;神经节神经母细胞瘤;成神经细胞瘤;视网膜母细胞瘤;嗅觉神经源性肿瘤;恶性脑膜瘤;神经纤维肉瘤;恶性神经鞘瘤;恶性颗粒细胞瘤;恶性淋巴瘤;霍奇金病;霍奇金淋巴瘤;副肉芽肿;小淋巴细胞性恶性淋巴瘤;弥漫性大细胞性恶性淋巴瘤;滤泡性恶性淋巴瘤;蕈样肉芽肿;其他指定的非霍奇金淋巴瘤;恶性组织细胞增生症;多发性骨髓瘤;肥大细胞肉瘤;免疫增殖性小肠疾病;白血病;淋巴样白血病;浆细胞白血病;红白血病;淋巴肉瘤细胞白血病;髓性白血病;嗜碱性粒细胞白血病;嗜酸性粒细胞白血病;单核细胞白血病;肥大细胞白血病;巨核细胞白血病;髓性肉瘤;浆细胞瘤、结直肠癌、直肠癌、和毛细胞白血病。
白血病的非限制性实例包括急性非淋巴细胞白血病、慢性淋巴细胞白血病、急性粒细胞白血病、慢性粒细胞白血病、急性早幼粒细胞白血病、成人T细胞白血病、白血性白血病、白细胞增多性白血病、嗜碱性粒细胞白血病、母细胞白血病、牛白血病、慢性髓细胞白血病、皮肤白血病、干细胞性白血病、嗜酸性粒细胞白血病、格罗斯白血病、里德尔细胞白血病、希林氏性白血病、干细胞白血病、亚白血性白血病、未分化细胞白血病、毛细胞白血病、血母细胞白血病、血母细胞性白血病、组织细胞白血病、干细胞白血病、急性单核细胞白血病、白细胞减少性白血病、淋巴性白血病、淋巴母细胞白血病、淋巴细胞白血病、淋巴源性白血病、淋巴样白血病、淋巴肉瘤细胞白血病、肥大细胞白血病、巨核细胞白血病、小原粒型白血病(micromyeloblastic leukemia)、单核细胞白血病、成髓细胞性白血病、髓细胞性白血病、骨髓性粒细胞性白血病、髓单核细胞白血病、内格利白血病、浆细胞白血病、浆细胞性白血病、和早幼粒细胞白血病。
癌的非限制性示例性类型包括腺泡癌、腺泡状癌、囊性腺样癌、腺样囊性癌、腺癌(carcinoma adenomatosum)、肾上腺皮质癌、肺泡癌、肺泡细胞癌、基底细胞癌(basal cellcarcinoma)、基底细胞癌(carcinoma basocellulare)、基底样癌、基底鳞状细胞癌、细支气管肺泡癌、细支气管癌、支气管源性癌、脑样癌、胆管细胞癌、绒毛膜癌、胶样癌、粉刺性癌、子宫体癌、筛状癌、铠甲状癌、皮肤癌、柱状癌、柱状细胞癌、导管癌、硬癌(carcinomadurum)、胚胎癌、脑样癌、表皮样癌、腺样上皮癌、外生性癌、溃疡性癌、纤维癌、明胶样癌、胶状癌、巨细胞癌(giant cell carcinoma)、印戒细胞癌、单纯癌、小细胞癌、马铃薯状癌、球形细胞癌、梭形细胞癌、海绵状细胞癌、鳞状癌、鳞状细胞癌、弦状癌(string carcinoma)、毛细血管扩张癌、毛细血管扩张性癌、移行细胞癌、结节性皮癌(carcinoma tuberosum)、结节性皮癌(tuberous carcinoma)、疣状癌、绒毛癌、巨细胞癌(carcinomagigantocellulare)、腺癌(glandular carcinoma)、颗粒细胞癌、毛基质癌、血样癌、肝细胞癌、许特莱细胞癌、透明样癌、高肾样癌、婴儿胚胎癌、原位癌、表皮内癌、上皮内癌、克龙派切尔癌(Krompecher's carcinoma)、库尔奇茨基细胞癌、大细胞癌、豆状细胞癌(lenticular carcinoma)、豆状细胞癌(carcinoma lenticulare)、脂瘤样癌、淋巴上皮癌、髓样癌(carcinoma medullare)、髓样癌(medullary carcinoma)、黑素癌、痣癌、粘液癌(mucinous carcinoma)、粘液癌(carcinoma muciparum)、粘液细胞癌、粘液表皮样癌、粘液癌(carcinoma mucosum)、粘液癌(mucous carcinoma)、粘液瘤样癌、鼻咽癌、燕麦细胞癌、骨化癌、类骨质癌、***状癌、门静脉周围癌、浸润前癌、刺细胞癌、浆状癌、肾的肾细胞癌、储备细胞癌、肉瘤癌、施耐德氏癌、硬癌(scirrhous carcinoma)、梅克尔细胞癌、唾液腺癌和阴囊癌。
肉瘤包括但不限于软骨肉瘤、纤维肉瘤、淋巴肉瘤、黑素肉瘤、粘液肉瘤、骨肉瘤、子宫内膜肉瘤、间质肉瘤、尤因肉瘤、筋膜肉瘤、成纤维细胞肉瘤、巨细胞肉瘤、阿贝美西肉瘤(Abemethy's sarcoma)、脂肪肉瘤、脂质肉瘤、肺泡软部肉瘤、成釉细胞肉瘤、葡萄状肉瘤、绿肉瘤、绒毛膜癌、胚胎肉瘤、威尔姆斯肿瘤肉瘤、粒细胞肉瘤、霍奇金肉瘤、特发性多发性色素性出血性肉瘤、B细胞免疫母细胞肉瘤、淋巴瘤、T细胞免疫母细胞肉瘤、詹恩逊氏肉瘤、卡波西肉瘤、库普弗细胞肉瘤、血管肉瘤、白血病性肉瘤、恶性间充质肉瘤、骨膜外肉瘤、网状细胞肉瘤、劳斯肉瘤、浆液囊性肉瘤、滑膜肉瘤、和毛细血管扩张肉瘤。
黑素瘤的非限制性实例是哈-帕二氏黑素瘤、幼年黑素瘤、恶性雀斑样黑素瘤、恶性黑素瘤、肢端雀斑样痣黑素瘤、无黑素性黑素瘤、良性幼年黑素瘤、克劳德曼黑素瘤、S91黑素瘤、结节性黑素瘤甲下黑素瘤、和浅表扩散性黑素瘤。
在某些实施方式中,本发明的方法可用于将本文描述的CRISPR***引入细胞中,并引起所述细胞和/或其后代改变一种或多种细胞产物(如生长因子(如VEGFA)、抗体、淀粉、乙醇、或任何其他所希望的产物)的产生。这样的细胞及其后代在本发明的范围内。
在某些实施方式中,本文描述的方法和/或CRISPR***导致细胞的一种或多种RNA产物的翻译和/或转录的修饰。例如,所述修饰可导致RNA产物的转录/翻译/表达增加。在其他实施方式中,所述修饰可导致RNA产物的转录/翻译/表达降低。
在某些实施方式中,所述细胞是原核细胞。
在某些实施方式中,所述细胞是真核细胞,如哺乳动物细胞,包括人细胞(原代人细胞或已建立的人细胞系)。在某些实施方式中,所述细胞是非人哺乳动物细胞,如来自非人灵长类动物(例如,猴)、母牛/公牛/牛、绵羊、山羊、猪、马、狗、猫、啮齿动物(如兔子、小鼠、大鼠、仓鼠等)的细胞。在某些实施方式中,所述细胞来自鱼(如鲑鱼)、鸟(如禽鸟,包括鸡、鸭、鹅)、爬行动物、贝类(例如,牡蛎、蛤蜊、龙虾、对虾)、昆虫、蠕虫、酵母等在某些实施方式中,所述细胞来自植物,如单子叶植物或双子叶植物。在某些实施方式中,所述植物是粮食作物,如大麦、木薯、棉花、落花生或花生、玉蜀黍、小米、油棕果、马铃薯、干豆、油菜籽或低芥酸菜籽(canola)、稻、黑麦、高粱、大豆、甘蔗、甜菜、向日葵和小麦。在某些实施方式中,所述植物是谷类(大麦、玉蜀黍、小米、稻、黑麦、高粱和小麦)。在某些实施方式中,所述植物是块茎(木薯和马铃薯)。在某些实施方式中,所述植物是糖料作物(甜菜和甘蔗)。在某些实施方式中,所述植物是含油作物(大豆、落花生或花生、油菜籽或低芥酸菜籽、向日葵和油棕果)。在某些实施方式中,所述植物是纤维作物(棉花)。在某些实施方式中,所述植物是树木(如桃树或油桃树、苹果树或梨树、坚果树(如杏仁树或核桃树或开心果树)、或柑橘树(例如,橙树、葡萄柚树或柠檬树))、草、蔬菜、水果或藻类。在某些实施方式中,所述植物是茄属植物;芸苔属(Brassica)植物;莴苣属(Lactuca)植物;菠菜属(Spinacia)植物;辣椒属(Capsicum)植物;棉花、烟草、芦笋、胡萝卜、卷心菜、西兰花、花椰菜、番茄、茄子、胡椒、生菜、菠菜、草莓、蓝莓、覆盆子、黑莓、葡萄、咖啡、可可等。
相关方面提供使用本文描述的CRISPR***通过本发明的方法修饰的细胞或其后代。
在某些实施方式中,所述细胞在体外、在体内或离体进行修饰。在某些实施方式中,所述细胞是干细胞。
8.递送
通过本披露和本领域的知识,本文描述的CRISPR***或本文描述的其任一组分(Cas13蛋白、其衍生物、功能性片段或各种融合物或加合物,以及指导RNA/crRNA)、其核酸分子、和/或编码或提供其组分的核酸分子可以通过各种递送***(如载体,例如质粒和病毒递送载体)使用本领域中任何合适的手段递送,所述CRISPR***包含工程化2类VI型Cas13蛋白,例如基本上缺乏旁切活性的那些(如Cas13e或Cas13f,例如,Cas13X.1)。这样的方法包括(但不限于)电穿孔、脂质转染、显微注射、转染、超声、基因枪等。
在某些实施方式中,所述CRISPR相关蛋白和/或任一RNA(例如,指导RNA或crRNA)和/或辅助蛋白可以使用合适的载体递送,所述载体例如质粒或病毒载体(如腺相关病毒(AAV)、慢病毒、腺病毒、逆转录病毒载体和其他病毒载体、或其组合)。可以将所述蛋白和一个或多个crRNA包装到一种或多种载体(例如,质粒或病毒载体)中。对于细菌应用,可以使用噬菌体将编码本文描述的CRISPR***的任一组分的核酸递送至细菌。示例性噬菌体包括但不限于T4噬菌体、Mu、λ噬菌体、T5噬菌体、T7噬菌体、T3噬菌体、Φ29、M13、MS2、Qβ和ΦX174。
在某些实施方式中,所述递送通过AAV9血清型病毒载体(如AAV9或其他进化枝F衣壳)、或基于AAV9的突变体/衍生物(例如,与AAV9共享显著的序列同源性和向性谱(spectrum of tropism))进行。
在一些实施方式中,通过例如肌内注射、静脉内施用、经皮施用、鼻内施用、口服施用或粘膜施用将所述载体(例如,质粒或病毒载体(例如,AAV病毒载体))递送至感兴趣的组织。
在某些实施方式中,本发明的AAV病毒颗粒(例如,AAV9病毒颗粒)通过视网膜下注射(如玻璃体切除术后的视网膜下注射)递送。在某些实施方式中,所述递送是每只眼睛进行一次视网膜下注射。例如,在充分麻醉下,使用针对视网膜下手术的标准玻璃体视网膜技术分别对每只人眼进行视网膜下注射,注射治疗有效量的本发明的载体基因组(vg)的合适总体积(例如,约0.1-0.5mL,如0.3mL)。在某些实施方式中,在对每只需要治疗的眼睛进行视网膜下注射之前和/或之后,给予受试者口服***(或等效物)的短期皮质类固醇方案。
递送可以经由单剂量或多剂量进行。本领域技术人员应理解,本文待递送的实际剂量可取决于多种因素而大幅变化,如载体选择、靶细胞、生物、组织、待治疗受试者的一般状况、所寻求的转化/修饰的程度、施用途径、施用模式、所寻求的转化/修饰的类型等。
在某些实施方式中,所述递送经由腺病毒进行,其可以是含有至少1×105个颗粒(也称为颗粒单位,pu)的腺病毒的单剂量。在一些实施方式中,所述剂量优选地是至少约1×106个颗粒、至少约1×107个颗粒、至少约1×108个颗粒、和至少约1×109个颗粒的腺病毒。所述递送方法和所述剂量描述于例如WO 2016205764 A1和美国专利号8,454,972 B2中,将所述两个文献通过引用以全文并入本文。
在一些实施方式中,所述递送经由质粒进行。所述剂量可以是足够数量的质粒以引发响应。在一些情况下,质粒组合物中质粒DNA的合适量可以是从约0.1至约2mg。质粒将通常包括(i)启动子;(ii)编码靶向核酸的CRISPR相关蛋白和/或辅助蛋白的序列,每个序列与启动子(例如,相同的启动子或不同的启动子)可操作地连接;(iii)可选择标志物;(iv)复制起点;以及(v)位于(ii)的下游并与其可操作地连接的转录终止子。质粒还可以编码CRISPR复合物的RNA组分,但这些组分中的一种或多种可以替代地在不同的载体上编码。施用频率在医学或兽医学从业者(例如,医师、兽医师)或本领域技术人员的范围内。
在另一实施方式中,所述递送经由脂质体或脂质转染配制品等进行,并且可以通过本领域技术人员已知的方法制备。这样的方法描述于例如WO 2016205764和美国专利号5,593,972、5,589,466、和5,580,859中,将各个文献通过引用以其全文并入本文。
在一些实施方式中,所述递送经由纳米颗粒或外泌体进行。例如,已表明外泌体在递送RNA方面特别有用。
将新的CRISPR***的一种或多种组分引入细胞中的另外的手段是通过使用细胞穿透肽(CPP)。在一些实施方式中,细胞穿透肽与所述CRISPR相关蛋白连接。在一些实施方式中,所述CRISPR相关蛋白和/或指导RNA与一种或多种CPP偶联以有效地将它们转运到细胞(例如,植物原生质体)内。在一些实施方式中,所述CRISPR相关蛋白和/或一种或多种指导RNA由一种或多种环状或非环状DNA分子编码,所述环状或非环状DNA分子与一种或多种CPP偶联用于细胞递送。
CPP是少于35个氨基酸的短肽,所述短肽源自能够以非受体依赖性方式跨细胞膜转运生物分子的蛋白或嵌合序列。CPP可以是阳离子肽、具有疏水性序列的肽、两亲性肽、具有富含脯氨酸且抗微生物的序列的肽、以及嵌合肽或二分肽。CPP的实例包括例如Tat(其是1型HIV病毒复制所需的核转录激活蛋白)、穿膜肽、卡波西成纤维细胞生长因子(FGF)信号肽序列、整合素β3信号肽序列、聚精氨酸肽Args序列、富含鸟嘌呤的分子转运蛋白和甜箭肽。CPP和使用它们的方法描述于例如
等人,“Prediction of cell-penetratingpeptides[细胞穿透肽的预测],”Methods Mol.Biol.[分子生物学方法],2015;1324:39-58;Ramakrishna等人,“Gene disruption by cell-penetrating peptide-mediateddelivery of Cas9 protein and guide RNA[通过细胞穿透肽介导的Cas9蛋白和指导RNA的递送来破坏基因],”Genome Res.[基因组研究],2014年6月;24(6):1020-7;以及WO2016205764 A1中;将各个文献通过引用以其全文并入本文。
用于本文描述的CRISPR***的各种递送方法还描述于例如美国专利号8,795,965、EP 3009511、WO 2016205764和WO 2017070605中;将各个文献通过引用以其全文并入本文。
9.试剂盒
本发明的另一方面提供试剂盒,所述试剂盒包含本文描述的本发明CRISPR/Cas***的任意两种或更多种组分,所述本发明CRISPR/Cas***包含工程化2类VI型Cas13蛋白,例如基本上缺乏旁切活性的那些,如Cas13X.1、Cas13e和Cas13f蛋白、其衍生物、功能性片段或各种融合物或加合物、指导RNA/crRNA、其复合物、涵盖它们的载体、或涵盖它们的宿主。
在某些实施方式中,所述试剂盒包含本文描述的rAAV载体基因组或rAAV病毒颗粒,所述rAAV载体基因组或rAAV病毒颗粒包含多核苷酸,所述多核苷酸包含Cas13X编码序列、以及由DR序列(如SEQ ID NO:6)隔开的一个或多个靶向VEGFA的sgRNA的编码序列。
在某些实施方式中,所述试剂盒进一步包括使用其中涵盖的组分的说明,和/或与可在别处获得的其他组分组合的说明。
在某些实施方式中,所述试剂盒进一步包含一种或多种核苷酸,例如对应于以下的一种或多种核苷酸:可用于将指导RNA编码序列***载体中并将所述编码序列与所述载体的一种或多种控制元件可操作地连接的那些。
在某些实施方式中,所述试剂盒进一步包含一种或多种缓冲液,所述缓冲液可用于溶解任一所述组分和/或为一种或多种所述组分提供合适的反应条件。这样的缓冲液可以包括以下中的一种或多种:PBS、HEPES、Tris、MOPS、Na2CO3、NaHCO3、NaB、或其组合。在某些实施方式中,所述反应条件包括适当的pH,如碱性pH。在某些实施方式中,所述pH在7-10之间。
在某些实施方式中,任一种或多种所述试剂盒组分可以储存在合适的容器中。
10.宿主细胞以及AAV生产
rAAV生产的一般原理是本领域已知的。参见以下综述,例如,Carter(CurrentOpinions in Biotechnology[生物技术新见],1533-539,1992);和Muzyczka,Curr.Topicsin Microbial,and Immunol[微生物学和免疫学的当前主题]158:97-129,1992,将两者通过引用并入本文)。以下文献中描述了各种方法:Ratschin等人(Mol.Cell.Biol.[分子细胞生物学]4:2072,1984;Hermonat等人(Proc.Natl.Acad.Sci.USA[美国国家科学院院刊]81:6466,1984);Tratschin等人(Mol.Cell.Biol.[分子细胞生物学]5:3251,1985);McLaughlin等人(J.Virol[病毒学杂志]62:1963,1988);以及Lebkowski等人(Mol.Cell.Biol[分子细胞生物学]7:349,1988),Samulski等人(J.Virol[病毒学杂志]63:3822-3828,1989);U.S.5,173,414;WO 95/13365和U.S.5,658,776;WO 95/13392;WO 96/17947;PCT/US98/18600;WO 97/09441;WO 97/08298;WO 97/21825;WO 97/06243;WO 99/11764;Perrin等人(Vaccine[疫苗]13:1244-1250,1995);Paul等人(Human Gene Therapy[人基因疗法]4:609-615,1993);Clark等人(Gene Therapy[基因疗法]3:1124-1132,1996);U.S.5,786,211;U.S.5,871,982;以及U.S.6,258,595。
AAV载体血清型可以与靶细胞类型匹配。例如,WO 2018002719A1的表2列出了可以被指定的AAV血清型转导的示例性细胞类型(通过引用并入本文)。
包装细胞用于形成能够感染宿主细胞的病毒颗粒。这样的细胞包括HEK293和Sf9细胞,其可用于包装AAV和腺病毒。
通常通过将核酸载体包装到病毒颗粒中的生产者细胞系来生成基因疗法中使用的病毒载体。载体典型地含有包装并且随后整合到宿主(如果合适的话)中所需的最小病毒序列,其他病毒序列被编码有待表达的蛋白的表达盒替代。缺失的病毒功能可以由包装细胞系以反式提供,通常是由于这些病毒功能/蛋白(如AAV的rep和cap基因)作为整合到包装细胞中的转基因或作为引入到所述包装细胞中的第二病毒载体或表达载体上的转基因而表达的结果。
例如,基因疗法中使用的AAV载体典型地仅具有来自AAV基因组的反向末端重复(ITR)序列,所述序列是包装并整合到宿主基因组中所需的。将病毒DNA包装在细胞系中,所述细胞系含有编码其他AAV基因即rep和cap但缺乏ITR序列的辅助质粒。所述细胞系还被作为辅助者的腺病毒感染。辅助病毒促进AAV载体复制和来自辅助质粒的AAV基因表达。辅助质粒由于缺乏ITR序列而未大量包装。腺病毒的污染可以通过例如进行腺病毒比AAV更敏感的热处理来减少。
在一些实施方式中,可以使用三重转染方法(在美国专利号6,001,650中详细描述)产生重组AAV。典型地,通过用有待包装到AAV颗粒中的重组AAV载体(包含感兴趣的基因)、AAV辅助功能载体和辅佐功能载体转染宿主细胞产生重组AAV。AAV辅助功能载体编码“AAV辅助功能”序列(例如,rep和cap),所述序列以反式起作用,用于生产性AAV复制和衣壳化。优选地,AAV辅助功能载体支持高效的AAV载体生产,而不生成任何可检测的野生型AAV病毒粒子(例如,含有功能性rep和cap基因的AAV病毒粒子)。所述辅佐功能载体编码用于AAV进行复制所依赖的非AAV衍生的病毒和/或细胞功能(例如,“辅佐功能”)的核苷酸序列。辅佐功能包括AAV复制所需的那些功能,包括但不限于参与激活AAV基因转录、阶段特异性AAV mRNA剪接、AAV DNA复制、cap表达产物合成和AAV衣壳组装的那些部分。基于病毒的辅佐功能可衍生自已知的辅助病毒的任一种,如腺病毒、疱疹病毒(除了单纯疱疹病毒-1型)和牛痘病毒。
在一些实施方式中,使用包装在昆虫细胞(如Sf9细胞)中的杆状病毒表达***产生本发明rAAV病毒颗粒。参见例如,WO 2007046703、WO 2007148971、WO 2009014445、WO2009104964、WO 2013036118、WO 2011112089、WO 2016083560、WO 2015137802和WO2019016349,将所有文献通过引用并入本文。
载体滴度通常表示为病毒基因组/ml(vg/ml)。在某些实施方式中,病毒滴度高于1x109、高于5x1010、高于1x1011、高于5x1011、高于1x1012、高于5x1012、或高于1x1013vg/ml。
11.湿性AMD/CNV的非人灵长类动物模型
本发明的另一方面提供湿性AMD/脉络膜新生血管形成(CNV)的非人灵长类动物(NHP)模型、以及制造和使用所述模型的方法。
NHP模型可以是有用的,因为啮齿动物模型可能不适合测试某些湿性AMD治疗(如人源化的抗VEGF抗体(包括目前针对新生血管性AMD的护理标准,抗VEGF抗体雷珠单抗和贝伐珠单抗))的效果,据推测是由于啮齿动物与人形式的VEGF之间存在差异,而在恒河猴中的研究显示了强有力的安全性和功效证据,并有助于为人临床试验提供基础。
尽管不希望受任何特定理论的束缚,但据信在激光诱导CNV之前向NHP施用免疫抑制剂导致激光诱导的CNV持续时间更长,例如超过2-4周。相比之下,之前的NHP模型的激光诱导的CNV持续约2-4周。
因此,在一个方面,本发明提供湿性AMD/CNV的NHP(如食蟹猴(食蟹猕猴))模型,所述模型包含眼睛已发展出激光诱导的CNV的NHP(如食蟹猴(食蟹猕猴)),其中所述CNV是在向所述NHP首次施用一种或多种免疫抑制剂后约一个月(例如,约3周、4周、31天、或5周)由激光光凝诱导的,并且所述激光诱导的CNV持续至少约4周,例如至少5周、至少6周、至少7周、至少8周、至少9周、或至少10周。
在一些实施方式中,所述一种或多种免疫抑制剂是在激光光凝前至少2周、至少3周、至少4周、至少5周、至少6周、至少7周、或至少8周进行首次施用的。
在某些实施方式中,所述一种或多种免疫抑制剂经每日施用,持续至少20天、至少22天、至少24天、至少26天、至少28天、至少30天、至少32天、至少34天、至少36天、至少38天、至少40天、至少42天、至少43天、至少44天、至少46天、至少48天、或至少50天。
在一些实施方式中,激光光凝诱导的CNV持续至少4周、至少5周、至少6周、至少7周、至少8周、至少9周、或至少10周。
在某些实施方式中,所述一种或多种免疫抑制剂包含雷公藤甲素、皮质类固醇如***、钙调磷酸酶抑制剂如他克莫司(ENVARSUS
或Protopic)、环孢素(
或
)、肌苷一磷酸脱氢酶(IMDH)抑制剂如霉酚酸酯
依木兰(硫唑嘌呤)、雷帕霉素机制性靶标(mTOR)抑制剂如西罗莫司
JAK激酶抑制剂如托法替尼
单克隆抗体如巴利昔单抗
在某些实施方式中,所述免疫抑制剂包含钙调磷酸酶抑制剂、白细胞介素抑制剂、和/或选择性免疫抑制剂和TNFα抑制剂(如阿达木单抗、英利昔单抗、赛妥珠单抗、戈利木单抗、和其他抗TNFα中和抗体或融合蛋白如依那西普)。
在某些实施方式中,所述激光光凝是在所述眼睛的黄斑周围区域中距离中央凹中心约1.5-2视盘直径处进行的。
在某些实施方式中,激光光凝包含以下设置:光斑大小约50μm、持续时间约0.1秒(或100ms)、和/或强度约400-700mW。
在某些实施方式中,重复光凝以造成布鲁赫膜破裂和气泡形成。
在某些实施方式中,所述激光为氩激光。
在某些实施方式中,所述NHP是食蟹猴(食蟹猕猴)、短尾猕猴(短尾猴)、恒河猴(猕猴)或非洲绿猴(绿猴)。
在某些实施方式中,所述NHP是食蟹猴(食蟹猕猴)。
本发明的另一方面提供在本发明湿性AMD/CNV的NHP模型中识别湿性AMD/CNV发展或进展抑制剂的方法,所述方法包括使所述湿性AMD/CNV的NHP模型的视网膜与候选抑制剂接触,并确定与溶媒对照相比,所述候选抑制剂抑制CNV进展的程度,其中与所述溶媒对照相比统计学显著地抑制CNV进展的候选抑制剂被选择作为湿性AMD/CNV的抑制剂。
在某些实施方式中,所述候选抑制剂经由视网膜下注射与所述视网膜接触。
在某些实施方式中,所述候选抑制剂通过管与所述视网膜接触,所述管通过所述NHP的眼睛上的穿刺斑点***。
在某些实施方式中,在向所述NHP首次施用一种或多种免疫抑制后,所述候选抑制剂与所述视网膜接触。
在某些实施方式中,在向所述NHP首次施用一种或多种免疫抑制后1、2、3、4、或5天,所述候选抑制剂与所述视网膜接触。
在某些实施方式中,在激光诱导CNV之前(例如,在此之前3、4、或5周),所述候选抑制剂与所述视网膜接触。
在某些实施方式中,所述候选抑制剂包含AAV病毒载体。
实施例
实施例1旁切效应减少的工程化Cas13X.1对VEGFA表达的高效体外敲低
本实施例证明了本发明Cas13X.1构建体——hfCas13X.1-sgVEGFA编辑盒,对VEGFA表达的高体外敲低效率。简言之,将表达hfCas13X.1和sgVEGFA的质粒和对照质粒(图3A-3C)分别瞬时转染到经培养的293T细胞中并在48小时后收获。
图3B中的hfCas13X.1-sgVEGFA构建体编码Cas13X.1编码序列、以及两个靶向VEGFA的sgRNA。还包含了在CMV启动子的转录控制下的编码mCherry报告子的第三编码序列。图3A中的阴性对照构建体仅具有由CMV启动子驱动的mCherry报告子。图3C中的另一对照在U6启动子的转录控制下表达针对VEGFA的shRNA,所述U6启动子与用于驱动hfCas13X.1-sgVEGFA构建体中的sgRNA表达的U6启动子相同。
从经转染的细胞中提取了RNA,并通过RT-PCR测量了VEGFA的表达水平。hfCas13X.1-sgVEGFA编辑盒对VEGFA表达的敲低为84.76%±1.89%,而shRNA仅为约32.99%±7.9%,表明对湿性AMD治疗的巨大潜力(图4)。
还确定了hfCas13X.1-sgVEGFA与VEGFA shRNA相比的脱靶RNA检测,并且该等结果显示在火山图中(图5)。
实施例2旁切效应减少的工程化Cas13X.1对VEGFA表达的高效体内敲低
为了证明本发明Cas13X.1构建体的体内编辑效率,将不同剂量(范围在1×106(或1E+6)与1×1010(或1E+10)vg/眼睛之间)的AAV9-hfCas13X.1-sgVEGFA经视网膜下注射到C57BL/6小鼠的眼睛中。本实验中使用了具有与实施例1中使用的序列元件相同的序列元件,且包装在AAV9衣壳内的AAV载体基因组。
在给药后8-14周收获了经注射的眼睛。提取了视网膜RNA,并通过qPCR检测了hfCas13X.1、sgVEGFA和VEGFA的RNA表达水平。
hfCas13X.1和sgVEGFA的表达水平范围为从1E+2到1E+9个拷贝/μg RNA,并且与VEGFA的体内敲低效率显著相关(图6)。
将激光诱导的脉络膜新生血管形成(CNV)小鼠和非人灵长类动物模型用于体内CNV的生长抑制研究。将溶媒和不同剂量(范围从2E+8到1E+10vg/眼睛)的AAV9-hfCas13X.1-sgVEGFA经视网膜下注射到小鼠的眼睛中。4周后,通过激光辐照诱导了CNV,并在7天后评估了治疗效果。
该等结果显示,AAV9-hfCas13X.1-sgVEGFA显著抑制了CNV的生长,最低有效剂量为约2E+8vg/眼睛,并且最大抑制率达到约46.6%±4.55%。该统计学显著性优于市售的VEGFA拮抗剂产品阿柏西普(约31.45%±4.08%)和康柏西普(约29.63%±3.63%)(图7)。
阿柏西普是可溶性诱饵受体,其以比天然VEGF受体更高的亲和力与VEGF-A、VEGF-B和胎盘生长因子(PIGF)结合。阿柏西普与VEGF受体竞争结合VEGFA,从而减少VEGFA信号传导。
康柏西普以商品名Lumitin销售,是经中国国家FDA(CFDA)批准用于治疗新生血管性年龄相关性黄斑变性(AMD)和糖尿病性黄斑水肿(DME)的抗VEGF抗体。
考虑到有效性和安全性两者,选择2E+11vg/mL作为NHP(非人灵长类动物)研究中使用的剂量。将约100μL的2E+11vg/ml AAV9-hfCas13X.1-sgVEGFA经视网膜下注射到NHP(经预筛选为AAV9中和抗体阴性)的眼睛中,然后在4周后使用激光以诱导CNV。在激光后1/2/4/6/9/14/19周时,以CNV面积和SHRM(视网膜下高反射物质)高度测量了CNV的生长。
发现AAV9-hfCas13X.1-sgVEGFA在面积和SHRM高度两方面均抑制了CNV的生长,并且抑制效果持续超过4个月。
如通过眼底荧光素血管造影所确定的,CNV的生长显示出与未治疗的眼睛相比,hfCas13X.1-sgVEGFA抑制了CNV的生长(图8A)。与未治疗的眼睛相比,在治疗后的23周后,CVN的面积减少了72%(图8B)。未治疗的眼睛中的4级病变比率增加至约61%,而使用hfCas13X.1-sgVEGFA治疗的眼睛为0%。
在使用hfCas13X.1-sgVEGFA治疗的眼睛相比于未治疗的眼睛的光学相干断层扫描(OCT)中测量了CNV SHRM(视网膜下高反射物质)高度(图9A)。与未治疗的眼睛相比,在给药后的23周后,hfCas13X.1-sgVEGFA使CNV高度降低了约61%(图9B)。
为了进一步评估AAV9-hfCas13X.1-sgVEGFA对湿性AMD的效果,使用ERG测试了NHPCNV模型的视功能,经AAV9-hfCas13X.1-sgVEGFA治疗的眼睛在视杆功能和视锥功能两方面均显示出比溶媒治疗的眼睛好得多的视力(图10)。
总之,本文呈现的数据证明,hfCas13X.1-sgVEGFA编辑盒高效地降低了VEGFA在经培养的293T细胞中和在小鼠眼睛中的表达,视网膜下注射AAV9-hfCas13X.1-sgVEGFA可以抑制小鼠和NHP两者中激光诱导的CNV的生长。该等结果证明了AAV9-hfCas13X.1-sgVEGFA在人类中治疗湿性AMD以及其他VEGFA相关的黄斑变性疾病的能力和潜力。
方法
动物
C57BL/6J动物购自北京维通利华实验动物技术有限公司(Beijing Vital RiverLaboratory Animal Technology Co.,Ltd.),并在内部动物设施中以12h:12h光/暗循环饲养,自由进食和饮水。所有实验方案均经动物护理和使用委员会(Animal Care and UseCommittee)批准。
将2-3岁、体重2.0-3.5kg的食蟹猴(食蟹猕猴)用于本研究,并且这些食蟹猴最初获自广东春盛生物科技发展有限公司(GuangDong Blooming-Spring BiologicalTechnology Development Co.,Ltd.)。动物将在房间的不锈钢笼子中以12小时的光/暗循环社会性地饲养(至多3只相同性别和相同剂量组的动物一起)。在启动这样的程序之前,本研究涉及方案以及动物护理和使用的任何修改或程序的IACUC申请由测试设施机构动物护理和使用委员会(Testing Facility Institutional Animal Care and Use Committee)(IACUC)审查并批准。兽医工作人员将监测研究中的动物福利问题,并咨询研究主任以确定适当的治疗。
AAV载体制备
通过使用聚乙烯亚胺(PEI)对293T细胞进行三重转染,生成了重组AAV9病毒颗粒。在转染后72小时时从培养基中收获了病毒颗粒,并且在120小时时从细胞和培养基中收获了病毒颗粒。将细胞沉淀物重悬于具有10mM MgCl2和150mM氯化钠的10mM Tris(pH 7.6)中,冻融三次,并在37℃下使用125U/mL的苯佐那酶(Benzonase)(西格玛公司(Sigma))处理至少1hr。通过以下浓缩病毒培养基:使用具有625mM氯化钠的10%聚乙二醇8000(西格玛奥德里奇公司(Sigma-Aldrich))进行沉淀,重悬于具有0.001%PluronicTM F-68非离子表面活性剂的PBS中,然后添加到裂解物中。然后将合并的原液调整至1000mM NaCl,在37℃下孵育1hr,并通过以2000g离心进行了澄清。然后经碘克沙醇(Optiprep,西格玛公司;D1556)分步梯度(15%、25%、40%和58%)纯化了澄清的原液。将病毒浓缩并在具有0.001%PluronicTM F-68非离子表面活性剂的PBS中配制。通过使用以线性化基因组质粒作为标准品的qPCR测量DNA酶l抗性载体基因组的数目确定了病毒滴度。
细胞培养物中的VEGFA敲低
将293T细胞在含有10%胎牛血清(FBS)和青霉素/链霉素的杜尔贝科改良伊格尔培养基(DMEM)中培养,并维持在37℃和5%CO2下。将细胞接种在6孔板(1.0-1.2E+6个细胞/孔)中,并使用PEI用表达hfCas13X.1-sgVEGFA和mCherry的4ug载体转染所述细胞。对照质粒仅表达mCherry或表达shRNA和mCherry。转染后2天,使用流式细胞术分离了mCherry阳性细胞。将总RNA首先使用Trizol(Ambion公司)纯化,然后转录成互补DNA(针对qPCR的HiScriptQ RT SuperMix,诺唯赞生物科技公司(Vazyme,Biotech))。通过SYBR绿色探针(AceQ qPCRSYBR Green预混物,诺唯赞生物科技公司)跟踪了qPCR反应。VEGFA qPCR引物是:正向,5‘-GAGGGCAGAATCATCACGAAG-3’(SEQ ID NO:73);反向,5’-GTGAGGTTTGATCCGCATAATC-3’(SEQID NO:74),18s RNA qPCR引物是:正向,5‘-TTGGTGGAGCGATTTGTCTG-3’(SEQ ID NO:75);反向,5’-GAATGGGGTTCAACGGGTTA-3’(SEQ ID NO:76)。shRNA1:-GTGCTGTAGGAAGCTCATCTCTCCTAT-(SEQ ID NO:77);shRNA2:-GAAGATGTCCACCAGGGTCT-(SEQID NO:78)。
视网膜下注射
小鼠——用唑替尔(60μg/g)和甲苯噻嗪(10μg/g)的混合物麻醉了8周龄的小鼠。在瞳孔扩张后,用无菌的31 G 1/2针穿刺角膜缘稍后方的小孔。使用带33G钝针的Hamilton注射器通过孔经视网膜下注射了1μL不同剂量的AAV9-hfCas13X.1-sgVEGFA、抗体(阿柏西普2.5μg/μL、康柏西普0.625μg/μL)或溶媒。
NHP——给猴的双眼滴了1-2滴托吡卡胺滴眼液以扩张瞳孔。之后,使用10-30mg/kg的***肌内注射使动物镇静,并以0.5-0.75mg/kg剂量的甲苯噻嗪肌内注射麻醉了动物。将动物放在了手术台上,用开睑器打开了眼睑以露出眼球。调整直到眼底清晰可见。立体显微镜下眼底清晰可见后,用镊子固定了眼球位置。在角膜缘后3-4mm处穿刺眼球壁,避开血管和其他眼组织。通过穿刺斑点***了管,然后将管尖端放置成与视网膜表面接触,向前推入到了视网膜。缓慢注射了AAV9-hfCas13X.1-sgVEGFA或溶媒,并且经注射的视网膜将被抬高。然后将管从视网膜中拔出,但在完全从眼球中拔出之前留在玻璃体中至少30秒。通过以下对经注射的动物进行了护理:用毯子保暖直到它们可以自由移动。
小鼠视网膜中的VEGFA敲低
在AAV9-hfCas13X.1-sgVEGFA注射后数周,将小鼠麻醉并使用PBS进行灌注并且分离了视网膜。使用Trizol(Ambion公司)提取并纯化了视网膜的总RNA,然后转录成互补DNA(针对qPCR的HiScript Q RT SuperMix,诺唯赞生物科技公司)。通过Taqman探针(Bestar qPCR预混物,DBI-2041,DBI)使用qPCR检测了hfCas13X.1、sgVEGFA和VEGFA的表达。mVEGFA qPCR引物是:正向,5‘-GCTACTGCCGTCCGATTGAG-3’(SEQ ID NO:79);反向,5’-CACTCCAGGGCTTCATCGTT-3’(SEQ ID NO:80);探针,TCCAGGAGTACCCCGACGAGATAG(SEQ IDNO:81),hfCas13X.1qPCR引物是:正向,5‘-CGGCGAGCAGGGTGATAAGA-3’(SEQ ID NO:82);反向,5’-CCAGGTAGTGCAGTGCAAATT-3’(SEQ ID NO:83);探针,TCCTTGTGCCGCTTGGGATTTGTG(SEQ ID NO:84),sgVEGFA qPCR引物是:正向,5‘-GGTACTCCTGGAAGATGTCC-3’(SEQ ID NO:85);反向,5’-TGTAATCACCCCACAAATCG-3’(SEQ ID NO:86);探针,ACCAGGGTCTGCTGGAGCAGCC(SEQ ID NO:87)。
激光诱导的CNV小鼠模型和CNV染色
在AAV9-hfCas13X.1-sgVEGFA注射后三周,将小鼠用于激光灼伤。简言之,使用唑替尔(60μg/g)和甲苯噻嗪(10μg/g)的混合物麻醉了小鼠,并用扩张滴眼液扩张了瞳孔以扩大瞳孔大小。使用NOVUS Spectra(科医人公司(LUMENIS))进行了激光光凝。本研究中使用的激光参数为:532nm波长、70ms曝露时间、240mW功率和50μm光斑大小。在视盘周围诱导了4处激光灼伤。研究中排除了玻璃体出血的小鼠。激光灼伤后7天之后进行了CNV分析。使用PBS灌注了小鼠,随后使用冰冷的4%多聚甲醛(PFA)进行灌注,然后使用PFA固定眼睛2小时。从眼睛中去除了视网膜,并且仅将RPE/脉络膜/巩膜复合物使用异凝集素-B4(IB4,10μg/mL,I21413,生命技术公司(Life Technologies))染色过夜。将RPE复合物平置并用尼康显微镜获得了CNV图像。由盲观察者使用ImageJ软件对CNV的面积进行了量化。
激光诱导的CNV NHP模型
给猴的双眼滴了1-2滴托吡卡胺滴眼液以扩张瞳孔。之后,使用10-30mg/kg的***肌内注射使动物镇静,并以0.5-0.75mg/kg剂量的甲苯噻嗪肌内注射麻醉了动物。将奥布卡因滴眼液滴入结膜囊进行表面麻醉。将卡波姆滴眼液(0.2%)涂抹在激光镜片的背面以帮助清楚地观察眼底。然后使用如下设置在距离中央凹中心约1.5-2视盘直径的黄斑周围区域中进行激光光凝:光斑大小50μm、持续时间0.1秒、和强度400-700mW。激光光凝后,使用氧氟沙星眼膏涂抹了动物的眼睛,并将动物放在毯子上保暖,并且在动物清醒后将其放回了笼子。在激光后不同时间点处通过FP FFA和OCT检查以面积和SHRM测量了CNV的生长。对于FFA,在眼底照相后荧光素血管造影之前通过快速静脉内注射给予动物荧光素钠注射液(10mg/kg,100mg/mL)。在激光后第9周使用ERG测量了视功能。
示例性序列
pAAV9-hfCas13X.1-sgVEGFA
经密码子优化的野生型Cas13e(SEQ ID NO:1),没有TAG终止密码子
野生型Cas13e的氨基酸序列(SEQ ID NO:4)
hfCas13X.1(SEQ ID NO:5)
野生型Cas13X.1的氨基酸序列(SEQ ID NO:2)
在SEQ ID NO:2中,在残基672处的Xaa定义为:任何氨基酸,当在676处的Xaa为Y且在751处的Xaa为I时,Y除外。
在残基676处的Xaa定义为:任何氨基酸,当在672处的Xaa为Y且在751处的Xaa为I时,Y除外。
在残基751处的Xaa定义为:任何氨基酸,当在672处的Xaa以及在676处的Xaa均为Y时,I除外。
Cas13X.1的氨基酸序列(SEQ ID NO:3)
DR SEQ ID NO:6
GCTGGAGCAGCCCCCGATTTGTGGGGTGATTACAGC
Sg1 SEQ ID NO:7
GTGCTGTAGGAAGCTCATCTCTCCTATGTG
Sg2 SEQ ID NO:8
GGTACTCCTGGAAGATGTCCACCAGGGTCT
5’ITR(SEQ ID NO:10)
3’ITR(SEQ ID NO:11)
EFS启动子(SEQ ID NO:12)
Kozak(SEQ ID NO:13)
GCCACCATG
SV40 NLS(SEQ ID NO:14)
CCCAAGAAGAAGCGGAAGGTG
SV40 polyA(SEQ ID NO:15)
U6启动子(SEQ ID NO:16)
pAAV9-hfCas13X.1-sgVEGFA ITR至ITR(SEQ ID NO:17)
p-U6-shRNA-CMV-mCherry
全长(SEQ ID NO:49)
CMV启动子(SEQ ID NO:50)
mCherry(SEQ ID NO:51)
bGH polyA(SEQ ID NO:52)