CN118159662A - 用于治疗sod1相关疾病的crispr-cas13*** - Google Patents

用于治疗sod1相关疾病的crispr-cas13*** Download PDF

Info

Publication number
CN118159662A
CN118159662A CN202280070844.6A CN202280070844A CN118159662A CN 118159662 A CN118159662 A CN 118159662A CN 202280070844 A CN202280070844 A CN 202280070844A CN 118159662 A CN118159662 A CN 118159662A
Authority
CN
China
Prior art keywords
promoter
seq
sequence
cas13
vector genome
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202280070844.6A
Other languages
English (en)
Inventor
杨辉
王兴
白明亮
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Huida Shanghai Biotechnology Co ltd
Center for Excellence in Brain Science and Intelligence Technology Chinese Academy of Sciences
Original Assignee
Huida Shanghai Biotechnology Co ltd
Center for Excellence in Brain Science and Intelligence Technology Chinese Academy of Sciences
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from PCT/CN2021/121926 external-priority patent/WO2022068912A1/en
Priority claimed from PCT/CN2022/083476 external-priority patent/WO2023024504A1/en
Application filed by Huida Shanghai Biotechnology Co ltd, Center for Excellence in Brain Science and Intelligence Technology Chinese Academy of Sciences filed Critical Huida Shanghai Biotechnology Co ltd
Publication of CN118159662A publication Critical patent/CN118159662A/zh
Pending legal-status Critical Current

Links

Classifications

    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P25/00Drugs for disorders of the nervous system
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/113Non-coding nucleic acids modulating the expression of genes, e.g. antisense oligonucleotides; Antisense DNA or RNA; Triplex- forming oligonucleotides; Catalytic nucleic acids, e.g. ribozymes; Nucleic acids used in co-suppression or gene silencing
    • C12N15/1137Non-coding nucleic acids modulating the expression of genes, e.g. antisense oligonucleotides; Antisense DNA or RNA; Triplex- forming oligonucleotides; Catalytic nucleic acids, e.g. ribozymes; Nucleic acids used in co-suppression or gene silencing against enzymes
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/52Genes encoding for enzymes or proenzymes
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/16Hydrolases (3) acting on ester bonds (3.1)
    • C12N9/22Ribonucleases RNAses, DNAses
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2310/00Structure or type of the nucleic acid
    • C12N2310/10Type of nucleic acid
    • C12N2310/14Type of nucleic acid interfering N.A.
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2310/00Structure or type of the nucleic acid
    • C12N2310/10Type of nucleic acid
    • C12N2310/20Type of nucleic acid involving clustered regularly interspaced short palindromic repeats [CRISPRs]
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2320/00Applications; Uses
    • C12N2320/10Applications; Uses in screening processes
    • C12N2320/11Applications; Uses in screening processes for the determination of target sites, i.e. of active nucleic acids
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2320/00Applications; Uses
    • C12N2320/30Special therapeutic applications
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2750/00MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssDNA viruses
    • C12N2750/00011Details
    • C12N2750/14011Parvoviridae
    • C12N2750/14111Dependovirus, e.g. adenoassociated viruses
    • C12N2750/14141Use of virus, viral particle or viral elements as a vector
    • C12N2750/14143Use of virus, viral particle or viral elements as a vector viral genome or elements thereof as genetic vector

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Engineering & Computer Science (AREA)
  • Biomedical Technology (AREA)
  • Chemical & Material Sciences (AREA)
  • Organic Chemistry (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Molecular Biology (AREA)
  • Wood Science & Technology (AREA)
  • Zoology (AREA)
  • Biotechnology (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Biochemistry (AREA)
  • Microbiology (AREA)
  • Biophysics (AREA)
  • Medicinal Chemistry (AREA)
  • Physics & Mathematics (AREA)
  • Plant Pathology (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Neurology (AREA)
  • Neurosurgery (AREA)
  • Virology (AREA)
  • General Chemical & Material Sciences (AREA)
  • Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
  • Pharmacology & Pharmacy (AREA)
  • Animal Behavior & Ethology (AREA)
  • Public Health (AREA)
  • Veterinary Medicine (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Medicines That Contain Protein Lipid Enzymes And Other Medicines (AREA)

Abstract

提供了CRISPR‑Cas13***和使用这些***治疗SOD 1相关疾病的方法。

Description

用于治疗SOD1相关疾病的CRISPR-CAS13***
相关申请的引用
本申请要求于2021年8月22日提交的国际专利申请号PCT/CN2021/113929、于2021年9月29日提交的国际专利申请号PCT/CN2021/121926、以及于2022年3月28日提交的国际专利申请号PCT/CN2022/083476的优先权,并将上述每件申请的全部内容(包括任何序列表和附图)通过援引以其全文并入本文。
序列表
本申请包含于2022年8月22日按照WIPOST.26标准以电子方式创建并且名称为“222510Z1 1PCWO SEQ.XML”的序列表。
应理解,由于WIPOST.26标准下序列制备软件的限制,序列表中在RNA序列的上下文中所有“t”都代表“u”。
背景技术
肌萎缩侧索硬化(ALS)是致命的神经***变性疾病,其发生在运动皮层、脑干和脊髓的运动神经元中。目前,ALS尚无法治愈,并且那些获批的ALS治疗只是延迟疾病的进展,而没有解决潜在的遗传病因,这凸显了对更有效ALS治疗的需要。
1993年,Rosen等人首次报告家族性ALS(fALS)与Cu/Zn超氧化物歧化酶1(SOD1)突变相关。约20%-25%的fALS病例是人SOD1基因突变引起的,并且已经在人SOD1基因的5个外显子中鉴定出超过180种不同的突变,所有这些突变都与fALS相关。
几种不同的分子策略已用于在体内高效递送靶向SOD1 mRNA的沉默载体,旨在降低与疾病相关的突变SOD1蛋白的表达并改善动物模型中的治疗结果,包括微RNA、shRNA和反义寡核苷酸(ASO)。之前的研究表明注射渤健公司(Biogen)的托夫生(Tofersen)(靶向SOD1的ASO)或注射编码靶向SOD1的微RNA的腺相关病毒(AAV)可有效降低SOD1突变患者中致病性错误折叠蛋白SOD1的水平。然而,那些传统RNA干扰(RNAi)技术的特异性、稳定性和有效性值得考虑。另外,ASO可能需要重复施用以维持敲低效果,这最终可能会限制其治疗结果。因此,需要更高效的治疗策略。
发明内容
本发明的一个方面提供重组腺相关病毒(rAAV)载体基因组,所述rAAV载体基因组包含:
(1)编码Cas13多肽的Cas13编码序列,
(i)其中所述Cas13编码序列与SEQ ID NO:3或5或其RNA对应物具有至少80%、85%、90%、95%、96%、97%、98%、99%、99.2%、99.4%、99.6%、99.8%、99.9%或100%同一性,
(ii)其中所述Cas13多肽包含
(a)SEQ ID NO:2或4,或者
(b)SEQ ID NO:2或4的变体,所述变体与SEQ ID NO:1具有至少80%、85%、90%、95%、96%、97%、98%或99%同一性,并且在SEQ ID NO:1的Y666和/或Y677处具有非保守取代(例如,Y666A和/或Y677A取代),其中所述变体具有与SEQ ID NO:1基本上相同(例如,至少约80%、90%、95%、99%或更多)的指导RNA特异性核酸酶活性(切割活性)并且基本上没有(例如,最多20%、15%、10%、5%)SEQ ID NO:1的旁切(指导RNA非依赖性)核酸酶活性(旁切活性);和
(2)单指导RNA(sgRNA)或编码所述sgRNA的sgRNA编码序列,所述sgRNA包含:
(A)与SOD1 mRNA上的靶RNA序列基本上互补的间隔序列;和
(B)能够与所述Cas13多肽形成复合物的同向重复(DR)序列;
其中当所述sgRNA将所述Cas13多肽引导至所述靶RNA序列时,所述复合物在所述靶RNA序列处或附近特异性切割所述SOD1 mRNA;
任选地其中所述sgRNA或sgRNA编码序列在所述Cas13编码序列或其RNA对应物的3’或5’。
在一些实施方式中,所述rAAV载体基因组进一步包含与所述Cas13多肽的N-末端融合的第一核定位序列(NLS,如SEQ ID NO:66)或核输出信号(NES)的第一编码序列,和/或与所述Cas13多肽的C-末端融合的第二NLS(如SEQ ID NO:66)或NES的第二编码序列;
任选地,所述rAAV载体基因组进一步包含与所述Cas13多肽(以及C-末端NLS或NES,如果存在)融合(例如,C-末端融合)的表位标签如HA标签的一个或多个拷贝(例如,3个串联拷贝)的编码序列。
在一些实施方式中,所述rAAV载体基因组进一步包含5'AAV ITR序列和3'AAV ITR序列。
在一些实施方式中,所述5'AAV ITR序列和所述3'AAV ITR序列两者都是来自以下的野生型AAV ITR序列:AAV1、AAV2、AAV3A、AAV3B、AAV4、AAV5、AAV6、AAV7、AAVrh74、AAV8、AAV9、AAV10、AAV11、AAV12、AAV13、AAV-DJ、AAV PHP.eB、或所述AAV1-AAV13中的任一者所属的进化枝的成员,或其功能性截短变体;任选地,所述5'AAV ITR序列具有SEQ ID NO:71的多核苷酸序列,并且/或者所述3'AAV ITR序列具有SEQ ID NO:72的多核苷酸序列。
在一些实施方式中,所述rAAV载体基因组进一步包含与所述Cas13编码序列可操作地连接的启动子。
在一些实施方式中,所述启动子是广谱(ubiquitous)启动子、组织特异性启动子、细胞类型特异性启动子、组成型启动子或诱导型启动子;任选地,其中所述启动子包含选自以下的启动子:Cbh启动子、Cba启动子、pol I启动子、pol II启动子、pol III启动子、T7启动子、U6启动子、H1启动子、逆转录病毒劳斯肉瘤病毒LTR启动子、巨细胞病毒(CMV)启动子、SV40启动子、二氢叶酸还原酶启动子、β-肌动蛋白启动子、延伸因子1α短(EFS)启动子、β葡糖醛酸糖苷酶(GUSB)启动子、巨细胞病毒(CMV)即早(Ie)增强子和/或启动子、鸡β-肌动蛋白(CBA)启动子或其衍生物如CAG启动子、CB启动子、(人)延伸因子1α-亚基(EF1α)启动子、泛素C(UBC)启动子、朊病毒启动子、神经元特异性烯醇化酶(NSE)、神经丝轻链(NFL)启动子、神经丝重链(NFH)启动子、血小板衍生生长因子(PDGF)启动子、血小板衍生生长因子B链(PDGF-β)启动子、突触蛋白(Syn)启动子、突触蛋白1(Syn1)启动子、甲基-CpG结合蛋白2(MeCP2)启动子、Ca2+/钙调蛋白依赖性蛋白激酶II(CaMKII)启动子、代谢型谷氨酸受体2(mGluR2)启动子、神经丝轻链(NFL)启动子、神经丝重链(NFH)启动子、β-珠蛋白小基因nβ2启动子、前脑啡肽原(PPE)启动子、脑啡肽(Enk)启动子、兴奋性氨基酸转运蛋白2(EAAT2)启动子、胶质纤维酸性蛋白(GFAP)启动子和髓鞘碱性蛋白(MBP)启动子。
在一些实施方式中,所述启动子包含Cbh启动子(如具有SEQ ID NO:63的多核苷酸序列的Cbh启动子)或Cba启动子(如具有SEQ ID NO:62的多核苷酸序列的Cba启动子)。
在一些实施方式中,所述rAAV载体基因组进一步包含聚腺苷酸化(polyA)信号序列,如牛生长激素聚腺苷酸化信号(bGH polyA)、小polyA信号(SPA)、人生长激素聚腺苷酸化信号(hGH polyA)、SV40 polyA信号(SV40 polyA)、兔β珠蛋白polyA信号(rBG polyA)、及其功能性截短或变体;或对应的polyA序列。
在一些实施方式中,所述polyA信号序列包含牛生长激素聚腺苷酸化信号(bGHpolyA)或其变体;任选地,所述bGH polyA包含SEQ ID NO:67的多核苷酸序列。
在一些实施方式中,所述sgRNA编码序列与启动子可操作地连接;任选地其中所述启动子是广谱启动子、组织特异性启动子、细胞类型特异性启动子、组成型启动子或诱导型启动子;任选地选自Cbh启动子、Cba启动子、pol I启动子、pol II启动子、pol III启动子、T7启动子、U6启动子、H1启动子、逆转录病毒劳斯肉瘤病毒LTR启动子、巨细胞病毒(CMV)启动子、SV40启动子、二氢叶酸还原酶启动子、β-肌动蛋白启动子、延伸因子1α短(EFS)启动子、β葡糖醛酸糖苷酶(GUSB)启动子、巨细胞病毒(CMV)即早(Ie)增强子和/或启动子、鸡β-肌动蛋白(CBA)启动子或其衍生物如CAG启动子、CB启动子、(人)延伸因子1α-亚基(EF1α)启动子、泛素C(UBC)启动子、朊病毒启动子、神经元特异性烯醇化酶(NSE)、神经丝轻链(NFL)启动子、神经丝重链(NFH)启动子、血小板衍生生长因子(PDGF)启动子、血小板衍生生长因子B链(PDGF-β)启动子、突触蛋白(Syn)启动子、突触蛋白1(Syn1)启动子、甲基-CpG结合蛋白2(MeCP2)启动子、Ca2+/钙调蛋白依赖性蛋白激酶II(CaMKII)启动子、代谢型谷氨酸受体2(mGluR2)启动子、神经丝轻链(NFL)启动子、神经丝重链(NFH)启动子、β-珠蛋白小基因nβ2启动子、前脑啡肽原(PPE)启动子、脑啡肽(Enk)启动子、兴奋性氨基酸转运蛋白2(EAAT2)启动子、胶质纤维酸性蛋白(GFAP)启动子和髓鞘碱性蛋白(MBP)启动子;任选地其中所述启动子是RNA pol III启动子。
在一些实施方式中,所述RNA pol III启动子是U6(如SEQ ID NO:68)、H1、7SK、或其变体。
在一些实施方式中,(1)所述sgRNA包含与一个DR序列(例如,SEQ ID NO:6)直接连接的一个间隔序列;(2)所述sgRNA包含侧接两个DR序列(例如,各自具有SEQ ID NO:6)的一个间隔序列;或(3)所述sgRNA包含两个或更多个间隔序列;并且其中每个间隔序列侧接两个DR序列,每个DR序列都能够与所述Cas13多肽形成复合物;任选地,所述sgRNA包含侧接三个DR序列(例如,各自具有SEQ ID NO:6)的两个间隔序列以形成DR-间隔子-DR-间隔子-DR结构;
其中所述间隔序列中的每一个都独立地与所述SOD1 mRNA上的不同靶RNA序列基本上互补,并且各自能够引导所述Cas13多肽切割相应的所述不同靶RNA序列。
在一些实施方式中,所述DR序列包含(1)SEQ ID NO:6;(2)与SEQ ID NO:6具有至少90%、92%、94%、95%、96%、98%或99%同一性的序列;(3)与SEQ ID NO:6具有最多1、2、3、4或5个核苷酸差异的序列;或(4)具有与SEQ ID NO:6的二级结构基本上相同的二级结构的序列。
在一些实施方式中,所述DR序列包含(1)SEQ ID NO:6;(2)具有与SEQ ID NO:6的二级结构基本上相同的二级结构的序列;或(3)SEQ ID NO:6的变体,所述变体与SEQ IDNO:6的差异为至多1、2、3、4、5、6、7、8、9或10个核苷酸且基本上不降低所述复合物切割所述SOD1 mRNA的能力。
在一些实施方式中,每个所述DR序列包含SEQ ID NO:6、基本上由其组成、或由其组成。
在一些实施方式中,所述靶RNA序列包含SEQ ID NO:73中的一段连续核苷酸;任选地SEQ ID NO:73中的20-50个连续核苷酸,或20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49或50个连续核苷酸,如30个连续核苷酸,如SEQ ID NO:39-54中的任一个。
在一些实施方式中,所述靶RNA序列包含SEQ ID NO:73中的一段连续核苷酸;任选地15-60个,或15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59或60个,如SEQ ID NO:39-54中的任一个。
在一些实施方式中,所述靶RNA序列包含SEQ ID NO:39-54中的任一个中的至少15个连续核苷酸。
在一些实施方式中,所述间隔序列独立地选自SEQ ID NO:23-38中的任一个或其变体,所述变体与SEQ ID NO:23-38中的任一个的差异为至多1、2、3、4、5或6个核苷酸且基本上不减弱引导所述Cas13多肽与所述sgRNA结合以形成靶向所述靶RNA序列的Cas13-sgRNA复合物以切割所述靶RNA的能力。
在一些实施方式中,所述间隔序列独立地包含(1)SEQ ID NO:23-38中的任一个;(2)SEQ ID NO:23-38中的任一个中的至少15个连续核苷酸;或(3)SEQ ID NO:23-38中的任一个的变体,所述变体与SEQ ID NO:23-38中的任一个的差异为至多1、2、3、4、5、6、7、8、9或10个核苷酸且基本上不降低所述复合物切割所述SOD1 mRNA的能力。
在一些实施方式中,所述SOD1 mRNA与疾病或病症如ALS(肌萎缩侧索硬化)相关。
在一些实施方式中,所述rAAV载体基因组包含ITR至ITR多核苷酸(如SEQ ID NO:75),所述ITR至ITR多核苷酸从5'到3'包含:
(a)来自AAV2的5'ITR(如SEQ ID NO:71);
(b)Cbh启动子(例如,包含增强子序列(如SEQ ID NO:64)和内含子序列(如SEQ IDNO:65)的Cbh启动子;任选地,所述Cbh启动子包含SEQ ID NO:63);
(c)Kozak序列(如“GCCACC”);
(d)第一NLS编码序列(如编码SEQ ID NO:66的序列);
(e)编码除第一氨基酸M外的SEQ ID NO:2或4的Cas13多肽的Cas13多核苷酸(如除起始密码子ATG外的SEQ ID NO:3或5);
(f)第二NLS编码序列(如编码SEQ ID NO:66的序列);
(g)任选的编码HA标签序列(例如,SEQ ID NO:74)的三个串联重复序列的编码序列;
(h)bGH polyA信号序列(如SEQ ID NO:67);
(i)U6启动子(如SEQ ID NO:68);
(j)编码第一同向重复序列(DR)(如SEQ ID NO:6)的第一DR DNA编码序列;
(k)编码对SOD1 mRNA具有特异性的第一间隔序列(如SEQ ID NO:27或29)的第一间隔子编码序列;
(l)编码第二DR(如SEQ ID NO:6)的第二DR DNA编码序列;
(m)编码对SOD1 mRNA具有特异性的第二间隔序列(如SEQ ID NO:27或29)的第二间隔子编码序列;
(n)编码第三DR(如SEQ ID NO:6)的第三DR DNA编码序列;和
(o)来自AAV2的3'ITR(如SEQ ID NO:72);
或与所述ITR至ITR多核苷酸具有至少约90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%、99.6%、99.7%、99.8%、99.9%同一性的多核苷酸;
任选地,所述ITR至ITR多核苷酸进一步包含在(a)–(o)中的任何两个相邻序列元件之间的接头序列;
任选地,在(i)至(n)序列元件的5'的(b)至(h)序列元件被重定位到(i)至(n)序列元件的3’。
本发明的另一方面提供重组AAV(rAAV)载体基因组,所述rAAV载体基因组包含以下、基本上由以下组成或由以下组成:
(1)SEQ ID NO:75,或与其具有至少约90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%、99.6%、99.7%、99.8%、99.9%同一性的多核苷酸;
其中所述多核苷酸编码以下的Cas13多肽:
(a)SEQ ID NO:2或4,或者
(b)SEQ ID NO:2或4的变体,所述变体与SEQ ID NO:1具有至少80%、85%、90%、95%、96%、97%、98%或99%同一性,并且在SEQ ID NO:1的Y666和/或Y677处具有非保守取代(例如,Y666A和/或Y677A取代),其中所述变体具有与SEQ ID NO:1基本上相同(例如,至少约80%、90%、95%、99%或更多)的指导RNA特异性核酸酶活性并且基本上没有(例如,最多20%、15%、10%、5%)SEQ ID NO:1的旁切(指导RNA非依赖性)核酸酶活性;和
(2)编码sgRNA的sg RNA编码序列,所述sgRNA包含:
(A)与SOD1 mRNA上的靶RNA序列基本上互补的间隔序列;和
(B)与所述Cas13多肽形成复合物的同向重复(DR)序列,
其中当所述sgRNA将所述Cas13多肽引导至所述靶RNA序列时,在所述靶RNA序列处或附近,所述复合物以与SEQ ID NO:1的Cas13多肽和所述sgRNA的复合物基本上相同(例如,至少约80%、90%、95%、99%或更多)的指导RNA特异性核酸酶活性特异性切割所述SOD1 mRNA并且基本上没有(例如,最多20%、15%、10%、5%)SEQ ID NO:1的Cas13多肽和所述sgRNA的复合物的旁切(指导RNA非依赖性)核酸酶活性;
任选地其中所述sgRNA编码序列在所述Cas13编码序列的3’或5’。
在一些实施方式中,所述rAAV载体基因组是SEQ ID NO:75或与其具有至少95%或99%同一性的多核苷酸。
本发明的另一方面提供重组AAV(rAAV)病毒颗粒,所述rAAV病毒颗粒包含如本文所述的rAAV载体基因组。
在一些实施方式中,所述rAAV颗粒包含包裹所述rAAV载体基因组的衣壳,所述衣壳的血清型是AAV1、AAV2、AAV3A、AAV3B、AAV4、AAV5、AAV6、AAV7、AAVrh74、AAV8、AAV9、AAV10、AAV11、AAV12、AAV13、AAV-DJ、或AAV PHP.eB、所述AAV1-AAV13中的任一者所属的进化枝的成员、或其功能性截短变体或功能性突变体。
在一些实施方式中,所述衣壳的血清型是AAV9-M8,其包含SEQ ID NO:82的VP1序列。
本发明的另一方面提供重组AAV(rAAV)病毒颗粒,所述rAAV病毒颗粒包含包裹在血清型为AAV9-M8的衣壳中的如本文所述的rAAV载体基因组。
本发明的另一方面提供药物组合物,所述药物组合物包含如本文所述的rAAV载体基因组、或如本文所述的rAAV病毒颗粒,以及药学上可接受的赋形剂。
本发明的另一方面提供在有需要的受试者中治疗与SOD1相关的疾病或病症的方法,所述方法包括向所述受试者施用治疗有效量的如本文所述的rAAV载体基因组、如本文所述的rAAV病毒颗粒、或如本文所述的药物组合物,其中所述rAAV载体基因组或所述rAAV病毒颗粒特异性地下调导致所述疾病或病症的所述SOD1的表达。
在一些实施方式中,所述施用包括使细胞与所述治疗有效量的如本文所述的rAAV载体基因组、如本文所述的rAAV病毒颗粒、或如本文所述的药物组合物接触。
在一些实施方式中,所述细胞位于所述受试者的CNS中。
在一些实施方式中,所述疾病或病症是ALS。
在一些实施方式中,所述施用包括鞘内施用。
在一些实施方式中,所述受试者是人。
在一些实施方式中,所述细胞中SOD1的表达与尚未与如本文所述的rAAV载体基因组、如本文所述的rAAV病毒颗粒、或如本文所述的药物组合物接触的细胞相比降低。
在一些实施方式中,与施用前所述受试者中SOD1的表达相比,所述受试者中SOD1的表达降低约30%、约35%、约40%、约45%、约50%、约55%、约60%、约65%、约70%、约75%、约80%、或约85%。
本发明的另一方面提供指导RNA(gRNA)(例如,单指导RNA),所述gRNA包含:
(A)与SOD1 mRNA上的靶RNA序列基本上互补的间隔序列;和
(B)任选地,能够与Cas13多肽形成复合物的同向重复(DR)序列,其中当所述gRNA将所述Cas13多肽引导至所述靶RNA序列时,所述复合物在所述靶RNA序列处或附近特异性切割所述SOD1 mRNA。
在一些实施方式中,所述靶RNA序列包含SEQ ID NO:73中的一段连续核苷酸;任选地SEQ ID NO:73中的20-50个连续核苷酸,或20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49或50个连续核苷酸,如30个连续核苷酸,如SEQ ID NO:39-54中的任一个。
在一些实施方式中,所述靶RNA序列包含SEQ ID NO:73中的一段连续核苷酸;任选地SEQ ID NO:73中的15-60个连续核苷酸,或15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59或60个连续核苷酸,如30个连续核苷酸,如SEQ ID NO:39-54中的任一个。
在一些实施方式中,所述靶RNA序列包含SEQ ID NO:39-54中的任一个中的至少15个连续核苷酸。
在一些实施方式中,所述gRNA包含两个或更多个相同或不同的间隔序列,每个间隔序列侧接两个所述DR序列。
在一些实施方式中,所述gRNA包含两个不同的间隔序列(例如,间隔子1和间隔子2),其将三个所述DR序列隔开(例如,DR-间隔子1-DR-间隔子2-DR)。
在一些实施方式中,所述gRNA包含一个或多个间隔序列,每个间隔序列独立地选自SEQ ID NO:23-38中的任一个或其变体,所述变体与SEQ ID NO:23-38中的任一个的差异为至多1、2、3、4、5或6个核苷酸且基本上不减弱引导所述Cas13多肽与所述sgRNA结合以形成靶向相应靶序列的Cas13-sgRNA复合物以切割所述靶序列的能力。
在一些实施方式中,所述gRNA包含一个或多个间隔序列,每个间隔序列包含(1)SEQ ID NO:23-38中的任一个;(2)SEQ ID NO:23-38中的任一个中的至少15个连续核苷酸;或(3)SEQ ID NO:23-38中的任一个的变体,所述变体与SEQ ID NO:23-38中的任一个的差异为至多1、2、3、4、5、6、7、8、9或10个核苷酸且基本上不降低所述复合物切割所述SOD1mRNA的能力。
在一些实施方式中,所述DR序列包含(1)SEQ ID NO:6;(2)与SEQ ID NO:6具有至少90%、92%、94%、95%、96%、98%或99%同一性的序列;(3)与SEQ ID NO:6具有最多1、2、3、4或5个核苷酸差异的序列;或(4)具有与SEQ ID NO:6的二级结构基本上相同的二级结构的序列。
在一些实施方式中,所述DR序列包含(1)SEQ ID NO:6;(2)具有与SEQ ID NO:6的二级结构基本上相同的二级结构的序列;或(3)SEQ ID NO:6的变体,所述变体与SEQ IDNO:6的差异为至多1、2、3、4、5、6、7、8、9或10个核苷酸且基本上不降低所述复合物切割所述SOD1 mRNA的能力。
在一些实施方式中,所述Cas13多肽包含Cas13a多肽、Cas13b多肽、Cas13c多肽、Cas13d多肽、Cas13e多肽或Cas13f多肽。
在一些实施方式中,所述Cas13多肽包含
(a)SEQ ID NO:2或4,或者
(b)SEQ ID NO:2或4的变体,所述变体与SEQ ID NO:1具有至少80%、85%、90%、95%、96%、97%、98%或99%同一性,并且在SEQ ID NO:1的Y666和/或Y677处具有非保守取代(例如,Y666A和/或Y677A取代),其中所述变体具有与SEQ ID NO:1基本上相同(例如,至少约80%、90%、95%、99%或更多)的指导RNA特异性核酸酶活性并且基本上没有(例如,最多20%、15%、10%、5%)SEQ ID NO:1的旁切(指导RNA非依赖性)核酸酶活性。
本发明的另一方面提供组合物,所述组合物包含如本文所述的gRNA。
在一些实施方式中,所述组合物进一步包含如本文所述的Cas13多肽。
本发明的另一方面提供细胞或其后代,所述细胞或其后代包含如本文所述的AAV载体基因组、如本文所述的rAAV病毒颗粒、如本文所述的gRNA、或如本文所述的组合物。
本发明的另一方面提试剂盒,所述试剂盒包含如本文所述的AAV载体基因组、如本文所述的rAAV病毒颗粒、如本文所述的gRNA、如本文所述的组合物、或如本文所述的细胞或其后代。
本发明的另一方面提供制备如本文所述的rAAV颗粒的方法,所述方法包括:
a)将编码如本文所述的rAAV载体基因组的核酸或从其转录的RNA序列、和如本文所述的AAV衣壳的编码序列引入AAV包装***中持续一段时间,所述时间足以将所述rAAV载体基因组或所述转录的RNA包装到所述AAV衣壳中以产生所述rAAV颗粒,以及
b)收获所述rAAV颗粒;以及任选地,
c)分离或纯化所述收获的rAAV颗粒。
附图说明
图1是使用mCherry作为报告子的表达hfCas13f v1和sgRNA-hSOD1的构建体以及表达靶向hSOD1的shRNA的构建体的示意图(未按比例绘制)。
图2示出了CRISPR-hfCas13f v1***对hSOD1 mRNA的体外敲低的图,该敲低相对于作为100%的阴性对照进行归一化。hSOD1 mRNA水平通过RT-qPCR检测。N=3/组。数据表示为平均值±SEM。*,P<0.05;**,P<0.01(未配对的双尾Student’s t检验)。n.s.-不显著。
图3是表达hfCas13f v1和sgRNA5&7-hSOD1的构建体的示意图(未按比例绘制),该构建体使用mCherry作为报告子。
图4示出了CRISPR-hfCas13f v1***对hSOD1 mRNA的体外敲低的图,该敲低相对于作为100%的阴性对照进行归一化。hSOD1 mRNA水平通过RT-qPCR检测。N=3/组。数据表示为平均值±SEM。**,P<0.01(未配对的双尾Student’s t检验)。
图5a是表达hfCas13f v2和sgRNA[hSOD1]的构建体的示意图(未按比例绘制),该构建体使用mCherry作为报告子;图5b示出了CRISPR-hfCas13f v2***对hSOD1mRNA的体外敲低的图,该敲低相对于作为100%的阴性对照进行归一化。hSOD1mRNA水平通过RT-qPCR检测。N=3-4/组。数据表示为平均值±SEM。*,P<0.05;***,P<0.001(未配对的双尾Student’st检验)。n.s.-不显著。
图6是示例性AAV载体基因组AAV9-M8-hfCas13f v2-sgRNA[hSOD1]5&7以及阴性对照的示意图(未按比例绘制)。
图7是使用AAV9-M8治疗SOD1突变模型小鼠以及后续检测的示意图,该AAV9-M8递送降低hSOD1表达的hfCas13f v2-sgRNA[hSOD1]5&7。
图8示出了编码hfCas13f v2-sgRNA[hSOD1]5&7的rAAV9-M8颗粒在脊髓神经元中的高转导效率。比例尺,100μm。
图9示出了在将AAV9-M8-hfCas13f v2-sgRNA[hSOD1]5&7鞘内注射到SOD1-G93A小鼠后用蛋白质印迹法检测到的hSOD1蛋白的表达降低。每组含有在注射后第4周收采的3条脊髓。脊髓分为颈、胸和腰区段。使用ImageJ进行蛋白质印迹法灰度分析。N=3/组。数据表示为平均值±SEM。*,P<0.05(未配对的双尾Student’s t检验)。
图10示出了在鞘内注射到SOD1-G93A小鼠后使用免疫染色检测到的hSOD1的表达降低。在注射后第4周收采脊髓。比例尺,100μm。
图11a和11b示出了不同组的小鼠的生存率曲线和死亡日龄;图11c示出了由在指示的天数测量的小鼠握力指示的运动性能;图11d示出了在指示的天数测量的小鼠重量。非转基因N=15;SOD1-G93A N=12;AAV(6.0E11)N=6;AAV(2.0E12)N=10;AAV(6.0E12)N=7。数据表示为平均值±SEM。*,P<0.05;**,P<0.01;***,P<0.001。(b)对数-秩Mantel-Cox检验;(c)未配对的双尾Student’s t检验。
具体实施方式
1.概述
本文所述的发明提供了用于治疗SOD1相关疾病(如肌萎缩侧索硬化(ALS))的CRISPR-Cas13***和方法。
特别地,本文所述的发明提供了CRISPR-Cas13***,该***用于通过切割SOD1mRNA(包括突变的SOD1 mRNA)来敲低SOD1基因的表达,从而防止与疾病相关的突变SOD1蛋白的表达。这样的***可以通过AAV载体和向有需要的受试者进行鞘内注射来递送。本发明的示例性构建体已经证明了敲低SOD1 mRNA和蛋白质水平(尤其是在体内)以及改善小鼠疾病模型的疾病表型的功效,从而为基因疗法治疗SOD1相关疾病(如ALS)打开了大门。
2.代表性Cas13效应酶
本文的Cas13多肽可以包含Cas13a多肽、Cas13b多肽、Cas13c多肽、Cas13d多肽、Cas13e多肽或Cas13f多肽。
虽然野生型或天然2类VI型酶或Cas13为基因疗法敲低靶基因产物(例如,mRNA)提供了巨大的机会,但它们的使用本质上受限于所谓的旁切活性,该旁切活性带来显著的细胞毒性风险。
特别地,在2类VI型***中,在靶RNA结合后,Cas13中的高等真核生物和原核生物核苷酸结合(HEPN)结构域赋予间隔(或指导RNA)序列非特异性(非依赖性)RNA切割,称为“(脱靶)旁切”。与结合的gRNA互补的同源靶ssRNA的结合导致Cas13效应酶发生实质性的构象变化,从而导致形成单一的复合催化位点,用于指导序列非依赖性“旁切”RNA切割,从而将Cas13转化为序列非特异性核糖核酸酶。该新形成的高度可及的活性位点不仅会以顺式降解靶RNA(如果该靶RNA足够长,能够到达该新的活性位点),而且还会基于该混杂的RNA酶活性(旁切活性)以反式降解非靶RNA。
大多数RNA似乎容易受到Cas13这种混杂的RNA酶活性的影响,并且大多数(如果不是全部)Cas13效应酶具有该旁切活性。最近已证明,Cas13介导的敲低带来的旁切活性存在于哺乳动物细胞和动物中,这表明Cas13介导的靶RNA敲低的临床应用在旁切活性存在的情况下将面临重大挑战。
因此,为了在基因疗法中使用Cas13酶特异性敲低靶RNA,显然必须严格控制该旁切活性,以防止不想要的自发性细胞毒性。
已经开展了工作以提供降低或消除不期望的旁切活性,同时维持期望的中靶切割活性(或简称“切割活性”)的工程化Cas13(例如,hfCas13f v1、hfCas13f v2)蛋白。参见PCT/CN2021/121926,将该文献通过援引以其全文并入本文。
本文所述的发明提供了工程化Cas13(例如,hfCas13f v1、hfCas13f v2)蛋白与经设计的gRNA的组合物及使用其来治疗SOD1相关疾病(例如,ALS)的方法。
在一些实施方式中,本文使用的Cas13蛋白:
(1)包含在空间上接近对应的亲本(或参考)Cas13的内切核酸酶催化结构域(例如,HEPN结构域)的区域中的突变;
(2)基本上保存(例如,保留至少50%、60%、70%、72.5%、75%、80%、85%、87.5%、90%、95%、96%、97%、97.5%、98%、99%或更多的)亲本(或参考)Cas13对与指导序列互补的靶RNA的切割活性;和
(3)基本上缺乏(例如,保留少于50%、40%、35%、30%、27.5%、25%、22.5%、20%、17.5%、15%、12.5%、10%、7.5%、5%、4%、3%、2.5%、2%、1%或更少的)亲本(或参考)Cas13对不与指导序列结合的非靶RNA的旁切活性。
在一些实施方式中,Cas13是Cas13f,如SEQ ID NO:1。在一些实施方式中,亲本(或参考)Cas13是亲本(或参考)Cas13f,如SEQ ID NO:1。
在一些实施方式中,该区域包括距离Cas13f的一级序列中的内切核酸酶催化结构域(例如,RXXXXH结构域)的任何残基在140、130、120、110、100、90、80、70、60、50、40、30、20或10个氨基酸以内的残基。
在一些实施方式中,该区域包括距离Cas13的一级序列中的内切核酸酶催化结构域的任何残基超过100、110、120或130个残基,但在空间上在该内切核酸酶催化结构域的残基的1-10或5埃内的残基。
在一些实施方式中,内切核酸酶催化结构域是HEPN结构域,任选地是包含RXXXXH基序的HEPN结构域。
在一些实施方式中,RXXXXH基序包含R{N/H/K/Q/R}X1X2X3H序列。
在一些实施方式中,在R{N/H/K/Q/R}X1X2X3H序列中,X1是R、S、D、E、Q、N、G、或Y;X2是I、S、T、V或L;并且X3是L、F、N、Y、V、I、S、D、E或A。
在一些实施方式中,RXXXXH基序是N-末端RXXXXH基序,该N-末端RXXXXH基序包含RNXXXH序列,如RN{Y/F}{F/Y}SH序列。
在一些实施方式中,N-末端RXXXXH基序具有RNYFSH序列。
在一些实施方式中,N-末端RXXXXH基序具有RNFYSH序列。
在一些实施方式中,RXXXXH基序是包含R{N/A/R}{A/K/S/F}{A/L/F}{F/H/L}H序列的C-末端RXXXXH基序。
在一些实施方式中,C-末端RXXXXH基序具有RN(A/K)ALH序列。
在一些实施方式中,C-末端RXXXXH基序具有RAFFHH或RRAFFH序列。
在一些实施方式中,该区域包含以下、基本上由以下组成、或由以下组成:对应于SEQ ID NO:1的HEPN1结构域(例如,残基1-168)、Helical1结构域、Helical2结构域(例如,残基346-477)和HEPN2结构域(例如,残基644-790)的残基。
在一些实施方式中,突变包含在该区域内的一段15-20个连续氨基酸内的以下取代、基本上由其组成、或由其组成:(a)一个或多个带电荷的、含氮侧链基团的、大的(如F或Y)、脂肪族和/或极性残基至电荷中性的短链脂肪族残基(如A、V或I);(b)一个或多个I/L至A的取代;和/或(c)一个或多个A至V的取代。
在一些实施方式中,该一段为约16或17个残基。
在一些实施方式中,该一段内除了至多1、2或3个之外的基本上所有带电荷的和极性残基都被取代。
在一些实施方式中,该一段内总共约7、8、9或10个带电荷的和极性残基被取代。
在一些实施方式中,该一段的N-末端和C-末端的2个残基被取代为编码序列含有限制酶识别序列的氨基酸。
在一些实施方式中,N-末端的两个残基是VF,并且C-末端的2个残基是ED,并且限制酶是BpiI。
在一些实施方式中,一个或多个带电荷的或极性残基包含N、Q、R、K、H、D、E、Y、S和T残基。
在一些实施方式中,一个或多个带电荷的或极性残基包含R、K、H、N、Y和/或Q残基。
在一些实施方式中,该一段内的一个或多个Y残基被取代。
在一些实施方式中,一个或多个Y残基对应于亲本(或参考)Cas13f.1(SEQ ID NO:1)的Y666和/或Y677。
在一些实施方式中,电荷中性的短链脂肪族残基是Ala(A)。
在一些实施方式中,突变包含以下、基本上由以下组成、或由以下组成:
(a)在该区域内的一段15-20个连续氨基酸中的1、2、3、4或5个内的取代;
(b)对应于Cas13f突变(例如,D160A、Q163A、D642A、L631A、P667A、H638A、T647A、D762A、L634A、L641A、V670A、A763V、T161A、R157A)的突变,该Cas13f突变保留亲本(或参考)Cas13f(如SEQ ID NO:1)的至少约75%的指导RNA特异性切割,并且展现出亲本(或参考)Cas13f(如SEQ ID NO:1)的小于约25%或27.5%的旁切效应;
(c)对应于PCT/CN2021/121926的实施例12和13中的Cas13f突变的F10S6、F38S12、F38S11、F7V2、F10V1、F10V4、F40V2、F40V4、F44V2、F10S19、F10S21、F10S24、F10S26、F10S27、F10S33、F10S34、F10S35、F10S36、F10S45、F10S46、F10S48、F10S49、F40S22、F40S23、F40S26、F40S27或F40S36突变、或其组合的突变;任选地,该Cas13f突变包含(A)选自D160A、Q163A、D642A、L631A、P667A、H638A、T647A、D762A、L634A、L641A、V670A、A763V、T161A、R157A(如F10S6(即,D160A)+F38S12(即,D642A))的任何一个、两个或更多个(例如,3个、4个或5个以上)突变与F40S23(即,Y666A和Y677A)的组合;(B)选自Cas13f v2(即F40S23,即Y666A和Y677A)+L631A&H638A、Cas13f v2+L631A&L641A、Cas13f v2+L631A&D642A、Cas13f v2+D160A&L631A、Cas13f v2+H638A&L641A、Cas13f v2+H638A&D642A、Cas13f v2+L641A&D642A、以及Cas13f v2+D160A&D642A的任何组合突变;(C)Y666A/Y677A双重突变与选自D160A、L641A和D642A的1、2或3个另外突变的组合;或(D)Y666A/Y677A/D160A/D642A突变。
(d)对应于Cas13f突变(例如,PCT/CN2021/121926的实施例12的Cas13f突变)的突变,该Cas13f突变保留亲本(或参考)Cas13f(如SEQ ID NO:1)的约50%-75%之间的指导RNA特异性切割,并且展现出亲本(或参考)Cas13f(如SEQ ID NO:1)的少于约25%或27.5%的旁切效应;和/或
(e)对应于Cas13f突变的F2V4、F3V1、F3V3、F3V4、F5V2、F5V3、F6V4、F7V1、F38V4、F40V1、F41V1、F41V3、F42V4、F43V1、F10S2、F10S11、F10S12、F10S18、F10S20、F10S23、F10S25、F10S28、F10S43、F10S44、F10S47、F10S50、F10S51、F10S52、F40S7、F40S9、F40S11、F40S21、F40S22、F40S24、F40S28、F40S29、F40S30、F40S35、或F40S37或突变的突变。
在一些实施方式中,Cas13保存亲本(或参考)Cas13对靶RNA的至少约50%、60%、70%、72.5%、75%、80%、85%、87.5%、90%、95%、96%、97%、97.5%、98%、99%或更多的指导序列特异性内切核酸酶切割活性。
在一些实施方式中,Cas13缺乏亲本(或参考)Cas13对非靶RNA的至少约70%、72.5%、75%、77.5%、80%、82.5%、85%、87.5%、90%、92.5%、95%、96%、97%、98%、99%或100%的指导序列非依赖性内切核酸酶旁切活性。
在一些实施方式中,工程化Cas13保存亲本(或参考)Cas13对靶RNA的指导序列特异性内切核酸酶切割活性的至少约80%-90%,并且缺乏亲本(或参考)Cas13对非靶RNA的指导序列非依赖性内切核酸酶旁切活性的至少约95%-100%。
在一些实施方式中,Cas13f蛋白进一步包含核定位信号(NLS)序列或核输出信号(NES)。
在一些实施方式中,Cas13蛋白包含N-末端和/或C-末端NLS。
在一些实施方式中,Cas13蛋白包含SEQ ID NO:2或4、基本上由其组成、或由其组成。
在一些实施方式中,本文使用的Cas13蛋白包含Cas13多肽,其中所述Cas13编码序列包含:
(a)SEQ ID NO:2(hfCas13f v1)或4(hfCas13f v2)的氨基酸序列,或
(b)与SEQ ID NO:1(美国申请号16/864,982中的Cas13f.1)具有至少80%、85%、90%、95%、96%、97%、98%或99%同一性,并且在SEQ ID NO:1的Y666和/或Y677处具有非保守取代(例如,Y666A和/或Y677A取代)的其变体,其中所述变体具有与SEQ ID NO:1基本上相同(例如,至少约80%、90%、95%、99%或更多)的指导RNA特异性核酸酶活性(切割活性)并且基本上没有(例如,最多20%、15%、10%、5%)SEQ ID NO:1的旁切(指导RNA非依赖性)核酸酶活性(旁切活性)。
3.多核苷酸和AAV载体基因组
本发明的一个方面提供重组腺相关病毒(rAAV)载体基因组,所述rAAV载体基因组包含(1)Cas13编码序列,所述Cas13编码序列编码本发明的工程化Cas13多肽(其基本上缺乏旁切核酸酶活性,但基本上保留衍生这样的Cas13多肽的原始Cas13蛋白的切割活性);以及(2)gRNA或编码所述gRNA的gRNA编码序列,其靶向靶基因转录物(如SOD1 mRNA),其中所述gRNA包含与靶RNA上的靶RNA序列基本上互补的间隔序列和能够与所述Cas13多肽形成复合物的同向重复(DR)序列。
更特别地,本发明的一个方面提供重组腺相关病毒(rAAV)载体基因组,所述rAAV载体基因组包含:
(1)编码Cas13多肽的Cas13编码序列,
(i)其中所述Cas13编码序列与SEQ ID NO:3或5或其RNA对应物具有至少80%、85%、90%、95%、96%、97%、98%、99%、99.2%、99.4%、99.6%、99.8%、99.9%或100%同一性,
(ii)其中所述Cas13多肽包含
(a)SEQ ID NO:2或4,或者
(b)SEQ ID NO:2或4的变体,所述变体与SEQ ID NO:1具有至少80%、85%、90%、95%、96%、97%、98%或99%同一性,并且在Y666和/或Y677处具有非保守取代(例如,Y666A和/或Y677A取代),其中所述变体具有与SEQ ID NO:1基本上相同(例如,至少约80%、90%、95%、99%或更多)的指导RNA特异性核酸酶活性(切割活性)并且基本上没有(例如,最多20%、15%、10%、5%)SEQ ID NO:1的旁切(指导RNA非依赖性)核酸酶活性(旁切活性);和
(2)单指导RNA(sgRNA)或编码所述sgRNA的sgRNA编码序列,所述sgRNA包含:
(A)与SOD1 mRNA上的靶RNA序列基本上互补的间隔序列;和
(B)能够与所述Cas13多肽形成复合物的同向重复(DR)序列;
其中当所述sgRNA将所述Cas13多肽引导至所述靶RNA序列时,所述复合物在所述靶RNA序列处或附近特异性切割所述SOD1 mRNA。
Cas13编码序列或其RNA对应物、以及sgRNA或其编码序列可以以5'-3'方向或3'-5'方向放置。
末端反向重复(ITR)序列对于病毒DNA复制的启动和腺相关病毒基因组的环化很重要。在ITR序列内,二级结构(例如,由回文序列形成的茎和环)在病毒复制和/或包装中是重要的一种或多种ITR功能。这样的序列元件包括RBE序列(Rep结合元件)、RBE'序列和trs(末端分解序列(terminal resolution sequence))。
在某些实施方式中,所述rAAV载体基因组包含5'AAV ITR序列和/或3'AAV ITR序列。
在某些实施方式中,所述5'AAV ITR序列和/或所述3'AAV ITR序列两者都是来自以下的野生型AAV ITR序列:AAV1、AAV2、AAV3A、AAV3B、AAV4、AAV5、AAV6、AAV7、AAVrh74、AAV8、AAV9、AAV10、AAV11、AAV12、AAV13、AAV-DJ、AAV PHP.eB、或所述AAV1-AAV13中的任一者所属的进化枝的成员,或其功能性截短变体。
在某些实施方式中,所述5'AAV ITR序列和所述3'AAV ITR序列两者都是来自AAV2的野生型AAV ITR序列。
在某些实施方式中,所述5'ITR序列和/或所述3'ITR序列是经修饰的ITR序列。例如,可以缺失野生型ITR序列(例如,AAV5、8、9,PHP.eB,或DJ ITR序列)的5'最末端或3'最末端。缺失可以为至多18、17、16、15、14、13、12、11、10、9、8、7、6、5、4、3、2、或1个核苷酸。
在某些实施方式中,可以缺失野生型AAV2 ITR序列的5'最末端核苷酸的至多15个(如正好15个)核苷酸、和/或3'最末端核苷酸的至多15个(如正好15个)核苷酸。
因此,一个或多个5'和/或3'经修饰的ITR可包含145个nt的野生型AAV ITR序列的至多144、143、142、141、140、139、138、137、136、135、134、133、132、131、130、129、128、或127个nt(如130个核苷酸)。
在某些实施方式中,所述经修饰的ITR序列包含wt ITR序列的RBE序列、RBE'序列、和/或trs。
在某些实施方式中,所述经修饰的ITR序列包含RBE序列和RBE'序列两者。
在某些实施方式中,所述经修饰的ITR序列赋予本发明的包含AAV载体基因组的质粒(参见下文)在细菌中的稳定性,如在质粒产生期间的稳定性。
在某些实施方式中,所述经修饰的ITR不干扰本发明的包含AAV载体基因组的质粒的测序验证。
在某些实施方式中,所述经修饰的5'ITR序列包含不是野生型AAV 5'ITR序列的一部分的5'异源序列。在某些实施方式中,所述经修饰的3'ITR序列包含不是野生型AAV 3'ITR序列的一部分的3'异源序列。
在某些实施方式中,所述经修饰的5'ITR序列包含不是野生型AAV(例如,wt AAV2)5'ITR序列的一部分的5'异源序列,并且所述经修饰的3'ITR序列包含不是野生型AAV(例如,wt AAV2)3'ITR序列的一部分的3'异源序列,其中所述5'异源序列和所述3'异源序列彼此互补。
在某些实施方式中,所述5'异源序列和所述3'异源序列各自包含II型限制性内切核酸酶识别序列,如Sse8387I的识别序列(CCTGCAGG)或PacI的识别序列(TTAATTAA)。
在某些实施方式中,所述5'ITR包含145个nt的wt AAV2 5'ITR的最3'核苷酸的至多141个nt(例如,145个nt的wt AAV2 5'ITR的5'最末端的4个或更多个的缺失)。
在某些实施方式中,所述5'ITR包含145个nt的wt AAV2 5'ITR的最3'核苷酸的至多130个nt(例如,145个nt的wt AAV2 5'ITR的5'最末端的15个或更多个的缺失)。
在某些实施方式中,所述3'ITR包含145个nt的wt AAV2 3'ITR的最5'核苷酸的至多141个nt(例如,145个nt的wt AAV2 3'ITR的3'最末端的4个或更多个的缺失)。
在某些实施方式中,所述3'ITR包含145个nt的wt AAV2 3'ITR的最5'核苷酸的至多130个nt(例如,145个nt的wt AAV2 3'ITR的3'最末端的15个或更多个的缺失)。
在某些实施方式中,所述5'ITR序列和3’ITR序列对于基于三重转染在哺乳动物细胞中的AAV产生是相容的。
在某些实施方式中,所述5'ITR序列和3’ITR序列对于基于杆状病毒载体(参见下文)在昆虫细胞(例如,Sf9)中的AAV产生是相容的。
在某些实施方式中,所述5'ITR序列和3’ITR序列对于基于HSV载体(参见下文)在哺乳动物细胞中的AAV产生是相容的。
在某些实施方式中,所述5’AAV ITR序列包含SEQ ID NO:71、基本上由其组成、或由其组成。
在某些实施方式中,所述3’AAV ITR序列包含SEQ ID NO:72、基本上由其组成、或由其组成。
在一些实施方式中,本文所述的Cas13多核苷酸与调节元件(例如,启动子)可操作地连接以控制所述Cas13多肽的表达。在一些实施方式中,所述启动子是广谱的。在一些实施方式中,所述启动子是组成型启动子。在一些实施方式中,所述启动子是诱导型启动子。在一些实施方式中,所述启动子是细胞特异性启动子。在一些实施方式中,所述启动子是生物特异性启动子,例如组织特异性启动子。
合适的启动子是本领域已知的并且包括例如Cbh启动子、Cba启动子、pol I启动子、pol II启动子、pol III启动子、T7启动子、U6启动子、H1启动子、逆转录病毒劳斯肉瘤病毒LTR启动子、巨细胞病毒(CMV)启动子、SV40启动子、二氢叶酸还原酶启动子、β-肌动蛋白启动子、延伸因子1α短(EFS)启动子、β葡糖醛酸糖苷酶(GUSB)启动子、巨细胞病毒(CMV)即早(Ie)增强子和/或启动子、鸡β-肌动蛋白(CBA)启动子或其衍生物如CAG启动子、CB启动子、(人)延伸因子1α-亚基(EF1α)启动子、泛素C(UBC)启动子、朊病毒启动子、神经元特异性烯醇化酶(NSE)、神经丝轻链(NFL)启动子、神经丝重链(NFH)启动子、血小板衍生生长因子(PDGF)启动子、血小板衍生生长因子B链(PDGF-β)启动子、突触蛋白(Syn)启动子、突触蛋白1(Syn1)启动子、甲基-CpG结合蛋白2(MeCP2)启动子、Ca2+/钙调蛋白依赖性蛋白激酶II(CaMKII)启动子、代谢型谷氨酸受体2(mGluR2)启动子、神经丝轻链(NFL)启动子、神经丝重链(NFH)启动子、β-珠蛋白小基因nβ2启动子、前脑啡肽原(PPE)启动子、脑啡肽(Enk)启动子、兴奋性氨基酸转运蛋白2(EAAT2)启动子、胶质纤维酸性蛋白(GFAP)启动子、髓鞘碱性蛋白(MBP)启动子。例如,U6启动子可用于调节本文所述的gRNA分子的表达。在一些实施方式中,延伸因子1α短(EFS)启动子可用于调节本文所述的Cas13蛋白的表达。
在一些实施方式中,所述启动子是Cbh启动子(如包含SEQ ID NO:63的多核苷酸序列、基本上由其组成、或由其组成的Cbh启动子)或Cba启动子(如包含SEQ ID NO:62的多核苷酸序列、基本上由其组成、或由其组成的Cba启动子)。
在某些实施方式中,本发明的rAAV载体基因组进一步包含与所述Cas13多肽的N-末端、C-末端、和/或内部融合的核定位序列(NLS)的编码序列,和/或与所述Cas13多肽的N-末端、C-末端、和/或内部融合的核输出信号(NES)的编码序列。
在某些实施方式中,本发明的rAAV载体基因组包含在所述Cas13多核苷酸的5'的第一NLS编码序列、和/或在所述Cas13多核苷酸的3'的第二NLS编码序列(例如,包含所述第一NLS编码序列和所述第二NLS编码序列两者)。
在某些实施方式中,所述NLS、所述第一NLS和所述第二NLS包含SEQ ID NO:66、基本上由其组成、或由其组成。
在某些实施方式中,本发明的rAAV载体基因组进一步包含Kozak序列或其功能性变体。在某些实施方式中,所述Kozak序列是“GCCACC”;或包含除所述Kozak序列内的ATG起始密码子(如果存在)之外与“GCCACC”的差异为最多1、2、3或4个核苷酸的序列,其中最后三个核苷酸任选地是ACC或GCC。
在某些实施方式中,本发明的rAAV载体基因组进一步包含聚腺苷酸化(polyA)信号序列。在某些实施方式中,所述polyA信号序列选自生长激素聚腺苷酸化信号(bGHpolyA)、小polyA信号(SPA)、人生长激素聚腺苷酸化信号(hGH polyA)、SV40 polyA信号(SV40 polyA)、兔β珠蛋白polyA信号(rBG polyA)、或其变体。在某些实施方式中,所述polyA信号序列是bgh-polyA信号序列或其功能性变体(如SEQ ID NO:67)。
在某些实施方式中,用于转录靶向所述靶基因转录物(例如,SOD1 mRNA)的gRNA的表达盒包含RNA pol III启动子,其中所述第二转录单元在所述Cas13多核苷酸的3'。
在某些实施方式中,所述RNA pol III启动子是U6(如SEQ ID NO:68)、H1、7SK、或其变体。
在某些实施方式中,所述gRNA编码序列编码包含一个或多个(例如,2个或3个)间隔序列的gRNA,每个间隔序列与靶RNA(例如SOD1 mRNA)的靶RNA序列基本上互补,并且能够引导本文的Cas13多肽切割所述靶RNA。多个间隔序列和相关的DR序列的更详细描述在下文的单独部分(通过援引并入本文)中提供。
在某些实施方式中,本发明的rAAV载体基因组包含ITR至ITR多核苷酸(如SEQ IDNO:75),所述ITR至ITR多核苷酸从5'到3'包含:
(a)来自AAV2的5'ITR(如SEQ ID NO:71);
(b)Cbh启动子(例如,包含增强子序列(如SEQ ID NO:64)和内含子序列(如SEQ IDNO:65)的Cbh启动子;任选地,所述Cbh启动子包含SEQ ID NO:63);
(c)Kozak序列(如“GCCACC”);
(d)第一NLS编码序列(如编码SEQ ID NO:66的序列);
(e)编码除第一氨基酸M外的SEQ ID NO:2或4的Cas13多肽的Cas13多核苷酸(如除起始密码子ATG外的SEQ ID NO:3或5);
(f)第二NLS编码序列(如编码SEQ ID NO:66的序列);
(g)任选的编码HA标签序列(例如,SEQ ID NO:74)的三个串联重复序列的编码序列;
(h)bGH polyA信号序列(如SEQ ID NO:67);
(i)U6启动子(如SEQ ID NO:68);
(j)编码第一同向重复序列(DR)(如SEQ ID NO:6)的第一DR DNA编码序列;
(k)编码对SOD1 mRNA具有特异性的第一间隔序列(如SEQ ID NO:27或29)的第一间隔子编码序列;
(l)编码第二DR(如SEQ ID NO:6)的第二DR DNA编码序列;
(m)编码对SOD1 mRNA具有特异性的第二间隔序列(如SEQ ID NO:27或29)的第二间隔子编码序列;
(n)编码第三DR(如SEQ ID NO:6)的第三DR DNA编码序列;和
(o)来自AAV2的3'ITR(如SEQ ID NO:72);
或与所述ITR至ITR多核苷酸具有至少约90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%、99.6%、99.7%、99.8%、99.9%同一性的多核苷酸;
任选地,所述ITR至ITR多核苷酸进一步包含在(a)–(o)中的任何两个相邻序列元件之间的接头序列;
任选地,在(i)至(n)序列元件的5'的(b)至(h)序列元件被重定位到(i)至(n)序列元件的3’。
在某些实施方式中,重组AAV(rAAV)载体基因组包含以下、基本上由以下组成或由以下组成:
(1)SEQ ID NO:75,或与其具有至少约90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%、99.6%、99.7%、99.8%、99.9%同一性的多核苷酸;
其中所述多核苷酸编码以下的Cas13多肽:
(a)SEQ ID NO:2或4,或者
(b)SEQ ID NO:2或4的变体,所述变体与SEQ ID NO:1具有至少80%、85%、90%、95%、96%、97%、98%或99%同一性,并且在SEQ ID NO:1的Y666和/或Y677处具有非保守取代(例如,Y666A和/或Y677A取代),其中所述变体具有与SEQ ID NO:1基本上相同(例如,至少约80%、90%、95%、99%或更多)的指导RNA特异性核酸酶活性并且基本上没有(例如,最多20%、15%、10%、5%)SEQ ID NO:1的旁切(指导RNA非依赖性)核酸酶活性;和
(2)单指导RNA(sgRNA)的编码序列,所述sgRNA包含:
(A)与SOD1 mRNA上的靶RNA序列基本上互补的间隔序列;和
(B)与所述Cas13多肽形成复合物的同向重复(DR)序列,
其中当所述sgRNA将所述Cas13多肽引导至所述靶RNA序列时,在所述靶RNA序列处或附近,所述复合物以与SEQ ID NO:1的Cas13多肽和所述sgRNA的复合物基本上相同(例如,至少约80%、90%、95%、99%或更多)的指导RNA特异性核酸酶活性特异性切割所述SOD1 mRNA并且基本上没有(例如,最多20%、15%、10%、5%)SEQ ID NO:1的Cas13多肽和所述sgRNA的复合物的旁切(指导RNA非依赖性)核酸酶活性。
在某些实施方式中,所述rAAV载体基因组是SEQ ID NO:75或与其具有至少50%、55%、60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%同一性的多核苷酸。在某些实施方式中,所述rAAV载体基因组是SEQ IDNO:75。
在一些实施方式中,所述rAAV载体基因组存在于载体(例如,病毒载体或噬菌体,如HSV载体、杆状病毒载体、或AAV载体)中。所述载体可以是克隆载体或表达载体。所述载体可以是质粒、噬菌粒、粘粒等。所述载体可以包括一个或多个允许所述载体在感兴趣的细胞(例如,细菌细胞、昆虫细胞或哺乳动物细胞)中繁殖的调节元件。在一些实施方式中,所述载体包括编码本文所述的CRISPR-Cas13***的单个组分的核酸。在一些实施方式中,所述载体包括多个核酸,每个核酸编码本文所述的CRISPR-Cas13***的组分。
在一个方面,本公开提供与本文所述的核酸序列具有至少50%、55%、60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%同一性的核酸序列,例如,编码如本文所述的Cas13蛋白和gRNA的核酸序列(如ITR至ITR序列,例如SEQ ID NO:75)。
在某些实施方式中,本发明的Cas13多核苷酸序列编码如下氨基酸序列,所述氨基酸序列与本文的Cas13蛋白的氨基酸序列(例如,SEQ ID NO:2或4)具有至少50%、55%、60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%同一性。
在一些实施方式中,所述核酸序列具有至少一部分(例如,至少1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、20、30、40、50、60、70、80、90或100个核苷酸,例如,连续或非连续核苷酸)与本文所述的序列相同。在一些实施方式中,所述核酸序列具有至少一部分(例如,至少1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、20、30、40、50、60、70、80、90或100个核苷酸,例如,连续或非连续核苷酸)与本文所述的序列不同。
在相关的实施方式中,本发明提供如下氨基酸序列,所述氨基酸序列具有至少一部分(例如,至少1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、20、30、40、50、60、70、80、90或100个氨基酸残基,例如,连续或非连续氨基酸残基)与本文所述的序列相同。在一些实施方式中,所述氨基酸序列具有至少一部分(例如,至少1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、20、30、40、50、60、70、80、90或100个氨基酸残基,例如,连续或非连续氨基酸残基)与本文所述的序列不同。
为了确定两个氨基酸序列或两个核酸序列的同一性百分比,出于最佳比较目的对序列进行比对(例如,可以在第一和第二氨基酸或核酸序列中的一者或两者中引入空位以用于最佳比对,并且出于比较目的可以忽略非同源序列)。一般来说,出于比较目的而比对的参考序列的长度应是参考序列长度的至少80%,并且在一些实施方式中是参考序列长度的至少90%、95%或100%。然后比较对应的氨基酸位置或核苷酸位置处的氨基酸残基或核苷酸。当第一序列中的位置被与第二序列中的对应位置相同的氨基酸残基或核苷酸占据时,则分子在该位置处是相同的。将需要引入以进行两个序列的最佳比对的空位的数量和每个空位的长度考虑在内,两个序列之间的同一性百分比是这些序列共享的相同位置的数量的函数。出于本公开的目的,序列的比较和两个序列之间同一性百分比的确定可以使用具有空位罚分12、空位延伸罚分4、以及移码空位罚分5的Blosum 62评分矩阵来完成。
本文所述的Cas13蛋白可以作为核酸分子或多肽递送或使用。
在某些实施方式中,编码所述Cas13蛋白、其衍生物或功能性片段的核酸分子经密码子优化以在宿主细胞或生物中表达。所述宿主细胞可以包括已建立的细胞系(如海拉细胞、293细胞、或293T细胞)或分离的原代细胞。所述核酸可以经密码子优化以用于在任何感兴趣的生物(特别是人细胞或细菌)中使用。例如,所述核酸可以经密码子优化以用于任何原核生物(如大肠杆菌(E.coli))或任何真核生物,如人和其他非人真核生物,包括酵母、蠕虫、昆虫、植物和藻类(包括粮食作物、稻、玉米、蔬菜、水果、树木、草)、脊椎动物、鱼、非人哺乳动物(例如,小鼠、大鼠、兔、狗、鸟(如鸡)、牲畜(母牛或牛、猪、马、绵羊、山羊等)、或非人灵长类动物)。密码子使用表易于获得,例如在www.kazusa.orjp/codon/上可获得的“密码子使用数据库(Codon Usage Database)”中,并且这些表能以多种方式进行调整。参见Nakamura等人,Nucl.Acids Res.[核酸研究]28:292,2000(将该文献通过援引以其全文并入本文)。用于密码子优化特定序列以在特定宿主细胞中表达的计算机算法也是可获得的,如Gene Forge(Aptagen公司;宾夕法尼亚州雅各布斯(Jacobus,Pa))。
在该情况下,经密码子优化的序列的实例是经优化以在以下中表达的序列:真核生物,例如人(即,经优化以在人中表达),或如本文所讨论的另一真核生物、动物或哺乳动物;参见例如,WO 2014/093622(PCT/US2013/074667)中的经SaCas9人密码子优化的序列。尽管这是优选的,但应理解其他实例是可能的,并且用于人以外的宿主物种的密码子优化或用于特定器官的密码子优化是已知的。一般来说,密码子优化是指在维持天然氨基酸序列的情况下通过以下方式修饰核酸序列以增强在感兴趣的宿主细胞中的表达的方法:用该宿主细胞的基因中更频繁使用或最频繁使用的密码子替代天然序列的至少一个密码子(例如,约或超过约1、2、3、4、5、10、15、20、25、50或更多个密码子)。多种物种对特定氨基酸的某些密码子表现出特定偏倚。密码子偏倚(生物之间密码子使用的差异)通常与信使RNA(mRNA)的翻译效率相关,而该信使RNA(mRNA)的翻译效率又被认为尤其依赖于被翻译的密码子的特性和特定的转移RNA(tRNA)分子的可获得性。选定的tRNA在细胞中的优势通常反映出肽合成中最频繁使用的密码子。相应地,可以对基因进行定制以基于密码子优化在给定生物中实现最佳基因表达。密码子使用表易于获得,例如在http://www.kazusa.orjp/codon/上可获得的“密码子使用数据库”中,并且这些表能以多种方式进行调整。参见Nakamura,Y.等人“Codon usage tabulated from the international DNA sequencedatabases:status for the year 2000[从国际DNA序列数据库制表的密码子使用:2000年的状况]”Nucl.Acids Res.[核酸研究]28:292(2000)。用于密码子优化特定序列以在特定宿主细胞中表达的计算机算法也是可获得的,如Gene Forge(Aptagen公司;宾夕法尼亚州雅各布斯)也是可获得的。在一些实施方式中,编码Cas的序列中的一个或多个密码子(例如,1、2、3、4、5、10、15、20、25、50或更多个或所有密码子)对应于特定氨基酸最频繁使用的密码子。
4.指导RNA
在一些实施方式中,本文所述的CRISPR***包括至少gRNA。这样的gRNA可以由编码工程化Cas13多肽的相同AAV载体基因组编码。如本文所用,指导RNA(gRNA)和CRISPR RNA(crRNA)是可互换的。
在一些实施方式中,所述gRNA包括与靶RNA(如SOD1 mRNA)上的靶RNA序列基本上互补的间隔(间隔子)序列和能够与如本文所述的Cas13多肽形成复合物的同向重复(DR)序列,其中当所述sgRNA将所述Cas13多肽引导至所述靶RNA序列时,所述复合物在所述靶RNA序列处或附近特异性切割所述靶RNA(如SOD1mRNA)。由于间隔序列与靶RNA序列之间基本上互补,该间隔序列可以经由碱基配对来识别该靶序列、与该靶序列结合和/或杂交。DR序列能够与如本文所述的Cas13多肽形成复合物,并且当间隔序列将所述Cas13多肽引导至靶RNA序列时,该复合物在该靶RNA序列处或附近特异性切割该靶RNA(如SOD1 mRNA)。
在一些实施方式中,所述gRNA是单指导RNA(sgRNA)。如本文所用,“sgRNA”是指在单个RNA序列中包含间隔序列和同向重复序列两者的指导RNA。
在一些实施方式中,所述sgRNA包含如下同向重复序列,基本上由其组成或由其组成,所述同向重复序列与间隔序列优选地在所述间隔序列的3'-端处(在所述间隔序列的3’)连接。
在一些实施方式中,所述sgRNA包含以下、基本上由以下组成或由以下组成:与一个DR序列直接连接的一个间隔序列,像DR-间隔子或间隔子-DR。
在一些实施方式中,所述sgRNA包含以下、基本上由以下组成或由以下组成:与一个DR序列间接连接的一个间隔序列,像DR-间隔子-DR。
靶向相同或不同靶RNA的相同或不同靶序列的两个或更多个相同或不同间隔序列可以组合使用。在一些实施方式中,sgRNA包含两个或更多个间隔序列、基本上由其组成、或由其组成。在一些另外的实施方式中,两个或更多个间隔序列中的每一个都侧接两个DR序列,并且任选地其中共享一个DR序列。例如,在两个间隔区序列中的每一个都侧接两个DR序列,其中这两个序列共享一个DR序列的情况下,这就像DR-间隔子-DR-间隔子-DR,其中中间的DR由串联的两个DR-间隔子-DR的sgRNA共享。这样的多间隔子结构(如较大的单gRNA)也可以被考虑并被称为sgRNA阵列。那些间隔序列中的每一个都可以独立地与靶RNA(例如,SOD1 mRNA)上的不同靶RNA序列基本上互补,并且各自能够引导如本文所述的Cas13多肽切割相应的不同靶RNA序列。这样的包含多个间隔序列和DR序列的较大的单gRNA可以被认为整体上是一个sgRNA,或者被认为是串联的两个或更多个sgRNA,每个sgRNA都各含有一个间隔序列和一个或多个DR序列,如果适用,该一个或多个DR序列由串联的两个sgRNA共享。
根据需要可以在DR序列与间隔序列之间引入可切割或不可切割的接头(如酶限制性位点)。
一般来说,本文的Cas13蛋白与DR-间隔子或间隔子-DR的成熟gRNA形成复合物,这可能是由该Cas13蛋白对gRNA阵列的RNA加工产生,并且间隔序列将该复合物引导至与该间隔序列基本上互补和/或与该间隔序列杂交的靶RNA进行序列特异性结合。所得的复合物包含Cas13蛋白和与靶RNA结合的成熟的crRNA。
Cas13***的同向重复序列通常非常保守,尤其是在末端处,例如,在5'-端处的Cas13e的GCUG和Cas13的GCUGU与在3'端处的Cas13e的CAGC和Cas13的ACAGC反向互补。该保守表明潜在地与基因座中的一种或多种蛋白质相互作用的RNA茎-环结构的强碱基配对。
在一些实施方式中,当在RNA中时,同向重复序列包含5'-S1a-Ba-S2a-L-S2b-Bb-S1b-3'的一般二级结构,其中区段S1a和S1b是反向互补序列并形成第一茎(S1),该第一茎(S1)具有在Cas13e中的4个核苷酸和在Cas13中的5个核苷酸;区段Ba和Bb不相互碱基配对,并形成对称的或接近对称的凸起(B),并且各具有在Cas13e中的5个核苷酸、以及分别在Cas13中的5个(Ba)和4个(Bb)或6个(Ba)和5个(Bb)核苷酸;区段S2a和S2b是反向互补序列并形成第二茎(S2),该第二茎(S2)具有在Cas13e中的5个碱基对和在Cas13中的6或5个碱基对;并且L是在Cas13e中的8个核苷酸的环和在Cas13中的5个核苷酸的环。
在某些实施方式中,S1a具有在Cas13e中的GCUG序列和在Cas13中的GCUGU序列。
在某些实施方式中,S2a具有在Cas13e中的GCCCC序列和在Cas13中的A/G CCUC G/A序列(其中第一个A或G可以不存在)。
在某些实施方式中,所述DR序列包含(1)SEQ ID NO:6;(2)具有与SEQ ID NO:6的二级结构基本上相同的二级结构的序列;或(3)SEQ ID NO:6的变体,所述变体与SEQ IDNO:6的差异为至多1、2、3、4、5、6、7、8、9或10个核苷酸且基本上不降低所述复合物切割所述SOD1 mRNA的能力。
如本文所用,短语“基本上不降低复合物切割SOD1 mRNA的能力”意指与具有相同Cas13多肽和相同gRNA、但使用SEQ ID NO:6的亲本DR序列的复合物相比,具有相同Cas13多肽和相同gRNA、但使用SEQ ID NO:6的DR序列变体的复合物切割SOD1 mRNA的能力降低不超过30%、25%、20%、15%、10%、或5%。
在一些实施方式中,同向重复序列包含SEQ ID NO:6的核酸序列、基本上由其组成或由其组成。
如本文所用,“同向重复序列”可以指同向重复RNA序列或编码同向重复RNA序列的同向重复DNA序列。因此,当在RNA分子(如sgRNA)的上下文中提到任何同向重复DNA序列时,编码序列的每个T都被理解为代表U。这同样也适用于间隔序列。
在一些实施方式中,同向重复序列包含如下核酸序列、基本上由其组成或由其组成,该核酸序列具有SEQ ID NO:6的至多1、2、3、4、5、6、7或8个核苷酸的缺失、***或取代。在一些实施方式中,同向重复序列包含如下核酸序列、基本上由其组成或由其组成,该核酸序列与SEQ ID NO:6具有至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的序列同一性(例如,由于SEQID NO:6中核苷酸的缺失、***或取代)。在一些实施方式中,同向重复序列包含如下核酸序列、基本上由其组成或由其组成,该核酸序列与SEQ ID NO:6不相同,但在严格的杂交条件下能够与SEQ ID NO:6的互补序列杂交或者在生理条件下能够与SEQ ID NO:6的互补序列结合。
在某些实施方式中,缺失、***或取代不改变SEQ ID NO:6的总体二级结构(例如,茎和凸起及环的相对位置和/或大小不显著偏离原始茎、凸起和环的相对位置和/或大小)。例如,缺失、***或取代可以在凸起或环区中,使得该凸起的总体对称性大致保持相同。缺失、***或取代可以在茎中,使得这些茎的长度不显著偏离原始茎的长度(例如,在两个茎的每一个中添加或缺失一个碱基对对应于总共4个碱基变化)。
在某些实施方式中,缺失、***或取代导致衍生性DR序列,该衍生性DR序列可在一个或两个茎中具有±1或2个碱基对,在凸起的一条或两条单链中具有±1、2或3个碱基,和/或在环区中具有±1、2、3或4个碱基。
在某些实施方式中,与SEQ ID NO:6不同的任一上述同向重复序列保留在Cas13蛋白中作为同向重复序列(作为SEQ ID NO:6的DR序列)发挥作用的能力。
在一些实施方式中,同向重复序列包含如下核酸、基本上由其组成或由其组成,该核酸具有SEQ ID NO:6的核酸序列,且具有初始一个、两个、三个、四个、五个、六个、七个或八个3'核苷酸的截短。
在经典的CRISPR***中,间隔序列与其对应的靶序列之间的互补程度可以是约50%、60%、75%、80%、85%、90%、95%、97.5%、99%或100%。在一些实施方式中,互补程度是90%-100%。
如本文所用,“基本上互补”意指间隔序列与其对应的靶序列之间的互补程度可以是约90%-100%,如至少90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%。互补程度可以通过100%减去间隔序列/靶序列之间在其全长上的错配来计算。例如,如果30nt的间隔序列和30nt的靶序列在中间有两个错配,则它们的互补程度为100%-2/30=93.3%。据认为,对于本文的Cas13蛋白,可以容忍在间隔序列与靶RNA序列之间的至少2个错配,而不显著降低切割效率。
在一些实施方式中,间隔序列独立地选自SEQ ID NO:23-38中的任一个或其变体,该变体与SEQ ID NO:23-38中的任一个的差异为至多1、2、3、4、5、6、7、8、9或10个核苷酸的缺失、***或取代,基本上不减弱引导如本文所述的Cas13多肽与sgRNA结合以形成靶向相应的靶序列的Cas13-sgRNA复合物以切割该靶序列的能力。
在一些实施方式中,所述间隔序列包含(1)SEQ ID NO:23-38中的任一个;(2)SEQID NO:23-38中的任一个中的至少15个连续核苷酸;或(3)SEQ ID NO:23-38中的任一个的变体,所述变体与SEQ ID NO:23-38中的任一个的差异为至多1、2、3、4、5、6、7、8、9或10个核苷酸且基本上不降低所述复合物切割所述SOD1 mRNA的能力。
如本文所用,短语“基本上不降低复合物切割SOD1 mRNA的能力”意指与具有相同Cas13多肽和相同gRNA、但使用SEQ ID NO:23-28中的任一个的亲本间隔序列的复合物相比,具有相同Cas13多肽和相同gRNA、但使用SEQ ID NO:23-28中的任一个的间隔序列变体的复合物切割SOD1 mRNA的能力降低不超过30%、25%、20%、15%、10%、或5%。
gRNA的长度可以是约5、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、35、40、45、50、75、100、125、150、175、200或更多个核苷酸。例如,为了在Cas13蛋白中使用,间隔子可以在10-60个核苷酸、20-50个核苷酸、25-45个核苷酸、25-35个核苷酸之间,或为约27、28、29、30、31、32或33个核苷酸。
为了减少脱靶相互作用,例如,为了减少gRNA与对其具有低互补性的靶序列相互作用,可以将突变引入CRISPR***中,使得这些CRISPR***可以区分具有大于80%、85%、90%或95%互补性的靶(或中靶)序列与脱靶序列。在一些实施方式中,互补程度为从80%至95%,例如,约83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%或95%(例如,区分具有18个核苷酸的靶标与具有1、2或3个错配的18个核苷酸的脱靶)。相应地,在一些实施方式中,间隔序列与其对应的靶序列之间的互补程度大于94.5%、95%、95.5%、96%、96.5%、97%、97.5%、98%、98.5%、99%、99.5%或99.9%。在一些实施方式中,互补程度是100%。
已证明VI型CRISPR-Cas蛋白采用多于一种RNA指导物,从而使这些蛋白以及包括它们的***和复合物能够实现靶向多个核酸的能力。在一些实施方式中,包含如本文所述的Cas13蛋白的CRISPR***包括多种RNA指导物(例如,两种、三种、四种、五种、六种、七种、八种、九种、十种、十五种、二十种、三十种、四十种或更多种RNA指导物)。在一些实施方式中,本文所述的CRISPR***可以包括单条RNA链或编码单条RNA链的核酸,其中RNA指导物串联排列。单条RNA链可以包括相同RNA指导物的多个拷贝、不同RNA指导物的多个拷贝、或其组合。多个RNA指导物可以呈现为较大的单gRNA(sgRNA阵列,如DR-间隔子-DR-间隔子-DR)或单独的sgRNA。本文所述的Cas13蛋白的加工能力使这些蛋白能够靶向多个靶RNA(例如,靶mRNA)而不丧失活性。在一些实施方式中,Cas13蛋白可以与针对不同靶RNA的多种RNA指导物复合进行递送。在一些实施方式中,Cas13蛋白可以与多种RNA指导物共同递送,每种RNA指导物对不同的靶RNA具有特异性。使用CRISPR相关蛋白进行多重复合(multiplexing)的方法描述于例如美国专利号9,790,490B2和EP 3009511B1中,将各个文献的全部内容通过援引明确并入本文。
在一些实施方式中,本文的gRNA的间隔子长度可以在约10-50个核苷酸的范围内,如15-50个核苷酸、20-50个核苷酸、25-50个核苷酸或19-50个核苷酸。在一些实施方式中,间隔子长度为至少16个核苷酸、至少17个核苷酸、至少18个核苷酸、至少19个核苷酸、至少20个核苷酸、至少21个核苷酸、或至少22个核苷酸。在一些实施方式中,间隔子长度为从15至17个核苷酸(例如,15、16或17个核苷酸)、从17至20个核苷酸(例如,17、18、19或20个核苷酸)、从20至24个核苷酸(例如,20、21、22、23或24个核苷酸)、从23至25个核苷酸(例如,23、24或25个核苷酸)、从24至27个核苷酸、从27至30个核苷酸、从30至45个核苷酸(例如,30、31、32、33、34、35、36、37、38、39、40、41、42、43、44或45个核苷酸)、从30或35至40个核苷酸、从41至45个核苷酸、从45至50个核苷酸(例如,45、46、47、48、49或50个核苷酸)或更长。在一些实施方式中,间隔子长度为从约15至约42个核苷酸。在实施方式中,间隔子长度为30个核苷酸。
在一些实施方式中,本文的gRNA的同向重复序列长度为15-36个核苷酸、为至少16个核苷酸、为从16至20个核苷酸(例如,16、17、18、19或20个核苷酸)、为20-30个核苷酸(例如,20、21、22、23、24、25、26、27、28、29或30个核苷酸)、为30-40个核苷酸(例如,30、31、32、33、34、35、36、37、38、39或40个核苷酸)、或为约36个核苷酸(例如,33、34、35、36、37、38或39个核苷酸)。在实施方式中,同向重复序列长度为36个核苷酸。
在一些实施方式中,gRNA的总长度比本文所述的任一间隔序列长度长本文所述的一个、两个、三个或多个DR序列的长度。在一些实施方式中,gRNA的总体长度比本文所述的任一间隔序列长度长约36、72、108或更多个核苷酸。例如,gRNA的总体长度可以在45-86个核苷酸、或60-86个核苷酸、62-86个核苷酸、或63-86个核苷酸之间。
gRNA序列可以按以下方式进行修饰:允许在本文的gRNA与Cas13蛋白之间形成复合物并与靶标成功结合,同时不允许成功的核酸酶活性(即,没有核酸酶活性/没有导致***缺失)。这些经修饰的gRNA序列称为“死crRNA”、“死gRNA”或“死间隔序列”。关于核酸酶活性,这些死指导物或死间隔序列可以是无催化活性的或无构象活性的。死间隔序列典型地比导致活性RNA切割的相应间隔序列短。在一些实施方式中,死gRNA比具有核酸酶活性的相应gRNA短5%、10%、20%、30%、40%或50%。gRNA的死间隔序列的长度可以为从13至15个核苷酸(例如,长度为13、14或15个核苷酸)、长度为从15至19个核苷酸、或长度为从17至18个核苷酸(例如,长度为17个核苷酸)。
在一些实施方式中,gRNA包含或者是SEQ ID NO:7-22和55中的任一个。
因此,在一个方面,本公开提供非天然存在的或工程化的CRISPR***,这些CRISPR***包括如本文所述的Cas13蛋白和gRNA,其中所述该gRNA包含死gRNA序列,由此该gRNA能够与靶序列杂交,使得将该CRISPR***引导至细胞中感兴趣的靶RNA而没有可检测的核酸酶活性(例如,RNA酶活性)。
对死gRNA的详细描述例如在国际公布号WO 2016/094872中描述,将该文献通过援引以其全文并入本文。
gRNA可以作为诱导型***的组分产生。该***的诱导型性质允许对基因编辑或基因表达进行时空控制。在一些实施方式中,用于诱导型***的刺激包括例如电磁辐射、声能、化学能和/或热能。
在一些实施方式中,gRNA的转录可以由启动子调节,该启动子是广谱启动子、组织特异性启动子、细胞类型特异性启动子、组成型启动子或诱导型启动子。
在一些实施方式中,启动子选自Cbh启动子、Cba启动子、pol I启动子、pol II启动子、pol III启动子、T7启动子、U6启动子、H1启动子、逆转录病毒劳斯肉瘤病毒LTR启动子、巨细胞病毒(CMV)启动子、SV40启动子、二氢叶酸还原酶启动子、β-肌动蛋白启动子、延伸因子1α短(EFS)启动子、β葡糖醛酸糖苷酶(GUSB)启动子、巨细胞病毒(CMV)即早(Ie)增强子和/或启动子、鸡β-肌动蛋白(CBA)启动子或其衍生物如CAG启动子、CB启动子、(人)延伸因子1α-亚基(EF1α)启动子、泛素C(UBC)启动子、朊病毒启动子、神经元特异性烯醇化酶(NSE)、神经丝轻链(NFL)启动子、神经丝重链(NFH)启动子、血小板衍生生长因子(PDGF)启动子、血小板衍生生长因子B链(PDGF-β)启动子、突触蛋白(Syn)启动子、突触蛋白1(Syn1)启动子、甲基-CpG结合蛋白2(MeCP2)启动子、Ca2+/钙调蛋白依赖性蛋白激酶II(CaMKII)启动子、代谢型谷氨酸受体2(mGluR2)启动子、神经丝轻链(NFL)启动子、神经丝重链(NFH)启动子、β-珠蛋白小基因nβ2启动子、前脑啡肽原(PPE)启动子、脑啡肽(Enk)启动子、兴奋性氨基酸转运蛋白2(EAAT2)启动子、胶质纤维酸性蛋白(GFAP)启动子和髓鞘碱性蛋白(MBP)启动子;任选地其中所述启动子是RNA pol III启动子。
在一些实施方式中,所述RNA pol III启动子是U6(如SEQ ID NO:68)、H1、7SK、或其变体。
在一些实施方式中,gRNA的转录可以通过诱导型启动子,例如四环素或强力霉素控制的转录激活(Tet-开和Tet-关表达***)、激素诱导型基因表达***(例如,蜕皮素诱导型基因表达***)和***糖诱导型基因表达***来调节。诱导型***的其他实例包括例如小分子双杂交转录激活***(FKBP、ABA等)、光诱导型***(光敏色素、LOV结构域或隐花色素)或光诱导型转录效应子(LITE)。这些诱导型***描述于例如WO 2016205764和美国专利号8,795,965中,将这两个文献通过援引以其全文并入本文。
可以优化本文所述的gRNA的序列和长度。在一些实施方式中,gRNA的优化长度可以通过鉴定crRNA的加工形式(即,成熟的crRNA)或通过对crRNA四环的经验长度研究来确定。
gRNA还可以包括一个或多个适配序列。适配体是具有特定的三维结构并可以与特定的靶分子结合的寡核苷酸或肽分子。适配体可以对基因效应子、基因激活子或基因阻遏子具有特异性。在一些实施方式中,适配体可以对蛋白质具有特异性,而该蛋白质又对特定的基因效应子、基因激活子或基因阻遏子具有特异性并对其进行募集和/或与其结合。效应子、激活子或阻遏子能够以融合蛋白的形式存在。在一些实施方式中,gRNA具有对相同的衔接蛋白具有特异性的两个或更多个适配序列。在一些实施方式中,两个或更多个适配序列对不同的衔接蛋白具有特异性。衔接蛋白可以包括例如MS2、PP7、Qβ、F2、GA、fr、JP501、M12、R17、BZ13、JP34、JP500、KU1、M11、MX1、TW18、VK、SP、FI、ID2、NL95、TW19、AP205、φkCb5、φkCb8r、φkCb12r、φkCb23r、7s和PRR1。相应地,在一些实施方式中,适配体选自特异性结合如本文所述的任一种衔接蛋白的结合蛋白。在一些实施方式中,适配序列是MS2结合环(5’-ggcccAACAUGAGGAUCACCCAUGUCUGCAGgggcc-3’)。在一些实施方式中,适配序列是Qβ结合环(5’-ggcccAUGCUGUCUAAGACAGCAUgggcc-3’)。在一些实施方式中,适配序列是PP7结合环(5’-ggcccUAAGGGUUUAUAUGGAAACCCUUAgggcc-3’)。对适配子的详细描述可见于例如Nowak等人,“Guide RNA engineering for versatile Cas9 functionality[针对多种Cas9功能的指导RNA工程化],”Nucl.Acid.Res.[核酸研究],44(20):9555-9564,2016;和WO2016205764中,将这些文献通过援引以其全文并入本文。
本发明还涵盖用于递送多种核酸组分的方法,其中每种核酸组分对不同的感兴趣的靶基因座具有特异性,从而修饰多种感兴趣的靶基因座(例如,可以在本发明的构建体中采用两个不同的gRNA,每个gRNA靶向相同SOD1 mRNA内的不同靶序列)。复合物的核酸组分可以包含一个或多个结合蛋白质的RNA适配体。一个或多个适配体可能能够结合噬菌体外壳蛋白。噬菌体外壳蛋白可以选自Qβ、F2、GA、fr、JP501、MS2、M12、R17、BZ13、JP34、JP500、KU1、M11、MX1、TW18、VK、SP、FI、ID2、NL95、TW19、AP205、φCb5、φCb8r、φCb12r、φCb23r、7s和PRR1。在某些实施方式中,噬菌体外壳蛋白是MS2。
5.靶RNA和靶序列
靶RNA可以是任何感兴趣的RNA分子,包括天然存在的和工程化的RNA分子。靶RNA可以是mRNA、tRNA、核糖体RNA(rRNA)、微RNA(miRNA)、干扰RNA(siRNA)、核酶、核糖开关、卫星RNA、微开关、微酶(microzyme)或病毒RNA。
在一些实施方式中,靶RNA序列是靶RNA的一部分,例如,靶序列是该靶RNA中的一段15-60个连续核苷酸,或15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59或60个连续核苷酸,如30个连续核苷酸。
在一些实施方式中,靶RNA与病况或疾病相关。
因此,在一些实施方式中,本文所述的***可用于通过靶向RNA(例如,SOD1mRNA)来治疗与该RNA相关的病况或疾病(如ALS)。例如,与病况或疾病相关的靶RNA可以是在患病细胞中过表达的RNA分子(例如,在湿性AMD患者的患病细胞中过表达的VEGFA mRNA)。靶RNA也可以是毒性RNA和/或突变的RNA(例如,具有剪接缺陷或突变的mRNA分子,如SOD1 mRNA)。
在某些实施方式中,靶RNA是编码病况或疾病相关蛋白的mRNA(包括pre-mRNA和成熟mRNA)。这样的蛋白质可以是野生型蛋白质或其突变蛋白,两者都可以是天然存在的。如本文所用,术语“mRNA”包括野生型mRNA及其在体内突变的mRNA(两者都可以是天然存在的),或者通过可替代的启动子的使用、可变剪接和/或可替代起始从其产生的任何转录物或亚型。野生型mRNA编码野生型蛋白质,突变的mRNA编码突变的蛋白质。
在某些实施方式中,靶RNA是编码SOD1的mRNA(包括pre-mRNA和成熟mRNA),即SOD1mRNA,如人SOD1,即人SOD1 mRNA,包括通过援引并入本文的SEQ ID NO:73的野生型人SOD1mRNA,登录号:NM_000454.5(应理解,NCBI GenBank网站中显示为NM_000454.5的序列叙述了mRNA的DNA版本,其中mRNA中的“u”被“t”替代),以及该野生型人SOD1 mRNA的任何突变的mRNA,该突变的mRNA可以是天然存在的并且可以是或不是致病性的,或者通过可替代启动子的使用、可变剪接和/或可替代起始从其产生的任何转录物或亚型。例如,当这样的突变的SOD1 mRNA中的突变是同义突变时,由其表达的SOD1蛋白的功能可能与由野生型SOD1mRNA表达的SOD1蛋白的功能相同,则该突变的SOD1 mRNA可能不是致病性的;当这样的突变的SOD1 mRNA中的突变是错义突变,导致表达功能失调的SOD1蛋白突变体时,则该突变的SOD1 mRNA可能是致病性的并且希望对其进行纠正。
据认为,凭借恰当的指导RNA设计,可以靶向这样的致病性SOD1 mRNA突变体,并且更希望地修饰、减少或消除该突变体。
在一些实施方式中,靶序列是人SOD1 mRNA的一部分,例如,靶序列是SEQ ID NO:73中的一段15-60个连续核苷酸,或15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59或60个连续核苷酸,如30个连续核苷酸。
在一些实施方式中,靶序列(1)包含或者是SEQ ID NO:39-45中的任一个;(2)包含或者是SEQ ID NO:39-54中的任一个中的至少15个连续核苷酸;或(3)与SEQ ID NO:39-45中的任一个的差异为在邻接关于SEQ ID NO:73的SEQ ID NO:39-45中的任一个的5’或3’的多或少1、2、3、4、5、6、7、8、9或10个的核苷酸。
6.复合物和细胞
本发明的一个方面提供Cas13蛋白的复合物(如CRISPR-Cas13突变体复合物),该复合物包含(1)任一Cas13蛋白(例如,如本文所述的Cas13突变体、其同源物、直系同源物、融合物、衍生物、缀合物、或功能性片段,和(2)本文所述的任一gRNA,每个gRNA包括设计为与靶RNA至少部分互补的间隔序列和与该Cas13蛋白(例如,Cas13突变体、其同源物、直系同源物、融合物、衍生物、缀合物、或功能性片段)相容的DR序列。
在某些实施方式中,复合物进一步包含所述gRNA结合的靶RNA(如SOD1mRNA)。
在本发明的一方面,提供了细胞或其后代,所述细胞或其后代包含如本文所述的AAV载体基因组、如本文所述的rAAV病毒颗粒、或如本文所述的sgRNA。在相关方面,本发明还提供细胞,所述细胞包含本发明的任一复合物。在某些实施方式中,细胞是原核生物。在某些实施方式中,细胞是真核生物,如小鼠、猴或人细胞。
7.治疗性应用
本文所述的CRISPR***可以具有多种治疗性应用。这样的应用可基于本发明Cas13(例如,CRISPR-Cas13***)的一种或多种下文的体外和体内能力。
在一些实施方式中,CRISPR-Cas13***可用于治疗与RNA相关(例如,与RNA的过表达或异常RNA的表达相关)的多种疾病和病症。
在一些实施方式中,RNA是SOD1 mRNA。这样的SOD1 mRNA可以包括非致病性和突变的野生型正常SOD1 mRNA、致病性的异常SOD1 mRNA两者,或仅突变的异常SOD1 mRNA。例如,突变的异常SOD1 mRNA可以是如在本文实施例2的动物模型中测试的SOD1-G93A mRNA。这样的突变的异常SOD1 mRNA的存在导致了本文讨论的SOD1相关疾病或病症。然而,可能难以区分正常和异常的SOD1 mRNA,并特异性敲低异常SOD1 mRNA。因此,可接受的方法是敲低正常和异常SOD1 mRNA两者,而总体SOD1蛋白的表达降低可以由其他基因自然地补偿或补足。
在一些实施方式中,与RNA相关的疾病或病症是SOD1相关疾病,即SOD1基因相关疾病。
在一些实施方式中,SOD1相关疾病是肌萎缩侧索硬化(ALS)。
在本发明的一方面,提供了药物组合物,所述药物组合物包含如本文所述的rAAV载体基因组、或如本文所述的rAAV病毒颗粒,以及药学上可接受的赋形剂。
在本发明的一方面,提供了在有需要的受试者中治疗与SOD1相关的疾病或病症的方法,所述方法包括向所述受试者施用治疗有效量的如本文所述的rAAV载体基因组、如本文所述的rAAV病毒颗粒、或如本文所述的药物组合物,其中所述rAAV载体基因组或所述rAAV病毒颗粒特异性地下调导致所述疾病或病症的所述SOD1的表达。
在一些实施方式中,所述施用包括使细胞与所述治疗有效量的如本文所述的rAAV载体基因组、如本文所述的rAAV病毒颗粒、或如本文所述的药物组合物接触。
在一些实施方式中,所述细胞位于所述受试者的CNS中。
在一些实施方式中,所述疾病或病症是ALS。
在一些实施方式中,所述施用包括鞘内施用。
在一些实施方式中,所述受试者是人。
在一些实施方式中,所述受试者是不是人。
在一些实施方式中,所述细胞中SOD1的表达与尚未与如本文所述的rAAV载体基因组、如本文所述的rAAV病毒颗粒、或如本文所述的药物组合物接触的细胞相比降低。
在一些实施方式中,与施用前所述受试者中SOD1的表达相比,所述受试者中SOD1的表达降低约30%、约35%、约40%、约45%、约50%、约55%、约60%、约65%、约70%、约75%、约80%、或约85%。
在某些实施方式中,本发明的方法可用于将本文所述的CRISPR***引入细胞中,并引起细胞和/或其后代改变一种或多种细胞产物(如生长因子、抗体、淀粉、乙醇、或任何其他所期望的产物)的产生。这样的细胞及其后代在本发明的范围内。
在某些实施方式中,本文所述的方法和/或CRISPR***导致细胞的一种或多种RNA产物的翻译和/或转录的修饰。例如,修饰可导致RNA产物的转录/翻译/表达增加。在其他实施方式中,修饰可导致RNA产物的转录/翻译/表达降低。
在某些实施方式中,细胞是真核细胞,如哺乳动物细胞,包括人细胞(原代人细胞或已建立的人细胞系)。在某些实施方式中,细胞是非人哺乳动物细胞,如来自非人灵长类动物(例如,猴)、母牛/公牛/牛、绵羊、山羊、猪、马、狗、猫、啮齿动物(如兔、小鼠、大鼠、仓鼠等)的细胞。在某些实施方式中,细胞来自鱼(如鲑鱼)、鸟(如禽鸟,包括鸡、鸭、鹅)、爬行动物、贝类(例如,牡蛎、蛤蜊、龙虾、对虾)、昆虫、蠕虫、酵母等。
相关方面提供使用本文所述的CRISPR***通过本发明的方法修饰的细胞或其后代。
在某些实施方式中,细胞在体外、在体内或离体进行修饰。在某些实施方式中,细胞是干细胞。在某些实施方式中,细胞不是胚胎干细胞。
8.递送
通过本公开和本领域的知识,本文所述的包含Cas13蛋白(如本文的Cas13突变体)的CRISPR***或本文所述的其任一组分(Cas13蛋白、其衍生物、功能性片段或各种融合物或加合物,以及gRNA)、其核酸分子、和/或编码或提供其组分的核酸分子可以通过各种递送***(如载体,例如质粒和病毒递送载体)使用本领域中任何合适的手段递送。这样的方法包括(但不限于)电穿孔、脂质转染、显微注射、转染、超声、基因枪等。
在本发明的一方面,CRISPR-Cas13***可以以包含gRNA和Cas13蛋白的核糖核蛋白(RNP)复合物的形式递送,任选地连同供体DNA模板或编码供体DNA模板的载体一起递送。
在本发明的一方面,CRISPR-Cas13***可以以一个或多个载体的形式递送,该一个或多个载体包含一个或多个编码gRNA和Cas13蛋白的多核苷酸,任选地连同供体DNA模板或编码供体DNA模板的载体一起递送,任选地其中该一个或多个载体是一个或多个病毒载体,任选地其中该病毒载体是逆转录病毒载体、单纯疱疹病毒载体、腺病毒载体、腺相关病毒(AAV)载体或慢病毒载体。
在本发明的一方面,CRISPR-Cas13***可以以gRNA和编码Cas13蛋白的mRNA的混合物的形式递送,任选地连同供体DNA模板或编码供体DNA模板的载体一起递送,任选地其中该混合物作为脂质纳米颗粒递送。
在某些实施方式中,CRISPR相关蛋白和/或任一RNA(例如,gRNA)和/或辅助蛋白可以使用合适的载体递送,这些载体例如质粒或病毒载体(如腺相关病毒(AAV)、慢病毒、腺病毒、逆转录病毒载体和其他病毒载体、或其组合)。可以将蛋白质和一种或多种gRNA包装到一种或多种载体(例如,质粒或病毒载体)中。对于细菌应用,可以使用噬菌体将编码本文所述的CRISPR***的任一组分的核酸递送至细菌。示例性噬菌体包括但不限于T4噬菌体、Mu、λ噬菌体、T5噬菌体、T7噬菌体、T3噬菌体、Φ29、M13、MS2、Qβ和ΦX174。
在某些实施方式中,递送是通过AAV1、AAV2、AAV3A、AAV3B、AAV4、AAV5、AAV6、AAV7、AAVrh74、AAV8、AAV9、AAV10、AAV11、AAV12、AAV13、AAV-DJ或AAV PHP.eB血清型病毒载体、所述AAV1-AAV13中的任一者所属的进化枝的成员,或其功能性截短变体或功能性突变体(例如,与AAV5、8、9、PHP.eB或DJ共享显著的序列同源性和向性谱)。在实施方式中,血清型为AAV9突变体AAV9-M8,其具有SEQ ID NO:82的VP1序列,如PCT/CN2021/106935中所述。
在一些实施方式中,通过例如鞘内施用、肌内注射、静脉内施用、经皮施用、鼻内施用、口服施用、粘膜施用、腹膜内施用、颅内施用、脑室内施用或立体定位施用将载体(例如,质粒或病毒载体(例如,AAV病毒载体))递送至感兴趣的细胞、组织或器官。在某些实施方式中,施用通过注射进行。
在某些实施方式中,本发明的AAV病毒颗粒通过鞘内注射递送。在某些实施方式中,递送通过一次鞘内注射进行。例如,在充分麻醉下,使用用于鞘内手术的标准技术进行鞘内注射,以合适的总体积注射治疗有效量的本发明的载体基因组(vg)。在某些实施方式中,在需要治疗的鞘内注射之前和/或之后,给予受试者口服***(或等效物)的短期皮质类固醇方案。本文用于施用的合适体积对于神经***施用可以是约0.01ml至约20ml(如约0.01、0.02、0.03、0.04、0.05、0.06、0.07、0.08、0.09、0.1、0.2、0.3、0.4、0.5、0.6、0.7、0.8、0.9、1、1.5、2、2.5、3、3.5、4、4.5、5、5.5、6、6.5、7、7.5、8、8.5、9、9.5、10、10.5、11、11.5、12、12.5、13、13.5、14、14.5、15、15.5、16、16.5、17、17.5、18、18.5、19、19.5或20ml,或在那些点值中任何两个的范围内),并且对于全身性(例如,静脉内)施用可以是约10ml至约100ml(如约10、15、20、25、30、35、40、45、50、55、60、65、70、75、80、85、90、95或100ml,或在那些点值中任何两个的范围内)。
递送可以经由单次剂量或多次剂量进行。本领域技术人员理解本文待递送的实际剂量可取决于多种因素而大幅变化,这些因素是如载体选择、靶细胞、生物、组织、待治疗受试者的一般状况、所寻求的转化/修饰的程度、施用途径、施用模式、所寻求的转化/修饰的类型等。用于本文的rAAV载体的治疗有效剂量可以合适地为约1E+8vg至约1E+17vg,其中vg代表用于施用的rAAV载体的载体基因组。
例如,用于本文的rAAV载体的治疗有效剂量可为约1.0E+8、2.0E+8、3.0E+8、4.0E+8、6.0E+8、8.0E+8、1.0E+9、2.0E+9、3.0E+9、4.0E+9、6.0E+9、8.0E+9、1.0E+10、2.0E+10、3.0E+10、4.0E+10、6.0E+10、8.0E+10、1.0E+11、2.0E+11、3.0E+11、4.0E+11、6.0E+11、8.0E+11、1.0E+12、2.0E+12、3.0E+12、4.0E+12、6.0E+12、8.0E+12、1.0E+13、2.0E+13、3.0E+13、4.0E+13、6.0E+13、8.0E+13、1.0E+14、2.0E+14、3.0E+14、4.0E+14、6.0E+14、8.0E+14、1.0E+15、2.0E+15、3.0E+15、4.0E+15、6.0E+15、8.0E+15、1.0E+16、2.0E+16、3.0E+16、4.0E+16、6.0E+16、8.0E+16或1.0E+17vg,或在那些点值中任何两个的范围内。
在某些实施方式中,递送经由腺病毒进行,其可以是含有至少1×105个颗粒(也称为颗粒单位,pu)的腺病毒的单次剂量。在一些实施方式中,剂量优选地是至少约1×106个颗粒、至少约1×107个颗粒、至少约1×108个颗粒、和至少约1×109个颗粒的腺病毒。递送方法和剂量描述于例如WO 2016205764 A1和美国专利号8,454,972B2中,将这两个文献通过援引以全文并入本文。
在一些实施方式中,递送经由质粒进行。剂量可以是足够数量的质粒以引发反应。在一些情况下,质粒组合物中质粒DNA的合适量可以是从约0.1至约2mg。质粒通常包括(i)启动子;(ii)编码靶向核酸的CRISPR相关蛋白和/或辅助蛋白的序列,每个序列与启动子(例如,相同的启动子或不同的启动子)可操作地连接;(iii)任选地可选择标志物;(iv)复制起点;以及(v)位于(ii)的下游并与其可操作地连接的转录终止子。质粒还可以编码CRISPR复合物的RNA组分,但这些组分中的一种或多种可以替代地在不同的载体上编码。施用频率在医学或兽医学从业者(例如,医师、兽医师)或本领域技术人员的范围内。
在另一实施方式中,递送经由脂质体或脂质转染配制品等进行,并且可以通过本领域技术人员已知的方法制备。这样的方法描述于例如WO 2016205764和美国专利号5,593,972、5,589,466、和5,580,859中,将各个文献通过援引以其全文并入本文。
在一些实施方式中,递送经由纳米颗粒或外泌体进行。例如,已表明外泌体在递送RNA方面特别有用。
将新的CRISPR***的一种或多种组分引入细胞中的另外的手段是通过使用细胞穿透肽(CPP)。在一些实施方式中,细胞穿透肽与CRISPR相关蛋白连接。在一些实施方式中,CRISPR相关蛋白和/或gRNA与一种或多种CPP偶联以有效地将它们转运到细胞(例如,植物原生质体)内。在一些实施方式中,CRISPR相关蛋白和/或一种或多种gRNA由一种或多种环状或非环状DNA分子编码,该一种或多种环状或非环状DNA分子与一种或多种CPP偶联用于细胞递送。
CPP是少于35个氨基酸的短肽,其源自能够以受体非依赖性方式跨细胞膜转运生物分子的蛋白或嵌合序列。CPP可以是阳离子肽、具有疏水性序列的肽、两亲性肽、具有富含脯氨酸且抗微生物的序列的肽、以及嵌合肽或二分肽。CPP的实例包括例如Tat(其是1型HIV病毒复制所需的核转录激活蛋白)、穿膜肽、卡波西成纤维细胞生长因子(FGF)信号肽序列、整合素β3信号肽序列、聚精氨酸肽Args序列、富含鸟嘌呤的分子转运蛋白和甜箭肽。CPP和使用它们的方法描述于例如等人,“Prediction of cell-penetratingpeptides[细胞穿透肽的预测],”Methods Mol.Biol.[分子生物学方法],2015;1324:39-58;Ramakrishna等人,“Gene disruption by cell-penetrating peptide-mediateddelivery of Cas9 protein and gRNA[通过细胞穿透肽介导的Cas9蛋白和gRNA的递送来破坏基因],”Genome Res.[基因组研究],2014年6月;24(6):1020-7;以及WO 2016205764A1中;将各个文献通过援引以其全文并入本文。
用于本文所述的CRISPR***的各种递送方法还描述于例如美国专利号8,795,965、EP 3009511、WO 2016205764和WO 2017070605中;将各个文献通过援引以其全文并入本文。
在一些实施方式中,Cas蛋白通过如在例如PCT/CN2022/075366中所述的能够包装RNA的AAV包装***以包装编码Cas的mRNA的rAAV颗粒形式递送。
9.试剂盒
本发明的另一方面提供试剂盒,该试剂盒包含本文所述Cas13蛋白的本发明CRISPR/Cas***的任何两种或更多种组分,如本文的Cas13突变体、其衍生物、功能性片段或各种融合物或加合物、gRNA、其复合物、涵盖它们的载体、或涵盖它们的宿主。
在本发明的另一方面,提供了试剂盒,该试剂盒包含如本文所述的AAV载体基因组、如本文所述的rAAV病毒颗粒、如本文所述的sgRNA、或如本文所述的细胞或其后代。
在某些实施方式中,试剂盒包含本文所述的rAAV载体基因组或rAAV颗粒,该rAAV载体基因组或rAAV颗粒包含多核苷酸,该多核苷酸包含Cas13编码序列、以及由DR序列隔开的一个或多个靶向SOD1的sgRNA的编码序列。
在某些实施方式中,试剂盒进一步包含使用其中涵盖的组分的说明,和/或与可在别处获得的另外的组分组合的说明。
在某些实施方式中,试剂盒进一步包含一种或多种缓冲液,该一种或多种缓冲液可用于溶解任一组分和/或为一种或多种组分提供合适的反应条件。这样的缓冲液可以包括以下中的一种或多种:PBS、HEPES、Tris、MOPS、Na2CO3、NaHCO3、NaB、或其组合。在某些实施方式中,反应条件包括适当的pH,如碱性pH。在某些实施方式中,pH在7-10之间。
在某些实施方式中,任一种或多种试剂盒组分可以储存在合适的容器中。
10.宿主细胞以及AAV产生
在本发明的另一方面,提供了制备如本文所述的rAAV颗粒的方法,所述方法包括:
a)将编码如本文所述的rAAV载体基因组的核酸或从其转录的RNA序列、和如本文所述的AAV衣壳的编码序列引入AAV包装***中持续一段时间,所述时间足以将所述rAAV载体基因组或所述转录的RNA包装到所述AAV衣壳中以产生所述rAAV颗粒,以及
b)收获所述rAAV颗粒;以及任选地,
c)分离或纯化所述收获的rAAV颗粒。
rAAV产生的一般原理是本领域已知的。参见以下综述,例如,Carter(CurrentOpinions in Biotechnology[生物技术新见],1533-539,1992);和Muzyczka,Curr.Topicsin Microbial,and Immunol[微生物学和免疫学的当前主题]158:97-129,1992,将两者通过援引并入本文)。以下文献中描述了各种方法:Ratschin等人(Mol.Cell.Biol.[分子细胞生物学]4:2072,1984;Hermonat等人(Proc.Natl.Acad.Sci.USA[美国国家科学院院刊]81:6466,1984);Tratschin等人(Mol.Cell.Biol.[分子细胞生物学]5:3251,1985);McLaughlin等人(J.Virol[病毒学杂志]62:1963,1988);以及Lebkowski等人(Mol.Cell.Biol[分子细胞生物学]7:349,1988),Samulski等人(J.Virol[病毒学杂志]63:3822-3828,1989);U.S.5,173,414;WO 95/13365和U.S.5,658,776;WO 95/13392;WO 96/17947;PCT/US98/18600;WO 97/09441;WO 97/08298;WO 97/21825;WO 97/06243;WO 99/11764;Perrin等人(Vaccine[疫苗]13:1244-1250,1995);Paul等人(Human Gene Therapy[人基因疗法]4:609-615,1993);Clark等人(Gene Therapy[基因疗法]3:1124-1132,1996);U.S.5,786,211;U.S.5,871,982;以及U.S.6,258,595。
AAV在被工程化用于递送例如感兴趣的蛋白质编码序列时,可以被称为(r)AAV载体、(r)AAV载体颗粒或(r)AAV颗粒,其中“r”代表“重组”。并且包装在AAV载体中用于递送的基因组可以被称为AAV载体基因组、载体基因组或简称vg,而病毒基因组可以是指天然AAV的原始病毒基因组。
AAV载体血清型可以与靶细胞类型匹配。例如,WO 2018002719A1的表2列出了可以被指示的AAV血清型转导的示例性细胞类型(通过援引并入本文)。
包装细胞系用于形成可感染宿主细胞的AAV载体。这样的包装细胞系包括HEK293和Sf9细胞。
用于基因疗法的AAV载体通常是通过包装细胞系产生的,这些细胞系将载体基因组包装到AAV衣壳中以形成AAV载体。载体基因组典型地含有包装所需的最少病毒序列,而其他病毒序列则由编码例如Cas蛋白和/或sgRNA的表达盒替代。缺失的病毒功能可以由包装细胞系以反式提供,通常是由于这些病毒功能/蛋白质(如AAV的rep和cap基因)作为整合到包装细胞中的转基因或作为引入到该包装细胞中的第二病毒载体或表达载体上的转基因而表达的结果。
例如,载体基因组典型地仅具有来自病毒基因组的末端反向重复(ITR)序列,这些序列是包装必需的。将载体基因组包装在包装细胞系中,该包装细胞系含有一个或多个编码其他AAV基因(即rep和cap)但缺乏ITR序列的辅助质粒。包装细胞系还被作为辅助者的腺病毒感染。辅助病毒促进载体基因组的复制和来自辅助质粒的AAV基因的表达。辅助质粒由于缺乏ITR序列而未大量包装。腺病毒的污染可以通过例如进行腺病毒比AAV更敏感的热处理来减少。
在一些实施方式中,可以使用三重转染方法(在美国专利号6,001,650中详细描述)产生重组AAV。典型地,重组AAV通过用待以转基因质粒的形式包装到AAV颗粒中的载体基因组(包含感兴趣的基因)、AAV辅助功能载体(也称为包装质粒)和辅佐功能载体(也称为辅助质粒)转染宿主细胞来产生。AAV辅助功能载体编码“AAV辅助功能”序列(例如,rep和cap),其以反式起作用以用于产生性AAV复制和衣壳化。优选地,AAV辅助功能载体支持高效的AAV载体产生,而不生成任何可检测的野生型AAV病毒粒子(例如,含有功能性rep和cap基因的AAV病毒粒子)。辅佐功能载体编码用于AAV进行复制所依赖的非AAV衍生的病毒和/或细胞功能(例如,“辅佐功能”)的核苷酸序列。辅佐功能包括AAV复制所需的那些功能,包括但不限于参与激活AAV基因转录、阶段特异性AAV mRNA剪接、AAV DNA复制、cap表达产物合成和AAV衣壳组装的那些部分。基于病毒的辅佐功能可源自已知的辅助病毒的任一种,如腺病毒、疱疹病毒(除了单纯疱疹病毒-1型)和牛痘病毒。
在一些实施方式中,使用包装在昆虫细胞(如Sf9细胞)中的杆状病毒表达***产生本发明rAAV病毒颗粒。参见例如,WO 2007046703、WO 2007148971、WO 2009014445、WO2009104964、WO 2013036118、WO 2011112089、WO 2016083560、WO 2015137802和WO2019016349,将所有文献通过援引并入本文。
用于递送的AAV的简单介绍还可以参考“腺相关病毒(AAV)指南”
(https://www.addgene.org/guides/aav/)。
载体滴度通常表示为载体基因组/ml(vg/ml)。在某些实施方式中,载体滴度高于1×109、高于5×1010、高于1×1011、高于5×1011、高于1×1012、高于5×1012或高于1×1013vg/ml。
作为将单链(ss)DNA序列包装为AAV颗粒的载体基因组的替代,最近开发了将RNA序列作为载体基因组包装到AAV颗粒中的***和方法,并可应用于本文。参见PCT/CN2022/075366,将该文献通过援引以其全文并入本文。
当载体基因组为例如PCT/CN2022/075366中的RNA时,为了进行简单描述和声明,本文中描述的用于DNA载体基因组的序列元件,当存在于RNA载体基因组中时,一般应认为适用于RNA载体基因组,除了DNA序列中的脱氧核糖核苷酸是RNA序列中对应的核糖核苷酸(例如dT相当于U,并且dA相当于A)和/或DNA序列中的元件被替换为在RNA序列中具有对应功能的对应元件,或因其功能在RNA序列中不需要而被省略,和/或引入RNA载体基因组所必需的另外元件。
如本文所用,编码序列(例如,作为本文中AAV载体基因组的序列元件)被解释、理解和认为覆盖(covering和covers)DNA编码序列和RNA编码序列两者。当它是DNA编码序列时,可以从DNA编码序列转录RNA序列,并且任选地可以根据需要进一步从转录的RNA序列翻译蛋白质。当它是RNA编码序列时,RNA编码序列本身可以是供使用的RNA序列(尽管RNA编码序列似乎不编码某物),或者RNA序列可以例如通过RNA加工由RNA编码序列产生(尽管RNA编码序列似乎不编码某物),或者可以从RNA编码序列翻译蛋白质。
例如,(例如,Cas13、NLS)编码序列(编码(例如Cas13、NLS)多肽)覆盖(例如,Cas13、NLS)多肽从其表达(经由转录和翻译间接地)的(例如,Cas13、NLS)DNA编码序列或(例如,Cas13、NLS)多肽从其翻译(直接地)的(例如,Cas13、NLS)RNA编码序列。
例如,(例如,sgRNA)编码序列(编码RNA(例如,sgRNA)的序列)覆盖RNA序列(例如,sgRNA序列或阵列)从其转录的(例如,sgRNA)DNA编码序列,或(例如,sgRNA)RNA编码序列(1)其本身就是供使用的RNA序列(例如,sgRNA序列或阵列),或(2)例如通过RNA加工从其产生sgRNA序列或阵列。
在RNA AAV载体基因组的一些实施方式中,5'-ITR和/或3'-ITR作为DNA包装信号将是不必要的并且可以将其省略,但是可以引入RNA包装信号。
在AAV RNA载体基因组的一些实施方式中,驱动DNA序列转录的启动子将是不必要的,并且可以至少将其部分省略。
在AAV RNA载体基因组的一些实施方式中,polyA信号序列将是不必要的并且可以将其省略,但是可以引入polyA尾。
类似地,可以将AAV DNA载体基因组的其他DNA元件省略或替换为对应的RNA元件和/或可以引入新的RNA元件,以适应由rAAV颗粒递送RNA载体基因组的策略。
实施例
实施例1CRISPR-hfCas13f v1和v2***高效体外敲低hSOD1表达
该实施例证明了本发明CRISPR-hfCas13f v1和v2***对hSOD1表达的高体外敲低效率。
质粒构建:
本发明CRISPR-hfCas13f v1***包含hfCas13f v1蛋白(SEQ ID NO:2,Cas13f.1-Y677A突变体)和单个靶向hSOD1的sgRNA(后文中“sgRNA[hSOD1]1-7”或“sg1-7”(SEQ IDNO:7-13)中的一个),该sgRNA包含两个同向重复序列(各自具有SEQ ID NO:6)和靶向hSOD1mRNA的靶序列(靶序列1-7(SEQ ID NO:39-45)中的一个)的间隔子(间隔子1-7(SEQ ID NO:23-29)中的一个)。
本发明CRISPR-hfCas13f v2***包含hfCas13f v2蛋白(SEQ ID NO:4,Cas13f.1-Y666A,Y677A突变体)和单个靶向hSOD1的sgRNA(后文中“sgRNA[hSOD1]8-16”或“sg8-16”(SEQ ID NO:14-22)中的一个),该sgRNA包含两个同向重复序列(各自具有SEQ ID NO:6)和靶向hSOD1 mRNA的靶序列(靶序列8-16(SEQ ID NO:46-54)中的一个)的间隔子(间隔子8-16(SEQ ID NO:30-38)中的一个)。
作为阴性对照,使用了包含两个同向重复序列(各自具有SEQ ID NO:17)和非靶向性间隔子(LacZ,SEQ ID NO:57)的非靶向性sgRNA(后文中的“sgRNA[NT]”或“NT”,SEQ IDNO:56)代替sgRNA[hSOD1]。
作为阳性对照,还使用了三种靶向hSOD1的shRNA(shRNA1-3(SEQ ID NO:59-61)中的一个)。
用于CRISPR-hfCas13f v1或v2***和shRNA连同mCherry报告子(SEQ ID NO:70)的质粒构建体显示在图1、图3和图5a中。构建体中的hfCas13f v1编码序列侧接了两个编码相同NLS(SEQ ID NO:66)的NLS编码序列。
间隔子也组合使用。将hfCas13f v1蛋白(SEQ ID NO:2)和含有两个间隔子的sgRNA[hSOD1](5和7,SEQ ID NO:55)与mCherry报告子(SEQ ID NO:70)一起编码到同一个质粒构建体中,如图3中所示。
质粒转染:
将HEK293T细胞在含有10%胎牛血清(FBS)和青霉素/链霉素的杜尔贝科改良伊格尔培养基(DMEM)中培养,并维持在37℃和5% CO2下。然后将培养的细胞接种到6孔板(8.0E+5个细胞/孔)上,并使用聚乙烯亚胺(PEI)转染试剂用2μg治疗质粒(编码靶向hSOD1的CRISPR-hfCas13f v1或CRISPR-hfCas13f v2***)或对照质粒(编码shRNA或非靶向性CRISPR-hfCas13f v1或非靶向性CRISPR-hfCas13f v2***)对其进行转染。然后,在转染2天后使用流式细胞术分选了70k mCherry阳性细胞用于RNA提取。
RT-qPCR检测:
用Trizol(Ambion公司)从mCherry阳性细胞中分离了总RNA。使用RT-qPCR用HiScript Q RT超混合物(诺唯赞生物科技公司(Vazyme,Biotech)),使用500ng总RNA反向合成互补DNA(cDNA)。将所得的cDNA在ddH2O中稀释20倍,并将2μl用基因特异性引物通过RT-qPCR测定。通过SYBR绿色探针(AceQ qPCR SYBR Green预混物,诺唯赞生物科技公司)跟踪了RT-qPCR反应。将hSOD1 mRNA的水平相对于参考基因18s核糖体核糖核酸(18s rRNA)的水平归一化。使用2-ΔΔCt法计算了相对表达水平。每个实验以一式三份进行,并重复三次。
人SOD1 qPCR引物:
正向:5’-TGGGCCAAAGGATGAAGAGA-3’(SEQ ID NO:76),
反向:5’-TTTCATGGACCACCAGTGTG-3’(SEQ ID NO:77)。
人18s rRNA qPCR引物:
正向:5’-TTGGTGGAGCGATTTGTCTG-3’(SEQ ID NO:78),
反向:5’-GAATGGGGTTCAACGGGTTA-3’(SEQ ID NO:79)。
结果:
为了确定CRISPR-hfCas13f v1***是否可用于降低hSOD1基因的表达,设计了7种靶向成熟hSOD1 mRNA的sgRNA(sg1-7)。在使用单个间隔子的情况下,相对于阴性对照,使用sg2-7的靶向hSOD1的CRISPR-hfCas13f v1***将人SOD1 mRNA的水平降低了>50%,其中发现活性最高的sgRNA 5和6将人SOD1 mRNA的水平降低了>90%(图2和表1)。
表1
在使用双间隔子的情况下,相对于阴性对照,使用配对的间隔子5和7(sg5和sg7)的靶向hSOD1的CRISPR-hfCas13f v1***将hSOD1 mRNA水平降低了98%(图4和表2)。选择了Sg5和7代替sg5和6组合使用是因为在靶hSOD1 mRNA上,sg5和6针对的靶序列在空间上接近。
表2
为了确定CRISPR-hfCas13f v2***是否可用于降低hSOD1基因的表达,设计了另9种靶向成熟hSOD1 mRNA的sgRNA(sg8-16)。在使用单个sgRNA的情况下,相对于阴性对照,使用sg10-16的靶向hSOD1的CRISPR-hfCas13f v2***将人SOD1 mRNA的水平降低了>90%(图5b和表3)。
表3
实施例2 CRISPR-hfCas13f v2***高效体内敲低hSOD1表达
为了证明实施例1中本发明CRISPR-hfCas13f v2-sg5&7***的体内敲低效率,使用了AAV9突变体AAV9-M8(SEQ ID NO:82)递送***将该***体内递送至动物中的靶细胞。
AAV9-M8转基因质粒构建:
与实施例1中的治疗和对照质粒类似,分别构建了包装编码hfCas13f v2和sgRNA[hSOD1]5&7或sgRNA[NT]的AAV9-M8变体的治疗和对照转基因质粒,如图6中所示。
重组AAV9-M8颗粒制备:
比照使用传统的三重质粒转染***,通过将相应的转基因质粒、包装质粒和辅助质粒以1∶1∶2的重量比共转染到HEK293T细胞中,产生了本文的治疗和对照rAAV9-M8颗粒两者。将转基因质粒通过AAV9-M8衣壳包装以形成在该衣壳内的基因组,并且该基因组和该衣壳一起构成rAAV9-M8颗粒。
特别地,将HEK293T细胞在感受态DMEM培养基中培养,并且在质粒转染前14-16小时将这些细胞铺板。转染前不久,将培养基替换为含有2%FBS的新鲜DMEM。将PEI用作转染试剂。在翻译后72小时从培养基中收采经转染的HEK293T细胞。通过使用碘克沙醇密度梯度超速离心从细胞中纯化治疗和对照rAAV9-M8颗粒。
将RT-qPCR与对基因组上的hfCas13f v2序列具有特异性的一对hfCas13f v2引物一起使用,以检测治疗和对照rAAV9-M8颗粒中包装的任何基因组的基因组滴度。
hfCas13f v2正向引物:5’-GAAATCGTGGAAGAACTGGTGG-3’(SEQ ID NO:80);
hfCas13f v2反向引物:5’-ATAAGCGTAATCTGGAACATCGTA-3’(SEQ ID NO:81)。
鞘内施用:
掺入的人SOD1基因携带与G93A疾病相关的突变的雄性人源化SOD1-G93A小鼠(B6.Cg-Tg(SOD1*G93A)1Gur/J)购自杰克逊实验室(Jackson Laboratory)(Jax:004435),并且雌性C57BL/6J小鼠(6-8周)购自上海斯莱克实验动物有限责任公司(Shanghai SLACLaboratory Animal Co.Ltd.),并将其安置在12h:12h亮/暗周期的内部动物设施中,自由获取食物和水。所有实验方案都获得了中国上海的中国科学院神经科学研究所动物护理和使用委员会(Animal Care and Use Committee of the Institute of Neuroscience,Chinese Academy of Sciences,Shanghai,China)和辉大(上海)生物科技有限公司(HUIGENE THERAPEUTICS CO.,LTD)的批准。
在出生后6-12小时内使用10μl注射器(1英寸针头,30度斜面;哈密顿公司(Hamilton Company),内华达州里诺(Reno,NV))对每只新生小鼠进行缓慢注射,使用3μl治疗或对照rAAV9-M8颗粒(P1:6×1011vg/mL、2×1012vg/mL和6×1012vg/mL)经由脊髓注射到脊髓的腰中,这些治疗或对照rAAV9-M8颗粒在具有0.01%非离子表面活性剂(赛默飞世尔公司(Thermo Fisher))和0.25% Fast Green(西格玛公司(Sigma))的磷酸盐缓冲盐水(1×PBS)缓冲液中,其中在距离尾巴基部5mm处观察到沿其背部向下的白线(脊髓)。当针头刺穿皮肤时,以几乎平行于背部的方式开始注射,然后将针头的角度增加到50°-60°以将针头***脊柱。注射后,将新生小鼠送回饲养笼中。
体重分析和行为测试:
在小鼠年龄为4与15周之间(分别为30天和约105天)记录体重。
行为测试(即握力测试)在中性环境的隔音室中进行。测试后,将新生小鼠送回其饲养笼中。所有测试都在亮/暗周期的亮阶段进行。在将小鼠运送到行为室后,在测试前给予其1小时的***行于表面。为了进行测试,用稳定的力轻轻地将小鼠往回拉,直到两只爪子松开杆。对连续六次试验记录以克为单位的峰值拉力。该设备设置为按磅力计以实现更高的灵敏度。
免疫染色:
用戊巴比妥(100mg/kg)对小鼠实施安乐死,并用20mL冰冷的PBS灌注,然后处死。然后解剖脊髓和肝脏。将脊髓分为颈、胸和腰区段,并将每个区段分为三块。使用一块脊髓进行免疫染色。其他两块脊髓和肝脏用于蛋白质印迹法分析。
对于脊髓切片免疫染色,将脊髓从处死的小鼠中解剖出来,在4℃下在4%多聚甲醛(PFA)中后固定过夜。接下来,在4℃下使用30%蔗糖/PBS溶液冷冻保护脊髓过夜,并用PBS洗涤并包埋在Tissue-Tek O.C.T.化合物中。然后,使用徕卡公司(Leica)的CM3050 S低温恒温器将脊髓切片为30μm。将脊髓切片储存在含有30%蔗糖和30%乙二醇、11.36%Na2HPO4和2.4% NaH2PO4的冷冻培养基中。将切片用PBS洗涤三次,然后在室温下用含有0.1% Triton X-100和10%胎牛血清(FBS)的PBS孵育1小时。随后,在4℃下将切片用一抗在具有0.1% Triton X-100和5% FBS的PBS中的适当稀释液孵育过夜。将切片用PBS洗涤三次,然后在室温下用二级抗体在具有0.1% Triton X-100和5% FBS的PBS中的适当稀释液孵育1h。将切片安装在载玻片上,在室温下干燥,并用DAPI(英杰公司(Invitrogen))在ProLong Gold抗淬灭固定介质中滑动封盖。最后,通过共聚焦显微镜(尼康公司(Nikon)的A1R)捕获所有免疫荧光标记的图像。使用了以下的一抗和稀释液:NeuN(兔,细胞信号传导公司(Cell Signaling),编号24307S,稀释1∶1000)、ChAT-胆碱乙酰转移酶(山羊,密理博西格玛公司(Millipore-Sigma),编号AB144P,稀释1∶500)、GFAP(小鼠,艾博抗公司(Abcam),编号Ab279290,稀释1∶1,000)、Iba1(兔,和光纯药工业株式会社(Wako)的克隆NCNP24,编号019-19,741,稀释1∶1,000)、HA(大鼠,罗氏公司(Roche),编号11867423001,稀释1∶1000)、hSOD1(兔,艾博抗公司,编号45777,稀释1∶500)。对于一抗的检测,使用了以1:1,000稀释的驴抗兔、抗小鼠或抗山羊Cy3、Cy5或Alexa 488缀合的二抗(杰克逊免疫研究公司(JacksonImmunoResearch))。
蛋白质印迹法:
从处死的小鼠中解剖出脊髓,并用冰冷的PBS洗涤,并收采在蛋白质裂解缓冲液和1×蛋白酶抑制剂混合物(罗氏公司)中。在4℃下将裂解物以12,000rpm离心15分钟,并通过用4%-20%Bis-Tris Plus凝胶(天能公司(Tanon))变性来分离10μg蛋白质并转移到PVDF膜(密理博公司)上。在具有1%Tween的pH 7.4的Tris缓冲盐水(20mM Tris、150mM NaCl和蒸馏的H2O)(TBST)中的5%脱脂奶粉中阻断印迹,然后在4℃下与一抗一起孵育过夜。用TBST洗涤印迹三次,然后在室温下与抗兔IgG辣根过氧化物酶(HRP)缀合的二抗一起孵育1小时。用TBST洗涤印迹三次,然后在SuperSignal West Pico化学发光底物(赛默飞世尔科技公司(Thermo Scientific))下观察。使用了以下的一抗和稀释液:SOD1(兔,艾博抗公司,编号Ab13498,稀释1∶1000)、HA(兔,细胞信号传导公司,编号5017,稀释1∶1000)。微管蛋白β(兔,生物世界公司(Bioworld),AP0064,稀释1∶1000)。对于一抗的检测,使用了抗兔IgG辣根过氧化物酶(HRP)缀合的二抗(细胞信号传导公司编号7074S,稀释1∶1000)。使用ImageJ(https://imagej.en.softonic.com)进行蛋白质印迹法灰度分析。还检测微管蛋白β作为对照。
结果:
首先在SOD1-G93A小鼠模型中评价了AAV9-M8转导的效率。在出生后第1天(称为P1)向模型鞘内注射AAV9-M8-hfCas13f v2-SOD1颗粒,其中hfCas13f v2与三重人流感血凝素(HA)标签融合(图7)。转导效率在SOD1-G93A小鼠模型的神经元中是高的,其中HA在85%的P1注射的腹角的腰脊髓神经元中表达(由神经元标志物NeuN的免疫反应性指示),并且HA在60%的运动神经元中表达(由运动神经元标志物ChAT的免疫反应性指示)。转导效率在SOD1-G93A小鼠模型的星形胶质细胞中是低的(由星形胶质细胞标志物GFAP的免疫反应性指示),其中HA在8%的星形胶质细胞中表达,并且HA在1%的小胶质细胞中表达(由小胶质细胞标志物Iba1的免疫反应性指示)(图8和表4)。因此,充分证实了AAV9-M8递送***的期望的神经元特异性。
表4注射后28天
蛋白质印迹法的hSOD1蛋白表达分析显示了在AAV9-M8-hfCas13f v2-SOD1注射到腰椎后第4周,SOD1-G93A小鼠的颈和腰脊髓中hSOD1蛋白表达明显降低。而对没有将轴突投射到脊髓中的外周器官肝脏中的hSOD1表达没有影响(图9)。
在将AAV9-M8-hfCas13f v2-SOD1注射到治疗和对照小鼠的腰椎后第4周,使用识别hSOD1但不识别小鼠SOD1的抗体进行的间接免疫荧光来确定累积的突变型SOD1蛋白的水平。与未转导以表达病毒编码的HA的周围神经元相比,经转导的运动神经元(由表达HA和胆碱乙酰转移酶(ChAT)的细胞鉴定)内的SOD1表达降低(图10)。
明显的是,与未经注射的对照SOD1-G93A小鼠相比,在疾病发作前通过使用高滴度rAAV9-M8颗粒的鞘内治疗注射进行治疗的那些SOD1-G93A小鼠的生存期显著增加,中位生存期延长了15.8天(图11a和11b)。与该高滴度实现的生存期延长一致,相对于对照SOD1-G93A小鼠,该AAV疗法以剂量依赖性方式改善了握力(图11c)。从4周龄至15周龄,与对照小鼠相比,所有经治疗的小鼠均未观察到显著的体重减轻(图10d)。
综上所述,数据表明CRISPR-hfCas13f v2-sgRNA[SOD1]***在体外和体内两种情况下均能特异性敲低人SOD1基因的表达,并且显著改善疾病小鼠模型的握力并延长其生存期,从而显示出治疗人SOD1-ALS的有期望的前景。
示例性序列
Cas13f.1氨基酸序列,没有NLS,SEQ ID NO:1
MNGIELKKEEAAFYFNQAELNLKAIEDNIFDKERRKTLLNNPQILAKMENFIFNFRDVTKNAKGEIDCLLLKLRELRNFYSHYVHKRDVRELSKGEKPILEKYYQFAIESTGSENVKLEIIENDAWLADAGVLFFLCIFLKKSQANKLISGISGFKRNDDTGQPRRNLFTYFSIREGYKVVPEMQKHFLLFSLVNHLSNQDDYIEKAHQPYDIGEGLFFHRIASTFLNISGILRNMKFYTYQSKRLVEQRGELKREKDIFAWEEPFQGNSYFEINGHKGVIGEDELKELCYAFLIGNQDANKVEGRITQFLEKFRNANSVQQVKDDEMLKPEYFPANYFAESGVGRIKDRVLNRLNKAIKSNKAKKGEIIAYDKMREVMAFINNSLPVDEKLKPKDYKRYLGMVRFWDREKDNIKREFETKEWSKYLPSNFWTAKNLERVYGLAREKNAELFNKLKADVEKMDERELEKYQKINDAKDLANLRRLASDFGVKWEEKDWDEYSGQIKKQITDSQKLTIMKQRITAGLKKKHGIENLNLRITIDINKSRKAVLNRIAIPRGFVKRHILGWQESEKVSKKIREAECEILLSKEYEELSKQFFQSKDYDKMTRINGLYEKNKLIALMAVYLMGQLRILFKEHTKLDDITKTTVDFKISDKVTVKIPFSNYPSLVYTMSSKYVDNIGNYGFSNKDKDKPILGKIDVIEKQRMEFIKEVLGFEKYLFDDKIIDKSKFADTATHISFAEIVEELVEKGWDKDRLTKLKDARNKALHGEILTGTSFDETKSLINELKK
hfCas13f.v1(Y677A)氨基酸序列,没有NLS,SEQ ID NO:2
MNGIELKKEEAAFYFNQAELNLKAIEDNIFDKERRKTLLNNPQILAKMENFIFNFRDVTKNAKGEIDCLLLKLRELRNFYSHYVHKRDVRELSKGEKPILEKYYQFAIESTGSENVKLEIIENDAWLADAGVLFFLCIFLKKSQANKLISGISGFKRNDDTGQPRRNLFTYFSIREGYKVVPEMQKHFLLFSLVNHLSNQDDYIEKAHQPYDIGEGLFFHRIASTFLNISGILRNMKFYTYQSKRLVEQRGELKREKDIFAWEEPFQGNSYFEINGHKGVIGEDELKELCYAFLIGNQDANKVEGRITQFLEKFRNANSVQQVKDDEMLKPEYFPANYFAESGVGRIKDRVLNRLNKAIKSNKAKKGEIIAYDKMREVMAFINNSLPVDEKLKPKDYKRYLGMVRFWDREKDNIKREFETKEWSKYLPSNFWTAKNLERVYGLAREKNAELFNKLKADVEKMDERELEKYQKINDAKDLANLRRLASDFGVKWEEKDWDEYSGQIKKQITDSQKLTIMKQRITAGLKKKHGIENLNLRITIDINKSRKAVLNRIAIPRGFVKRHILGWQESEKVSKKIREAECEILLSKEYEELSKQFFQSKDYDKMTRINGLYEKNKLIALMAVYLMGQLRILFKEHTKLDDITKTTVDFKISDKVTVKIPFSNYPSLVYTMSSKAVDNIGNYGFSNKDKDKPILGKIDVIEKQRMEFIKEVLGFEKYLFDDKIIDKSKFADTATHISFAEIVEELVEKGWDKDRLTKLKDARNKALHGEILTGTSFDETKSLINELKK
密码子优化的编码hfCas13f.v1(Y677A)的多核苷酸序列,没有TAG终止密码子,SEQ ID NO:3
atgaatggcatcgagctgaagaaggaagaagccgccttctacttcaatcaggccgagctgaacctgaaggccattgaggacaacatcttcgacaaggagagacggaagacactgctgaacaacccccagatcctggccaagatggagaactttatcttcaatttccgggacgtgaccaagaacgccaagggcgaaatcgactgcctgctgctgaagctgagagagctgcggaacttttacagccactacgtgcacaagcgggacgtcagagaactgagcaagggcgagaagccgatcctggagaagtactaccagttcgccatcgaatccaccggctctgagaacgtgaagctcgaaatcatcgaaaacgacgcctggctggccgacgccggcgtgctgttcttcctgtgcatcttcctgaagaagagccaggcaaacaagctgatcagcggcatcagcggcttcaagagaaacgacgacaccggccagcctcggagaaacctgttcacctacttctccatccgggagggctacaaggtggtgcccgaaatgcagaagcacttcctgctgttctccctggtgaaccacctgagcaaccaggacgattatatcgaaaaggcccaccagccctacgacatcggcgagggcctcttcttccaccggattgccagcaccttcctgaacatctccggaatcctgagaaacatgaagttctacacctatcagagcaagagactggtggagcagagaggcgagctgaagcgggaaaaggacatcttcgcctgggaagaaccgtttcagggcaattcctactttgagatcaacggccacaagggcgtgattggcgaagacgagctgaaggagctgtgctacgccttcctgatcggcaaccaggacgccaacaaggtggagggccggatcacccagttcctggagaagttcagaaacgccaacagcgtgcagcaggtgaaggacgacgagatgctgaagcctgaatatttccccgccaactactttgccgagagcggcgtgggccggatcaaggaccgggtgctgaacagactgaacaaggccatcaagagcaacaaggccaagaagggcgagatcatcgcctatgacaagatgagagaagtgatggctttcatcaataactctctgcccgtggacgagaagctgaagcccaaggattacaagagatacctgggcatggtgagattctgggatagagaaaaggacaatatcaagcgcgagttcgaaacgaaggagtggagcaagtatctgccctccaacttctggaccgccaagaacctggagagagtgtacggactggcccgggaaaagaacgcagagctgtttaacaagctgaaggccgacgtggagaagatggacgaaagagagctggaaaagtatcagaagatcaacgacgccaaggatctggccaacctgcggcggctggccagcgacttcggagtgaagtgggaggagaaggattgggacgagtactccggccagatcaagaagcagatcacagattcccagaagctgaccatcatgaagcagagaatcacagccggcctgaagaagaagcacggcatcgaaaacctgaacctgaggatcaccatcgacatcaacaagtccagaaaggccgtgctgaatcggatcgccatccccagaggatttgtgaagcggcacatcctgggctggcaggaatccgagaaggtgagcaagaagatcagagaagccgaatgcgagattctgctgagcaaggagtacgaggagctgagcaagcagttctttcagagcaaggactacgacaagatgacccgcatcaacggcctgtacgagaagaataagctgatcgccctgatggccgtgtatctgatggggcagctgagaatcctgttcaaggagcacaccaagctggacgacatcaccaagaccaccgtggatttcaagatcagcgacaaggtgaccgtgaagatccccttctccaactatccctccctggtgtacaccatgagcagcaaggccgtggacaatatcggcaactacggcttcagcaacaaggacaaggataagcccattctgggcaagatcgacgtgatcgagaagcagcggatggagtttatcaaggaggtgctgggattcgagaagtacctgtttgacgataagatcatcgacaagagcaagttcgccgacaccgccacccacatcagctttgccgaaatcgtggaagaactggtggagaagggctgggacaaggaccggctgacgaagctgaaggatgcccggaacaaggccctgcacggcgagatcctgaccggcaccagcttcgacgagacaaagtccctgatcaacgagctgaagaag
hfCas13f.v2(Y666A、Y677A)氨基酸序列,没有NLS,SEQ ID NO:4
MNGIELKKEEAAFYFNQAELNLKAIEDNIFDKERRKTLLNNPQILAKMENFIFNFRDVTKNAKGEIDCLLLKLRELRNFYSHYVHKRDVRELSKGEKPILEKYYQFAIESTGSENVKLEIIENDAWLADAGVLFFLCIFLKKSQANKLISGISGFKRNDDTGQPRRNLFTYFSIREGYKVVPEMQKHFLLFSLVNHLSNQDDYIEKAHQPYDIGEGLFFHRIASTFLNISGILRNMKFYTYQSKRLVEQRGELKREKDIFAWEEPFQGNSYFEINGHKGVIGEDELKELCYAFLIGNQDANKVEGRITQFLEKFRNANSVQQVKDDEMLKPEYFPANYFAESGVGRIKDRVLNRLNKAIKSNKAKKGEIIAYDKMREVMAFINNSLPVDEKLKPKDYKRYLGMVRFWDREKDNIKREFETKEWSKYLPSNFWTAKNLERVYGLAREKNAELFNKLKADVEKMDERELEKYQKINDAKDLANLRRLASDFGVKWEEKDWDEYSGQIKKQITDSQKLTIMKQRITAGLKKKHGIENLNLRITIDINKSRKAVLNRIAIPRGFVKRHILGWQESEKVSKKIREAECEILLSKEYEELSKQFFQSKDYDKMTRINGLYEKNKLIALMAVYLMGQLRILFKEHTKLDDITKTTVDFKISDKVTVKIPFSNAPSLVYTMSSKAVDNIGNYGFSNKDKDKPILGKIDVIEKQRMEFIKEVLGFEKYLFDDKIIDKSKFADTATHISFAEIVEELVEKGWDKDRLTKLKDARNKALHGEILTGTSFDETKSLINELKK
密码子优化的编码hfCas13f.v2(Y666A、Y677A)的多核苷酸序列,没有TAG终止密码子,SEQ ID NO:5
atgaatggcatcgagctgaagaaggaagaagccgccttctacttcaatcaggccgagctgaacctgaaggccattgaggacaacatcttcgacaaggagagacggaagacactgctgaacaacccccagatcctggccaagatggagaactttatcttcaatttccgggacgtgaccaagaacgccaagggcgaaatcgactgcctgctgctgaagctgagagagctgcggaacttttacagccactacgtgcacaagcgggacgtcagagaactgagcaagggcgagaagccgatcctggagaagtactaccagttcgccatcgaatccaccggctctgagaacgtgaagctcgaaatcatcgaaaacgacgcctggctggccgacgccggcgtgctgttcttcctgtgcatcttcctgaagaagagccaggcaaacaagctgatcagcggcatcagcggcttcaagagaaacgacgacaccggccagcctcggagaaacctgttcacctacttctccatccgggagggctacaaggtggtgcccgaaatgcagaagcacttcctgctgttctccctggtgaaccacctgagcaaccaggacgattatatcgaaaaggcccaccagccctacgacatcggcgagggcctcttcttccaccggattgccagcaccttcctgaacatctccggaatcctgagaaacatgaagttctacacctatcagagcaagagactggtggagcagagaggcgagctgaagcgggaaaaggacatcttcgcctgggaagaaccgtttcagggcaattcctactttgagatcaacggccacaagggcgtgattggcgaagacgagctgaaggagctgtgctacgccttcctgatcggcaaccaggacgccaacaaggtggagggccggatcacccagttcctggagaagttcagaaacgccaacagcgtgcagcaggtgaaggacgacgagatgctgaagcctgaatatttccccgccaactactttgccgagagcggcgtgggccggatcaaggaccgggtgctgaacagactgaacaaggccatcaagagcaacaaggccaagaagggcgagatcatcgcctatgacaagatgagagaagtgatggctttcatcaataactctctgcccgtggacgagaagctgaagcccaaggattacaagagatacctgggcatggtgagattctgggatagagaaaaggacaatatcaagcgcgagttcgaaacgaaggagtggagcaagtatctgccctccaacttctggaccgccaagaacctggagagagtgtacggactggcccgggaaaagaacgcagagctgtttaacaagctgaaggccgacgtggagaagatggacgaaagagagctggaaaagtatcagaagatcaacgacgccaaggatctggccaacctgcggcggctggccagcgacttcggagtgaagtgggaggagaaggattgggacgagtactccggccagatcaagaagcagatcacagattcccagaagctgaccatcatgaagcagagaatcacagccggcctgaagaagaagcacggcatcgaaaacctgaacctgaggatcaccatcgacatcaacaagtccagaaaggccgtgctgaatcggatcgccatccccagaggatttgtgaagcggcacatcctgggctggcaggaatccgagaaggtgagcaagaagatcagagaagccgaatgcgagattctgctgagcaaggagtacgaggagctgagcaagcagttctttcagagcaaggactacgacaagatgacccgcatcaacggcctgtacgagaagaataagctgatcgccctgatggccgtgtatctgatggggcagctgagaatcctgttcaaggagcacaccaagctggacgacatcaccaagaccaccgtggatttcaagatcagcgacaaggtgaccgtgaagatccccttctccaacgctccctccctggtgtacaccatgagcagcaaggccgtggacaatatcggcaactacggcttcagcaacaaggacaaggataagcccattctgggcaagatcgacgtgatcgagaagcagcggatggagtttatcaaggaggtgctgggattcgagaagtacctgtttgacgataagatcatcgacaagagcaagttcgccgacaccgccacccacatcagctttgccgaaatcgtggaagaactggtggagaagggctgggacaaggaccggctgacgaagctgaaggatgcccggaacaaggccctgcacggcgagatcctgaccggcaccagcttcgacgagacaaagtccctgatcaacgagctgaagaag
DR RNA序列,SEQ ID NO:6
GCUGUGAUAGACCUCGAUUUGUGGGGUAGUAACAGC
sgRNA[hSOD1]1 RNA序列,SEQ ID NO:7
GCUGUGAUAGACCUCGAUUUGUGGGGUAGUAACAGCCCCACACCUUCACUGGUCCAUUACUUUCCUGCUGUGAUAGACCUCGAUUUGUGGGGUAGUAACAGC
sgRNA[hSOD1]2 RNA序列,SEQ ID NO:8
GCUGUGAUAGACCUCGAUUUGUGGGGUAGUAACAGCUCCCCACACCUUCACUGGUCCAUUACUUUCGCUGUGAUAGACCUCGAUUUGUGGGGUAGUAACAGC
sgRNA[hSOD1]3 RNA序列,SEQ ID NO:9
GCUGUGAUAGACCUCGAUUUGUGGGGUAGUAACAGCUAAUGCUUCCCCACACCUUCACUGGUCCAUGCUGUGAUAGACCUCGAUUUGUGGGGUAGUAACAGC
sgRNA[hSOD1]4 RNA序列,SEQ ID NO:10
GCUGUGAUAGACCUCGAUUUGUGGGGUAGUAACAGCGAACAUGGAAUCCAUGCAGGCCUUCAGUCAGCUGUGAUAGACCUCGAUUUGUGGGGUAGUAACAGC
sgRNA[hSOD1]5 RNA序列,SEQ ID NO:11
GCUGUGAUAGACCUCGAUUUGUGGGGUAGUAACAGCGGAUUAAAGUGAGGACCUGCACUGGUACAGGCUGUGAUAGACCUCGAUUUGUGGGGUAGUAACAGC
sgRNA[hSOD1]6 RNA序列,SEQ ID NO:12
GCUGUGAUAGACCUCGAUUUGUGGGGUAGUAACAGCUCUGGAUAGAGGAUUAAAGUGAGGACCUGCGCUGUGAUAGACCUCGAUUUGUGGGGUAGUAACAGC
sgRNA[hSOD1]7 RNA序列,SEQ ID NO:13
GCUGUGAUAGACCUCGAUUUGUGGGGUAGUAACAGCGCCUCUCUUCAUCCUUUGGCCCACCGUGUUGCUGUGAUAGACCUCGAUUUGUGGGGUAGUAACAGC
sgRNA[hSOD1]8 RNA序列,SEQ ID NO:14
GCUGUGAUAGACCUCGAUUUGUGGGGUAGUAACAGCGCUCGAAAUUGAUGAUGCCCUGCACUGGGCGCUGUGAUAGACCUCGAUUUGUGGGGUAGUAACAGC
sgRNA[hSOD1]9 RNA序列,SEQ ID NO:15
GCUGUGAUAGACCUCGAUUUGUGGGGUAGUAACAGCCACUGGUCCAUUACUUUCCUUCUGCUCGAAGCUGUGAUAGACCUCGAUUUGUGGGGUAGUAACAGC
sgRNA[hSOD1]10 RNA序列,SEQ ID NO:16
GCUGUGAUAGACCUCGAUUUGUGGGGUAGUAACAGCCCAAGUCUCCAACAUGCCUCUCUUCAUCCUGCUGUGAUAGACCUCGAUUUGUGGGGUAGUAACAGC
sgRNA[hSOD1]11 RNA序列,SEQ ID NO:17
GCUGUGAUAGACCUCGAUUUGUGGGGUAGUAACAGCGCAGUCACAUUGCCCAAGUCUCCAACAUGCGCUGUGAUAGACCUCGAUUUGUGGGGUAGUAACAGC
sgRNA[hSOD1]12 RNA序列,SEQ ID NO:18
GCUGUGAUAGACCUCGAUUUGUGGGGUAGUAACAGCUUCAUGGACCACCAGUGUGCGGCCAAUGAUGCUGUGAUAGACCUCGAUUUGUGGGGUAGUAACAGC
sgRNA[hSOD1]13 RNA序列,SEQ ID NO:19
GCUGUGAUAGACCUCGAUUUGUGGGGUAGUAACAGCCAUUUCCACCUUUGCCCAAGUCAUCUGCUUGCUGUGAUAGACCUCGAUUUGUGGGGUAGUAACAGC
sgRNA[hSOD1]14 RNA序列,SEQ ID NO:20
GCUGUGAUAGACCUCGAUUUGUGGGGUAGUAACAGCUACACCACAAGCCAAACGACUUCCAGCGUUGCUGUGAUAGACCUCGAUUUGUGGGGUAGUAACAGC
sgRNA[hSOD1]15 RNA序列,SEQ ID NO:21
GCUGUGAUAGACCUCGAUUUGUGGGGUAGUAACAGCCGAUCCCAAUUACACCACAAGCCAAACGACGCUGUGAUAGACCUCGAUUUGUGGGGUAGUAACAGC
sgRNA[hSOD1]16 RNA序列,SEQ ID NO:22
GCUGUGAUAGACCUCGAUUUGUGGGGUAGUAACAGCAAUGGUCUCCUGAGAGUGAGAUCACAGAAUGCUGUGAUAGACCUCGAUUUGUGGGGUAGUAACAGC
间隔子[hSOD1]1 RNA序列,SEQ ID NO:23
CCCACACCUUCACUGGUCCAUUACUUUCCU
间隔子[hSOD1]2 RNA序列,SEQ ID NO:24
UCCCCACACCUUCACUGGUCCAUUACUUUC
间隔子[hSOD1]3 RNA序列,SEQ ID NO:25
UAAUGCUUCCCCACACCUUCACUGGUCCAU
间隔子[hSOD1]4 RNA序列,SEQ ID NO:26
GAACAUGGAAUCCAUGCAGGCCUUCAGUCA
间隔子[hSOD1]5 RNA序列,SEQ ID NO:27
GGAUUAAAGUGAGGACCUGCACUGGUACAG
间隔子[hSOD1]6 RNA序列,SEQ ID NO:28
UCUGGAUAGAGGAUUAAAGUGAGGACCUGC
间隔子[hSOD1]7 RNA序列,SEQ ID NO:29
GCCUCUCUUCAUCCUUUGGCCCACCGUGUU
间隔子[hSOD1]8 RNA序列,SEQ ID NO:30
GCUCGAAAUUGAUGAUGCCCUGCACUGGGC
间隔子[hSOD1]9 RNA序列,SEQ ID NO:31
CACUGGUCCAUUACUUUCCUUCUGCUCGAA
间隔子[hSOD1]10 RNA序列,SEQ ID NO:32
CCAAGUCUCCAACAUGCCUCUCUUCAUCCU
间隔子[hSOD1]11 RNA序列,SEQ ID NO:33
GCAGUCACAUUGCCCAAGUCUCCAACAUGC
间隔子[hSOD1]12 RNA序列,SEQ ID NO:34
UUCAUGGACCACCAGUGUGCGGCCAAUGAU
间隔子[hSOD1]13 RNA序列,SEQ ID NO:35
CAUUUCCACCUUUGCCCAAGUCAUCUGCUU
间隔子[hSOD1]14 RNA序列,SEQ ID NO:36
UACACCACAAGCCAAACGACUUCCAGCGUU
间隔子[hSOD1]15 RNA序列,SEQ ID NO:37
CGAUCCCAAUUACACCACAAGCCAAACGAC
间隔子[hSOD1]16 RNA序列,SEQ ID NO:38
AAUGGUCUCCUGAGAGUGAGAUCACAGAAU
靶RNA序列[hSOD1]1,SEQ ID NO:39
AGGAAAGUAAUGGACCAGUGAAGGUGUGGG
靶RNA序列[hSOD1]2,SEQ ID NO:40
GAAAGUAAUGGACCAGUGAAGGUGUGGGGA
靶RNA序列[hSOD1]3,SEQ ID NO:41
AUGGACCAGUGAAGGUGUGGGGAAGCAUUA
靶RNA序列[hSOD1]4,SEQ ID NO:42
UGACUGAAGGCCUGCAUGGAUUCCAUGUUC
靶RNA序列[hSOD1]5,SEQ ID NO:43
CUGUACCAGUGCAGGUCCUCACUUUAAUCC
靶RNA序列[hSOD1]6,SEQ ID NO:44
GCAGGUCCUCACUUUAAUCCUCUAUCCAGA
靶RNA序列[hSOD1]7,SEQ ID NO:45
AACACGGUGGGCCAAAGGAUGAAGAGAGGC
靶RNA序列[hSOD1]8,SEQ ID NO:46
GCCCAGUGCAGGGCAUCAUCAAUUUCGAGC
靶RNA序列[hSOD1]9,SEQ ID NO:47
UUCGAGCAGAAGGAAAGUAAUGGACCAGUG
靶RNA序列[hSOD1]10,SEQ ID NO:48
AGGAUGAAGAGAGGCAUGUUGGAGACUUGG
靶RNA序列[hSOD1]11,SEQ ID NO:49
GCAUGUUGGAGACUUGGGCAAUGUGACUGC
靶RNA序列[hSOD1]12,SEQ ID NO:50
AUCAUUGGCCGCACACUGGUGGUCCAUGAA
靶RNA序列[hSOD1]13,SEQ ID NO:51
AAGCAGAUGACUUGGGCAAAGGUGGAAAUG
靶RNA序列[hSOD1]14,SEQ ID NO:52
AACGCUGGAAGUCGUUUGGCUUGUGGUGUA
靶RNA序列[hSOD1]15,SEQ ID NO:53
GUCGUUUGGCUUGUGGUGUAAUUGGGAUCG
靶RNA序列[hSOD1]16,SEQ ID NO:54
AUUCUGUGAUCUCACUCUCAGGAGACCAUU
sgRNA[hSOD1]5&7 RNA序列,SEQ ID NO:55
GCUGUGAUAGACCUCGAUUUGUGGGGUAGUAACAGCGGAUUAAAGUGAGGACCUGCACUGGUACAGGCUGUGAUAGACCUCGAUUUGUGGGGUAGUAACAGCGCCUCUCUUCAUCCUUUGGCCCACCGUGUUGCUGUGAUAGACCUCGAUUUGUGGGGUAGUAACAGC
非靶向sgRNA序列,SEQ ID NO:56
GCUGUGAUAGACCUCGAUUUGUGGGGUAGUAACAGCCGUCUGGCCUUCCUGUAGCCAGCUUUCAUCGCUGUGAUAGACCUCGAUUUGUGGGGUAGUAACAGC
非靶向间隔子RNA序列,SEQ ID NO:57
CGUCUGGCCUUCCUGUAGCCAGCUUUCAUC
非靶向靶RNA序列,SEQ ID NO:58
GAUGAAAGCUGGCUACAGGAAGGCCAGACG
ShRNA[hSOD1]1序列,SEQ ID NO:59
AAGGAUGAAGAGAGGCAUG
ShRNA[hSOD1]2序列,SEQ ID NO:60
GCAUUAAAGGACUGACUGA
ShRNA[hSOD1]3序列,SEQ ID NO:61
CAUGGAUUCCAUGUUCAUGA
Cba启动子,SEQ ID NO:62
cgttacataacttacggtaaatggcccgcctggctgaccgcccaacgacccccgcccattgacgtcaatagtaacgccaatagggactttccattgacgtcaatgggtggagtatttacggtaaactgcccacttggcagtacatcaagtgtatcatatgccaagtacgccccctattgacgtcaatgacggtaaatggcccgcctggcattgtgcccagtacatgaccttatgggactttcctacttggcagtacatctacgtattagtcatcgctattaccatggtcgaggtgagccccacgttctgcttcactctccccatctcccccccctccccacccccaattttgtatttatttattttttaattattttgtgcagcgatgggggcggggggggggggggggcgcgcgccaggcggggcggggcggggcgaggggcggggcggggcgaggcggagaggtgcggcggcagccaatcagagcggcgcgctccgaaagtttccttttatggcgaggcggcggcggcggcggccctataaaaagcgaagcgcgcggcgggcgaactgaaaaaccagaaagttaactggtaagtttagtctttttgtcttttatttcaggtcctggtggtgcaaatcaaagaactgctcctcagtggatgttgcctttacttctaggcctgtacggaagtgttacttctgctctaaaagctgttgg
Cbh启动子,SEQ ID NO:63
cgttacataacttacggtaaatggcccgcctggctgaccgcccaacgacccccgcccattgacgtcaatagtaacgccaatagggactttccattgacgtcaatgggtggagtatttacggtaaactgcccacttggcagtacatcaagtgtatcatatgccaagtacgccccctattgacgtcaatgacggtaaatggcccgcctggcattgtgcccagtacatgaccttatgggactttcctacttggcagtacatctacgtattagtcatcgctattaccatggtcgaggtgagccccacgttctgcttcactctccccatctcccccccctccccacccccaattttgtatttatttattttttaattattttgtgcagcgatgggggcggggggggggggggggcgcgcgccaggcggggcggggcggggcgaggggcggggcggggcgaggcggagaggtgcggcggcagccaatcagagcggcgcgctccgaaagtttccttttatggcgaggcggcggcggcggcggccctataaaaagcgaagcgcgcggcgggcgggagtcgctgcgcgctgccttcgccccgtgccccgctccgccgccgcctcgcgccgcccgccccggctctgactgaccgcgttactcccacaggtgagcgggcgggacggcccttctcctccgggctgtaattagctgagcaagaggtaagggtttaagggatggttggttggtggggtattaatgtttaattacctggagcacctgcctgaaatcactttttttcaggttgg
增强子,SEQ ID NO:64
cgttacataacttacggtaaatggcccgcctggctgaccgcccaacgacccccgcccattgacgtcaatagtaacgccaatagggactttccattgacgtcaatgggtggagtatttacggtaaactgcccacttggcagtacatcaagtgtatcatatgccaagtacgccccctattgacgtcaatgacggtaaatggcccgcctggcattgtgcccagtacatgaccttatgggactttcctacttggcagtacatctacgtattagtcatcgctattaccatg
内含子,SEQ ID NO:65
ggagtcgctgcgcgctgccttcgccccgtgccccgctccgccgccgcctcgcgccgcccgccccggctctgactgaccgcgttactcccacaggtgagcgggcgggacggcccttctcctccgggctgtaattagctgagcaagaggtaagggtttaagggatggttggttggtggggtattaatgtttaattacctggagcacctgcctgaaatcactttttttcag
SV40 NLS氨基酸序列,SEQ ID NO:66
PKKKRKV
bgh-polyA,SEQ ID NO:67
ctgtgccttctagttgccagccatctgttgtttgcccctcccccgtgccttccttgaccctggaaggtgccactcccactgtcctttcctaataaaatgaggaaattgcatcgcattgtctgagtaggtgtcattctattctggggggtggggtggggcaggacagcaagggggaggattgggaagacaatagcaggcatgctggggatgcggtgggctctatgg
U6启动子,SEQ ID NO:68
gagggcctatttcccatgattccttcatatttgcatatacgatacaaggctgttagagagataattggaattaatttgactgtaaacacaaagatattagtacaaaatacgtgacgtagaaagtaataatttcttgggtagtttgcagttttaaaattatgttttaaaatggactatcatatgcttaccgtaacttgaaagtatttcgatttcttggctttatatatcttgtggaaaggac
CMV启动子,SEQ ID NO:69
gtgatgcggttttggcagtacatcaatgggcgtggatagcggtttgactcacggggatttccaagtctccaccccattgacgtcaatgggagtttgttttggcaccaaaatcaacgggactttccaaaatgtcgtaacaactccgccccattgacgcaaatgggcggtaggcgtgtacggtgggaggtctatataagcagagct
mCherry氨基酸序列,SEQ ID NO:70
MVSKGEEDNMAIIKEFMRFKVHMEGSVNGHEFEIEGEGEGRPYEGTQTAKLKVTKGGPLPFAWDILSPQFMYGSKAYVKHPADIPDYLKLSFPEGFKWERVMNFEDGGVVTVTQDSSLQDGEFIYKVKLRGTNFPSDGPVMQKKTMGWEASSERMYPEDGALKGEIKQRLKLKDGGHYDAEVKTTYKAKKPVQLPGAYNVNIKLDITSHNEDYTIVEQYERAEGRHSTGGMDELYK
5’ITR,SEQ ID NO:71
cctgcaggcagctgcgcgctcgctcgctcactgaggccgcccgggcaaagcccgggcgtcgggcgacctttggtcgcccggcctcagtgagcgagcgagcgcgcagagagggagtggccaactccatcactaggggttcct
3’ITR,SEQ ID NO:72
aggaacccctagtgatggagttggccactccctctctgcgcgctcgctcgctcactgaggccgggcgaccaaaggtcgcccgacgcccgggctttgcccgggcggcctcagtgagcgagcgagcgcgcagctgcctgcagg
Kozak
gccacc
全长hSOD1 mRNA,SEQ ID NO:73
GCGUCGUAGUCUCCUGCAGCGUCUGGGGUUUCCGUUGCAGUCCUCGGAACCAGGACCUCGGCGUGGCCUAGCGAGUUAUGGCGACGAAGGCCGUGUGCGUGCUGAAGGGCGACGGCCCAGUGCAGGGCAUCAUCAAUUUCGAGCAGAAGGAAAGUAAUGGACCAGUGAAGGUGUGGGGAAGCAUUAAAGGACUGACUGAAGGCCUGCAUGGAUUCCAUGUUCAUGAGUUUGGAGAUAAUACAGCAGGCUGUACCAGUGCAGGUCCUCACUUUAAUCCUCUAUCCAGAAAACACGGUGGGCCAAAGGAUGAAGAGAGGCAUGUUGGAGACUUGGGCAAUGUGACUGCUGACAAAGAUGGUGUGGCCGAUGUGUCUAUUGAAGAUUCUGUGAUCUCACUCUCAGGAGACCAUUGCAUCAUUGGCCGCACACUGGUGGUCCAUGAAAAAGCAGAUGACUUGGGCAAAGGUGGAAAUGAAGAAAGUACAAAGACAGGAAACGCUGGAAGUCGUUUGGCUUGUGGUGUAAUUGGGAUCGCCCAAUAAACAUUCCCUUGGAUGUAGUCUGAGGCCCCUUAACUCAUCUGUUAUCCUGCUAGCUGUAGAAAUGUAUCCUGAUAAACAUUAAACACUGUAAUCUUAAAAGUGUAAUUGUGUGACUUUUUCAGAGUUGCUUUAAAGUACCUGUAGUGAGAAACUGAUUUAUGAUCACUUGGAAGAUUUGUAUAGUUUUAUAAAACUCAGUUAAAAUGUCUGUUUCAAUGACCUGUAUUUUGCCAGACUUAAAUCACAGAUGGGUAUUAAACUUGUCAGAAUUUCUUUGUCAUUCAAGCCUGUGAAUAAAAACCCUGUAUGGCACUUAUUAUGAGGCUAUUAAAAGAAUCCAAAUUCAAACUAAA
HA标签,SEQ ID NO:74
YPYDVPDYA
AAV-转基因质粒-[hfCas13f.v2]-sgRNA[hSOD1]5&7ITR至ITR,SEQ ID NO:75
cctgcaggcagctgcgcgctcgctcgctcactgaggccgcccgggcaaagcccgggcgtcgggcgacctttggtcgcccggcctcagtgagcgagcgagcgcgcagagagggagtggccaactccatcactaggggttcctgcggccatcgatggcgcgcccgttacataacttacggtaaatggcccgcctggctgaccgcccaacgacccccgcccattgacgtcaatagtaacgccaatagggactttccattgacgtcaatgggtggagtatttacggtaaactgcccacttggcagtacatcaagtgtatcatatgccaagtacgccccctattgacgtcaatgacggtaaatggcccgcctggcattgtgcccagtacatgaccttatgggactttcctacttggcagtacatctacgtattagtcatcgctattaccatggtcgaggtgagccccacgttctgcttcactctccccatctcccccccctccccacccccaattttgtatttatttattttttaattattttgtgcagcgatgggggcggggggggggggggggcgcgcgccaggcggggcggggcggggcgaggggcggggcggggcgaggcggagaggtgcggcggcagccaatcagagcggcgcgctccgaaagtttccttttatggcgaggcggcggcggcggcggccctataaaaagcgaagcgcgcggcgggcgggagtcgctgcgcgctgccttcgccccgtgccccgctccgccgccgcctcgcgccgcccgccccggctctgactgaccgcgttactcccacaggtgagcgggcgggacggcccttctcctccgggctgtaattagctgagcaagaggtaagggtttaagggatggttggttggtggggtattaatgtttaattacctggagcacctgcctgaaatcactttttttcaggttggaccggtgccaccatgcccaagaagaagcggaaggtgaatggcatcgagctgaagaaggaagaagccgccttctacttcaatcaggccgagctgaacctgaaggccattgaggacaacatcttcgacaaggagagacggaagacactgctgaacaacccccagatcctggccaagatggagaactttatcttcaatttccgggacgtgaccaagaacgccaagggcgaaatcgactgcctgctgctgaagctgagagagctgcggaacttttacagccactacgtgcacaagcgggacgtcagagaactgagcaagggcgagaagccgatcctggagaagtactaccagttcgccatcgaatccaccggctctgagaacgtgaagctcgaaatcatcgaaaacgacgcctggctggccgacgccggcgtgctgttcttcctgtgcatcttcctgaagaagagccaggcaaacaagctgatcagcggcatcagcggcttcaagagaaacgacgacaccggccagcctcggagaaacctgttcacctacttctccatccgggagggctacaaggtggtgcccgaaatgcagaagcacttcctgctgttctccctggtgaaccacctgagcaaccaggacgattatatcgaaaaggcccaccagccctacgacatcggcgagggcctcttcttccaccggattgccagcaccttcctgaacatctccggaatcctgagaaacatgaagttctacacctatcagagcaagagactggtggagcagagaggcgagctgaagcgggaaaaggacatcttcgcctgggaagaaccgtttcagggcaattcctactttgagatcaacggccacaagggcgtgattggcgaagacgagctgaaggagctgtgctacgccttcctgatcggcaaccaggacgccaacaaggtggagggccggatcacccagttcctggagaagttcagaaacgccaacagcgtgcagcaggtgaaggacgacgagatgctgaagcctgaatatttccccgccaactactttgccgagagcggcgtgggccggatcaaggaccgggtgctgaacagactgaacaaggccatcaagagcaacaaggccaagaagggcgagatcatcgcctatgacaagatgagagaagtgatggctttcatcaataactctctgcccgtggacgagaagctgaagcccaaggattacaagagatacctgggcatggtgagattctgggatagagaaaaggacaatatcaagcgcgagttcgaaacgaaggagtggagcaagtatctgccctccaacttctggaccgccaagaacctggagagagtgtacggactggcccgggaaaagaacgcagagctgtttaacaagctgaaggccgacgtggagaagatggacgaaagagagctggaaaagtatcagaagatcaacgacgccaaggatctggccaacctgcggcggctggccagcgacttcggagtgaagtgggaggagaaggattgggacgagtactccggccagatcaagaagcagatcacagattcccagaagctgaccatcatgaagcagagaatcacagccggcctgaagaagaagcacggcatcgaaaacctgaacctgaggatcaccatcgacatcaacaagtccagaaaggccgtgctgaatcggatcgccatccccagaggatttgtgaagcggcacatcctgggctggcaggaatccgagaaggtgagcaagaagatcagagaagccgaatgcgagattctgctgagcaaggagtacgaggagctgagcaagcagttctttcagagcaaggactacgacaagatgacccgcatcaacggcctgtacgagaagaataagctgatcgccctgatggccgtgtatctgatggggcagctgagaatcctgttcaaggagcacaccaagctggacgacatcaccaagaccaccgtggatttcaagatcagcgacaaggtgaccgtgaagatccccttctccaacgctccctccctggtgtacaccatgagcagcaaggccgtggacaatatcggcaactacggcttcagcaacaaggacaaggataagcccattctgggcaagatcgacgtgatcgagaagcagcggatggagtttatcaaggaggtgctgggattcgagaagtacctgtttgacgataagatcatcgacaagagcaagttcgccgacaccgccacccacatcagctttgccgaaatcgtggaagaactggtggagaagggctgggacaaggaccggctgacgaagctgaaggatgcccggaacaaggccctgcacggcgagatcctgaccggcaccagcttcgacgagacaaagtccctgatcaacgagctgaagaagcccaagaagaagcggaaggtgtacccatacgatgttccagattacgcttatccctacgacgtgcctgattatgcatacccatatgatgtccccgactatgcctagaagcttctgtgccttctagttgccagccatctgttgtttgcccctcccccgtgccttccttgaccctggaaggtgccactcccactgtcctttcctaataaaatgaggaaattgcatcgcattgtctgagtaggtgtcattctattctggggggtggggtggggcaggacagcaagggggaggattgggaagacaatagcaggcatgctggggatgcggtgggctctatggcttactagtgagggcctatttcccatgattccttcatatttgcatatacgatacaaggctgttagagagataattggaattaatttgactgtaaacacaaagatattagtacaaaatacgtgacgtagaaagtaataatttcttgggtagtttgcagttttaaaattatgttttaaaatggactatcatatgcttaccgtaacttgaaagtatttcgatttcttggctttatatatcttgtggaaaggacgaaacaccggctgtgatagacctcgatttgtggggtagtaacagcggattaaagtgaggacctgcactggtacaggctgtgatagacctcgatttgtggggtagtaacagcgcctctcttcatcctttggcccaccgtgttgctgtgatagacctcgatttgtggggtagtaacagctttttttgaatccatcggcggccgcgtcggccgcaggaacccctagtgatggagttggccactccctctctgcgcgctcgctcgctcactgaggccgggcgaccaaaggtcgcccgacgcccgggctttgcccgggcggcctcagtgagcgagcgagcgcgcagctgcctgcagg
人SOD1 qPCR引物:
正向:5‘-TGGGCCAAAGGATGAAGAGA-3’(SEQ ID NO:76)
反向:5’-TTTCATGGACCACCAGTGTG-3’(SEQ ID NO:77)
人18s rRNA qPCR引物:
正向:5’-TTGGTGGAGCGATTTGTCTG-3’(SEQ ID NO:78)
反向:5’-GAATGGGGTTCAACGGGTTA-3’(SEQ ID NO:79)
hfCas13f.v2 qPCR引物:
hfCas13f.v2正向引物;5’-GAAATCGTGGAAGAACTGGTGG-3’(SEQ ID NO:80);
hfCas13f.v2反向引物;5’-ATAAGCGTAATCTGGAACATCGTA-3’(SEQ ID NO:81)。
AAV9-M8;SEQ ID NO:82
MAADGYLPDWLEDNLSEGIREWWALKPGAPQPKANQQHQDNARGLVLPGYKYLGPGNGLDKGEPVNAADAAALEHDKAYDQQLKAGDNPYLKYNHADAEFQERLKEDTSFGGNLGRAVFQAKKRLLEPLGLVEEAAKTAPGKKRPVEQSPQEPDSSAGIGKSGAQPAKKRLNFGQTGDTESVPDPQPIGEPPAAPSGVGSLTMASGGGAPVADNNEGADGVGSSSGNWHCDSQWLGDRVITTSTRTWALPTYNNHLYKQISNSTSGGSSNDNAYFGYSTPWGYFDFNRFHCHFSPRDWQRLINNNWGFRPKRLNFKLFNIQVKEVTDNNGVKTIANNLTSTVQVFTDSDYQLPYVLGSAHEGCLPPFPADVFMIPQYGYLTLNDGSQAVGRSSFYCLEYFPSQMLRTGNNFQFSYEFENVPFHSSYAHSQSLDRLMNPLIDQYLYYLSKTINGSGQNQQTLKFSVAGPSNMAVQGRNYIPGPSYRQQRVSTTVTQNNNSEFAWPGASSWALNGRNSLMNPGPAMASHKEGEDRFFPLSGSLIFGKQGTGRDNVDADKVMITNEEEIKTTNPVATESYGQVATNHQSEATLGIFPKAQAQTGWVQNQGILPGMVWQDRDVYLQGPIWAKIPHTDGNFHPSPLMGGFGMKHPPPQILIKNTPVPADPPTAFNKDKLNSFITQYSTGQVSVEIEWELQKENSKRWNPEIQYTSNYYKSNNVEFAVNTEGVYSEPRPIGTRYLTRNL

Claims (47)

1.一种重组腺相关病毒(rAAV)载体基因组,所述rAAV载体基因组包含:
(1)编码Cas13多肽的Cas13编码序列,
(i)其中所述Cas13编码序列与SEQ ID NO:3或5或其RNA对应物具有至少80%、85%、90%、95%、96%、97%、98%、99%、99.2%、99.4%、99.6%、99.8%、99.9%或100%同一性,
(ii)其中所述Cas13多肽包含
(a)SEQ ID NO:2或4,或者
(b)SEQ ID NO:2或4的变体,所述变体与SEQ ID NO:1具有至少80%、85%、90%、95%、96%、97%、98%或99%同一性,并且在SEQ ID NO:1的Y666和/或Y677处具有非保守取代(例如,Y666A和/或Y677A取代),其中所述变体具有与SEQ ID NO:1基本上相同(例如,至少约80%、90%、95%、99%或更多)的指导RNA特异性核酸酶活性(切割活性)并且基本上没有(例如,最多20%、15%、10%、5%)SEQ ID NO:1的旁切(指导RNA非依赖性)核酸酶活性(旁切活性);和
(2)单指导RNA(sgRNA)或编码所述sgRNA的sgRNA编码序列,所述sgRNA包含:
(A)与SOD1 mRNA上的靶RNA序列基本上互补的间隔序列;和
(B)能够与所述Cas13多肽形成复合物的同向重复(DR)序列;
其中当所述sgRNA将所述Cas13多肽引导至所述靶RNA序列时,所述复合物在所述靶RNA序列处或附近特异性切割所述SOD1 mRNA;
任选地其中所述sgRNA或sgRNA编码序列在所述Cas13编码序列或其RNA对应物的3’或5’。
2.如权利要求1所述的rAAV载体基因组,所述rAAV载体基因组进一步包含与所述Cas13多肽的N-末端融合的第一核定位序列(NLS,如SEQ ID NO:66)或核输出信号(NES)的第一编码序列,和/或与所述Cas13多肽的C-末端融合的第二NLS(如SEQ ID NO:66)或NES的第二编码序列;
任选地,所述rAAV载体基因组进一步包含与所述Cas13多肽(以及C-末端NLS或NES,如果存在)融合(例如,C-末端融合)的表位标签如HA标签的一个或多个拷贝(例如,3个串联拷贝)的编码序列。
3.如权利要求1或2所述的rAAV载体基因组,所述rAAV载体基因组进一步包含5’AAVITR序列和3’AAV ITR序列。
4.如权利要求3所述的rAAV载体基因组,其中所述5'AAV ITR序列和所述3'AAV ITR序列两者都是来自以下的野生型AAV ITR序列:AAV1、AAV2、AAV3A、AAV3B、AAV4、AAV5、AAV6、AAV7、AAVrh74、AAV8、AAV9、AAV10、AAV11、AAV12、AAV13、AAV-DJ、AAV PHP.eB、或所述AAV1-AAV13中的任一者所属的进化枝的成员,或其功能性截短变体;任选地,所述5'AAV ITR序列具有SEQ ID NO:71的多核苷酸序列,并且/或者所述3'AAV ITR序列具有SEQ ID NO:72的多核苷酸序列。
5.如权利要求1-4中任一项所述的rAAV载体基因组,所述rAAV载体基因组进一步包含与所述Cas13编码序列可操作地连接的启动子。
6.如权利要求5所述的rAAV载体基因组,其中所述启动子是广谱启动子、组织特异性启动子、细胞类型特异性启动子、组成型启动子或诱导型启动子;任选地,其中所述启动子包含选自以下的启动子:Cbh启动子、Cba启动子、pol I启动子、pol II启动子、pol III启动子、T7启动子、U6启动子、H1启动子、逆转录病毒劳斯肉瘤病毒LTR启动子、巨细胞病毒(CMV)启动子、SV40启动子、二氢叶酸还原酶启动子、β-肌动蛋白启动子、延伸因子1α短(EFS)启动子、β葡糖醛酸糖苷酶(GUSB)启动子、巨细胞病毒(CMV)即早(Ie)增强子和/或启动子、鸡β-肌动蛋白(CBA)启动子或其衍生物如CAG启动子、CB启动子、(人)延伸因子1α-亚基(EF1α)启动子、泛素C(UBC)启动子、朊病毒启动子、神经元特异性烯醇化酶(NSE)、神经丝轻链(NFL)启动子、神经丝重链(NFH)启动子、血小板衍生生长因子(PDGF)启动子、血小板衍生生长因子B链(PDGF-β)启动子、突触蛋白(Syn)启动子、突触蛋白1(Syn1)启动子、甲基-CpG结合蛋白2(MeCP2)启动子、Ca2+/钙调蛋白依赖性蛋白激酶II(CaMKII)启动子、代谢型谷氨酸受体2(mGluR2)启动子、神经丝轻链(NFL)启动子、神经丝重链(NFH)启动子、β-珠蛋白小基因nβ2启动子、前脑啡肽原(PPE)启动子、脑啡肽(Enk)启动子、兴奋性氨基酸转运蛋白2(EAAT2)启动子、胶质纤维酸性蛋白(GFAP)启动子和髓鞘碱性蛋白(MBP)启动子。
7.如权利要求6所述的rAAV载体基因组,其中所述启动子包含Cbh启动子,如具有SEQID NO:63的多核苷酸序列的Cbh启动子,或Cba启动子,如具有SEQ ID NO:62的多核苷酸序列的Cba启动子。
8.如权利要求1-7中任一项所述的rAAV载体基因组,所述rAAV载体基因组进一步包含聚腺苷酸化(polyA)信号序列,如牛生长激素聚腺苷酸化信号(bGH polyA)、小polyA信号(SPA)、人生长激素聚腺苷酸化信号(hGH polyA)、SV40 polyA信号(SV40 polyA)、兔β珠蛋白polyA信号(rBG polyA)、及其功能性截短或变体;或对应的polyA序列。
9.如权利要求8所述的rAAV载体基因组,其中所述polyA信号序列包含牛生长激素聚腺苷酸化信号(bGH polyA)或其变体;任选地,所述bGH polyA包含SEQ ID NO:67的多核苷酸序列。
10.如权利要求1-9中任一项所述的rAAV载体基因组,其中所述sgRNA编码序列与启动子可操作地连接;任选地其中所述启动子是广谱启动子、组织特异性启动子、细胞类型特异性启动子、组成型启动子或诱导型启动子;任选地选自Cbh启动子、Cba启动子、pol I启动子、pol II启动子、pol III启动子、T7启动子、U6启动子、H1启动子、逆转录病毒劳斯肉瘤病毒LTR启动子、巨细胞病毒(CMV)启动子、SV40启动子、二氢叶酸还原酶启动子、β-肌动蛋白启动子、延伸因子1α短(EFS)启动子、β葡糖醛酸糖苷酶(GUSB)启动子、巨细胞病毒(CMV)即早(Ie)增强子和/或启动子、鸡β-肌动蛋白(CBA)启动子或其衍生物如CAG启动子、CB启动子、(人)延伸因子1α-亚基(EF1α)启动子、泛素C(UBC)启动子、朊病毒启动子、神经元特异性烯醇化酶(NSE)、神经丝轻链(NFL)启动子、神经丝重链(NFH)启动子、血小板衍生生长因子(PDGF)启动子、血小板衍生生长因子B链(PDGF-β)启动子、突触蛋白(Syn)启动子、突触蛋白1(Syn1)启动子、甲基-CpG结合蛋白2(MeCP2)启动子、Ca2+/钙调蛋白依赖性蛋白激酶II(CaMKII)启动子、代谢型谷氨酸受体2(mGluR2)启动子、神经丝轻链(NFL)启动子、神经丝重链(NFH)启动子、β-珠蛋白小基因nβ2启动子、前脑啡肽原(PPE)启动子、脑啡肽(Enk)启动子、兴奋性氨基酸转运蛋白2(EAAT2)启动子、胶质纤维酸性蛋白(GFAP)启动子和髓鞘碱性蛋白(MBP)启动子;任选地其中所述启动子是RNA pol III启动子。
11.如权利要求10所述的rAAV载体基因组,其中所述RNA pol III启动子是U6(如SEQID NO:68)、H1、7SK、或其变体。
12.如权利要求1-11中任一项所述的rAAV载体基因组,其中
(1)所述sgRNA包含与一个DR序列(例如,SEQ ID NO:6)直接连接的一个间隔序列;
(2)所述sgRNA包含侧接两个DR序列(例如,各自具有SEQ ID NO:6)的一个间隔序列;或
(3)所述sgRNA包含两个或更多个间隔序列;并且其中每个间隔序列侧接两个DR序列,每个DR序列都能够与所述Cas13多肽形成复合物;任选地,所述sgRNA包含侧接三个DR序列(例如,各自具有SEQ ID NO:6)的两个间隔序列以形成DR-间隔子-DR-间隔子-DR结构;
其中所述间隔序列中的每一个都独立地与所述SOD1 mRNA上的不同靶RNA序列基本上互补,并且各自能够引导所述Cas13多肽切割相应的所述不同靶RNA序列。
13.如权利要求1-12中任一项所述的rAAV载体基因组,其中所述DR序列包含(1)SEQ IDNO:6;(2)具有与SEQ ID NO:6的二级结构基本上相同的二级结构的序列;或(3)SEQ ID NO:6的变体,所述变体与SEQ ID NO:6的差异为至多1、2、3、4、5、6、7、8、9或10个核苷酸且基本上不降低所述复合物切割所述SOD1 mRNA的能力。
14.如权利要求13所述的rAAV载体基因组,其中每个所述DR序列包含SEQ ID NO:6、基本上由其组成、或由其组成。
15.如权利要求1-14中任一项所述的rAAV载体基因组,其中所述靶RNA序列包含SEQ IDNO:73中的一段连续核苷酸;任选地SEQ ID NO:73中的15-60个连续核苷酸,或15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59或60个连续核苷酸,如30个连续核苷酸,如SEQ ID NO:39-54中的任一个;
任选地其中所述靶RNA序列包含SEQ ID NO:39-54中的任一个中的至少15个连续核苷酸。
16.如权利要求1-15中任一项所述的rAAV载体基因组,其中所述间隔序列独立地包含(1)SEQ ID NO:23-38中的任一个;(2)SEQ ID NO:23-38中的任一个中的至少15个连续核苷酸;或(3)SEQ ID NO:23-38中的任一个的变体,所述变体与SEQ ID NO:23-38中的任一个的差异为至多1、2、3、4、5、6、7、8、9或10个核苷酸且基本上不降低所述复合物切割所述SOD1mRNA的能力。
17.如权利要求1-16中任一项所述的rAAV载体基因组,其中所述SOD1mRNA与疾病或病症如ALS(肌萎缩侧索硬化)相关。
18.如权利要求1-17中任一项所述的rAAV载体基因组,所述rAAV载体基因组包含ITR至ITR多核苷酸(如SEQ ID NO:75),所述ITR至ITR多核苷酸从5'到3'包含:
(a)来自AAV2的5'ITR(如SEQ ID NO:71);
(b)Cbh启动子(例如,包含增强子序列(如SEQ ID NO:64)和内含子序列(如SEQ ID NO:65)的Cbh启动子;任选地,所述Cbh启动子包含SEQ ID NO:63);
(c)Kozak序列(如“GCCACC”);
(d)第一NLS编码序列(如编码SEQ ID NO:66的序列);
(e)编码除第一氨基酸M外的SEQ ID NO:2或4的Cas13多肽的Cas13多核苷酸(如除起始密码子ATG外的SEQ ID NO:3或5);
(f)第二NLS编码序列(如编码SEQ ID NO:66的序列);
(g)任选的编码HA标签序列(例如,SEQ ID NO:74)的三个串联重复序列的编码序列;
(h)bGH polyA信号序列(如SEQ ID NO:67);
(i)U6启动子(如SEQ ID NO:68);
(j)编码第一同向重复序列(DR)(如SEQ ID NO:6)的第一DR DNA编码序列;
(k)编码对SOD1 mRNA具有特异性的第一间隔序列(如SEQ ID NO:27或29)的第一间隔子编码序列;
(l)编码第二DR(如SEQ ID NO:6)的第二DR DNA编码序列;
(m)编码对SOD1 mRNA具有特异性的第二间隔序列(如SEQ ID NO:27或29)的第二间隔子编码序列;
(n)编码第三DR(如SEQ ID NO:6)的第三DR DNA编码序列;和
(o)来自AAV2的3'ITR(如SEQ ID NO:72);
或与所述ITR至ITR多核苷酸具有至少约90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%、99.6%、99.7%、99.8%、99.9%同一性的多核苷酸;
任选地,所述ITR至ITR多核苷酸进一步包含在(a)–(o)中的任何两个相邻序列元件之间的接头序列;
任选地,在(i)至(n)序列元件的5'的(b)至(h)序列元件被重定位到(i)至(n)序列元件的3’。
19.一种重组AAV(rAAV)载体基因组,所述rAAV载体基因组包含以下、基本上由以下组成或由以下组成:
(1)SEQ ID NO:75,或与其具有至少约90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%、99.6%、99.7%、99.8%、99.9%同一性的多核苷酸;
其中所述多核苷酸编码以下的Cas13多肽:
(a)SEQ ID NO:2或4,或者
(b)SEQ ID NO:2或4的变体,所述变体与SEQ ID NO:1具有至少80%、85%、90%、95%、96%、97%、98%或99%同一性,并且在SEQ ID NO:1的Y666和/或Y677处具有非保守取代(例如,Y666A和/或Y677A取代),其中所述变体具有与SEQ ID NO:1基本上相同(例如,至少约80%、90%、95%、99%或更多)的指导RNA特异性核酸酶活性并且基本上没有(例如,最多20%、15%、10%、5%)SEQ ID NO:1的旁切(指导RNA非依赖性)核酸酶活性;和
(2)编码sgRNA的sgRNA编码序列,所述sgRNA包含:
(A)与SOD1 mRNA上的靶RNA序列基本上互补的间隔序列;和
(B)与所述Cas13多肽形成复合物的同向重复(DR)序列,
其中当所述sgRNA将所述Cas13多肽引导至所述靶RNA序列时,在所述靶RNA序列处或附近,所述复合物以与SEQ ID NO:1的Cas13多肽和所述sgRNA的复合物基本上相同(例如,至少约80%、90%、95%、99%或更多)的指导RNA特异性核酸酶活性特异性切割所述SOD1mRNA并且基本上没有(例如,最多20%、15%、10%、5%)SEQ ID NO:1的Cas13多肽和所述sgRNA的复合物的旁切(指导RNA非依赖性)核酸酶活性;任选地其中所述sgRNA编码序列在所述Cas13编码序列的3’或5’。
20.如权利要求19所述的rAAV载体基因组,所述rAAV载体基因组是SEQ ID NO:75或与其具有至少95%或99%同一性的多核苷酸。
21.一种重组AAV(rAAV)病毒颗粒,所述rAAV病毒颗粒包含权利要求1-18中任一项所述的rAAV载体基因组。
22.如权利要求21所述的rAAV病毒颗粒,所述rAAV病毒颗粒包含包裹所述rAAV载体基因组的衣壳,所述衣壳的血清型是AAV1、AAV2、AAV3A、AAV3B、AAV4、AAV5、AAV6、AAV7、AAVrh74、AAV8、AAV9、AAV10、AAV11、AAV12、AAV13、AAV-DJ、或AAV PHP.eB、所述AAV1-AAV13中的任一者所属的进化枝的成员、或其功能性截短变体或功能性突变体。
23.如权利要求21或22所述的rAAV病毒颗粒,其中所述衣壳的血清型是AAV9-M8,其包含SEQ ID NO:82的VP1序列。
24.一种重组AAV(rAAV)病毒颗粒,所述rAAV病毒颗粒包含包裹在血清型为AAV9-M8的衣壳中的权利要求19或20所述的rAAV载体基因组。
25.一种药物组合物,所述药物组合物包含权利要求1-20中任一项所述的rAAV载体基因组、或权利要求21-24中任一项所述的rAAV病毒颗粒,以及药学上可接受的赋形剂。
26.一种在有需要的受试者中治疗与SOD1相关的疾病或病症的方法,所述方法包括向所述受试者施用治疗有效量的权利要求1-20中任一项所述的rAAV载体基因组、权利要求21-24中任一项所述的rAAV病毒颗粒、或权利要求25所述的药物组合物,其中所述rAAV载体基因组或所述rAAV病毒颗粒特异性地下调导致所述疾病或病症的所述SOD1的表达。
27.如权利要求26所述的方法,其中所述施用包括使细胞与所述治疗有效量的权利要求1-20中任一项所述的rAAV载体基因组、权利要求21-24中任一项所述的rAAV病毒颗粒、或权利要求25所述的药物组合物接触。
28.如权利要求27所述的方法,其中所述细胞位于所述受试者的CNS中。
29.如权利要求26-28中任一项所述的方法,其中所述疾病或病症是ALS。
30.如权利要求26-29中任一项所述的方法,其中所述施用包括鞘内施用。
31.如权利要求26-30中任一项所述的方法,其中所述受试者是人。
32.如权利要求26-31中任一项所述的方法,其中所述细胞中SOD1的表达与尚未与权利要求1-20中任一项所述的rAAV载体基因组、权利要求21-24中任一项所述的rAAV病毒颗粒、或权利要求25所述的药物组合物接触的细胞相比降低。
33.如权利要求32所述的方法,其中与施用前所述受试者中SOD1的表达相比,所述受试者中SOD1的表达降低约30%、约35%、约40%、约45%、约50%、约55%、约60%、约65%、约70%、约75%、约80%、或约85%。
34.一种指导RNA(gRNA)(例如,单指导RNA),所述gRNA包含:
(A)与SOD1 mRNA上的靶RNA序列基本上互补的间隔序列;和
(B)任选地,能够与Cas13多肽形成复合物的同向重复(DR)序列,其中当所述gRNA将所述Cas13多肽引导至所述靶RNA序列时,所述复合物在所述靶RNA序列处或附近特异性切割所述SOD1 mRNA。
35.如权利要求34所述的gRNA,其中所述靶RNA序列包含SEQ ID NO:73中的一段连续核苷酸;任选地SEQ ID NO:73中的15-60个连续核苷酸,或15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59或60个连续核苷酸,如30个连续核苷酸,如SEQ ID NO:39-54中的任一个。
36.如权利要求34或35所述的gRNA,其中所述靶RNA序列包含SEQ ID NO:39-54中的任一个中的至少15个连续核苷酸。
37.如权利要求34-36中任一项所述的gRNA,所述gRNA包含两个或更多个相同或不同的间隔序列,每个间隔序列侧接两个所述DR序列。
38.如权利要求34-37中任一项所述的gRNA,所述gRNA包含两个不同的间隔序列(例如,间隔子1和间隔子2),其将三个所述DR序列隔开(例如,DR-间隔子1-DR-间隔子2-DR)。
39.如权利要求34-38中任一项所述的gRNA,所述gRNA包含一个或多个间隔序列,所述一个或多个间隔序列各包含(1)SEQ ID NO:23-38中的任一个;(2)SEQ ID NO:23-38中的任一个中的至少15个连续核苷酸;或(3)SEQ ID NO:23-38中的任一个的变体,所述变体与SEQID NO:23-38中的任一个的差异为至多1、2、3、4、5、6、7、8、9或10个核苷酸且基本上不降低所述复合物切割所述SOD1 mRNA的能力。
40.如权利要求34-39中任一项所述的gRNA,其中所述DR序列包含(1)SEQ ID NO:6;(2)具有与SEQ ID NO:6的二级结构基本上相同的二级结构的序列;或(3)SEQ ID NO:6的变体,所述变体与SEQ ID NO:6的差异为至多1、2、3、4、5、6、7、8、9或10个核苷酸且基本上不降低所述复合物切割所述SOD1 mRNA的能力。
41.如权利要求34-40中任一项所述的gRNA,其中所述Cas13多肽包含Cas13a多肽、Cas13b多肽、Cas13c多肽、Cas13d多肽、Cas13e多肽或Cas13f多肽。
42.如权利要求34-41中任一项所述的gRNA,其中所述Cas13多肽包含
(a)SEQ ID NO:2或4,或者
(b)SEQ ID NO:2或4的变体,所述变体与SEQ ID NO:1具有至少80%、85%、90%、95%、96%、97%、98%或99%同一性,并且在SEQ ID NO:1的Y666和/或Y677处具有非保守取代(例如,Y666A和/或Y677A取代),其中所述变体具有与SEQ ID NO:1基本上相同(例如,至少约80%、90%、95%、99%或更多)的指导RNA特异性核酸酶活性并且基本上没有(例如,最多20%、15%、10%、5%)SEQ ID NO:1的旁切(指导RNA非依赖性)核酸酶活性。
43.一种组合物,所述组合物包含权利要求34-42中任一项所述的gRNA。
44.如权利要求43所述的组合物,所述组合物进一步包含权利要求41或42中的Cas13多肽。
45.一种细胞或其后代,所述细胞或其后代包含权利要求1-20中任一项所述的AAV载体基因组、权利要求21-24中任一项所述的rAAV病毒颗粒、权利要求34-42中任一项所述的gRNA或权利要求43或44所述的组合物。
46.一种试剂盒,所述试剂盒包含权利要求1-20中任一项所述的AAV载体基因组、权利要求21-24中任一项所述的rAAV病毒颗粒、权利要求34-42中任一项所述的gRNA、权利要求43或44所述的组合物或权利要求45所述的细胞或其后代。
47.一种制备权利要求21-24中任一项所述的rAAV颗粒的方法,所述方法包括
a)将编码权利要求1-20中任一项所述的rAAV载体基因组的核酸或从其转录的RNA序列和权利要求22或23中定义的AAV衣壳的编码序列引入AAV包装***中足以将所述rAAV载体基因组或所述转录的RNA包装到所述AAV衣壳中以产生所述rAAV颗粒的一段时间,以及
b)收获所述rAAV颗粒;以及任选地,
c)分离或纯化所述收获的rAAV颗粒。
CN202280070844.6A 2021-08-22 2022-08-22 用于治疗sod1相关疾病的crispr-cas13*** Pending CN118159662A (zh)

Applications Claiming Priority (7)

Application Number Priority Date Filing Date Title
CNPCT/CN2021/113929 2021-08-22
CN2021113929 2021-08-22
CNPCT/CN2021/121926 2021-09-29
PCT/CN2021/121926 WO2022068912A1 (en) 2020-09-30 2021-09-29 Engineered crispr/cas13 system and uses thereof
CNPCT/CN2022/083476 2022-03-28
PCT/CN2022/083476 WO2023024504A1 (en) 2021-08-22 2022-03-28 Crispr-cas13 system for treating sod1-associated diseases
PCT/CN2022/114021 WO2023025103A1 (en) 2021-08-22 2022-08-22 Crispr-cas13 system for treating sod1-associated diseases

Publications (1)

Publication Number Publication Date
CN118159662A true CN118159662A (zh) 2024-06-07

Family

ID=85321524

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202280070844.6A Pending CN118159662A (zh) 2021-08-22 2022-08-22 用于治疗sod1相关疾病的crispr-cas13***

Country Status (2)

Country Link
CN (1) CN118159662A (zh)
WO (1) WO2023025103A1 (zh)

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11174469B2 (en) * 2016-06-29 2021-11-16 Crispr Therapeutics Ag Materials and methods for treatment of Amyotrophic Lateral Sclerosis (ALS) and other related disorders
EP3622073A4 (en) * 2017-05-09 2021-01-06 University of Massachusetts METHOD FOR TREATMENT OF AMYOTROPHIC LATERAL SCLEROSIS (ALS)
US11168322B2 (en) * 2017-06-30 2021-11-09 Arbor Biotechnologies, Inc. CRISPR RNA targeting enzymes and systems and uses thereof
US20220348925A1 (en) * 2019-09-09 2022-11-03 Scribe Therapeutics Inc. Compositions and methods for the targeting of sod1
BR112022017070A2 (pt) * 2020-02-28 2022-11-16 Huigene Therapeutics Co Ltd Sistema crispr-cas tipo vi-e e tipo vi-f e usos do mesmo

Also Published As

Publication number Publication date
WO2023025103A1 (en) 2023-03-02

Similar Documents

Publication Publication Date Title
RU2727672C2 (ru) Нацеливающие пептиды для направленной доставки аденоассоциированных вирусов (aav)
AU2017234929B2 (en) Therapeutic for treatment of diseases including the central nervous system
Dirren et al. SOD1 silencing in motoneurons or glia rescues neuromuscular function in ALS mice
JP7428664B2 (ja) 合成肝臓指向性アデノ随伴ウイルスカプシドおよびその使用
US20200340012A1 (en) Crispr-cas genome engineering via a modular aav delivery system
JP2019519221A (ja) 加齢関連疾患及び症状の遺伝子治療法
JP7182873B2 (ja) 多重ベクターシステム及びその使用
JP2023126487A (ja) 無細胞合成から得ることができる閉端DNAベクターおよびceDNAベクターを得るためのプロセス
CN114480440A (zh) 靶向中枢神经***的aav载体
JP2008506363A (ja) ベクター内非相同末端パリンドローム配列を有するアデノ随伴ウイルスベクター
US20220195458A1 (en) Engineered adeno-associated (aav) vectors for transgene expression
CN115427561B (zh) 工程化CRISPR/Cas13***及其用途
KR20220066225A (ko) 선택적 유전자 조절을 위한 조성물 및 방법
CN113518824A (zh) 新的aav变体
JP2021534814A (ja) アルファ−シヌクレインに対するバリアントRNAi
WO2023025103A1 (en) Crispr-cas13 system for treating sod1-associated diseases
WO2023024504A1 (en) Crispr-cas13 system for treating sod1-associated diseases
US20230272428A1 (en) Methods and compositions for correction of dmd mutations
WO2023184108A1 (en) Crispr-cas13 system for treating ube3a-associated diseases
JP7498499B2 (ja) 心臓、骨格筋、及び筋幹細胞におけるインビボ相同組換え修復
WO2023184107A1 (en) Crispr-cas13 system for treating mecp2-associated diseases
AU2016252887A1 (en) Smad7 gene delivery as a therapeutic
WO2023206088A1 (en) Rna base editor for treating dmd-associated diseases
WO2024078345A1 (zh) snRNA核酸分子及其应用
JP2024517957A (ja) ベクター系

Legal Events

Date Code Title Description
PB01 Publication
SE01 Entry into force of request for substantive examination