CN113122524B - 一种靶向编辑rna的新方法 - Google Patents

一种靶向编辑rna的新方法 Download PDF

Info

Publication number
CN113122524B
CN113122524B CN202011642469.7A CN202011642469A CN113122524B CN 113122524 B CN113122524 B CN 113122524B CN 202011642469 A CN202011642469 A CN 202011642469A CN 113122524 B CN113122524 B CN 113122524B
Authority
CN
China
Prior art keywords
target
arrna
rna
base
adenosine deaminase
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202011642469.7A
Other languages
English (en)
Other versions
CN113122524A (zh
Inventor
袁鹏飞
易泽轩
刘能银
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Jiyin Medical Technology Co ltd
Original Assignee
Beijing Jiyin Medical Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Jiyin Medical Technology Co ltd filed Critical Beijing Jiyin Medical Technology Co ltd
Publication of CN113122524A publication Critical patent/CN113122524A/zh
Application granted granted Critical
Publication of CN113122524B publication Critical patent/CN113122524B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/78Hydrolases (3) acting on carbon to nitrogen bonds other than peptide bonds (3.5)
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K38/00Medicinal preparations containing peptides
    • A61K38/16Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • A61K38/43Enzymes; Proenzymes; Derivatives thereof
    • A61K38/46Hydrolases (3)
    • A61K38/50Hydrolases (3) acting on carbon-nitrogen bonds, other than peptide bonds (3.5), e.g. asparaginase
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K48/00Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy
    • A61K48/005Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy characterised by an aspect of the 'active' part of the composition delivered, i.e. the nucleic acid delivered
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/102Mutagenizing nucleic acids
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/113Non-coding nucleic acids modulating the expression of genes, e.g. antisense oligonucleotides; Antisense DNA or RNA; Triplex- forming oligonucleotides; Catalytic nucleic acids, e.g. ribozymes; Nucleic acids used in co-suppression or gene silencing
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/85Vectors or expression systems specially adapted for eukaryotic hosts for animal cells
    • C12N15/86Viral vectors
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y305/00Hydrolases acting on carbon-nitrogen bonds, other than peptide bonds (3.5)
    • C12Y305/04Hydrolases acting on carbon-nitrogen bonds, other than peptide bonds (3.5) in cyclic amidines (3.5.4)
    • C12Y305/04004Adenosine deaminase (3.5.4.4)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2310/00Structure or type of the nucleic acid
    • C12N2310/10Type of nucleic acid
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2740/00Reverse transcribing RNA viruses
    • C12N2740/00011Details
    • C12N2740/10011Retroviridae
    • C12N2740/15011Lentivirus, not HIV, e.g. FIV, SIV
    • C12N2740/15041Use of virus, viral particle or viral elements as a vector
    • C12N2740/15043Use of virus, viral particle or viral elements as a vector viral genome or elements thereof as genetic vector
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2800/00Nucleic acids vectors
    • C12N2800/10Plasmid DNA
    • C12N2800/106Plasmid DNA for vertebrates
    • C12N2800/107Plasmid DNA for vertebrates for mammalian

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Engineering & Computer Science (AREA)
  • Chemical & Material Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Organic Chemistry (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Biotechnology (AREA)
  • General Engineering & Computer Science (AREA)
  • Biomedical Technology (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Biochemistry (AREA)
  • Microbiology (AREA)
  • Medicinal Chemistry (AREA)
  • Plant Pathology (AREA)
  • Biophysics (AREA)
  • Physics & Mathematics (AREA)
  • Public Health (AREA)
  • Pharmacology & Pharmacy (AREA)
  • Epidemiology (AREA)
  • Animal Behavior & Ethology (AREA)
  • Veterinary Medicine (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Virology (AREA)
  • Gastroenterology & Hepatology (AREA)
  • Immunology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Pharmaceuticals Containing Other Organic And Inorganic Compounds (AREA)
  • Enzymes And Modification Thereof (AREA)

Abstract

本申请涉及一种使细胞中靶标RNA中的靶标胞嘧啶脱氨基的方法,包括将经修饰的腺苷脱氨酶蛋白或其催化结构域或表达该经修饰的腺苷脱氨酶蛋白或其催化结构域的构建体和包含将所述经修饰的腺苷脱氨酶蛋白或其催化结构域募集到所述靶标RNA的arRNA寡核苷酸或表达该arRNA的构建体导入所述细胞。同时,本申请提供了一种用于RNA编辑的工程化组合物或***,以及应用该工程化组合物或***校正T到C突变治疗疾病的用途。

Description

一种靶向编辑RNA的新方法
技术领域
本申请属于基因编辑治疗领域,具体地,本申请创造了一种名为CUSPER(C to USpecific Programmable Editing of RNA)的靶向编辑RNA的方法,其包括利用CUSPER技术进行RNA上由C到U碱基的精准位点编辑,可用于治疗由于T到C突变导致的疾病。
背景技术
近年来,以CRISPR(Clustered regularly interspaced short palindromicrepeats)为首的基因组编辑技术正在飞速发展,并对生物以及医学诸多领域产生了深远的影响。许多科研工作者和生物技术公司也在致力于将该技术推上临床。2019年9月,北京大学邓宏魁教授与其合作者发表文章11首次报道了利用CRISPR技术编辑干细胞并将其回输至患者,以治疗其艾滋病和白血病的临床试验结果,为CRISPR技术在基因治疗方向的转化做出了巨大的贡献。
尽管CRISPR技术存在极大的应用前景,但该技术也存在一系列缺陷,导致该技术从科研阶段向临床治疗应用的转化步履维艰。问题之一便是CRISPR技术用到的核心作用酶:Cas9。基于CRISPR的DNA编辑技术,必须外源表达Cas9或拥有相似功能的其它核酸酶,从而造成了以下几个问题。首先,需要外源表达的核酸酶通常具有较大的分子量,这使得通过病毒载体将其递送至体内的效率急剧下降。其次,由于核酸酶的外源表达,使这种方法存在潜在的核酸酶脱靶可能,这将导致其应用中的潜在致癌风险。最后,外源表达的Cas9等类似核酸酶是从细菌中发现的,而非人类或哺乳动物天然存在的,这使其可能引起患者体内的免疫反应,这一方面可能会对患者自身造成损伤,另一方面也可能会使外源表达的核酸酶被中和,从而失去应有的活性,影响治疗效果。
2017年,麻省理工学院张锋教授及其课题组报道了一种名为REPAIR(RNA Editingfor Programmable A to I Replacement)的RNA编辑技术,通过外源表达Cas13-ADAR融合蛋白及单向导RNA(single guide RNA,sgRNA)可以实现靶向目标RNA的A到I的编辑2,但是该方法同CRISPR技术一样,仍需要外源蛋白的表达。无法解决外源蛋白表达造成的问题。
2019年1月,Thorsten Stafforst课题组报道了名为RESTORE(recruitingendogenous ADAR to specific trans for oligonucleotide-mediated RNAediting,Merkle et al.,2019)的RNA单碱基编辑技术。RESTORE能够摆脱对外源蛋白的依赖,但RESTORE技术需要在IFN-γ存在的前提下才能有较高的编辑效率,而IFN-γ是决定自体免疫发展和严重程度的关键因子9,这使得该技术在医学领域的应用大打折扣。另一方面,RESTORE技术中同样也用到一段向导RNA,而其使用的向导RNA是化学合成的寡核苷酸,并且其合成的寡核苷酸需要人为引入大量的化学修饰以保证其稳定性。在这些化学修饰中,有一部分是非天然的修饰,使得该寡核苷酸可能存在毒性或免疫原性;还有一部分修饰会导致相同碱基链的不同构象,使得对于相同的RNA序列,可能有数十种不同的构象组合,这增加了其向细胞内递送的难度。
2019年7月,北京大学魏文胜教授课题组在Nature Biotechnology上发表的文章4中,首次报道了一种核酸编辑技术:LEAPER(Leveraging Endog enous ADAR forProgrammable Editing of RNA)。与CRISPR技术不同的是,一方面该技术从原理上摆脱了对外源核酸酶过表达的依赖,并且可以通过化学合成RNA完成,也可以通过腺相关病毒(AAV)、慢病毒等载体递送至患者发挥功能,这使得其递送手段的选择上更加灵活多变,使得该技术在向医学领域转化的过程中,具有更大的优势;另一方面该技术只能实现腺苷A到肌酐I(肌酐I在蛋白质翻译过程中会被识别为鸟酐G)的编辑,使得对其他突变,例如T到C的突变无能为力。此外,与CRISPR技术类似,该技术同样需要一段RNA作为向导,以便将内源的核酸酶招募至所需编辑的位点。该段向导RNA被命名为arRNA(adar-recruiting RNA)。
2019年7月,张锋教授课题组报道了一种名为RESCUE(RNA Editing for SpecificC to U Exchange)的新技术1。该技术基于2017年该课题组报道的Cas13-ADAR基本骨架,在负责反应的ADAR催化结构域上做了不同的突变尝试。最终将ADAR催化结构域的A到I编辑活性修改为C到U编辑活性,从而实现了特定位点RNA上C到U的编辑,进一步拓展了对碱基的精准编辑范围。然而,该技术仍需要外源表达Cas13与ADAR突变后的融合蛋白,无法解决细菌源蛋白表达造成的问题。
发明内容
为了解决上述基因编辑技术中的问题,以便将基因编辑技术更好地应用于医学领域,迫切地需要找到一种易于递送且可高效精准纠正T至C突变的定向基因编辑技术。
本申请创造了一种新的RNA编辑技术CUSPER(C to U Specific Prog rammableEditing of RNA),该技术无需依赖细菌来源的Cas13b的表达,并且将RNA编辑的应用范围从A到I的编辑拓展到C到U的编辑。
在本申请中,一方面由于无需依赖细菌来源的大分子蛋白的表达,因此减少了潜在的免疫***风险,和因免疫***对外源蛋白的攻击而对***编辑效率带来的影响;另一方面,随着需要引入的蛋白分子量的显著缩减,其递送方式也变得更加灵活,可以包括化学转化及生物学递送,例如AAV递送等。因此,本申请提供的技术方案,不仅解决了C到U的单碱基编辑技术问题,而且提高了编辑***的安全性、稳定性和使用的灵活性,更加利于体内应用,更具生物医药领域的应用前景。
具体地,本申请涉及:
1.一种用于RNA编辑的工程化组合物或***,包含:
1)经修饰的腺苷脱氨酶蛋白或其催化结构域或表达该经修饰的腺苷脱氨酶蛋白或其催化结构域的构建体,其中,所述腺苷脱氨酶蛋白或其催化结构域经过修饰具有催化胞苷脱氨基的活性,和
2)将所述经修饰的腺苷脱氨酶蛋白或其催化结构域募集到靶标RNA的arRNA或包含该arRNA或包含其编码序列的构建体;
其中所述arRNA包含与所述靶标RNA杂交的互补RNA序列,并且所述arRNA募集所述腺苷脱氨酶蛋白或其催化结构域至靶标RNA致使靶标RNA中的靶标胞苷脱氨基。
在一些实施方案中,所述表达经修饰的腺苷脱氨酶蛋白或其催化结构域的构建体和包含所述arRNA的编码序列的构建体为同一构建体。在一些实施方案中,所述表达经修饰的腺苷脱氨酶蛋白或其催化结构域的构建体和包含所述arRNA的编码序列的构建体为分开的构建体。
在一些实施方案中,本申请的经修饰的腺苷脱氨酶蛋白是腺苷脱氨酶蛋白(例如ADAR2蛋白)经过缺失、添加或取代一个或多个氨基酸而具有胞苷脱氨基的活性的蛋白质。在一些实施方案中,本申请的经修饰的腺苷脱氨酶蛋白是腺苷脱氨酶蛋白(例如ADAR2蛋白)或其催化结构域是经过取代一个或多个氨基酸而具有胞苷脱氨基的活性的蛋白质。在一些实施方案中,本申请经修饰的腺苷脱氨酶蛋白包含如下突变修饰:E488Q/V351G/S486A/T375S/S370C/P462A/N597I/L332I/I398V/K350I/M383L/D619G/S582T/V440I/S495N/K418E/S661T,其中所述突变修饰的氨基酸编号与NP_001103.1中的氨基酸编号一致。在一些实施方案中,本申请经修饰的腺苷脱氨酶蛋白包含以其它ADAR2同源蛋白作为参考序列并具有E488Q/V351G/S486A/T375S/S370C/P462A/N597I/L332I/I398V/K350I/M383L/D619G/S582T/V440I/S495N/K418E/S661T相应突变的蛋白。
在一些实施方案中,本申请用于RNA编辑的工程化组合物或***包含上述经修饰的腺苷脱氨酶蛋白的催化结构域。在一些实施方案中,所述催化结构域为上述经修饰的腺苷脱氨酶蛋白的催化结构域。
2.项1的工程化组合物或***,其中所述腺苷脱氨酶在一个或多个位点发生突变修饰从而具有对胞苷脱氨使其转化成尿苷的活性。
3.项2的工程化组合物或***,其中所述腺苷脱氨酶蛋白或其催化结构域为ADAR2蛋白或其同源蛋白或其催化结构域。
4.项3中的工程化组合物或***,其中所述突变修饰包含:E488Q/V351G/S486A/T375S/S370C/P462A/N597I/L332I/I398V/K350I/M383L/D619G/S582T/V440I/S495N/K418E/S661T,其中所述突变修饰的氨基酸编号与NP_001103.1中的氨基酸编号一致。
在一些实施方案中,所述经修饰的腺苷脱氨酶蛋白或其催化结构域为NP_001103.1蛋白的同源蛋白,具有与如下突变相应的突变:E488Q/V351G/S486A/T375S/S370C/P462A/N597I/L332I/I398V/K350I/M383L/D619G/S582T/V440I/S495N/K418E/S661T。
5.项1-4中任一项的工程化组合物或***,其中所述arRNA与靶标RNA杂交时,其与靶标胞苷相对的靶向碱基为A、U、C、或G。
6.项5中所述的工程化组合物或***,其中所述靶向碱基为U或C。
7.项1-6中任一项的工程化组合物或***,其中:
所述arRNA在对应于靶标RNA的靶标碱基的上游、下游、或上游和下游的一个或多个位置包含非配对核苷酸,以形成和靶标碱基上游、下游、或上游和下游的一个或多个位置的核苷酸错配。
8.项7中的工程化组合物或***,其中所述arRNA靶向碱基的3’最近邻碱基与靶标RNA形成错配。
9.项8中所述的工程化组合物或***,其中所述arRNA与靶标RNA杂交时,所述靶向碱基的3’最近邻碱基与靶标RNA形成G-G错配。
10.项1-9中任一项的工程化组合物或***,所述arRNA与靶标RNA杂交时,所述靶向碱基的5’最近邻碱基与靶标RNA不形成错配。
11.项10中的工程化组合物或***,其中所述靶向碱基的5’最近邻碱基为U。
12.项9中的工程化组合物或***,其中当所述arRNA与靶标RNA杂交时,与所述arRNA的靶向碱基的5’最近邻碱基相对的靶标RNA中的碱基优选次序从高到低为G或C、U或A(G≈C>U≈A)。
13.项1-6中任一项的工程化组合物或***,其中当所述arRNA与靶标RNA杂交时,所述靶标碱基及其5’和3’相邻碱基形成的靶标碱基三联体仅在靶标碱基处形成错配,其中所述靶标碱基三联体选自:ACG、ACC、UCC、UCG、CCC、CCG、UCA、UCU。
14.项1-13任一项的工程化组合物或***,其中所述arRNA长度>50nt、>55nt、>60nt、>65nt、>70nt、>75nt、>80nt、>85nt、>90nt、>95nt、>100nt、>105nt、>110nt、>115nt、>120nt。在一些实施方案中,所述arRNA长约151-53nt、131-61nt、121-61nt、111-65、101-71nt、91-71nt、81-71nt。在一些具体实施方案中,所述arRNA的长度是该项定义的长度范围内的任一正整数。
15.项1-14任一项的工程化组合物或***,其中所述arRNA中靶向碱基距离3’端及5’端的长度相等。
16.项1-14中任一项的组合物,其中所述arRNA中靶向碱基距离3’端的长度为45-5nt,40-5nt,35-10nt,25nt-15nt,24nt-11nt。在一些具体实施方案中,所述arRNA的长度是该项定义的长度范围内的任一正整数。
17.项1-14任一项的工程化组合物或***,其中所述arRNA中靶向碱基距离5’端的长度为80-30nt,70-35nt,60-40nt,55nt-35nt,55nt-45nt。在一些具体实施方案中,所述arRNA的长度是该项定义的长度范围内的任一正整数。
18.项1-17任一项的工程化组合物或***,其中所述arRNA是化学修饰的。
19.项18的工程化组合物或***,其中所述化学修饰包括2’-O-甲基修饰或核苷酸间3’硫代修饰。
20.一种使细胞中靶标RNA中的靶标胞嘧啶脱氨基的方法,包括将如下1)和2)导入所述细胞:
1)经修饰的腺苷脱氨酶蛋白或其催化结构域或表达该经修饰的腺苷脱氨酶蛋白或其催化结构域的构建体,和
2)将所述经修饰的腺苷脱氨酶蛋白或其催化结构域募集到所述靶标RNA的arRNA或包含该arRNA或包含其编码序列的构建体,其中,所述腺苷脱氨酶蛋白或其催化结构域经过修饰具有催化胞苷脱氨基的活性,所述arRNA包含与所述靶标RNA杂交的互补RNA序列,并且所述arRNA募集所述腺苷脱氨酶蛋白或其催化结构域至靶标RNA致使靶标RNA中的靶标胞苷脱氨基。
在一些实施方案中,本申请的经修饰的腺苷脱氨酶蛋白是腺苷脱氨酶蛋白(例如ADAR2蛋白)经过缺失、添加或取代一个或多个氨基酸而具有胞苷脱氨基的活性的蛋白质。在一些实施方案中,本申请的经修饰的腺苷脱氨酶蛋白是腺苷脱氨酶蛋白(例如ADAR2蛋白)或其催化结构域是经过取代一个或多个氨基酸而具有胞苷脱氨基的活性的蛋白质。在一些实施方案中,本申请经修饰的腺苷脱氨酶蛋白包含如下突变修饰:E488Q/V351G/S486A/T375S/S370C/P462A/N597I/L332I/I398V/K350I/M383L/D619G/S582T/V440I/S495N/K418E/S661T,其中所述突变修饰的氨基酸编号与NP_001103.1中的氨基酸编号一致。在一些实施方案中,本申请经修饰的腺苷脱氨酶蛋白包含以其它ADAR2蛋白作为参考序列并具有E488Q/V351G/S486A/T375S/S370C/P462A/N597I/L332I/I398V/K350I/M383L/D619G/S582T/V440I/S495N/K418E/S661T相应突变的蛋白。
在一些实施方案中,本申请用于RNA编辑的工程化组合物或***包含上述经修饰的腺苷脱氨酶蛋白的催化结构域。
21.项20的方法,其中,所述表达经修饰的腺苷脱氨酶蛋白或其催化结构域的构建体和包含所述arRNA的编码序列的构建体为同一构建体,被同时导入所述细胞,或者所述表达经修饰的腺苷脱氨酶蛋白或其催化结构域的构建体和包含所述arRNA的编码序列的构建体为分开的构建体,所述分开的构建体被同时或分开地导入所述细胞。
22.项20或21的方法,其中所述腺苷脱氨酶在一个或多个位点发生突变修饰从而具有对胞苷脱氨使其转化成尿苷的活性。
23.项22的方法,其中所述腺苷脱氨酶蛋白或其催化结构域为ADAR2蛋白或其同源蛋白或其催化结构域。
24.项23中的方法,其中所述突变修饰包含:E488Q/V351G/S486A/T375S/S370C/P462A/N597I/L332I/I398V/K350I/M383L/D619G/S582T/V440I/S495N/K418E/S661T,其中所述突变修饰的氨基酸编号与NP_001103.1中的氨基酸编号一致。
在一些实施方案中,所述经修饰的腺苷脱氨酶蛋白或其催化结构域为NP_001103.1蛋白的同源蛋白,具有与如下突变相应的突变:E488Q/V351G/S486A/T375S/S370C/P462A/N597I/L332I/I398V/K350I/M383L/D619G/S582T/V440I/S495N/K418E/S661T。
25.项21-24中任一项方法,其中所述arRNA与靶标RNA杂交时,其与靶标胞苷相对的靶向碱基为A、U、C、或G。
26.项25中所述的方法,其中所述靶向碱基为U或C。
27.项21-26中任一项的方法,其中:
所述arRNA在对应于靶标RNA的靶标碱基的上游、下游、或上游和下游的一个或多个位置包含非配对核苷酸,以形成和靶标碱基上游、下游、或上游和下游的一个或多个位置的核苷酸错配。
28.项27中的方法,其中所述arRNA靶向碱基的3’最近邻碱基与靶标RNA形成错配。
29.项28中所述的方法,其中所述arRNA与靶标RNA杂交时,所述靶向碱基的3’最近邻碱基与靶标RNA形成G-G错配。
30.项21-29中任一项的方法,所述arRNA与靶标RNA杂交时,所述靶向碱基的5’最近邻碱基与靶标RNA不形成错配。
31.项30中的方法,其中所述靶向碱基的5’最近邻碱基为U。
32.项29中的方法,其中当所述arRNA与靶标RNA杂交时,与所述arRNA的靶向碱基的5’最近邻碱基相对的靶标RNA中的碱基优选次序从高到低为G或C、U或A(G≈C>U≈A)。
33.项21-26中任一项的方法,其中当所述arRNA与靶标RNA杂交时,所述靶标碱基及其5’和3’相邻碱基形成的靶标碱基三联体仅在靶标碱基处形成错配,其中所述靶标碱基三联体选自:ACG、ACC、UCC、UCG、CCC、CCG、UCA、UCU。
34.项21-33任一项的方法,其中所述arRNA长度>50nt、>55nt、>60nt、>65nt、>70nt、>75nt、>80nt、>85nt、>90nt、>95nt、>100nt、>105nt、>110nt、>115nt、>120nt。在一些实施方案中,所述arRNA长约151-53nt、1131-61nt、121-61nt、111-65、101-71nt、91-71nt、81-71nt。在一些具体实施方案中,所述arRNA的长度是该项定义的长度范围内的任一正整数。
35.项21-34任一项的方法,其中所述arRNA中靶向碱基距离3’端及5’端的长度相等。
36.项21-34中任一项的方法,其中所述arRNA中靶向碱基距离3’端的长度为45-5nt,40-5nt,35-10nt,25nt-15nt,24nt-11nt。在一些具体实施方案中,所述arRNA的长度是该项定义的长度范围内的任一正整数。
37.项21-34任一项的方法,其中所述arRNA中靶向碱基距离5’端的长度为80-30nt,70-35nt,60-40nt,55nt-35nt,55nt-45nt。在一些具体实施方案中,所述arRNA的长度是该项定义的长度范围内的任一正整数。
38.项21-37任一项的方法,其中所述arRNA是化学修饰的。
39.项38的方法,其中所述化学修饰包括2’-O-甲基修饰或核苷酸间3’硫代修饰。
40.项21-39中任一项的方法,其中所述细胞为哺乳动物细胞。
41.一种治疗由T到C突变引起的疾病的方法,包括使用如项21-39中任一项的方法使包含所述T到C突变转录形成的信使RNA中靶标碱基C脱氨基,以校正所述突变。
42.一种经修饰的腺苷脱氨酶蛋白,其中所述腺苷脱氨酶蛋白为ADAR2,其包含E488Q/V351G/S486A/T375S/S370C/P462A/N597I/L332I/I398V/K350I/M383L/D619G/S582T/V440I/S495N/K418E/S661T突变修饰,其中所述突变修饰的氨基酸编号与NP_001103.1中的氨基酸编号一致,所述ADAR2蛋白经过所述突变修饰而具有催化胞苷脱氨基的活性。
在一些实施方案中,所述经修饰的腺苷脱氨酶蛋白或其催化结构域为NP_001103.1蛋白的同源蛋白,具有与如下突变相应的突变:E488Q/V351G/S486A/T375S/S370C/P462A/N597I/L332I/I398V/K350I/M383L/D619G/S582T/V440I/S495N/K418E/S661T。
43.如项42中所述的经修饰的腺苷脱氨酶蛋白用于催化胞苷脱氨基转化为尿苷的用途。
附图说明
图1显示了BFP报告体系以及待进行C到U编辑的靶标碱基。
图2显示了当靶向为点为U时,CUSPER和RESCUE技术设计向导RNA时靶标碱基的选择以及靶向为点相邻碱基的设计原则。
图3显示了对CUSPER编辑体系的测试。图中“/”代表未添加对应质粒或arRNA,仅添加相同体积水。
图4显示了LEAPER技术对靶标碱基相邻上下游碱基的偏好性。图中箭头所示为与图3对应的当靶标碱基的3’相邻碱基为A时,LEAPER技术对5’相邻上游的偏好性。
图5显示了RESCUE技术对靶标碱基相邻上下游碱基的偏好性。图中箭头所示为与图3对应的当3’相邻碱基为A时,RESCUE技术对5’相邻碱基的偏好性。
图6显示了对CUSPER编辑体系的重复测试结果。图中“/”代表未添加对应质粒或arRNA而仅添加相同体积水。
图7显示靶标C对应U,及其相邻碱基无错配的情况下,mRNA与对应arRNA序列。
图8显示靶标C对应U,及其相邻碱基无错配的情况下全部16种3’和5’相邻碱基组合的C到U RNA编辑效率
发明详述
为解决现有基因编辑技术中普遍依赖异种外源蛋白的困境,在更多种类的碱基上实现精准的单个碱基编辑,本申请创造了一种RNA编辑技术CUSPER(C to U SpecificProgrammable Editing of RNA)。CUSPER将RNA编辑的应用范围从A到I的编辑拓展到C到U的编辑,且由于使用了哺乳动物本身表达的酶蛋白进行编辑,避免了向细胞内引入异种外源蛋白,从而提高了安全性,并使整个基因编辑过程更加高效便利。
定义
如本文所用,“CUSPER技术”是本申请技术方案中的原创技术,其中的CUSPER是“Cto U Specific Programmable Editing of RNA”的缩写,即“将胞苷C转变为尿苷U的特异性可编程RNA编辑”。该技术使用一段可与靶标RNA互补杂交的短RNA,将经修饰的腺苷脱氨酶蛋白或包含其催化结构域的蛋白募集到靶标RNA,以对靶标胞苷脱氨基,使其转变为尿苷。其中所述经修饰的腺苷脱氨酶蛋白或包含其催化结构域的蛋白经修饰而具有催化胞嘧啶脱氨基的活性。所述可与靶标RNA互补杂交的短RNA即arRNA。本申请中所使用的“arRNA(adar-recruiting RNA)”是指可以招募腺苷脱氨酶蛋白或包含其催化结构域至靶标RNA的单链RNA,该arRNA募集所述腺苷脱氨酶蛋白或其催化结构域至靶标RNA致使靶标RNA中的靶标胞苷脱氨基。如本文所用,核酸的“互补”是指一条核酸通过传统的Watson-Crick碱基配对与另一条核酸形成氢键的能力。百分比互补性表示核酸分子中可与另一核酸分子形成氢键(即,Watson-Crick碱基配对)的残基的百分比(例如,10个中的约5、6、7、8、9、10个分别为约50%,60%,70%,80%,90%和100%互补)。“完全互补”是指核酸序列的所有连续残基与第二核酸序列中相同数量的连续残基形成氢键。如本文所用,“基本上互补”是指在约40、50、60、70、80、100、150、200、250或更多个核苷酸的区域内,至少约70%,75%,80%,85%,90%,95%,97%,98%,99%或100%中的任何一个的互补程度,或指在严格条件下杂交的两条核酸。对于单个碱基或单个核苷酸,按照Watson-Crick碱基配对原则,A与T或U、C与G或I配对时,被称为互补或匹配,反之亦然;而除此以外的碱基配对都称为不互补或不匹配。
“杂交”是指其中一种或多种多核苷酸反应形成复合物的反应,所述复合物通过核苷酸残基的碱基之间的氢键稳定。所述氢键可以通过Watson Crick碱基配对,Hoogstein结合或以任何其他序列特异性的方式发生。能够与给定序列杂交的序列称为给定序列的“互补序列”。
如本文所用,术语“递送”是指将核酸、蛋白等生物大分子通过某些途径从细胞膜外引入细胞膜内。所述“递送”例如电转染、脂质体转染、脂质-纳米颗粒递送、病毒递送、外泌体递送等方式。
如本文所用,术语“靶标RNA”是指待编辑的目标RNA,其包含待编辑的胞苷。所述靶标RNA可以是成熟mRNA或mRNA前体。所述待编辑的胞苷被称为“靶标碱基、”“靶标胞苷”或“靶标C”。在靶标RNA的5’端与靶标胞苷相邻的碱基称为“5’相邻碱基”;在靶标RNA的3’端与靶标胞苷相邻的碱基称为“3’相邻碱基”;靶标碱基及其3’和5’相邻碱基组成的碱基三联体在本文中被称为“靶标碱基三联体”。当arRNA与靶标RNA杂交时,在arRNA上与所述靶标碱基相对的碱基称为“靶向碱基”,在arRNA的5’端与靶向碱基相邻的碱基称为“5’最近邻碱基”;在arRNA的3’端与靶向碱基相邻的碱基称为“3’最近邻碱基”;靶向碱基及其3’和5’最近邻碱基组成的碱基三联体在本文中被称为“靶向碱基三联体”。
在本文中,靶向碱基距离3’端的长度是指靶向碱基的3’最近邻碱基至3’最末端碱基的所有碱基个数;所述靶向碱基距离5’端的长度是指靶向碱基的5’最近邻碱基至5’最末端碱基的所有碱基个数。
如本文所用,术语“腺苷脱氨酶(Adenosine to inosine acting on RNA enzyme,ADAR)”是指是一类在真核生物(包括人等哺乳动物)各组织中广泛表达的腺苷脱氨酶,能够催化RNA分子中腺苷A到肌苷I的转换。
在本申请中,E488Q/V351G/S486A/T375S/S370C/P462A/N597I/L332I/I398V/K350I/M383L/D619G/S582T/V440I/S495N/K418E/S661T突变是指发生于ADAR2蛋白的一系列突变,其中所述突变修饰的氨基酸编号与NP_001103.1中的氨基酸编号一致,即使用NP_001103.1作为参考序列。本领域技术人员应当知晓,对于不同的ADAR2蛋白的参考序列,所述突变中的氨基酸编号可能发生变化。因此,如本申请所用,E488Q/V351G/S486A/T375S/S370C/P462A/N597I/L332I/I398V/K350I/M383L/D619G/S582T/V440I/S495N/K418E/S661T突变包括不同ADAR2蛋白参考序列中与所述突变氨基酸位置对应的突变,所述ADAR2蛋白经过所述突变修饰而具有催化胞苷脱氨基的活性。相应的,本申请提供的经修饰的腺苷脱氨酶蛋白,包括以NP_001103.1作为参考序列并包含E488Q/V351G/S486A/T375S/S370C/P462A/N597I/L332I/I398V/K350I/M383L/D619G/S582T/V440I/S495N/K418E/S661T突变修饰的ADAR2,也涵盖以不同ADAR2蛋白作为参考序列并包含相应突变修饰的ADAR2。
如本文所用,术语“构建体”是指包含某一核酸序列的核酸载体,所述核酸载体可以是线性核酸分子、质粒或病毒载体等。所述核酸分子可以是单链也可以是双链分子。所述特定的核酸序列可以是DNA序列也可以是RNA序列。在一些实施方案中,所述核酸序列不经过转录、翻译或表达而直接发挥其功能。在一些实施方案中,所述核酸序列为DNA序列,其经过转录形成RNA后以RNA分子形式发挥功能。在一些实施方案中,所述核酸序列为RNA,其经过翻译后以多肽或蛋白质的形式发挥作用。在一些实施方案中,所述核酸序列为DNA,其经过转录和翻译步骤形成蛋白质后以蛋白质的形式发挥功能。所述构建体可以通过包装为病毒、脂质纳米颗粒或外泌体等形式进入细胞,亦可以通过电转化、显微注射、化学转化等方式进入细胞。
本申请所用术语“修饰”是指通过化学方法例如基因工程方法改变核酸或蛋白的组成或结构,从而使所述核酸或蛋白的一项或多项特性或功能发生改变。例如,在本申请中,腺苷脱氨酶蛋白或其催化结构域经过修饰,例如添加、缺失和/或突变一个或多个氨基酸后具有催化胞苷脱氨基的作用。
工程化组合物或***
本申请提供了一种用于RNA编辑的工程化组合物或***,其包含:
1)经修饰的腺苷脱氨酶蛋白或其催化结构域或表达该经修饰的腺苷脱氨酶蛋白或其催化结构域的构建体,其中,所述腺苷脱氨酶蛋白或其催化结构域经过修饰具有催化胞苷脱氨基的活性,和
2)将所述经修饰的腺苷脱氨酶蛋白或其催化结构域募集到靶标RNA的arRNA或包含该arRNA或包含其编码序列的构建体;
其中所述arRNA包含与所述靶标RNA杂交的互补RNA序列,并且所述arRNA募集所述腺苷脱氨酶蛋白或其催化结构域至靶标RNA致使靶标RNA中的靶标胞苷脱氨基。
在一些实施方案中,本申请的经修饰的腺苷脱氨酶蛋白是腺苷脱氨酶蛋白(例如ADAR2蛋白)经过缺失、添加或取代一个或多个氨基酸而具有胞苷脱氨基的活性的蛋白质。在一些实施方案中,本申请的经修饰的腺苷脱氨酶蛋白是腺苷脱氨酶蛋白(例如ADAR2蛋白)或其催化结构域是经过取代一个或多个氨基酸而具有胞苷脱氨基的活性的蛋白质。在一些实施方案中,本申请经修饰的腺苷脱氨酶蛋白包含如下突变修饰:E488Q/V351G/S486A/T375S/S370C/P462A/N597I/L332I/I398V/K350I/M383L/D619G/S582T/V440I/S495N/K418E/S661T,其中所述突变修饰的氨基酸编号与NP_001103.1中的氨基酸编号一致。在一些实施方案中,本申请经修饰的腺苷脱氨酶蛋白包含以其它ADAR2同源蛋白作为参考序列并具有E488Q/V351G/S486A/T375S/S370C/P462A/N597I/L332I/I398V/K350I/M383L/D619G/S582T/V440I/S495N/K418E/S661T相应突变的蛋白。
在一些实施方案中,本申请用于RNA编辑的工程化组合物或***包含上述经修饰的腺苷脱氨酶蛋白或其催化结构域。在一些实施方案中,所述催化结构域为上述经修饰的腺苷脱氨酶蛋白的催化结构域。
在一些实施方案中,所述腺苷脱氨酶在一个或多个位点发生突变修饰从而具有对胞苷脱氨使其转化成尿苷的活性。在一些实施方案中,所述腺苷脱氨酶蛋白或其催化结构域为ADAR2蛋白或其同源蛋白或所述ADAR2蛋白的催化结构域或所述ADAR2蛋白同源蛋白的催化结构域。在一些实施方案中,所述突变修饰包含:E488Q/V351G/S486A/T375S/S370C/P462A/N597I/L332I/I398V/K350I/M383L/D619G/S582T/V440I/S495N/K418E/S661T,其中所述突变修饰的氨基酸编号与NP_001103.1中的氨基酸编号一致。
在一些实施方案中,所述经修饰的腺苷脱氨酶蛋白或其催化结构域通过构建体导入细胞进行表达,所述构建体选自线性核酸、质粒及病毒载体中的任意。在一些实施方案中,所述细胞为真核细胞。在一些实施方案中,所述细胞为哺乳动物细胞。在一些实施方案中,所述细胞为人细胞。
在一些实施方案中,所述arRNA与靶标RNA杂交时,其与靶标胞苷相对的靶向碱基为A、U、C、或G。在一些实施方案中,优选的靶向碱基顺序为U>C>A≈G,即,当多条arRNA序列相比,其中除靶向碱基以外其他的所有碱基均相同时,靶向碱基为U或C的arRNA通常具有更高的编辑效率。因此优选地,在一些实施方案中,所述靶向碱基为U或C。
在一些实施方案中,所述arRNA在对应于靶标RNA的靶标碱基的上游、下游、或上游和下游的一个或多个位置包含非配对核苷酸,以形成和靶标碱基上游、下游、或上游和下游的一个或多个位置的核苷酸错配。在一些实施方案中,所述arRNA靶向碱基的3’最近邻碱基与靶标RNA形成错配。在一些实施方案中,所述arRNA与靶标RNA杂交时,所述靶向碱基的3’最近邻碱基与靶标RNA形成G-G错配。在一些实施方案中,所述arRNA与靶标RNA杂交时,所述靶向碱基的5’最近邻碱基与靶标RNA不形成错配。在一些实施方案中,所述靶向碱基的5’最近邻碱基与靶标RNA不形成错配,且其中所述靶向碱基的5’最近邻碱基为U。在一些实施方案中,当所述arRNA与靶标RNA杂交时,与所述arRNA的靶向碱基的5’最近邻碱基相对的靶标RNA中的碱基优选次序从高到低为G或C、U或A。在一些实施方案中,当所述arRNA与靶标RNA互补杂交时,所述arRNA靶向三联体以外的一个或多个碱基与靶标RNA形成错配。并且在一些实施方案中,所述错配可以进一步提高基于所述arRNA的靶向编辑效率。
在一些实施方案中,当所述arRNA与靶标RNA杂交时,所述靶标碱基及其5’和3’相邻碱基形成的靶标碱基三联体仅在靶标碱基处形成错配,并且,所述arRNA中靶向碱基距离3’端及5’端的长度相等,此时,优选地其中所述靶标碱基三联体选自:ACG、ACC、UCC、UCG、CCC、CCG、UCA、UCU。在一些实施方案中,当所述arRNA与靶标RNA杂交时,所述靶标碱基及其5’和3’相邻碱基形成的靶标碱基三联体仅在靶标碱基处形成错配,并且,所述arRNA中靶向碱基距离3’端及5’端的长度不相等,此时,其中所述靶标碱基三联体选自:ACG、ACC、UCC、UCG、CCC、CCG、UCA、UCU。
在一些实施方案中,所述arRNA长度>50nt、>55nt、>60nt、>65nt、>70nt、>75nt、>80nt、>85nt、>90nt、>95nt、>100nt、>105nt、>110nt、>115nt、>120nt。在一些实施方案中,所述arRNA长约151-53nt、131-61nt、121-61nt、111-65、101-71nt、91-71nt、81-71nt。在一些具体实施方案中,所述arRNA的长度是该项定义的长度范围内的任一正整数。
在一些实施方案中,所述arRNA中靶向碱基距离3’端及5’端的长度相等。在一些实施方案中,所述arRNA中靶向碱基距离3’端及5’端的长度不相等。在一些实施方案中,所述arRNA中靶向碱基距离3’端的长度为45-5nt,40-5nt,35-10nt,25nt-15nt,24nt-11nt。在一些具体实施方案中,所述长度选自本项定义的长度范围内的任一正整数。
在一些实施方案中,所述arRNA中靶向碱基距离5’端的长度为80-30nt,70-35nt,60-40nt,55nt-35nt,55nt-45nt。在一些具体实施方案中,所述长度选自本项定义的长度范围内的任一正整数。在一些实施方案中,所述arRNA中靶向碱基距离5’端的长度大于80。
在一些实施方案中,所述arRNA由化学合成。在一些实施方案中,所述arRNA为寡核苷酸。在一些实施方案中,所述arRNA是化学修饰的。在一些实施方案中,所述化学修饰包括2’-O-甲基修饰或核苷酸间3’硫代修饰。在一些实施方案中,所述化学修饰选自如下的一项或多项:
序列前3个和后3个核苷酸分别被2`-OMe修饰,
前3个和后3个核苷酸间连接均为硫代磷酸酯键连接,
序列中全部U均被2`-OMe修饰,
靶向碱基的3’最近邻碱基为2`-OMe修饰的A,
靶向碱基的5’最近邻碱基为2`-OMe修饰的C,
靶向碱基与其3’最近邻碱基和5’最近邻碱基分别以硫代磷酸酯键连接,
前5个和后5个核苷酸分别被2`-OMe修饰,和
前5个和后5个核苷酸间连接为硫代磷酸酯键连接。
在一些实施方案中,所述arRNA由一种构建体编码并转录生成。在一些实施方案中,所述构建体选自线性核酸链、病毒载体或质粒。
编辑RNA的方法
本申请提供了一种使细胞中靶标RNA中的靶标胞嘧啶脱氨基的方法——CUSPER(程序化的C到U的RNA编辑),包括将如下1)和2)导入所述细胞:
1)经修饰的腺苷脱氨酶蛋白或其催化结构域或表达该经修饰的腺苷脱氨酶蛋白或其催化结构域的构建体,和
2)将所述经修饰的腺苷脱氨酶蛋白或其催化结构域募集到所述靶标RNA的arRNA或包含该arRNA或包含其编码序列的构建体。其中,所述腺苷脱氨酶蛋白或其催化结构域经过修饰具有催化胞苷脱氨基的活性,所述arRNA包含与所述靶标RNA杂交的互补RNA序列,并且所述arRNA募集所述腺苷脱氨酶蛋白或其催化结构域至靶标RNA致使靶标RNA中的靶标胞苷脱氨基。
在一些实施方案中,所述细胞为真核细胞。在一些实施方案中,所述细胞为哺乳动物细胞。在一些实施方案中,所述细胞为人细胞。在一些实施方案中,所述细胞为小鼠细胞。
在一些实施方案中,本申请的经修饰的腺苷脱氨酶蛋白是腺苷脱氨酶蛋白(例如ADAR2蛋白)经过缺失、添加或取代一个或多个氨基酸而具有胞苷脱氨基的活性的蛋白质。在一些实施方案中,本申请的经修饰的腺苷脱氨酶蛋白是腺苷脱氨酶蛋白(例如ADAR2蛋白)或其催化结构域是经过取代一个或多个氨基酸而具有胞苷脱氨基的活性的蛋白质。在一些实施方案中,本申请经修饰的腺苷脱氨酶蛋白包含如下突变修饰:E488Q/V351G/S486A/T375S/S370C/P462A/N597I/L332I/I398V/K350I/M383L/D619G/S582T/V440I/S495N/K418E/S661T,其中所述突变修饰的氨基酸编号与NP_001103.1中的氨基酸编号一致。在一些实施方案中,本申请经修饰的腺苷脱氨酶蛋白包含以其它ADAR2蛋白作为参考序列并具有E488Q/V351G/S486A/T375S/S370C/P462A/N597I/L332I/I398V/K350I/M383L/D619G/S582T/V440I/S495N/K418E/S661T相应突变的蛋白。
本领域技术人员应当知晓,所述表达经修饰的腺苷脱氨酶蛋白或其催化结构域的构建体包含所述经修饰的腺苷脱氨酶蛋白或其催化结构域的编码序列。在一些实施方案中,所述表达经修饰的腺苷脱氨酶蛋白或其催化结构域的构建体与包含所述arRNA的编码序列的构建体为同一构建体。在一些实施方案中,所述表达经修饰的腺苷脱氨酶蛋白或其催化结构域的编码序列的构建体与包含所述arRNA的编码序列的构建体为不同构建体,即所述经修饰的腺苷脱氨酶蛋白或其催化结构域的编码序列与所述arRNA的编码序列分别位于不同构建体上。在一些实施方案中,所述不同构建体为两个或多于两个。在一些实施方案中,所述不同的构建体同时或分开地导入所述细胞。应当理解,本段所说的不同构建体指的是非同一个构建体,并不代表所述不同构建体分别属于不同的构建体类别。在一些实施方案中,将所述表达该经修饰的腺苷脱氨酶蛋白或其催化结构域的构建体与所述将所述经修饰的腺苷脱氨酶蛋白或其催化结构域募集到所述靶标RNA的arRNA或包含该arRNA的构建体或包含该arRNA的编码序列的构建体导入同一细胞。在一些实施方案中,将经修饰的腺苷脱氨酶蛋白或其催化结构域或表达该经修饰的腺苷脱氨酶蛋白或其催化结构域的构建体,和多种arRNA或包含所述arRNA的构建体或包含所述arRNA的编码序列的构建体导入细胞,以实现对靶标RNA的高通量编辑,其中所述的多种arRNA为靶向不同靶标RNA的arRNA,或为靶向同一靶标RNA不同靶标碱基(例如C)位点的arRNA。
因此,本申请还涵盖一种高通量编辑细胞中靶标RNA中的靶标胞嘧啶的方法,包括将如下1)和2)导入所述细胞:
1)经修饰的腺苷脱氨酶蛋白或其催化结构域或表达该经修饰的腺苷脱氨酶蛋白或其催化结构域的构建体,和
将所述经修饰的腺苷脱氨酶蛋白或其催化结构域募集到所述靶标RNA的多种(例如2种以上、5种以上、5种以上、10种以上)arRNA或包含该arRNA或包含其编码序列的构建体,其中,所述腺苷脱氨酶蛋白或其催化结构域经过修饰具有催化胞苷脱氨基的活性,所述多种(例如2种以上、5种以上、5种以上、10种以上)arRNA包含分别与所述靶标RNA杂交的互补RNA序列,并且所述arRNA募集所述腺苷脱氨酶蛋白或其催化结构域至靶标RNA致使靶标RNA中的靶标胞苷脱氨基。
在一些实施方案中,所述表达经修饰的腺苷脱氨酶蛋白或其催化结构域的构建体和包含所述arRNA的编码序列的构建体为同一构建体,或者所述表达经修饰的腺苷脱氨酶蛋白或其催化结构域的构建体和包含所述arRNA的编码序列的构建体为分开的构建体,所述分开的构建体被同时或分开地导入所述细胞。
在一些实施方案中,所述腺苷脱氨酶在一个或多个位点发生突变修饰从而具有对胞苷脱氨使其转化成尿苷的活性。
在一些实施方案中,所述腺苷脱氨酶蛋白或其催化结构域为ADAR2蛋白或其同源蛋白或其催化结构域。
在一些实施方案中,所述突变修饰包含:E488Q/V351G/S486A/T375S/S370C/P462A/N597I/L332I/I398V/K350I/M383L/D619G/S582T/V440I/S495N/K418E/S661T,其中所述突变修饰的氨基酸编号与NP_001103.1中的氨基酸编号一致。在一些实施方案中,所述构建体选自病毒载体、质粒和线性核酸。在一些实施方案中,所述经修饰的腺苷脱氨酶蛋白或其催化结构域或表达该经修饰的腺苷脱氨酶蛋白或其催化结构域的构建体以及包含将所述经修饰的腺苷脱氨酶蛋白或其催化结构域募集到所述靶标RNA的arRNA的寡核苷酸或转录该arRNA的构建体通过病毒侵染、化学转染、电转染、外泌体递送、或纳米脂质颗粒递送等方式被导入所述细胞。
在一些实施方案中,所述腺苷脱氨酶在一个或多个位点发生突变修饰从而具有对胞苷脱氨使其转化成尿苷的活性。在一些实施方案中,所述腺苷脱氨酶蛋白或其催化结构域为ADAR2蛋白或其同源蛋白或其催化结构域。在一些实施方案中,所述突变修饰包含:E488Q/V351G/S486A/T375S/S370C/P462A/N597I/L332I/I398V/K350I/M383L/D619G/S582T/V440I/S495N/K418E/S661T,其中所述突变修饰的氨基酸编号与NP_001103.1中的氨基酸编号一致。
在一些实施方案中,所述arRNA与靶标RNA杂交时,其与靶标胞苷相对的靶向碱基为A、U、C、或G。在一些实施方案中,所述arRNA与靶标RNA杂交时,其与靶标胞苷相对的靶向碱基优选为U或C。
在一些实施方案中,所述arRNA在对应于靶标RNA的靶标碱基的上游、下游、或上游和下游的一个或多个位置包含非配对核苷酸,以形成和靶标碱基上游、下游、或上游和下游的一个或多个位置的核苷酸错配。在一些实施方案中,所述arRNA靶向碱基的3’最近邻碱基与靶标RNA形成错配。在一些实施方案中,所述arRNA与靶标RNA杂交时,所述靶向碱基的3’最近邻碱基与靶标RNA形成G-G错配。在一些实施方案中,所述arRNA与靶标RNA杂交时,所述靶向碱基的5’最近邻碱基与靶标RNA不形成错配。在一些实施方案中,所述靶向碱基的5’最近邻碱基为U。在一些实施方案中,当所述arRNA与靶标RNA杂交时,与所述arRNA的靶向碱基的5’最近邻碱基相对的靶标RNA中的碱基优选次序从高到低为G或C、U或A(G≈C>U≈A)。在一些实施方案中,当所述arRNA与靶标RNA杂交时,与所述arRNA的靶向碱基的5’最近邻碱基相对的靶标RNA中的碱基优选为G或C。在一些实施方案中,当所述arRNA与靶标RNA杂交时,与所述arRNA的靶向碱基的5’最近邻碱基相对的靶标RNA中的碱基最优选为G。在一些实施方案中,当所述arRNA与靶标RNA互补杂交时,所述arRNA靶向三联体以外的一个或多个碱基与靶标RNA形成错配。并且在一些实施方案中,所述错配可以进一步提高基于所述arRNA的靶向编辑效率。
在一些实施方案中,当所述arRNA与靶标RNA杂交时,所述靶标碱基及其5’和3’相邻碱基形成的靶标碱基三联体仅在靶标碱基处形成错配,并且,所述arRNA中靶向碱基距离3’端及5’端的长度相等,此时,优选地其中所述靶标碱基三联体选自:ACG、ACC、UCC、UCG、CCC、CCG、UCA、UCU。在一些实施方案中,当所述arRNA与靶标RNA杂交时,所述靶标碱基及其5’和3’相邻碱基形成的靶标碱基三联体仅在靶标碱基处形成错配,并且,所述arRNA中靶向碱基距离3’端及5’端的长度不相等,此时,其中所述靶标碱基三联体选自:ACG、ACC、UCC、UCG、CCC、CCG、UCA、UCU。
在一些实施方案中,所述arRNA长度>50nt、>55nt、>60nt、>65nt、>70nt、>75nt、>80nt、>85nt、>90nt、>95nt、>100nt、>105nt、>110nt、>115nt、>120nt。在一些实施方案中,所述arRNA长约151-53nt、131-61nt、121-61nt、111-65、101-71nt、91-71nt、81-71nt。在一些具体实施方案中,所述arRNA的长度是该项定义的长度范围内的任一正整数。
在一些实施方案中,所述arRNA中靶向碱基距离3’端及5’端的长度相等。在一些实施方案中,所述arRNA中靶向碱基距离3’端及5’端的长度不相等。在一些实施方案中,所述arRNA中靶向碱基距离3’端的长度为45-5nt,40-5nt,35-10nt,25nt-15nt,24nt-11nt。在一些具体实施方案中,所述长度为本项定义的长度范围内的任一正整数。
在一些实施方案中,所述arRNA中靶向碱基距离5’端的长度为80-30nt,70-35nt,60-40nt,55nt-35nt,55nt-45nt。在一些具体实施方案中,所述长度为本项定义的长度范围内的任一正整数。在一些实施方案中,所述arRNA中靶向碱基距离5’端的长度大于80。
在一些实施方案中,所述arRNA为寡核苷酸或包含于寡核苷酸。在一些实施方案中,所述寡核苷酸是化学修饰的。在一些实施方案中,所述化学修饰包括2’-O-甲基修饰或核苷酸间3’硫代修饰。在一些实施方案中,所述化学修饰选自如下的一项或多项:
序列前3个和后3个核苷酸分别被2`-OMe修饰,
前3个和后3个核苷酸间连接均为硫代磷酸酯键连接,
序列中全部U均被2`-OMe修饰,
靶向碱基的3’最近邻碱基为2`-OMe修饰的A,
靶向碱基的5’最近邻碱基为2`-OMe修饰的C,
靶向碱基与其3’最近邻碱基和5’最近邻碱基分别以硫代磷酸酯键连接,
前5个和后5个核苷酸分别被2`-OMe修饰,和
前5个和后5个核苷酸间连接为硫代磷酸酯键连接。
在一些实施方案中,所述arRNA由一种构建体编码并转录生成。在一些实施方案中,所述构建体选自线性核酸链、病毒载体或质粒。
RNA编辑相关酶蛋白及其用途
本申请提供了一种经修饰的腺苷脱氨酶蛋白,其中所述腺苷脱氨酶蛋白为ADAR2,其包含对应于Genebank登记号为NP_001103.1的ADAR2中如下氨基酸突变:E488Q/V351G/S486A/T375S/S370C/P462A/N597I/L332I/I398V/K350I/M383L/D619G/S582T/V440I/S495N/K418E/S661T,或所述NP_001103.1的同源ADAR2蛋白相应位置的氨基酸突变,所述ADAR2蛋白经过所述突变修饰而具有催化胞苷脱氨基的活性。
本申请同时还提供了所述经修饰的腺苷脱氨酶蛋白用于催化胞苷脱氨基转化为尿苷的用途。在一些实施方案中,所述催化胞苷脱氨基转化为尿苷的用途发生于细胞内。在一些实施方案中,所述催化胞苷脱氨基转化为尿苷的用途发生于细胞外。
疾病治疗方法
本申请提供了一种治疗由T到C突变引起的疾病的方法,包括使用如前所述的编辑RNA的方法使包含所述T到C突变转录形成的信使RNA中靶标碱基C脱氨基,以校正所述突变。
在一些实施方案中,所述治疗由T到C突变引起的疾病的方法包括将如前所述的工程化组合物或***注射入受试者体内。在一些实施方案中,所述治疗将包括将如下1)和2)注射入受试者体内。
1)经修饰的腺苷脱氨酶蛋白或其催化结构域或表达该经修饰的腺苷脱氨酶蛋白或其催化结构域的构建体,和
2)将所述经修饰的腺苷脱氨酶蛋白或其催化结构域募集到所述靶标RNA的arRNA或包含该arRNA或包含其编码序列的构建体。其中,所述腺苷脱氨酶蛋白为如前所述的RNA编辑相关酶蛋白。
在一些实施方案中,所述注射为静脉注射、动脉灌注、肌肉注射、皮下注射或瘤内注射。
在一些实施方案中,所述由T到C突变引起的疾病包括遗传性疾病和癌症。
试剂盒及制剂
本申请还提供了一种试剂盒,其用于催化胞苷脱氨基转化为尿苷。在一些实施方案中,所述试剂盒包含如前所述的工程化组合物或***。在一些实施方案中,所述试剂盒包含编码或表达所述工程化组合物***中所述经修饰的腺苷脱氨酶蛋白或其催化结构域和/或将所述经修饰的腺苷脱氨酶蛋白或其催化结构域募集到靶标RNA的arRNA的构建体。
本申请提供的利用CUSPER技术对RNA进行靶向编辑的方法,具有以下优点:
一方面,新的技术招募编辑蛋白(例如腺苷脱氨酶(ADAR))时,不像RESCUE技术,需要设计含Cas13b招募骨架的向导RNA,也不需要细菌来源的Cas13b过表达,减小了外源表达蛋白的长度使得通过病毒载体进行装载及人体内递送容易、多样,同时,也可以减小外源表达的核酸酶被中和导致的基因编辑失败的可能性,这使得其在应用至医疗领域时比RESCUE技术具有显著优势。
另一方面,新的体系不像LEAPER技术,LEAPER技术仅能实现RNA编辑的应用范围从A到I的编辑,而新的体系将该编辑拓宽至C到U,这使得很多在基因组上呈现T到C突变的遗传病,以及其它需要将C转变为T/U的应用,可以用本申请的技术治疗。
因此,本申请的技术相比于现有技术而言,应用范围更广,更加安全有效。
以上详细描述了本发明的优选实施方式,但是,本发明并不限于此。在本发明的技术构思范围内,可以对本发明的技术方案进行多种简单变型,包括各个技术特征以任何其它的合适方式进行组合,这些简单变型和组合同样应当视为本发明所公开的内容,均属于本发明的保护范围。
下面结合具体实施例,对本发明的技术方案作进一步的详述,但本发明并不限于以下实施例。如未特别指出,以下所涉及的试剂均可通过商业途径购得。为简便起见,部分操作未详述操作的参数、步骤及所使用的仪器,应当理解,这些都是本领域技术人员所熟知并可重复再现的。
实施例
实施例1:经修饰的ADAR2及BFP报告体系的分子构建
1.突变型ADAR2-r16-293T的构建
参照参考文献1中报道的RESCUE技术对ADAR2(RNA腺苷脱氨酶2)催化结构域进行诱变,突变位点与文献中r16相同(dADAR2(E488Q/V351G/S486A/T375S/S370C/P462A/N597I/L332I/I398V/K350I/M383L/D619G/S582T/V440I/S495N/K418E/S661T)r16,https://benchling.com/s/seq-19Ytwwh0i0vSIbyXYZ95),其中所述突变修饰的氨基酸编号与NP_001103.1中的氨基酸编号一致。使用本领域常规DNA合成技术体外合成包含上述突变的ADAR2编码序列片段,并通过酶切连接***pLenti-ADAR2质粒载体(pLenti-ADAR2质粒骨架由魏文胜教授试验室惠赠)的ADAR2 XmaI酶切位点及AscI酶切位点之间。通过以上步骤构建的质粒命名为pLenti-ADAR2-r16,其包含上述突变的ADAR2基因命名为ADAR2-r16。ADAR2-r16全长cDNA序列为:SEQ ID NO 1。通过第二代慢病毒包装体系(pCAG-VSVG由Arthur Nienhuis&Patrick Salmon惠赠(Addgene plasmid#35616;http://n2t.net/addgene:35616;RRID:Addgene_35616);pCMVR8.74由Didier Trono惠赠(Addgeneplasmid#22036;http://n2t.net/addgene:22036;RRID:Addgene_22036))将pLenti-ADAR2-r16包装成慢病毒,并使用所述慢病毒侵染293T细胞并于48小时后使用10ug/ml终浓度的Blasticidin(Solarbio B9300)进行抗性筛选。筛选过后存活的细胞称为ADAR2-r16-293T。
SEQ ID NO 1:
ATGGATATAGAAGATGAAGAAAACATGAGTTCCAGCAGCACTGATGTGAAGGAAAACCGCAATCTGGACAACGTGTCCCCCAAGGATGGCAGCACACCTGGGCCTGGCGAGGGCTCTCAGCTCTCCAATGGGGGTGGTGGTGGCCCCGGCAGAAAGCGGCCCCTGGAGGAGGGCAGCAATGGCCACTCCAAGTACCGCCTGAAGAAAAGGAGGAAAACACCAGGGCCCGTCCTCCCCAAGAACGCCCTGATGCAGCTGAATGAGATCAAGCCTGGTTTGCAGTACACACTCCTGTCCCAGACTGGGCCCGTGCACGCGCCTTTGTTTGTCATGTCTGTGGAGGTGAATGGCCAGGTTTTTGAGGGCTCTGGTCCCACAAAGAAAAAGGCAAAACTCCATGCTGCTGAGAAGGCCTTGAGGTCTTTCGTTCAGTTTCCTAATGCCTCTGAGGCCCACCTGGCCATGGGGAGGACCCTGTCTGTCAACACGGACTTCACATCTGACCAGGCCGACTTCCCTGACACGCTCTTCAATGGTTTTGAAACTCCTGACAAGGCGGAGCCTCCCTTTTACGTGGGCTCCAATGGGGATGACTCCTTCAGTTCCAGCGGGGACCTCAGCTTGTCTGCTTCCCCGGTGCCTGCCAGCCTAGCCCAGCCTCCTCTCCCTGCCTTACCACCATTCCCACCCCCGAGTGGGAAGAATCCCGTGATGATCTTGAACGAACTGCGCCCAGGACTCAAGTATGACTTCCTCTCCGAGAGCGGGGAGAGCCATGCCAAGAGCTTCGTCATGTCTGTGGTCGTGGATGGTCAGTTCTTTGAAGGCTCGGGGAGAAACAAGAAGCTTGCCAAGGCCCGGGCTGCGCAGTCTGCCCTGGCCGCCATTTTTAACTTGCACTTGGATCAGACGCCATCTCGCCAGCCTATTCCCAGTGAGGGTCTTCAGCTGCATTTACCGCAGGTTTTAGCTGACGCTGTCTCACGCCTGGTCATAGGTAAGTTTGGTGACCTGACCGACAACTTCTCCTCCCCTCACGCTCGCAGAATAGGTCTGGCTGGAGTCGTCATGACAACAGGCACAGATGTTAAAGATGCCAAGGTGATATGTGTTTCTACAGGATCTAAATGTATTAATGGTGAATACCTAAGTGATCGTGGCCTTGCATTAAATGACTGCCATGCAGAAATAGTATCTCGGAGATCCTTGCTCAGATTTCTTTATACACAACTTGAGCTTTACTTAAATAACGAGGATGATCAAAAAAGATCCATCTTTCAGAAATCAGAGCGAGGGGGGTTTAGGCTGAAGGAGAATATACAGTTTCATCTGTACATCAGCACCTCTCCCTGTGGAGATGCCAGAATCTTCTCACCACATGAGGCAATCCTGGAAGAACCAGCAGATAGACACCCAAATCGTAAAGCAAGAGGACAGCTACGGACCAAAATAGAGGCTGGTCAGGGGACGATTCCAGTGCGCAACAATGCGAGCATCCAAACGTGGGACGGGGTGCTGCAAGGGGAGCGGCTGCTCACCATGTCCTGCAGTGACAAGATTGCACGCTGGAACGTGGTGGGCATCCAGGGATCACTGCTCAGCATTTTCGTGGAGCCCATTTACTTCTCGAGCATCATCCTGGGCAGCCTTTACCACGGGGACCACCTTTCCAGGGCCATGTACCAGCGGATCTCCAACATAGAGGACCTGCCACCTCTCTACACCCTCAACAAGCCTTTGCTCACAGGCATCAGCAATGCAGAAGCACGGCAGCCAGGGAAGGCCCCCATATTCAGTGTCAACTGGACGGTAGGCGACTCCGCTATTGAGGTCATCAACGCCACGACTGGGAAGGGAGAGCTGGGCCGCGCGTCCCGCCTGTGTAAGCACGCGTTGTACTGTCGCTGGATGCGTGTGCACGGCAAGGTTCCCTCCCACTTACTACGCTCCAAGATTACCAAGCCCAACGTGTACCATGAGACAAAGCTGGCGGCAAAGGAGTACCAGGCCGCCAAGGCGCGTCTGTTCACAGCCTTCATCAAGGCGGGGCTGGGGGCCTGGGTGGAGAAGCCCACCGAGCAGGACCAGTTCTCACTCACGCCCGATTACAAGGATGACGACGATAAGTAG
2.BFP报告体系的构建
BFP报告体系参照参考文献7构建,全部BFP(蓝色荧光蛋白)cDNA序列在体外合成,具体序列为:SEQ ID NO 2。BFP cDNA序列通过CMV启动子后的多克隆位点克隆至pCDH-CMV质粒载体(pCDH-CMV质粒骨架由Kazuhiro Oka惠赠,Addgene plasmid#72265;http://n2t.net/addgene:72265;RRID:Addgene_72265)。报告体系中待编辑的靶标碱基为BFP序列第199位的碱基C,对应第66位组氨酸,参见图1。
SEQ ID NO 2:
ATGGTGAGCAAGGGCGAGGAGCTGTTCACCGGGGTGGTGCCCATCCTGGTCGAGCTGGACGGCGACGTAAACGGCCACAAGTTCAGCGTGTCTGGCGAGGGCGAGGGCGATGCCACCTACGGCAAGCTGACCCTGAAGTTCATCTGCACCACCGGCAAGCTGCCCGTGCCCTGGCCCACCCTCGTGACCACCCTGACCCACGGCGTGCAGTGCTTCAGCCGCTACCCCGACCACATGAAGCAGCACGACTTCTTCAAGTCCGCCATGCCCGAAGGCTACGTCCAGGAGCGCACCATCTTCTTCAAGGACGACGGCAACTACAAGACCCGCGCCGAGGTGAAGTTCGAGGGCGACACCCTGGTGAACCGCATCGAGCTGAAGGGCATCGACTTCAAGGAGGACGGCAACATCCTGGGGCACAAGCTGGAGTACAACTACAACAGCCACAACGTCTATATCATGGCCGACAAGCAGAAGAACGGCATCAAGGCGAACTTCAAGATCCGCCACAACATCGAGGACGGCAGCGTGCAGCTCGCCGACCACTACCAGCAGAACACCCCCATCGGCGACGGCCCCGTGCTGCTGCCCGACAACCACTACCTGAGCACCCAGTCCGCCCTGAGCAAAGACCCCAACGAGAAGCGCGATCACATGGTCCTGCTGGAGTTCGTGACCGCCGCCGGGATCACTCTCGGCATGGACGAGCTGTACAAGTGA
该序列第198,199,200位的碱基依次为CCA,命名为BFP-CCA,缩略为C*。当199位的碱基C在RNA水平通过脱氨基化被编辑为U之后,BFP荧光蛋白会从原先的蓝色荧光变为绿色荧光,从而可以通过流式细胞仪FITC(Fluorescein isothiocyanate,异硫氰酸荧光素)通道检测到信号。由于198位核苷酸从C突变为A、T、G后,对应密码子(196、197、198位碱基)ACC、ACA、ACT、ACG均编码苏氨酸,因此该位突变为同义突变。这使得该报告体系可以同时测定和比较在mRNA上靶标碱基的5’上游相邻碱基不同时,C到U的编辑效率。可据此使用定点诱变试剂盒(
Figure BDA0002880078150000251
Site-Directed Mutagenesis Kit,NEB E0554S)向198位置碱基中引入突变,从而198,199,200三个位置碱基分别为:GCA,命名为BFP-GCA,缩略为G*;ACA,命名为BFP-ACA,缩略为A*;TCA命名为BFP-UCA,缩略为U*。/>
实施例2:CUSPER体系的初步测试
1.arRNA的设计与合成
本实施例中使用的arRNA包含与靶标mRNA互补的反义RNA,靶标碱基位于arRNA的中间位置,5’上游以及3’下游按照相同长度向两边延伸。由于合成长度的限制,本实施例选取长度为91nt的RNA进行体外合成。如图3所示,当所述arRNA第46位核苷酸分别为A、U、G、C时,则分别缩写为A^、U^、G^、C^。四种合成的arRNA具体序列见下表1。如图2所示,与LEAPER技术设计方法不同的是,本批试验中四条arRNA的设计,由于试验目的是确定靶标碱基与arRNA上的靶向碱基错配时的编辑效率,因此使用了不同的靶向碱基进行了测试,即对第46位分别为A、U、G、C的arRNA进行了测试。而在arRNA第47位的5’最近邻碱基(对应报告体系第198位)则按照引入突变前的BFP序列的靶标三联体碱基(即CCA)进行设计,即所述arRNA靶向碱基的5’最近邻碱基(第47位)为与A互补的U。这意味着,当且仅当后续测试的报告体系为BFP-CCA的时候,arRNA的设计方才与LEAPER技术一致,即:当arRNA与靶标RNA杂交时,仅在靶标碱基存在错配;而当报告体系为BFP-GCA,BFP-TCA,BFP-ACA的时候,arRNA的设计不仅在靶标碱基存在错配,而且在arRNA靶标碱基的3’相邻碱基处也存在错配。
表1
Figure BDA0002880078150000261
注:大写字母只为突出序列间差异,同一字母的大小写不同不代表碱基的差异。
2.C到U编辑测试
ADAR2-r16-293T以300000个细胞/孔的密度铺板至6孔板,铺板后24小时,用Lipofectamine 3000转染(Invitrogen L3000015),转染步骤按照说明书进行。按照说明书采用不同浓度的Lipofectamine 3000转染试剂进行两次重复试验,重复1每孔使用3.75μL的Lipofectamine 3000,重复每孔2使用7.5μL的Lipofectamine 3000。每孔添加2.5μg BFP报告质粒(选自:BFP-GCA,缩略为G*;BFP-ACA,缩略为A*;BFP-TCA,缩略为T*;BFP-CCA,缩略为C*)以及25pmol化学合成的arRNA。转染后48h通过FACS检测FITC通道信号强度。阳性细胞平均荧光强度(Mean Fluorescent Intensity,MFI)统计结果如图3所示。
图3中mRNA行表示对应孔中添加的BFP报告体系质粒,arRNA行表示对应孔中添加的arRNA。BFP报告体系中,198,199,200三个碱基在原始序列中为CCA,而当198位C变为A、T或G的时候,对应的65位氨基酸均为苏氨酸,所以BFP-GCA、BFP-CCA、BFP-ACA、BFP-TCA四种不同报告体系198位的改变不会造成原本蛋白功能的改变。而当199位C被编辑变为U时,199、200、201形成的密码子从CAC变为UAC,对应的66位氨基酸从组氨酸(Histidine,His,H)变为酪氨酸(Tyrosine,Tyr,Y),从而实现BFP到GFP的荧光转变。如图3所示,当不加入任何arRNA时,报告体系本底GFP信号MFI约为5×104(mRNA行标注为U*,arRNA行标注为/的报告体系;以及,mRNA行标注为A*,arRNA标注为/的报告体系)。而当通过DNA水平的点突变,使199位C突变为T时,GFP信号MFI约为2.4×106~3.1×106,比本底值高约100倍。因此,如果199位的C在RNA水平全部变为U,则可导致GFP MFI的约100倍提升。
在DNA水平199位C不变的基础上,如图3所示,而当加入arRNA后,GFP的MFI最多能提升至超过5×105,荧光强度超过了DNA水平的199位C点突变成T后荧光强度的20%。这说明,本申请的技术可以在不改变DNA序列的前提下,通过在转录水平上将199位的C转变为U,从而改变最终的蛋白功能。
在LEAPER技术文献中(Qu et al.,2019,原图2f,对应于本申请图4),当靶标碱基3’相邻碱基(如N2位置所示)为A时,LEAPER技术对靶标碱基5’相邻碱基(如N1位置所示)的偏好(指在5’上游碱基为A、U、G或C时,相同arRNA所得到的编辑效率)是:U>C≈A>G。在RESCUE技术文献中(Abudayyeh et al.,2019,原图1c,对应于本申请图5)当靶标碱基3’相邻碱基为A时,RESCUE技术对靶标碱基5’相邻碱基的偏好是:U≈A>>C≈G。而在本申请的CUSPER技术中,我们意外地发现,该技术在当靶标碱基3’相邻碱基为A时,对靶标碱基5’上游碱基的偏好与LEAPER技术和RESCUE技术两者均不相同,如图3所示,如果固定arRNA为编辑效率较高的U^或者C^,可以看到,本申请的技术对5’上游碱基的偏好是:G>C>>U≈A。
3.对CUSPER碱基偏好性的进一步确定
为进一步确定CUSPER的编辑能力及其碱基偏好性,我们对实施例2第2部分做了进一步重复,如图6所示。相较于实施例2第2部分,本部分中补充了实施例2第2部分中未涉及的仅有BFP-GCA和BFP-CCA两个报告体系质粒而不添加任何arRNA情况下的对照试验。并且对图3相关测试中MFI超过本底值2倍以上的条件做了重复。同时,试验中重复1和重复2对应两株不同批次制作的ADAR2-r16-293T。
如图6所示,重复试验中该体系对靶标碱基5’相邻碱基的偏好呈现出与图3显示的实施例2第2部分的相关测试类似的模式,均为在5’相邻碱基为G或C时有较好编辑效率,且G大于C。
以上结果表明,本申请的技术可以在不改变DNA序列的前提下,从转录水平影响最终蛋白功能。同时,该技术对靶标碱基5’相邻碱基的偏好可能与LERPER和RESCUE技术均不相同,具体参见表2。值得注意的是,本研究中对于BFP-GCA、BFP-TCA、BFP-ACA的测试中,arRNA的设计不仅在靶标碱基处存在一个错配,在arRNA的3’下游也存在另外一个错配(如图2所示)。因此,后续还需进一步测试当这些位置不存在错配时,该技术对5’上游碱基的偏好是否还存在类似的模式。
表2.三种RNA编辑技术靶标碱基相邻碱基偏好性对比
Figure BDA0002880078150000281
实施例3:3’及5’相邻碱基均无错配的情况下,对CUSPER编辑体系的测试
通过对GFP信号的读取,我们可以快速粗略地判断不同arRNA的编辑效率,但如果需要进一步确认编辑效率,则需通过二代测序(Next Generation Sequencing,NGS)来最终确认mRNA中有多少比例的C被编辑成U。同时,RNA单碱基编辑体系无论是A到I(Qu et al.,2019)还是C到U(Abudayyeh et al.,2019)其靶标碱基A或者C的5’相邻碱基和3’相邻碱基对其编辑效率影响较大。由于BFP到GFP报告体系的限制,如果以BFP的DNA序列(SEQ ID NO2)中第199位的C为靶标碱基,当5’相邻碱基(第198位)C变为A、T、G时均不影响对应的65位氨基酸;但当3’相邻碱基(第200位)的A变为T、C或G时,则会导致其完全失去GFP信号。因此,通过报告体系读取GFP的试验无法对3’相邻碱基为T、C、G的体系进行测试。而如果通过二代测序则可直接读取编辑后其mRNA中U占A、U、C、G的百分比,从而较为方便地比较4种不同5’相邻碱基和4种不同3’相邻碱基共16种情况下,其编辑效率的高低。
参照实施例1.2的步骤,根据BFP的DNA序列(SEQ ID NO 2)中第198、199、200位的DNA序列不同,我们构建了16个不同的报告体系,即ACA、ACT(对应mRNA:ACU)、ACC、ACG、TCA(对应mRNA:UCA)、TCT(对应mRNA:UCU)、TCC(对应mRNA:UCC)、TCG(对应mRNA:UCG)、CCA、CCT(对应mRNA:CCU)、CCC、CCG、GCA、GCT(对应mRNA:GCU)、GCC、GCG。并且参照实施例1.1的慢病毒包装、侵染步骤,侵染293T,使其稳定整合入293T细胞中。
与以上16个不同的报告体系相对应,在mRNA靶标碱基C对应arRNA靶向碱基为U的基础上,使arRNA靶向碱基的3’及5’最近邻碱基可与靶标RNA中靶标碱基的5’及3’相邻碱基以沃森克里克碱基配对原则互补配对。所合成arRNA序列见表3,其中mRNA中靶标以及其5’和3’相邻碱基与arRNA靶向碱基以及其5’和3’最近邻碱基的对应关系表见图7。
按照以下步骤,向16个不同的报告体系细胞中,转染入对应的arRNA,并进行RNA提取和二代测序。
1.细胞培养采用含有10%FBS(Vistech SE100-011)的DMEM(HycloneSH30243.01)。报告体系细胞以15000个细胞/孔,传至12孔板。此时记为0小时。
2.细胞传代后24小时,用RNAi MAX(Invitrogen,13778150)试剂将12.5pmol的arRNA转入每个孔。转染步骤参照供应商说明书。
3.细胞传代后72小时,用胰酶(Invitrogen 25300054)消化整孔细胞,用800μLTRIzol(Invitrogen,15596018)收样,采用Direct-zol RNA Miniprep试剂盒(ZymoResaerch,R2052)进行RNA提取,每个样品取1000ng提取好的总RNA用
Figure BDA0002880078150000291
One-Step gDNA Removal and cDNA Synthesis SuperMix试剂盒(全式金,AT311)进行反转录合成cDNA,取1μL反转录产物,用序列为ggagtgagtacggtgtgcCTACGGCAAGCTGACCCTGAAGTT(SEQID NO:7)和gagttggatgctggatggGTAGTTGCCGTCGTCCTTGAAGAAG(SEQ ID NO:8)的两个引物以及Q5热启动酶(NEB,M0494L)进行PCR。PCR产物用Hi-TOM试剂盒(诺禾致源,REF PT045)进行建库并按照以下步骤完成二代测序和数据分析。
i.Illumina测序
将构建好的测序文库,通过NovaSeq6000平台以PE150方式进行高通量测序。
ii.测序数据处理
高通量测序得到的原始数据以fastp(v0.19.6)进行质控,过滤掉低质量、带有接头序列、及含有polyG等的序列。将得到的高质量测序数据以自主开发的拆分脚本按照相应的Barcode序列拆分到每个样本,使用BWA(v0.7.17-r1188)软件与扩增的目标区域序列进行比对,通过SAMtools(v1.9)进行格式转换以生成BAM文件、统计比对信息并重新排序和建立索引。
iii.编辑效率分析
使用JACUSA(v1.3.0)软件检测所有的mRNA靶标碱基,所用参数为:call-1-a B,R,D,I,Y,M:4-C ACGT-c 2-p 1-P UNSTRANDED-R-u Dir Mult-CE。过滤掉同时在对照和处理样本中出现的高频突变之后,以C->U突变之外的平均突变频率的三倍作为阈值,将靶标碱基C到U的突变频率在阈值之上的部分作为真实的靶标C突变为U的频率。
二代测序结果如图8显示。通过二代测序可以证实,CUSPER体系确实可以实现mRNA的C到U单碱基编辑。相较于实施例2可以看出,如果靶向碱基的5’及3’最近邻碱基与靶标RNA均无错配,则编辑效率相对较低,而当靶向碱基的5’最近邻碱基与靶标RNA形成G-G错配时,便可以提高编辑效率。此外,当除靶标碱基的C-U错配以外,靶向碱基的5’及3’最近邻碱基均与靶标碱基的3’及5’相邻碱基以沃森-克里克原则配对时,当mRNA上靶标碱基三联体为下述序列时可以获得较高的编辑效率:ACG、ACC、UCC、UCG、CCC、CCG、UCA、UCU。
表3. 3’及5’相邻碱基均无错配的arRNA序列
Figure BDA0002880078150000301
/>
Figure BDA0002880078150000311
Figure BDA0002880078150000321
注:大小写字母无区别,大写字母只为突出序列间差异。其中arRNA,以其靶向的靶标碱基三联体命名。
参考文献
1.Abudayyeh,O.O.,Gootenberg,J.S.,Franklin,B.,Koob,J.,Kellner,M.J.,Ladha,A.,...&Zhang,F.(2019).A cytosine deaminase for programmable single-baseRNA editing.Science,365(6451),382-386.
2.Cox,D.B.,Gootenberg,J.S.,Abudayyeh,O.O.,Franklin,B.,Kellner,M.J.,Joung,J.,&Zhang,F.(2017).RNA editing with CRISPR-Cas13.Science,358(6366),1019-1027.
3.Eckstein,F.(2014).Phosphorothioates,essential components oftherapeutic oligonucle otides.Nucleic acid therapeutics,24(6),374-387.
4.Merkle,T.,Merz,S.,Reautschnig,P.,Blaha,A.,Li,Q.,Vogel,P.,...&Stafforst,T.(2019).Precise RNA editing by recruiting endogenous ADARs withantisense oligon ucleotides.Nature biotechnology,37(2),133.
5.Pollard,K.M.,Cauvi,D.M.,Toomey,C.B.,Morris,K.V.,&Kono,D.H.(2013).Interferon-γand systemic autoimmunity.Discovery medicine,16(87),123.
6.Qu,L.,Yi,Z.,Zhu,S.,Wang,C.,Cao,Z.,Zhou,Z.,...&Bao,Y.(2019).Programmable RNA editing by recruiting endogenous ADAR using engineered RNAs.Naturebiotechnology,37(9),1059-1069.
7.Vu,L.T.,Nguyen,T.T.K.,Md Thoufic,A.A.,Suzuki,H.,&Tsukahara,T.(2016).Chemical RNA editing for genetic restoration:the relationship betweenthe structure and deamination efficiency of carboxyvinyldeoxyuridineoligodeoxynucleotides.Chemical biology&drug design,87(4),583-593.
8.Xu,L.,Wang,J.,Liu,Y.,Xie,L.,Su,B.,Mou,D.,...&Zhao,L.(2019).CRISPR-edited stem cells in a patient with HIV and acute lymphocytic leukemia.NewEngland Journal of Medicine,381(13),1240-1247.
序列表
<110> 博雅辑因(北京)生物科技有限公司
<120> 一种靶向编辑RNA的新方法
<130> PD01322
<150> 201911411077.7
<151> 2019-12-31
<160> 25
<170> PatentIn version 3.5
<210> 1
<211> 2130
<212> DNA
<213> 人工序列
<220>
<223> ADAR2-r16 cDNA
<400> 1
atggatatag aagatgaaga aaacatgagt tccagcagca ctgatgtgaa ggaaaaccgc 60
aatctggaca acgtgtcccc caaggatggc agcacacctg ggcctggcga gggctctcag 120
ctctccaatg ggggtggtgg tggccccggc agaaagcggc ccctggagga gggcagcaat 180
ggccactcca agtaccgcct gaagaaaagg aggaaaacac cagggcccgt cctccccaag 240
aacgccctga tgcagctgaa tgagatcaag cctggtttgc agtacacact cctgtcccag 300
actgggcccg tgcacgcgcc tttgtttgtc atgtctgtgg aggtgaatgg ccaggttttt 360
gagggctctg gtcccacaaa gaaaaaggca aaactccatg ctgctgagaa ggccttgagg 420
tctttcgttc agtttcctaa tgcctctgag gcccacctgg ccatggggag gaccctgtct 480
gtcaacacgg acttcacatc tgaccaggcc gacttccctg acacgctctt caatggtttt 540
gaaactcctg acaaggcgga gcctcccttt tacgtgggct ccaatgggga tgactccttc 600
agttccagcg gggacctcag cttgtctgct tccccggtgc ctgccagcct agcccagcct 660
cctctccctg ccttaccacc attcccaccc ccgagtggga agaatcccgt gatgatcttg 720
aacgaactgc gcccaggact caagtatgac ttcctctccg agagcgggga gagccatgcc 780
aagagcttcg tcatgtctgt ggtcgtggat ggtcagttct ttgaaggctc ggggagaaac 840
aagaagcttg ccaaggcccg ggctgcgcag tctgccctgg ccgccatttt taacttgcac 900
ttggatcaga cgccatctcg ccagcctatt cccagtgagg gtcttcagct gcatttaccg 960
caggttttag ctgacgctgt ctcacgcctg gtcataggta agtttggtga cctgaccgac 1020
aacttctcct cccctcacgc tcgcagaata ggtctggctg gagtcgtcat gacaacaggc 1080
acagatgtta aagatgccaa ggtgatatgt gtttctacag gatctaaatg tattaatggt 1140
gaatacctaa gtgatcgtgg ccttgcatta aatgactgcc atgcagaaat agtatctcgg 1200
agatccttgc tcagatttct ttatacacaa cttgagcttt acttaaataa cgaggatgat 1260
caaaaaagat ccatctttca gaaatcagag cgaggggggt ttaggctgaa ggagaatata 1320
cagtttcatc tgtacatcag cacctctccc tgtggagatg ccagaatctt ctcaccacat 1380
gaggcaatcc tggaagaacc agcagataga cacccaaatc gtaaagcaag aggacagcta 1440
cggaccaaaa tagaggctgg tcaggggacg attccagtgc gcaacaatgc gagcatccaa 1500
acgtgggacg gggtgctgca aggggagcgg ctgctcacca tgtcctgcag tgacaagatt 1560
gcacgctgga acgtggtggg catccaggga tcactgctca gcattttcgt ggagcccatt 1620
tacttctcga gcatcatcct gggcagcctt taccacgggg accacctttc cagggccatg 1680
taccagcgga tctccaacat agaggacctg ccacctctct acaccctcaa caagcctttg 1740
ctcacaggca tcagcaatgc agaagcacgg cagccaggga aggcccccat attcagtgtc 1800
aactggacgg taggcgactc cgctattgag gtcatcaacg ccacgactgg gaagggagag 1860
ctgggccgcg cgtcccgcct gtgtaagcac gcgttgtact gtcgctggat gcgtgtgcac 1920
ggcaaggttc cctcccactt actacgctcc aagattacca agcccaacgt gtaccatgag 1980
acaaagctgg cggcaaagga gtaccaggcc gccaaggcgc gtctgttcac agccttcatc 2040
aaggcggggc tgggggcctg ggtggagaag cccaccgagc aggaccagtt ctcactcacg 2100
cccgattaca aggatgacga cgataagtag 2130
<210> 2
<211> 720
<212> DNA
<213> 人工序列
<220>
<223> BFP cDNA
<400> 2
atggtgagca agggcgagga gctgttcacc ggggtggtgc ccatcctggt cgagctggac 60
ggcgacgtaa acggccacaa gttcagcgtg tctggcgagg gcgagggcga tgccacctac 120
ggcaagctga ccctgaagtt catctgcacc accggcaagc tgcccgtgcc ctggcccacc 180
ctcgtgacca ccctgaccca cggcgtgcag tgcttcagcc gctaccccga ccacatgaag 240
cagcacgact tcttcaagtc cgccatgccc gaaggctacg tccaggagcg caccatcttc 300
ttcaaggacg acggcaacta caagacccgc gccgaggtga agttcgaggg cgacaccctg 360
gtgaaccgca tcgagctgaa gggcatcgac ttcaaggagg acggcaacat cctggggcac 420
aagctggagt acaactacaa cagccacaac gtctatatca tggccgacaa gcagaagaac 480
ggcatcaagg cgaacttcaa gatccgccac aacatcgagg acggcagcgt gcagctcgcc 540
gaccactacc agcagaacac ccccatcggc gacggccccg tgctgctgcc cgacaaccac 600
tacctgagca cccagtccgc cctgagcaaa gaccccaacg agaagcgcga tcacatggtc 660
ctgctggagt tcgtgaccgc cgccgggatc actctcggca tggacgagct gtacaagtga 720
<210> 3
<211> 91
<212> RNA
<213> 人工序列
<220>
<223> arRNA
<400> 3
gcugcuucau guggucgggg uagcggcuga agcacugcac gccguagguc agggugguca 60
cgaggguggg ccagggcacg ggcagcuugc c 91
<210> 4
<211> 91
<212> RNA
<213> 人工序列
<220>
<223> arRNA
<400> 4
gcugcuucau guggucgggg uagcggcuga agcacugcac gccguugguc agggugguca 60
cgaggguggg ccagggcacg ggcagcuugc c 91
<210> 5
<211> 91
<212> RNA
<213> 人工序列
<220>
<223> arRNA
<400> 5
gcugcuucau guggucgggg uagcggcuga agcacugcac gccgucgguc agggugguca 60
cgaggguggg ccagggcacg ggcagcuugc c 91
<210> 6
<211> 91
<212> RNA
<213> 人工序列
<220>
<223> arRNA
<400> 6
gcugcuucau guggucgggg uagcggcuga agcacugcac gccguggguc agggugguca 60
cgaggguggg ccagggcacg ggcagcuugc c 91
<210> 7
<211> 42
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 7
ggagtgagta cggtgtgcct acggcaagct gaccctgaag tt 42
<210> 8
<211> 43
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 8
gagttggatg ctggatgggt agttgccgtc gtccttgaag aag 43
<210> 9
<211> 91
<212> RNA
<213> 人工序列
<220>
<223> arRNA
<400> 9
gcugcuucau guggucgggg uagcggcuga agcacugcac gccguucguc agggugguca 60
cgaggguggg ccagggcacg ggcagcuugc c 91
<210> 10
<211> 91
<212> RNA
<213> 人工序列
<220>
<223> arRNA
<400> 10
gcugcuucau guggucgggg uagcggcuga agcacugcac gccgaucguc agggugguca 60
cgaggguggg ccagggcacg ggcagcuugc c 91
<210> 11
<211> 91
<212> RNA
<213> 人工序列
<220>
<223> arRNA
<400> 11
gcugcuucau guggucgggg uagcggcuga agcacugcac gccggucguc agggugguca 60
cgaggguggg ccagggcacg ggcagcuugc c 91
<210> 12
<211> 91
<212> RNA
<213> 人工序列
<220>
<223> arRNA
<400> 12
gcugcuucau guggucgggg uagcggcuga agcacugcac gccgcucguc agggugguca 60
cgaggguggg ccagggcacg ggcagcuugc c 91
<210> 13
<211> 91
<212> RNA
<213> 人工序列
<220>
<223> arRNA
<400> 13
gcugcuucau guggucgggg uagcggcuga agcacugcac gccguugguc agggugguca 60
cgaggguggg ccagggcacg ggcagcuugc c 91
<210> 14
<211> 91
<212> RNA
<213> 人工序列
<220>
<223> arRNA
<400> 14
gcugcuucau guggucgggg uagcggcuga agcacugcac gccgaugguc agggugguca 60
cgaggguggg ccagggcacg ggcagcuugc c 91
<210> 15
<211> 91
<212> RNA
<213> 人工序列
<220>
<223> arRNA
<400> 15
gcugcuucau guggucgggg uagcggcuga agcacugcac gccggugguc agggugguca 60
cgaggguggg ccagggcacg ggcagcuugc c 91
<210> 16
<211> 91
<212> RNA
<213> 人工序列
<220>
<223> arRNA
<400> 16
gcugcuucau guggucgggg uagcggcuga agcacugcac gccgcugguc agggugguca 60
cgaggguggg ccagggcacg ggcagcuugc c 91
<210> 17
<211> 91
<212> RNA
<213> 人工序列
<220>
<223> arRNA
<400> 17
gcugcuucau guggucgggg uagcggcuga agcacugcac gccguuaguc agggugguca 60
cgaggguggg ccagggcacg ggcagcuugc c 91
<210> 18
<211> 91
<212> RNA
<213> 人工序列
<220>
<223> arRNA
<400> 18
gcugcuucau guggucgggg uagcggcuga agcacugcac gccgauaguc agggugguca 60
cgaggguggg ccagggcacg ggcagcuugc c 91
<210> 19
<211> 91
<212> RNA
<213> 人工序列
<220>
<223> arRNA
<400> 19
gcugcuucau guggucgggg uagcggcuga agcacugcac gccgguaguc agggugguca 60
cgaggguggg ccagggcacg ggcagcuugc c 91
<210> 20
<211> 91
<212> RNA
<213> 人工序列
<220>
<223> arRNA
<400> 20
gcugcuucau guggucgggg uagcggcuga agcacugcac gccgcuaguc agggugguca 60
cgaggguggg ccagggcacg ggcagcuugc c 91
<210> 21
<211> 91
<212> RNA
<213> 人工序列
<220>
<223> arRNA
<400> 21
gcugcuucau guggucgggg uagcggcuga agcacugcac gccguuuguc agggugguca 60
cgaggguggg ccagggcacg ggcagcuugc c 91
<210> 22
<211> 91
<212> RNA
<213> 人工序列
<220>
<223> arRNA
<400> 22
gcugcuucau guggucgggg uagcggcuga agcacugcac gccgauuguc agggugguca 60
cgaggguggg ccagggcacg ggcagcuugc c 91
<210> 23
<211> 91
<212> RNA
<213> 人工序列
<220>
<223> arRNA
<400> 23
gcugcuucau guggucgggg uagcggcuga agcacugcac gccgguuguc agggugguca 60
cgaggguggg ccagggcacg ggcagcuugc c 91
<210> 24
<211> 91
<212> RNA
<213> 人工序列
<220>
<223> arRNA
<400> 24
gcugcuucau guggucgggg uagcggcuga agcacugcac gccgcuuguc agggugguca 60
cgaggguggg ccagggcacg ggcagcuugc c 91
<210> 25
<211> 91
<212> RNA
<213> 人工序列
<220>
<223> arRNA
<400> 25
uaauccugaa uaucgcgcaa uuccccagca gagaacaucg cggugugaac gucccuuuau 60
accgggcagg uauagcugaa aucagcgugg c 91

Claims (31)

1.一种用于RNA编辑的工程化组合物,包含:
1)经修饰的腺苷脱氨酶蛋白或表达该经修饰的腺苷脱氨酶蛋白的构建体,其中,所述腺苷脱氨酶蛋白经过修饰具有催化胞苷脱氨基的活性,和
2)将经修饰的腺苷脱氨酶蛋白募集到靶标RNA的arRNA或包含该arRNA或包含其编码序列的构建体;
其中所述arRNA包含与所述靶标RNA杂交的互补RNA序列,并且所述arRNA募集所述腺苷脱氨酶蛋白至靶标RNA致使靶标RNA中的靶标胞苷脱氨基,其中所述腺苷脱氨酶蛋白为ADAR2蛋白,其中所述修饰为:E488Q/V351G/S486A/T375S/S370C/P462A/N597I/L332I/I398V/K350I/M383L/D619G/S582T/V440I/S495N/K418E/S661T,其中所述修饰的氨基酸编号与Ge nBank登记号NP_001103.1中的氨基酸编号一致。
2.根据权利要求1所述的工程化组合物,其中所述arRNA与靶标RNA杂交时,所述arRNA中与靶标胞苷相对的靶向碱基为U或C。
3.根据权利要求1所述的工程化组合物,其中:
所述arRNA在对应于靶标RNA的靶标胞苷的上游、下游、或上游和下游的一个或多个位置包含非配对核苷酸,以形成和靶标胞苷上游、下游、或上游和下游的一个或多个位置的核苷酸错配。
4.根据权利要求3所述的工程化组合物,其中所述靶向碱基的3’最近邻碱基与靶标RNA形成错配。
5.根据权利要求4所述的工程化组合物,其中所述arRNA与靶标RNA杂交时,所述靶向碱基的3’最近邻碱基与靶标RNA形成G-G错配。
6.根据权利要求2所述的工程化组合物,所述arRNA与靶标RNA杂交时,所述靶向碱基的5’最近邻碱基与靶标RNA不形成错配。
7.根据权利要求6所述的工程化组合物,其中所述靶向碱基的5’最近邻碱基为U。
8.权利要求5所述的工程化组合物,其中当所述arRNA与靶标RNA杂交时,与所述arRNA的靶向碱基的5’最近邻碱基相对的靶标RNA中的碱基优选次序从高到低为G或C、U或A。
9.根据权利要求1的工程化组合物,其中当所述arRNA与靶标RNA杂交时,所述靶标胞苷及其5’和3’相邻碱基形成的靶标胞苷三联体仅在靶标胞苷处形成错配,其中所述靶标胞苷三联体选自:ACG、ACC、UCC、UCG、CCC、CCG、UCA、UCU。
10.根据权利要求1所述的工程化组合物,其中所述arRNA的长度为91nt。
11.根据权利要求2所述的工程化组合物,其中所述arRNA中靶向碱基距离3’端及5’端的长度相等。
12.根据权利要求1所述的工程化组合物,其中所述arRNA是化学修饰的。
13.根据权利要求12所述的工程化组合物,其中所述化学修饰包括2’-O-甲基修饰或核苷酸间3’硫代修饰。
14.一种非诊断治疗目的的使细胞中靶标RNA中的靶标胞苷脱氨基的方法,包括将如下1)和2)导入所述细胞:
1)经修饰的腺苷脱氨酶蛋白或表达所述经修饰的腺苷脱氨酶蛋白的构建体,和
2)将所述经修饰的腺苷脱氨酶蛋白募集到所述靶标RNA的arRNA或包含该arRNA或包含其编码序列的构建体,其中,所述腺苷脱氨酶蛋白经过修饰具有催化胞苷脱氨基的活性,所述arRNA包含与所述靶标RNA杂交的互补RNA序列,并且所述arRNA募集所述腺苷脱氨酶蛋白至靶标RN A致使靶标RNA中的靶标胞苷脱氨基,其中所述腺苷脱氨酶蛋白为ADAR2蛋白,所述修饰为:E488Q/V351G/S486A/T375S/S370C/P462A/N597I/L332I/I398V/K350I/M383L/D619G/S582T/V440I/S495N/K418E/S661T,所述修饰的氨基酸编号与GenBank登记号NP_001103.1中的氨基酸编号一致。
15.根据权利要求14所述的方法,其中,表达所述经修饰的腺苷脱氨酶蛋白的构建体和包含所述arRNA的编码序列的构建体为同一构建体,或者表达所述经修饰的腺苷脱氨酶蛋白的构建体和包含所述arRNA的编码序列的构建体为分开的构建体,所述分开的构建体被同时或分开地导入所述细胞。
16.根据权利要求14所述方法,其中所述arRNA与靶标RNA杂交时,所述arRNA中与靶标胞苷相对的靶向碱基为U或C。
17.根据权利要求14所述的方法,其中:
所述arRNA在对应于靶标RNA的靶标胞苷的上游、下游、或上游和下游的一个或多个位置包含非配对核苷酸,以形成和靶标胞苷上游、下游、或上游和下游的一个或多个位置的核苷酸错配。
18.根据权利要求16所述的方法,其中所述靶向碱基的3’最近邻碱基与靶标RNA形成错配。
19.根据权利要求18所述的方法,其中所述arRNA与靶标RNA杂交时,所述靶向碱基的3’最近邻碱基与靶标RNA形成G-G错配。
20.根据权利要求16所述的方法,所述arRNA与靶标RNA杂交时,所述靶向碱基的5’最近邻碱基与靶标RNA不形成错配。
21.根据权利要求20所述的方法,其中所述靶向碱基的5’最近邻碱基为U。
22.根据权利要求19所述的方法,其中当所述arRNA与靶标RNA杂交时,与所述靶向碱基的5’最近邻碱基相对的靶标RNA中的碱基优选次序从高到低为G或C、U或A。
23.根据权利要求14所述的方法,其中当所述arRNA与靶标RNA杂交时,所述靶标胞苷及其5’和3’相邻碱基形成的靶标胞苷三联体仅在靶标胞苷处形成错配,其中所述靶标胞苷三联体选自:ACG、ACC、UCC、UC G、CCC、CCG、UCA、UCU。
24.根据权利要求14所述的方法,其中所述arRNA长度为91nt。
25.根据权利要求16所述的方法,其中所述arRNA中靶向碱基距离3’端及5’端的长度相等。
26.根据权利要求14所述的方法,其中所述arRNA是化学修饰的。
27.根据权利要求26所述的方法,其中所述化学修饰包括2’-O-甲基修饰或核苷酸间3’硫代修饰。
28.根据权利要求14所述的方法,其中所述细胞为哺乳动物细胞。
29.一种将权利要求1-13中任一项所述的工程化组合物用于制备治疗由T到C突变引起的疾病的药物的用途,所述用途使包含所述T到C突变转录形成的信使RNA中靶标胞苷脱氨基。
30.一种用于RNA编辑的经修饰的腺苷脱氨酶蛋白,其中所述腺苷脱氨酶蛋白为ADAR2,其中所述修饰为:E488Q/V351G/S486A/T375S/S370C/P462A/N597I/L332I/I398V/K350I/M383L/D619G/S582T/V440I/S495N/K418E/S661T,所述修饰的氨基酸编号与GenBank登记号NP_001103.1中的氨基酸编号一致。
31.根据权利要求30所述的经修饰的腺苷脱氨酶蛋白用于催化胞苷脱氨基转化为尿苷的用途。
CN202011642469.7A 2019-12-31 2020-12-31 一种靶向编辑rna的新方法 Active CN113122524B (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
CN201911411077 2019-12-31
CN2019114110777 2019-12-31

Publications (2)

Publication Number Publication Date
CN113122524A CN113122524A (zh) 2021-07-16
CN113122524B true CN113122524B (zh) 2023-03-24

Family

ID=76772659

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011642469.7A Active CN113122524B (zh) 2019-12-31 2020-12-31 一种靶向编辑rna的新方法

Country Status (1)

Country Link
CN (1) CN113122524B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2023143538A1 (zh) * 2022-01-28 2023-08-03 北京辑因医疗科技有限公司 基于leaper技术治疗mpsi的方法和组合物

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107109413A (zh) * 2014-12-17 2017-08-29 ProQR治疗上市公司Ⅱ 靶向的rna编辑
WO2019071048A1 (en) * 2017-10-04 2019-04-11 The Broad Institute, Inc. SYSTEMS, METHODS AND COMPOSITIONS FOR TARGETED NUCLEIC ACID EDITION

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11274300B2 (en) * 2017-01-19 2022-03-15 Proqr Therapeutics Ii B.V. Oligonucleotide complexes for use in RNA editing

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107109413A (zh) * 2014-12-17 2017-08-29 ProQR治疗上市公司Ⅱ 靶向的rna编辑
WO2019071048A1 (en) * 2017-10-04 2019-04-11 The Broad Institute, Inc. SYSTEMS, METHODS AND COMPOSITIONS FOR TARGETED NUCLEIC ACID EDITION

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
A cytosine deaminase for programmable single-base RNA editing;Omar O Abudayyeh等;《Science》;20190726;第365卷(第6451期);第382-386页 *
Programmable RNA editing by recruiting endogenous ADAR using engineered RNAs;QU,L.等;《NATURE BIOTECHNOLOGY》;20190715;第37卷(第9期);第1059-1068页 *

Also Published As

Publication number Publication date
CN113122524A (zh) 2021-07-16

Similar Documents

Publication Publication Date Title
CN110352244B (zh) 化学修饰的编辑rna的单链寡核苷酸
US20230272379A1 (en) Improved rna editing method
CN113939591A (zh) 编辑rna的方法和组合物
EP4137161A1 (en) Method and drug for treating hurler syndrome
WO2021136520A1 (zh) 一种靶向编辑rna的新方法
CN114846139A (zh) 一种基于leaper技术治疗mps ih的方法和组合物
CN113528582B (zh) 基于leaper技术靶向编辑rna的方法和药物
CN113122524B (zh) 一种靶向编辑rna的新方法
EP4314265A2 (en) Novel crispr enzymes, methods, systems and uses thereof
US20220275378A1 (en) Method for the generation of dumbbell-shaped dna vectors
CN116507629A (zh) Rna支架
CN113122580A (zh) 一种基于leaper技术治疗mps ih的方法和组合物
US20220251566A1 (en) Cells engineered for oligonucleotide delivery, and methods for making and using thereof
TW202339774A (zh) 基於leaper技術治療mpsi的方法和組合物

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
REG Reference to a national code

Ref country code: HK

Ref legal event code: DE

Ref document number: 40051598

Country of ref document: HK

TA01 Transfer of patent application right
TA01 Transfer of patent application right

Effective date of registration: 20220701

Address after: 102206 2nd floor, building 2, No.22, kekeyuan Road, Changping District, Beijing

Applicant after: Beijing Jiyin Medical Technology Co.,Ltd.

Address before: 102206 2nd floor, building 2, No.22, kekeyuan Road, Changping District, Beijing

Applicant before: EDIGENE Inc.

GR01 Patent grant
GR01 Patent grant