CN114981426A

CN114981426A - 合成向导rna、其组合物、方法和用途

Info

Publication number: CN114981426A
Application number: CN202080091197.8A
Authority: CN
Inventors: B·卡弗蒂; A·拉森
Original assignee: Bim Medical Co ltd
Current assignee: Bim Medical Co ltd
Priority date: 2019-12-03
Filing date: 2020-12-03
Publication date: 2022-08-30
Also published as: EP4069838A1; US20230055682A1; KR20220123398A; JP2023504264A; CA3162908A1; WO2021113494A1; AU2020398213A1

Abstract

本发明尤其提供了一种使用自模板方法产生合成RNA的方法。例如，在一些实施例中，产生合成gRNA包括：使第一RNA与第二RNA接触，其中所述第一RNA和所述第二RNA包括至少五个互补的RNA核苷酸，并且其中所述接触形成茎结构或茎环结构；以及用连接酶(i)在所述茎结构内或(ii)在所述茎结构的端部处连接所述第一RNA和所述第二RNA，从而在所述茎结构的所述端部处形成环。

Description

合成向导RNA、其组合物、方法和用途

相关申请的交叉引用

本申请要求于2019年12月3日提交的U.S.62/943,158和于2020年5月28日提交的U.S.63/031,262的权益和优先权，所述文献中的每个文献的内容并入本文中。

背景技术

与Cas内切核酸酶和包含碱基编辑器在内的相关酶相关联的向导RNA分子(gRNA)用于基因编辑。用于治疗应用的一种常见形式的gRNA是大约100个核苷酸的单一非天然RNA，所述核苷酸与Cas9形成核糖核蛋白。使用亚磷酰胺化学的质粒DNA和固相合成是获得治疗性sgRNA的典型方法。使用合成RNA是有利的，因为它允许掺入既可以增加sgRNA的化学稳定性又可以减少在不期望的位置(脱靶)编辑基因组DNA的修饰。

gRNA的制造中仍然存在问题，例如：i)sgRNA分子的长度(长度通常为100个核苷酸)推动了亚磷酰胺化学的限值。亚磷酰胺化学对RNA的偶联效率为约0.985X(其中X是核苷酸数)。例如，100nts长的gRNA的合成在分离前会产生大约20％的全长产物。这些长度明显大于目前市场上基于寡核苷酸的治疗剂中使用的长度(siRNA和反义寡核苷酸(ASO)的长度通常为20-50个核苷酸并且因此更易于纯化)；ii)对于这些长度尺度的RNA，标准纯化方法(例如，色谱法、电泳法)目前无法完全去除由不完全偶联(截短产物)、不完全去保护和随机***核苷酸(加成产物)形成的副产物；以及iii)与全长产物具有相似序列同源性的与全长产物分离的副产物会降低核糖核蛋白复合物的活性并可能导致脱靶编辑。

发明内容

本文描述了一种使用化学和/或酶促策略合成gRNA的方法，所述方法克服了限制合成RNA的纯度、完整性和最终(纯化后)产率的挑战。在一些方面，本发明提供了一种基于连接的方法，其中使用酶连接两个或更多个合成RNA。令人惊讶地发现，基于连接的方法提高了所产生的gRNA的纯度、产率和完整性。与先前的gRNA合成方法相比，gRNA的所得纯度、产率和完整性可以提高编辑效率并减少脱靶编辑。用于合成gRNA的基于连接的方法包含：包括使用随后连接的两个或更多个部分互补的合成RNA的方法(“模板方法”)；以及不需要两个或更多个合成RNA之间互补性的方法(“非模板方法”)。

在一些方面，提供了一种方法方法，所述方法包括：使第一RNA与第二RNA接触，其中所述第一RNA和所述第二RNA包括至少五个互补的RNA核苷酸，并且其中所述接触形成茎结构或茎环结构；以及用连接酶(i)在所述茎结构内或(ii)在所述茎结构的端部处连接所述第一RNA和所述第二RNA，从而在所述茎结构的所述端部处形成环。

在一些实施例中，所述接触形成茎结构，并且所述连接酶在所述茎结构的所述端部处连接所述第一RNA和所述第二RNA，从而在所述茎结构的所述端部处形成环。

在一些实施例中，所述接触形成茎环结构，并且所述连接酶在所述茎环结构的茎内连接所述第一RNA和所述第二RNA。

在一些实施例中，所述连接酶选自由以下组成的组：T4 RNA连接酶1、T4 RNA连接酶2、RtcB连接酶、热稳定性5'App DNA/RNA连接酶、ElectroLigase、T4 DNA连接酶、T3 DNA连接酶、T7 DNA连接酶、Taq DNA连接酶、SplintR连接酶、大肠杆菌DNA连接酶、9°N DNA连接酶、CircLigase、CircLigase II、DNA连接酶I、DNA连接酶III和DNA连接酶IV。因此，在一些实施例中，所述连接酶是T4 RNA连接酶1。在一些实施例中，所述连接酶是T4 RNA连接酶2。在一些实施例中，所述连接酶是RtcB连接酶。在一些实施例中，所述连接酶是热稳定性5'App DNA/RNA连接酶。在一些实施例中，所述连接酶是ElectroLigase。在一些实施例中，所述连接酶是T4 DNA连接酶。在一些实施例中，所述连接酶是T3 DNA连接酶。在一些实施例中，所述连接酶是T7 DNA连接酶。在一些实施例中，所述连接酶是Taq DNA连接酶。在一些实施例中，所述连接酶是SplintR连接酶、大肠杆菌DNA连接酶。在一些实施例中，所述连接酶是9°N DNA连接酶。在一些实施例中，所述连接酶是CircLigase。在一些实施例中，所述连接酶是CircLigase II。在一些实施例中，所述连接酶是DNA连接酶I。在一些实施例中，所述连接酶是DNA连接酶III。在一些实施例中，所述连接酶是DNA连接酶IV。

在一些实施例中，所述第一RNA和/或所述第二RNA是化学合成的。

在一些实施例中，所述第一RNA是成簇规律间隔短回文重复序列(CRISPR)RNA(crRNA)并且所述第二RNA是反式激活RNA(tracrRNA)。

在一些实施例中，根据本文的方法产生向导RNA(gRNA)。

在一些实施例中，所述第一RNA和/或所述第二RNA是酶促合成的。

在一些实施例中，所述第一RNA和/或所述第二RNA包括经修饰的碱基。各种经修饰的RNA碱基在本领域中是已知的并且包含例如2'-O-甲氧基-乙基碱基(2'-MOE)，如2-甲氧基乙氧基A、2-甲氧基乙氧基MeC、2-甲氧基乙氧基G、2-甲氧基乙氧基T。其它经修饰的碱基包含例如2'-O-甲基RNA碱基和氟基碱基。各种氟代碱基是已知的，并且包含例如氟基C、氟基U、氟基A、氟基G碱基。各种2'O甲基修饰也可以与本文所述的方法一起使用。例如，包括以下2'O甲基修饰中的一个或多个的以下RNA可以与所述方法一起使用：2'-OMe-5-甲基-rC、2'-OMe-rT、2'-OMe-rI、2'-OMe-2-氨基-rA、氨基连接子-C6-rC、氨基连接子-C6-rU、2'-OMe-5-Br-rU、2'-OMe-5-I-rU、2-OMe-7-Deaza-rG。

在一些实施例中，所述第一RNA和/或所述第二RNA包括以下修饰中的一个或多个修饰：硫代磷酸酯、2'O-甲基、2'氟基(2'F)、DNA。

在一些实施例中，所述第一RNA和/或所述第二RNA在3'和5'端处包括2'OMe修饰。

在一些实施例中，所述第一RNA和/或所述第二RNA包括以下修饰中的一个或多个修饰：2'-O-2-甲氧基乙基(MOE)、锁核酸、桥接核酸、解锁核酸、肽核酸、吗啉基核酸。

在一些实施例中，所述第一RNA和/或所述第二RNA包括以下碱基修饰中的一个或多个碱基修饰：2,6-二氨基嘌呤、2-氨基嘌呤、假尿嘧啶、N1-甲基-假尿嘧啶、5'甲基胞嘧啶、2'嘧啶酮(泽布拉林(zebularine))、胸腺嘧啶。

其它经修饰的碱基包含例如2-氨基嘌呤、5-溴基dU、脱氧尿苷、2,6-二氨基嘌呤(2-氨基-dA)、双脱氧-C、脱氧肌苷、羟甲基dC、反向dT、Iso-dG、Iso-dC、反向双脱氧-T、5-甲基dC、5-甲基dC、5-硝基吲哚、Super

2'-F-r(C,U)、2'-NH2-r(C,U)、2,2'-脱水-U、3'-脱氧-r(A,C,G,U)、3'-O-甲基-r(A,C,G,U)、rT、rI、5-甲基-rC、2-氨基-rA、rSpacer(Abasic)、7-Deaza-rG、7-Deaza-rA、8-Oxo-rG、5-卤化-rU、N-烷基化-rN。

本文可以使用其它经化学修饰的RNA。例如，所述第一RNA和/或所述第二RNA可以包括经修饰的碱基，例如5'、Int、3'叠氮化物(NHS酯)；5'己炔基；5'、Int、3'5-辛二炔基dU；5'、Int生物素(叠氮化物)；5'、Int 6-FAM(叠氮化物)；以及5'、Int 5-TAMRA(叠氮化物)。可以用于本文所述方法的RNA核苷酸修饰的其它实例包含例如磷酸化修饰，如5'-磷酸化和3'-磷酸化。所述RNA还可以具有以下修饰中的一个或多个修饰：氨基修饰、生物素化、硫醇修饰、炔烃修饰、腺苷酸化、叠氮化物(NHS酯)、胆固醇-TEG和地高辛(Digoxigenin)(NHS酯)。

在一些实施例中，用连接酶连接所述第一RNA和所述第二RNA在所述第一RNA与所述第二RNA之间产生磷酸二酯键。

在一些实施例中，所述第一RNA和/或所述第二RNA核苷酸经工程化以允许非共价组装。

在一些实施例中，所述茎环的长度介于约2-50个核苷酸之间。

在一些实施例中，所述第一RNA和所述第二RNA包括至少两个具有完全互补性的RNA核苷酸。

在一些实施例中，所述第一RNA和所述第二RNA包括至少三个、四个、五个、六个或七个具有完全互补性的连续RNA核苷酸。

在一些实施例中，所述具有完全互补性的RNA核苷酸存在于顶部茎和/或底部茎中。

在一些实施例中，所述第一RNA和所述第二RNA在由所述第一RNA和所述第二RNA形成的下部茎处包括至少五个、六个或七个互补的连续RNA核苷酸。

在一些实施例中，所述第一RNA和所述第二RNA在上部茎处包括至少四到十四个互补的连续RNA核苷酸。

在一些实施例中，所述第一RNA和所述第二RNA在上部茎处包括四个互补的连续RNA核苷酸。

在一些实施例中，所述第一RNA和所述第二RNA在上部茎处包括五个互补的连续RNA核苷酸。

在一些实施例中，所述第一RNA和所述第二RNA在上部茎处包括七个互补的连续RNA核苷酸。

在一些实施例中，所述第一RNA和所述第二RNA在上部茎处包括14个互补的连续RNA核苷酸。

在一些实施例中，所述第一RNA和所述第二RNA在下部茎处包括7个互补的连续RNA核苷酸。

在一些实施例中，所述第一RNA和/或所述第二RNA经工程化以产生用于连接酶的连接位点。

在一些实施例中，所述茎环包括4个、5个、6个、7个、8个、9个、10个、11个、12个、13个、14个、15个或16个核苷酸的环。因此，在一些实施例中，所述茎环包括4个核苷酸的环，在本文中也称为四环。在一些实施例中，所述茎环包括5个核苷酸的环。在一些实施例中，所述茎环包括6个核苷酸的环。在一些实施例中，所述茎环包括7个核苷酸的环。在一些实施例中，所述茎环包括8个核苷酸的环。在一些实施例中，所述茎环包括9个核苷酸的环。在一些实施例中，所述茎环包括10个核苷酸的环。在一些实施例中，所述茎环包括11个核苷酸的环。在一些实施例中，所述茎环包括12个核苷酸的环。在一些实施例中，所述茎环包括13个核苷酸的环。在一些实施例中，所述茎环包括14个核苷酸的环。在一些实施例中，所述茎环包括15个核苷酸的环。在一些实施例中，所述茎环包括15个核苷酸的环。

在一些实施例中，连接所述第一RNA和所述第二RNA发生在距所述环至少1个、2个、3个、4个、5个、6个、7个、8个、9个或10个碱基对的连接位点处。因此，在一些实施例中，连接所述第一RNA和所述第二RNA发生在距所述环至少1个碱基对的连接位点处。在一些实施例中，连接所述第一RNA和所述第二RNA发生在距所述环至少2个碱基对的连接位点处。在一些实施例中，连接所述第一RNA和所述第二RNA发生在距所述环至少3个碱基对的连接位点处。在一些实施例中，连接所述第一RNA和所述第二RNA发生在距所述环至少4个碱基对的连接位点处。在一些实施例中，连接所述第一RNA和所述第二RNA发生在距所述环至少5个碱基对的连接位点处。在一些实施例中，连接所述第一RNA和所述第二RNA发生在距所述环至少6个碱基对的连接位点处。在一些实施例中，连接所述第一RNA和所述第二RNA发生在距所述环至少7个碱基对的连接位点处。在一些实施例中，连接所述第一RNA和所述第二RNA发生在距所述环至少8个碱基对的连接位点处。在一些实施例中，连接所述第一RNA和所述第二RNA发生在距所述环至少9个碱基对的连接位点处。在一些实施例中，连接所述第一RNA和所述第二RNA发生在距所述环至少10个碱基对的连接位点处。

在一些实施例中，所述连接位点距所述环2个或3个碱基对。

在一些实施例中，连接所述第一RNA和所述第二RNA发生在距凸起至少3个、4个、5个、6个、7个、8个、9个、10个、11个或12个碱基对的连接位点处。因此，在一些实施例中，连接所述第一RNA和所述第二RNA发生在距凸起至少3个碱基对的连接位点处。在一些实施例中，连接所述第一RNA和所述第二RNA发生在距凸起至少4个碱基对的连接位点处。在一些实施例中，连接所述第一RNA和所述第二RNA发生在距凸起至少5个碱基对的连接位点处。在一些实施例中，连接所述第一RNA和所述第二RNA发生在距凸起至少6个碱基对的连接位点处。在一些实施例中，连接所述第一RNA和所述第二RNA发生在距凸起至少7个碱基对的连接位点处。在一些实施例中，连接所述第一RNA和所述第二RNA发生在距凸起至少8个碱基对的连接位点处。在一些实施例中，连接所述第一RNA和所述第二RNA发生在距凸起至少9个碱基对的连接位点处。在一些实施例中，连接所述第一RNA和所述第二RNA发生在距凸起至少10个碱基对的连接位点处。在一些实施例中，连接所述第一RNA和所述第二RNA发生在距凸起至少11个碱基对的连接位点处。在一些实施例中，连接所述第一RNA和所述第二RNA发生在距凸起至少12个碱基对的连接位点处。

在一些实施例中，连接所述第一RNA和所述第二RNA发生在距所述凸起3个、4个、5个或11个碱基对的连接位点。

在一些实施例中，所述第一RNA和/或所述第二RNA是酶促产生的。

在一些实施例中，所述第一RNA包括能够与所述第二RNA的一部分碱基配对的3'序列。

在一些实施例中，所述第一RNA在5'末端处包括磷酸酯。

在一些实施例中，所述第一RNA是供体RNA。

在一些实施例中，所述第二RNA包括可变原型间隔子区域。

在一些实施例中，所述第二RNA是受体RNA。

在一些实施例中，所述第一RNA在5'末端处包括三磷酸腺苷。

在一些实施例中，约8-50个核苷酸是互补的并且允许在所述第一RNA与所述第二RNA之间进行碱基配对。在一些实施例中，约8-40个核苷酸是互补的并且允许在所述第一RNA与所述第二RNA之间进行碱基配对。在一些实施例中，约8-30个核苷酸是互补的并且允许在所述第一RNA与所述第二RNA之间进行碱基配对。在一些实施例中，约8-20个核苷酸是互补的并且允许在所述第一RNA与所述第二RNA之间进行碱基配对。在一些实施例中，约8-10个核苷酸是互补的并且允许在所述第一RNA与所述第二RNA之间进行碱基配对。

在一些实施例中，所述8-50个核苷酸是部分互补的。在一些实施例中，约8-40个核苷酸是部分互补的并且允许所述第一RNA与所述第二RNA之间进行碱基配对。在一些实施例中，约8-30个核苷酸是部分互补的并且允许所述第一RNA与所述第二RNA之间进行碱基配对。在一些实施例中，约8-20个核苷酸是部分互补的并且允许所述第一RNA与所述第二RNA之间进行碱基配对。在一些实施例中，约8-10个核苷酸是部分互补的并且允许所述第一RNA与所述第二RNA之间进行碱基配对。

在一些实施例中，所述8-50个核苷酸是约50％到99％互补的。

在一些实施例中，所述8-50个核苷酸是完全互补的。在一些实施例中，约8-40个核苷酸是完全互补的并且允许所述第一RNA与所述第二RNA之间进行碱基配对。在一些实施例中，约8-30个核苷酸是完全互补的并且允许所述第一RNA与所述第二RNA之间进行碱基配对。在一些实施例中，约8-20个核苷酸是完全互补的并且允许所述第一RNA与所述第二RNA之间进行碱基配对。在一些实施例中，约8-10个核苷酸是完全互补的并且允许所述第一RNA与所述第二RNA之间进行碱基配对。

在一些实施例中，所述第一RNA和所述第二RNA具有不同的核苷酸长度。

在一些实施例中，所述第一RNA具有约20-100个核苷酸。在一些实施例中，所述第一RNA具有约20-90个核苷酸。在一些实施例中，所述第一RNA具有约20-80个核苷酸。在一些实施例中，所述第一RNA具有约20-70个核苷酸。在一些实施例中，所述第一RNA具有约20-60个核苷酸。在一些实施例中，所述第一RNA具有约20-50个核苷酸。在一些实施例中，所述第一RNA具有约20-40个核苷酸。在一些实施例中，所述第一RNA具有约20-30个核苷酸。

在一些实施例中，所述第二RNA具有约20-70个核苷酸。在一些实施例中，所述第二RNA具有约20-60个核苷酸。在一些实施例中，所述第二RNA具有约20-50个核苷酸。在一些实施例中，所述第二RNA具有约20-40个核苷酸。在一些实施例中，所述第二RNA具有约20-30个核苷酸。

在一些实施例中，碱基配对发生在下部茎中。

在一些实施例中，7个核苷酸在所述下部茎中是互补的并且允许在所述第一RNA与所述第二RNA之间进行碱基配对。

在一些实施例中，所述碱基配对发生在上部茎中。

在一些实施例中，2个核苷酸在所述上部茎中是互补的并且允许在所述第一RNA与所述第二RNA之间进行碱基配对。

在一些实施例中，所述gRNA的长度为约100个核苷酸、约125个核苷酸、约150个核苷酸、约175个核苷酸、约200个核苷酸或大于约200个核苷酸。因此，在一些实施例中，所述gRNA的长度为约100个核苷酸。在一些实施例中，所述gRNA的长度为约125个核苷酸。在一些实施例中，所述gRNA的长度为约150个核苷酸。在一些实施例中，所述gRNA的长度为约175个核苷酸。在一些实施例中，所述gRNA的长度为约200个核苷酸。在一些实施例中，所述gRNA的长度为大于200个核苷酸。

在一些实施例中，所述gRNA是扩展向导RNA、引导编辑器向导RNA(pegRNA)或Cas12向导RNA，例如Cas12a向导RNA、Cas12b向导RNA、Cas12c向导RNA、Cas12d向导RNA、Cas12e向导RNA、Cas12f向导RNA、Cas12g向导RNA、Cas12h向导RNA、Cas12i向导RNA、Cas12j向导RNA或Cas12k向导RNA。因此，在一些实施例中，所述gRNA是扩展向导RNA。在一些实施例中，所述gRNA是引导编辑器向导RNA(pegRNA)。在一些实施例中，所述gRNA是Cas12向导RNA。各种Cas12是本领域已知的，并且包含例如来自2类CRISPR-Cas***的Cas12。示例性Cas12包含例如来自第2类CRISPR-Cas***的任何Cas12。在一些实施例中，本文所述的方法适用于合成Cas12a、Cas12b、Cas12c、Cas12d、Cas12e、Cas12f、Cas12g、Cas12h、Cas12i、Cas12j和/或Cas12k的gRNA。因此，在一些实施例中，所述gRNA是Cas12a向导RNA。在一些实施例中，所述gRNA是Cas12b向导RNA。在一些实施例中，所述gRNA是Cas12c向导RNA。在一些实施例中，所述gRNA是Cas12d向导RNA。在一些实施例中，所述gRNA是Cas12e向导RNA。在一些实施例中，所述gRNA是Cas12f向导RNA。在一些实施例中，所述gRNA是Cas12g向导RNA。在一些实施例中，所述gRNA是Cas12h向导RNA。在一些实施例中，所述gRNA是Cas12i向导RNA。在一些实施例中，所述gRNA是Cas12j向导RNA。在一些实施例中，所述gRNA是Cas12k向导RNA。

在一些实施例中，所述gRNA包括以下中的一种或多种：间隔子、下部茎、凸起、上部茎、连结和发夹。

在一些实施例中，所述第一RNA和所述第二RNA以约0.5:1、0.6:1、0.7:1、0.8:1、0.9:1、1:1、1:0.9、1:0.8、1:0.7、1:0.6或1:0.5的比率存在。因此，在一些实施例中，所述第一RNA和所述第二RNA以约0.5:1的比率存在。在一些实施例中，所述第一RNA和所述第二RNA以约0.6:1的比率存在。在一些实施例中，所述第一RNA和所述第二RNA以约0.7:1的比率存在。在一些实施例中，所述第一RNA和所述第二RNA以约0.8:1的比率存在。在一些实施例中，所述第一RNA和所述第二RNA以约0.9:1的比率存在。在一些实施例中，所述第一RNA和所述第二RNA以约1:1的比率存在。在一些实施例中，所述第一RNA和所述第二RNA以约1:0.9的比率存在。在一些实施例中，所述第一RNA和所述第二RNA以约1:0.8的比率存在。在一些实施例中，所述第一RNA和所述第二RNA以约1:0.7的比率存在。在一些实施例中，所述第一RNA和所述第二RNA以约1:0.6的比率存在。在一些实施例中，所述第一RNA和所述第二RNA以约1:0.5的比率存在。

在一些实施例中，所述gRNA以约50％、55％、60％、65％、70％、75％、80％、85％、90％、95％、99％或更大的产率产生。因此，在一些实施例中，所述gRNA以约50％的产率产生。在一些实施例中，所述gRNA以约55％的产率产生。在一些实施例中，所述gRNA以约60％的产率产生。在一些实施例中，所述gRNA以约65％的产率产生。在一些实施例中，所述gRNA以约70％的产率产生。在一些实施例中，所述gRNA以约75％的产率产生。在一些实施例中，所述gRNA以约80％的产率产生。在一些实施例中，所述gRNA以约85％的产率产生。在一些实施例中，所述gRNA以约90％的产率产生。在一些实施例中，所述gRNA以约95％的产率产生。在一些实施例中，所述gRNA以超过99％的产率产生。

在一些实施例中，与常规合成方法相比，所述gRNA以高50％、55％、60％、65％、70％、75％、80％、85％、90％、95％、99％或更多的产率产生。因此，在一些实施例中，与常规合成方法相比，所述gRNA以高50％的产率产生。在一些实施例中，与常规合成方法相比，所述gRNA以高55％的产率产生。在一些实施例中，与常规合成方法相比，所述gRNA以高60％的产率产生。在一些实施例中，与常规合成方法相比，所述gRNA以高55％的产率产生。在一些实施例中，与常规合成方法相比，所述gRNA以高60％的产率产生。在一些实施例中，与常规合成方法相比，所述gRNA以高65％的产率产生。在一些实施例中，与常规合成方法相比，所述gRNA以高70％的产率产生。在一些实施例中，与常规合成方法相比，所述gRNA以高75％的产率产生。在一些实施例中，与常规合成方法相比，所述gRNA以高80％的产率产生。在一些实施例中，与常规合成方法相比，所述gRNA以高85％的产率产生。在一些实施例中，与常规合成方法相比，所述gRNA以高90％的产率产生。在一些实施例中，与常规合成方法相比，所述gRNA以高99％的产率产生。在一些实施例中，与常规合成方法相比，所述gRNA以高大于99％的产率产生。

在一些方面，提供了一种产生合成向导RNA(gRNA)的方法，所述方法包括：提供包括5'-单磷酸酯的第一RNA；提供第二RNA；提供与所述第一RNA和所述第二RNA具有部分互补性的寡核苷酸，其中所述寡核苷酸的所述互补性允许与所述第一RNA和所述第二RNA进行碱基配对；以及提供连接酶以催化所述第一RNA与所述第二RNA之间的连接，从而产生所述合成gRNA。

在一些方面，提供了一种产生合成向导RNA(gRNA)的方法，所述方法包括：提供包括5'–单磷酸酯的第一RNA；提供包括封闭3'端的第二RNA；以及提供连接酶以催化所述第一RNA与所述第二RNA之间的连接，从而产生所述合成gRNA。

在一些实施例中，所述第一RNA是反式激活RNA(tracrRNA)，并且所述第二RNA是成簇规律间隔短回文重复序列(CRISPR)RNA(crRNA)。

在一些实施例中，所述寡核苷酸的长度为约100个核苷酸。在一些实施例中，所述寡核苷酸的长度为约80个、90个、100个、110个、120个、130个、140个、150个、160个、170个、180个、190个或200个核苷酸。

在一些方面，提供了一种产生合成向导RNA(gRNA)的方法，所述方法包括：

提供两个或更多个RNA片段；提供与所述两个或更多个RNA片段具有部分互补性的寡核苷酸，其中所述寡核苷酸的所述互补性允许与所述两个或更多个RNA片段进行碱基配对；以及提供连接酶以催化所述两个或更多个RNA片段之间的连接，从而产生所述合成向导RNA。

在一些实施例中，所述两个或更多个RNA片段在突出端、平端或凸起处连接。

在一些实施例中，向导RNA(gRNA)或引导编辑向导RNA(pegRNA)通过本文所述的方法合成。在一些实施例中，所述向导RNA是Cas9向导RNA或Cas12向导RNA。

本文所述的方法可以用于合成Cas12向导RNA，如Cas12b向导RNA。例如，Cas12bRNA发夹环结构可以作为***sgRNA的位置靶向。各种发夹环结构可以作为***sgRNA的位置靶向，例如，如图16中所示的那些发夹环结构。因此，在一些实施例中，可以根据本文所述的方法通过靶向一个或多个发夹环结构来合成Cas12向导RNA。在一些实施例中，Cas12 RNA内的一个或多个四环被靶向用于连接。例如，在一些实施例中，Cas12b RNA内的一个或多个四环被靶向用于连接。在一些实施例中，所述靶向的四环位于所述Cas12 RNA的5'端处。在一些实施例中，所述靶向的四环位于所述Cas12RNA的3'端处。在一些实施例中，所述靶向四环位于距Cas12 RNA 3'端约5-30个核苷酸的范围内。在一些实施例中，所述靶向四环距Cas12RNA的5'端约5-30个核苷酸。

在一些方面，提供了一种用于靶向转录激活、靶向转录抑制、靶向表观基因组修饰或靶向基因组修饰的方法，所述方法包括向真核细胞中引入：(a)如前述权利要求中任一项所定义的合成向导RNA(gRNA)；(b)至少一种CRISPR/Cas蛋白或编码所述至少一种CRISPR/Cas蛋白的核酸；其中(a)和(b)与染色体DNA中的靶序列之间的相互作用引起靶向转录激活、靶向转录抑制、靶向表观基因组修饰或靶向基因组修饰。

在一些方面，提供了一种靶向RNA修饰的方法，所述方法包括向真核细胞中引入：(a)如前述权利要求中任一项所定义的合成向导RNA(gRNA)；(b)至少一种CRISPR/Cas蛋白或编码所述至少一种CRISPR/Cas蛋白的核酸；其中(a)和(b)与由染色体DNA表达的RNA之间的相互作用引起由所述染色体DNA表达的所述RNA的修饰。

在一些实施例中，由所述染色体DNA表达的所述RNA是信使RNA(mRNA)。

在一些实施例中，所述CRISPR/Cas蛋白选自Cas9、Cpf1、SaCas、Cas12、Cas13或其经修饰的型式。

在一些实施例中，根据本文所述的方法提供了一种用于产生合成向导RNA(gRNA)的方法。

在一些实施例中，所述第二RNA包括能够与所述第一RNA的一部分碱基配对的3'序列。

在一些实施例中，所述第二RNA包括可变原型间隔子区域。

在一些实施例中，所述第一RNA在5'末端处包括磷酸酯。

在一些实施例中，所述连接酶是T4 RNA连接酶2。

在一些实施例中，所述茎环在上部茎中包括GC碱基对。

在一些实施例中，所述上部茎包括与CGAUACGACAGAAC至少约80％相同的核苷酸序列。在一些实施例中，所述上部茎包括与CGAUACGACAGAAC至少约85％相同的核苷酸序列。在一些实施例中，所述上部茎包括与CGAUACGACAGAAC至少约90％相同的核苷酸序列。在一些实施例中，所述上部茎包括与CGAUACGACAGAAC至少约95％相同的核苷酸序列。在一些实施例中，所述上部茎包括与CGAUACGACAGAAC至少约99％相同的核苷酸序列。在一些实施例中，所述上部茎包括与CGAUACGACAGAAC相同的核苷酸序列。

在一些实施例中，所述上部茎包括与CGCCG至少约80％相同的核苷酸序列。在一些实施例中，所述上部茎包括与CGCCG至少约85％相同的核苷酸序列。在一些实施例中，所述上部茎包括与CGCCG至少约90％相同的核苷酸序列。在一些实施例中，所述上部茎包括与CGCCG至少约80％相同的核苷酸序列。在一些实施例中，所述上部茎包括与CGCCG至少约95％相同的核苷酸序列。在一些实施例中，所述上部茎包括与CGCCG至少约99％相同的核苷酸序列。在一些实施例中，所述上部茎包括与CGCCG相同的核苷酸序列。

在一些实施例中，所述上部茎包括与CGGCCGC至少约80％相同的核苷酸序列。在一些实施例中，所述上部茎包括与CGGCCGC至少约85％相同的核苷酸序列。在一些实施例中，所述上部茎包括与CGGCCGC至少约90％相同的核苷酸序列。在一些实施例中，所述上部茎包括与CGGCCGC至少约95％相同的核苷酸序列。在一些实施例中，所述上部茎包括与CGGCCGC至少约99％相同的核苷酸序列。在一些实施例中，所述上部茎包括与CGGCCGC相同的核苷酸序列。

在一些实施例中，所述上部茎包括与CGCGC至少约80％相同的核苷酸序列。在一些实施例中，所述上部茎包括与CGCGC至少约85％相同的核苷酸序列。在一些实施例中，所述上部茎包括与CGCGC至少约90％相同的核苷酸序列。在一些实施例中，所述上部茎包括与CGCGC至少约95％相同的核苷酸序列。在一些实施例中，所述上部茎包括与CGCGC至少约99％相同的核苷酸序列。在一些实施例中，所述上部茎包括与CGCGC相同的核苷酸序列。

在一些实施例中，所述上部茎包括与CGAU至少约80％相同的核苷酸序列。在一些实施例中，所述上部茎包括与CGAU至少约85％相同的核苷酸序列。在一些实施例中，所述上部茎包括与CGAU至少约90％相同的核苷酸序列。在一些实施例中，所述上部茎包括与CGAU至少约95％相同的核苷酸序列。在一些实施例中，所述上部茎包括与CGAU至少约99％相同的核苷酸序列。在一些实施例中，所述上部茎包括与CGAU相同的核苷酸序列。

在一些实施例中，所述茎环在下部茎中包括GC碱基对。

在一些实施例中，所述下部茎不包括GC碱基对。

在一些实施例中，所述上部茎不包括GC碱基对。

在一些实施例中，所述上部茎包括至少1个、2个、3个、4个、5个或6个、7个、8个、9个、10个、11个或12个GC碱基对。在一些实施例中，所述茎包括至少1个GC碱基对。在一些实施例中，所述茎包括至少2个GC碱基对。在一些实施例中，所述茎包括至少3个GC碱基对。在一些实施例中，所述茎包括至少4个GC碱基对。在一些实施例中，所述茎包括至少2个GC碱基对。在一些实施例中，所述茎包括至少5个GC碱基对。在一些实施例中，所述茎包括至少6个GC碱基对。在一些实施例中，所述茎包括至少7个GC碱基对。在一些实施例中，所述茎包括至少8个GC碱基对。在一些实施例中，所述茎包括至少9个GC碱基对。在一些实施例中，所述茎包括至少10个GC碱基对。在一些实施例中，所述茎包括至少11个GC碱基对。在一些实施例中，所述茎包括至少12个GC碱基对。

在一些实施例中，连接所述第一RNA和所述第二RNA导致全长产物的产率为至少60％、70％、80％、90％或超过95％。在一些实施例中，所述第一RNA和所述第二RNA导致全长产物的产率为至少60％。在一些实施例中，所述第一RNA和所述第二RNA导致全长产物的产率为至少70％。在一些实施例中，所述第一RNA和所述第二RNA导致全长产物的产率为至少80％。在一些实施例中，所述第一RNA和所述第二RNA导致全长产物的产率为至少90％。在一些实施例中，所述第一RNA和所述第二RNA导致全长产物的产率为至少95％。在一些实施例中，所述第一RNA和所述第二RNA导致全长产物的产率为超过95％。

在一些实施例中，所述gRNA以至少1克的量产生。

在一些实施例中，gRNA以至少5克、10克、20克、30克、40克、50克、60克、70克、80克、90克或100克的量产生。因此，在一些实施例中，gRNA以至少5克的量产生。在一些实施例中，gRNA以至少10克的量产生。在一些实施例中，gRNA以至少20克的量产生。在一些实施例中，gRNA以至少30克的量产生。在一些实施例中，gRNA以至少40克的量产生。在一些实施例中，gRNA以至少50克的量产生。在一些实施例中，gRNA以至少60克的量产生。在一些实施例中，gRNA以至少70克的量产生。在一些实施例中，gRNA以至少80克的量产生。在一些实施例中，gRNA以至少90克的量产生。在一些实施例中，gRNA以至少100克的量产生。

在一些实施例中，所述gRNA以少于1克的量产生。

在一些实施例中，所述gRNA以约0.05克、0.1克、0.2克、0.3克、0.4克、0.5克、0.6克、0.7克、0.8克或0.9克的量产生。在一些实施例中，所述gRNA以约0.05克的量产生。在一些实施例中，所述gRNA以约0.1克的量产生。在一些实施例中，所述gRNA以约0.2克的量产生。在一些实施例中，所述gRNA以约0.3克的量产生。在一些实施例中，所述gRNA以约0.4克的量产生。在一些实施例中，所述gRNA以约0.5克的量产生。在一些实施例中，所述gRNA以约0.6克的量产生。在一些实施例中，所述gRNA以约0.7克的量产生。在一些实施例中，所述gRNA以约0.8克的量产生。在一些实施例中，所述gRNA以约0.9克的量产生。

在一些实施例中，所述方法以约50％、60％、70％、80％、90％或超过90％的纯度产生gRNA。在一些实施例中，所述方法以约50％的纯度产生gRNA。在一些实施例中，所述方法以约60％的纯度产生gRNA。在一些实施例中，所述方法以约70％的纯度产生gRNA。在一些实施例中，所述方法以约80％的纯度产生gRNA。在一些实施例中，所述方法以约90％的纯度产生gRNA。在一些实施例中，所述方法以超过90％的纯度产生gRNA。

在一些实施例中，所述第一RNA是在3'到5'的方向上合成的。

在一些实施例中，所述第二RNA是在3'到5'的方向上合成的。

在一些实施例中，所述gRNA的长度为约100个核苷酸、约125个核苷酸、约150个核苷酸、约175个核苷酸、约200个核苷酸或大于约200个核苷酸。在一些实施例中，所述gRNA的长度为约100个核苷酸。在一些实施例中，所述gRNA的长度为约125个核苷酸。在一些实施例中，所述gRNA的长度为约150个核苷酸。在一些实施例中，所述gRNA的长度为约175个核苷酸。在一些实施例中，所述gRNA的长度为约200个核苷酸。在一些实施例中，所述gRNA的长度为大于200个核苷酸。

在一些实施例中，所述环包括4个、5个、6个、7个、8个、9个、10个、11个、12个、13个、14个、15个或16个核苷酸。在一些实施例中，所述环包括4个核苷酸，在本文中也称为四环。在一些实施例中，所述环包括5个核苷酸。在一些实施例中，所述环包括6个核苷酸。在一些实施例中，所述环包括7个核苷酸。在一些实施例中，所述环包括8个核苷酸。在一些实施例中，所述环包括9个核苷酸。在一些实施例中，所述环包括10个核苷酸。在一些实施例中，所述环包括11个核苷酸。在一些实施例中，所述环包括12个核苷酸。在一些实施例中，所述环包括13个核苷酸。在一些实施例中，所述环包括14个核苷酸。在一些实施例中，所述环包括15个核苷酸。在一些实施例中，所述环包括16个核苷酸。

在一些实施例中，连接所述第一RNA和所述第二RNA发生在距所述环至少约3个碱基对的连接位点处。

在一些实施例中，所述连接位点距所述环1个、2个、3个、4个、5个、6个或10个碱基对。在一些实施例中，所述连接位点距所述环1个碱基对。在一些实施例中，所述连接位点距所述连接环2个碱基对。在一些实施例中，所述连接位点距所述连接环3个碱基对。在一些实施例中，所述连接位点距所述连接环4个碱基对。在一些实施例中，所述连接位点距所述连接环5个碱基对。在一些实施例中，所述连接位点距所述连接环6个碱基对。在一些实施例中，所述连接位点距所述连接环7个碱基对。在一些实施例中，所述连接位点距所述连接环8个碱基对。在一些实施例中，所述连接位点距所述连接环9个碱基对。在一些实施例中，所述连接位点距所述连接环10个碱基对。

在一些实施例中，所述第一RNA和/或所述第二RNA包括一个或多个骨架修饰。

在一些实施例中，所述一个或多个骨架修饰包括2'O-甲基或硫代磷酸酯修饰。因此，在一些实施例中，所述一个或多个骨架修饰包括2'O-甲基修饰。在一些实施例中，所述一个或多个骨架修饰包括硫代磷酸酯修饰。

在一些实施例中，所述一个或多个骨架修饰选自3'-硫代磷酸2'-O-甲酯、2'O-甲基、2'-核糖3'-硫代磷酸酯、脱氧或5'磷酸酯修饰。因此，在一些实施例中，所述一个或多个骨架修饰包括3'-硫代磷酸2'-O-甲酯修饰。在一些实施例中，所述一个或多个修饰包括2'-核糖3'-硫代磷酸酯修饰。在一些实施例中，所述一个或多个修饰包括脱氧修饰。在一些实施例中，所述一个或多个修饰包括5'磷酸酯修饰。

在一些实施例中，所述一个或多个修饰存在于所述连接位点处。

在一些实施例中，所述一个或多个修饰存在于所述供体RNA和/或所述受体RNA中。因此，在一些实施例中，所述一个或多个修饰存在于所述受体RNA中。在一些实施例中，所述一个或多个修饰存在于所述受体RNA中。在一些实施例中，所述一个或多个修饰存在于所述供体和/或所述受体RNA中。

在一些实施例中，所述供体RNA的所述3'和/或5'端具有一个或多个骨架修饰。因此，在一些实施例中，所述供体RNA的所述3'端具有一个或多个骨架修饰。在一些实施例中，所述供体RNA的所述5'端具有一个或多个骨架修饰。

在一些实施例中，所述受体RNA的所述3'和/或所述5'端具有一个或多个骨架修饰。因此，在一些实施例中，所述受体RNA的所述3'端具有一个或多个骨架修饰。在一些实施例中，所述受体RNA的所述5'端具有一个或多个骨架修饰。

在一些实施例中，所述第一RNA和/或第二RNA的浓度介于约1g/L与5g/L之间。

在一些实施例中，所述第一RNA和/或第二RNA的浓度为约1g/L。在一些实施例中，所述第一RNA和/或第二RNA的浓度为约2g/L。在一些实施例中，所述第一RNA和/或第二RNA的浓度为约3g/L。在一些实施例中，所述第一RNA和/或第二RNA的浓度为约4g/L。在一些实施例中，所述第一RNA和/或第二RNA的浓度为约5g/L。

在一些实施例中，提供了一种通过本文所述的方法产生的组合物，所述组合物包括：第一RNA，所述第一RNA在5'末端处包括磷酸酯；以及第二RNA，所述第二RNA包括可变原型间隔子区域，其中所述第一RNA和所述第二RNA是非共价结合的。

在一些实施例中，提供了一种通过本文所述的方法产生的组合物，所述组合物包括：第一RNA，所述第一RNA在5'末端处包括磷酸酯；以及第二RNA，所述第二RNA包括可变原型间隔子区域，并且其中所述第一RNA和所述第二RNA与连接酶结合。

在一些实施例中，所述连接酶是T4 RNA连接酶2。

在一些方面，提供了一种组合物，所述组合物包括包含与CGAUACGACAGAAC至少约80％相同的核苷酸序列的RNA。在一些实施例中，提供了一种组合物，所述组合物包括包含与CGAUACGACAGAAC至少约85％相同的核苷酸序列的RNA。在一些实施例中，提供了一种组合物，所述组合物包括包含与CGAUACGACAGAAC至少约90％相同的核苷酸序列的RNA。在一些实施例中，提供了一种组合物，所述组合物包括包含与CGAUACGACAGAAC至少约95％相同的核苷酸序列的RNA。在一些实施例中，提供了一种组合物，所述组合物包括包含与CGAUACGACAGAAC相同的核苷酸序列的RNA。

在一些方面，提供了一种组合物，所述组合物包括包含与CGCCG至少约80％相同的核苷酸序列的RNA。在一些实施例中，提供了一种组合物，所述组合物包括包含与CGCCG至少约85％相同的核苷酸序列的RNA。在一些实施例中，提供了一种组合物，所述组合物包括包含与CGCCG至少约90％相同的核苷酸序列的RNA。在一些实施例中，提供了一种组合物，所述组合物包括包含与CGCCG至少约95％相同的核苷酸序列的RNA。在一些实施例中，所述核苷酸序列与CGCCG相同。

在一些方面，提供了一种组合物，所述组合物包括包含与CGGCCGC至少约80％相同的核苷酸序列的RNA。在一些实施例中，提供了一种组合物，所述组合物包括包含与CGGCCGC至少约85％相同的核苷酸序列的RNA。在一些实施例中，提供了一种组合物，所述组合物包括包含与CGGCCGC至少约90％相同的核苷酸序列的RNA。在一些实施例中，提供了一种组合物，所述组合物包括包含与CGGCCGC至少约95％相同的核苷酸序列的RNA。在一些实施例中，所述核苷酸序列与CGGCCGC相同。

在一些方面，提供了一种组合物，所述组合物包括包含与CGCGC至少约80％相同的核苷酸序列的RNA。在一些实施例中，提供了一种组合物，所述组合物包括包含与CGCGC至少约85％相同的核苷酸序列的RNA。在一些实施例中，提供了一种组合物，所述组合物包括包含与CGCGC至少约90％相同的核苷酸序列的RNA。在一些实施例中，提供了一种组合物，所述组合物包括包含与CGCGC至少约95％相同的核苷酸序列的RNA。在一些实施例中，所述核苷酸序列与CGCGC相同。

在一些实施例中，提供了一种试剂盒，所述试剂盒包括本文所述的组合物。

在一些方面，提供了一种试剂盒，其包括：第一RNA，所述第一RNA包括反式激活RNA(tracrRNA)序列；第二RNA，所述第二RNA包括可变原型间隔子区域；以及连接酶。

在一些实施例中，所述试剂盒包括T4 RNA连接酶2。

定义

为了更容易理解本发明，下面首先定义某些术语。用于以下术语和其它术语的另外的定义在整个说明书中阐述。

一个或一种：冠词“一个”和“一种”在本文中指代冠词的一个/种或多于一个/种(即，至少一个/种)语法宾语。举例来说，“要素”意指一个/种要素或多于一个/种要素。

大约或约：如本文所用，术语“大约”或“约”，当应用于所关注的一个或多个值时，是指与所规定的参考值相似的值。在某些实施例中，术语“大约”或“约”是指在陈述的参考值的任一方向(大于或小于)的25％、20％、19％、18％、17％、16％、15％、14％、13％、12％、11％、10％、9％、8％、7％、6％、5％、4％、3％、2％、1％或更小的值的范围，除非另外陈述或另外从上下文明显可见(除了这种数字将会超过可能值的100％的情况)。

与...相关：如果一个事件或实体的存在、水平和/或形式与另一个事件或实体的存在、水平和/或形式有关，则两个事件或实体彼此“缔合”，如所述术语在本文所使用。例如，如果特定实体(例如，多肽)的存在、水平和/或形式与疾病、病症或病状的发病率和/或易感性有关(例如，跨相关群体)，则所述特定实体被认为与特定疾病、病症或病状相关。在一些实施例中，如果两个或更多个实体直接或间接相互作用，使得其在物理上彼此接近和保持彼此接近，则其在物理上彼此“缔合”。在一些实施例中，物理上彼此缔合的两个或两个以上实体彼此共价连接；在一些实施例中，物理上彼此缔合的两个或两个以上实体不是彼此共价连接的，而是例如通过氢键、范德华相互作用(van der Waals interaction)、疏水性相互作用、磁性和其组合非共价缔合的。

碱基编辑器：“碱基编辑器(BE)”或“核碱基编辑器(NBE)”是指结合多核苷酸并具有核碱基修饰活性的药剂。在各个实施例中，所述碱基编辑器包括核碱基修饰多肽(例如，脱氨酶)和多核苷酸可编程核苷酸结合结构域以及向导多核苷酸(例如，向导RNA)。在各个实施例中，所述药剂是生物分子复合物，所述生物分子复合物包括具有碱基编辑活性的蛋白质结构域，即，能够修饰核酸分子(例如，DNA)内的碱基(例如，A、T、C、G或U)的结构域。在一些实施例中，所述多核苷酸可编程DNA结合结构域融合或连接到脱氨酶结构域。在一个实施例中，所述药剂是包括一个或多个具有碱基编辑活性的结构域的融合蛋白。在另一个实施例中，所述具有碱基编辑活性的蛋白质结构域与向导RNA连接(例如，通过向导RNA上的RNA结合基序和与脱氨酶融合的RNA结合结构域)。在一些实施例中，所述具有碱基编辑活性的结构域能够使核酸分子内的碱基脱氨基。在一些实施例中，所述碱基编辑器能够使DNA分子内的一个或多个碱基脱氨基。在一些实施例中，所述碱基编辑器能够使DNA内的胞嘧啶(C)或腺苷(A)脱氨基。在一些实施例中，所述碱基编辑器能够使DNA内的胞嘧啶(C)和腺苷(A)脱氨基。在一些实施例中，所述碱基编辑器是胞苷碱基编辑器(CBE)。在一些实施例中，所述碱基编辑器是腺苷碱基编辑器(ABE)。在一些实施例中，所述碱基编辑器是腺苷碱基编辑器(ABE)和胞苷碱基编辑器(CBE)。在一些实施例中，所述碱基编辑器是与腺苷脱氨酶融合的核酸酶失活Cas9(dCas9)。在一些实施例中，所述碱基编辑器与碱基切除修复抑制剂融合，例如UGI结构域或dISN结构域。在一些实施例中，所述融合蛋白包括与脱氨酶融合的Cas9切口酶和碱基切除修复抑制剂，例如UGI或dISN结构域。在其它实施例中，所述碱基编辑器是无碱基碱基编辑器。碱基编辑器的细节在国际PCT申请第PCT/2017/045381号(WO2018/027078)和第PCT/US2016/058344号(WO2017/070632)中进行了描述，所述国际PCT申请中的每一个都通过引用整体并入本文。还参见Komor,A.C.等人,“无需双链DNA切割的基因组DNA中靶碱基的可编程编辑(Programmable editing of a target base ingenomic DNA without double-stranded DNA cleavage)”《自然(Nature)》533,420-424(2016)；Gaudelli,N.M.等人,“无需DNA切割的基因组DNA中A·T到G·C的可编程碱基编辑(Programmable base editing of A·Tto G·C in genomic DNA without DNAcleavage)”《自然》551,464-471(2017)；Komor,A.C.等人,“改进的碱基切除修复抑制和噬菌体Mu Gam蛋白以更高效率和产物纯度产生C:G-到-T:A碱基编辑器(Improved baseexcision repair inhibition and bacteriophage Mu Gam protein yields C:G-to-T:Abase editors with higher efficiency and product purity)”《科学进步(ScienceAdvances)》3:eaao4774(2017)和Rees,H.A.等人,“碱基编辑：活细胞基因组和转录组的精确化学(Base editing:precision chemistry on the genome and transcriptome ofliving cells)”.《遗传学自然评论(Nat Rev Genet.)》2018年12月；19(12):770-788.doi:10.1038/s41576-018-0059-1，所述文献的全部内容通过引用并入本文。

碱基编辑活性：“碱基编辑活性”是指化学改变多核苷酸内的碱基(例如，通过使碱基脱氨基)。在一个实施例中，第一碱基转化为第二碱基。在一个实施例中，所述碱基编辑活性是胞苷脱氨酶活性，例如将靶标C·G转化为T·A。在另一个实施例中，所述碱基编辑活性是腺苷或腺嘌呤脱氨酶活性，例如将A·T转化为G·C。在另一个实施例中，所述碱基编辑活性是胞苷脱氨酶活性，例如将靶标C·G转化为T·A和腺苷或腺嘌呤脱氨酶活性，例如将A·T转化为G·C。

碱基编辑器***：术语“碱基编辑器***”是指用于编辑靶核苷酸序列的核碱基的***。在各个实施例中，所述碱基编辑器(BE)***包括(1)多核苷酸可编程核苷酸结合结构域(例如，Cas9)、脱氨酶结构域和胞苷脱氨酶结构域，其用于将靶核苷酸序列中的核碱基脱氨基；以及(2)一种或多种向导多核苷酸(例如，向导RNA)与多核苷酸可编程核苷酸结合结构域结合。在各个实施例中，碱基编辑器(BE)***包括选自腺苷脱氨酶或胞苷脱氨酶的核碱基编辑器结构域，以及具有核酸序列特异性结合活性的结构域。在一些实施例中，碱基编辑器***包括(1)碱基编辑器(BE)，所述碱基编辑器包括多核苷酸可编程DNA结合结构域和脱氨酶结构域，其用于将靶核苷酸序列中的一个或多个核碱基脱氨基；以及(2)一种或多种向导RNA与多核苷酸可编程DNA结合结构域结合。在一些实施例中，所述多核苷酸可编程核苷酸结合结构域是多核苷酸可编程DNA结合结构域。在一些实施例中，所述碱基编辑器是胞苷碱基编辑器(CBE)。在一些实施例中，所述碱基编辑器是腺嘌呤或腺苷碱基编辑器(ABE)。在一些实施例中，所述碱基编辑器是腺嘌呤或腺苷碱基编辑器(ABE)或胞苷碱基编辑器(CBE)。

生物活性：如本文所用，短语“生物活性”是指在生物***中，特别是在生物体中具有活性的任何药剂的特性。例如，当施用于生物体时对所述生物体具有生物效应的药剂被视为是生物活性的。在特定实施例中，当肽具有生物活性时，所述肽的共享肽的至少一种生物活性的部分通常被称为“生物活性”部分。

切割：如本文所用，切割是指由本文所述的CRISPR***的核酸酶产生的靶核酸中的断裂。在一些实施例中，切割事件是双链DNA断裂。在一些实施例中，切割事件是单链DNA断裂。在一些实施例中，切割事件是单链RNA断裂。在一些实施例中，切割事件是双链RNA断裂。

互补：“互补”或“互补性”是指核酸可以通过传统的沃森-克里克碱基配对(Watson-Crick base pairing)或霍氏碱基配对(Hoogsteen base pairing)与另一个核酸序列形成氢键。互补碱基配对不仅包含G-C和A-T碱基配对，而且还包含涉及如肌苷等通用碱基的碱基配对。互补性百分比指示可以与第二核酸序列(例如，与具有10个核苷酸的第二核酸序列配对的第一寡核苷酸中总共10个核苷酸中的5个、6个、7个、8个、9个或10个核苷酸表示50％、60％、70％、80％、90％和100％分别互补)形成氢键(例如，沃森-克里克碱基配对)的核酸分子中的连续残基的百分比。为了确定百分比互补性至少为某个百分比，计算核酸分子中可以与第二个核酸序列形成氢键(例如，沃森-克里克碱基配对)的连续残基的百分比并四舍五入到最接近的整数(例如，与具有23个核苷酸的第二核酸序列配对的第一寡核苷酸中总共23个核苷酸中的12个、13个、14个、15个、16个或17个核苷酸分别表示52％、57％、61％、65％、70％和74％；并且分别具有至少50％、50％、60％、60％、70％和70％的互补性)。如本文所用，“基本上互补”是指链之间的互补性，使得所述链能够在生物条件下杂交。基本上互补的序列具有60％、70％、80％、90％、95％或甚至100％的互补性。另外，通过检查两条链的核苷酸序列来确定所述两条链是否能够在生物条件下杂交的技术在本领域中是众所周知的。

成簇间隔短回文重复序列(CRISPR)相关(Cas)***：如本文所用，CRISPR-Cas9***是指参与CRISPR效应子的表达或指导CRISPR效应子活性的核酸和/或蛋白质，包含编码CRISPR效应子的序列、RNA向导以及来自CRISPR基因座的其它序列和转录物。在一些实施例中，CRISPR***是经工程化、非天然存在的CRISPR***。在一些实施例中，CRISPR***的组分可以包含编码***的一种或多种组分的核酸(例如，载体)、蛋白质形式的组分或其组合。

CRISPR阵列：如本文所用，术语“CRISPR阵列”是指包含CRISPR重复序列和间隔子的核酸(例如，DNA)区段，所述区段从第一个CRISPR重复的第一个核苷酸开始并且到最后一个(末端)CRISPR重复的最后一个核苷酸结束。通常，CRISPR阵列中的每个间隔子位于两个重复序列之间。如本文所用，术语“CRISPR重复序列”或“CRISPR同向重复序列”或“同向重复序列”是指多个短的同向重复序列，所述短的直接重复序列在CRISPR阵列内显示非常少或无序列变异。

CRISPR相关蛋白(Cas)：如本文所用，术语“CRISPR相关蛋白”、“CRISPR效应子”、“效应子”或“CRISPR酶”是指执行酶活性和/或结合由RNA向导指定的核酸上的靶位点的蛋白。在不同实施例中，CRISPR效应子具有内切核酸酶活性、切口酶活性、核酸外切酶活性、转座酶活性和/或切除活性。在其它实施例中，所述CRISPR效应子是核酸酶失活的。

crRNA：如本文所用，术语“CRISPR RNA”或“crRNA”是指包含由CRISPR效应子用于靶向特定核酸序列的向导序列的RNA分子。通常，crRNA含有介导靶识别的序列和与tracrRNA形成双链体的序列。在一些实施例中，crRNA:tracrRNA双链体与CRISPR效应子结合。

双链体：如本文所用，“双链体”是指由两条单链核酸相互作用形成的双螺旋结构。双链体通常由碱基的成对氢键键合，即两个单链核酸之间的“碱基配对”形成，所述两个单链核酸彼此反向平行。双链体中的碱基配对通常通过沃森-克里克碱基配对发生，例如，在DNA和RNA中鸟嘌呤(G)与胞嘧啶(C)形成碱基对，在DNA中腺嘌呤(A)与胸腺嘧啶(T)形成碱基对，以及在RNA中腺嘌呤(A)与尿嘧啶(U)形成碱基对。碱基对可以形成的条件包含生理或生物学相关条件(例如，细胞内：pH 7.2、140mM钾离子；细胞外pH 7.4、145mM钠离子)。此外，通过堆叠相邻核苷酸之间的相互作用来稳定双链体。如本文所用，可以通过碱基配对或堆叠相互作用建立或维持双链体。双链体由两条互补的核酸链形成，所述核酸链可以是基本上互补的或完全互补的。在多个碱基上碱基配对的单链核酸被称为“杂交”。

离体：如本文所用，术语“离体”是指在细胞或组织中发生的事件，所述细胞或组织在多细胞生物体外而不是在多细胞生物体内生长。

功能等同物或类似物：如本文所用，术语“功能等同物”或“功能类似物”在氨基酸序列的功能衍生物的上下文中表示保留与原始序列的生物活性(功能或结构)基本上相似的生物活性的分子。功能衍生物或等同物可以是天然衍生物或是合成制备的。示例性功能衍生物包含具有一个或多个氨基酸的取代、缺失或添加的氨基酸序列，条件是蛋白质的生物活性是保守的。取代氨基酸理想地具有与所述取代氨基酸相似的化学物理性质。理想的相似化学物理性质包含电荷、体积、疏水性、亲水性等的相似性。

半衰期：如本文所用，术语“半衰期”是量(如蛋白浓度或活性)下降到其在时间段开始时测量的值的一半所需的时间。

杂交：“杂交”意指在各种严格条件下在互补多核苷酸序列(例如，本文所述的基因)或其部分之间形成双链分子。(参见例如Wahl,G.M.和S.L.Berger(1987)《酶学方法(Methods Enzymol.)》152:399；Kimmel,A.R.(1987)《酶学方法》152:507)。杂交通过互补核碱基之间的氢键键合发生，所述氢键键合可以是沃森-克里克、霍氏或反向霍氏氢键键合。例如，腺嘌呤和胸腺嘧啶是通过氢键的形成进行配对的互补核碱基。

改善、增加或减少：如本文所用，术语“改善”、“增加”或“减少”或其语法等效物表示相对于基线测量值的值，所述基线测量值如在开始本文所述的治疗之前在同一个体中的测量值，或在不存在本文所述的治疗的情况下在对照受试者(或多个对照受试者)中的测量值。“对照受试者”是患有与正在治疗的受试者相同形式的疾病的受试者，所述受试者与正在接受治疗的受试者的年龄大致相同。

Indel：如本文所用，术语“Indel”是指核酸序列中碱基的***或缺失。它通常会导致突变并且是遗传变异的一种常见形式。

抑制：如本文所用，术语“抑制(inhibition)”、“抑制(inhibit)”和“抑制(inhibiting)”是指减少或降低所关注的蛋白质或基因的活性和/或表达的过程或方法。通常，抑制蛋白质或基因是指将蛋白质或基因的表达或相关活性降低至少10％或更多，例如，20％、30％、40％或50％、60％、70％、80％、90％或更多，或表达或相关活性降低大于1倍、2倍、3倍、4倍、5倍、10倍、50倍、100倍或更多，如通过本文所述或本领域公认的一种或多种方法测量的。

体外：如本文所使用的，术语“体外”是指发生在人工环境，例如测试管或反映器皿中、细胞培养基等中而不是多细胞生物体内的事件。

体内：如本文所用，术语“体内”是指在多细胞生物体如人或非人动物内发生的事件。在基于细胞的***的上下文中，术语可以用于指在活细胞内发生的事件(例如与体外***相反)。

寡核苷酸：如本文所用，术语“寡核苷酸”通常是指单链或双链DNA的介于约5与约100个核苷酸之间的多核苷酸。寡核苷酸也称为“寡聚物(oligomer)”或“寡聚物(oligo)”，并且可以从基因中分离出来，或化学合成。

PAM：术语“PAM”或“原型间隔子相邻基序”是指短核酸序列(长度通常为2-6个碱基对)，所述序列位于如CRISPR-Cas9等CRISPR***所靶向切割的核酸区域之后。Cas核酸酶切割可能需要PAM并且通常在切割位点下游3-4个核苷酸处发现PAM。

多肽：如本文所用，术语“多肽”是指通过肽键连接在一起的连续氨基酸链。所述术语用于指任何长度的氨基酸链，但本领域普通技术人员将理解所述术语不限于长链并且可以指包括通过肽键连接在一起的两个氨基酸的最小链。如本领域技术人员所知，可以加工和/或修饰多肽。如本文所用，术语“多肽”和“肽”可互换使用。

预防：如本文所用，当与疾病、病症和/或病状的发生结合使用时，术语“预防(prevent)”或“预防(prevention)”是指降低发生疾病、病症和/或病状的风险。

引导编辑向导RNA：术语“引导编辑向导RNA”或“pegRNA”是指一种既指定靶位点又编码期望的编辑的向导RNA。引导编辑向导RNA(pegRNA)在本领域中是已知的并且先前已经例如在Anzalone A.V.,“搜索和替换基因组编辑而无需双链断裂或供体DNA(Search-and-replace genome editing without double-strand breaks or donor DNA)”《自然》.2019年10月21日.doi:10.1038/s41586-019-1711-4中进行了描述，所述文献的全部内容通过引用并入本文。

蛋白质：如本文所用，术语“蛋白质”是指一种或多种用作离散单位的多肽。如果单个多肽是离散功能单位并且不需要与其它多肽永久或临时物理结合以形成离散功能单位，则术语“多肽”和“蛋白质”可以互换使用。如果离散功能单位由多于一种物理上彼此缔合的多肽组成，则术语“蛋白质”是指物理偶联并作为离散单位一起发挥作用的多种多肽。

参考：“参考”实体、***、数量、条件集合等是与本文所述的测试实体、***、数量、条件集合等进行比较的实体、***、数量、条件集合等。例如，在一些实施例中，“参考”抗体是如本文所述未经工程化的对照抗体。

RNA向导：术语RNA向导是指促进本文所述的蛋白质靶向靶核酸的RNA分子。示例性“RNA向导”或“向导RNA”包含但不限于crRNA或crRNA与同源tracrRNA的组合。后者可能是独立的RNA或使用连接子(sgRNA)融合为单个RNA。在一些实施例中，RNA向导经工程化以包含化学或生物化学修饰。在一些实施例中，RNA向导可以包含一个或多个核苷酸。

夹板链(Splint)：术语“夹板链”是指是指能够与至少两个、三个或更多个单链RNA核苷酸杂交的单链RNA或DNA或其它聚合物。

受试者：如本文所用，术语“受试者”是指需要对其进行诊断、预后或治疗的任何受试者。例如，受试者可以是哺乳动物，例如人或非人灵长类动物(如猿、猴、猩猩或黑猩猩)、狗、猫、豚鼠、兔、大鼠、小鼠、马、牛或奶牛。

sgRNA：术语“sgRNA”、“单向导RNA”或“向导RNA”是指含有(i)向导序列(crRNA序列)和(ii)Cas9核酸酶募集序列(tracrRNA)的单向导RNA。

基本同一性：短语“基本同一性”在本文中用于指氨基酸或核酸序列之间的比较。如本领域普通技术人员将理解的，如果两个序列在对应位置含有相同残基，则它们通常被认为是“基本上相同的”。如本领域所熟知的，可以使用多种算法中的任何一种来比较氨基酸或核酸序列，所述算法包含商业计算机程序中可用的那些，如用于核苷酸序列的BLASTN和用于氨基酸序列的BLASTP、有空位的BLAST和PSI-BLAST。此类示例性程序在以下中描述：Altschul等人,基本局部比对搜索工具,《分子生物学杂志(J.Mol.Biol.)》,215(3):403-410,1990；Altschul等人,《酶学方法(Methods in Enzymology)》；Altschul等人,《核酸研究(Nucleic Acids Res.)》25:3389-3402,1997；Baxevanis等人,《生物信息学：基因和蛋白质分析的实用指南(Bioinformatics:A Practical Guide to the Analysis of Genesand Proteins)》,威利公司(Wiley),1998；和Misener等人,(编辑),《生物信息学方法和方案(Bioinformatics Methods and Protocols)》(《分子生物学方法(Methods inMolecular Biology)》,第132卷),胡马纳出版社(Humana Press),1999。除了鉴定相同序列之外，上述程序通常提供对同一性程度的指示。在一些实施例中，如果在相关延伸段的残基上至少50％、55％、60％、65％、70％、75％、80％、85％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或更多的对应残基相同，则认为两个序列基本上相同。在一些实施例中，所述相关延伸段是完整序列。在一些实施例中，所述相关延伸段为至少10、15、20、25、30、35、40、45、50、55、60、65、70、75、80、85、90、95、100、125、150、175、200、225、250、275、300、325、350、375、400、425、450、475、500个或更多个残基。

靶核酸：如本文所用，术语“靶核酸”是指CRISPR-Cas9***结合到的任何长度的核苷酸(寡核苷酸或多核苷酸)，脱氧核糖核苷酸、核糖核苷酸或其类似物。靶核酸可以具有三维结构，可以包含编码区或非编码区，可以包含外显子、内含子、mRNA、tRNA、rRNA、siRNA、shRNA、miRNA、核酶、cDNA、质粒、载体、外源序列、内源序列。靶核酸可以包括经修饰的核苷酸，所述经修饰的核苷酸包含甲基化核苷酸或核苷酸类似物。靶核酸可以散布有非核酸组分。靶核酸不限于单链、双链或多链DNA或RNA、基因组DNA、cDNA、DNA-RNA杂交体或包括嘌呤和嘧啶碱基或其它天然的、经化学或生化修饰的、非天然的或衍生的核苷酸碱基的聚合物。

治疗有效量：如本文所用，术语“治疗有效量”是指以适用于任何医学治疗的合理益处/风险比赋予经治疗受试者治疗效果的治疗性分子(例如，本文描述的经工程化的抗体)的量。治疗效果可以是客观的(即，可通过某一测试或标志物测量)或主观的(即，受试者给出效果的指示或感受到效果)。具体地，所述“治疗有效量”是指有效治疗、改善或预防特定疾病或病状，或表现出可检测的治疗或预防作用的治疗性分子或组合物的量，如通过改善与疾病相关的症状、预防或延迟疾病发作，和/或还减轻疾病症状的严重性或频率。可以在可以包括多个单位剂量的给药方案中施用的治疗有效量。对于任何特定的治疗性分子，治疗有效量(和/或有效给药方案内的适当单位剂量)可以变化，例如，取决于施用途径，以及与其它药剂的组合。此外，任何特定受试者的特定治疗有效量(和/或单位剂量)可能取决于多种因素，包含所治疗的病症和病症的严重程度；所采用的特定药剂的活性；所采用的特定组合物；受试者的年龄、体重、总体健康状况、性别和饮食；施用时间、施用途径和所采用的特定治疗性分子的***率或代谢率；治疗的持续时间；以及医学领域众所周知的类似因素。

tracrRNA：如本文所用，术语“tracrRNA”或“反式激活crRNA”是指包含形成CRlSPR相关蛋白结合特定靶核酸所需结构的序列的RNA。

治疗：如本文所用，术语“治疗(treatment)”(还有“治疗(treat/treating)”是指施用治疗性分子(例如，本文所述的CRISPR-Cas治疗性蛋白或***)，所述治疗性分子部分或完全减轻、改善、缓解、抑制疾病、病症和/或病状的一种或多种症状或特征，延迟疾病、病症和/或病状的一种或多种症状或特征的发作，降低疾病、病症和/或病状的一种或多种症状或特征的严重程度和/或降低疾病、病症和/或病状的一种或多种症状或特征的发病率。此治疗可以是针对未出现相关疾病、病症和/或病状的病征的受试者和/或针对出现疾病、病症和/或病状的早期病征的受试者。可替代地或另外，此治疗可以是针对出现相关疾病、病症和/或病状的一种或多种确定病征的受试者。

附图说明

附图仅用于说明目的；而非用于限制。

图1是示出合成RNA的标准化学合成的示意图。合成RNA通常通过在固体支撑物上进行序列控制聚合来合成。化学合成以循环方式进行，每个循环包括如图1示意图所展示的各个步骤。

图2是示出sgRNA与靶DNA序列相互作用的一般示意图。所述示意图展示了sgRNA中存在的各种基序，包含间隔子区域、由下部茎、四环和凸起区域构成的茎环、连结基序和一系列发夹基序。

图3，小图A示出了使用基于连接的方法合成sgRNA的两种通用方法。在一种方法(1)中，连接发生在茎环的环部分处。在第二种方法(2)中，连接发生在茎环的螺旋处。在每种方法中，茎环都被延伸并用于缔合用于酶促连接的区段。图3，小图B描绘了示意性HPLC图，所述HPLC图示出了RNA片段与通过连接所述片段产生的gRNA之间的分离，所述分离由峰表示。连接后，使用HPLC进行最终纯化步骤以去除未连接的RNA片段。从全长产物(FLP)中完全分离RNA片段是可能的。

图4是示出了用于药物合成的典型点击化学反应实例的示意图。先前的方法使用化学连接，使用“点击化学”将RNA片段组合成全长sgRNA。

图5，小图A-C描绘了用于酶促连接的各种底物。图5，小图A描绘了在夹板链上缔合的两个RNA寡聚物。在这种情况下，切口(例如，第一RNA与第二RNA之间的连接点)将被连接酶密封，从而形成天然的磷酸二酯骨架连接。图5，小图B描绘了彼此具有部分互补性的两个RNA寡聚物，以及一起形成茎环结构的碱基对。可以在茎环的环区段高效地进行酶促连接。图5，小图C描绘了与夹板链碱基配对的两个RNA。连接可以在各种RNA缔合中进行，并且可以在不需要预缔合的情况下进行。

图6，小图A描绘了与最常用的sgRNA相关的序列和配置。图6，小图B示出了两个代表性的RNA序列和用于环连接的相关连接位点。图6，小图C示出了两个代表性的RNA序列和用于螺旋连接的连接位点。序列如下：

小图A：

XXXXXXXXXXXXXXXXXXXXGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAG

GCUAGUCCGUUAUCAACUUGAAAAAGUGGGACCGAGUCGGUGCAGACUUCUCCA

CAGGAGUCAGGUGCAC

小图B：

XXXXXXXXXXXXXXXXXXXXGUUUUAGAGCUAUGCUGUCUUGCUCGA

pUACAAGACAGCAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUU

小图C：

XXXXXXXXXXXXXXXXXXXXGUUUUAGAGCUAUGCUGU

pCUUGGAAACAAGACAGCAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUU

其中X是任何核苷酸并且“p”表示游离磷酸酯，其中所述RNA未共价连接，如图所示。

图7，小图A描绘了连接实验中使用的片段序列。示出了受体和供体序列两者。碱基代码：A，腺苷；G，鸟苷；U，尿苷；C，胞苷；mA，2'-O-甲基-腺苷；mU，2'-O-甲基-尿苷；mC，2'-O-甲基-胞苷；pC，5'-磷酸化胞苷。小图B示出了预连接复合物的建议结构。示出了受体和供体序列，并且受体和供体序列对应于图7小图A中所示的受体和供体序列。磷酸酯以圆表示。小图C示出了色谱图，所述色谱图示出了：1，受体片段；2，供体片段；3，受体和供体片段与T4RNA连接酶2反应的产物。反应含有10μM供体片段、10μM受体片段、40μL 1x T4 RNA连接酶2反应缓冲液(NEB)和20单位的T4 RNA连接酶2，并在37℃下进行。

图8，小图A描绘了RNA供体1(Dnr-01)、RNA受体1(Acp-01)设计和连接复合物的RNA片段设计。Dnr-01和Acp-01序列在表4中示出。字母“P”表示磷酸酯和连接的位置。图8，小图B描绘了Acp-1和Dnr-1在有和没有T4 RNA连接酶2的情况下反应的HPLC色谱图。“FLP”表示“全长产物”。

图9，小图A描绘了RNA受体2(Acp-02)、RNA供体2(Dnr-02)和连接复合物的RNA片段设计。字母“P”表示磷酸酯和连接的位置。图9，小图B描绘了Acp-02和Dnr-02在有和没有连接酶T4 RNA连接酶1的情况下反应的HPLC色谱图。Acp-02和Dnr-02序列在表4中示出。“FLP”表示“全长产物”。

图10，小图A描绘了RNA受体3(Acp-03)、RNA供体3(Dnr-03)和连接复合物的RNA片段设计。字母“P”表示磷酸酯和连接的位置。图10，小图B描绘了Acp-03和Dnr-03在有和没有T4 RNA连接酶2的情况下反应的HPLC色谱图。图10，小图C描绘了RNA受体4(Acp-04)、RNA供体4(Dnr-04)和连接复合物的片段设计。字母“P”表示连接位点的位置。图10，小图D描绘了RNA受体4(Acp-04)和RNA供体4(Dnr-04)在有和没有T4 RNA连接酶2的情况下反应的HPLC色谱图。Acp-03和Dnr-03序列在表4中示出。“FLP”表示“全长产物”。

图11，小图A描绘了RNA受体5(Acp-05)、RNA供体5(Dnr-05)和连接复合物的RNA片段设计。字母“P”表示连接位点的位置。图11，小图B描绘了Acp-05和Dnr-05在有和没有连接酶2的情况下反应的HPLC色谱图。图11，小图C描绘了RNA受体6(Acp-06)、RNA供体6(Dnr-06)和连接复合物的RNA片段设计。字母“P”表示连接位点的位置。图11，小图D描绘了Acp-06和Dnr-06在有和没有T4 RNA连接酶2的情况下反应的HPLC色谱图。Acp-05和Dnr-05序列在表4中示出。字母“P”表示连接位点的位置。“FLP”表示“全长产物”。

图12，小图A描绘了RNA受体7(Acp-07)、RNA供体7(Dnr-07)和连接复合物的片段设计。字母“P”表示连接位点的位置。图12，小图B描绘了Acp-07和Dnr-07在有和没有T4 RNA连接酶2的情况下反应的HPLC色谱图。Acp-07和Dnr-07序列在表4中示出。“FLP”表示“全长产物”。反应中产生的副产物用“*”标记。

图13是示出作为起始片段浓度(g/L)函数的反应产率(“FLP”)的图。对于这些研究，使用了RNA受体5/RNA供体5(Acp/Dnr-05)和RNA受体6/RNA供体6(Acp/Dnr-6)。“FLP”表示“全长产物”。

图14，小图A描绘了以下广泛修饰的片段的片段设计：RNA受体8(Acp-08)、RNA供体8(Dnr-08)和连接复合物。Acp-08和Dnr-08序列在表4中示出。小图A中突出显示/阴影的核苷酸表示用2'-O-甲基修饰的位置。字母“P”表示连接位点的位置。图14，小图B描绘了这些反应的HPLC色谱图。字母“P”表示磷酸酯和连接的位置。图14，小图B示出了在存在(实线)和不存在(虚线)连接酶(T4 RNA连接酶2)的情况下反应的色谱图。“FLP”表示全长产物。

图15是示出使用腺嘌呤碱基编辑器(ABE)和使用自模板连接方法合成的三种向导RNA(AD-08、AD-05、AD-06)之一的成纤维细胞中编辑百分比的图。

图16是示出外村尚芽孢杆菌(Bacillus hisashii)bhCas12b sgRNA的序列和二级结构的示意图。所述示意图示出了标记为“A”、“B”和“C”的区域，所述区域表示可以作为***sgRNA的位置靶向的发夹环结构。序列中的字母“N”表示任何核碱基。

具体实施方式

本发明提供了产生合成RNA的方法。任何合成RNA都可以用本文所述的方法产生。例如，在一些实施例中，所提供的连接方法可以用于产生向导RNA(gRNA)，当与定点修饰多肽如Cas9、Cpf1、SaCas、Cas12、Cas13、碱基编辑器和引导编辑器等一起使用时，所述向导RNA(gRNA)可用于修饰靶DNA或RNA中的特定基因座。本发明人惊奇地发现了一种由RNA片段产生gRNA的方法，所述方法使得产生的gRNA具有高纯度、完整性和最终(纯化后)产率。

在以下部分中详细描述了本发明的各个方面。部分的使用并不旨在限制本发明。每个部分可以适用于本发明的任何方面。在本申请中，除非另外说明，否则“或者”的使用是指“和/或”。

向导RNA(gRNA)

gRNA包括与靶序列互补的多核苷酸序列。gRNA与靶核酸序列杂交并指导CRISPR复合物与靶核酸的序列特异性结合。在一些实施例中，RNA向导与靶核酸序列具有50％、60％、70％、75％、80％、85％、90％、95％、96％、97％、98％、99％或100％的互补性。

在一些实施例中，本发明的gRNA介于约50个核苷酸与250个核苷酸之间。因此，在一些实施例中，本发明的gRNA的长度为约50、55、60、65、70、75、80、85、90、95、100、105、110、115、120、125、130、135、140、145、150、155、160、165、170、175、180、185、190、195、200、205、210、215、220、225、230、235、240、245或250个核苷酸。在一些实施例中，所述gRNA的长度介于约50与75个核苷酸之间。在一些实施例中，所述gRNA的长度介于约75与100个核苷酸之间。在一些实施例中，所述gRNA的长度介于约100与125个核苷酸之间。在一些实施例中，所述gRNA的长度介于约125与150个核苷酸之间。在一些实施例中，所述gRNA的长度介于约150与175个核苷酸之间。在一些实施例中，所述gRNA的长度介于约175与200个核苷酸之间。在一些实施例中，所述gRNA的长度介于约200与225个核苷酸之间。在一些实施例中，所述gRNA的长度介于约225与250个核苷酸之间。在一些实施例中，所述gRNA是“引导编辑向导RNA”或“pegRNA”。参见Anzalone等人,《自然》,2019年10月21日，所述文献的内容通过引用并入本文。

在一些实施例中，所述gRNA包括连接的crRNA和tracrRNA。各种crRNA和tracrRNA序列是本领域已知的，例如与几种II型CRISPR-Cas9***(例如，WO2013/176772)、Cpf1、SaCas、Cas12和引导编辑Cas等相关的那些。

可以设计gRNA以靶向任何靶序列。使用用于比对序列的任何算法确定最佳比对，所述算法包含尼德曼-翁施算法(Needleman-Wunsch algorithm)、史密斯-沃特曼算法(Smith-Waterman algorithm)、伯罗斯-惠勒算法(Burrows-Wheeler algorithm)、ClustlW、ClustlX、BLAST、Novoalign、SOAP、Maq和ELAND。

在一些实施例中，gRNA被设计成靶向细胞基因组内的独特靶序列。在一些实施例中，gRNA被设计成缺少PAM序列。在一些实施例中，使用包含mFold或Geneious在内的折叠算法将gRNA序列设计成具有最佳二级结构。在一些实施例中，gRNA的表达可以在诱导型启动子下进行，例如激素诱导型、四环素或强力霉素诱导型、***糖诱导型或光诱导型。

在一些实施例中，所述gRNA序列是“死crRNA”、“死向导”或“死向导序列”，它们可以与CRISPR相关蛋白形成复合物并结合特定靶标而没有任何实质性核酸酶活性。

在一些实施例中，所述gRNA在糖磷酸骨架或碱基中被化学修饰。在一些实施例中，所述gRNA具有以下修饰中的一个或多个修饰：2'O-甲基、2'-F或锁核酸，以提高核酸酶抗性或碱基配对。在一些实施例中，所述gRNA可以含有经修饰的碱基，如2-硫脲二烯或N6-甲基腺苷。

在一些实施例中，所述gRNA与其它寡核苷酸、肽、蛋白质、标签、染料或聚乙二醇缀合。

在一些实施例中，所述gRNA包含适体或核糖开关序列，所述核糖开关序列由于三维结构而结合特定的靶分子。

在一些实施例中，所述环形成序列的长度为3、4、5或更多个核苷酸。在一些实施例中，所述环具有序列GAAA、AAAG、CAAA和/或AAAC。

在一些实施例中，gRNA具有两个、三个、四个或五个发夹。

在一些实施例中，gRNA包含转录终止序列，所述序列包含包括六个核苷酸的polyT序列。

合成向导RNA的产生

本文描述了一种制备合成RNA，如向导RNA(gRNA)的方法。所述方法产生具有高完整性和产率的合成RNA，如gRNA。

本文所述的连接策略不同于先前报道的用于合成如gRNA等合成RNA的化学连接策略，因为所述策略在连接位点处形成天然磷酸键。使用分段合成方法(如本文所述)的优势在于，与全长gRNA相比，可以在纯化后以更高的纯度产生RNA的短区段。在这种方法中，5'受体是最小的RNA片段(约30-50nts)，并且因此可以在连接前纯化到高水平。3'供体以合成所需的磷酸酯终止，并且因此只有全长片段将被掺入全长产物中(即，截短不是底物)。

当考虑大于100nts的gRNA，如pegRNA或Cas12b向导时，本文所述的方法的优势会增加。本文所述的酶促连接类型产率非常高(>80％)，并且寡核苷酸起始材料可以高选择性地与连接产物分离，从而确保全长产物非常纯。这些类型的酶促连接相对便宜且规模良好。

用于产生合成gRNA的自模板方法

在一些方面，制备合成gRNA的方法包括：提供具有互补性的第一RNA和第二RNA，其中互补性允许碱基配对和在第一RNA与第二RNA之间产生茎环；用连接酶将第一RNA和第二RNA在茎环内连接，从而产生合成gRNA。这允许使用在第一RNA与第二RNA之间形成的螺旋或其它结构来模板化两个RNA的酶促连接。在一些实施例中，修饰第一RNA与第二RNA之间形成的结构的长度和序列组成以促进非共价组装并为与RNA连接相容的酶创建最佳连接位点。

第一RNA和第二RNA的核苷酸延伸段之间的互补性可以是部分的或完全的。所述互补性允许互补核苷酸之间的碱基配对。在存在部分互补性的区域中，错配的核苷酸会导致第一RNA与第二RNA分子之间形成凸起或环结构。基于第一RNA与第二RNA分子之间的杂交，可以在所述两个RNA分子之间形成各种结构。可以在第一RNA与第二RNA分子之间形成的示例性结构在图2中展示。所述两个RNA分子之间的连接可以发生在茎、螺旋、环、突出端、平端或凸起处。

使用这种方法，合成的第一RNA在5'-末端具有磷酸酯(称为供体)，所述末端通过多种连接酶之一连接到包括可变原型间隔子区域的第二RNA(称为受体)的3'-末端。

在一些实施例中，使用这种方法连接两个或更多个RNA片段。例如，在一些实施例中，使用自模板方法连接2个、3个、4个、5个、6个、7个、8个、9个、10个或更多个RNA片段。因此，在一些实施例中，产生合成RNA的自模板方法包括：提供两个或更多个RNA片段；提供与所述两个或更多个RNA片段具有部分互补性的寡核苷酸，其中所述寡核苷酸的所述互补性允许与所述两个或更多个RNA片段进行碱基配对；以及提供连接酶以催化所述两个或更多个RNA片段之间的连接，从而产生合成向导RNA。

各种连接酶可以与本文所述的方法一起使用。例如，可以使用T4 RNA连接酶1、T4RNA连接酶2、RtcB连接酶、热稳定性5'App DNA/RNA连接酶、ElectroLigase、T4DNA连接酶、T3 DNA连接酶、T7 DNA连接酶、Taq DNA连接酶、SplintR连接酶、大肠杆菌DNA连接酶、9°NDNA连接酶、CircLigase、CircLigase II、DNA连接酶I、DNA连接酶III和DNA连接酶IV中的一种或多种。在一些实施例中，T4 RNA连接酶1用于在末端环处连接第一RNA和第二RNA。在一些实施例中，T4 RNA连接酶2用于在第一RNA与第二RNA之间形成的茎内连接第一RNA和第二RNA。

使用这种方法可以进行各种连接，如在第一RNA与第二RNA之间形成的发夹的末端环内进行连接。各种连接酶都适合在形成的发夹的末端环处进行连接，如T4 RNA连接酶1。这种方法可能实现的另一种连接是在第一RNA与第二RNA之间形成的双链体内的连接。各种连接酶都适用于在两个RNA之间形成的双链体处进行连接，如T4 RNA连接酶2和DNA连接酶。

在一些实施例中，第一RNA是反式激活RNA(tracrRNA)，并且第二RNA是成簇规律间隔短回文重复序列(CRISPR)RNA(crRNA)。

在一些实施例中，第一RNA的长度介于约10到约100个核苷酸之间。因此，在一些实施例中，第一RNA的长度介于约10与25个核苷酸之间。在一些实施例中，第一RNA的长度介于约25与40个核苷酸之间。在一些实施例中，第一RNA的长度介于约40与45个核苷酸之间。在一些实施例中，第一RNA的长度介于约45与60个核苷酸之间。在一些实施例中，第一RNA的长度介于约60与75个核苷酸之间。在一些实施例中，第一RNA的长度介于约75与90个核苷酸之间。在一些实施例中，第一RNA的长度介于约90与100个核苷酸之间。

在一些实施例中，第二RNA的长度介于约10与约100个核苷酸之间。因此，在一些实施例中，第二RNA的长度介于约10与25个核苷酸之间。在一些实施例中，第二RNA的长度介于约25与40个核苷酸之间。在一些实施例中，第二RNA的长度介于约40与45个核苷酸之间。在一些实施例中，第二RNA的长度介于约45与60个核苷酸之间。在一些实施例中，第二RNA的长度介于约60与75个核苷酸之间。在一些实施例中，第二RNA的长度介于约75与90个核苷酸之间。在一些实施例中，第二RNA的长度介于约90与100个核苷酸之间。

合成RNA产生中的夹板链模板法

在一些实施例中，在合成RNA的产生中使用夹板链。使用夹板链允许一个或多个RNA分子在物理上接近，以使用夹板链作为模板进行反应。当要连接多于两个RNA时，使用夹板链有助于合成RNA的产生。

所述夹板链可以是能够使一个或多个RNA分子紧密靠近的任何合适的聚合物。例如，在一些实施例中，所述夹板链是RNA分子或DNA分子。

在一些实施例中，所述夹板链与第一RNA和第二RNA的区段具有互补性。所述互补性可以是部分的或完全的。因此，在一些实施例中，提供了产生合成RNA如向导RNA的方法，所述方法包括：提供包括5'磷酸酯的第一RNA；提供包括游离3'-羟基的第二RNA；提供与所述第一RNA和所述第二RNA具有部分互补性的寡核苷酸，其中所述寡核苷酸的所述互补性允许与所述第一RNA和所述第二RNA进行碱基配对；以及提供连接酶以催化所述第一RNA与所述第二RNA之间的连接，从而产生gRNA。

在一些实施例中，所述夹板链与将要偶联的第一RNA和第二RNA的区段没有互补性。因此，在一些实施例中，提供了产生合成RNA如向导RNA的方法，所述方法包括：提供包括5'磷酸酯的第一RNA；提供包括游离3'-羟基的第二RNA；提供与将被偶联的第一RNA和第二RNA的核苷酸不具有互补性的寡核苷酸；以及提供连接酶以催化所述第一RNA与所述第二RNA之间的连接，从而产生gRNA。

用于产生合成RNA的非模板方法

在一些实施例中，非模板方法用于产生合成RNA，如向导RNA。

在非模板方法的一些实施例中，提供具有5'磷酸酯(如5'单磷酸酯)的第一RNA，并且提供包括封闭的3'端(如封闭的3'OH)的第二RNA。封闭第二RNA的3'OH的目的是使第二RNA在发生连接时不能通过非模板机制环化。例如，使用这种非模板方法可以包括第二RNA，所述第二RNA包括化学封闭或去除的供体分子3'末端的3'羟基(例如，双脱氧核苷酸)，并且酶(特别是通过T4 RNA连接酶1)将催化第一RNA与第二RNA之间的适当连接。在一些实施例中，此连接策略是在高浓度下进行的。

因此，在一些方面，产生合成RNA的非模板方法包括：提供包括5'-单磷酸酯的第一RNA；提供包括封闭3'端的第二RNA；以及提供连接酶以催化所述第一RNA与所述第二RNA之间的连接，从而产生gRNA。

经化学修饰的RNA

在一些实施例中，第一RNA和/或第二RNA包括对其骨架或其一个或多个碱基的化学修饰。例如，经化学修饰的RNA可以包含化学合成，所述化学合成可以用于安装高度修饰的单体，所述单体包含经修饰的糖、碱基、骨架或不类似于天然核苷酸的官能团。

因此，在一些实施例中，第一RNA和/或第二RNA包括经修饰的碱基。在一些实施例中，所述经修饰的RNA包含以下中的一个或多个：2'-O-甲氧基-乙基碱基(2'-MOE)，如2-甲氧基乙氧基A、2-甲氧基乙氧基MeC、2-甲氧基乙氧基G、2-甲氧基乙氧基T。其它经修饰的碱基包含例如2'-O-甲基RNA碱基和氟基碱基。各种氟代碱基是已知的，并且包含例如氟基C、氟基U、氟基A、氟基G碱基。各种2'O甲基修饰也可以与本文所述的方法一起使用。例如，包括以下2'O甲基修饰中的一个或多个的以下RNA可以与所述方法一起使用：2'-OMe-5-甲基-rC、2'-OMe-rT、2'-OMe-rI、2'-OMe-2-氨基-rA、氨基连接子-C6-rC、氨基连接子-C6-rU、2'-OMe-5-Br-rU、2'-OMe-5-I-rU、2-OMe-7-Deaza-rG。

在一些实施例中，所述第一RNA和/或所述第二RNA包括以下碱基修饰中的一个或多个碱基修饰：2,6-二氨基嘌呤、2-氨基嘌呤、假尿嘧啶、N1-甲基-假尿嘧啶、5'甲基胞嘧啶、2'嘧啶酮(泽布拉林)、胸腺嘧啶。

本文可以使用其它经化学修饰的RNA。例如，所述第一RNA和/或所述第二RNA可以包括经修饰的碱基，例如5'、Int、3'叠氮化物(NHS酯)；5'己炔基；5'、Int、3'5-辛二炔基dU；5'、Int生物素(叠氮化物)；5'、Int 6-FAM(叠氮化物)；以及5'、Int 5-TAMRA(叠氮化物)。可以用于本文所述方法的RNA核苷酸修饰的其它实例包含例如磷酸化修饰，如5'-磷酸化和3'-磷酸化。所述RNA还可以具有以下修饰中的一个或多个修饰：氨基修饰、生物素化、硫醇修饰、炔烃修饰、腺苷酸化、叠氮化物(NHS酯)、胆固醇-TEG和地高辛(NHS酯)。

受体和供体RNA连接

在一些实施例中，受体RNA和供体RNA在距在受体RNA与供体RNA之间形成的环设定距离的连接位点处连接。例如，所述连接位点距在受体RNA与供体RNA之间形成的环至少1个、2个、3个、4个、5个、6个、7个、8个、9个或10个碱基对。在一些实施例中，所述连接位点距所述环2个或3个碱基对。在受体RNA与供体RNA之间形成的环结构可以在长度方面有所不同。例如，在受体RNA与供体RNA之间形成的环的长度可以是4个、5个、6个、7个、8个、9个、10个、11个、12个、13个、14个、15个或16个核苷酸。在一些实施例中，环长度为4。长度为4的环在本文中被称为四环。在一些实施例中，所述环包括7个核苷酸。

在一些实施例中，受体和供体RNA在距在受体RNA与供体RNA之间形成的凸起设定距离的连接位点处连接。例如，受体RNA和供体RNA的连接发生在距凸起至少约3个、4个、5个、6个、7个、8个、10个、11个或12个碱基对的连接位点处。在一些实施例中，受体RNA和供体RNA的连接发生在距凸起3个、4个、5个或11个碱基对的连接位点处。

受体RNA与供体RNA之间的碱基配对可以发生在下部茎和/或上部茎处。在一些实施例中，受体RNA和供体RNA具有核苷酸互补性。所述核苷酸互补性可以是部分的，例如在受体RNA与供体RNA之间的互补性可以是约50％到约99％的互补性。在一些实施例中，受体RNA和供体RNA具有完全互补的核苷酸。

在一些实施例中，受体RNA和供体RNA以约0.5:1、0.6:1、0.7:1、0.8:1、0.9:1、1:1、1:0.9、1:0.8、1:0.7、1:0.6或1:0.5的比率存在。

在一些实施例中，与使用常规合成方法产生的gRNA相比，本文所述的方法允许产生具有提高产率的gRNA。例如，在一些实施例中，与常规合成方法相比，根据本文所述的方法产生的gRNA在产率方面会提高约50％、55％、60％、65％、70％、75％、80％、85％、90％、95％、99％或更多。

在一些实施例中，所述上部和/或下部茎的GC含量会影响RNA连接反应的产率、生产率和纯度。

在一些实施例中，受体RNA和供体RNA在上部茎中不包括GC碱基对。

在一些实施例中，单个供体片段可以与各种受体片段一起使用。以此方式，供体片段可作为通用供体片段，所述通用供体片段可与各种受体片段的一种或多种组合配对。

在一些实施例中，受体RNA和供体RNA被工程化为在上部茎中含有GC碱基对。在一些实施例中，受体RNA和供体RNA在上部茎中包括至少1个、2个、3个、4个、5个、6个、7个、8个、9个、10个、11个或12个GC碱基对。在一些实施例中，受体RNA和供体RNA在上部茎中包括2个GC核苷酸。本文所述的示例性上部茎核苷酸包含：CGAUACGACAGAAC(SEQ ID NO:1)；CGCCG(SEQ ID NO:2)；CGGCCGC(SEQ ID NO:3)；CGCGC(SEQ ID NO:4)；以及CGAU(SEQ ID NO:5)。

在一些实施例中，受体RNA和供体RNA在下部茎中不包括GC碱基对。在一些实施例中，受体RNA和供体RNA在下部茎中包括GC碱基对。

在一些实施例中，受体和供体RNA的浓度介于约1g/L与5g/L之间。在一些实施例中，受体和供体RNA的浓度会影响所得gRNA的产率、生产率和纯度。

在一些实施例中，发生连接反应的温度会影响RNA连接反应的产率或生产率。在一些实施例中，发生连接反应的温度为约15℃、16℃、17℃、18℃、19℃、20℃、21℃、22℃、23℃、24℃、25℃、26℃、27℃、28℃、29℃、30℃、31℃、32℃、33℃、34℃、35℃、36℃、37℃、38℃、39℃或40℃。因此，在一些实施例中，发生连接反应的温度为约15℃。在一些实施例中，发生连接反应的温度为约16℃。在一些实施例中，发生连接反应的温度为约17℃。在一些实施例中，发生连接反应的温度为约18℃。在一些实施例中，发生连接反应的温度为约19℃。在一些实施例中，发生连接反应的温度为约20℃。在一些实施例中，发生连接反应的温度为约21℃。在一些实施例中，发生连接反应的温度为约22℃。在一些实施例中，发生连接反应的温度为约23℃。在一些实施例中，发生连接反应的温度为约24℃。在一些实施例中，发生连接反应的温度为约25℃。在一些实施例中，发生连接反应的温度为约26℃。在一些实施例中，发生连接反应的温度为约27℃。在一些实施例中，发生连接反应的温度为约28℃。在一些实施例中，发生连接反应的温度为约29℃。在一些实施例中，发生连接反应的温度为约30℃。在一些实施例中，发生连接反应的温度为约31℃。在一些实施例中，发生连接反应的温度为约32℃。在一些实施例中，发生连接反应的温度为约33℃。在一些实施例中，发生连接反应的温度为约34℃。在一些实施例中，发生连接反应的温度为约35℃。在一些实施例中，发生连接反应的温度为约36℃。在一些实施例中，发生连接反应的温度为约37℃。在一些实施例中，发生连接反应的温度为约38℃。在一些实施例中，发生连接反应的温度为约39℃。在一些实施例中，发生连接反应的温度为约40℃。

在一些实施例中，受体RNA和供体RNA包括至少两个具有完全互补性的RNA核苷酸。在一些实施例中，受体RNA和供体RNA在下部茎中包括5个典型碱基对。在一些实施例中，受体RNA和供体RNA在下部茎中包括2个非典型碱基对。在一些实施例中，受体RNA和供体RNA在上部茎中包括2个典型碱基对。在一些实施例中，受体RNA和供体RNA包括8个碱基对。在一些实施例中，所述碱基对不是连续的。在一些实施例中，所述碱基对是连续的。

使用gRNA进行基因编辑

本文所述的合成gRNA可以与合适的基因编辑***一起用于靶向基因编辑，这可以导致基因沉默事件或所需靶基因表达中的表达改变(例如，增加或减少)。因此，在一些实施例中，本文所述的合成gRNA可以用于靶向转录激活、靶向转录抑制、靶向表观基因组修饰或靶向基因组修饰的方法中，所述方法包括向真核细胞中引入：(a)如本文定义的合成向导RNA(gRNA)；(b)至少一种CRISPR/Cas蛋白或编码所述至少一种CRISPR/Cas蛋白的核酸；其中(a)和(b)与染色体DNA中的靶序列之间的相互作用引起靶向转录激活、靶向转录抑制、靶向表观基因组修饰或靶向基因组修饰。

在一些实施例中，本文所述的合成RNA可以用于基因编辑***，所述基因编辑***包括：本文所述的合成向导RNA，其中所述RNA向导包括能够与靶核酸杂交的同向重复序列和间隔子序列；基因编辑蛋白，并且其中所述基因编辑酶能够与所述RNA向导结合并导致与所述RNA向导互补的靶核酸序列的断裂。

在一些实施例中，本文所述的合成RNA可以用于基因编辑***，所述基因编辑***包括：本文所述的合成向导RNA，其中所述RNA向导包括能够与靶核酸杂交的同向重复序列和间隔子序列；和基因编辑蛋白h；其中所述基因编辑蛋白与脱氨酶融合，并且其中所述基因编辑蛋白融合物能够与所述RNA向导结合并编辑与所述RNA向导互补的靶核酸序列。

在一些实施例中，本发明提供了一种改变真核细胞中靶核酸表达的方法，所述方法包括：使所述细胞与基因编辑蛋白和本文所述的合成向导RNA接触，其中所述RNA向导包括能够与靶核酸杂交的同向重复序列和间隔子序列，并且其中所述基因编辑蛋白能够与所述RNA向导结合并导致与所述RNA向导互补的靶核酸序列的断裂。

在一些实施例中，本发明提供了一种改变真核细胞中靶核酸表达的方法，所述方法包括：使所述细胞与基因编辑蛋白和本文所述的合成向导RNA接触，其中所述RNA向导包括能够与靶核酸杂交的同向重复序列和间隔子序列，并且其中所述基因编辑蛋白能够与所述RNA向导结合并编辑与所述RNA向导互补的靶核酸序列。

在一些实施例中，本发明提供了一种修饰真核细胞中的靶核酸的方法，所述方法包括：使所述细胞与基因编辑蛋白和本文所述的合成向导RNA接触，其中所述RNA向导包括能够与靶核酸杂交的同向重复序列和间隔子序列，并且其中所述基因编辑蛋白能够与所述RNA向导结合并编辑与所述RNA向导互补的靶核酸序列。

在一些实施例中，所述基因编辑方法或***包括具有以位点特异性方式修饰靶DNA的效应子的融合蛋白，其中修饰活性包含甲基转移酶活性、去甲基化酶活性、乙酰转移酶活性、去乙酰化酶活性、激酶活性、磷酸酶活性、泛素连接酶活性、去泛素化活性、腺苷酸化活性、去腺苷酸化活性、SUMO化活性、去SUMO化活性、核糖基化活性、去核糖基化活性、肉豆蔻酰化活性、去肉豆蔻酰化活性、整合酶活性、转座酶活性、重组酶活性、聚合酶活性、连接酶活性、解旋酶活性或核酸酶活性，其中任何一种都可以修饰DNA或DNA相关多肽(例如，组蛋白或DNA结合蛋白)。

在一些实施例中，所述基因编辑方法或***包括融合蛋白与可以通过化学修饰核苷酸碱基来编辑DNA序列的酶，所述酶包含可以修饰腺苷或胞嘧啶碱基并充当位点特异性碱基编辑器的脱氨酶。例如，通常使用RNA作为底物的APOBEC1胞苷脱氨酶在其与Cas9融合时可以靶向单链和双链DNA，从而将胞苷直接转化为尿苷，并进化出TadA酶以将腺苷脱氨基为肌苷。因此，使用脱氨酶的“碱基编辑”能够将一个靶DNA碱基可编程转换为另一个。各种碱基编辑器在本领域中是已知的并且可以用于本文所述的方法和***中。示例性碱基编辑器在以下中描述：例如，Rees和Liu《自然评论：遗传学(Nature Review Genetics)》,2018,19(12):770-788，所述文献的内容并入本文。

在一些实施例中，碱基编辑导致引入终止密码子来沉默基因。在一些实施例中，碱基编辑通过改变氨基酸序列来改变蛋白质功能。

在一些实施例中，本文所述的合成向导RNA可以用于基因编辑方法或***以调节靶DNA的转录。在一些实施例中，所述合成向导RNA可以用于基因编辑方法或***以调节靶非编码RNA的表达，所述靶非编码RNA包含tRNA、rRNA、snoRNA、siRNA、miRNA和长ncRNA。

在一些实施例中，本文所述的合成向导RNA用于使用合适的基因编辑***对染色质环结构进行靶向工程化。调控基因组区域之间的染色质环的靶向工程化提供了一种用于操纵内源染色质结构并能够形成新的增强子-启动子连接以克服遗传缺陷或抑制异常增强子-启动子连接的手段。

在一些实施例中，本文所述的合成向导RNA与基因编辑***结合使用，以通过***有益的临床变体或抑制突变来校正致病突变。

治疗应用

本文所述的合成向导RNA可以在用于各种治疗应用的基因编辑***中使用。因此，在一些实施例中，提供了一种治疗有需要的受试者的病症或疾病的方法，所述方法包括向受试者施用具有基因编辑***的本文所述的合成向导RNA。各种基因编辑***在本领域中是已知的并且包含例如CRISPR-Cas9、Cpf1、SpCas9、SaCas、Cas12和引导编辑Cas等。本文所述的合成gRNA可以与任何基因编辑***一起使用。

在一些实施例中，本文所述的合成向导RNA可以与基因编辑***结合使用以治疗各种疾病和病症，例如，遗传病症(例如，单基因疾病)、可以通过核酸酶活性治疗的疾病和各种癌症等。

在一些实施例中，本文所述的合成向导RNA可以与基因编辑***结合使用以编辑靶核酸，从而修饰靶核酸(例如，通过***、缺失或突变一个或多个核酸残基)。例如，在一些实施例中，CRISPR***与本文所述的合成gRNA一起使用并且包括外源供体模板核酸(例如，DNA分子或RNA分子)，所述外源供体模板核酸包括所需的核酸序列。在解决用CRISPR***诱导的切割事件后，细胞的分子机制将利用外源供体模板核酸来修复和/或解决切割事件。可替代地，细胞的分子机制可以利用内源模板来修复和/或解决切割事件。在一些实施例中，本文所述的合成向导RNA与基因编辑***结合使用以改变导致***、缺失和/或点突变的靶核酸。在一些实施例中，所述***是无痕***(即，将预期的核酸序列***靶核酸中，从而导致在解决切割事件后没有另外的非预期的核酸序列)。供体模板核酸可以是双链或单链核酸分子(例如，DNA或RNA)。

一方面，本文所述的合成向导RNA可以与基因编辑***结合使用，以用于治疗由RNA、毒性RNA和/或突变RNA(例如，剪接缺陷或截短)的过表达引起的疾病。

在一些实施例中，本文所述的合成向导RNA可以与基因编辑***结合使用以靶向影响引起各种疾病的RNA依赖性功能的反式作用突变。

在一些实施例中，本文所述的合成向导RNA可以与基因编辑***结合使用，以靶向破坏可以引起剪接缺陷和疾病的顺式作用剪接代码的突变。

本文所述的合成向导RNA可以与基因编辑***结合使用，以实现抗病毒活性，特别是抗RNA病毒。例如，使用合适的合成RNA向导来靶向病毒RNA，所述向导被选择用于靶向病毒RNA序列。

本文所述的合成向导RNA可以与基因编辑***结合使用以治疗受试者(例如，人类受试者)的癌症。例如，通过靶向异常(例如，包括点突变或选择性剪接)并在癌细胞中发现的RNA分子来诱导癌细胞中的细胞死亡(例如，通过细胞凋亡)。

本文所述的合成向导RNA可以与基因编辑***结合使用以治疗受试者的传染病。例如，通过靶向感染原(例如，细菌、病毒、寄生虫或原生动物)表达的RNA分子以靶向并诱导感染原细胞中的细胞死亡。本文所述的合成向导RNA可以与基因编辑***结合使用以治疗细胞内感染原感染宿主受试者细胞的疾病。

在期望将多核苷酸序列***靶DNA序列的应用中，还向细胞提供包括待***的供体序列的多核苷酸。“供体序列”或“供体多核苷酸”意指待***在由定点修饰多肽诱导的切割位点处的核酸序列。所述供体多核苷酸将在切割位点处与基因组序列含有足够的同源性，例如与侧接切割位点(例如，在切割位点的约50个碱基或更少以内，例如在约30个碱基内、在约15个碱基内、在约10个碱基内、在约5个碱基内，或紧侧接切割位点)的核苷酸序列具有70％、80％、85％、90％、95％或100％的同源性，以支持其与和其具有同源性的基因组序列之间的同源性定向修复。供体和基因组序列之间具有序列同源性的大约为25、50、100或200个核苷酸或超过200个核苷酸(或介于10与200或更多个核苷酸之间的任何整数值)将支持同源性定向修复。供体序列可以是任意长度，例如10个核苷酸或更多、50个核苷酸或更多、100个核苷酸或更多、250个核苷酸或更多、500个核苷酸或更多、1000个核苷酸或更多、5000个核苷酸或更多等。

所述供体序列通常与其替换的基因组序列不同。相反，所述供体序列可以含有相对于基因组序列的至少一个或多个单碱基改变、***、缺失、倒置或重排，只要存在足够的同源性以支持同源性定向修复即可。在一些实施例中，所述供体序列包括由两个同源区域侧接的非同源序列，使得靶DNA区域与两个侧接序列之间的同源定向修复导致非同源序列在靶区域处的***。供体序列还可以包括载体骨架，所述载体骨架含有与所关注的DNA区域不同源并且不打算***所关注的DNA区域的序列。通常，供体序列的同源区域与需要重组的基因组序列将具有至少50％的序列同一性。在某些实施例中，存在60％、70％、80％、90％、95％、98％、99％或99.9％的序列同一性。根据供体多核苷酸的长度，可以存在介于1％与100％序列同一性之间的任何值。

与基因组序列相比，供体序列可以包括某些序列差异，例如限制性位点、核苷酸多态性、可选择标志物(例如，耐药基因、荧光蛋白、酶等)等，所述序列差异可以用于评估供体序列在切割位点处的成功***，或在一些情况下可以用于其它目的(例如，表示在靶向基因组基因座处的表达)。在一些情况下，如果定位于编码区中，则此类核苷酸序列差异将不会改变氨基酸序列，或将使沉默氨基酸发生改变(即，不影响蛋白质的结构或功能的改变)。可替代地，这些序列差异可以包含侧接重组序列，如FLP、loxP序列等，所述重组序列可以在稍后的时间被激活以去除标志物序列。

所述供体序列可以作为单链DNA、单链RNA、双链DNA或双链RNA提供给细胞。它可以线性或圆形形式引入细胞中。如果以线性形式引入，可以通过本领域技术人员已知的方法保护供体序列的末端(例如，防止核酸外切降解)。例如，将一个或多个双脱氧核苷酸残基添加到线性分子的3'末端和/或将自互补寡核苷酸连接到一个或两个末端。用于保护外源多核苷酸免于降解的另外的方法包含但不限于添加末端氨基以及使用经过修饰的核苷酸间键，例如硫代磷酸酯、氨基磷酸酯和O-甲基核糖或脱氧核糖残基。作为保护线性供体序列末端的替代方案，可以在同源区域之外包含额外长度的序列，所述同源区域可以在不影响重组的情况下被降解。可以将供体序列作为载体分子的一部分引入细胞，所述载体分子具有额外序列，例如复制起点、启动子和编码抗生素抗性的基因。此外，供体序列可以作为裸核酸、作为与如脂质体或泊洛沙姆等药剂复合的核酸引入，或者可以通过病毒(例如，腺病毒、AAV)递送，如上文对于编码靶向DNA的RNA和/或定点修饰多肽和/或供体多核苷酸的核酸所述。

按照上述方法，可以离体切割和修饰，即“基因修饰”所关注的DNA区域。在一些实施例中，当将可选择标志物***所关注的DNA区域时，通过将经基因修饰的细胞与剩余细胞群分离，可以使细胞群富集包括经基因修饰的细胞。在富集之前，“经基因修饰的”细胞可能仅占细胞群的约1％或更多(例如，2％或更多、3％或更多、4％或更多、5％或更多、6％或更多、7％或更多、8％或更多、9％或更多、10％或更多、15％或更多，或20％或更多)。“经基因修饰的”细胞的分离可以通过适于所使用的可选择标志物的任何方便的分离技术来实现。例如，如果已***荧光标记物，则可以通过荧光激活细胞分选来使细胞分离，而如果已***细胞表面标记物，则可以通过亲和分离技术将细胞与异质群体分离，例如磁分离、亲和层析、用附着到固体基质上的亲和试剂进行“淘选”或其它方便的技术。提供精确分离的技术包含荧光激活细胞分选仪，所述荧光激活细胞分选仪可以具有不同程度的复杂性，如多色通道、低角度和钝角光散射检测通道、阻抗通道等。可以通过采用与死细胞缔合的染料(例如，碘化丙锭)针对死细胞来选择细胞。可以采用不会过度损害经基因修饰的细胞的活力的任何技术。以此方式实现包括经修饰的DNA的细胞高度富集的细胞组合物。“高度富集”是指经过遗传修饰的细胞将为细胞组合物的70％或更多、75％或更多、80％或更多、85％或更多、90％或更多，例如细胞组合物的约95％或更多或98％或更多。换言之，所述组合物可以是基本上纯的经基因修饰的细胞的组合物。

通过本文所述的方法产生的经基因修饰的细胞可以立即使用。可替代地，所述细胞可以在液氮温度下冷冻并长期储存，解冻并能够重复使用。在这种情况下，细胞通常会被冷冻在10％二甲亚砜(DMSO)、50％血清、40％缓冲介质或如本领域中常用的其它某种溶液中以将细胞保存在这种冷冻温度下，并且以本领域中已知的用于解冻冷冻培养细胞的方式解冻。

经基因修饰的细胞可以在各种培养条件下体外培养。所述细胞可以在培养物中扩增，即在促进其增殖的条件下生长。培养基可以是液体或半固体，例如，含有琼脂、甲基纤维素等。细胞群可以悬浮在适当的营养培养基中，如Iscove改良的DMEM或RPMI1640，所述营养培养基通常补充有胎牛血清(约5-10％)、

L-谷氨酰胺、硫醇，特别是2-巯基乙醇和抗生素，例如青霉素和链霉素。培养物可以含有调节性T细胞对其有应答的生长因子。如本文所定义的，生长因子是能够通过对跨膜受体的特定作用促进细胞在培养物或完整组织中存活、生长和/或分化的分子。生长因子包含多肽和非多肽因子。

可以将已经以这种方式进行经基因修饰的细胞移植到受试者体内，用于基因治疗等目的，例如治疗疾病或作为抗病毒、抗病原体或抗癌治疗剂，用于在农业中生产经基因修饰的生物体，或用于生物学研究。受试者可以是新生儿、青少年或成人。特别关注的是哺乳动物受试者。以用本方法处理的哺乳动物物种包含犬和猫；马；牛；绵羊等和灵长类动物，特别是人类。动物模型，特别是小型哺乳动物(例如小鼠、大鼠、豚鼠、仓鼠、兔形目动物(例如兔子)等)可以用于实验研究。

细胞可以单独或与合适的底物或基质一起提供给受试者，例如，以支持它们在被移植的组织中的生长和/或组织。通常，将施用至少1×10³个细胞，例如5×10³个细胞、1×10⁴个细胞、5×10⁴个细胞、1×10⁵个细胞、1×10⁶个细胞或更多。可以通过以下任何途径将细胞引入受试者：肠胃外、皮下、静脉内、颅内、脊髓内、眼内或进入脊髓液。细胞可以通过注射、导管等引入。为了产生转基因动物(例如，转基因小鼠)的目的，也可以将细胞引入胚胎(例如，胚泡)中。

向受试者施用治疗的次数可以变化。将经基因修饰的细胞引入受试者可能是一次性事件；但在某些情况下，这种治疗可能会在有限的时间段内引起改善并且需要进行一系列持续的重复治疗。在其它情况下，在观察到效果之前，可能需要多次施用经基因修饰的细胞。确切的方案取决于疾病或病状、疾病的阶段和正在治疗的个体受试者的参数。

在本发明的其它方面，靶向DNA的RNA和/或定点修饰多肽和/或供体多核苷酸用于体内修饰细胞DNA，同样用于基因治疗等目的，例如用于治疗疾病或作为抗病毒剂、抗病原体剂或抗癌剂，用于在农业中生产经基因修饰的生物体，或用于生物学研究。在这些体内实施例中，将靶向DNA的RNA和/或定点修饰多肽和/或供体多核苷酸直接施用于个体。靶向DNA的RNA和/或定点修饰多肽和/或供体多核苷酸可以通过本领域中用于将肽、小分子和核酸施用给受试者的许多众所周知的方法中的任一种施用。可以将靶向DNA的RNA和/或定点修饰多肽和/或供体多核苷酸掺入多种调配物中。更具体地，本发明的靶向DNA的RNA和/或定点修饰多肽和/或供体多核苷酸可以通过与适当的药学上可接受的载体或稀释剂组合而调配成药物组合物。

药物制剂是包含一种或多种存在于药学上可接受的载体中的靶向DNA的RNA和/或定点修饰多肽和/或供体多核苷酸的组合物。“药学上可接受的媒剂”可以是由联邦或州政府的监管机构批准的或者在美国药典或其它公认药典中列出的在如人类等哺乳动物中使用的媒剂。术语“媒剂”是指本发明的化合物与其一起调配用于向哺乳动物施用的稀释剂、佐剂、赋形剂或载体。此类药物媒剂可以是脂质，例如脂质体，例如脂质体树状物；液体，如水和油，包含石油、动物、植物或合成来源的油，如花生油、大豆油、矿物油、芝麻油等，盐水；***树胶、明胶、淀粉糊、滑石、角蛋白、胶体二氧化硅、尿素等。另外，可以使用助剂、稳定剂、增稠剂、润滑剂和着色剂。药物组合物可以调配成固体、半固体、液体或气体形式的制剂，如片剂、胶囊、粉末、颗粒、软膏、溶液、栓剂、注射剂、吸入剂、凝胶、微球和气雾剂。因此，DNA靶向RNA和/或定点修饰多肽和/或供体多核苷酸的施用可以多种方式实现，包含口服、口腔、直肠、肠胃外、腹膜内、皮内、经皮、气管内、眼内等施用。活性剂在施用后可以是全身性的，也可以通过使用局部施用、壁内施用或使用植入物来定位，所述植入物起到在植入部位保留活性剂量的作用。所述活性剂可以被调配成立即活性或可以被调配成缓释。

对于一些病状，特别是中枢神经***病状，可能需要调配药剂以穿过血脑屏障(BBB)。一种通过血脑屏障(BBB)递送药物的策略需要通过如甘露醇或白三烯等渗透性手段或生化地通过使用血管活性物质如缓激肽来破坏BBB。使用BBB开放将特定药剂靶向脑肿瘤的潜力也是一种选择。当组合物通过血管内注射施用时，BBB破坏剂可以与本发明的治疗组合物共同施用。其它通过BBB的策略可能需要使用内源性转运***，包含Caveolin-1介导的转胞吞作用、如葡萄糖和氨基酸载体等载体介导的转运蛋白、受体介导的胰岛素或转铁蛋白转胞吞作用以及主动外排转运蛋白，如p-糖蛋白。活性转运部分也可以与用于本发明的治疗化合物缀合以促进穿过血管内皮壁的转运。

可替代地，BBB后面的治疗剂的药物递送可以通过局部递送，例如通过鞘内递送。

通常，提供有效量的靶向DNA的RNA和/或定点修饰多肽和/或供体多核苷酸。如上文关于离体方法所讨论的，体内靶向DNA的RNA和/或定点修饰多肽和/或供体多核苷酸的有效量或有效剂量是诱导两个同源序列之间观察到的重组量相对于阴性对照，例如与空载体或无关多肽接触的细胞增加2倍或更多的量。重组的量可以通过任何方便的方法来测量，例如如上所述并且在本领域中是已知的。待施用的靶向DNA的RNA和/或定点修饰多肽和/或供体多核苷酸的有效量或有效剂量的计算在本领域普通技术人员的技能范围内，并且对于本领域技术人员来说是常规的。待施用的最终量将取决于施用途径和待治疗的病症或病状的性质。

给予特定患者的有效量将取决于多种因素，其中一些因素因患者而异。有能力的临床医生将能够确定有效量的治疗剂以施用于患者，以根据需要停止或逆转疾病状况的进展。利用LD50动物数据和所述药剂可用的其它信息，临床医生可以根据施用途径确定个体的最大安全剂量。例如，假设治疗组合物被施用到更大的体液中，静脉内施用的剂量可能大于鞘内施用的剂量。类似地，可以以更高剂量或以重复剂量施用快速从体内清除的组合物，以维持治疗浓度。利用普通技能，有能力的临床医生将能够在常规临床试验过程中优化特定治疗剂的剂量。

为了包含在药物中，靶向DNA的RNA和/或定点修饰多肽和/或供体多核苷酸可以从合适的商业来源获得。作为一般建议，每剂肠胃外施用的靶向DNA的RNA和/或定点修饰多肽和/或供体多核苷酸的总药学有效量将处于可以通过剂量应答曲线测量的范围内。

基于靶向DNA的RNA和/或定点修饰多肽和/或供体多核苷酸的疗法，即用于治疗性施用的靶向DNA的RNA和/或定点修饰多肽和/或供体多核苷酸的制剂，必须是无菌的。通过无菌过滤膜(例如，0.2μm膜)过滤容易实现无菌。治疗性组合物通常放置在具有无菌进入口的容器中，例如，静脉注射溶液袋或具有可通过皮下注射针刺穿的塞子的小瓶。基于靶向DNA的RNA和/或定点修饰多肽和/或供体多核苷酸的疗法可以作为水溶液或作为冻干调配物储存在单位或多剂量容器(例如，密封的安瓿或小瓶)中用于重组。作为冻干调配物的实例，10-mL小瓶填充有5ml无菌过滤的1％(w/v)化合物水溶液，并将所得混合物冻干。通过使用抑菌注射用水重构冻干化合物来制备输注溶液。

取决于期望的调配物，药物组合物可以包含药学上可接受的、无毒的稀释剂载体，所述载体被定义为通常用于调配用于动物或人类施用的药物组合物的载体。对稀释剂进行选择以免影响所述组合物的生物活性。此类稀释剂的实例是蒸馏水、缓冲水、生理盐水、PBS、林格氏溶液、葡萄糖溶液和汉克溶液。另外，药物组合物或调配物可以包含其它载体、佐剂、或无毒的、非治疗性的、非免疫原性的稳定剂、赋形剂等。所述组合物还可以包含接近生理条件的另外的物质，如pH调节剂和缓冲剂、毒性调节剂、润湿剂和去污剂。

所述组合物还可以包含多种稳定剂中的任何一种，如抗氧化剂。当药物组合物包含多肽时，所述多肽可以与增强多肽的体内稳定性或以其它方式增强其药理学性质(例如，增加多肽的半衰期，降低其毒性并提高溶解度或吸收)的各种众所周知的化合物复合。此类修饰剂或络合剂的实例包含硫酸盐、葡萄糖酸盐、柠檬酸盐和磷酸盐。组合物的核酸或多肽也可以与增强其体内属性的分子复合。此类分子包含例如碳水化合物、多胺、氨基酸、其它肽、离子(例如，钠、钾、钙、镁、锰)和脂质。

可以施用药物组合物用于预防和/或治疗性处理。可以根据细胞培养物和/或实验动物中的标准药学程序确定活性成分的毒性和治疗功效，包含例如确定LD50(对50％群体致死的剂量)和ED50(对50％群体治疗有效的剂量)。毒性作用与治疗效果之间的剂量比为治疗指数并且所述治疗指数可以被表示为比率LD50/ED50。优选展现出大的治疗指数的疗法。

从细胞培养和/或动物研究获得的数据可以用于调配人类使用的一系列剂量。活性成分的剂量通常在包含低毒性ED50在内的循环浓度范围内。根据所采用的剂型和所利用的施用途径，剂量可以在此范围内变化。

用于调配药物组合物的组分优选地具有高纯度并且基本上不含潜在有害污染物(例如，至少是国家食品(NF)级，通常至少是分析级，并且更通常至少是药物级)。此外，用于体内使用的组合物通常是无菌的。就必须在使用前合成给定化合物而言，所得产物通常基本上不含任何潜在的毒性剂，特别是任何可能存在于合成或纯化过程中的内毒素。用于肠胃外施用的组合物也是无菌的、基本上等渗的并且在GMP条件下制备。

递送***

本文所述的合成RNA连同期望的基因编辑***组分可以通过各种递送***如载体，例如质粒和递送载体递送到所关注的细胞。

本文所述的合成RNA可以通过纳米颗粒递送，所述纳米颗粒可以是有机的或无机的。纳米颗粒在本领域中是众所周知的。任何合适的纳米颗粒设计都可以用于递送基因组编辑***组分或编码此类组分的核酸。例如，有机(例如，脂质和/或聚合物)纳米颗粒可以适合用作本公开的某些实施例中的递送媒剂。用于纳米颗粒调配物和/或基因转移的示例性脂质示于表1(下文)中。

表1

表2列出了用于基因转移和/或纳米颗粒调配物的示例性聚合物。

表2

表3总结了用于编码本文所述Cas9的多核苷酸的递送方法。

表3

另一方面，包含本文描述的合成gRNA的基因组编辑***的递送可以通过将核糖核蛋白(RNP)递送到细胞来完成。所述RNP包括与靶向gRNA复合的核酸结合蛋白，例如Cas9。可以使用已知方法将RNP递送到细胞，所述方法如电穿孔、核转染或阳离子脂质介导的方法，例如，如Zuris,J.A.等人,2015,《自然生物技术(Nat.Biotechnology)》,33(1):73-80所报道的。RNP有利于在CRISPR碱基编辑***中使用，特别是对于难以转染的细胞，例如原代细胞。另外，RNP还可以缓解细胞中蛋白质表达可能出现的困难，特别是当真核启动子(例如，可以用于CRISPR质粒的CMV或EF1A)表达不佳时。有利地，RNP的使用不需要将外源DNA递送到细胞中。此外，由于包括核酸结合蛋白和gRNA复合物的RNP会随着时间的推移而降解，因此使用RNP有可能限制脱靶效应。以与基于质粒的技术类似的方式，RNP可以用于递送结合蛋白(例如，Cas9变体)和指导同源定向修复(HDR)。

用于驱动CRISPR***的启动子(例如，包含本文所述的合成gRNA)可以包含AAVITR。这对于消除对可能占用载体空间的额外启动子元件的需要是有利的。释放的额外空间可以用于驱动其它元件的表达，如向导核酸或可选择标志物。ITR活性相对较弱，因此可以用于降低因所选核酸酶过度表达而导致的潜在毒性。

任何合适的启动子都可以用于驱动Cas9和适当时向导核酸的表达。对于普遍存在的表达，可以使用的启动子包含CMV、CAG、CBh、PGK、SV40、铁蛋白重链或轻链等。对于脑或其它CNS细胞表达，合适的启动子可以包含：用于所有神经元的Synapsin I、用于兴奋性神经元的CaMKIIα、用于GABA能神经元的GAD67或GAD65或VGAT等。对于肝细胞表达，合适的启动子包含白蛋白启动子。对于肺细胞表达，合适的启动子可以包含SP-B。对于内皮细胞，合适的启动子可以包含ICAM。对于造血细胞，合适的启动子可以包含IFNβ或CD45。对于成骨细胞，合适的启动子可以包含OG-2。

在一些情况下，分开的启动子在同一核酸分子内驱动碱基编辑器和相容向导核酸的表达。例如，载体或病毒载体可以包括与编码碱基编辑器的核酸可操作地连接的第一启动子和与向导核酸可操作地连接的第二启动子。

用于驱动向导核酸表达的启动子可以包含：Pol III启动子，如U6或H1使用Pol II启动子和内含子盒来表达gRNA腺相关病毒(AAV)。

可以使用腺相关病毒(AAV)、慢病毒、腺病毒或其它质粒或病毒载体类型来递送Cas9和合成gRNA，特别是使用来自以下的调配物和剂量：例如美国专利第8,454,972号(腺病毒的调配物、剂量)、美国专利第8,404,658号(AAV的调配物、剂量)和美国专利第5,846,946号(DNA质粒的调配物、剂量)以及涉及慢病毒、AAV和腺病毒的临床试验和关于所述临床试验的出版物。例如，对于AAV，施用途径、调配物和剂量可以如美国专利第8,454,972号中和涉及AAV的临床试验中那样。对于腺病毒，施用途径、调配物和剂量可以如美国专利第8,404,658号和涉及腺病毒的临床试验中那样。对于质粒递送，施用途径、调配物和剂量可以如美国专利第5,846,946号和涉及质粒的临床研究中那样。剂量可以基于或外推到平均70kg的个体(例如，成年男性)，并且可以针对不同体重和物种的患者、受试者、哺乳动物进行调整。施用频率在医疗或兽医从业者(例如，医师、兽医)的范围内，这取决于常见因素，包含年龄、性别、一般健康状况、患者或受试者的其它状况以及正在解决的特定病状或症状。病毒载体可以注射到所关注的组织中。对于细胞类型特异性碱基编辑，碱基编辑器和任选的向导核酸的表达可以由细胞类型特异性启动子驱动。

对于体内递送，AAV可能优于其它病毒载体。在一些情况下，AAV具有低毒性，这可能是由于纯化方法不需要对可以激活免疫反应的细胞颗粒进行超离心。在一些情况下，AAV导致***诱变的可能性很小，因为它未整合到宿主基因组中。

AAV的包装限制为4.5或4.75Kb。大于4.5或4.75Kb的构建体可以导致病毒产量显著降低。例如，SpCas9相当大，基因本身超过4.1Kb，这使其很难包装到AAV中。因此，本公开的实施例包含使用长度比常规Cas9短的公开的Cas9。

AAV可以是AAV1、AAV2、AAV5或其任何组合。可以根据要靶向的细胞选择AAV的类型；例如，可以选择AAV血清型1、2、5或混合衣壳AAV1、AAV2、AAV5或其任何组合用于靶向脑或神经元细胞；并且可以选择AAV4用于靶向心脏组织。AAV8可用于递送到肝脏。关于这些细胞的某些AAV血清型的列表可以在Grimm,D.等人,《病毒学杂志(J.Virol.)》82:5887-5911(2008)中找到。

慢病毒是复杂的逆转录病毒，其能够在有丝***和有丝***后细胞中感染和表达其基因。最常见的慢病毒是人类免疫缺陷病毒(HIV)，它利用其它病毒的包膜糖蛋白靶向广泛的细胞类型。

可以如下制备慢病毒。在克隆pCasES10(含有慢病毒转移质粒骨架)之后，将处于低传代数(p＝5)的HEK293FT接种在T-75烧瓶中，以在转染之前的一天在具有10％胎牛血清而没有抗生素的DMEM中50％汇合。在20小时之后，将培养基更换为OptiMEM(无血清)培养基，并且在4小时后进行转染。用10μg慢病毒转移质粒(pCasES10)和以下包装质粒转染细胞：5μg pMD2.G(VSV-g假型)和7.5μg psPAX2(gag/pol/rev/tat)。可以在具有阳离子脂质递送剂(50μl Lipofectamine 2000和100ul Plus试剂)的4mL OptiMEM中进行转染。6小时后，将培养基更换为含有10％胎牛血清的无抗生素DMEM。这些方法在细胞培养过程中使用血清，但是优选无血清的方法。

可以如下纯化慢病毒。48小时后收集病毒上清液。首先清除上清液中的碎片并通过0.45μm低蛋白结合(PVDF)过滤器进行过滤。然后将它们在超速离心机中以24,000rpm旋转2小时。将病毒沉淀重新悬浮于50μl DMEM中，于4℃下过夜。然后将它们等分并立即在-80℃下冷冻。

在另一个实施例中，还考虑了基于马传染性贫血病毒(EIAV)的最小非灵长类慢病毒载体。在另一个实施例中，

一种基于马传染性贫血病毒的慢病毒基因治疗载体，其表达血管抑制蛋白内皮抑制素和预期通过视网膜下注射递送的血管抑制素。在另一个实施例中，考虑使用自灭活慢病毒载体。

***的任何RNA，例如向导RNA或编码Cas9的mRNA，都可以以RNA的形式递送。可以使用体外转录生成编码Cas9的mRNA。例如，可以使用含有以下元素的PCR盒合成Cas9 mRNA：T7启动子、任选的kozak序列(GCCACC)、核酸酶序列和3'UTR，如来自β珠蛋白-polyA尾的3'UTR。所述盒可以用于经由T7聚合酶的转录。向导多核苷酸(例如，gRNA)也可以使用体外转录从含有T7启动子的盒中转录，然后是序列“GG”和向导多核苷酸序列。

为了增强表达和降低可能的毒性，可以例如使用假-U或5-甲基-C将Cas9序列和/或向导核酸可以修饰成包含一种或多种经修饰的核苷。

在一些实施例中，本公开包括修饰细胞或生物体的方法。所述细胞可以是原核细胞或真核细胞。所述细胞可以是哺乳动物细胞。所述哺乳动物细胞可以是非人灵长类动物、牛、猪、啮齿动物或小鼠细胞。通过本公开的碱基编辑器、组合物和方法引入细胞的修饰可以使得细胞和细胞的后代被改变以改进生物产物如抗体、淀粉、醇或其它期望细胞输出的产生。通过本公开的方法引入细胞的修饰可以使得细胞和细胞的后代包含改变所产生的生物产物的改变。

所述***可以包括一种或多种不同的载体。一方面，Cas9被密码子优化以表达期望的细胞类型，优先地是真核细胞，优选地是哺乳动物细胞或人类细胞。

通常，密码子优化是指在维持天然氨基酸序列的情况下通过以下方式修饰核酸序列来增强在所关注的宿主细胞中的表达的方法：通过用所述宿主细胞的基因中更频繁使用或最频繁使用的密码子替换天然序列的至少一个密码子(例如，约或超过约1、2、3、4、5、10、15、20、25、50或更多个密码子)。各种物种对特定氨基酸的某些密码子表现出特定的偏好。密码子偏倚(生物体之间密码子使用的差异)通常与信使RNA(mRNA)的翻译效率相关，所述信使RNA的翻译效率又被认为取决于被翻译的密码子的特性和特定转移RNA(tRNA)分子的可用性。所选tRNA在细胞中的优势大体上反映了在肽合成中最常使用的密码子。因此，能够基于密码子优化来定制基因以使指定生物体中的基因表达最优。密码子使用表例如可在www.kazusa.orjp/codon/上的“密码子使用数据库”(2002年7月9日访问)中很容易获得，并且这些表可以通过多种方式进行调整。参见Nakamura,Y.等人“来自国际DNA序列数据库的密码子使用表：2000年状况(Codon usage tabulated from the international DNAsequence databases:status for the year 2000)”《核酸研究》28:292(2000)。用于密码子优化特定序列以在特定宿主细胞中表达的计算机算法也是可得的，如基因制造(GeneForge)(宾夕法尼亚州雅各布斯的Aptagen公司(Aptagen；Jacobus,Pa.))也是可得的。在一些实施例中，编码经工程化的核酸酶的序列中的一个或多个密码子(例如，1、2、3、4、5、10、15、20、25、50或更多，或所有密码子)对应于特定氨基酸最常用的密码子。

包装细胞通常用于形成能够感染宿主细胞的病毒颗粒。此类细胞包含包装腺病毒的293细胞和包装逆转录病毒的psi.2细胞或PA317细胞。用于基因治疗的病毒载体通常是通过产生将核酸载体包装到病毒颗粒中的细胞系来生成的。这些载体通常含有包装并随后整合到宿主中所需要的最小病毒序列、被有待表达的一个或多个多核苷酸的表达盒替换的其它病毒序列。缺失的病毒功能通常由包装细胞系以反式形式提供。例如，用于基因治疗的AAV载体通常仅具有来自AAV基因组的ITR序列，所述序列是包装和整合到宿主基因组中所必需的。病毒DNA可以包装在细胞系中，所述细胞系含有辅助质粒，所述质粒编码其它AAV基因，即rep和cap，但缺乏ITR序列。所述细胞系也可以作为辅助感染腺病毒。辅助病毒可以促进AAV载体的复制和来自辅助质粒的AAV基因的表达。在一些情况下，由于缺乏ITR序列，辅助质粒未大量包装。腺病毒的污染可以是通过例如进行腺病毒比AAV更敏感的热处理来减少的。

药物组合物

本公开的其它方面涉及包括基因编辑***(例如，包含本文所述的合成gRNA)的药物组合物。如本文所用，术语“药物组合物”是指被调配用于药物用途的组合物。在一些实施例中，所述药物组合物进一步包括药学上可接受的载体。在一些实施例中，所述药物组合物包括另外的药剂(例如，用于特异性递送、增加半衰期或其它治疗化合物)。

如本文所用，术语“药学上可接受的载体”是指药学上可接受的材料、组合物或媒剂，如液体或固体填料、稀释剂、赋形剂、制造助剂(例如，润滑剂、滑石镁、硬脂酸钙或硬脂酸锌、或硬脂酸)、或溶剂封装材料，涉及将化合物从身体的一个部位(例如，递送部位)携带或运输到另一个部位(例如，器官、组织或身体的一部分)。药学上可接受的载体在与调配物的其它成分相容并且对受试者的组织无害(例如，生理相容的、无菌的、生理pH等)的意义上是“可接受的”。

可以充当药学上可接受的载体的材料的一些非限制性实例包含：(1)糖类，如乳糖、葡萄糖和蔗糖；(2)淀粉，如玉米淀粉和马铃薯淀粉；(3)纤维素和其衍生物，如羧甲基纤维素钠、甲基纤维素、乙基纤维素、微晶纤维素和乙酸纤维素；(4)粉末状黄蓍胶；(5)麦芽；(6)明胶；(7)润滑剂，如硬脂酸镁、十二烷基硫酸钠和滑石；(8)赋形剂，如可可脂和栓剂蜡；(9)油，如花生油、棉籽油、红花油、芝麻油、橄榄油、玉米油以及大豆油；(10)二醇，如丙二醇；(11)多元醇，如甘油、山梨醇、甘露醇和聚乙二醇(PEG)；(12)酯，如油酸乙酯和月桂酸乙酯；(13)琼脂；(14)缓冲剂，如氢氧化镁和氢氧化铝；(15)海藻酸；(16)无热原水；(17)等渗盐水；(18)林格氏溶液；(19)乙醇；(20)pH缓冲溶液；(21)聚酯、聚碳酸酯和/或聚酐；(22)填充剂，如多肽和氨基酸(23)血清醇，例如乙醇；以及(23)药物调配物中采用的其它无毒的相容物质。润湿剂、着色剂、脱模剂、包衣剂、甜味剂、调味剂、芳香剂、防腐剂和抗氧化剂也可以存在于调配物中。术语如“赋形剂”、“载体”、“药学上可接受的载体”、“媒剂”等在本文中可互换使用。

药物组合物可以包括一种或多种pH缓冲化合物以将调配物的pH维持在反映生理pH的预定水平，如在约5.0到约8.0的范围内。用于水性液体调配物的pH缓冲化合物可以是氨基酸或氨基酸混合物，如组氨酸或氨基酸混合物，如组氨酸和甘氨酸。可替代地，pH缓冲化合物优选地为将调配物的pH维持在预定水平，例如在约5.0到约8.0的范围内并且不螯合钙离子的药剂。此类pH缓冲化合物的说明性实例包含但不限于咪唑和乙酸根离子。所述pH缓冲化合物可以以适合将调配物的pH维持在预定水平的任何量存在。

药物组合物还可以含有一种或多种渗透调节剂，即，将调配物的渗透性质(例如，张力、同渗重摩和/或渗透压)调节至受体个体的血流和血细胞可接受的水平的化合物。所述渗透调节剂可以是不螯合钙离子的药剂。所述渗透调节剂可以是本领域技术人员已知或可获得的调节调配物的渗透性质的任何化合物。本领域技术人员可以凭经验确定给定渗透调节剂在本发明调配物中的适用性。合适类型的渗透调节剂的说明性实例包含但不限于：盐类，如氯化钠和乙酸钠；糖类，如蔗糖、葡萄糖和甘露醇；氨基酸，如甘氨酸；以及这些药剂和/或药剂类型中的一种或多种的混合物。所述渗透调节剂可以以足以调节调配物的渗透性质的任何浓度存在。

在一些实施例中，所述药物组合物被调配成用于递送到受试者，例如用于基因编辑。施用本文所述药物组合物的合适途径包含但不限于：局部、皮下、透皮、皮内、病灶内、关节内、腹膜内、膀胱内、经粘膜、牙龈、齿内、耳蜗内、经鼓室、器官内、硬膜外、鞘内、肌肉内、静脉内、血管内、骨内、眼周、瘤内、脑内和脑室内施用。

在一些实施例中，将本文所述的药物组合物局部施用到患病部位。在一些实施例中，本文所述的药物组合物通过注射、通过导管、通过栓剂或通过植入物施用于受试者，所述植入物是多孔、无孔或凝胶状材料，包含膜，如唾液酸膜或纤维。

在一些实施例中，本文所述的药物组合物在控释***中递送。在一个实施例中，可以使用泵(参见例如Langer,1990,《科学(Science)》249:1527-1533；Sefton,1989,《CRC：生物医学工程评论(CRC Crit.Ref.Biomed.Eng.)》14:201；Buchwald等人,1980,《外科学(Surgery)》88:507；Saudek等人,1989,《新英格兰医学杂志(N.Engl.J.Med.)》321:574)。在另一个实施例中，可以使用聚合物材料。(参见例如《控释的医学应用(MedicalApplications of Controlled Release)》(Langer和Wise编辑,佛罗里达州波卡拉顿的CRC出版社(CRC Press,Boca Raton,Fla.),1974)；《受控的药物生物利用度、药物产品设计和性能(Controlled Drug Bioavailability,Drug Product Design and Performance)》(Smolen和Ball编辑，纽约威利出版社(Wiley,New York),1984)；Ranger和Peppas,1983,《高分子科学评论杂志：高分子化学(Macromol.Sci.Rev.Macromol.Chem.)》23:61。还参见Levy等人,1985,《科学》228:190；During等人,1989,《神经病学年鉴(Ann.Neurol.)》25:351；Howard等人,1989,《神经外科杂志(J.Neurosurg.)》71:105)。其它控释***在例如Langer,同上中进行了讨论。

在一些实施例中，根据常规程序将药物组合物调配成适于静脉内或皮下施用到受试者，例如人类的组合物。在一些实施例中，用于注射施用的药物组合物是无菌等渗溶液，用作增溶剂和局部麻醉剂如利多卡因以减轻注射部位的疼痛。一般地，将成分分开或混合在一起以单位剂型提供，例如，作为在气密封容器中的干燥冻干粉或无水浓缩剂，所述气密封容器如指示活性剂的量的安瓿或小药囊。在通过输注施用药物时，可以用含有无菌药用级水或盐水的输注瓶分配。当药物组合物通过注射施用时，可以提供无菌注射用水或盐水的安瓿，使得成分可以在施用之前混合。

用于全身施用的药物组合物可以是液体，例如无菌盐水、乳酸林格氏溶或汉克溶液。另外，所述药物组合物可以是固体形式并在使用前立即重新溶解或悬浮。还考虑了冻干形式。所述药物组合物可以包含在也适用于肠胃外施用的如脂质体或微晶等脂质颗粒或囊泡中。所述颗粒可以具有任何合适的结构，如单层或多层，只要其中含有组合物即可。化合物可以包埋在“稳定的质粒脂质颗粒”(SPLP)中，所述颗粒含有融合脂质二油酰磷脂酰乙醇胺(DOPE)、低水平(5-10mol％)的阳离子脂质，并通过聚乙二醇(PEG)涂层进行稳定(ZhangY.P.等人,《基因疗法(Gene Ther.)》,1999,6:1438-47)。带正电荷的脂质如N-[l-(2,3-二油酰氧基)丙基]-N,N,N-三甲基-甲基硫酸铵或“DOTAP”对于此类颗粒和囊泡来说是特别优选的。此类脂质颗粒的制备是众所周知的。参见例如美国专利第4,880,635号；第4,906,477号；第4,911,928号；第4,917,951号；第4,920,016号；和第4,921,757号；所述文献中的每一个通过引用并入本文。

例如，本文所述的药物组合物可以作为单位剂量施用或包装。当用于指本公开的药物组合物时，术语“单位剂量”是指适合作为用于受试者的单一剂量的物理上离散单位，每个单位含有预定量的经计算结合所需稀释剂(即，载体或媒剂)可产生期望的治疗效果的活性材料。

进一步地，所述药物组合物可以作为药物试剂盒提供，所述药物试剂盒包括(a)含有冻干形式的本发明化合物的容器和(b)含有药学上可接受的稀释剂的第二容器(例如，用于重构或稀释本发明的冻干化合物的无菌稀释剂)。与一个或多个这种容器任选地相关联的可以是处于由管理药物或生物制品的制造、使用或销售的政府机构规定的形式的公告，所述公告反映了机构针对人类施用在制造、使用或销售方面的许可。

在另一方面，包含一种含有可用于治疗上述疾病的材料的制品。在一些实施例中，所述制品包括容器和标签。合适的容器包含例如瓶子、小瓶、注射器和试管。所述容器可以由各种材料如玻璃或塑料形成。在一些实施例中，所述容器容纳有效治疗本文所述疾病的组合物并且可以具有无菌进入端口。例如，所述容器可以是静脉内溶液袋或具有可被皮下注射针刺穿的塞子的小瓶。所述组合物中的活性剂是本发明的化合物。在一些实施例中，容器上或与容器相关的标签指示组合物用于治疗选择的疾病。所述制品可以进一步包括第二容器，所述第二容器包括药学上可接受的缓冲剂，如磷酸盐缓冲盐水、林格氏溶液或右旋糖溶液。所述制品可以进一步包含从商业和用户的角度来看合乎期望的其它材料，所述其它材料包含其它缓冲液、稀释剂、过滤器、针、注射器和具有使用说明的包装***物。

在一些实施例中，CRISPR***(例如，包含本文所述的Cas9)作为药物组合物的一部分提供。在一些实施例中，所述药物组合物包括本文提供的任何融合蛋白(例如，包含本文所述的包括LubCas9的核碱基编辑器)。在一些实施例中，所述药物组合物包括本文提供的任何复合物。在一些实施例中，所述药物组合物包括核糖核蛋白复合物，所述复合物包括与gRNA和阳离子脂质形成复合物的RNA向导的核酸酶(例如，Cas9)。在一些实施例中，所述药物组合物包括gRNA、核酸可编程DNA结合蛋白、阳离子脂质和药学上可接受的赋形剂。药物组合物可以任选地包括一种或多种另外的治疗活性物质。

试剂盒

一方面，本文所述的合成gRNA可以由含有上述方法和组合物中公开的任何一种或多种元件的试剂盒提供和/或产生。例如，试剂盒可以包含受体RNA、供体RNA、连接酶和合适的缓冲试剂。所述受体RNA、供体RNA和连接酶可以是本文公开的任何物质。

在一些实施例中，所述试剂盒进一步包括核碱基编辑器。

在一些实施例中，试剂盒包括用于在利用本文所描述的元件中的一个或多个元件的方法中使用的一种或多种试剂。可以在任何适合的容器中提供试剂。例如，试剂盒可以提供一种或多种反应或储存缓冲液。试剂可以以可用于特定测定中的形式或以在使用前需要添加一种或多种其它组分的形式(例如，以浓缩物或冻干的形式)提供。缓冲液可以是任何缓冲液，包含但不限于碳酸钠缓冲液、碳酸氢钠缓冲液、硼酸盐缓冲液、Tris缓冲液、MOPS缓冲液、HEPES缓冲液和其组合。在一些实施例中，缓冲液是碱性的。在一些实施例中，缓冲液的pH为约7到约10。在一些实施例中，所述试剂盒包括一种或多种与向导序列相对应的寡核苷酸以用于***到载体中以可操作地连接向导序列和调节元件。在一些实施例中，所述试剂盒包括同源重组模板多核苷酸。

本文提及的所有出版物、专利申请、专利和其它参考通过引用整体并入。另外，所述材料、方法和实例仅是说明性的并且不意在是限制性的。除非另有定义，否则本文所使用的所有技术和科学术语均具有与本发明所属领域普通技术人员所通常理解的相同含义。尽管类似或等效于本文所述的方法和材料的方法和材料可以用于实践或测试本发明，但本文描述了合适的方法和材料。

实例

以下实例描述了制作和实践本发明的一些优选模式。然而，应理解，这些实例仅用于说明目的，并不意味着限制本发明的范围。

实例1.RNA的传统合成

传统的RNA合成包含使用质粒DNA和使用亚磷酰胺化学的固相合成(“合成RNA”)。下文详述了合成RNA的化学合成和基于酶的合成的比较。

方向性

合成RNA通常在3'到5'方向上合成。对于sgRNA，这意味着大多数副产物是那些在5'末端的间隔子区域中具有截短的产物，这将导致较低的中靶编辑。

底物

化学合成利用高反应性单体。这些单体受到官能团的化学保护，以减少副反应并确保期望的反应在正确的合成阶段发生。这些单体被称为“亚酰胺”，是指它们之间共有的亚磷酰胺官能团。亚磷酰胺核心周围的化学基团可以进行大量修饰，并且无需类似于天然存在的核苷酸。出于此原因，化学合成可以用于安装高度修饰的单体，所述单体包含经修饰的糖、碱基、骨架或不类似于天然核苷酸的官能团。

顺序性

合成RNA通常通过在固体支撑物上进行序列控制聚合来合成。化学合成以循环方式进行，每个循环包括多个步骤(参见图1)。此序列被设计成尽可能地防止***不期望的核苷酸或缺失。对在任何给定阶段未能掺入到正在生长的聚合物中的寡聚物进行化学“封端”，以防止它们延伸到它们“未能”掺入的序列中的位置之外。“偶联效率”是指每个循环的整体效率的术语。此值在很大程度上取决于亚酰胺的性质，但也可能受到仪器设计或反应规模的影响。典型的DNA偶联效率约为98-99.5％并且DNA的偶联效率通常高于RNA。

纯化

在纯化前，首先将寡核苷酸产物去保护并从固体支撑物上切割。纯化通常通过电泳分离(即聚丙烯酰胺凝胶电泳或“PAGE”)或更常见的柱色谱法(即HPLC)进行。使用阴离子交换或反相离子配对介质的固定相进行HPLC。随着全长产物的长度增加，这两种方法都会以指数方式损失分辨率。这尤其成问题，因为纯化后与FLP的混合物中最常见的副产物在长度上与全长产物相似。此外，相对于用于产生用于研究目的的材料的更常用的小规模合成，GMP级材料所需的大规模合成的特征在于偶联效率通常较低，从而导致纯度降低和加成产物数量增加。偶联效率的差异最常见的原因是随着合成规模的增加需要更长的偶联时间。长度约为100nt的寡聚物(即，碱基编辑中使用的向导RNA)很难与仅短几个nt的寡聚物进行物理分离。由于这些限制，从CMO获得的gRNA纯度通常在50-90％范围内。对于典型的合成gRNA合成策略，包括剩余10-50％的大多数杂质在间隔子区域(主要是截短产物)和加成产物中含有缺失。这些类型的杂质会导致编辑效率低下和/或脱靶编辑。

用于产生长RNA的改良方法的优势

出于以下几个原因，用于通过化学合成产生高纯度长RNA(例如，100个核苷酸或更多)的方法是期望的，所述原因包含：与传统合成方法相比，减少脱靶编辑、高效编辑、提高纯度、提高产率、降低成本以及修饰合成RNA中核苷酸的通用性。

用于产生RNA的改良化学合成方法可以减少脱靶编辑。纯度和脱靶编辑可能是相关的。有证据表明截短产物(主要副产物)的情况相反，这似乎减少了脱靶和中靶编辑两者；然而，加成产物可能会增加脱靶编辑。

用于产生RNA的改良化学合成方法可以实现高效编辑。这至少是因为大多数杂质(例如，截短物)会降低编辑活性。

与传统合成方法相比，用于产生RNA的改良化学合成方法可以提高纯度。合成RNA纯度的提高将更易于监管机构批准用于治疗人类患者。

用于产生RNA的改良化学合成方法可以提高产率并降低成本。合成RNA过程的产率通常随着合成RNA的长度呈指数下降。通常，纯化后仅获得理论产率的3-5％，尽管在反应中产生了20-30％的全长产物(FLP)(因此，在纯化过程中损失了反应中产生的>90％的FLP)。例如，5克GMP级FLP(10克纯度为50％的材料)的成本可能为1-2百万美元。如果在纯化期间可以分离出大部分FLP，则生产成本将降低5-10倍并与纯度提高相关。

最后，用于产生RNA的改良化学合成方法可以实现专门安装经修饰的核苷酸和化学功能，这是使用酶合成无法实现的。

实例2：基于连接的RNA合成方法

本实例中描述的基于连接的方法利用了一个或多个RNA片段，所述片段随后被连接以产生全长向导RNA(gRNA)。由于副产物的更好分离等，一个或多个RNA片段的产生使得gRNA的纯化后产率更高。

基于连接的方法的一个方面使用在构成生物学中使用的双向导RNA***的crRNA与tracrRNA分子之间形成的螺旋(称为重复-反-重复螺旋)，以模板化两个合成RNA的酶促连接。这在图2中展示。

在一些实施例中，此螺旋的长度和序列组成经过修饰，以促进正确的非共价组装，并为与RNA连接相容的酶创建最佳连接位点。这种类型的缔合需要5到50的核苷酸长度。在一些实施例中，当供体核碱基是C并且受体是A时，酶促连接可能更有效。在一些实施例中，非共价组装的RNA的Tm(熔融温度)大于0℃、1℃、2℃、3℃、4℃、5℃、6℃、7℃、8℃、9℃、10℃、11℃、12℃、12℃、14℃、15℃、16℃、17℃、18℃、19℃、20℃或更高。例如，可以将茎的长度修饰为足够长以促进茎环的形成高于将进行连接的温度，并且还避免非连接相容的自身结构。作为另一个实例，间隔子序列的可变性可能导致与连接不相容的碱基配对，这可以通过在与供体序列组合之前添加具有与间隔子序列互补的序列的寡核苷酸来避免。

在一些实施例中，合成的包括tracrRNA序列的RNA(称为“供体”)在5'-末端处具有磷酸酯，所述末端通过多种连接酶之一连接到包括可变原型间隔子区域的第二RNA(称为“受体”)的3'-末端。在一些实施例中，合成包括tracrRNA序列的RNA，使得一部分tracrRNA在5'-末端处含有磷酸酯。

这种方法可能有两种连接形式(图3，小图A(1)和(2))，这两种形式都位于茎环区域内。第一种连接形式发生在发夹的末端环内，所述末端环是T4 RNA连接酶1的天然位点。第二种连接形式发生在双链体内，所述双链体是T4 RNA连接酶2和DNA连接酶的天然物。这种连接形式的优势之一是片段杂质很容易去除，因为融合的gRNA和片段杂质之间的洗脱时间存在显著差异(图3，小图B)。

本发明的另一种基于连接的方法涉及通过非模板方法连接两个或更多个RNA片段。在这种方法中，供体分子的3'末端的3'羟基被化学封闭或去除(例如，双脱氧核苷酸)，并且酶(例如，T4 RNA连接酶1)将催化两个分子之间的正确连接。通常，这种连接策略在较高浓度下更受青睐。

此实例中描述的连接方法利用连接酶，所述连接酶是一类将核酸片段相互组合的酶。使用此类连接酶的优势之一是RNA片段之间产生的连接与天然存在的RNA或DNA没有区别。连接酶作用于RNA或DNA并高效地进行反应。

在一些实施例中，通过使用与第一和第二RNA片段具有互补性的核酸模板，可以使用于连接的RNA片段物理接近以进行连接反应。此模板在本文中被称为夹板链。可以设计不完美配对的夹板链，以生成适合通过特定连接酶(例如T4 RNA连接酶1)连接的环。在一些实施例中，夹板链用于将多于两个RNA片段连接在一起。

在一些实施例中，所述RNA片段可以在连接反应之前通过碱基配对相互缔合。此方法在本文中称为“自模板”。使用自模板方法，可以选择用于连接RNA片段的茎环的位置包含环或在其中一个寡聚物含有短茎环(例如，自模板缺口)的螺旋中。切口可以包含在夹板链、突出端、钝端，并且也可以使用凸起(参见图5)。

在一些实施例中，所述连接反应可以以高产率进行，而无需事先物理缔合RNA区段。鉴于此，选择连接反应不需要使用夹板链或自模板。

本发明的不同连接方法在图5中描绘。

正在使用本文所述的基于连接的方法检查各种连接设计(图6)。如图6所描绘，这些设计之一涉及在茎环的环处连接两个RNA片段(图6，小图B)；另一种设计涉及在茎环的螺旋处进行连接(图6，小图C)。

这些连接策略不同于其它报道的用于合成sgRNA的化学连接策略，因为所描述的连接策略在连接位点处形成天然磷酸键。使用分段合成方法的优势在于，与全长sgRNA相比，可以在纯化后以更高的纯度产生RNA的短区段。在一些实施例中，5'受体是最小的RNA片段(30-50个核苷酸)，并且因此可以在连接前纯化至高水平。3'供体以合成所需的磷酸酯终止，并且因此只有全长片段将被掺入全长产物中(即，截短物不是底物)。

当考虑大于100个核苷酸的gRNA如pegRNA或Cas12b gRNA时，这一优势会增加。酶促连接类型产率非常高(>80％)，并且寡核苷酸起始材料可以高选择性地与连接产物分离，从而确保全长产物非常纯。此外，这些类型的酶促连接相对便宜且规模良好。

实例3：示例性基于连接的RNA合成方案

下文提供了用于合成合成RNA的示例性方案。

1.茎大小和连接位点(环或螺旋)的选择基于i)对所用连接酶的天然底物的要求(例如，环与螺旋设计)和ii)双分子螺旋的亲和力，所述亲和力使用用于RNA双链体稳定性的热力学算法确定。

2.使用标准亚磷酰胺化学合成RNA片段。3'RNA片段(供体)含有末端5'磷酸酯，所述磷酸酯包含在合成的最后一步中。

3.RNA片段通过HPLC纯化(片段也可以通过使用阴离子交换色谱法(AEX)或离子对反相色谱法(IP-RP)进行纯化。

4.退火：将每个寡核苷酸(0.01-1mM)与退火缓冲液(25mM KCl，0.025mM EDTA)合并。加热至80℃持续0.5-5分钟，然后以0.1℃/秒的速度冷却至25℃。

5.连接：添加RNA连接酶缓冲液以达到1X浓度(50mM Tris-HCl、10mM MgCl2、1mMDTT、1mM ATP，pH 7.5，温度介于20-37℃之间)。添加5-10U的T4 RNA连接酶1/nmol磷酸化5'端。在20-37℃的温度下温育过夜。通过添加0.5M EDTA停止。

6.使用离子对反相色谱法(IP-RP)(也可能是AEX)进行纯化。

7.通过用SYBR Safe和IP-RP HPLC染色的6％PAGE-D凝胶进行分析。

连接实验的示例性结果在图7中呈现。对于此连接，所述反应含有10μM供体片段、10μM受体片段、1x T4 RNA连接酶2反应缓冲液(NEB)和20单位的T4 RNA连接酶2，并在37℃下进行。图7，小图A示出了用于连接实验的序列。茎连接的结果示出于图7，小图C中。通过HPLC检测全长产物，以及RNA受体和供体片段与全长产物的分离。

实例4：描述的方法与先前方法之间的差异

本发明的连接方法不同于先前描述的RNA连接方法，因为除其它外，先前描述的连接方法依赖于片段RNA分子之间的非天然键和/或使用非模板连接方法，如通过使用叠氮化物-炔烃环加成反应，以通过非天然的替拉唑(tirazole)键将较小的RNA分子偶联到sgRNA中。如前所述，使用非天然键有几个缺点，包含非天然键可能在生物***中产生不良影响。

本文所述的连接方法也不同于先前使用的化学连接策略，后者使用其它版本的“点击化学”或其它化学生物缀合方法将RNA片段组合成全长sgRNA(参见图4)。其它先前描述的组合RNA片段的方法包含使用酰胺连接化学(例如，通过酰胺偶联18个原子的连接子)和自模板形成sgRNA。先前的方法是不利的，至少是因为：i)与本文所述的本发明中的磷酸酯的掺入不同，用于连接的化学基团不太可能以高产率掺入；以及ii)先前使用的键是非天然的并且比天然的磷酸二酯键大得多。由于这些限制，先前描述的RNA连接方法可能会损害效力并带来额外的监管负担。

实例5：sgRNA的产生——连接酶的比较

在此实例中，评估两种构建体，一种在环中发生连接，另一种在茎中发生连接(图3)，以确定哪种连接酶使sgRNA产物达到最高产率。T4 RNA连接酶1用于环处的连接，T4 RNA连接酶2用于茎中的连接。

图3，小图A描绘了评估的两个酶促连接位置：(i)在茎环的环中，以及(ii)在螺旋中。在这两种情况下，此茎环都被延伸并用于缔合用于酶促连接的区段。图3，小图B描绘了代表性图，所述图示出了连接后可以进行最终纯化步骤，包括HPLC以去除未连接的RNA片段。从全长产物中纯化RNA片段是可能的。

开发了一种使用化学和酶相结合的策略合成单向导RNA的方法，所述方法克服了限制合成RNA的纯度和最终(纯化后)产率的挑战。这种方法称为L.O.N.G.E.S.T.(使用酶和自模板连接核酸向导)，使用基于连接的方法，其中两个或更多个部分互补的合成RNA使用酶连接。在一个实施例中，在构成由SpCas9在生物学中使用的双向导RNA***的crRNA与tracrRNA分子之间形成螺旋(称为重复-反-重复螺旋)，以模板化两种合成RNA的酶促连接(图3)。可以修改此螺旋的长度和序列组成，以促进适当的非共价组装，并为与RNA连接相容的酶创建最佳连接位点，而不会降低RNP复合物的活性。合成的包括大部分tracrRNA序列的RNA可以在5'-末端具有磷酸酯(称为供体)，所述末端通过任一T4 RNA连接酶1或T4 RNA连接酶2连接到包括可变原型间隔子区域的第二RNA(称为受体)的3'-末端。用这种方法举例说明了两种形式的连接(图3)，第一种在发夹的末端环(T4 RNA连接酶1的底物)内，并且第二种在双链体(T4 RNA连接酶2和DNA连接酶的底物)内。

在这些实验中，评估了T4 RNA连接酶1和T4 RNA连接酶2，以及供体/受体RNA片段设计。这些gRNA的原型间隔子是α1。经确定，与T4 RNA连接酶1相比，T4 RNA连接酶2的产率最高并且副产物最少。还发现，与“标准”gRNA设计相比，供体/受体设计仅向最终sgRNA产物添加两个碱基，并在此处检查的条件下产生sgRNA的定量产率。

实验条件。

所有含有T4 RNA连接酶2的反应均含有10μM供体、10μM受体、1x T4 RNA连接酶2反应缓冲液和20单位的T4 RNA连接酶2。所有反应均在37℃下进行15小时。

对于利用T4 RNA连接酶1的反应，所有反应均含有10μM供体、10μM受体、NEB反应缓冲液、1mM ATP和20单位的T4 RNA连接酶1。一些反应还含有25％(wt/vol)PEG 8000。反应在25℃下进行15小时。

所有反应均在热循环仪中以50μL进行。为了形成预连接复合物，首先将溶液与除连接酶外的所有组分一起加热至70℃，并对于T4 RNA连接酶2或T4 RNA连接酶1，以0.1℃/秒的速度分别缓慢冷却至37℃或25℃。

RNA供体和RNA受体设计-T4 RNA连接酶1和T4 RNA连接酶2

首先评估了由RNA受体1(Acp-01)和RNA供体1(Dnr-1)组成的茎连接设计。四环的连接后螺旋在具有混合GCAU含量的上螺旋中总共含有14个碱基对(连接前复合物中片段之间的10个碱基对)(图8，小图A)。该反应产率高，在存在T4 RNA连接酶2的样本中几乎没有可检测的片段量(图8，小图B)。使用连接酶和仅Dnr-01或Acp-01的对照反应(未示出)未示出形成副反应。

评估的另一种RNA供体和RNA受体设计是RNA受体2(Acp-02)和RNA供体2(Dnr-2)的螺旋连接设计。连接后螺旋在具有混合的GCAU含量的上螺旋中含有14个碱基对(图9，小图A和B)。与T4 RNA连接酶2的反应相比，该反应的产率较低(～60％)。使用连接酶和(磷酸化)Dnr-02的对照反应(未示出)仅示出形成副反应(使用T4 RNA连接酶1可能使Dnr-02环化)。在存在T4 RNA连接酶2的情况下，Acp-02与Dnr-02之间的反应不会形成产物，因为T4 RNA连接酶2需要双链复合物。这些实验的数据表明，T4 RNA连接酶2优于T4 RNA连接酶1。其余数据是使用T4 RNA连接酶2生成的。

RNA供体和RNA受体设计-GC含量和茎核苷酸长度的影响

与最初的Dnr-01/Acp-01四环设计相比，评估了两种RNA构建体，所述构建体具有以下特性：i)上部和下部茎中较高的GC含量；以及ii)较短的上部茎(图10，小图A-D)。虽然下部茎被认为与Cas9相互作用，但先前的报道表明U轨道中的四个碱基中的三个可以被GC碱基对取代。对具有这些替代的sgRNA进行评估，发现它们虽然具有活性，但其活性低于标准sgRNA设计的活性。

所述数据表明，Acp-03和Dnr-03与连接酶之间的反应是富有成效的，并且与高产率合成相容。Acp-04和Dnr-04与连接酶的反应是富有成效的，似乎已完成，如Dnr-04峰的丢失所示。Acp/Dnr-04***代表相对于Acp/Dnr-01***的显著进步，因为它缩短了7个碱基对，但仍然具有同样的成效。

在使用将底部茎的U轨道部分替换为GC碱基对(如Acp/Dnr-03和Acp/Dnr-04所示)的gRNA的研究减少了编辑结果后，评估了不改变底部茎的U轨道并且还包含较短的上部茎的设计(图11)。还检查了一种设计(Acp/Dnr-06)，所述设计具有与由Acp/Dnr-03连接形成的sgRNA的上部茎序列相似的上部茎序列。然而，连接位点被放置在距离四环一bp的位置。

所述数据显示出Acp-05和Dnr-05与连接酶之间的反应与Acp/Dnr-04反应***一样富有成效，这表明在这些早期设计中下部茎环中较高的GC含量不是定量反应所必需的(至少使用α-1原型间隔子)。Acp-06和Dnr-06与连接酶的反应也富有成效。因为上部茎环与Acp/Dnr-03的类似，仅连接位点的位置发生变化，所以这些结果表明距四环至少三个碱基对的连接位点允许有效连接。Acp/Dnr-06***表明，“标准”sgRNA设计的最小变化与高产率合成相容，因为它仅具有单个额外的碱基对。

检查“标准”sgRNA设计以查看它是否与连接相容(图12)。因为上部茎环仅含有四个碱基对，所以连接位点距四环仅两个碱基对。在存在连接酶的情况下，Acp-07与Dnr-07之间的反应的产率很低(图13)。还存在其它副反应，进一步表明组装良好的双链体可用于高产率反应。

也使用相同的供体片段(Dnr-05)与两个不同的受体片段(Acp-05和Acp-05_v2)进行RNA连接反应，所述受体片段仅在供体和受体片段之间的自组装不需要的原型间隔子序列中变化。这说明了将通用供体与各种受体片段组合使用的概念。

RNA供体和RNA受体设计——RNA浓度对反应生产率的影响

进行了研究以评估RNA浓度对反应生产率的影响。对于这些研究，使用Acp/Dnr-05和Acp/Dnr-6。与Acp/Dnr-6相比，Acp/Dnr-05具有更稳定的受体/供体双链体。在这些研究中，评估了两个片段的浓度，因为它与sgRNA生产率的生产率有关(图13)。所述数据表明，具有更稳定的A/D双链体可以在更高的底物浓度下实现更高的产率。

基于这些数据，1mg/ml或更高浓度可能是适合制造的浓度。此外，连接反应的温度也会影响数据(请注意，此处描述的所有实验均在37℃下进行)。还示出了T4 RNA连接酶2在20℃时有效。图13示出了产率最高为大约80％，但这可能是因为供体片段中存在与连接不相容但仍会增加起始材料吸收的如截短物等副产物并且因此此值被低估。

对sgRNA生产率的热力学影响

在所测试的条件下，热力学更稳定的双链体(通过增加长度和/或GC含量形成)在一定程度上提供了更高的产率，但对“标准”设计的这些改变不需要形成产物，因为仍然获得了60％产率，而仅适度的修饰可以实现更高的产率，这种优势不会线性扩展，由于它在仅1个额外bp处接近限值——从结果可以看出，1和10个额外bps提供了相似的产率，而在上螺旋中具有4个bps的“标准”sgRNA设计的产率明显低于在上螺旋(AD-06)中仅使用1个额外bp的产率。

值得注意的是，这里描述的所有研究都在37℃下进行，并且这种T4 RNA连接酶2也可以耐受较低的温度，如果是这样，那么在较低温度下使用“标准”4bp上螺旋可能会产生更高的产率。因此，改变条件会导致能量关闭组装发生变化。因此，可以使用各种参数，包含RNA设计的外部或内在参数来实现这一目标。这些条件包含例如反应温度和RNA浓度的变化。

结论

这些数据建立了用于L.O.N.G.E.S.T.方法的片段和连接酶的设计规则。具体地，发现T4 RNA连接酶2比T4 RNA连接酶1的产率更高，并且产生的副反应更少。还发现T4 RNA连接酶2可容纳双链底物，其连接位点与四环相距三个或更多个碱基对。还发现一种片段设计(Acp/Dnr-06)，与标准sgRNA设计(分别为102个核苷酸与100个核苷酸)相比，所述片段设计产率高并且仅含有一个额外的碱基对。另外的研究将旨在利用此***针对编辑活性和扩大反应评估Acp/Dnr-06设计。

实例6：对骨架修饰的耐受性和温度耐受性

对骨架修饰的耐受性

已分析各种片段以确定对骨架修饰的耐受性。分析了以下片段：i)完全RNA；ii)那些在末端处含有2'O-甲基和硫代磷酸酯基团的序列，通常称为“末端mods”；以及iii)含有48个核苷酸(48％)的序列，所述序列用2'O-甲基修饰，包含在连接位点处(5'供体核苷酸和3'受体核苷酸)的修饰。已经测试了基于Acp/Dnr-05和Acp/Dnr-6设计(分别为AD_09和AD_08)的两组经修饰的向导。这些研究的数据示出于图14，小图A和B中。这些数据共同示出了经广泛修饰的片段的成功反应。

温度耐受性

sgRNA在20℃和37℃下产生。这些实验的数据表明，在任一测试温度下的反应都是富有成效的。所述反应在20℃(室温)下也起作用的发现表明所述反应是稳健的，并且可以在使制造更容易的温度下进行。

实例7：细胞中的碱基编辑

针对纯化产物的特定基因靶标的碱基编辑活性已在哺乳动物细胞中成功进行。这些数据是使用DA-05、DA-06和AD-08分别从Acp-05和Dnr-05、Acp-06和Dnr-06以及Acp-08和Dnr-08的反应中获得的。(图15)。对于这些研究，使用腺嘌呤碱基编辑器(ABE)编辑成纤维细胞中的靶位点，并使用自模板连接方法合成三种向导RNA(AD-08、AD-05、AD-06)之一。

实例8：Cas12b向导RNA

本文公开的方法可以用于合成Cas12b sgRNA。图16是描绘了与来自外村尚芽孢杆菌的示例性Cas12b sgRNA、bhCas12b sgRNA缔合的序列和构型的示意图。各种特征，包含各种二级结构，如四环，可以用作***和连接的靶标，以产生期望的Cas12b sgRNA。

图16示出了可以靶向以***sgRNA，然后根据本文描述的方法进行后续连接的各种示例性位置。图16示出了bhCas12b sgRNA的二级结构，其含有可变原型间隔子区域和不变区域。标记A、B和C表示可以作为用于***sgRNA的位置靶向的发夹环结构。标记为C的发夹的双链体可以在其环近端位置处延伸，以促进供体和受体杂交，因为此四环不接触Cas蛋白。

序列

表4(下)示出了在实例和对应图中引用的序列。

表4：引用的序列

mN表示具有2'OMe修饰的核苷酸；N*表示具有3'硫代磷酸酯修饰的核苷酸；“p”表示具有磷酸酯基团的位置。

等效物和范围

本领域的技术人员将认识到或者使用仅常规实验能够确定，本文所描述的本发明的具体实施例的许多等效形式。本发明的范围不旨在限于以上说明书，而是如以下权利要求书所述。

Claims

1.一种方法，其包括：使第一RNA与第二RNA接触，

其中所述第一RNA和所述第二RNA包括至少五个互补的RNA核苷酸，并且其中所述接触形成茎结构或茎环结构，以及

用连接酶

(i)在所述茎结构内

(ii)或在所述茎结构的端部处连接所述第一RNA和所述第二RNA，从而在所述茎结构的所述端部处形成环。

2.根据权利要求1所述的方法，其中所述接触形成茎结构，并且所述连接酶在所述茎结构的所述端部处连接所述第一RNA和所述第二RNA，从而在所述茎结构的所述端部处形成环。

3.根据权利要求1所述的方法，其中所述接触形成茎环结构，并且所述连接酶在所述茎环结构的茎内连接所述第一RNA和所述第二RNA。

4.根据前述权利要求中任一项所述的方法，其中所述连接酶选自由以下组成的组：T4RNA连接酶1、T4 RNA连接酶2、RtcB连接酶、热稳定性5'App DNA/RNA连接酶、ElectroLigase、T4 DNA连接酶、T3 DNA连接酶、T7 DNA连接酶、Taq DNA连接酶、SplintR连接酶、大肠杆菌DNA连接酶、9°N DNA连接酶、CircLigase、CircLigase II、DNA连接酶I、DNA连接酶III和DNA连接酶IV。

5.根据权利要求2所述的方法，其中所述连接酶是T4 RNA连接酶1。

6.根据权利要求3所述的方法，其中所述连接酶是T4 RNA连接酶2。

7.根据前述权利要求中任一项所述的方法，其中所述第一RNA和/或所述第二RNA是化学合成的。

8.根据前述权利要求中任一项所述的方法，其中所述第一RNA是成簇规律间隔短回文重复序列(CRISPR)RNA(crRNA)并且所述第二RNA是反式激活RNA(tracrRNA)。

9.根据前述权利要求中任一项所述的方法，其中产生向导RNA(gRNA)。

10.根据前述权利要求中任一项所述的方法，其中所述第一RNA和/或所述第二RNA是化学合成的。

11.根据权利要求1到9中任一项所述的方法，其中所述第一RNA和/或所述第二RNA是酶促合成的。

12.根据前述权利要求中任一项所述的方法，其中用连接酶连接所述第一RNA和所述第二RNA在所述第一RNA与所述第二RNA之间产生磷酸二酯键。

13.根据前述权利要求中任一项所述的方法，其中所述第一RNA和/或所述第二RNA核苷酸经工程化以允许非共价组装。

14.根据前述权利要求中任一项所述的方法，其中所述茎环的长度介于约2-50个核苷酸之间。

15.根据前述权利要求中任一项所述的方法，其中所述第一RNA和所述第二RNA包括至少两个具有完全互补性的RNA核苷酸。

16.根据权利要求14所述的方法，其中所述第一RNA和所述第二RNA包括至少三个、四个、五个、六个或七个具有完全互补性的连续RNA核苷酸。

17.根据权利要求15或16所述的方法，其中所述具有完全互补性的RNA核苷酸存在于顶部茎和/或底部茎中。

18.根据前述权利要求中任一项所述的方法，其中所述第一RNA和所述第二RNA在由所述第一RNA和所述第二RNA形成的下部茎处包括至少五个、六个或七个互补的连续RNA核苷酸。

19.根据前述权利要求中任一项所述的方法，其中所述第一RNA和所述第二RNA在上部茎处包括至少四到十四个互补的连续RNA核苷酸。

20.根据权利要求19所述的方法，其中所述第一RNA和所述第二RNA在上部茎处包括四个互补的连续RNA核苷酸。

21.根据权利要求19所述的方法，其中所述第一RNA和所述第二RNA在上部茎处包括五个互补的连续RNA核苷酸。

22.根据权利要求19所述的方法，其中所述第一RNA和所述第二RNA上部茎处包括七个在互补的连续RNA核苷酸。

23.根据权利要求19所述的方法，其中所述第一RNA和所述第二RNA在上部茎处包括14个互补的连续RNA核苷酸。

24.根据前述权利要求中任一项所述的方法，其中所述第一RNA和所述第二RNA在下部茎处包括7个互补的连续RNA核苷酸。

25.根据前述权利要求中任一项所述的方法，其中所述第一RNA和/或所述第二RNA经工程化以产生用于连接酶的连接位点。

26.根据前述权利要求中任一项所述的方法，其中所述茎环包括4个、5个、6个、7个、8个、9个、10个、11个、12个、13个、14个、15个或16个核苷酸的环。

27.根据前述权利要求中任一项所述的方法，其中所述茎环包括四环。

28.根据权利要求16所述的方法，其中所述环包括7个核苷酸。

29.根据权利要求26到28中任一项所述的方法，其中连接所述第一RNA和所述第二RNA发生在距所述环至少1个、2个、3个、4个、5个、6个、7个、8个、9个或10个碱基对的连接位点处。

30.根据权利要求29所述的方法，其中所述连接位点距所述环2个或3个碱基对。

31.根据前述权利要求中任一项所述的方法，其中连接所述第一RNA和所述第二RNA发生在距凸起至少3个、4个、5个、6个、7个、8个、9个、10个、11个或12个碱基对的连接位点处。

32.根据权利要求31所述的方法，其中连接所述第一RNA和所述第二RNA发生在距所述凸起3个、4个、5个或11个碱基对的连接位点处。

33.根据前述权利要求中任一项所述的方法，其中所述第一RNA和/或第二RNA是酶促产生的。

34.根据前述权利要求中任一项所述的方法，其中所述第一RNA包括能够与所述第二RNA的一部分碱基配对的3'序列。

35.根据前述权利要求中任一项所述的方法，其中所述第一RNA在5'末端处包括磷酸酯。

36.根据权利要求35所述的方法，其中所述第一RNA是供体RNA。

37.根据前述权利要求中任一项所述的方法，其中所述第二RNA包括可变原型间隔子区域。

38.根据权利要求37所述的方法，其中所述第二RNA是受体RNA。

39.根据权利要求35所述的方法，其中所述第一RNA在5'末端处包括三磷酸腺苷。

40.根据前述权利要求中任一项所述的方法，其中约8-50个核苷酸是互补的并且允许在所述第一RNA与所述第二RNA之间进行碱基配对。

41.根据权利要求40所述的方法，其中所述8-50个核苷酸是部分互补的。

42.根据权利要求41所述的方法，其中所述8-50个核苷酸是约50％到99％互补的。

43.根据权利要求41所述的方法，其中所述8-50个核苷酸是完全互补的。

44.根据前述权利要求中任一项所述的方法，其中所述第一RNA和所述第二RNA具有不同的核苷酸长度。

45.根据权利要求44所述的方法，其中所述第一RNA具有约20-100个核苷酸。

46.根据前述权利要求中任一项所述的方法，其中所述第二RNA具有约20-70个核苷酸。

47.根据前述权利要求中任一项所述的方法，其中碱基配对发生在下部茎中。

48.根据权利要求47所述的方法，其中7个核苷酸在所述下部茎中是互补的并且允许在所述第一RNA与所述第二RNA之间进行碱基配对。

49.根据权利要求47或48中任一项所述的方法，其中所述碱基配对发生在上部茎中。

50.根据权利要求49所述的方法，其中2个核苷酸在所述上部茎中是互补的并且允许在所述第一RNA与所述第二RNA之间进行碱基配对。

51.根据权利要求9到50中任一项所述的方法，其中所述gRNA的长度为约100个核苷酸、约125个核苷酸、约150个核苷酸、约175个核苷酸、约200个核苷酸或大于约200个核苷酸。

52.根据前述权利要求中任一项所述的方法，其中所述gRNA是扩展向导RNA、引导编辑器向导RNA(pegRNA)或Cas12向导RNA，如Cas12a向导RNA、Cas12b向导RNA、Cas12c向导RNA、Cas12d向导RNA、Cas12e向导RNA、Cas12f向导RNA、Cas12g向导RNA、Cas12h向导RNA、Cas12i向导RNA、Cas12j向导RNA或Cas12k向导RNA。

53.根据前述权利要求中任一项所述的方法，其中所述gRNA包括以下中的一个或多个：间隔子、下部茎、凸起、上部茎、连结和发夹。

54.根据前述权利要求中任一项所述的方法，其中所述第一RNA和所述第二RNA以约0.5:1、0.6:1、0.7:1、0.8:1、0.9:1、1:1、1:0.9、1:0.8、1:0.7、1:0.6或1:0.5的比率存在。

55.根据前述权利要求中任一项所述的方法，其中所述gRNA以约50％、55％、60％、65％、70％、75％、80％、85％、90％、95％、99％或更大的产率产生。

56.根据前述权利要求中任一项所述的方法，其中与常规合成方法相比，所述gRNA以高50％、55％、60％、65％、70％、75％、80％、85％、90％、95％、99％或更多的产率产生。

57.一种产生合成向导RNA(gRNA)的方法，所述方法包括：

提供包括5'-单磷酸酯的第一RNA；

提供第二RNA′；

提供与所述第一RNA和所述第二RNA具有部分互补性的寡核苷酸，其中所述寡核苷酸的所述互补性允许与所述第一RNA和所述第二RNA进行碱基配对；以及

提供连接酶以催化所述第一RNA与所述第二RNA之间的连接，从而产生所述合成gRNA。

58.一种产生合成向导RNA(gRNA)的方法，所述方法包括：

提供包括5'–单磷酸酯的第一RNA；

提供包括封闭3'端的第二RNA；以及

59.根据权利要求57到58中任一项所述的方法，其中所述第一RNA是反式激活RNA(tracrRNA)，并且所述第二RNA是成簇规律间隔短回文重复序列(CRISPR)RNA(crRNA)。

60.根据权利要求57所述的方法，其中所述寡核苷酸的长度为约100个核苷酸。

61.一种产生合成向导RNA(gRNA)的方法，所述方法包括：

提供两个或更多个RNA片段；

提供与所述两个或更多个RNA片段具有部分互补性的寡核苷酸，其中所述寡核苷酸的所述互补性允许与所述两个或更多个RNA片段进行碱基配对；以及

提供连接酶以催化所述两个或更多个RNA片段之间的连接，从而产生所述合成向导RNA。

62.根据权利要求61所述的方法，其中所述两个或更多个RNA片段在突出端、平端或凸起处连接。

63.一种通过根据权利要求1到62中任一项所述的方法合成的向导RNA(gRNA)或引导编辑向导RNA(pegRNA)。

64.一种用于靶向转录激活、靶向转录抑制、靶向表观基因组修饰或靶向基因组修饰的方法，所述方法包括向真核细胞中引入：

(a)如前述权利要求中任一项所定义的合成向导RNA(gRNA)；

(b)至少一种CRISPR/Cas蛋白或编码所述至少一种CRISPR/Cas蛋白的核酸；

其中(a)和(b)与染色体DNA中的靶序列之间的相互作用引起靶向转录激活、靶向转录抑制、靶向表观基因组修饰或靶向基因组修饰。

65.一种用于靶向RNA修饰的方法，所述方法包括向真核细胞中引入：

(a)如前述权利要求中任一项所定义的合成向导RNA(gRNA)；

其中(a)和(b)与由染色体DNA表达的RNA之间的相互作用引起由所述染色体DNA表达的所述RNA的修饰。

66.根据权利要求65所述的方法，其中由所述染色体DNA表达的所述RNA是信使RNA(mRNA)。

67.根据权利要求64到66中任一项所述的方法，其中所述CRISPR/Cas蛋白选自Cas9、Cpf1、SaCas、Cas12、Cas13或其经修饰的型式。

68.一种用于根据权利要求1到67中任一项产生合成向导RNA(gRNA)的方法。

69.根据权利要求68所述的方法，其中所述第二RNA包括能够与所述第一RNA的一部分碱基配对的3'序列。

70.根据权利要求68或69所述的方法，其中所述第二RNA包括可变原型间隔子区域。

71.根据权利要求68到70中任一项所述的方法，其中所述第一RNA在5'末端处包括磷酸酯。

72.根据权利要求68到71中任一项所述的方法，其中所述接触形成茎环结构，并且所述连接酶在所述茎环结构的茎内连接所述第一RNA和所述第二RNA。

73.根据权利要求72所述的方法，其中所述连接酶是T4 RNA连接酶2。

74.根据权利要求73所述的方法，其中所述茎环在上部茎中包括GC碱基对。

75.根据权利要求74所述的方法，其中所述上部茎包括与CGAUACGACAGAAC至少约80％相同的核苷酸序列。

76.根据权利要求74所述的方法，其中所述上部茎包括与CGCCG至少约80％相同的核苷酸序列。

77.根据权利要求74所述的方法，其中所述上部茎包括与CGGCCGC至少约80％相同的核苷酸序列。

78.根据权利要求74所述的方法，其中所述上部茎包括与CGCGC至少约80％相同的核苷酸序列。

79.根据权利要求74所述的方法，其中所述上部茎包括与CGAU至少约80％相同的核苷酸序列。

80.根据权利要求72所述的方法，其中所述茎环在下部茎中包括GC碱基对。

81.根据权利要求68到79中任一项所述的方法，其中所述下部茎不包括GC碱基对。

82.根据权利要求68到81中任一项所述的方法，其中所述上部茎不包括GC碱基对。

83.根据权利要求68到81中任一项所述的方法，其中所述上部茎包括至少1个、2个、3个、4个、5个或6个、7个、8个、9个、10个、11个或12个GC碱基对。

84.根据权利要求83所述的方法，其中所述茎的上部部分包括2个GC核苷酸。

85.根据权利要求68到84中任一项所述的方法，其中连接所述第一RNA和所述第二RNA导致全长产物的产率为至少60％、70％、80％、90％或超过95％。

86.根据权利要求85所述的方法，其中连接所述第一RNA和所述第二RNA导致至少约60％的产率。

87.根据权利要求1到63或68到86中任一项所述的方法，其中所述gRNA以至少1克的量产生。

88.根据权利要求87所述的方法，其中大规模包括至少5克、10克、20克、30克、40克、50克、60克、70克、80克、90克或100克。

89.根据权利要求1到63或68到88中任一项所述的方法，其中所述gRNA以少于1克的量产生。

90.根据权利要求89所述的方法，其中所述gRNA以约0.05克、0.1克、0.2克、0.3克、0.4克、0.5克、0.6克、0.7克、0.8克或0.9克的量产生。

91.根据权利要求68到90中任一项所述的方法，其中所述方法以约50％、60％、70％、80％、90％或超过90％的纯度产生gRNA。

92.根据权利要求68到91中任一项所述的方法，其中所述第一RNA是在3'到5'的方向上合成的。

93.根据权利要求68到92中任一项所述的方法，其中所述第二RNA是在3'到5'的方向上合成的。

94.根据权利要求68到93中任一项所述的方法，其中所述gRNA的长度为约100个核苷酸、约125个核苷酸、约150个核苷酸、约175个核苷酸、约200个核苷酸或大于约200个核苷酸。

95.根据权利要求68到94中任一项所述的方法，其中所述环包括4个、5个、6个、7个、8个、9个、10个、11个、12个、13个、14个、15个或16个核苷酸。

96.根据权利要求95所述的方法，其中所述环是四环。

97.根据权利要求95所述的方法，其中所述环包括7个核苷酸。

98.根据权利要求68到97中任一项所述的方法，其中连接所述第一RNA和所述第二RNA发生在距所述环至少约3个碱基对的连接位点处。

99.根据权利要求98所述的方法，其中所述连接位点距所述环1个、2个、3个、4个、5个、6个或10个碱基对。

100.根据权利要求1到63或68到99中任一项所述的方法，其中所述第一RNA和/或所述第二RNA包括一个或多个骨架修饰。

101.根据权利要求100所述的方法，其中所述一个或多个骨架修饰包括2'O-甲基或硫代磷酸酯修饰。

102.根据权利要求100所述的方法，其中所述一个或多个骨架修饰选自3'-硫代磷酸2'-O-甲酯、2'O-甲基、2'-核糖3'-硫代磷酸酯、脱氧或5'磷酸酯修饰。

103.根据权利要求101或102所述的方法，其中所述一个或多个修饰存在于所述连接位点处。

104.根据权利要求103所述的方法，其中所述一个或多个修饰存在于所述供体RNA和/或所述受体RNA中。

105.根据权利要求104所述的方法，其中所述供体RNA的3'和/或5'端具有一个或多个骨架修饰。

106.根据权利要求104所述的方法，其中所述受体RNA的3'和/或5'端具有一个或多个骨架修饰。

107.根据权利要求1到63或68到106中任一项所述的方法，其中所述第一RNA和/或所述第二RNA的浓度介于约1g/L与5g/L之间。

108.根据权利要求107所述的方法，其中所述第一RNA和/或所述第二RNA的浓度为约1g/L。

109.根据权利要求107所述的方法，其中所述第一RNA和/或所述第二RNA的浓度为约3g/L。

110.一种通过根据前述权利要求中任一项所述的方法产生的组合物，所述组合物包括：第一RNA，所述第一RNA在5'末端处包括磷酸酯；以及第二RNA，所述第二RNA包括可变原型间隔子区域，其中所述第一RNA和所述第二RNA是非共价结合的。

111.一种通过根据权利要求1到103中任一项所述的方法产生的组合物，所述组合物包括：第一RNA，所述第一RNA在5'末端处包括磷酸酯；以及第二RNA，所述第二RNA包括可变原型间隔子区域，并且其中所述第一RNA和所述第二RNA与连接酶结合。

112.根据权利要求111所述的组合物，其中所述连接酶是T4 RNA连接酶2。

113.一种包括RNA的组合物，所述RNA包括与CGAUACGACAGAAC至少约80％相同的核苷酸序列。

114.根据权利要求113所述的组合物，其中所述核苷酸序列与CGAUACGACAGAAC相同。

115.一种包括RNA的组合物，所述RNA包括与CGCCG至少约80％相同的核苷酸序列。

116.根据权利要求115所述的组合物，其中所述核苷酸序列与CGCCG相同。

117.一种包括RNA的组合物，所述RNA包括与CGGCCGC至少约80％相同的核苷酸序列。

118.根据权利要求117所述的组合物，其中所述核苷酸序列与CGGCCGC相同。

119.一种包括RNA的组合物，所述RNA包括与CGCGC至少约80％相同的核苷酸序列。

120.根据权利要求119所述的组合物，其中所述核苷酸序列与CGCGC相同。

121.一种试剂盒，其包括根据权利要求110到120中任一项所述的组合物。

122.一种试剂盒，其包括：第一RNA，所述第一RNA包括反式激活RNA(tracrRNA)序列；第二RNA，所述第二RNA包括可变原型间隔子区域；以及连接酶。

123.根据权利要求122所述的试剂盒，其中所述连接酶是T4 RNA连接酶2。