CN115175990A

CN115175990A - 治疗血红蛋白病的经修饰的细胞和方法

Info

Publication number: CN115175990A
Application number: CN202080095711.5A
Authority: CN
Inventors: J·L·戈里; E·奥佩潘·德·拉莫特-德赫兹; J·希斯; J·A·左瑞斯; K·常
Original assignee: Editas Medicine Inc
Current assignee: Editas Medicine Inc
Priority date: 2020-11-18
Filing date: 2020-12-09
Publication date: 2022-10-11
Also published as: JP2023521524A; CA3164055A1

Abstract

提供了基因组编辑***、指导RNA和CRISPR介导的方法，用于改变细胞中HBG1和HBG2基因座的部分，并增加胎儿血红蛋白的表达。

Description

治疗血红蛋白病的经修饰的细胞和方法

优先权要求

本申请要求于2019年12月8日提交的美国临时专利申请号62/945,190和2020年11月18日提交的美国临时专利申请号63/115,518的权益，这两个申请都通过引用以其整体(包括附图)并入本文。

序列表

本申请含有以ASCII格式经由EFS-Web提交的序列表，并且将其通过引用以其整体并入本文。创建于2020年12月8日的ASCII副本被命名为SequenceListing.txt，并且大小为699KB。

技术领域

本披露涉及用于基因组编辑***和改变靶核酸序列或调节靶核酸序列的表达的方法，及其与编码血红蛋白亚基的基因的改变和/或血红蛋白病的治疗有关的应用。

背景技术

血红蛋白(Hb)将红细胞或红血细胞(RBC)中的氧从肺部运送到组织。在胚胎发育期间和出生后不久，血红蛋白以胎儿血红蛋白(HbF)的形式存在，胎儿血红蛋白是由两个α-珠蛋白链和两个γ-珠蛋白链组成的四聚体蛋白质。HbF在很大程度上被成人血红蛋白(HbA)替换，成人血红蛋白是一种四聚体蛋白质，其中HbF的γ-珠蛋白链通过称为珠蛋白转换的过程被β-珠蛋白链替换。普通成人的总血红蛋白小于1％的HbF(Thein 2009)。所述α-血红蛋白基因位于第16号染色体上，而β-血红蛋白基因(HBB)，Aγ(Aγ)珠蛋白链(HBG1，也称为γ珠蛋白A)和Gγ(Gγ)珠蛋白链(HBG2，也称为γ珠蛋白G)位于第11号染色体上的珠蛋白基因簇(也称为珠蛋白基因座)内。

HBB中的突变可引起血红蛋白异常(即血红蛋白病)，所述血红蛋白病包括镰状细胞病(SCD)和β地中海贫血(β-Thal)。美国大约93,000人被诊断患有血红蛋白病。全球每年有300,000儿童出生患有血红蛋白病(Angastiniotis 1998)。因为这些病症与HBB突变有关，所以他们的症状典型地直到珠蛋白从HbF转换为HbA后才表现。

SCD是美国最常见的遗传性血液病，影响大约80,000人(Brousseau2010)。SCD在非洲血统的人中最常见，SCD的流行率为500人中有1人。在非洲，SCD的流行率为1500万(Aliyu，2008)。SCD在印度人，沙特***人和地中海人后裔中也更常见。在西班牙裔美国人后裔中，镰状细胞病的流行率为1000人中有1人(Lewis 2014)。

SCD由HBB基因中的单个纯合突变引起，c.17A>T(HbS突变)。镰状突变是HBB上的点突变(GAG>GTG)，其导致缬氨酸取代外显子1中氨基酸位置6的谷氨酸。β-血红蛋白链位置6的缬氨酸是疏水性的，并且当β-珠蛋白不与氧气结合时，引起β-珠蛋白构象的变化。这种构象变化引起HbS蛋白在没有氧的情况下聚合，导致RBC变形(即，镰状)。SCD以常染色体隐性方式遗传，因此只有具有两个HbS等位基因的患者才患有所述疾病。杂合的受试者具有镰状细胞性状，如果他们严重脱水或缺氧，可能患有贫血和/或痛性危象。

镰状形状的RBC引起多种症状，包括贫血、镰状细胞危象、血管阻塞性危象，再生障碍性危象和急性胸部综合征。镰状形状的RBC比野生型RBC弹性小，因此不能容易地通过毛细血管床并导致阻塞和缺血(即，血管阻塞)。当镰状细胞阻塞器官毛细血管床中的血流导致疼痛、缺血和坏死时，就会发生血管阻塞性危象。这些发作典型地持续5天至7天。脾脏在清除功能失调的RBC中起作用，因此典型地在儿童早期期间扩大并且频繁发生血管阻塞性危象。到儿童期结束时，SCD患者的脾经常梗塞，导致自体脾切除。溶血是SCD的一个恒定特征并引起贫血。镰状细胞在循环中存活10天至20天，而健康的RBC存活90天至120天。必要时输血SCD受试者以维持足够的血红蛋白水平。频繁的输血使受试者有感染HIV、乙型肝炎、和丙型肝炎的风险。受试者还可能患有急性胸部危象和四肢、终末器官、和中枢神经***的梗塞。

患有SCD的受试者的生命期望降低。通过对危象和贫血进行认真的，终身的管理，SCD患者的预后正在稳定地改进。在2001年，患有镰状细胞病的受试者的平均生命期望是50岁中后期。目前对SCD的治疗涉及危象期间的水合和疼痛管理，以及根据需要进行输血以校正贫血。

地中海贫血(例如，β-Thal、δ-Thal、和β/δ-Thal)引起慢性贫血。估计β-Thal影响全球大约100,000人中有1人。它在某些群体中的流行率较高，包括欧洲后裔的群体，其流行率大约为10,000人中有1人。除非通过终身输血和螯合疗法治疗，否则重型β-Thal是疾病的更严重形式，是危及生命的。在美国，大约有3,000名患有重型β-Thal的受试者。中间型β-Thal不需要输血，但可能引起生长延迟和显著的全身异常，并且频繁地需要终身螯合疗法。尽管HbA构成成人RBC中大多数血红蛋白，但大约3％的成人血红蛋白是HbA2形式，HbA变体是两个γ-珠蛋白链被两个δ(Δ)-珠蛋白链替换。δ-Thal与引起HBD表达损失的Δ血红蛋白基因(HBD)突变有关。HBD突变的共遗传可以通过将HbA2水平降低至正常范围来掩盖β-Thal(即，β/δ-Thal)的诊断(Bouva 2006)。β/δ-Thal通常由两个等位基因中HBB和HBD序列的缺失引起。在纯合的(δo/δoβo/βo)患者中，表达HBG，导致单独产生HbF。

与SCD一样，β-Thal是由HBB基因突变引起的。导致β-Thal的最常见HBB突变为：c.-136C>G、c.92+1G>A、c.92+6T>C、c.93-21G>A、c.118C>T、c.316-106C>G、c.25_26delAA、c.27_28insG、c.92+5G>C、c.118C>T、c.135delC、c.315+1G>A、c.-78A>G、c.52A>T、c.59A>G、c.92+5G>C、c.124_127delTTCT、c.316-197C>T、c.-78A>G、c.52A>T、c.124_127delTTCT、c.316-197C>T、c.-138C>T、c.-79A>G、c.92+5G>C、c.75T>A、c.316-2A>G、以及c.316-2A>C。与β-Thal有关的这些和其他突变引起β-珠蛋白链的突变或缺失，这导致正常Hbα-血红蛋白与β-血红蛋白比率的破坏。过量的α-珠蛋白链在骨髓中的红系前体中沉淀。

在重型β-Thal中，HBB的两个等位基因都含有无意义突变、移码突变、或剪接突变，导致完全不存在β-珠蛋白产生(表示为β⁰/β⁰)。重型β-Thal导致β-珠蛋白链的严重减少，导致RBC中α-珠蛋白链的显著沉淀和更严重的贫血。

中间型β-Thal由HBB的5’或3’非翻译区域突变、启动子区域突变、或HBB多聚腺苷酸化信号或HBB基因内的剪接突变导致。患者基因型表示为βo/β+或β+/β+。βo代表不存在β-珠蛋白链的表达；β+代表功能失调但存在的β-珠蛋白链。表型表达因患者而异。由于存在一些β-珠蛋白的产生，中间型β-Thal导致红系前体中α-珠蛋白链的沉淀较少，并且与重型β-Thal相比导致较少的严重贫血。然而，继发于慢性贫血的红系谱系扩增有更显著的后果。

具有重型β-Thal的受试者存在于6个月和2岁之间，并且患有未能茁壮成长、发热、肝脾大和腹泻。足够的治疗包括定期输血。重型β-Thal疗法还包括脾切除术和羟基脲治疗。如果患者定期输血，他们将正常发育，直到第二个十年开始。那时，他们需要螯合疗法(除了继续输血)以防止铁超过载的并发症。铁过载可能表现为生长延迟或性成熟延迟。在成人期，不充分的螯合疗法可能导致心肌病、心律失常、肝纤维化和/或肝硬化、糖尿病、甲状腺和甲状旁腺异常、血栓症和骨质疏松症。频繁的输血还使受试者有感染HIV、乙型肝炎、和丙型肝炎的风险。

中间型β-Thal受试者通常存在于2岁至6岁之间。他们通常不需要输血。然而，由于红系谱系的慢性肥大而发生骨异常以补偿慢性贫血。由于骨质疏松症，受试者可能有长骨骨折。髓外红细胞生成是常见的并且导致脾，肝和***的扩大。它还可能引起脊髓压缩和神经***问题。受试者还患有下肢溃疡并且血栓形成事件的风险增加，包括中风、肺栓塞和深静脉血栓形成。中间型β-Thal的治疗包括脾切除术、叶酸补充、羟基脲疗法和髓外肿块的放射治疗。螯合疗法用于发生铁过载的受试者。

β-Thal患者的生命期望通常会降低。患有重型β-Thal且未接收输血疗法的受试者通常在其第二或第三个十年死亡。接收常规输血和足够螯合疗法的重型β-Thal受试者可以活到第五个十年甚至更长时间。继发于铁毒性的心脏衰竭是由于铁毒性导致的重型β-Thal受试者死亡的主要原因。

目前正在发育SCD和β-Thal的各种新治疗。目前正在临床试验中研究经由基因疗法递送抗镰状化HBB基因。然而，这种途径的长期功效和安全性尚不清楚。已经证明用来自HLA匹配的异基因干细胞供体的造血干细胞(HSC)移植治疗SCD和β-Thal，但是所述方法涉及风险，包括与切除疗法有关的风险，这要求准备受试者进行移植，增加威胁生命的机会性感染的风险，和移植后移植物抗宿主疾病的风险。另外，通常无法识别匹配的异基因供体。因此，需要改进的管理这些和其他血红蛋白病的方法。

发明内容

在某些实施例中，本文提供了经修饰的细胞的第一群体，这些经修饰的细胞的第一群体包含在HBG基因启动子中具有一个或多个***缺失的多个经修饰的CD34+或造血干细胞。在这些实施例的某些中，该多个经修饰的细胞包括CCAAT盒靶区域中的***缺失。

在本文提供的经修饰的细胞的第一群体的某些实施例中，该多个经修饰的细胞中的一个或多个细胞包括HBG1启动子、HBG2启动子或两者中的HBG1/2c.-104至-121缺失。在这些实施例的某些中，HBG1/2c.-104至-121缺失占作为整体的多个经修饰的细胞中的***缺失的1％或更多、1.5％或更多、2％或更多、2.5％或更多、3％或更多、3.5％或更多、4％或更多、4.5％或更多、5％或更多、5.5％或更多、6％或更多、6.5％或更多、7％或更多、7.5％或更多、8％或更多、8.5％或更多、9％或更多、9.5％或更多、10％或更多、10.5％或更多、11％或更多、11.5％或更多、12％或更多、12.5％或更多、13％或更多、13.5％或更多、14％或更多、14.5％或更多、15％或更多、或15.5％或更多。在这些实施例的某些中，HBG1/2c.-104至-121缺失占作为整体的多个经修饰的细胞中的***缺失的小于25％。

在本文提供的经修饰的细胞的第一群体的某些实施例中，作为整体的多个经修饰的细胞中的***缺失的60％或更多、65％或更多、70％或更多、75％或更多、80％或更多、85％或更多、90％或更多、或95％或更多是至少4个碱基对的缺失。

在本文提供的经修饰的细胞的第一群体的某些实施例中，作为整体的多个经修饰的细胞中的***缺失的25％或更多、30％或更多、35％或更多、40％或更多、45％或更多、50％或更多、55％或更多、60％或更多、或65％或更多是至少4个碱基对的缺失，这些缺失通过修复机制而不是微同源介导的末端连接(MMEJ)修复来引入。

在本文提供的经修饰的细胞的第一群体的某些实施例中，作为整体的多个经修饰的细胞中的***缺失的25％或更多、30％或更多、35％或更多、40％或更多、45％或更多、50％或更多、55％或更多、60％或更多、或65％或更多是至少4个碱基对的缺失，这些缺失通过非同源末端连接(NHEJ)修复(例如，经典NHEJ修复)来引入。

在本文提供的经修饰的细胞的第一群体的某些实施例中，作为整体的多个经修饰的细胞中的***缺失的50％或更多、55％或更多、60％或更多、65％或更多、70％或更多、75％或更多、80％或更多、85％或更多、90％或更多、或92％或更多是1至25个碱基对的缺失。

在本文提供的经修饰的细胞的第一群体的某些实施例中，作为整体的多个经修饰的细胞中的***缺失的50％或更多、55％或更多、60％或更多、65％或更多、70％或更多、75％或更多、80％或更多、或85％或更多是3至25个碱基对的缺失。

在本文提供的经修饰的细胞的第一群体的某些实施例中，作为整体的多个经修饰的细胞中的***缺失的50％或更多、55％或更多、60％或更多、65％或更多、70％或更多、75％或更多、或80％或更多是4至25个碱基对的缺失。

在本文提供的经修饰的细胞的第一群体的某些实施例中，作为整体的多个经修饰的细胞中的***缺失的50％或更多、55％或更多、60％或更多、65％或更多、70％或更多、或72％或更多是5至25个碱基对的缺失。

在本文提供的经修饰的细胞的第一群体的某些实施例中，通过将包括第一gRNA(包含第一gRNA靶向结构域和Cpf1 RNA指导的核酸酶或经修饰的Cpf1RNA指导的核酸酶)的第一RNP复合物递送至包含多个未经修饰的CD34+或造血干细胞的未经修饰的细胞的第一群体以生成***缺失，来产生这些经修饰的细胞。在这些实施例的某些中，将第一RNP复合物通过电穿孔递送至未经修饰的细胞的第一群体。在某些实施例中，未经修饰的细胞的第一群体来自患有镰状细胞病的受试者。在某些实施例中，第一gRNA包括5’末端和3’末端，具有在5’末端的DNA延伸以及在3’末端的2’-O-甲基-3’-硫代磷酸酯修饰。在这些实施例的某些中，在5’末端的DNA延伸包含SEQ ID NO:1235-1250中任一个所示的序列。在某些实施例中，第一gRNA靶向结构域包含SEQ ID NO:1254所示的序列。在某些实施例中，第一gRNA包含SEQ ID NO:1051所示的序列。在某些实施例中，经修饰的Cpf1 RNA指导的核酸酶包含SEQID NO:1097所示的序列。在某些实施例中，与未经修饰的细胞的第一群体相比，经修饰的细胞的第一群体具有较高的胎儿血红蛋白(HbF)水平。

在本文提供的经修饰的细胞的第一群体的某些实施例中，该多个经修饰的细胞中的一个或多个细胞包括(a)HBG1启动子、HBG2启动子或两者中的HBG1/2c.-104至-121缺失；(b)HBG1启动子、HBG2启动子或两者中的HBG1/2c.-110至-115缺失；(c)HBG1启动子、HBG2启动子或两者中的HBG1/2c.-112至-115缺失；(d)HBG1启动子、HBG2启动子或两者中的HBG1/2c.-113至-115缺失；(e)HBG1启动子、HBG2启动子或两者中的HBG1/2c.-111至-115缺失；(f)HBG1启动子、HBG2启动子或两者中的HBG1/2c.-111至-117缺失；(g)HBG1启动子、HBG2启动子或两者中的HBG1/2c.-102至-114缺失；(h)HBG1启动子、HBG2启动子或两者中的HBG1/2c.-114至-118缺失；(i)HBG1启动子、HBG2启动子或两者中的HBG1/2c.-112至-116缺失；或(j)HBG1启动子、HBG2启动子或两者中的HBG1/2c.-113至-117缺失。

在本文提供的经修饰的细胞的第一群体的某些实施例中，作为整体的该多个经修饰的细胞包括(a)HBG1启动子、HBG2启动子或两者中的HBG1/2c.-104至-121缺失；以及(b)HBG1启动子、HBG2启动子或两者中的HBG1/2c.-110至-115缺失。在某些实施例中，HBG1/2c.-104至-121缺失占作为整体的多个经修饰的细胞中的***缺失的1％或更多、1.5％或更多、2％或更多、2.5％或更多、3％或更多、3.5％或更多、4％或更多、4.5％或更多、5％或更多、5.5％或更多、6％或更多、6.5％或更多、7％或更多、7.5％或更多、8％或更多、8.5％或更多、9％或更多、9.5％或更多、10％或更多、10.5％或更多、11％或更多、11.5％或更多、12％或更多、12.5％或更多、13％或更多、13.5％或更多、14％或更多、14.5％或更多、或15％或更多。在某些实施例中，HBG1/2c.-104至-121缺失占作为整体的多个经修饰的细胞中的***缺失的1％至15.5％。在某些实施例中，HBG1/2c.-110至-115缺失占作为整体的多个经修饰的细胞中的***缺失的0.5％或更多、1％或更多、1.5％或更多、2％或更多、2.5％或更多、3％或更多、3.5％或更多、4％或更多、4.5％或更多、5％或更多、或5.5％或更多。在某些实施例中，HBG1/2c.-110至-115缺失占作为整体的多个经修饰的细胞中的***缺失的0.5％至6％。

在本文提供的经修饰的细胞的第一群体的某些实施例中，作为整体的该多个经修饰的细胞包括(a)HBG1启动子、HBG2启动子或两者中的HBG1/2c.-104至-121缺失；(b)HBG1启动子、HBG2启动子或两者中的HBG1/2c.-110至-115缺失；(c)HBG1启动子、HBG2启动子或两者中的HBG1/2c.-112至-115缺失；(d)HBG1启动子、HBG2启动子或两者中的HBG1/2c.-113至-115缺失；(e)HBG1启动子、HBG2启动子或两者中的HBG1/2c.-111至-115缺失；(f)HBG1启动子、HBG2启动子或两者中的HBG1/2c.-111至-117缺失；(g)HBG1启动子、HBG2启动子或两者中的HBG1/2c.-102至-114缺失；(h)HBG1启动子、HBG2启动子或两者中的HBG1/2c.-114至-118缺失；(i)HBG1启动子、HBG2启动子或两者中的HBG1/2c.-112至-116缺失；以及(j)HBG1启动子、HBG2启动子或两者中的HBG1/2c.-113至-117缺失。在某些实施例中，HBG1/2c.-104至-121缺失占作为整体的多个经修饰的细胞中的***缺失的1％或更多、1.5％或更多、2％或更多、2.5％或更多、3％或更多、3.5％或更多、4％或更多、4.5％或更多、5％或更多、5.5％或更多、6％或更多、6.5％或更多、7％或更多、7.5％或更多、8％或更多、8.5％或更多、9％或更多、9.5％或更多、10％或更多、10.5％或更多、11％或更多、11.5％或更多、12％或更多、12.5％或更多、13％或更多、13.5％或更多、14％或更多、14.5％或更多、或15％或更多。在某些实施例中，HBG1/2c.-104至-121缺失占作为整体的多个经修饰的细胞中的***缺失的1％至15.5％。在某些实施例中，HBG1/2c.-110至-115缺失占作为整体的多个经修饰的细胞中的***缺失的0.5％或更多、1％或更多、1.5％或更多、2％或更多、2.5％或更多、3％或更多、3.5％或更多、4％或更多、4.5％或更多、5％或更多、或5.5％或更多。在某些实施例中，HBG1/2c.-110至-115缺失占作为整体的多个经修饰的细胞中的***缺失的0.5％至6％。在某些实施例中，HBG1/2c.-112至-115缺失占作为整体的多个经修饰的细胞中的***缺失的0.5％或更多、1％或更多、1.5％或更多、2％或更多、2.5％或更多、3％或更多、3.5％或更多、4％或更多、4.5％或更多、5％或更多、或5.5％或更多。在某些实施例中，HBG1/2c.-112至-115缺失占作为整体的多个经修饰的细胞中的***缺失的0.5％至6％。在某些实施例中，HBG1/2c.-113至-115缺失占作为整体的多个经修饰的细胞中的***缺失的0.5％或更多、1％或更多、1.5％或更多、2％或更多、2.5％或更多、3％或更多、3.5％或更多、4％或更多、4.5％或更多、5％或更多、或5.5％或更多。在某些实施例中，HBG1/2c.-113至-115缺失占作为整体的多个经修饰的细胞中的***缺失的0.5％至6％。在某些实施例中，HBG1/2c.-111至-115缺失占作为整体的多个经修饰的细胞中的***缺失的0.5％或更多、1％或更多、1.5％或更多、2％或更多、2.5％或更多、3％或更多、3.5％或更多、4％或更多、4.5％或更多、5％或更多、或5.5％或更多。在某些实施例中，HBG1/2c.-111至-115缺失占作为整体的多个经修饰的细胞中的***缺失的0.5％至6％。在某些实施例中，HBG1/2c.-111至-117缺失占作为整体的多个经修饰的细胞中的***缺失的0.5％或更多、1％或更多、1.5％或更多、2％或更多、2.5％或更多、3％或更多、3.5％或更多、4％或更多、4.5％或更多、5％或更多、或5.5％或更多。在某些实施例中，HBG1/2c.-111至-117缺失占作为整体的多个经修饰的细胞中的***缺失的0.5％至6％。在某些实施例中，HBG1/2c.-102至-114缺失占作为整体的多个经修饰的细胞中的***缺失的0.5％或更多、1％或更多、1.5％或更多、2％或更多、2.5％或更多、3％或更多、3.5％或更多、4％或更多、4.5％或更多、5％或更多、或5.5％或更多。在某些实施例中，HBG1/2c.-102至-114缺失占作为整体的多个经修饰的细胞中的***缺失的0.5％至6％。在某些实施例中，HBG1/2c.-114至-118缺失占作为整体的多个经修饰的细胞中的***缺失的0.5％或更多、1％或更多、1.5％或更多、2％或更多、2.5％或更多、3％或更多、3.5％或更多、4％或更多、4.5％或更多、5％或更多、或5.5％或更多。在某些实施例中，HBG1/2c.-114至-118缺失占作为整体的多个经修饰的细胞中的***缺失的0.5％至6％。在某些实施例中，HBG1/2c.-112至-116缺失占作为整体的多个经修饰的细胞中的***缺失的0.5％或更多、1％或更多、1.5％或更多、2％或更多、2.5％或更多、3％或更多、3.5％或更多、4％或更多、4.5％或更多、5％或更多、或5.5％或更多。在某些实施例中，HBG1/2c.-112至-116缺失占作为整体的多个经修饰的细胞中的***缺失的0.5％至6％。在某些实施例中，HBG1/2c.-113至-117缺失占作为整体的多个经修饰的细胞中的***缺失的0.5％或更多、1％或更多、1.5％或更多、2％或更多、2.5％或更多、3％或更多、3.5％或更多、4％或更多、4.5％或更多、5％或更多、或5.5％或更多。在某些实施例中，HBG1/2c.-113至-117缺失占作为整体的多个经修饰的细胞中的***缺失的0.5％至6％。

在本文提供的经修饰的细胞的第一群体的某些实施例中，作为整体的多个经修饰的细胞包括存在于表25中所有14个样品中的108个缺失。

在本文提供的经修饰的细胞的第一群体的某些实施例中，作为整体的多个经修饰的细胞包括在表25中被鉴定为具有“***缺失的平均百分比”为0.1％或更多的***缺失。在这些实施例的某些中，作为整体的多个经修饰的细胞包括表25中的所有***缺失。

在本文提供的经修饰的细胞的第一群体的某些实施例中，作为整体的多个经修饰的细胞包括比经修饰的细胞的第二群体多至少10％的至少4个碱基对的缺失，该经修饰的细胞的第二群体包含在HBG基因启动子中具有一个或多个***缺失的多个经修饰的CD34+或造血干细胞，其中通过将包括第二gRNA(具有包含SEQ ID NO:339和Cas9 RNA指导的核酸酶的gRNA靶向结构域)的第二RNP复合物递送至包含多个未经修饰的CD34+或造血干细胞的未经修饰的细胞的第二群体来产生该经修饰的细胞的第二群体的***缺失。在这些实施例的某些中，将第二RNP复合物通过电穿孔递送至未经修饰的细胞的第二群体。在某些实施例中，未经修饰的细胞的第二群体来自患有镰状细胞病的受试者。在某些实施例中，与经修饰的细胞的第二群体相比，经修饰的细胞的第一群体具有较高的HbF水平。在这些实施例的某些中，第二群体中的多个经修饰的细胞包括CCAAT盒靶区域中的***缺失。

在某些实施例中，本文提供了诱导HbF在经修饰的细胞的第一群体中表达的方法，该经修饰的细胞的第一群体包含在HBG基因启动子中具有一个或多个***缺失的多个经修饰的CD34+或造血干细胞，该方法包括将包括第一gRNA(包含第一gRNA靶向结构域和Cpf1RNA指导的核酸酶或经修饰的Cpf1 RNA指导的核酸酶)的第一RNP复合物递送至包含多个未经修饰的CD34+或造血干细胞的未经修饰的细胞的第一群体以生成***缺失。在某些实施例中，作为整体的多个经修饰的细胞中的所得***缺失的60％或更多、65％或更多、70％或更多、75％或更多、80％或更多、85％或更多、90％或更多、或95％或更多是至少4个碱基对的缺失。在某些实施例中，经修饰的细胞的第一群体展现出相比于未经修饰的细胞的第一群体的增加的HbF水平。在某些实施例中，将第一RNP复合物通过电穿孔递送至未经修饰的细胞的第一群体。

在某些实施例中，本文提供了降低红细胞(RBC)的第一群体的镰状化的方法，该红细胞的第一群体从包含多个经修饰的CD34+细胞(在HBG基因启动子中具有一个或多个***缺失)的经修饰的细胞的第一群体中培养，该方法包括将包括第一gRNA(包含第一gRNA靶向结构域和Cpf1 RNA指导的核酸酶或经修饰的Cpf1RNA指导的核酸酶)的第一RNP复合物递送至包含多个未经修饰的CD34+细胞的未经修饰的细胞的第一群体以产生***缺失，然后培养来自该经修饰的细胞的第一群体的RBC的第一群体。在某些实施例中，作为整体的多个经修饰的细胞中的所得***缺失的60％或更多、65％或更多、70％或更多、75％或更多、80％或更多、85％或更多、90％或更多、或95％或更多是至少4个碱基对的缺失。在某些实施例中，相比于从未经修饰的细胞的第一群体培养的RBC的第二群体，RBC的第一群体在脱氧时展现出显著降低的镰状化。在某些实施例中，与RBC的第二群体相比，RBC的第一群体以显著较低于的氧张力镰状化，例如，如通过相对氧气压力所测量的。在某些实施例中，与RBC的第二群体相比，RBC的第一群体在脱氧时具有显著较高的最小伸长指数。在某些实施例中，与RBC的第二群体相比，RBC的第一群体在脱氧时具有显著较高的速度。在某些实施例中，与RBC的第二群体相比，RBC的第一群体具有较高的HbF水平。

在某些实施例中，本文提供了减轻有需要的受试者中镰状细胞病的一种或多种症状的方法，这些方法包括将包括第一gRNA(包含第一靶向结构域和Cpf1RNA指导的核酸酶或经修饰的Cpf1 RNA指导的核酸酶)的第一RNP复合物递送至包含多个未经修饰的CD34+或造血干细胞的未经修饰的细胞的第一群体以产生包含多个经修饰的CD34+或造血干细胞(在HBG基因启动子中包含一个或多个***缺失)的经修饰的细胞的第一群体，并且然后向该受试者施用所得经修饰的细胞的第一群体以减轻镰状细胞病的一种或多种症状。在某些实施例中，作为整体的所得多个经修饰的CD34+或造血干细胞中的所得***缺失的60％或更多、65％或更多、70％或更多、75％或更多、80％或更多、85％或更多、90％或更多、或95％或更多是至少4个碱基对的缺失。在某些实施例中，这些方法进一步包括在施用后约1周、2周、3周、4周、5周、6周、7周、8周、10周、12周、16周、20周、1个月、2个月、3个月、4个月、5个月、6个月、8个月、12个月、1年、2年、3年、4年、5年、或多于5年，检测包含从经修饰的细胞的第一群体培养的多个经修饰的红系后代细胞的经修饰的红系后代细胞群体。在某些实施例中，培养的细胞可以包括骨髓(BM)植入的CD34+造血干细胞或由其衍生的血细胞，例如髓样祖细胞或分化的骨髓细胞，例如红细胞、肥大细胞、成肌细胞；或淋巴样祖细胞或分化的淋巴样细胞，例如，T淋巴细胞或B淋巴细胞、或NK细胞。在某些实施例中，该方法导致在骨髓中多个HSC克隆的长期植入，例如，在施用后至少1周、2周、3周、4周、5周、6周、7周、8周、10周、12周、16周、20周、1个月、2个月、3个月、4个月、5个月、6个月、8个月、12个月、1年、2年、3年、4年、5年或多于5年。在某些实施例中，与健康受试者相比，该方法导致至少50％、至少60％、至少70％、至少80％、至少90％、至少95％、或至少99％的总血红蛋白的长期表达。在某些实施例中，该方法导致所有造血细胞谱系(例如，没有任何分化偏向，例如，没有红系谱系分化偏向)的重构。

在某些实施例中，本文提供了细胞群体，该细胞群体包含从来自患有镰状细胞病的受试者的多个经修饰的CD34+细胞培养的多个红细胞(RBC)，每个经修饰的细胞包含HBG基因启动子中的***缺失。在某些实施例中，作为整体的多个经修饰的细胞包括存在于表25中所有14个样品中的108个缺失。在某些实施例中，通过将包括gRNA(包含第一靶向结构域和Cpf1 RNA指导的核酸酶或经修饰的Cpf1RNA指导的核酸酶)的RNP复合物递送至来自患有镰状细胞病的受试者的多个未经修饰的CD34+细胞以生成***缺失；以及培养来自多个经修饰的CD34+细胞的RBC，来生成细胞群体。

在某些实施例中，本文提供了细胞群体，该细胞群体包含从来自患有镰状细胞病的受试者的多个经修饰的CD34+细胞培养的多个红细胞(RBC)，每个经修饰的细胞包含HBG基因启动子中的***缺失。在某些实施例中，HBG基因启动子中的***缺失的60％或更多、65％或更多、70％或更多、75％或更多、80％或更多、85％或更多、90％或更多、或95％或更多是至少4个碱基对的缺失。在某些实施例中，通过将包括gRNA(包含第一靶向结构域和Cpf1 RNA指导的核酸酶或经修饰的Cpf1RNA指导的核酸酶)的RNP复合物递送至来自患有镰状细胞病的受试者的多个未经修饰的CD34+细胞以生成***缺失；以及培养来自多个经修饰的CD34+细胞的RBC，来生成细胞群体。

在本文提供的包含多个RBC的细胞的群体的某些实施例中，与从患有镰状细胞病的受试者的未经修饰的CD34+细胞培养的RBC的群体相比，该多个RBC以显著较低的氧张力(例如，如通过相对氧气压力所测量的)镰状化，与从患有镰状细胞病的受试者的未经修饰的CD34+细胞培养的RBC的群体相比，该多个RBC在脱氧时具有显著较高的最小伸长指数，并且/或与从患有镰状细胞病的受试者的未经修饰的CD34+细胞培养的RBC的群体相比，该多个RBC在脱氧时具有显著较高的速度。

本文提供了基因组编辑***、核糖核蛋白(RNP)复合物、指导RNA、Cpf1蛋白(包括经修饰的Cpf1蛋白(Cpf1变体))以及用于改变一个或多个γ-珠蛋白基因(例如HBG1、HBG2或HBG1和HBG2)启动子区域并增加胎儿血红蛋白(HbF)的表达的CRISPR介导方法。在某些实施例中，RNP复合物可以包括与野生型Cpf1或经修饰的Cpf1 RNA指导的核酸酶(经修饰的Cpf1蛋白)复合的指导RNA(gRNA)。在某些实施例中，gRNA可包含表6、表12、或表13所示的序列。在某些实施例中，gRNA可包含gRNA靶向结构域。在某些实施例中，gRNA靶向结构域可包含选自由SEQ ID NO:1002、1254、1258、1260、1262和1264组成的组的序列。在某些实施例中，gRNA可包含表13所示的gRNA序列。在某些实施例中，gRNA可包含选自由SEQ ID NO:1022、1023、1041-1105组成的组的序列。在某些实施例中，RNP复合物可包含表15所示的RNP复合物。例如，RNP复合物可以包括包含SEQ ID NO:1051所示的序列的gRNA和由SEQ ID NO:1097所示的序列编码的经修饰的Cpf1蛋白(RNP32，表15)。

在本文中发明人发现，包括与经修饰的Cpf1蛋白复合的gRNA的RNP复合物的递送可能导致靶核酸的编辑增加。在某些实施例中，所述经修饰的Cpf1蛋白可含有一个或多个修饰。在某些实施例中，所述一个或多个修饰可以包括但不限于野生型Cpf1氨基酸序列中的一个或多个突变、野生型Cpf1核酸序列中的一个或多个突变、一个或多个核定位信号(NLS)、一个或多个纯化标签(例如，His标签)或其组合。在某些实施例中，经修饰的Cpf1可以由SEQ ID NO:1000、1001、1008-1018、1032、1035-39、1094-1097、1107-09(Cpf1多肽序列)或SEQ ID NO:1019-1021、1110-17(Cpf1多核苷酸序列)所示的序列编码。在某些实施例中，gRNA可以是经修饰的或未经修饰的gRNA。在某些实施例中，gRNA可包含表6、表12或表13所示的序列。在某些实施例中，RNP复合物可包含表15所示的RNP复合物。例如，RNP复合物可以包括包含SEQ ID NO:1051所示的序列的gRNA和由SEQ ID NO:1097所示的序列编码的经修饰的Cpf1蛋白(RNP32，表15)。在某些实施例中，包含经修饰的Cpf1蛋白的RNP复合物可以增加靶核酸的编辑。在某些实施例中，包含经修饰的Cpf1蛋白的RNP复合物可以增加编辑，导致有效***缺失的增加。在各种实施例中，可以通过技术人员已知的任何方式来评估靶核酸的编辑增加，例如但不限于，靶核酸的PCR扩增和随后的测序分析(例如，桑格测序，下一代测序)。

在本文中发明人还发现，包括与未经修饰或经修饰的Cpf1蛋白复合的经修饰的gRNA的RNP复合物的递送可能导致靶核酸的编辑增加。在某些实施例中，所述经修饰的gRNA可包含一个或多个如下修饰，所述修饰包括硫代磷酸酯键修饰，二硫代磷酸酯(PS2)键修饰、2’-O-甲基修饰、一个或多个或一段脱氧核糖核酸(DNA)碱基(在本文中也称为“DNA延伸”)、一个或多个或一段核糖核酸(RNA)碱基(在本文中也称为“RNA延伸”)或其组合。在某些实施例中，DNA延伸可包含表18所示的序列。例如，在某些实施例中，DNA延伸可包含SEQID NO:1235-1250所示的序列。在某些实施例中，RNA延伸可包含表18所示的序列。例如，在某些实施例中，RNA延伸可包含SEQ ID NO:1231-1234、1251-1253所示的序列。在某些实施例中，gRNA可包含表6、表12或表13所示的序列。在某些实施例中，RNP复合物可包含表15所示的RNP复合物。例如，RNP复合物可以包括包含SEQ ID NO:1051所示的序列的gRNA和由SEQID NO:1097所示的序列编码的经修饰的Cpf1蛋白(RNP32，表15)。在某些实施例中，包含经修饰的gRNA的RNP复合物可以增加靶核酸的编辑。在某些实施例中，包含经修饰的gRNA的RNP复合物可以增加编辑，导致有效***缺失的增加。

在某些实施例中，包含经修饰的gRNA和经修饰的Cpf1蛋白的RNP复合物可以增加靶核酸的编辑。在某些实施例中，包含经修饰的gRNA和经修饰的Cpf1蛋白的RNP复合物可增加编辑，导致有效***缺失的增加。

发明人还发现包含与具有“加强元件”的Cpf1分子复合的gRNA的RNP复合物(例如，“gRNA-Cpf1-RNP”)的共递可以导致靶核酸的编辑增加。在某些实施例中，RNP复合物可包含表15所示的RNP复合物。例如，RNP复合物可以包括包含SEQ ID NO:1051所示的序列的gRNA和由SEQ ID NO:1097所示的序列编码的经修饰的Cpf1蛋白(RNP32，表15)。如本文所用，术语“加强元件”是指以下元件，所述元件当与包含跟RNA引导的核酸酶复合的gRNA的RNP复合物(“gRNA-核酸酶-RNP”)共递送时与没有所述加强元件情况下的靶核酸编辑相比增加所述靶核酸的编辑。在某些实施例中，可以将一种或多种加强元件与gRNA-核酸酶-RNP复合物共递送以增加靶核酸的编辑。在某些实施例中，加强元件的共递送可以增加编辑，从而导致有效***缺失的增加。在各种实施例中，可以通过技术人员已知的任何方式来评估靶核酸的编辑增加，例如但不限于，靶核酸的PCR扩增和随后的测序分析(例如，桑格测序，下一代测序)。

在某些实施例中，gRNA-核酸酶-RNP可包含gRNA-Cpf1-RNP。在某些实施例中，gRNA-Cpf1-RNP复合物的Cpf1分子可以是野生型Cpf1或经修饰的Cpf1。在某些实施例中，gRNA-Cpf1-RNP的Cpf1分子可以由SEQ ID NO:1000、1001、1008-1018、1032、1035-39、1094-1097、1107-09(Cpf1多肽序列)或SEQ ID NO:1019-1021、1110-17(Cpf1多核苷酸序列)所示的序列编码。在某些实施例中，gRNA-Cpf1-RNP复合物可包含gRNA，该gRNA包含表6或表12所示的靶向结构域。在某些实施例中，gRNA-Cpf1-RNP复合物可包含gRNA，该gRNA包含表13所示的序列。在某些实施例中，gRNA可以是经修饰的或未经修饰的gRNA。

在某些实施例中，加强元件可包含失活RNP，该失活RNP包含与RNA指导的核酸酶分子复合的失活gRNA分子(“失活gRNA-核酸酶-RNP”)。在某些实施例中，失活gRNA-核酸酶-RNP可包含与野生型(WT)Cas9分子复合的失活gRNA(“失活gRNA-Cas9-RNP”)，与Cas9切口酶分子复合的失活gRNA(“失活gRNA-切口酶-RNP”)或与酶失活(ei)Cas9分子复合的失活gRNA(“失活gRNA-eiCas9-RNP”)。在某些实施例中，失活gRNA-核酸酶-RNP复合物可具有降低的活性或缺乏核酸酶活性。在某些实施例中，失活gRNA-核酸酶-RNP复合物的失活gRNA可包含本文所述的任何失活gRNA。例如，失活gRNA可包含靶向结构域，该靶向结构域可以与表8或表9所示的失活gRNA靶向结构域相同或相差不超过3个核苷酸。在某些实施例中，失活gRNA可以包括靶向结构域，所述靶向结构域包括gRNA靶向结构域的截短。在某些实施例中，待截短的gRNA靶向结构域可以是表8或表9所示的gRNA靶向结构域。在某些实施例中，失活gRNA可以是经修饰的或未经修饰的失活gRNA。如本文中所示，gRNA-Cpf1-RNP与失活gRNA-Cas9-RNP(即，包含与WT Cas9复合的失活gRNA的RNP)的共递送或gRNA-Cpf1-RNP与失活gRNA-切口酶-RNP(即，包含与Cas9切口酶(即，Cas9 D10A切口酶)复合的失活gRNA的RNP)的共递送导致总编辑增加，高于单独递送gRNA-Cpf1-RNP(参见，例如，实例，5、7、8)后所观察到的水平。失活gRNA分子可包含与靶核酸中的靶区域(例如，CCAAT盒靶区域、13nt靶区域、近端HBG1/2启动子靶序列和/或BCL11Ae中的GATA1结合基序)近端或内的区域互补的靶向结构域。在某些实施例中，“近端”可表示靶区域(例如，CCAAT盒靶区域、13nt靶区域、近端HBG1/2启动子靶序列、和/或BCL11Ae中的GATA1结合基序)的10、25、50、100或200个核苷酸内的区域。在某些实施例中，一种或多种加强元件可以由有待与gRNA-Cpf1-RNP共递送的一种或多种失活gRNA-核酸酶-RNP(例如，失活gRNA-Cas9-RNP、失活gRNA-切口酶-RNP、失活gRNA-eiCas9-RNP)构成。在某些实施例中，失活gRNA-核酸酶-RNP的共递送不改变gRNA-Cpf1-RNP的***缺失谱。

在某些实施例中，加强元件可包含RNP复合物，所述RNP复合物包含与RNA指导的核酸酶切口酶分子复合的gRNA分子(“gRNA-切口酶-RNP”)。在某些实施例中，RNA指导的核酸酶切口酶分子可以是Cas9切口酶分子，例如Cas9D10A切口酶。在某些实施例中，gRNA-切口酶-RNP的gRNA可包含本文所示的任何gRNA。例如，gRNA可包含表8或表9所示的gRNA靶向结构域。在某些实施例中，gRNA可以是经修饰的或未经修饰的gRNA。如本文所示，gRNA-Cpf1-RNP与gRNA-切口酶-RNP复合物(包含与Cas9D10A切口酶分子复合的指导RNA的RNP)的共递送导致总编辑增加，高于在递送单独gRNA-Cpf1-RNP后观察到的水平(参见，例如，实例4、5)。另外，gRNA-切口酶-RNP复合物与gRNA-Cpf1-RNP复合物的共递送改变gRNA-Cpf1-RNP的***缺失谱的方向性、长度和/或位置。在某些实施例中，可以使用加强元件来提供期望的编辑结果，例如以增加有效***缺失的比率。在某些实施例中，gRNA-切口酶-RNP复合物与gRNA-Cpf1-RNP复合物的共递送可以改变gRNA-Cpf1-RNP的***缺失谱。

在某些实施例中，加强元件可包含单链寡脱氧核苷酸(ssODN)或双链寡脱氧核苷酸(dsODN)。在某些实施例中，ssODN可以是本文披露的任何ssODN。在某些实施例中，ssODN可包含表7所示的序列。例如，在某些实施例中，ssODN可包含SEQ ID NO:1040所示的序列。

在一方面，本披露涉及RNP复合物，其包含来自普雷沃菌属(Prevotella)和弗朗西斯菌属(Franciscella)的CRISPR 1(Cpf1)RNA指导的核酸酶或其变体和gRNA，其中所述gRNA能够结合细胞中的HBG基因启动子的靶位点。在某些实施例中，所述gRNA可以是经修饰的或未经修饰的。在某些实施例中，gRNA可包含一个或多个修饰，所述修饰包括硫代磷酸酯键修饰、二硫代磷酸酯(PS2)键修饰、2’-O-甲基修饰、DNA延伸、RNA延伸或其组合。在某些实施例中，DNA延伸可包含表18所示的序列。在某些实施例中，RNA延伸可包含表18所示的序列。在某些实施例中，gRNA可包含表6、表12或表13所示的序列。在某些实施例中，RNP复合物可包含表15所示的RNP复合物。例如，RNP复合物可以包括包含SEQ ID NO:1051所示的序列的gRNA和由SEQ ID NO:1097所示的序列编码的Cpf1变体蛋白(RNP32，表15)。在某些实施例中，Cpf1变体蛋白可含有一个或多个修饰。在某些实施例中，所述一个或多个修饰可以包括但不限于野生型Cpf1氨基酸序列中的一个或多个突变、野生型Cpf1核酸序列中的一个或多个突变、一个或多个核定位信号(NLS)、一个或多个纯化标签(例如，His标签)或其组合。在某些实施例中，Cpf1变体蛋白可以由SEQ ID NO:1000、1001、1008-1018、1032、1035-39、1094-1097、1107-09(Cpf1多肽序列)或SEQ ID NO:1019-1021、1110-17(Cpf1多核苷酸序列)所示的序列编码。

在一方面，本披露涉及改变细胞中HBG基因的启动子的方法，该方法包括使细胞与本文公开的RNP复合物接触。在某些实施例中，该改变可包含表11所示的一个或多个区域内的***缺失。在某些实施例中，该改变可包含HBG基因的启动子的CCAAT盒靶区域内的***缺失。例如，在某些实施例中，该改变可包含Chr 11(NC_000011.10):5,249,955-5,249,987(表11，区域6)、Chr 11(NC_000011.10):5,254,879-5,254,909(表11，区域16)内或其组合内的***缺失。在某些实施例中，RNP复合物可包含gRNA和Cpf1蛋白。在某些实施例中，gRNA可包含表13所示的RNA靶向结构域。在某些实施例中，gRNA靶向结构域可包含选自由SEQ IDNO:1002、1254、1258、1260、1262和1264组成的组的序列。在某些实施例中，gRNA可包含表13所示的gRNA序列。在某些实施例中，gRNA可包含选自由SEQ ID NO:1022、1023、1041-1105组成的组的序列。在某些实施例中，可以将gRNA配置为在如下处提供编辑事件：Chr11:5249973，Chr11:5249977(HBG1)；Chr11:5250042，Chr11:5250046(HBG1)；Chr11:5250055，Chr11:5250059(HBG1)；Chr11:5250179，Chr11:5250183(HBG1)；Chr11:5254897，Chr11:5254901(HBG2)；Chr11:5254897，Chr11:5254901(HBG2)；Chr11:5254966、5254970(HBG2)；Chr11:5254979、5254983(HBG2)(表16、表17)。在某些实施例中，细胞可以进一步与加强元件接触。在某些实施例中，加强元件可包含单链寡脱氧核苷酸(ssODN)或双链寡脱氧核苷酸(dsODN)。在某些实施例中，ssODN可以是本文披露的任何ssODN。在某些实施例中，ssODN可包含表7所示的序列。例如，在某些实施例中，ssODN可包含SEQ ID NO:1040所示的序列。

在一方面，本披露涉及分离的细胞，该分离的细胞包含通过将RNP复合物递送至细胞而产生的HBG基因的启动子中的改变。在某些实施例中，RNP复合物可包含gRNA和Cpf1蛋白。在某些实施例中，所述gRNA可以是经修饰的或未经修饰的。在某些实施例中，gRNA可包含一个或多个修饰，所述修饰包括硫代磷酸酯键修饰、二硫代磷酸酯(PS2)键修饰、2’-O-甲基修饰、DNA延伸、RNA延伸或其组合。在某些实施例中，DNA延伸可包含表18所示的序列。在某些实施例中，RNA延伸可包含表18所示的序列。在某些实施例中，gRNA可包含表6、表12或表13所示的序列。在某些实施例中，RNP复合物可包含表15所示的RNP复合物。例如，RNP复合物可以包括包含SEQ ID NO:1051所示的序列的gRNA和由SEQ ID NO:1097所示的序列编码的Cpf1变体蛋白(RNP32，表15)。在某些实施例中，Cpf1变体蛋白可含有一个或多个修饰。在某些实施例中，所述一个或多个修饰可以包括但不限于野生型Cpf1氨基酸序列中的一个或多个突变、野生型Cpf1核酸序列中的一个或多个突变、一个或多个核定位信号(NLS)、一个或多个纯化标签(例如，His标签)或其组合。在某些实施例中，Cpf1变体蛋白可以由SEQ IDNO:1000、1001、1008-1018、1032、1035-39、1094-1097、1107-09(Cpf1多肽序列)或SEQ IDNO:1019-1021、1110-17(Cpf1多核苷酸序列)所示的序列编码。在某些实施例中，加强元件可以与RNP复合物共递送。在某些实施例中，加强元件可包含单链寡脱氧核苷酸(ssODN)或双链寡脱氧核苷酸(dsODN)。在某些实施例中，ssODN可以是本文披露的任何ssODN。在某些实施例中，ssODN可包含表7所示的序列。例如，在某些实施例中，ssODN可包含SEQ ID NO:1040所示的序列。

在一方面，本披露涉及增加人细胞中胎儿血红蛋白(HbF)水平的离体方法，该方法是通过使用包含gRNA和Cpf1 RNA指导的核酸酶或其变体的RNP复合物进行基因组编辑，以实现HBG基因启动子的改变，从而增加HbF的表达。在某些实施例中，所述gRNA可以是经修饰的或未经修饰的。在某些实施例中，gRNA可包含一个或多个修饰，所述修饰包括硫代磷酸酯键修饰、二硫代磷酸酯(PS2)键修饰、2’-O-甲基修饰、DNA延伸、RNA延伸或其组合。在某些实施例中，DNA延伸可包含表18所示的序列。在某些实施例中，RNA延伸可包含表18所示的序列。在某些实施例中，gRNA可包含表6、表12或表13所示的序列。在某些实施例中，RNP复合物可包含表15所示的RNP复合物。例如，RNP复合物可以包括包含SEQ ID NO:1051所示的序列的gRNA和由SEQ ID NO:1097所示的序列编码的Cpf1变体蛋白(RNP32，表15)。在某些实施例中，Cpf1变体蛋白可含有一个或多个修饰。在某些实施例中，所述一个或多个修饰可以包括但不限于野生型Cpf1氨基酸序列中的一个或多个突变、野生型Cpf1核酸序列中的一个或多个突变、一个或多个核定位信号(NLS)、一个或多个纯化标签(例如，His标签)或其组合。在某些实施例中，Cpf1变体蛋白可以由SEQ ID NO:1000、1001、1008-1018、1032、1035-39、1094-1097、1107-09(Cpf1多肽序列)或SEQ ID NO:1019-1021、1110-17(Cpf1多核苷酸序列)所示的序列编码。在某些实施例中，加强元件可以与RNP复合物共递送。在某些实施例中，加强元件可包含单链寡脱氧核苷酸(ssODN)或双链寡脱氧核苷酸(dsODN)。在某些实施例中，ssODN可以是本文披露的任何ssODN。在某些实施例中，ssODN可包含表7所示的序列。例如，在某些实施例中，ssODN可包含SEQ ID NO:1040所示的序列。

在一方面，本披露涉及CD34+或造血干细胞的群体，其中群体中的一个或多个细胞包含HBG基因的启动子的改变，该改变是通过将RNP复合物递送至CD34+或造血干细胞群体产生的，该RNP复合物包含gRNA和Cpf1 RNA指导的核酸酶或其变体。在某些实施例中，所述gRNA可以是经修饰的或未经修饰的。在某些实施例中，gRNA可包含一个或多个修饰，所述修饰包括硫代磷酸酯键修饰、二硫代磷酸酯(PS2)键修饰、2’-O-甲基修饰、DNA延伸、RNA延伸或其组合。在某些实施例中，DNA延伸可包含表18所示的序列。在某些实施例中，RNA延伸可包含表18所示的序列。在某些实施例中，gRNA可包含表6、表12或表13所示的序列。在某些实施例中，RNP复合物可包含表15所示的RNP复合物。例如，RNP复合物可以包括包含SEQ IDNO:1051所示的序列的gRNA和由SEQ ID NO:1097所示的序列编码的Cpf1变体蛋白(RNP32，表15)。在某些实施例中，Cpf1变体蛋白可含有一个或多个修饰。在某些实施例中，所述一个或多个修饰可以包括但不限于野生型Cpf1氨基酸序列中的一个或多个突变、野生型Cpf1核酸序列中的一个或多个突变、一个或多个核定位信号(NLS)、一个或多个纯化标签(例如，His标签)或其组合。在某些实施例中，Cpf1变体蛋白可以由SEQ ID NO:1000、1001、1008-1018、1032、1035-39、1094-1097、1107-09(Cpf1多肽序列)或SEQ ID NO:1019-1021、1110-17(Cpf1多核苷酸序列)所示的序列编码。在某些实施例中，加强元件可以与RNP复合物共递送。在某些实施例中，加强元件可包含单链寡脱氧核苷酸(ssODN)或双链寡脱氧核苷酸(dsODN)。在某些实施例中，ssODN可以是本文披露的任何ssODN。在某些实施例中，ssODN可包含表7所示的序列。例如，在某些实施例中，ssODN可包含SEQ ID NO:1040所示的序列。

在一方面，本披露涉及减轻有需要的受试者中镰状细胞病的一种或多种症状的方法，该方法包括：a)从所述受试者中分离CD34+或造血干细胞的群体；b)通过以下修饰离体分离的细胞的群体：将包含gRNA和Cpf1 RNA指导的核酸酶或其变体的RNP复合物递送至分离的细胞的群体，从而实现所述群体中的一个或多个细胞中HBG基因启动子的改变；以及c)将经修饰的细胞群体施用于所述受试者，从而减轻所述受试者中镰状细胞病的一种或多种症状。在某些实施例中，该方法可以进一步包括，在施用后，例如至少[1、2、3、4、5、6、7、8、12、16或20]周，或至少[1、2、3、4、5或6]个月，或至少[1、2、3、4或5]年，检测受试者中施用的经修饰的细胞的后代/子代细胞(例如，呈以下形式：BM植入的CD34+造血干细胞或衍生自那些细胞的血细胞(例如，髓样祖细胞或分化的骨髓细胞(例如，红细胞、肥大细胞、成肌细胞))；或淋巴样祖细胞或分化的淋巴样细胞(例如，T淋巴细胞或B淋巴细胞，或NK细胞))。在某些实施例中，该方法可以导致所有造血细胞谱系(例如，没有任何分化偏向，例如，没有红系谱系分化偏向)的重构。在某些实施例中，该方法可以包括施用多个经编辑的细胞，并且该方法可以导致BM中多个[至少5、10、15、20、25……100个]不同的HSC克隆的长期植入[例如，施用后至少[1、2、3、4、5、6、7、8、12、16或20]周，或至少[1、2、3、4、5或6]个月，或至少[1、2、3、4或5]年]。在某些实施例中，该方法可以进一步包括在施用后至少[1、2、3、4、5、6、7、8、12、16或20]周，或至少[1、2、3、4、5或6]个月，或至少[1、2、3、4或5]年，检测受试者中总血红蛋白表达的水平。在某些实施例中，与健康受试者相比，该方法可以导致[至少50％、至少60％……至少99％]的总血红蛋白(例如，总Hb(例如，HbA和HbF(如果有的话)之和))的长期表达[例如，施用后至少[1、2、3、4、5、6、7、8、12、16或20]周，或至少[1、2、3、4、5或6]个月，或至少[1、2、3、4或5]年]。在某些实施例中，改变可包含HBG基因的启动子的CCAAT盒靶区域内的***缺失。在某些实施例中，可以使用电穿孔递送所述RNP复合物。在某些实施例中，细胞群体中至少约5％、至少约10％、至少约20％、至少约30％、至少约40％、至少约50％、至少约60％、至少约70％、至少约80％或至少约90％的细胞包含有效***缺失。

在一方面，本披露涉及gRNA，该gRNA包含5’末端和3’末端，并且在该5’末端包含DNA延伸，并且在该3’末端包含2’-O-甲基-3’-硫代磷酸酯修饰，其中该gRNA包括能够与靶位点杂交的RNA区段和能够与Cpf1 RNA指导的核酸酶缔合的RNA区段。在某些实施例中，DNA延伸可包含SEQ ID NO:1235-1250所示的序列。在某些实施例中，所述gRNA可以是经修饰的或未经修饰的。在某些实施例中，gRNA可包含一个或多个修饰，所述修饰包括硫代磷酸酯键修饰、二硫代磷酸酯(PS2)键修饰、2’-O-甲基修饰、DNA延伸、RNA延伸或其组合。在某些实施例中，DNA延伸可包含表18所示的序列。在某些实施例中，RNA延伸可包含表18所示的序列。在某些实施例中，gRNA可包含表6、表12或表13所示的序列。

在一方面，本披露涉及RNP复合物，该RNP复合物包含如本文披露的Cpf1 RNA指导的核酸酶和如本文披露的gRNA。

本文还提供了基因组编辑***、指导RNA和CRISPR介导的方法，这些方法用于改变一种或多种γ-珠蛋白基因(例如HBG1、HBG2或HBG1和HBG2)，并增加胎儿血红蛋白(HbF)的表达。在某些实施例中，包含表12或表13所示的序列的一种或多种gRNA可用于在HBG基因的启动子区域中引入改变。在某些实施例中，基因组编辑***、指导RNA和CRISPR介导的方法可以改变13个核苷酸(nt)靶区域，该13个核苷酸(nt)靶区域是HBG1、HBG2、或HBG1和HBG2基因的转录位点的5’(“13nt靶区域”)。在某些实施例中，基因组编辑***、指导RNA和CRISPR介导的方法可以改变CCAAT盒靶区域，该CCAAT盒靶区域是HBG1、HBG2、或HBG1和HBG2基因的转录位点的5’(“CCAAT盒靶区域”)。在某些实施例中，CCAAT盒靶区域可以是在远端CCAAT盒处或附近的区域，并且包括远端CCAAT盒的核苷酸和远端CCAAT盒的上游(5’)25个核苷酸和下游(3’)25个核苷酸(即HBG1/2c.-86至-140)。在某些实施例中，CCAAT盒靶区域可以是在远端CCAAT盒处或附近的区域，并且包括远端CCAAT盒的核苷酸和远端CCAAT盒的上游(5’)5个核苷酸和下游(3’)5个核苷酸(即HBG1/2c.-106至-120)。在某些实施例中，CCAAT盒靶区域可包含18nt靶区域、13nt靶区域、11nt靶区域、4nt靶区域、1nt靶区域、-117G>A靶区域、或如本文所披露的其组合。在某些实施例中，该改变可以是HBG1、HBG2、或HBG1和HBG2基因的18nt缺失、13nt缺失、11nt缺失、4nt缺失、1nt缺失、在c.-117处从G到A的取代、或其组合。在某些实施例中，改变可以是非天然发生的改变或天然发生的改变。

在某些实施例中，本文还提供了任选的基因组编辑***组分，例如模板核酸(寡核苷酸供体模板)的用途。在某些实施例中，用于靶向CCAAT盒靶区域的模板核酸可以包括但不限于编码CCAAT盒靶区域的改变的模板核酸。在某些实施例中，CCAAT盒靶区域可包含18nt靶区域、11nt靶区域、4nt靶区域、1nt靶区域、或其组合。在某些实施例中，模板核酸可以是单链寡脱氧核苷酸(ssODN)或双链寡脱氧核苷酸(dsODN)。在某些实施例中，下文(例如，SEQ ID NO:974-995、1040)也提供了5’和3’同源臂，以及编码CCAAT盒靶区域处的改变的示例性全长供体模板。在某些实施例中，模板核酸可以是正链或负链。在某些实施例中，ssODN可包含5’同源臂、替代序列和3’同源臂。在某些实施例中，5’同源臂可以是长度约25至约200个核苷酸或更多，例如，长度至少约25、50、75、100、125、150、175或200个核苷酸；该替代序列可包含长度为0个核苷酸；并且3’同源臂可以是长度约25至约200个核苷酸或更多，例如，长度至少约25、50、75、100、125、150、175或200个核苷酸。在某些实施例中，ssODN可包含一个或多个硫代磷酸酯。

在某些实施例中，用于改变一种或多种γ-珠蛋白基因(例如，HBG1，HBG2或HBG1和HBG2)的基因组编辑***、指导RNA、CRISPR介导的方法可包括RNA指导的核酸酶。在某些实施例中，RNA指导的核酸酶可以是本文披露的Cpf1或经修饰的Cpf1。

在一方面，本披露涉及组合物，这些组合物包括以下：通过以上披露的方法产生的多个细胞，其中至少20％、30％、40％、50％、60％、70％、80％或90％的细胞包括人HBG1或HBG2基因的13nt靶区域的序列的改变；或通过以上披露的方法产生的多个细胞，其中至少20％、30％、40％、50％、60％、70％、80％或90％的细胞包括人HBG1或HBG2基因的13nt靶区域的序列的改变。在某些实施例中，多个细胞中的至少一部分可以在红系谱系内。在某些实施例中，多个细胞的特征在于相对于未经修饰的多个细胞而言，胎儿血红蛋白表达水平的增加。在某些实施例中，胎儿血红蛋白的水平可以增加至少20％、30％、40％、50％、60％、70％、80％或90％。在某些实施例中，这些组合物可以进一步包括药学上可接受的载剂。

本文的披露内容还涉及改变细胞的方法，该方法包括使该细胞与本文披露的任何基因组编辑***接触。在某些实施例中，接触细胞的步骤可以包括使细胞与包含第一和第二核糖核蛋白复合物的溶液接触。在某些实施例中，使细胞与溶液接触的步骤还包含电穿孔细胞，从而将第一和第二核糖核蛋白复合物引入细胞。

包括上述所有特征中的任一个的基因组编辑***或方法可以包括包含人HBG1、HBG2基因或其组合的靶核酸。在某些实施例中，靶区域可以是人HBG1、HBG2基因或其组合的CCAAT盒靶区域。在某些实施例中，第一靶向结构域序列可以与人HBG1、HBG2基因或其组合的CCAAT盒靶区域一侧的第一序列互补，其中该第一序列任选地与人HBG1、HBG2基因或其组合的CCAAT盒靶区域重叠。在某些实施例中，第二靶向结构域序列可以与人HBG1、HBG2基因或其组合的CCAAT盒靶区域一侧的第二序列互补，其中该第二序列任选地与人HBG1、HBG2基因或其组合的CCAAT盒靶区域重叠。在某些实施例中，第一靶向结构域可包含gRNA靶向结构域的截短。在某些实施例中，gRNA靶向结构域可以包括表8或表9所示的gRNA，并且gRNA靶向结构域已经从gRNA靶向结构域的5’末端截短。在某些实施例中，第一靶向结构域可以与表8或表9所示的dgRNA靶向结构域相同或相差不超过3个核苷酸。在某些实施例中，第二靶向结构域与表8或表9所示的gRNA靶向结构域相差不超过3个核苷酸。在某些实施例中，***缺失可以改变CCAAT盒靶区域***缺失。在某些实施例中，***缺失可以是导致胎儿血红蛋白表达水平升高的有效***缺失。在某些实施例中，gRNA、dgRNA或两者可以体外合成或化学合成。

在某些实施例中，细胞可以包括通过本文披露的改变细胞的任何方法产生的HBG基因座的至少一个经修饰的等位基因，其中HBG基因座的经修饰的等位基因包含人HBG1、HBG2基因或其组合的改变。

在某些实施例中，可以通过本文披露的改变细胞的任何方法来修饰分离的细胞群体，其中该细胞群体可以包括***缺失分布，所述***缺失分布可能与具有相同细胞类型的未通过该方法修饰的分离的细胞群体或其后代不同。

在某些实施例中，可通过本文披露的改变细胞的任何方法产生多个细胞，其中至少20％、30％、40％、50％、60％、70％、80％或90％的细胞可以包括人HBG1基因、HBG2基因或其组合的CCAAT盒靶区域中的序列的改变。

在某些实施例中，本文披露的细胞可以用于药物。在某些实施例中，这些细胞可以用于治疗β-血红蛋白病。在某些实施例中，β-血红蛋白病可以选自由镰状细胞病和β-地中海贫血组成的组。

在一方面，本披露涉及组合物，这些组合物包括以下：通过包括上述披露dgRNA的方法产生的多个细胞，其中至少20％、30％、40％、50％、60％、70％、80％或90％的细胞包括人HBG1或HBG2基因的CCAAT盒靶区域的序列的改变；或通过上述披露方法产生的多个细胞，其中至少20％、30％、40％、50％、60％、70％、80％或90％的细胞包括人HBG1或HBG2的CCAAT盒靶区域的序列的改变。在某些实施例中，多个细胞中的至少一部分可以在红系谱系内。在某些实施例中，多个细胞的特征在于相对于未经修饰的多个细胞而言，胎儿血红蛋白表达水平的增加。在某些实施例中，胎儿血红蛋白的水平可以增加至少20％、30％、40％、50％、60％、70％、80％或90％。在某些实施例中，这些组合物可以进一步包括药学上可接受的载剂。

在一方面，本披露涉及通过基因组编辑***修饰的细胞群体，该基因编辑***包括上述dgRNA，其中相对于未经该基因编辑***修饰的细胞群体，经该基因编辑***修饰的细胞群体包含更高百分比的有效***缺失。本披露还涉及通过包括上述dgRNA的基因组编辑***修饰的细胞群体，其中相对于未经基因组编辑***修饰的细胞群体，更高百分比的细胞群体能够分化为表达HbF的红系谱系细胞群体。

在某些实施例中，更高百分比可以至少约15％、至少约20％、至少约25％、至少约30％或至少约40％或更高。在某些实施例中，这些细胞可以是造血干细胞。在某些实施例中，这些细胞能够分化为成红细胞、红细胞或红细胞的前体或成红细胞的前体。在某些实施例中，***缺失可以通过除微同源性介导的末端连接(MMEJ)修复以外的修复机制产生。

本披露还涉及本文公开的任何细胞在制备用于治疗受试者的β-血红蛋白病的药物中的用途。

在一方面，本披露涉及在有需要的受试者中治疗β-血红蛋白病的方法，该方法包括向该受试者施用本文披露的细胞。在某些实施例中，在有需要的受试者中治疗β-血红蛋白病的方法可包括向该受试者施用经修饰的造血细胞群体，其中根据本文披露的改变细胞的方法已经改变了一个或多个细胞。在某些实施例中，该方法可以进一步包括，在施用后，例如至少[1、2、3、4、5、6、7、8、12、16或20]周，或至少[1、2、3、4、5或6]个月，或至少[1、2、3、4或5]年，检测受试者中施用的经修饰的细胞的后代/子代细胞(例如，呈以下形式：BM植入的CD34+造血干细胞或衍生自那些细胞的血细胞(例如，髓样祖细胞或分化的骨髓细胞(例如，红细胞、肥大细胞、成肌细胞))；或淋巴样祖细胞或分化的淋巴样细胞(例如，T淋巴细胞或B淋巴细胞，或NK细胞))。在某些实施例中，该方法可以导致所有造血细胞谱系(例如，没有任何分化偏向，例如，没有红系谱系分化偏向)的重构。在某些实施例中，该方法可以包括施用多个经编辑的细胞，并且该方法可以导致BM中多个[至少5、10、15、20、25……100个]不同的HSC克隆的长期植入[例如，施用后至少[1、2、3、4、5、6、7、8、12、16或20]周，或至少[1、2、3、4、5或6]个月，或至少[1、2、3、4或5]年]。在某些实施例中，该方法可以进一步包括在施用后至少[1、2、3、4、5、6、7、8、12、16或20]周，或至少[1、2、3、4、5或6]个月，或至少[1、2、3、4或5]年，检测受试者中总血红蛋白表达的水平。在某些实施例中，与健康受试者相比，该方法可以导致[至少50％、至少60％……至少99％]的总血红蛋白(例如，总Hb(例如，HbA和HbF(如果有的话)之和))的长期表达[例如，施用后至少[1、2、3、4、5、6、7、8、12、16或20]周，或至少[1、2、3、4、5或6]个月，或至少[1、2、3、4或5]年]。在某些实施例中，改变可包含HBG基因的启动子的CCAAT盒靶区域内的***缺失。

在一方面，本披露涉及基因组编辑***，该基因组编辑***包含：RNA指导的核酸酶；以及第一指导RNA，其中该第一指导RNA可包含与人HBG1、HBG2基因或其组合的CCAAT盒靶区域一侧的第一序列互补的第一靶向结构域，其中该第一序列任选地与人HBG1、HBG2基因或其组合的CCAAT盒靶区域重叠。在某些实施例中，基因组编辑***可进一步包含模板核酸，该模板核酸编码人HBG1、HBG2基因或其组合的CCAAT盒靶区域的改变。在某些实施例中，模板核酸可以是单链寡脱氧核苷酸(ssODN)或双链寡脱氧核苷酸(dsODN)。在某些实施例中，ssODN可包含5’同源臂、替代序列和3’同源臂。在某些实施例中，同源臂在长度方面可以是对称的。在某些实施例中，同源臂在长度方面可以是不对称的。在某些实施例中，ssODN可包含一个或多个硫代磷酸酯修饰。在某些实施例中，一个或多个硫代磷酸酯修饰可以在5’末端、3’末端或其组合。在某些实施例中，ssODN可以是正链或负链。在某些实施例中，该改变可以是非天然发生的改变。在某些实施例中，该改变可包含CCAAT盒靶区域的缺失。在某些实施例中，该缺失可包含18nt缺失、11nt缺失、4nt缺失、1nt缺失或其组合。在某些实施例中，CCAAT盒靶区域可包含18nt靶区域、11nt靶区域、4nt靶区域、1nt靶区域、或其组合。在某些实施例中，5’同源臂的长度可以是约25至约200个或更多个核苷酸，例如，长度是至少约25、50、75、100、125、150、175或200个核苷酸；该替代序列可包含长度为0个核苷酸；并且3’同源臂的长度可以是约25至约200个或更多个核苷酸，例如长度是至少约25、50、75、100、125、150、175或200个核苷酸。在某些实施例中，5’同源臂可包含约50至100bp，例如55至95、60至90、70至90或80至90bp与18nt靶区域的5’同源，并且3’同源臂可包含约50至100bp，例如55至95、60至90、70至90或80至90bp与18nt靶区域的3’同源。在某些实施例中，ssODN可包含以下、可以基本上由以下组成或由以下组成：SEQ ID NO:974或SEQ ID NO:975。在某些实施例中，5’同源臂可包含约50至100bp，例如55至95、60至90、70至90或80至90bp与11nt靶区域的5’同源，并且3’同源臂可包含约50至100bp，例如55至95、60至90、70至90或80至90bp与11nt靶区域的3’同源。在某些实施例中，ssODN可包含以下、可以基本上由以下组成或由以下组成：SEQ ID NO:976或SEQ ID NO:978。在某些实施例中，5’同源臂可包含约50至100bp，例如55至95、60至90、70至90或80至90bp与4nt靶区域的5’同源，并且3’同源臂可包含约50至100bp，例如55至95、60至90、70至90或80至90bp与4nt靶区域的3’同源。在某些实施例中，ssODN可包含以下、可以基本上由以下组成或由以下组成：选自由SEQ ID NO:984、SEQ IDNO:985、SEQ ID NO:986、SEQ ID NO:987、SEQ ID NO:988、SEQ ID NO:989、SEQ ID NO:990、SEQ ID NO:991、SEQ ID NO:992、SEQ ID NO:993、SEQ ID NO:994和SEQ ID NO:995组成的组的序列。在某些实施例中，5’同源臂可包含约50至100bp，例如55至95、60至90、70至90或80至90bp与1nt靶区域的5’同源，并且3’同源臂可包含约50至100bp，例如55至95、60至90、70至90或80至90bp与1nt靶区域的3’同源。在某些实施例中，同源臂在长度方面可以是对称的。在某些实施例中，ssODN可包含以下、可以基本上由以下组成或由以下组成：SEQ ID NO:982或SEQ ID NO:983。在某些实施例中，该改变可以是天然发生的改变。在某些实施例中，该改变可包含CCAAT盒靶区域的缺失或突变。在某些实施例中，该CCAAT盒靶区域可包含13nt靶区域、-117G>A靶区域、或其组合。在某些实施例中，该改变可包含在13nt靶区域的13nt缺失或在-117G>A靶区域的从G至A的取代，或其组合。在某些实施例中，5’同源臂可包含约50至100bp，例如55至95、60至90、70至90或80至90bp与13nt靶区域的5’同源，并且3’同源臂可包含约50至100bp，例如55至95、60至90、70至90或80至90bp与13nt靶区域的3’同源。在某些实施例中，ssODN可包含以下、可以基本上由以下组成或由以下组成：SEQ ID NO:977或SEQ ID NO:979。在某些实施例中，5’同源臂可包含约50至100bp，例如55至95、60至90、70至90或80至90bp与13nt靶区域的5’同源，并且3’同源臂可包含约50至100bp，例如55至95、60至90、70至90或80至90bp与13nt靶区域的3’同源。在某些实施例中，ssODN可包含以下、可以基本上由以下组成或由以下组成：SEQ ID NO:980或SEQ ID NO:981。在某些实施例中，RNA指导的核酸酶可以是化脓链球菌(S.pyogenes)Cas9。在某些实施例中，RNA指导的核酸酶可以是本文披露的Cpf1变体。在某些实施例中，第一靶向结构域可以与表12、表13中所示的靶结构域或表13中的gRNA相差不超过3个核苷酸。在某些实施例中，基因组编辑***可以进一步包含第二指导RNA，其中该第二指导RNA可包含第二靶向结构域，该第二靶向结构域可以与人HBG1、HBG2基因或其组合的CCAAT盒靶区域一侧的第二序列互补，其中该第二序列任选地与人HBG1、HBG2基因或其组合的CCAAT盒靶区域重叠。在某些实施例中，RNA指导的核酸酶可以是切口酶，并且任选地缺乏RuvC活性。在某些实施例中，基因组编辑***可包含第一和第二RNA指导的核酸酶。在某些实施例中，第一和第二RNA指导的核酸酶可以分别与第一和第二指导RNA复合，形成第一和第二核糖核蛋白复合物。在某些实施例中，基因组编辑***可进一步包含第三指导RNA；以及任选的第四指导RNA，其中该第三和第四指导RNA可包含与第三和第四序列互补的第三和第四靶向结构域，该第三和第四序列在人BCL11A基因的BCL11A红系增强子(BCL11Ae)中GATA1结合基序的位置的相对侧，其中该第三和第四序列之一或两者任选地与人BCL11A基因的BCL11Ae中的GATA1结合基序重叠。在某些实施例中，基因组编辑***可以进一步包含编码BCL11Ae中的GATA1结合基序的缺失的核酸模板。在某些实施例中，RNA指导的核酸酶可以是化脓链球菌Cas9。在某些实施例中，RNA指导的核酸酶可以是切口酶，并且任选地缺乏RuvC活性。在某些实施例中，第三靶向结构域可与BCL11Ae中GATA1结合基序上游1000个核苷酸内的序列互补。在某些实施例中，第三靶向结构域可与BCL11Ae中GATA1结合基序上游100个核苷酸内的序列互补。在某些实施例中，第三和第四靶向结构域之一可以与BCL11Ae中GATA1结合基序下游100个核苷酸内的序列互补。在某些实施例中，第四靶向结构域可以与BCL11Ae中GATA1结合基序下游的50个核苷酸内的序列互补。在某些实施例中，基因组编辑***可包含第一和第二RNA指导的核酸酶。在某些实施例中，第一和第二RNA指导的核酸酶可以分别与第三和第四指导RNA复合，形成第三和第四核糖核蛋白复合物。

在一方面，本披露涉及改变细胞的方法，该方法包括使细胞与基因组编辑***接触。在某些实施例中，使细胞与基因组编辑***接触的步骤可包括使细胞与包含第一和第二核糖核蛋白复合物的溶液接触。在某些实施例中，使细胞与溶液接触的步骤可以进一步包括电穿孔细胞，从而将第一和第二核糖核蛋白复合物引入细胞中。在某些实施例中，改变细胞的方法可以进一步包括使细胞与基因组编辑***接触，其中使细胞与基因组编辑***接触的步骤可包括使细胞与包含第一、第二、第三和任选的第四核糖核蛋白复合物的溶液接触。在某些实施例中，使细胞与溶液接触的步骤可以进一步包括电穿孔细胞，从而将第一、第二、第三和任选的第四核糖核蛋白复合物引入细胞中。在某些实施例中，细胞能够分化为成红细胞、红细胞或红细胞的前体或成红细胞的前体。在某些实施例中，细胞可以是CD34⁺细胞。

在一方面，本披露涉及CRISPR介导的改变细胞的方法，该方法包括：在人HBG1或HBG2基因的c.-106至-120位之间的细胞基因组中引入第一DNA单链断裂(SSB)或双链断裂(DSB)；以及任选地在人HBG1或HBG2基因的c.-106至-120位之间的细胞基因组中引入第二SSB或DSB，其中该第一和第二SSB或DSB可以由细胞以改变人HBG1或HBG2基因的CCAAT盒靶区域的方式修复。在某些实施例中，第一和第二SSB或DSB可以由细胞以导致人HBG1或HBG2基因的CCAAT盒靶区域的改变的方式修复。在某些实施例中，CRISPR介导的方法可以进一步包含编码人HBG1、HBG2基因或其组合的CCAAT盒靶区域的改变的模板核酸。在某些实施例中，该模板核酸可以是单链寡脱氧核苷酸(ssODN)。在某些实施例中，ssODN可包含5’同源臂、替代序列和3’同源臂。在某些实施例中，ssODN可以是正链或负链。在某些实施例中，该改变可以是非天然发生的改变。在某些实施例中，第一和第二SSB或DSB可以由细胞以下述方式修复，该方式导致在人HBG1或HBG2基因的CCAAT盒靶区域中***缺失、缺失或***中的至少一种的形成。在某些实施例中，CCAAT盒靶区域可包含18nt靶区域、11nt靶区域、4nt靶区域、1nt靶区域、或其组合。在某些实施例中，5’同源臂可以是长度约25至约200个核苷酸或更多，例如，长度至少约25、50、75、100、125、150、175或200个核苷酸；该替代序列可包含长度为0个核苷酸；并且3’同源臂可以是长度约25至约200个核苷酸或更多，例如，长度至少约25、50、75、100、125、150、175或200个核苷酸。在某些实施例中，5’同源臂可包含约50至100bp，例如55至95、60至90、70至90或80至90bp与18nt靶区域、11nt靶区域、4nt靶区域或1nt靶区域的5’同源，并且3’同源臂可包含约50至100bp，例如55至95、60至90、70至90或80至90bp与18nt靶区域、11nt靶区域、4nt靶区域或1nt靶区域的3’同源。在某些实施例中，ssODN可包含以下、可以基本上由以下组成或由以下组成：选自由SEQ ID NO:974、SEQ IDNO:975、SEQ ID NO:976、SEQ ID NO:978、SEQ ID NO:984、SEQ ID NO:985、SEQ ID NO:986、SEQ ID NO:987、SEQ ID NO:988、SEQ ID NO:989、SEQ ID NO:990、SEQ ID NO:991、SEQ IDNO:992、SEQ ID NO:993、SEQ ID NO:994、SEQ ID NO:995、SEQ ID NO:982和SEQ ID NO:983组成的组的序列。在某些实施例中，该改变可以是非天然发生的改变。在某些实施例中，第一和第二SSB或DSB可以由细胞以下述方式修复，该方式导致在人HBG1或HBG2基因的CCAAT盒靶区域中***缺失、缺失或***中的至少一种的形成。在某些实施例中，该CCAAT盒靶区域可包含13nt靶区域、-117G>A靶区域、或其组合。在某些实施例中，该改变可包含在13nt靶区域的13nt缺失或在-117G>A靶区域的从G至A的取代，或其组合。在某些实施例中，5’同源臂可包含约50至100bp，例如55至95、60至90、70至90或80至90bp与13nt靶区域或-117G>A靶区域的5’同源，并且3’同源臂可包含约50至100bp，例如55至95、60至90、70至90或80至90bp与13nt靶区域或-117G>A靶区域的3’同源。在某些实施例中，ssODN可包含以下、可以基本上由以下组成或由以下组成：选自由SEQ ID NO:977或SEQ ID NO:979、SEQ ID NO:980或SEQID NO:981组成的组的序列。

在一方面，本披露涉及组合物，该组合物可包含通过改变本文披露的改变细胞的方法产生的多个细胞，其中至少20％、30％、40％、50％、60％、70％、80％或90％的细胞可包含人HBG1基因、HBG2基因或其组合的CCAAT盒靶区域的序列的改变。在某些实施例中，该改变可以包含18nt缺失，11nt缺失，4nt缺失，1nt缺失，13nt缺失，人HBG1基因、HBG2基因或其组合在c.-117处从G到A的取代。在某些实施例中，多个细胞中的至少一部分可以在红系谱系内。在某些实施例中，多个细胞的特征在于相对于未经修饰的多个细胞而言，胎儿血红蛋白表达水平的增加。在某些实施例中，胎儿血红蛋白的水平可以增加至少20％、30％、40％、50％、60％、70％、80％或90％。在某些实施例中，组合物可以进一步包含药学上可接受的载剂。

在一方面，本披露涉及包含通过本文披露的改变细胞的方法产生的合成基因型的细胞，其中该细胞可包含18nt缺失，11nt缺失，4nt缺失，1nt缺失，13nt缺失，人HBG1基因、HBG2基因或其组合在-117处从G到A的取代。

在一方面，本披露涉及细胞，该细胞包含通过本文披露的改变细胞的方法产生的HBG基因座的至少一个等位基因，其中该细胞可以编码18nt缺失、11nt缺失、4nt缺失、1nt缺失，13nt缺失，人HBG1基因、HBG2基因或其组合在-117处从G到A的取代。

在一方面，本披露涉及包含模板核酸的AAV载体，该模板核酸编码人HBG1、HBG2基因或其组合的CCAAT盒靶区域的非天然发生的改变。在某些实施例中，该模板核酸可以是单链寡脱氧核苷酸(ssODN)。在某些实施例中，CCAAT盒靶区域可包含18nt靶区域、11nt靶区域、4nt靶区域、1nt靶区域、或其组合。在某些实施例中，ssODN可包含5’同源臂、替代序列和3’同源臂。在某些实施例中，5’同源臂的长度可以是约25至约200个或更多个核苷酸，例如，长度是至少约25、50、75、100、125、150、175或200个核苷酸；该替代序列可包含长度为0个核苷酸；并且3’同源臂的长度可以是约25至约200个或更多个核苷酸，例如长度是至少约25、50、75、100、125、150、175或200个核苷酸。在某些实施例中，5’同源臂可包含约50至100bp，例如55至95、60至90、70至90或80至90bp与18nt靶区域、11nt靶区域、4nt靶区域或1nt靶区域的5’同源，并且3’同源臂可包含约50至100bp，例如55至95、60至90、70至90或80至90bp与18nt靶区域、11nt靶区域、4nt靶区域或1nt靶区域的3’同源。在某些实施例中，ssODN可包含以下、可以基本上由以下组成或由以下组成：选自由SEQ ID NO:974-976、SEQ ID NO:978、SEQ ID NO:982-995组成的组的序列。

在一方面，本披露涉及包含模板核酸的核苷酸序列，该模板核酸编码人HBG1、HBG2基因或其组合的CCAAT盒靶区域的非天然发生的改变。在某些实施例中，模板核酸可以是包含该改变的单链寡脱氧核苷酸(ssODN)或双链寡脱氧核苷酸(dsODN)。在某些实施例中，CCAAT盒靶区域可包含18nt靶区域、11nt靶区域、4nt靶区域、1nt靶区域、或其组合。在某些实施例中，ssODN可包含5’同源臂、替代序列和3’同源臂。在某些实施例中，5’同源臂的长度可以是约25至约200个或更多个核苷酸，例如，长度是至少约25、50、75、100、125、150、175或200个核苷酸；该替代序列可包含长度为0个核苷酸；并且3’同源臂的长度可以是约25至约200个或更多个核苷酸，例如长度是至少约25、50、75、100、125、150、175或200个核苷酸。在某些实施例中，5’同源臂可包含约50至100bp，例如55至95、60至90、70至90或80至90bp与18nt靶区域、11nt靶区域、4nt靶区域或1nt靶区域的5’同源，并且3’同源臂可包含约50至100bp，例如55至95、60至90、70至90或80至90bp与18nt靶区域、11nt靶区域、4nt靶区域或1nt靶区域的3’同源。在某些实施例中，ssODN可包含以下、可以基本上由以下组成或由以下组成：选自由SEQ ID NO:974-976、SEQ ID NO:978、SEQ ID NO:982-995组成的组的序列。

在一方面，本披露涉及包含合成的基因型的细胞，其中该细胞可包含18nt缺失，11nt缺失，4nt缺失，1nt缺失，13nt缺失，人HBG1基因、HBG2基因或其组合在-117处从G到A的取代。

在一方面，本披露涉及组合物，该组合物包含通过本文披露的改变细胞的方法产生的细胞群体，其中相对于未经修饰的细胞群体而言，该细胞包含人HBG1基因、HBG2基因或其组合的CCAAT盒靶区域的序列的更高的改变频率。在某些实施例中，更高的频率是高至少约10％、20％、30％、40％、50％、60％、70％、80％或90％。在某些实施例中，该改变包含18nt缺失，11nt缺失，4nt缺失，1nt缺失，13nt缺失，人HBG1基因、HBG2基因或其组合在c.-117处从G到A的取代。在某些实施例中，细胞群体至少一部分在红系谱系内。

该清单旨在是示例性和说明性的，而不是全面的和限制性的。其他方面和实施例可以在本披露和权利要求书的其余部分中阐明或从中显而易见。

附图说明

附图旨在提供本披露的某些方面和实施例的说明性和示意性而非综合性的实例。图式并不旨在限制或结合于任何具体理论或模型，并且不一定成比例。不限制前文，可将核酸和多肽描绘为线性序列，或描绘为示意性二维或三维结构；这些描绘旨在具有说明性，而不是限制或束缚于关于其结构的任何具体模型或理论。

图1以示意图形式在人第11号染色体上的β-珠蛋白基因簇的背景下描绘了一个或多个HBG1和HBG2基因。图1β-珠蛋白基因簇中的每个基因均受近端启动子的转录调控。尽管不希望受到任何特定理论的束缚，但通常认为A_γ和/或G_γ表达是通过近端启动子与远端强红系特异性增强子(基因座控制区(LCR))之间的结合而激活的。LCR的长程反式激活被认为是通过染色质构型/确认的改变来介导的。LCR的特征是4个红系特异性DNA酶I超敏位点(HS1-4)和2个远端增强子元件(5’HS和3’HS1)。β样基因珠蛋白基因的表达以发育阶段特异性的方式调节，并且珠蛋白基因的表达变化与血液产生的主要部位的变化一致。

图2A-2B描绘了HBG1和HBG2基因，编码序列(CDS)以及HBG1和HBG2近端启动子中和上游的小缺失和点突变(已在患者中鉴定出并与胎儿血红蛋白(HbF)升高有关)。近端启动子(CAAT盒，13nt序列)内的核心元件，其在某些具有遗传持续性胎儿血红蛋白(HPFH)的患者中已被缺失。还可以鉴定每个基因座的“靶序列”区域，所述区域已针对gRNA结合靶位点进行了筛选。

图3描绘了用氨基酸球菌属物种Cpf1的变体(“AsCpf1”)电穿孔的mPB CD34+细胞的HBG的基因编辑，该变体即His-AsCpf1-nNLS(SEQ ID NO:1000)和His-AsCpf1-sNLS-sNLS(SEQ ID NO:1001)，与指导RNA HBG1-1(OLI13620)(表6)复合(“His-AsCpf1-nNLS_HBG1-1RNP”和“His-AsCpf1-sNLS-sNLS_HBG1-1RNP”)。RNP以5μM或20μM电穿孔。

图4A-4C描绘了用His-AsCpf1-sNLS-sNLS_HBG1-1 RNP单独或与各种ssODN一起电穿孔的mPB CD34+细胞的HBG的基因编辑。图4A描绘了在用His-AsCpf1-sNLS-sNLS_HBG1-1RNP单独或与OLI164324(“-4nt-链”)、OLI16430(“-4nt+链”)、OLI16410(“-18nt-链”)或OLI16409(“-18nt+链”)一起电穿孔后72小时，对HBG PCR产物进行测序检测到的***缺失的百分比(表7)。图4B描绘了在用His-AsCpf1-sNLS-sNLS_HBG1-1 RNP单独或与OLI16410(“-18nt链”)或OLI16409(“-18nt+链”)一起电穿孔后72小时，对HBG PCR产物进行测序检测到的精确18个核苷酸缺失的***缺失的百分比。图4C描绘了在用His-AsCpf1-sNLS-sNLS_HBG1-1 RNP单独或与OLI16410(“-18nt-链”)或OLI16409(“-18nt+链”)一起电穿孔后72小时，对HBG PCR产物进行测序检测到的在所有***缺失中精确18nt缺失的百分比。

图5A-5F描绘了HBG1-1靶区域和化脓链球菌Cas9 gRNA对组合使用的示意图。图5A显示了HBG1-1 gRNA的靶区域(包含SEQ ID NO:1002所示的RNA靶向结构域，表9)。灰色框表示HBG启动子的远端CCAAT盒(即HBG1/2c.-111至-115)。图5B显示了HBG1-1的靶区域、HBG的远端CCAAT盒和靶区域SpA gRNA(包含SEQ ID NO:941的靶向结构域，表9)。图5C显示了HBG1-1的靶区域、HBG的远端CCAAT盒和靶区域SpG gRNA(包含SEQ ID NO:359的靶向结构域，表9)。图5D显示了HBG1-1的靶区域、HBG的远端CCAAT盒、tSpA失活gRNA(“dgRNA”)的靶区域(包含SEQ ID NO:326的靶向结构域，表9)，以及Sp182dgRNA的靶区域(包含SEQ ID NO:1028的靶向结构域，表9)。图5E显示了HBG1-1的靶区域、HBG的远端CCAAT盒和tSpA dgRNA(包含SEQ ID NO:326的靶向结构域，表9)。图5F显示了HBG1-1的靶区域、HBG的远端CCAAT盒和Sp182 dgRNA的靶区域(包含SEQ ID NO:1028的靶向结构域，表9)。

图6A-6B描绘了通过使用靶向HBG启动子区域的HBG1-1-AsCpf1-RNP离体编辑mPBCD34+细胞实现的HbF表达。图6A显示了在mPB CD34+细胞中经由Amaxa电穿孔递送5μM或20μM HBG1-1-AsCpf1-RNP(“HBG-1-1”)后在HBG启动子区域处进行编辑的结果。通过Amaxa电穿孔递送20μM HBG1-1-AsCpf1-RNP可获得高达约43％的编辑率和21％的HbF诱导(高于背景水平)。HbF水平用黑圈表示，该黑圈描绘了通过mPB CD34+细胞的红系后代的UPLC分析测得的γ珠蛋白链占总β样珠蛋白链(γ链/[γ链+β链])的表达水平。灰色柱表示在电穿孔后72小时，通过HBG PCR产物的下一代测序(NGS)检测到的***缺失的百分比。图6B显示了在mPBCD34+细胞中经由MaxCyte电穿孔递送5μM或20μM HBG1-1-AsCpf1-RNP(“HBG-1-1”)后在HBG启动子区域进行编辑的结果。通过MaxCyte电穿孔递送20μM HBG1-1-AsCpf1-RNP可获得高达约16％的编辑率和7％的HbF诱导(高于背景水平)。HbF水平用黑圈表示，该黑圈描绘了通过mPB CD34+细胞的红系后代的UPLC分析测得的γ珠蛋白链占总β样珠蛋白链(γ链/[γ链+β链])的表达水平。灰色柱表示在电穿孔后72小时，通过HBG PCR产物的NGS检测到的***缺失的百分比。

图7描绘了在Maxcyte设备上通过共递送各种化脓链球菌Cas9 WT或Cas9D10ARNP，在HBG启动子区域处通过HBG1-1-AsCpf1H800A-RNP进行的增强的编辑。“化脓链球菌D10A”代表Cas9 D10A切口酶蛋白，并且“化脓链球菌WT”代表Cas9 WT蛋白。测试的RNP包括SpA-D10A-RNP、SpG-D10A-RNP、tSpA-Cas9-RNP、Sp182-Cas9-RNP、和tSpA-Cas9-RNP+Sp182-Cas9-RNP(表8)。描绘了HBG1-1-AsCpf1H800A-RNP(“HBG1-1”)单独或与化脓链球菌的Cas9RNP或RNP对组合一起递送后，在HBG启动子区域处的总编辑(灰色柱)和相关的HbF蛋白诱导(黑圈)。HbF水平用黑圈表示，该黑圈描绘了通过mPB CD34+细胞的红系后代的UPLC分析测得的γ珠蛋白链占总β样珠蛋白链(γ链/[γ链+β链])的表达水平。灰色柱描绘了由HBGPCR产物的NGS检测到的***缺失的百分比。

图8描绘了HBG1-1-AsCpf1H800A-RNP(“HBG1-1”)单独或与各种化脓链球菌Cas9WT或Cas9D10A RNP组合一起MaxCyte递送后，mPB CD34+细胞的生存力。“化脓链球菌D10A”代表Cas9 D10A切口酶蛋白，并且“化脓链球菌WT”代表Cas9 WT蛋白。测试的RNP包括SpA-D10A-RNP、SpG-D10A-RNP、tSpA-Cas9-RNP、Sp182-Cas9-RNP、和tSpA-Cas9-RNP+Sp182-Cas9-RNP(表8)。在电穿孔后24小时通过DAPI染色和流式细胞术分析来测量生存力。

图9A-9B描绘了靶区域的HBG1-1-AsCpf1H800A-RNP和D10A-Cas9RNP的切割位点，以及HBG1-1-AsCpf1H800A-RNP与D10A RNP共递送所产生的编辑谱。图9A描绘了靶区域(浅灰色箭头)的每条链上的HBG1-1-AsCpf1H800A-RNP剪切位点的位置，以及由SpG-D10A-RNP和SpA-D10A-RNP靶向的切口位点的位置(黑色箭头)(表8)。图9B描绘了通过HBG PCR产物的NGS分析检测到的在电穿孔后72小时，在mPB CD34+中共递送HBG1-1-AsCpf1H800A-RNP(“HBG1-1RNP”)与SpG-D10A-RNP(“spG RNP”)或SpA-D10A-RNP(“spA RNP”)产生的编辑谱(表8)。X轴代表相对于HBG1-1-AsCpf1H800A-RNP正链切割位点的***缺失中心的基因组位置。Y轴表示***缺失的长度，其中缺失表示为负值，并且***表示为正值。每个***缺失的总频率由符号的面积表示。描绘了以等于或大于0.1％的频率出现的***缺失。SpG和SpA靶位点用虚线表示。

图10A-10B描绘了通过电穿孔后72小时的HBG PCR产物的NGS分析检测到，Sp182-Cas9-RNP与HBG1-1-AsCpf1H800A-RNP共递送导致总***缺失以及远端CCAAT盒破坏性***缺失的加强(***缺失谱并未发生实质性改变)。图10A显示了用HBG1-1-AsCpf1H800A-RNP(“HBG1-1 RNP”)单独或与Sp182-Cas9-RNP(sp182 RNP)组合一起进行编辑后的***缺失谱。X轴代表相对于HBG1-1-AsCpf1H800A-RNP正链切割位点的***缺失中心的基因组位置。Y轴表示***缺失的长度，其中缺失表示为负值，并且***表示为正值。每个***缺失的总频率由符号的面积表示。描绘了以等于或大于0.1％的频率出现的***缺失。Sp182靶位点由虚线表示。图10B描绘了破坏远端CCAAT盒序列中的无、1nt、2nt、3nt、4nt或全部5nt的***缺失的频率。

图11描绘了与Sp182-Cas9-RNP共递送的HBG1-1-AsCpf1H800A-RNP的最佳剂量导致总编辑和HbF产生的增加(表8)。将HBG1-1-AsCpf1H800A-RNP(“HBG1-1”)作为与Sp182-Cas9-RNP(“Sp182”)一起的RNP对进行递送，在HBG启动子区域实现了>92％编辑(灰色柱)，高达34％HbF诱导(高于背景)(黑圈)。当Sp182-Cas9-RNP单独以12μM递送时，未观察到编辑。HbF水平用黑圈表示，该黑圈描绘了通过mPB CD34+细胞的红系后代的UPLC分析测得的γ珠蛋白链占总β样珠蛋白链(γ链/[γ链+β链])的表达水平。灰色柱描绘了由HBG PCR产物的NGS检测到的***缺失的百分比。

图12描绘了通过UPLC测量的用HBG1-1-AsCpf1H800A-RNP与Sp182-Cas9-RNP组合(表8)在HBG启动子区域编辑的单一人mPB CD34+细胞的克隆红系后代中γ链表达相比于总β样链(γ链/[γ链+β链])的水平分布。每个黑圈代表在通过在电穿孔后48小时通过FACS分选分离的单一细胞衍生的克隆红系群体中检测到的γ-珠蛋白水平。

图13A-13C描绘了RNP(含有与His-AsCpf1-sNLS-sNLS H800A(SEQ ID NO:1032，表8)复合的经修饰的HBG1-1 gRNA(SEQ ID NO:1041，表8)(“His-AsCpf1-sNLS-sNLS H800A_HBG1-1 RNP”，在图13A-C中表示为“HBG1-1”))与增加浓度的ssODN OLI16431(SEQ ID NO:1040，表7)(在图13A-C中表示为“OLI16431”)(表7)的共递送后的总编辑、HbF产生、生存力和集落形成潜力。图13A描绘了共递送6μM His-AsCpf1-sNLS-sNLS H800A_HBG1-1 RNP及增加浓度的ssODN OLI16431后，在远端CAATT盒处的编辑(灰色柱)和HbF诱导(黑圈)。HbF水平用黑圈表示，该黑圈描绘了通过mPB CD34+细胞的红系后代的UPLC分析测得的γ珠蛋白链占总β样珠蛋白链(γ链/[γ链+β链])的表达水平。灰色柱描绘了由HBG PCR产物的NGS检测到的***缺失的百分比。图13B描绘了His-AsCpf1-sNLS-sNLS H800A_HBG1-1 RNP单独或与增加剂量的ssODN OLI16431组合递送后，mPB CD34+细胞的生存力。通过电穿孔后72小时的DAPI排除来测量生存力。图13C描绘了在集落形成细胞(CFC)测定中“HBG1-1”RNP和ssODNOLI16431处理的和供体匹配的未经处理对照CD34⁺细胞的造血活性。所示的CFC为每800接种的CD34⁺细胞。指示了集落的数量和亚型(GEMM：粒细胞-红系-单核细胞-巨噬细胞集落(黑色)，GM：粒细胞-巨噬细胞集落(深灰色)，E：红系集落(浅灰色))。

图14A-14B描绘了使用不同浓度的RNP(含有与His-AsCpf1-sNLS-sNLS H800A(SEQID NO:1032，表8)复合的未经修饰的HBG1-1gRNA(SEQ ID NO:1022，表8)(“His-AsCpf1-sNLS-sNLS H800A_HBG1-1 RNP”，在图14A-B中表示为“HBG1-1”))与不同浓度的ssODNOLI16431(SEQ ID NO:1040，表7)(在图14A-B中表示为“OLI16431”)(表7)共递送的总编辑、HbF产生、和生存力结果。图14A描绘了在共递送His-AsCpf1-sNLS-sNLS H800A_HBG1-1RNP(“HBG1-1”)和不同浓度的ssODN OLI16431之后，在远端CAATT盒(黑色柱(48小时)和浅灰色柱(红系培养14天)处的编辑和HbF诱导(黑圈)。HbF水平用黑圈表示，该黑圈描绘了通过mPBCD34+细胞的红系后代的UPLC分析测得的γ珠蛋白链占总β样珠蛋白链(γ链/[γ链+β链])的表达水平。柱描绘在48小时(黑色)和14天红系培养(浅灰色)时间点，由HBG PCR产物的NGS检测到的***缺失的百分比。图14B描绘了His-AsCpf1-sNLS-sNLS H800A_HBG1-1 RNP(“HBG1-1”)单独、ssODN OLI16431单独、或与不同剂量的HBG1-1和OLI16431组合递送后，mPB CD34+细胞的生存力。通过电穿孔后48小时和在红系培养中14天后的DAPI排除来测量生存力。在对mPB CD34+细胞进行编辑后，进行了18天的离体分化为红系谱系(Giarratana2011)。在培养的第14天，分离了细胞的子集，并进行生存力(DAPI排除)和编辑(HBG PCR产物的NGS)测量。

图15描绘了RNP在mPB CD34+细胞中的编辑。RNP包括与表15所示的Cpf1蛋白复合的gRNA。电穿孔后72小时，对分离的基因组DNA进行Illumina测序。

图16A-16B描绘了在电穿孔后48小时通过Illumina测序确定的混合CD34+细胞群体(黑色柱)、祖细胞(浅灰色柱)和HSC(深灰色柱)的编辑。图16A描绘了单独递送或与ssODNOLI16431(SEQ ID NO:1040，表7)共同递送的RNP33(表15)。图16B描绘了单独递送或与Sp182 RNP(包含与化脓链球菌Cas9(SEQ ID NO:1033)复合的SEQ ID NO:1027(表8)的失活gRNA)共递送的RNP33(表15)。

图17描绘了在电穿孔后48小时通过Illumina测序确定的混合CD34+细胞群体(黑色柱)、祖细胞(浅灰色柱)和HSC(深灰色柱)的编辑。RNP34、RNP33和RNP43(表15)单独或与Sp182 RNP(包含与化脓链球菌Cas9(SEQ ID NO:1033)复合的SEQ ID NO:1027(表8)的失活gRNA)或ssODN OLI16431(SEQ ID NO:1040，表7)组合递送。

图18描绘了在电穿孔后72小时通过Illumina测序确定的CD34+细胞中的编辑。RNP64、RNP63和RNP45(表15)以2或4的化学计量(gRNA:Cpf1复合比)递送，其中gRNA摩尔过量。

图19描绘了在电穿孔后72小时通过Illumina测序确定的CD34+细胞中的编辑。RNP33、RNP64、RNP63、和RNP45(表15)单独或与Sp182 RNP(包含与化脓链球菌Cas9(SEQ IDNO:1033)复合的SEQ ID NO:1027(表8)的失活gRNA)或ssODN OLI16431(SEQ ID NO:1040，表7)组合递送。

图20描绘了通过Illumina测序确定的CD34+细胞中的编辑。包含与具有不同5’DNA延伸的gRNA复合的Cpf1(SEQ ID:1094)的RNP(表15)单独递送或与8μM OLI16431(SEQ IDNO:1040，表7)组合递送。

图21描绘了通过Illumina测序确定的CD34+细胞中的编辑。将包含具有匹配的5’末端的gRNA的RNP(RNP49相比于RNP58和RNP59相比于RNP60，表15)递送至CD34+细胞，以评估3’修饰的影响。在这两个比较中，带有3’PS-OMe的gRNA在电穿孔后24小时的表现优于未经修饰的3’版本。

图22A-22B描绘了在电穿孔后24和48小时通过Illumina测序确定的CD34+细胞中的编辑。将RNP58(表15)以2:1、1:1或0.5:1摩尔比的化学计量(gRNA:Cpf1复合比)递送至CD34+细胞。在所有测试剂量下，当RNP以2:1的比例复合时，编辑效果最佳。

图23A-23B描绘了通过Illumina测序确定的CD34+细胞中的编辑。图45A和45B描绘了包含具有匹配的5’末端但不同的3’修饰的gRNA的RNP(表15)，其递送至CD34+细胞以评估3’修饰或延伸的影响。

图24A-24C描绘了在递送靶向HBG基因座内的各种剪切位点的RNP之后，CD34+细胞及其红系后代中的编辑以及红系后代中的HbF水平。图24A描绘了包含指导RNA的RNP，这些指导RNA含有未经修饰的5’和在3’末端的1x PS-Ome(表15)。图24B描绘了包含指导RNA的RNP，这些指导RNA含有在5’的2PS+20DNA延伸和在3’末端的1x PS-Ome(表15)。图24C描绘了包含指导RNA的RNP，这些指导RNA含有在5’的25DNA延伸和在3’末端的1x PS-Ome(表15)。

图25描绘了在以1μM、2μM和4μM递送RNP58之后，CD34+细胞的红系后代中的编辑和HbF水平。

图26描绘了在RNP的Maxcyte电穿孔后CD34+细胞中的编辑。将包含与不同的Cpf1蛋白(SEQ IDs:1094、1096、1107、1108)复合的gRNASEQ ID:1051的RNP58、RNP26、RNP27和RNP28(表15)递送至CD34+细胞。在电穿孔后24和48小时通过Illumina测序确定编辑。

图27描绘了在RNP的Maxcyte电穿孔后CD34+细胞中的编辑。将包含与具有各种5’延伸的指导RNA复合的Cpf1蛋白SEQ ID：1094的RNP58、RNP29、RNP30和RNP31(表15)递送到CD34+细胞中。在电穿孔后24和48小时通过Illumina测序确定编辑。由于细胞数限制，未在1μM下测试RNP30(nt)。

图28描绘了在电穿孔后48小时通过Illumina测序确定的混合CD34+细胞群体(黑色柱)、祖细胞(深灰色柱)和HSC(浅灰色柱)的编辑。将RNP58、RNP27和RNP26(表15)以2μM或4μM递送至CD34+细胞。

图29描绘了在电穿孔后48小时通过Illumina测序确定的混合CD34+细胞群体(黑色柱)、祖细胞(深灰色柱)和HSC(浅灰色柱)的编辑。将RNP61、RNP62和RNP34(表15)(8μM)与ssODN OLI16431(SEQ ID NO:1040，表7)(8μM)共递送至CD34+细胞。

图30描绘了在电穿孔后48小时通过Illumina测序确定的混合CD34+细胞群体(黑色柱)、祖细胞(深灰色柱)和HSC(浅灰色柱)的编辑。将RNP58和RNP32(表15)以2μM递送至CD34+细胞。

图31描绘了在电穿孔后48小时通过Illumina测序确定的混合CD34+细胞群体(黑色柱)、祖细胞(深灰色柱)和HSC(浅灰色柱)的编辑。将RNP58和RNP1(表15)以2μM、4μM或8μM递送至CD34+细胞。未对使用2μM RNP1编辑的细胞进行分选(N.S)，并且因此无法使用编辑数据。

图32描绘了经电穿孔的细胞输注后8周，来自“NBSGW”小鼠BM的植入的mPB CD34+细胞的***缺失。将RNP34和RNP33(表15)(8μM)与ssODN OLI16431(SEQ ID NO:1040，表7)(6μM)共递送至CD34+细胞。

图33A-33B描绘了经电穿孔的细胞输注后8周，植入的mPB CD34+细胞的***缺失和衍生自“NBSGW”小鼠的嵌合BM的红系细胞的HbF表达。RNP33或RNP34(表15)与Sp182 RNP(包含与化脓链球菌Cas9(SEQ ID NO:1033)复合的SEQ ID NO:1027(表8)的失活gRNA)(16μM总RNP)共递送至CD34+细胞。图33A描绘了在模拟转染(未添加RNP)或RNP转染的细胞中未分级的骨髓或按流分选的CD15+、CD19+、GlyA+和Lin-CD34+细胞的单个群体中的***缺失频率。Lin-CD34+细胞定义为以下CD34+细胞，其对CD3、CD14、CD15、CD16、CD19、CD20和CD56是阴性的，来自未经辐照的用模拟(无RNP)或RNP转染的mPB CD34+细胞输注的NOD,B6.SCIDIl2rγ-/-Kit(W41/W41)(“NBSGW”)小鼠的骨髓(BM)。通过Illumina测序确定每个细胞群体的***缺失。图33B描绘了来自总嵌合BM的18天红系分化培养后，红系细胞裂解物的HbF表达，通过UPLC计算为γ/β样(％)。

图34A-34B描绘了经电穿孔的细胞输注后8周，植入的mPB CD34+细胞的***缺失和来自“NBSGW”小鼠的嵌合BM的红系细胞的HbF表达。将RNP61或RNP62(表15)(8μM)与ssODNOLI16431(SEQ ID NO:1040，表7)(8μM)共递送至CD34+细胞。图34A描绘了在模拟转染(未添加RNP)或RNP转染的细胞中未分级的骨髓或按流分选的CD15+、CD19+、GlyA+和Lin-CD34+细胞的单个群体的***缺失。Lin-CD34+细胞定义为以下CD34+细胞，其对CD3、CD14、CD15、CD16、CD19、CD20和CD56是阴性的，来自未经辐照的用模拟(无RNP)或RNP转染的mPB CD34+细胞输注的NBSGW小鼠的骨髓(BM)。通过Illumina测序确定每个细胞群体的***缺失。图34B描绘了来自总嵌合BM的18天红系分化培养后，红系细胞的HbF表达，通过UPLC计算为γ/β样(％)。

图35描绘了在模拟(不添加RNP)mPB CD34+细胞或用RNP1(4或8μM)或RNP58(2、4或8μM)(表15)编辑的mPB CD34+细胞输注后8周骨髓内的人嵌合性。通过流式细胞术确定了BM中的人嵌合性和谱系重构(CD45+、CD14+、CD19+、血型糖蛋白A(GlyA、CD235a+)、谱系和CD34+以及小鼠CD45+标记表达)。

图36描绘了在模拟(不添加RNP)mPB CD34+细胞或用RNP1(4或8μM)或RNP58(2、4或8μM)(表15)编辑的mPB CD34+细胞输注后8周未分选的混合骨髓内的***缺失。通过Illumina测序确定***缺失。

图37描绘了在模拟转染(未添加RNP)或RNP转染的细胞中未分级的骨髓或按流分选的CD15+、CD19+、GlyA+和Lin-CD34+细胞的单个群体中的***缺失频率。Lin-CD34+细胞定义为以下CD34+细胞，其对CD3、CD14、CD15、CD16、CD19、CD20和CD56是阴性的，来自未经辐照的用模拟(无RNP)或RNP转染的mPB CD34+细胞输注的NOD,B6.SCID Il2rγ-/-Kit(W41/W41)(“NBSGW”)小鼠的骨髓(BM)。通过Illumina测序确定每个细胞群体的***缺失。

图38描绘了模拟(不添加RNP)mPB CD34+细胞或经RNP58(2、4或8μM)(表15)编辑的mPB CD34+细胞输注后8周从骨髓分离的GlyA+级分中的HbF。

图39描绘了在模拟的或经编辑的人动员的CD34+细胞输注后8周来自获取的骨髓冲洗物的细胞的集落形成潜力。指示了集落的数量和亚型(GEMM：粒细胞-红系-单核细胞-巨噬细胞集落(黑色)，GM：粒细胞-巨噬细胞集落(深灰色)，E：红系集落(浅灰色))。

图40描述了表14所示的Cpf1蛋白变体的序列。核定位序列显示为粗体字母，六组氨酸序列显示为带下划线的字母。NLS序列的同一性和N末端/C末端位置的另外的排列(例如附加两个或更多个nNLS序列或nNLS和sNLS序列(或其他NLS序列)的组合至N末端/C末端位置，以及有和没有纯化序列(例如六组氨酸序列))的序列在本披露的主题范围内。

图41A-41E描绘了HBG远端CCAAT盒区域中的编辑。图41A显示了HBG远端CCAAT盒区域处的Cpf1(RNP34，表15)和SpCas9(Sp35 RNP)切割位点的示意图。Sp35 RNP包含Sp35gRNA(包含SEQ ID NO:339的靶向结构域(即，CUUGUCAAGGCUAUUGGUCA(RNA))；与化脓链球菌野生型(Wt)Cas9蛋白复合的SEQ ID NO:917(即，CTTGTCAAGGCTATTGGTCA(DNA))。带有箭头的深灰色锯齿状线标记了用RNP34切割后的预期的4个核苷酸5’突出端。灰色虚线标记了RNP34的预期的剪切位点。这是含有gRNA(包含gRNA靶向结构域序列UAAUUUCUACUCUUGUAGAUCCUUGUCAAGGCUAUUGGUC(SEQ ID NO:1022))的任何RNP的预期的剪切位点。Sp35 RNP预期的剪切位点由带有箭头的灰色直线表示。图41B描绘了衍生自CD34+细胞群体、祖细胞以及HSC中NHEJ和MMEJ修复的***缺失百分比。MMEJ***缺失用黑色条纹柱表示，并且NHEJ***缺失用白色柱表示。图41C和图41D描绘了衍生自用Sp35 RNP或RNP34+Sp182RNP电穿孔的mPB CD34+细胞的红系细胞中的G-γ链表达水平(G-γ链/[总β样链]的百分比)；在这些红系细胞编码G-γ的HBG等位基因上携带长度为≤3bp或>3bp的***缺失。仅分析具有单等位基因4.9kb缺失(导致染色体中的一条没有g-γ表达)的克隆，以确保单个HBG等位基因驱动g-γ表达。因此，所示的表达水平代表了在另一条染色体上的g-γ基因缺失的细胞中，单个HBG基因的g-γ表达水平，这取决于启动子处携带的***缺失。图41C显示了按照长度为≤3bp或>3bp的***缺失分组的结果。图41D描绘了衍生自用Sp35 RNP或RNP34+Sp182 RNP电穿孔(产生长度为≤3bp或>3bp的***缺失)的mPB CD34+细胞的红系细胞中的γ链表达水平(γ链/[总β样链]的百分比)。缺失的位置在X轴上表示。X表示由Cas9(Sp35 RNP)产生的***缺失，并且圆圈表示由Cpf1(RNP34)产生的编辑。图41E描绘了通过UPLC测量的用spCas9 RNP“sp35”或Cpf1 RNP34(HBG1-1-AsCpf1H800A-RNP)与“加强元件”Sp182-Cas9-RNP组合(表8)在HBG启动子区域编辑的单一人mPB CD34+细胞的克隆红系后代中γ链表达相比于总β样链(γ链/[γ链+β链])的水平分布。每个黑圈代表在通过在电穿孔后48小时通过FACS分选分离的单一细胞衍生的克隆红系群体中检测到的γ-珠蛋白水平。误差条显示出中值和四分位距。

图42A-42J描绘了经由Cpf1或SpCas9酶切割的编辑。图42A描绘了由RNP58(Cpf1)(表15)或Sp35 RNP(SpCas9)编辑产生的、在远端CCAAT盒处的NHEJ介导的***缺失的百分比。x轴表示***缺失的大小。图42B描绘了由Cpf1或SpCas9 RNP的编辑产生的、在远端CCAAT盒处>3bp的NHEJ介导的***缺失、>3bp的MMEJ介导的***缺失、以及≤3bp的***缺失的百分比。对于图42B中的Sp35 RNP Cas9***缺失(左侧饼图)：NHEJ>3bp＝21.42％；≤3bp＝48.84％；MMEJ>3bp＝29.74％。对于图42B中的RNP58 Cpf1***缺失(右侧饼图)：NHEJ>3bp＝64.86％；≤3bp＝11.11％；MMEJ>3bp＝24.02％。图42C显示了野生型(wt)等位基因和前18个***缺失，以及其在所有样品的***缺失中的平均百分比，以及编辑后其相应的最终序列。虚线表示缺失的碱基，并且垂直线为剪切位点(还参见图55A)。wt等位基因上的长深灰色线标记了RNP58的gRNA的gRNA靶向结构域的DNA序列(即，CCUUGUCAAGGCUAUUGGUCA(SEQ ID NO:1254))，并且较短的黑色线标记了远端CCAAT盒(此处显示为反向互补)。相对于TSS的碱基距离用箭头标记。灰色框表示同源性区域，该同源性区域表示MMEJ修复。图42D显示了野生型(wt)等位基因和前18个***缺失，以及其在所有样品的***缺失中的平均百分比，以及编辑后其相应的最终序列。虚线表示缺失的碱基，并且垂直线为剪切位点(还参见图55A)。wt等位基因上的长深灰色线标记了Sp35 RNP的gRNA的gRNA靶向结构域的DNA序列(即，CUUGUCAAGGCUAUUGGUCA SEQ ID NO:339)，并且较短的黑色线标记了远端CCAAT盒(此处显示为反向互补)。相对于TSS的碱基距离用箭头标记。灰色框表示同源性区域，该同源性区域表示MMEJ修复。图42E显示了在用RNP58或Sp35 RNP编辑的样品中沿靶区域缺失的碱基百分比。黑色线表示RNP58编辑，并且虚线表示Sp35 RNP编辑。靶区域DNA序列显示在x轴上。灰色线标记了Sp35 RNP的gRNA的gRNA靶向结构域的DNA序列(即，CUUGUCAAGGCUAUUGGUCA SEQ ID NO:339)，并且较短的黑色线标记了远端CCAAT盒(此处显示为反向互补)。图42F显示了在用RNP58或Sp35 RNP编辑的样品中，靶区域上的每个碱基处检测到的缺失的归一化曲线(每个最大值为1)。黑色线表示RNP58编辑，并且虚线表示Sp35RNP编辑。靶区域DNA序列显示在x轴上。灰色线标记了Sp35 RNP的gRNA的gRNA靶向结构域的DNA序列(即，CUUGUCAAGGCUAUUGGUCA SEQ ID NO:339)，并且较短的黑色线标记了远端CCAAT盒(此处显示为反向互补)。图42G显示了检测到的***缺失的百分比，其作为缺失大小(x轴上的负值)或***大小(x轴上的正值)的函数。黑色线表示RNP58编辑，并且虚线表示Sp35 RNP编辑。图42H显示了在靶区域中的每个位置处检测到的***缺失的百分比。Sp35RNP由虚线表示。RNP58由实线表示。靶区域DNA序列显示在x轴上。灰色线标记了Sp35 RNP的gRNA的gRNA靶向结构域的DNA序列(即，CUUGUCAAGGCUAUUGGUCA SEQ ID NO:339)，并且短的黑色线标记了远端CCAAT盒(此处显示为反向互补)。图42I显示了Sp35 RNP或RNP58编辑的细胞中检测到的≥0.1％的共有***缺失的频率相关性。图42J显示了这些样品的至少一个中检测到的所有***缺失的频率相关性。Sp35 RNP编辑的细胞中未检测到的***缺失在1E-5处垂直线的左侧显示。RNP58编辑的细胞中未检测到的***缺失在1E-5处的水平线顶部显示。三角形表示≤3bp的缺失，并且圆圈表示>3bp的缺失。

图43A-43O描绘导致长期植入、***缺失维持和体内高HbF诱导的RNP32编辑。图43A描绘电穿孔后24小时，由RNP32编辑产生的、在远端CCAAT盒处>3bp的NHEJ介导的***缺失、>3bp MMEJ的介导的***缺失、以及≤3bp的***缺失的百分比：NHEJ>3bp＝66.10％；≤3bp＝12.60％；MMEJ>3bp＝27.10％。图43B描绘电穿孔后48小时，由RNP32编辑产生的、在远端CCAAT盒处>3bp的NHEJ介导的***缺失、>3bp MMEJ介导的***缺失、以及<3bp的***缺失的百分比：NHEJ>3bp＝65.30％；≤3bp＝12.70％；MMEJ>3bp＝27.80％。图43C描绘电穿孔后72小时，由RNP32编辑产生的、在远端CCAAT盒处>3bp的NHEJ介导的***缺失、>3bp MMEJ的介导的***缺失、以及<3bp的***缺失的百分比：NHEJ>3bp＝64.70％；≤3bp＝11.90％；MMEJ>3bp＝29.20％。图43D描绘了电穿孔和预输注后24、48和72小时，由RNP32编辑产生的、经由NHEJ修复介导的在远端CCAAT盒处的***缺失百分比。图43E描绘了电穿孔和预输注后24小时，由RNP32编辑产生的、经由NHEJ修复介导的在远端CCAAT盒处的***缺失百分比。图43F描绘了电穿孔和预输注后48小时，由RNP32编辑产生的、经由NHEJ修复介导的在远端CCAAT盒处的***缺失百分比。图43G描绘了电穿孔和预输注后72小时，由RNP32编辑产生的、经由NHEJ修复介导的在远端CCAAT盒处的***缺失百分比。图43H描绘了电穿孔和预输注后24、48和72小时，由RNP32编辑产生的、在远端CCAAT盒处的所有***缺失百分比。图43I描绘了电穿孔和预输注后24小时，由RNP32编辑的、在远端CCAAT盒处的所有***缺失百分比。图43J描绘了电穿孔和预输注后48小时，由RNP32编辑产生的、在远端CCAAT盒处的所有***缺失百分比。图43K描绘了电穿孔和预输注后72小时，由RNP32编辑产生的、在远端CCAAT盒处的所有***缺失百分比。图43L描绘了输注RNP32编辑的mPB CD34+细胞和16周植入(“BM”)后，来自NBSGW小鼠的预输注的RNP32编辑的mPB CD34+细胞(“预输注”)和长期繁殖的CD34+细胞中的***缺失的百分比。图43M描绘了在模拟(不添加RNP)mPB CD34+细胞或用RNP32(表15)编辑的mPB CD34+细胞输注后16周骨髓内的人嵌合性。通过流式细胞术确定了BM中的人嵌合性和谱系重构(CD19+、CD15+、CD235A+、谱系和CD34+以及小鼠CD45+标记表达)。图43N描绘了衍生自RNP32编辑的CD34+细胞的模拟(不添加RNP)和CD235a+(GlyA+)红系细胞中，F阳性细胞的百分比。图43O描绘了HbF的百分比，该HbF的百分比通过CD235a+(GlyA+)红系细胞的UPLC分析测得的γ珠蛋白链占总β样珠蛋白链(γ链/[γ链+β链])的表达水平显示。

图44A-44B描绘了输注RNP32编辑的CD34+细胞的NBSGW小鼠中的高多克隆性。图44A显示了输注RNP32编辑的CD34+细胞的小鼠(小鼠A、小鼠B、小鼠C、小鼠D)血液中，20周时间段(输注后8、12、16以及20周)内的高多克隆性。“0”表示预输注的RNP32编辑的mPB CD34+细胞的数据。图44B显示了输注RNP32编辑的CD34+细胞的NBSGW小鼠的骨髓(BM)中，在植入后20周的高多克隆性。图44A和44B中，图形描绘内的每个灰色阴影表示不同的***缺失特征，频率最高的***缺失类型位于x轴附近，并且频率最低的***缺失类型位于图的顶部附近。

图45显示了β珠蛋白基因座的示意图。“CD34+细胞^a”意指CD34+造血干细胞和祖细胞，“HS”意指超敏位点，“LCR”意指基因座控制区，“TSS”意指转录起始位点。

图46A显示了正常和SCD CD34+细胞在用从两个独立实验收集的6μM RNP32电穿孔后第1至3天的生存力。显示了每个治疗组的单独的数据点和平均值。正常供体N＝4；镰状化供体N＝5(CEL238-001[正常CD34+细胞]和CEL211-001[SCD CD34+细胞]各测试两次)。图46B显示了用RNP32电穿孔后的CD34+细胞生存力。^a表示仅适用于RNP32电穿孔细胞。^b表示可用的细胞数量不足，并且因此未评估生存力。

图47A显示了正常和SCD CD34+细胞在用从两个独立实验收集的6μM RNP32电穿孔后第1至3天的***缺失水平。显示了每个治疗组的单独的数据点和平均值。正常供体N＝4；镰状化供体N＝5。CEL238-001[正常CD34+细胞]和CEL211-001[SCD CD34+细胞]各测试两次。***缺失＝***和/或缺失。图47B显示了来自正常供体和SCD患者的RNP32编辑的CD34+细胞的相当的且有效的编辑。在来自正常供体(n＝3)的未编辑和RNP32编辑的CD34+细胞和来自SCD(n＝4)的患者的未编辑和RNP32编辑的CD34+细胞中评估***缺失的百分比。未编辑的细胞未进行电穿孔。图47C显示了用RNP32电穿孔后的CD34+细胞的***缺失水平。ND＝未测定(样品不足以运行测序分析)。

图48A-48D描绘了用于数字液滴聚合酶链反应(ddPCR)的PCR引物和混合物。图48A描绘了相对于RNP32剪切位点的ddPCR引物和探针位置的示意图。图48B显示了用于4.9kb片段缺失评估的引物和探针序列。图48C显示了用于ddPCR测定6和9的主混合物1和2组成。图48D显示了主混合物3的组成。

图49A显示了在用6μM的RNP32电穿孔后第1天，正常和SCD CD34+细胞的4.9kb片段缺失的频率。数据来自1项研究(SCD014)。每个点代表1个样品。未处理的细胞未进行电穿孔。图49B显示了在用RNP32电穿孔后的CD34+细胞中，4.9kb缺失的频率。NA＝数据不可用，因为数字液滴聚合酶链反应测定失败。未处理的细胞未进行电穿孔。

图50A显示了CD34+细胞红系后代的倍数扩增。将未经处理或用6μM RNP32电穿孔的正常和SCD CD34+细胞置于红系诱导条件下持续18天。数据从2个独立的实验中收集。每个点代表1个样品。图50B显示了CD34+细胞红系后代的去核频率。将未经处理或用6μMRNP32电穿孔的正常和SCD CD34+细胞置于红系诱导条件下持续18天。数据从2个独立的实验中收集。每个点代表1个样品。

图51A显示了两个实验中的红系后代中HbF诱导的评估。将未经处理或用6μMRNP32电穿孔的正常和SCD CD34+细胞置于红系诱导条件下持续18天。通过RP-UPLC分析红系裂解物中珠蛋白链相对丰度，并且将HbF水平计算为HbF(％)＝(Aγ+Gγ)/(Aγ+Gγ+β)(％)。图51B显示了在一个独立实验中通过流式细胞术评估的HbF+RBC的频率。对于图51A和图51B，每个点表示1个样品。进行配对T检验，以确定RNP32处理的样品与未经处理的样品之间的差异是否具有统计学显著性。*p<0.05、**p<0.01、****p<0.0001。RP-UPLC＝反相超高效液相色谱。未处理的细胞未进行电穿孔。图51C显示了来自正常供体和SCD患者的RNP32编辑的CD34+细胞中，相当的且稳健的离体HbF表达。通过在来自正常供体(n＝3)的未编辑和RNP32编辑的CD34+细胞和来自SCD(n＝4)的患者的未编辑和RNP32编辑的CD34+细胞中，γ珠蛋白链占总β样珠蛋白链(γ链/[γ链+β链])的表达水平显示出HbF的百分比。未编辑的细胞未进行电穿孔。

图52显示了当暴露于焦亚硫酸钠并在显微镜下检查时，相比于SCD患者的未编辑的红细胞(RBC)，SCD患者的RNP32编辑的CD34+衍生的RBC具有减少的镰状化。显示了未编辑的SCD衍生的RBC和RNP32编辑的SCD衍生的RBC的镰状RBC的百分比。还显示了未编辑的SCD衍生的RBC和RNP32编辑的SCD衍生的RBC的平均HbF百分比。

图53A显示了测量到的变形能力丧失(SCD RBC的镰状化点)的图形表示，这是随着时间的推移氧耗竭的结果，接着是随后于再氧合期间获得RBC的变形能力，如在氧扫描所见。EImax表示常氧时的RBC变形能力，并且EImin表示脱氧时的变形能力。镰状化点(PoS)反映了开始镰状化的pO2，并且在脱氧期间观察到EI下降>5％。EI＝伸长指数。图53B-53E显示了RBC变形能力的评估。在Lorrca血细胞计数器上分析了来自三个批次的未处理的正常CD34+细胞(图53B)和四个批次的未处理的或RNP32编辑的SCD CD34+细胞(图53C)的经培养的RBC，以测量在O2水平降低时剪切应力下的变形能力，以伸长指数表示。图53C中，用黑线表示从未用RNP32进行电穿孔(未处理)的CD34+细胞培养的RBC(在所有图中，底线直到至少25mmHg)，用深灰色线表示从RNP32编辑的SCD CD34+细胞培养的RBC(在所有图中，顶线直到至少25mmHg)。绘制了每个SCD RBC样品的镰状化点图(图53D)，该点表示脱氧期间SCD RBC开始镰状化时的相对氧气压力。(图53E)中显示了每个SCD RBC样品的最小伸长指数接近于当RBC脱氧时的柔性。每条线连接在同一实验中从同一供体的未处理和RNP32编辑的细胞培养的RBC。在两个独立实验中对CEL211-001进行两次测试。进行配对T检验，以确定从RNP32处理的样品与未经处理的样品培养的RBC之间的差异是否具有统计学显著性。**p<0.01、***p<0.001。

图54A显示了培养的RBC的流变性评估。将未处理的CD34+细胞和未处理的或RNP32电穿孔的SCD CD34+细胞置于红系诱导条件下持续18天，以产生红系细胞。使用微流体平台评估培养的RBC在不同氧浓度下的流变行为。速度下降百分比是基于指定氧浓度下的速度与大气氧气水平(21％)下的速度之间的差异计算得出。显示的数据为平均值±标准偏差。N＝5：未处理的SCD样品，N＝5：RNP32处理的SCD样品，N＝4：未处理的正常样品。使用配对T检验，以比较从未处理的和相应的RNP32编辑的SCD样品培养的RBC之间的平均值。*p<0.05、***p<0.001、****p<0.0001。图54B显示了通过改变氧浓度的速度下降百分比的汇总。^b表示评估期间样品堵塞，并且实验中止。仅报告堵塞形成前收集的数据。图54A中未绘制数据。图54C显示了，在一定的氧水平范围内，当置于模拟毛细血管中血流的微流体通道中时，与从SCD患者的未编辑的CD34+细胞培养的RBC相比，从SCD患者的RNP32编辑的CD34+细胞培养的RBC具有改善的流变性质，更接近于正常供体的RBC。评估了在不同氧百分比下，从未编辑的正常供体衍生的CD34+细胞培养的RBC(菱形)、从未编辑的SCD供体衍生的CD34+细胞培养的RBC(三角形)以及从RNP32编辑的SCD衍生的CD34+细胞培养的RBC(圆圈)的归一化速度百分比。在静脉循环中观察到的典型氧水平为约4％至6％的氧。图54D显示了HbF诱导与流变行为间的相关性。在0％、2％、4％和6％氧浓度下，将SCD样品(x轴)表示的HbF水平相对于相应速度下降百分比(y轴)作图。进行了简单的线性回归分析，并且各分图中显示出测定系数。图54E显示了，当将从未编辑的SCD衍生的CD34+细胞培养的RBC(三角形)和从RNP32编辑的SCD衍生的CD34+细胞培养的RBC(圆圈)以4％氧水平下置于模拟毛细血管中血流的微流体通道中时，HbF水平与速度相关。HbF的百分比通过γ珠蛋白链占总β样珠蛋白链(γ链/[γ链+β链])的表达水平来显示。

图55A显示了远端CCAAT盒区域的示意图，其中基于0的hg38坐标为HBG1的chr11:5,249,949-5,249,987(+)和HBG2的chr11:5,254,873-5,254,911(+)。黑色线标记了RNP32的gRNA的gRNA靶向结构域DNA序列(即，CCUUGUCAAGGCUAUUGGUCA(SEQ ID NO:1254))。黑色框标记了远端CCAAT盒。带有箭头的深灰色锯齿状线标记了用RNP32切割后的预期的4个核苷酸5’突出端。灰色虚线标记了RNP32的预期的剪切位点。剪切位点前的碱基在相对于TSS的-118个碱基位置处用黑色箭头标记。序列末端(TSS：-93和-130)处的黑色箭头标记了边界处碱基与TSS的距离。图55B显示了用于对通过RNP32产生的***缺失谱进行测序的寡核苷酸。图55C显示了用于对RNP32编辑进行分析的扩增子。图55D显示了用于表征RNP32的***缺失谱的***缺失_id的实例。***缺失_id是标识***缺失的字符串，显示为***缺失_起始_位置+_+***缺失_长度+_+ID。其中对于缺失，ID是NA，并且对于***，ID是***的序列。

图56描绘了由RNP32编辑的产生的、在远端CCAAT盒处>3bp的NHEJ介导的***缺失、>3bp的MMEJ介导的***缺失、以及≤3bp的***缺失的百分比：NHEJ>3bp＝65.9％；≤3bp＝8.6％；MMEJ>3bp＝25.5％。

图57显示了野生型(wt)等位基因和前20个***缺失，以及其在所有样品的***缺失中的平均百分比，以及编辑后的其相应的最终序列。虚线表示缺失的碱基，并且垂直线为剪切位点(还参见图55A)。黑色线标记了RNP32的gRNA的gRNA靶向结构域的DNA序列(即，CCUUGUCAAGGCUAUUGGUCA(SEQ ID NO:1254))，并且较短的黑色线标记了远端CCAAT盒(此处显示为反向互补)。相对于TSS的碱基距离用箭头标记。

图58显示了检测到的缺失的百分比作为缺失中心和剪切位点(由作为5’突出端中间的垂直灰色虚线表示)之间距离的函数。最高峰在相对于剪切位点(TSS:-113)的-6bp位置处，并且朝向TSS(另见图55A)。正常供体样品(正常，N＝4)的谱显示为黑色，镰状细胞供体样品(SCD，N＝5)的谱显示为浅灰色，另一组正常供体样品(正常＝5，SCD1)的谱显示为深灰色。第二组正常样品来自研究SCD1，并且使用G-CSF和普乐沙福进行动员，并且使用大规模过程产生。黑色线标记了RNP32的gRNA的gRNA靶向结构域DNA序列(即，CCUUGUCAAGGCUAUUGGUCA(SEQ ID NO:1254))，并且短的黑色线标记了远端CCAAT盒(此处显示为反向互补)。

图59显示了检测到的***缺失的百分比作为缺失大小(x轴上的负值)或***大小(x轴上的正值)的函数。垂直线将***和缺失分隔开。最高峰是对应于***缺失159_-18_NA的大小为18的缺失。正常供体样品(正常，N＝4)的谱显示为黑色，镰状细胞供体样品(SCD，N＝5)的谱显示为浅灰色，另一组正常供体样品(正常＝5，SCD1)的谱显示为深灰色。第二组正常样品来自研究SCD1，并且使用G-CSF和普乐沙福进行动员，并且使用大规模过程产生。

图60显示了50和-50长度之间的***缺失平均百分比。正值表示***。负值表示缺失。

图61显示了用RNP32编辑的样品中沿靶区域缺失的碱基百分比。正常供体样品(正常，N＝4)的谱显示为黑色，镰状细胞供体样品(SCD，N＝5)的谱显示为浅灰色，另一组正常供体样品(正常＝5，SCD1)的谱显示为深灰色。第二组正常样品来自研究SCD1，并且使用G-CSF和普乐沙福进行动员，并且使用大规模过程产生。靶区域DNA序列显示在x轴上。黑色线标记了RNP32的gRNA的gRNA靶向结构域DNA序列(即，CCUUGUCAAGGCUAUUGGUCA(SEQ ID NO:1254))，并且短的黑色线标记了远端CCAAT盒(此处显示为反向互补)。垂直灰色虚线表示剪切位点，取5’突出部分的中间(还参见图55A)。

图62显示了在用RNP32编辑的样品中，靶区域上的每个碱基处检测到的缺失的归一化谱(每个最大值为1)。正常供体样品(正常，N＝4)谱显示为黑色，镰状细胞供体样品(SC)谱显示为浅灰色。第二组正常样品来自研究SCD1，并且使用G-CSF和普乐沙福进行动员，并且使用大规模流程产生。靶区域序列显示在x轴中。黑色线标记了RNP32的gRNA的gRNA靶向结构域DNA序列(即，CCUUGUCAAGGCUAUUGGUCA(SEQ ID NO:1254))，并且短的黑色线标记了远端CCAAT盒(此处显示为反向互补)。垂直灰色虚线表示剪切位点，取5’突出部分的中间(还参见图55A)。

图63显示了跨多个样品中检测到的***缺失的数量。显示了***缺失数量的计数作为检测***缺失的样品数量的函数。

图64显示了跨所有14个样品的***缺失再现性作为其***缺失平均百分比的函数。显示了按照检测到***缺失的样品的数量(x轴)分组，***缺失的平均百分比(y轴)。在0.22％处的灰色水平线标记了前55个***缺失的最低***缺失百分比。

图65A和65B显示了基于电穿孔时的RNP32的浓度，CD34+细胞的中靶***缺失水平。用指定浓度的RNP32电穿孔CD34+细胞后的第1天(图65A)和第2天(图65B)，经由Illumina测序测定总中靶编辑***缺失水平。数据从八个独立的实验中收集。跨范围为0.125μM至8μM的十一种RNP32浓度，总计测试了五个RNP批次和四个正常供体批次的CD34+细胞。每个点表示单独的电穿孔。***缺失＝***和/或缺失。

图66显示了在用RNP32电穿孔的第1天，细胞生存力的汇总。用*标记的数据表示，基于差示扫描荧光法发现RNP32的复合不良，因此排除了数据。

图67显示了在用RNP32电穿孔后的第1天，中靶***缺失水平的汇总。用*标记的数据表示，基于差示扫描荧光法发现RNP32的复合不良，因此排除了数据。

图68显示了电穿孔后第2天，中靶***缺失的汇总。用*标记的数据表示，基于差示扫描荧光法发现RNP32的复合不良，因此排除了数据。

图69A和69B显示了在电穿孔后的第1天和第2天，经编辑的CD34+细胞中4.9kb片段缺失的频率。在用指定浓度RNP电穿孔后第1天和第2天，通过ddPCR测定评估CD34+细胞中两个RNP32剪切位点之间的4.9kb片段缺失频率(图69A)。通过用每个样品的缺失水平除以***缺失水平来计算4.9kb缺失与***缺失的比率(图69B)。数据从三个独立的实验中收集。跨范围为0.125μM至8μM的八种RNP32浓度，总计测试了两个RNP批次和两个正常供体批次的CD34+细胞。每个点表示单独的电穿孔。***缺失＝***和/或缺失。

图70显示了在用RNP32电穿孔后第1天和第2天，4.9kb片段缺失频率的汇总。

图71A和71B显示了造血干细胞和祖细胞亚群的中靶***缺失水平。电穿孔后2天，基于表面免疫表型将CD34+细胞分类为CMP、MPP和LT-HSC亚群。图71A显示了经由Illumina测序测定的中靶***缺失水平。图71B描绘了表型LT-HSC群体内的中靶***缺失水平与总CD34+细胞的比率。比率为1(虚线)说明，LT-HSC具有与总CD34+细胞相同的中靶***缺失水平。CMP＝普通髓样祖细胞；***缺失＝***和/或缺失；LT-HSC＝长期造血干细胞；MPP＝多能祖细胞。

图72显示了电穿孔后第2天，总CD34+细胞和分选的亚群中中靶***缺失水平的汇总。CMP＝普通髓样祖细胞；***缺失＝***和/或缺失；LT-HSC＝长期造血干细胞；MPP＝多能祖细胞。

图73A和73B显示了总CD34+细胞和分选的造血干细胞和祖细胞亚群中的4.9kb片段缺失的频率。电穿孔后2天，基于表面免疫表型将CD34+细胞分类为CMP、MPP和LT HSC亚群。图73A显示了经由ddPCR确定的4.9kb缺失的频率。通过用每个样品的缺失水平除以***缺失水平来计算4.9kb缺失与***缺失的比率(图73B)。较低的比率描绘了群体中发生4.9kb缺失的倾向较低。使用弗里德曼检验(Friedman)进行多重比较。*p＝0.01、****p<0.0001。CMP＝普通髓样祖细胞；***缺失＝***和/或缺失；LT HSC＝长期造血干细胞；MPP＝多能祖细胞。

图74显示了在用RNP32电穿孔后第2天，总CD34+细胞和分选的亚群中4.9kb片段缺失频率的汇总。CD34+＝分化簇34；CMP＝普通髓样祖细胞；***缺失＝***和/或缺失；LT-HSC＝长期造血干细胞；MPP＝多能祖细胞；RNP＝核糖核蛋白。

具体实施方式

定义和缩写

除非另外指定，否则以下术语中的每一个具有此章节中与其相关的含义。

不定冠词“一个”(“a”和“an”)是指至少一个相关名词，并且可与术语“至少一个”和“一个或多个”互换使用。例如，“一个模块”意指至少一个模块，或一个或多个模块。

连词“或”和“和/或”可作为非排他析取词互换使用。

“结构域”用于描述蛋白质或核酸的区段。除非另外指明，否则不需要结构域具有任何特定功能特性。

术语“外源反式作用因子”是指基因组编辑***中的任何肽或核苷酸组分，两者(a)都通过修饰(例如肽或核苷酸***或融合，针对RNA指导的核酸酶或gRNA)与RNA指导的核酸酶或gRNA相互作用，和(b)与靶DNA相互作用以改变其螺旋结构。肽或核苷酸的***或融合可包括但不限于RNA指导的核酸酶或gRNA与外源反式作用因子之间的直接共价键，和/或由RNA/蛋白质相互作用结构域例如MS2环和蛋白质/蛋白质相互作用结构域(例如PDZ，Lim或SH1、2或3结构域)的***或融合介导的非共价键。其他特定的RNA和氨基酸相互作用基序对于本领域技术人员将是熟悉的。反作用因子通常可以包括转录激活子。

术语“加强元件”是指以下元件，所述元件当与包含跟RNA引导的核酸酶复合的gRNA的核糖核蛋白(RNP)复合物(“gRNA-核酸酶-RNP”)共递送时与没有所述加强元件情况下的靶核酸编辑相比增加所述靶核酸的编辑。在某些实施例中，共递送可以是顺序的或同时的。在某些实施例中，加强元件可以是RNP复合物，其由与WT Cas9蛋白、Cas9切口酶蛋白(例如，Cas9 D10A蛋白)或酶失活的Cas9(eiCas9)蛋白复合的失活指导RNA构成。在某些实施例中，加强元件可以是RNP复合物，其由与Cas9切口酶蛋白(例如，Cas9 D10A蛋白)或酶失活的Cas9(eiCas9)蛋白复合的指导RNA构成。在某些实施例中，加强元件可以是单链或双链供体模板DNA。在某些实施例中，可以将一种或多种加强元件与gRNA-核酸酶-RNP共递送以增加靶核酸的编辑。在某些实施例中，加强元件可以与包含跟Cpf1分子复合的gRNA的RNP(“gRNA-Cpf1-RNP”)共递送以增加靶核酸的编辑。

“有效***缺失”是指导致HbF表达的***缺失(缺失和/或***)。在某些实施例中，有效***缺失可以诱导HbF表达。在某些实施例中，有效***缺失可以导致HbF表达水平升高。

“***缺失”是核酸序列中的***和/或缺失。***缺失可为DNA双链断裂的修复产物，该DNA双链断裂例如通过本披露的基因组编辑***形成的双链断裂。***缺失最常在通过“错误倾向”修复路径(例如下文所述的NHEJ路径)修复断裂时形成。

“基因转变”是指通过并入内源同源序列(例如基因阵列内的同源序列)改变DNA序列。“基因修正”是指通过并入外源同源序列(例如外源单链或双链供体模板DNA)改变DNA序列。基因转变和基因修正是通过HDR路径(例如下文所述的那些)修复DNA双链断裂的产物。

***缺失、基因转变、基因修正和其他基因组编辑结果典型地通过测序(最常通过“新一代(next-gen)”或“边合成边测序(sequencing-by-synthesis)”方法进行，但仍可使用Sanger测序)来评价，并且通过所有测序读段之间所关注位点处的数值变化(例如，±1、±2或更多个碱基)的相对频率来定量。测序用DNA样品可通过本领域中已知的多种方法来制备，并且可包括通过聚合酶链式反应(PCR)扩增所关注位点、捕捉通过双链断裂产生的DNA末端，如在Tsai 2016(通过引用并入本文)中所述的GUIDEseq方法中，或通过本领域熟知的其他手段。基因组编辑结果也可通过原位杂交法(例如FiberComb^TM***，由基因组视觉公司(Genomic Vision)(法国巴涅)商品化)和通过本领域中已知的任何其他适宜方法来评价。

“alt-HDR”、“替代性同源定向修复”或“替代性HDR”可互换使用，是指使用同源核酸(例如，内源同源序列(例如姐妹染色单体)或外源核酸(例如模板核酸))修复DNA损伤的过程。alt-HDR与经典HDR的不同之处在于，该过程利用与经典HDR不同的路径，并且可以被经典HDR介体RAD51和BRCA2抑制。alt-HDR的不同之处还在于涉及单链或带切口同源核酸模板，而经典HDR通常涉及双链同源模板。

“经典HDR”、“经典同源定向修复”或“cHDR”是指使用同源核酸(例如，内源同源序列(例如，姐妹染色单体)或外源核酸(例如，模板核酸))修复DNA损伤的过程。当在双链断裂处已有显著切除时，典型HDR通常起作用，形成DNA的至少一个单链部分。在正常细胞中，cHDR通常涉及一系列步骤，诸如断裂的识别、断裂的稳定、切除、单链DNA的稳定、DNA交叉中间体的形成、交叉中间体的拆分以及连接。该过程需要RAD51和BRCA2，并且同源核酸典型地为双链。

除非另外指明，否则如本文所用的术语“HDR”涵盖经典HDR和alt-HDR两者。

“非同源末端连接”或“NHEJ”是指连接介导的修复和/或非模板介导的修复，包括经典NHEJ(cNHEJ)和替代性NHEJ(altNHEJ)，替代性NHEJ又包括微同源介导的末端连接(MMEJ)、单链退火(SSA)和合成依赖性微同源介导的末端连接(SD-MMEJ)。

在关于分子的修饰(例如核酸或蛋白质)使用时，“替代”或“替代的”不需要方法限制，但仅指示替代实体是存在的。

“受试者”是指人、小鼠或非人灵长类动物。人受试者可为任何年龄(例如，婴儿、儿童、青年人或成年人)，并且可患有疾病，并且可能实际上具有基因改变。

“治疗(Treat)”、“治疗(treating)”和“治疗(treatment)”意指治疗受试者(例如，人受试者)的疾病，包括以下各项中的一种或多种：抑制疾病，即，阻止或预防其发展或进展；缓解疾病，即，引起疾病状态消退；减轻疾病的一种或多种症状；和治愈疾病。

“预防(prevent)”、“预防(preventing)”和“预防(prevention)”是指预防受试者的疾病，包括：(a)避免或预先排除疾病；(b)影响朝向疾病的倾向；或(c)预防或延迟疾病的至少一种症状的发作。

“试剂盒”是指两种或更多种组分的任何集合，该两种或更多种组分一起构成可用于特殊目的的功能单元。通过说明(而不是限制)，根据本披露的一个试剂盒可以包括与RNA指导的核酸酶复合或能够与该核酸酶复合的指导RNA，并且伴有(例如悬浮于，或可悬浮于)药学上可接受的载体。在某些实施例中，试剂盒可以包括加强元件。该试剂盒可用于将复合物引入例如细胞或受试者中，用于在这种细胞或受试者中引起所需基因组改变的目的。试剂盒的组分可以包装在一起，或者这些组分可分开包装。根据本披露的试剂盒还任选地包括使用说明书(DFU)，其描述例如根据本披露的方法使用该试剂盒。DFU可以物理方式与试剂盒包装在一起，或者可以使试剂盒的使用者能获得该DFU，例如通过电子方式获得。

术语“多核苷酸”、“核苷酸序列”、“核酸”、“核酸分子”、“核酸序列”和“寡核苷酸”是指DNA和RNA中的一系列核苷酸碱基(也称为“核苷酸”)，并且意指两个或更多个核苷酸的任何链。多核苷酸、核苷酸序列、核酸等可以是嵌合混合物或其衍生物或经修饰的形式，单链或双链。它们可以在碱基部分、糖部分或磷酸骨架处经修饰，例如以改进分子的稳定性、其杂交参数等。核苷酸序列典型地携带遗传信息，包括但不限于细胞器用于制造蛋白质和酶的信息。这些术语包括双链或单链基因组DNA、RNA、任何合成的和遗传操纵的多核苷酸，以及正义和反义多核苷酸二者。这些术语还包括含有经修饰碱基的核酸。

常规IUPAC表示法用于本文所呈现的核苷酸序列中，如下表1中所示(还参见Cornish-Bowden A，Nucleic Acids Res.[核酸研究]1985年5月10日；13(9):3021-30，通过引用并入本文)。然而应注意，在序列可能由DNA或者RNA编码的那些情况下，例如在gRNA靶向结构域中，“T”表示“胸腺嘧啶或尿嘧啶”。

表1：IUPAC核酸表示法

符号	碱基
		A	腺嘌呤
T	胸腺嘧啶或尿嘧啶
		G	鸟嘌呤
C	胞嘧啶
		U	尿嘧啶
K	G或T/U
		M	A或C
R	A或G
		Y	C或T/U
S	C或G
		W	A或T/U
B	C、G或T/U
		V	A、C或G
H	A、C或T/U
		D	A、G或T/U
N	A、C、G或T/U

术语“蛋白质”、“肽”和“多肽”可互换使用，是指通过肽键连接在一起的氨基酸的连续链。这些术语包括个别蛋白质、缔合在一起的蛋白质的组或复合物，以及此类蛋白质的片段或部分、变体、衍生物和类似物。肽序列使用常规表示法呈现于本文中，在左侧以氨基或N末端开始，并且前进至右侧的羧基或C末端。可以使用标准单字母或三字母缩写。

符号“CCAAT盒靶区域”等是指HBG1和/或HBG2基因的转录起始位点(TSS)的5’的序列。CCAAT盒是α样和β样珠蛋白基因启动子区域内高度保守的基序。CCAAT盒内或附近的区域在珠蛋白基因调控中起重要作用。例如，γ-珠蛋白远端CCAAT盒与胎儿血红蛋白的遗传持久性有关。据报道，许多转录因子与γ-珠蛋白启动子的复制的CCAAT盒区域结合，例如NF-Y、COUP-TFII(NF-E3)、CDP、GATA1/NF-E1和DRED(Martyn 2017)。尽管不希望受到理论的束缚，但据信转录激活子NF-Y的结合位点在γ-珠蛋白启动子处与转录阻遏子重叠。存在于远端γ-珠蛋白启动子区域内(例如，在CCAAT盒内或附近)的HPFH突变可改变那些因子的竞争性结合，并因此促使γ-珠蛋白表达增加和HbF水平升高。本文为HBG1和HBG2提供的基因组位置基于NCBI参考序列NC_000011，“智人第11号染色体，GRCh38.p12初级组装”(版本NC_000011.10)中提供的坐标。HBG1和HBG2的远端CCAAT盒位于HBG1和HBG2 c.-111至-115(基因组位置分别为Hg38 Chr11:5,249,968至Chr11:5,249,972和Hg38 Chr11:5,254,892至Chr11:5,254,896)。HBG1 c.-111至-115区域示例在SEQ ID NO:902(HBG1)中的位置2823-2827，并且HBG2 c.-111至-115区域示例在SEQ ID NO:903(HBG2)中的位置2747-2751。在某些实施例中，“CCAAT盒靶区域”表示在远端CCAAT盒处或附近的区域，并且包括远端CCAAT盒的核苷酸和远端CCAAT盒的上游(5’)25个核苷酸和下游(3’)25个核苷酸(即HBG1/2c.-86至-140)(基因组位置分别为Hg38 Chr11:5249943至Hg38 Chr11:5249997和Hg38Chr11:5254867至Hg38 Chr11:5254921)。HBG1 c.-86至-140区域示例在SEQ ID NO:902(HBG1)中的位置2798-2852，并且HBG2 c.-86至-140区域示例在SEQ ID NO:903(HBG2)中的位置2723-2776。在其他实施例中，“CCAAT盒靶区域”表示在远端CCAAT盒处或附近的区域，并且包括远端CCAAT盒的核苷酸和远端CCAAT盒的上游(5’)5个核苷酸和下游(3’)5个核苷酸(即HBG1/2c.-106至-120(基因组位置为Hg38 Chr11:5249963至Hg38 Chr11:5249977(分别是HGB1和Hg38 Chr11:5254887至Hg38 Chr11:5254901))。HBG1 c.-106至-120区域示例在SEQID NO:902(HBG1)中的位置2818-2832，并且HBG2 c.-106至-120区域示例在SEQ ID NO:903(HBG2)中的位置2742-2756。术语“CCAAT盒靶位点改变”等是指CCAAT盒靶区域的一个或多个核苷酸的改变(例如，缺失、***、突变)。示例性CCAAT盒靶区域改变的实例包括但不限于1nt缺失、4nt缺失、11nt缺失、13nt缺失和18nt缺失以及-117G>A改变。如本文所使用的，术语“CCAAT盒”和“CAAT盒”可以互换使用。

符号“c.-114至-102区域”、“c.-102至-114区域”、“-102:-114”、“13nt靶区域”等是指分别位于基因组位置Hg38 Chr11:5,249,959至Hg38Chr11:5,249,971和Hg38 Chr11:5,254,883至Hg38 Chr11:5,254,895的HBG1和/或HBG2基因的转录起始位点(TSS)的5’的序列。HBG1 c.-102至-114区域示例在SEQ ID NO:902(HBG1)中的位置2824-2836，并且HBG2c.-102至-114区域示例在SEQ ID NO:903(HBG2)中的位置2748-2760。术语“13nt缺失”等是指13nt靶区域的缺失。

符号“c.-121至-104区域”、“c.-104至-121区域”、“-104:-121”、“18nt靶区域”等是指分别位于基因组位置Hg38 Chr11:5,249,961至Hg38Chr11:5,249,978和Hg38 Chr11:5,254,885至Hg38 Chr11:5,254,902的HBG1和/或HBG2基因的转录起始位点(TSS)的5’的序列。HBG1 c.-104至-121区域示例在SEQ ID NO:902(HBG1)中的位置2817-2834，并且HBG2c.-104至-121区域示例在SEQ ID NO:903(HBG2)中的位置2741-2758。术语“18nt缺失”等是指18nt靶区域的缺失。

符号“c.-105至-115区域”、“c.-115至-105区域”、“-105:-115”、“11nt靶区域”等是指分别位于基因组位置Hg38 Chr11:5,249,962至Hg38Chr11:5,249,972和Hg38 Chr11:5,254,886至Hg38 Chr11:5,254,896的HBG1和/或HBG2基因的转录起始位点(TSS)的5’的序列。HBG1 c.-105至-115区域示例在SEQ ID NO:902(HBG1)中的位置2823-2833，并且HBG2c.-105至-115区域示例在SEQ ID NO:903(HBG2)中的位置2747-2757。术语“11nt缺失”等是指11nt靶区域的缺失。

符号“c.-115至-112区域”、“c.-112至-115区域”、“-112:-115”、“4nt靶区域”等是指分别位于基因组位置Hg38 Chr11:5,249,969至Hg38Chr11:5,249,972和Hg38 Chr11:5,254,893至Hg38 Chr11:5,254,896的HBG1和/或HBG2基因的转录起始位点(TSS)的5’的序列。HBG1 c.-112至-115区域示例在SEQ ID NO:902中的位置2823-2826，并且HBG2 c.-112至-115区域示例在SEQ ID NO:903(HBG2)中的位置2747-2750。术语“4nt缺失”等是指4nt靶区域的缺失。

符号“c.-116区域”、“HBG-116”、“1nt靶区域”等是指分别位于基因组位置Hg38Chr11:5,249,973和Hg38 Chr11:5,254,897的HBG1和/或HBG2基因的转录起始位点(TSS)的5’的序列。HBG1 c.-116区域示例在SEQ ID NO:902中的位置2822，并且HBG2 c.-116区域示例在SEQ ID NO:903(HBG2)中的位置2746。术语“1nt缺失”等是指1nt靶区域的缺失。

符号“c.-117G>A区域”、“HBG-117G>A”、“-117G>A靶区域”等是指分别位于基因组位置Hg38 Chr11:5,249,974至Hg38 Chr11:5,249,974和Hg38Chr11:5,254,898至Hg38Chr11:5,254,898的HBG1和/或HBG2基因的转录起始位点(TSS)的5’的序列。HBG1 c.-117G>A区域通过在SEQ ID NO:902中的位置2821处鸟嘌呤(G)取代为腺嘌呤(A)而示例，并且HBG2c.-117G>A区域通过在SEQ ID NO:903(HBG2)中的位置2745处G取代为A而示例。术语“-117G>A改变”等是指在-117G>A靶区域处G取代为A。

术语“近端HBG1/2启动子靶序列”表示包括13nt靶区域的近端HBG1/2启动子序列的50、100、200、300、400或500bp内的区域。根据本披露的基因组编辑***的改变有利于(例如引起、促进或倾向于增加红系后代中的HbF产生的上调)。

术语“BCL11Ae中的GATA1结合基序”是指作为BCL11A(BCL11Ae)红系特异性增强子中的GATA1结合基序(其在BCL11A基因的内含子2的+58DNA酶I超敏位点(DHS)区域中)的序列。BCL11Ae中GATA1结合基序的基因组坐标为chr2:60,495,265至60,495,270。+58DHS位点包含115个碱基对(bp)序列，如SEQ ID NO:968所示。SEQ ID NO:969中示出了+58DHS位点序列，包括约500bp上游和约200bp下游。

在本文提供范围的情况下，括端点。此外，应理解的是，除非另外指出或从上下文和/或本领域普通技术人员的理解中显而易见，否则以范围表示的值在本发明的不同实施例中可以假定为所述范围内的任何特定值，至所述范围的下限的单位的十分之一，除非上下文另有明确规定。还应理解，除非另外指出或从上下文和/或本领域普通技术人员的理解中显而易见，否则表示为范围的值可以假定给定范围内的任何子范围，其中所述子范围的端点表示为与所述范围的下限的单位的十分之一相同的精度程度。

概述

本披露的各种实施例通常涉及基因组编辑***，其被配置为将改变(例如，缺失或***或其他突变)引入染色体DNA中，以增强HBG1和/或HBG2基因的转录，所述基因分别编码血红蛋白的Aγ和Gγ亚基。在某些实施例中，使用本文提供的方法增加的一种或多种γ-珠蛋白基因(例如，HBG1、HBG2)的表达导致相对于HbA优先形成HbF和/或增加的HbF水平(作为总血红蛋白的百分比)。在某些实施例中，本披露总体上涉及包含与Cpf1分子复合的gRNA的RNP复合物的用途。在某些实施例中，gRNA可以是未经修饰的或经修饰的，Cpf1分子可以是野生型Cpf1蛋白或经修饰的Cpf1蛋白。在某些实施例中，gRNA可包含表6、表12或表13所示的序列。在某些实施例中，经修饰的Cpf1可以由SEQ ID NO:1000、1001、1008-1018、1032、1035-39、1094-1097、1107-09(Cpf1多肽序列)或SEQ ID NO:1019-1021、1110-17(Cpf1多核苷酸序列)所示的序列编码。在某些实施例中，RNP复合物可包含表15所示的RNP复合物。例如，RNP复合物可以包括包含SEQ ID NO:1051所示的序列的gRNA和由SEQ ID NO:1097所示的序列编码的经修饰的Cpf1蛋白(RNP32，表15)。

先前已经证明患有病症遗传持续性胎儿血红蛋白(HPFH)的患者在γ-珠蛋白调节元件中含有突变，导致胎儿γ-珠蛋白在整个生命中表达，而不是在出生时受到阻遏(Martyn 2017)。这导致胎儿血红蛋白(HbF)表达升高。HPFH突变可以是缺失的或非缺失的(例如，点突变)。患有HPFH的受试者展现出HbF的终身表达，即，他们不经历或仅经历部分珠蛋白转换，没有贫血症状。

可以通过与天然存在的HPFH变体相关的γ-珠蛋白调节元件中的点突变来诱导HbF表达，所述变体包括例如HBG1 c.-114C>T；c.-117G>A；c.-158C>T；c.-167C>T；c.-170G>A；c.-175T>G；c.-175T>C；c.-195C>G；c.-196C>T；c.-197C>T；c.-198T>C；c.-201C>T；c.-202C>T；c.-211C>T、c.-251T>C；或c.-499T>A；或HBG2 c.-109G>T；c.-110A>C；c.-114C>A；c.-114C>T；c.-114C>G；c.-157C>T；c.-158C>T；c.-167C>T；c.-167C>A；c.-175T>C；c.-197C>T；c.-200+C；c.-202C>G；c.-211C>T；c.-228T>C；c.-255C>G；c.-309A>G；c.-369C>G；或c.-567T>G。

在HBG1和/或HBG2基因的启动子内发现的远端CCAAT盒基序处的天然存在突变(即HBG1/2c.-111至-115)也已显示出导致持续的γ-珠蛋白表达和HPFH病症。据认为，CCAAT盒的改变(突变或缺失)可能会破坏一个或多个转录阻遏子的结合，导致γ-珠蛋白基因的持续表达和HbF表达的升高(Martyn 2017)。例如，已经显示天然存在的13个碱基对的del c.-114至-102(“13nt缺失”)与升高的HbF水平相关(Martyn 2017)。远端CCAAT盒可能与负调节转录因子(其在成人期表达并阻遏HBG)的CCAAT盒内和周围的结合基序重叠(Martyn2017)。

本文披露的基因编辑策略是通过破坏远端CCAAT盒中和/或远端CCAAT盒周围的一个或多个核苷酸来增加HbF表达。在某些实施例中，“CCAAT盒靶区域”可以是在远端CCAAT盒处或附近的区域，并且包括远端CCAAT盒的核苷酸和远端CCAAT盒的上游(5’)25个核苷酸和下游(3’)25个核苷酸(即HBG1/2c.-86至-140)。在其他实施例中，“CCAAT盒靶区域”可以是在远端CCAAT盒处或附近的区域，并且包括远端CCAAT盒的核苷酸和远端CCAAT盒的上游(5’)5个核苷酸和下游(3’)5个核苷酸(即HBG1/2c.-106至-120)。本文披露了CCAAT盒靶区域的独特的非天然存在的改变，所述改变诱导HBG表达，包括但不限于HBG del c.-104至-121(“18nt缺失”)、HBG del c.-105至-115(“11nt缺失”)、HBG del c.-112至-115(“4nt缺失”)和HBG del c.-116(“1nt缺失”)。在某些实施例中，本文披露的基因组编辑***可用于将改变引入HBG1和/或HBG2的CCAAT盒靶区域。在某些实施例中，基因组编辑***可以包括一种或多种DNA供体模板，其编码CCAAT盒靶区域中的改变(例如缺失、***或突变)。在某些实施例中，改变可以是非天然发生的改变或天然发生的改变。在某些实施例中，供体模板可以编码1nt缺失、4nt缺失、11nt缺失、13nt缺失、18nt缺失或c.-117G>A改变。在某些实施例中，基因组编辑***可以包括RNA指导的核酸酶，其包括Cas9、经修饰的Cas 9、Cpf1或经修饰的Cpf1。在某些实施例中，基因组编辑***可以包括包含gRNA和Cpf1分子的RNP。在某些实施例中，gRNA可以是未经修饰的或经修饰的，Cpf1分子可以是野生型Cpf1蛋白或经修饰的Cpf1蛋白，或其组合。在某些实施例中，gRNA可包含表6、表12或表13所示的序列。在某些实施例中，经修饰的Cpf1可以由SEQ ID NO:1000、1001、1008-1018、1032、1035-39、1094-1097、1107-09(Cpf1多肽序列)或SEQ ID NO:1019-1021、1110-17(Cpf1多核苷酸序列)所示的序列编码。在某些实施例中，RNP复合物可包含表15所示的RNP复合物。例如，RNP复合物可以包括包含SEQ ID NO:1051所示的序列的gRNA和由SEQ ID NO:1097所示的序列编码的经修饰的Cpf1蛋白(RNP32，表15)。

本披露的基因组编辑***可以包括RNA指导的核酸酶(如Cpf1)以及一种或多种具有与靶区域内或附近的序列互补的靶向结构域的gRNA，以及任选地一种或多种DNA供体模板(其编码靶区域内或附近的特定突变(如缺失或***)，和/或增强产生此类突变的效率的试剂(其包括但不限于随机寡核苷酸、参与DNA修复或DNA损伤应答的基因产物的小分子激动剂或拮抗剂、或肽试剂)。

在本披露的实施例中可以采用多种将突变引入CCAAT盒靶区域、13nt靶区域、和/或近端HBG1/2启动子靶序列的方法。在一种方法中，在CCAAT盒靶区域、13nt靶区域、和/或近端HBG1/2启动子靶序列内进行单个改变，例如双链断裂，并以破坏区域功能的方式修复，例如通过形成***缺失或通过并入编码该区域缺失的供体模板序列。在第二方法中，在区域的任一侧进行两个或更多个改变，导致间插序列(包括CCAAT盒靶区域和/或13nt靶区域)的缺失。

通过基因疗法和/或基因组编辑对血红蛋白病的治疗因以下事实而变得复杂：因疾病在表型方面受影响的细胞，红细胞或RBC被去核，并且不包含编码异常血红蛋白(Hb)亚基的遗传材料也不含有上述示例性基因组编辑方法中靶向的Aγ或Gγ亚基。在本披露的某些实施例中，通过改变能够分化为红细胞或以其他方式产生红细胞的细胞来解决该复杂情况。根据本披露的各种实施例改变的红系谱系内的细胞包括但不限于造血干细胞和祖细胞(HSC)、成红细胞(包括嗜碱性、多染性和/或正染性成红细胞)、原成红细胞、多染性红细胞或网织红细胞、胚胎细胞干(ES)细胞和/或诱导性多能干(iPSC)细胞。这些细胞可以原位(例如在受试者的组织内)或离体地被改变。用于原位和离体改变细胞的基因组编辑***的实施描述于以下标题“基因组编辑***的实施：递送、配制和施用途径”下。

在某些实施例中，通过使用基因组编辑***获得导致Aγ和/或Gγ表达诱导的改变，所述基因组编辑***包含RNA指导的核酸酶和至少一种具有靶向结构域的gRNA，所述靶向结构域与HBG1和/或HBG2的CCAAT盒靶区域内的或其近端(例如，在CCAAT盒靶区域的10、20、30、40或50、100、200、300、400或500个碱基内)的序列互补。如下面更详细地讨论的，RNA指导的核酸酶和gRNA形成复合物，所述复合物能够缔合并改变CCAAT盒靶区域或其近端区域。用于本文披露的实施例中的针对HBG1和/或HBG2的CCAAT盒靶区域或其近端的合适的gRNA和gRNA靶向结构域的实例包括本文所示的那些。

在某些实施例中，通过使用基因组编辑***获得导致Aγ和/或Gγ表达诱导的改变，所述基因组编辑***包含RNA指导的核酸酶和至少一种具有靶向结构域的gRNA，所述靶向结构域与HBG1和/或HBG2的13nt靶区域内的或其近端(例如，在13nt靶区域的10、20、30、40或50、100、200、300、400或500个碱基内)的序列互补。如下面更详细地讨论的，RNA指导的核酸酶和gRNA形成复合物，所述复合物能够缔合并改变13nt靶区域或其近端区域。用于本文披露的实施例中的针对HBG1和/或HBG2的13nt靶区域或其近端的合适的gRNA和gRNA靶向结构域的实例包括本文所示的那些。

基因组编辑***可以以多种方式实现，如下面详细讨论的。例如，本披露的基因组编辑***可以作为核糖核蛋白复合物或使用多种gRNA的多种复合物来实施。可以使用本领域已知的方法，包括电穿孔法将该核糖核蛋白复合物引入靶细胞，如共同转让的国际专利公开号WO 2016/182959(Jennifer Gori(“Gori”)，公开于2016年11月17日)所述，将其通过引用以其整体并入本文。

通过本领域已知的方法将这些组合物中的核糖核蛋白复合物引入靶细胞中，所述方法包括但不限于电穿孔(例如，使用瑞士巴塞尔(Basel,Switzerland)龙沙公司商业化的Nucleofection^TM技术或由马里兰州盖瑟斯堡(Gaithersburg,Maryland)的Maxcyte Inc.商业化的类似技术)和脂转染(例如，使用马萨诸塞州沃尔瑟姆(Waltham Massachusetts)赛默飞世尔科技公司(Thermo Fisher Scientific)公司商业化的Lipofectamine^TM试剂)。可替代地或另外地，在引入编码RNA指导的核酸酶和/或gRNA的核酸之后，在靶细胞自身内形成核糖核蛋白复合物。这些和其他递送方式在下面和Gori中进行了概述。

根据本披露离体改变的细胞可以在递送给受试者之前***作(例如，扩增、传代、冷冻、分化、去分化、用转基因转导等)。将细胞不同地递送至获得它们的受试者(以“自体”移植)，或递送到在免疫学上不同于细胞供体的接受体(以“同种异体”移植)。

在一些情况下，自体移植包括以下步骤：从受试者获得多个细胞，这些多个细胞在外周血中或在骨髓或其他组织(例如脾脏，皮肤等)中循环，并且对这些细胞操作以富集红系谱系中的细胞(例如，通过诱导产生iPSC，纯化表达某些细胞表面标记(例如CD34、CD90、CD49f)和/或不表达非红系谱系特征表面标记(例如CD10、CD14、CD38等)的细胞)。任选地或另外地，将细胞扩增，用转基因转导，暴露于细胞因子或其他肽或小分子试剂，和/或在用靶向CCAAT盒靶区域、13nt靶区域、和/或近端HBG1/2启动子靶序列的基因组编辑***转导前冷冻/融化。基因组编辑***可以以任何合适的形式实施或递送至细胞，包括作为核糖核蛋白复合物、作为分离的蛋白质和核酸组分、和/或作为编码基因组编辑***的组分的核酸。

在某些实施例中，使用本文披露的基因组编辑方法编辑的CD34+造血干细胞和祖细胞(HSPC)可用于治疗有需要的受试者中的血红蛋白病。在某些实施例中，血红蛋白病可以是严重镰状细胞病(SCD)或地中海贫血，如β-地中海贫血、δ-地中海贫血或β/δ-地中海贫血。在某些实施例中，用于治疗血红蛋白病的示例性方案可以包括从有需要的受试者中收获CD34+HSPC，使用本文披露的基因组编辑方法离体编辑自体CD34+HSPC，然后将编辑的自体CD34+HSPC重新注入受试者中。在某些实施例中，用编辑的自体CD34+HSPC治疗可导致HbF诱导增加。

在收获CD34+HSPC之前，在某些实施例中，受试者可以中断羟基脲治疗(如果适用的话)，并接受输血以维持足够的血红蛋白(Hb)水平。在某些实施例中，受试者可经静脉内施用普乐沙福(plerixafor)(例如，0.24mg/kg)以将CD34+HSPC从骨髓动员至外周血。在某些实施例中，受试者可经历一个或多个白细胞去除周期(例如，周期之间约一个月，一个周期定义为连续几天进行两次普乐沙福动员的白细胞去除收集)。在某些实施例中，为受试者进行的白细胞去除周期的数量可以是实现编辑的自体CD34+HSPC重新注入回受试者所需的剂量(例如，≥2x10⁶细胞/kg，≥3x10⁶细胞/kg，≥4x10⁶细胞/kg，≥5x10⁶细胞/kg，2x10⁶细胞/kg至3x10⁶细胞/kg，3x10⁶细胞/kg至4x10⁶细胞/kg，4x10⁶细胞/kg至5x10⁶细胞/kg)连同实现用于备份存储的未编辑的自体CD34+HSPC/kg的剂量(例如，≥1.5x10⁶细胞/kg)的数量。在某些实施例中，可以使用本文披露的任何基因组编辑方法编辑从受试者收获的CD34+HSPC。在某些实施例中，本文披露的任何一种或多种gRNA和一种或多种RNA指导的核酸酶可以在基因组编辑方法中使用。

在某些实施例中，治疗可以包括自体干细胞移植。在某些实施例中，受试者可以用白消安调理进行清髓性调理(例如，基于第一剂量药物代谢动力学分析调整剂量，测试剂量为1mg/kg)。在某些实施例中，调理可以连续发生四天。在某些实施例中，三天白消安洗脱期后，可以将编辑的自体CD34+HSPC(例如，≥2x10⁶细胞/kg，≥3x10⁶细胞/kg，≥4x10⁶细胞/kg，≥5x10⁶细胞/kg，2x10⁶细胞/kg至3x10⁶细胞/kg，3x10⁶细胞/kg至4x10⁶细胞/kg，4x10⁶细胞/kg至5x10⁶细胞/kg)重新注入受试者(例如重新注入外周血)。在某些实施例中，可以制造编辑的自体CD34+HSPC并为特定受试者冷冻保存。在某些实施例中，受试者可以在连续的清髓性调理方案和经编辑的自体CD34+细胞输注后获得中性粒细胞移植。中性粒细胞移植可以定义为三次连续测量的ANC≥0.5x10⁹/L。

无论如何实施，基因组编辑***可包括以下或可与以下一起共递送：一种或多种在编辑过程中和编辑后改善细胞生存力的因子，包括但不限于芳烃受体拮抗剂，例如StemRegenin-1(SR1)、UM171，LGC0006、α-萘并黄酮和CH-223191，和/或先天性免疫应答拮抗剂，例如环孢菌素A、***、白藜芦醇(reservatrol)、MyD88抑制肽、靶向Myd88的RNAi剂、B18R重组蛋白、糖皮质激素、OxPAPC、TLR拮抗剂、雷帕霉素、BX795和RLR shRNA。可在编辑过程中和编辑后改善细胞生存力的这些和其他因子描述于Gori中标题“I.干细胞的优化”(第36页至第61页)下，将其通过引用并入本文。

递送基因组编辑***后，任选地对细胞进行操作，例如以富集红系谱系中的HSC和/或细胞和/或富集经编辑的细胞，以使其扩增、冷冻/融化，或以其他方式使细胞返回受试者。然后将经编辑的细胞返回给受试者，例如通过静脉内递送在循环***中或递送至实体组织例如骨髓中。

在功能上，使用本披露的组合物、方法和基因组编辑***改变CCAAT盒靶区域、13nt靶区域、和/或近端HBG1/2启动子靶序列导致在表达血红蛋白的细胞中显著诱导Aγ和/或Gγ亚基(可互换地称为HbF表达)，例如相对于未经修饰的对照，至少5％、10％、15％、20％、25％、30％、35％、40％、45％、50％或更高的Aγ和/或Gγ亚基表达诱导。这种蛋白表达的诱导通常是经处理的多个细胞中的一些或全部中的CCAAT盒靶区域、13nt靶区域、和/或近端HBG1/2启动子靶序列发生改变的结果(表达，例如关于多个细胞中包含***缺失突变的总基因组的百分比)，例如该多个细胞中至少5％、10％、15％、20％、25％、30％、35％、40％、45％、50％包含至少一个等位基因，该等位基因包含在CCAAT盒靶区域、13nt靶区域、和/或近端HBG1/2启动子靶序列内或附近的序列改变，该序列改变包括但不限于***缺失、***或缺失。

可以以许多合适的方式评估由本披露的基因组编辑***和方法引起或促进的改变的功能作用。例如，可以在蛋白质或mRNA水平上评估改变对胎儿血红蛋白表达的作用。HBG1和HBG2 mRNA的表达可通过数字液滴PCR(ddPCR)进行评估，ddPCR可对通过从经处理的或未经处理的样品收获的mRNA的逆转录而获得的cDNA样品进行。HBG1、HBG2、HBB和/或HBA的引物可使用本领域已知的方法单独使用或多重使用。例如，可以使用由伯乐公司(BioRad)(海格立斯(Hercules)，加利福尼亚)商业化的QX200^TMddPCR***以及由伯乐公司公开的相关方案进行样品的ddPCR分析。胎儿血红蛋白可以通过以下进行评估：高压液相色谱(HPLC)(例如，根据Chang 2017第143-44页上讨论的方法(通过引用并入本文))，或快速蛋白液相色谱(FPLC)(如本领域已知的，使用离子交换和/或反相柱来解析HbF、HbB和HbA和/或Aγ和Gγ珠蛋白链)。

应当指出，CCAAT盒靶区域(例如18nt、11nt、4nt、1nt、c.-117G>A靶区域)、13nt靶区域和/或近端HBG1/2启动子靶序列在靶细胞中被改变的比率可以通过使用任选的基因组编辑***组分(例如寡核苷酸供体模板)进行修饰。供体模板设计在下面的“供体模板设计”标题下进行了概述。用于靶向13nt靶区域的供体模板可以包括但不限于编码HBG1 c.-114至-102(对应于SEQ ID NO:902的核苷酸2824-2836)、HBG1 c.-225至-222(对应于SEQ IDNO:902的核苷酸2716-2719)和/或HBG2 c.-114至-102(对应于SEQ ID NO:903的核苷酸2748-2760)的改变(例如缺失)的供体模板。示例性5’和3’同源臂，以及编码缺失(例如c.-114至-102)的示例性全长供体模板也在下文给出。在某些实施例中，用于靶向18nt靶区域的供体模板可以包括但不限于编码HBG1 c.-104至-121、HBG2 c.-104至-121、或其组合的改变(例如缺失)的供体模板。编码缺失(例如c.-104至-121)的示例性全长供体模板包括SEQ ID NO:974和975。在某些实施例中，用于靶向11nt靶区域的供体模板可以包括但不限于编码HBG1 c.-105至-115、HBG2 c.-105至-115、或其组合的改变(例如缺失)的供体模板。编码缺失(例如c.-105至-115)的示例性全长供体模板包括SEQ ID NO:976和978。在某些实施例中，用于靶向4nt靶区域的供体模板可以包括但不限于编码HBG1 c.-112至-115、HBG2c.-112至-115、或其组合的改变(例如缺失)的供体模板。编码缺失(例如c.-112至-115)的示例性全长供体模板包括SEQ ID NO:984-995。在某些实施例中，用于靶向1nt靶区域的供体模板可以包括但不限于编码HBG1 c.-116、HBG2 c.-116、或其组合的改变(例如缺失)的供体模板。编码缺失(例如c.-116)的示例性全长供体模板包括SEQ ID NO:982和983。在某些实施例中，用于靶向c.-117G>A靶区域的供体模板可以包括但不限于编码HBG1 c.-117G>A、HBG2 c.-117G>A、或其组合的改变(例如缺失)的供体模板。编码缺失(例如c.-117G>A)的示例性全长供体模板包括SEQ ID NO:980和981。在某些实施例中，供体模板可以是正链或负链。

本文使用的供体模板可以是与靶序列内或附近的DNA区域不同源的非特异性模板。在某些实施例中，用于靶向13nt靶区域的供体模板可包括但不限于与13nt靶区域内或附近的DNA区域不同源的非靶特异性模板。例如，用于靶向13nt靶区域的非特异性供体模板可以与13nt靶区域内或附近的DNA区域不同源，并且可包含编码HBG1 c.-225至-222(对应于SEQ ID NO:902的核苷酸2716-2719)的缺失的供体模板。

本文描述的实施例可用于所有类别的脊椎动物，包括但不限于灵长类动物、小鼠、大鼠、兔、猪、狗和猫。

该概述集中在少数示例性实施例上，这些实施例说明了基因组编辑***和CRISPR介导的细胞改变方法的原理。然而，为清楚起见，本披露包含以上未明确解决的但对于本领域技术人员而言显而易见的修改和变化。考虑到这一点，以下披露旨在更概括地说明基因组编辑***的操作原理。以下内容不应理解为限制性的，而应是基因组编辑***和利用这些***的CRISPR介导方法的某些原理的说明，这与本披露相结合，将在其范围内为本领域技术人员提供有关另外的实施和修改的信息。RNA指导的解旋酶、指导RNA和失活的指导RNA

在上述办法和方法的某些实施例中，DNA螺旋结构的改变是通过“RNA指导的解旋酶”的作用实现的，术语“RNA指导的解旋酶”通常用于指分子，典型地是肽，其(a)与gRNA相互作用(例如，复合)，并且(b)与gRNA一起，缔合并解旋靶位点。在某些实施例中，RNA指导的解旋酶可以包含被配置为缺乏核酸酶活性的RNA指导的核酸酶。然而，发明人已经观察到，甚至具有切割能力的RNA指导的核酸酶也可以通过将其与具有长度为15个或更少的核苷酸的截短的靶向结构域的失活gRNA复合而适于用作RNA指导的解旋酶。野生型RNA指导的核酸酶与失活gRNA的复合物显示减少的或消除的RNA切割活性，但似乎保留了解旋酶活性。RNA指导的解旋酶和失活gRNA的详细描述如下。

关于RNA指导的解旋酶，根据本披露，RNA指导的解旋酶可包含本文披露的和下文“RNA指导的核酸酶”标题下的任何RNA指导的核酸酶，包括但不限于Cas9或Cpf1 RNA指导的核酸酶。这些RNA指导的核酸酶的解旋酶活性允许解旋DNA，从而增加基因组编辑***组分(例如但不限于催化活性RNA指导的核酸酶和gRNA)进入所期望的有待编辑的靶区域(例如CCAAT盒靶区域、13nt靶区域、和/或近端HBG1/2启动子靶序列)。在某些实施例中，RNA指导的核酸酶可以是具有核酸酶活性的催化活性RNA指导的核酸酶。在某些实施例中，RNA指导的解旋酶可以被配置为缺乏核酸酶活性。例如，在某些实施例中，RNA指导的解旋酶可以是缺乏核酸酶活性的催化失活性RNA指导的核酸酶，例如催化失活性Cas9分子，其仍然提供解旋酶活性。在某些实施例中，RNA指导的解旋酶可以与失活gRNA形成复合物，从而形成不能切割核酸的失活RNP。在其他实施例中，RNA指导的解旋酶可以是与失活gRNA复合的催化活性RNA指导的核酸酶，形成不能切割核酸的失活RNP。在某些实施例中，RNA指导的核酸酶未配置为将外源反式作用因子募集至所期望的有待的编辑的靶区域(例如，CCAAT盒靶区域、13nt靶区域、和/或近端HBG1/2启动子靶标序列)。

关于失活gRNA，这些包括本文讨论的以及下文“失活gRNA分子”标题下的任何失活gRNA。可以通过以下来产生失活gRNA(在本文中也称为“dgRNA”)：截短gRNA靶向结构域序列的5’末端，从而导致长度为15个核苷酸或更短的靶向结构域序列。根据本披露的失活指导RNA分子包括具有降低的、低的或不可检测的切割活性的失活指导RNA分子。与活性指导RNA的靶向结构域序列相比，失活指导RNA的靶向结构域序列的长度可以短1、2、3、4、5、6、7、8、9或10个核苷酸。失活gRNA分子可包含与靶核酸中的靶区域(例如，CCAAT盒靶区域、13nt靶区域、近端HBG1/2启动子靶序列和/或BCL11Ae中的GATA1结合基序)近端或内的区域互补的靶向结构域。在某些实施例中，“近端”可表示靶区域(例如，CCAAT盒靶区域、13nt靶区域、近端HBG1/2启动子靶序列、和/或BCL11Ae中的GATA1结合基序)的10、25、50、100或200个核苷酸内的区域。在某些实施例中，失活gRNA包含与DNA的转录链或非转录链互补的靶向结构域。在某些实施例中，失活指导RNA未配置为将外源反式作用因子募集至靶区域(例如，CCAAT盒靶区域、13nt靶区域，近端HBG1/2启动子靶标序列、和/或BCL11Ae中的GATA1结合基序)。

该概述集中在少数示例性实施例上，这些实施例说明了基因组编辑***和CRISPR介导的细胞改变方法的原理。然而，为清楚起见，本披露包含以上未明确解决的但对于本领域技术人员而言显而易见的修改和变化。考虑到这一点，以下披露旨在更概括地说明基因组编辑***的操作原理。以下内容不应理解为限制性的，而应是基因组编辑***和利用这些***的CRISPR介导方法的某些原理的说明，这与本披露相结合，将在其范围内为本领域技术人员提供有关另外的实施和修改的信息。

基因组编辑***

术语“基因组编辑***”是指具有RNA指导的DNA编辑活性的任何***。本披露的基因组编辑***包括至少两种从天然存在的CRISPR***改适的组分：指导RNA(gRNA)和RNA指导的核酸酶。这两种组分形成复合物，所述复合物能够与特定核酸序列结合并在所述核酸序列中或其周围编辑DNA，例如通过制备一条或多条单链断裂(SSB或切口)、双链断裂(DSB)和/或点突变。

基因组编辑***可以用多种方式来实施(例如施用于或递送至细胞或受试者)，并且不同的实施可适合于不同应用。例如，在某些实施例中，基因组编辑***作为蛋白质/RNA复合物(核糖核蛋白或RNP)进行实施，所述复合物可以被包含在药物组合物中，所述药物组合物任选地包括药学上可接受的载剂和/或包囊剂，例如但不限于脂质或聚合物的微颗粒或纳米颗粒、胶束或脂质体。在某些实施例中，基因组编辑***作为编码上述RNA指导的核酸酶和指导RNA组分的一种或多种核酸(任选地具有一种或多种另外的组分)进行实施；在某些实施例中，基因组编辑***作为包含此类核酸的一种或多种载体(例如病毒载体，例如腺相关病毒(参见下文“基因组编辑***的实施：递送、配制和施用途径”标题下的部分))进行实施；并且在某些实施例中，基因组编辑***是作为前述任一种的组合来实施。根据本文所述原理操作的其他或经修改的实施将为技术人员所显而易见并且在本披露的范围内。

应注意，本披露的基因组编辑***可靶向单一特定核苷酸序列，或者可通过使用两个或更多个指导RNA靶向(并且能平行编辑)两个或更多个特定核苷酸序列。在本披露通篇中，多种gRNA的使用称为“多重化”，并且可用于靶向多个无关的目的靶序列，或用于在单一靶结构域内形成多个SSB或DSB，并且在一些情形中，用于在这种靶结构域内产生特定编辑。例如，Maeder等人的国际专利公开号WO2015/138510(“Maeder”)(将其通过引用并入本文)描述用于修正人CEP290基因中的点突变(C.2991+1655A至G)的基因组编辑***，所述点突变导致产生隐蔽剪接位点，这又降低或消除该基因的功能。Maeder的基因组编辑***利用两个指导RNA，这些指导RNA靶向该点突变任一侧上的(即，侧接)序列，并且形成侧接该突变的DSB。这又促进了包括突变在内的间插序列的缺失，由此消除隐蔽剪接位点并恢复正常的基因功能。

作为另一实例，Cotta-Ramusino等人的WO 2016/073990(“Cotta-Ramusino”)(通过引用并入本文)描述利用两个gRNA与Cas9切口酶(制造单链切口的Cas9，如化脓链球菌D10A)的基因组编辑***，该布置称为“双重切口酶***”。Cotta-Ramusino的双重切口酶***经配置以在目的序列的相对链上制造两个偏移一个或多个核苷酸的切口，所述切口组合产生具有悬突(在Cotta-Ramusino情形中是5’悬突，但3’悬突也有可能)的双链断裂。在一些情况下，该悬突又可以促进同源定向修复事件。并且作为另一实例，Palestrant等人的WO2015/070083(通过引用并入本文)描述靶向编码Cas9的核苷酸序列的gRNA(称为“管理RNA”)，其可以包括于基因组编辑***中，该基因组编辑***包含一个或多个另外的gRNA以容许Cas9的瞬时表达，该Cas9可能原本例如在一些经病毒转导的细胞中是组成型表达的。这些多重化应用旨在具有示例性而不是限制性，并且技术人员将了解，其他多重化应用通常与本文所述的基因组编辑***相容。

如本文所披露，在某些实施例中，基因组编辑***可包含多种gRNA，其可用于将突变引入BCL11Ae中的GATA1结合基序或HBG1和/或HBG2的13nt靶区域。在某些实施例中，本文披露的基因组编辑***可包含用于将突变引入BCL11Ae中的GATA1结合基序和HBG1和/或HBG2的13nt靶区域的多种gRNA。

在一些情况下，基因组编辑***可以形成双链断裂，这些双链断裂是通过细胞DNA双链断裂机制例如NHEJ或HDR来修复。这些机制描述于文献中(参见例如Davis和Maizels2014(描述Alt-HDR)；Frit 2014(描述Alt-NHEJ)；Iyama和Wilson 2013(一般性描述经典HDR和NHEJ途径))。

如果基因组编辑***通过形成DSB来操作，那么此类***任选地包括促进或有助于特定双链断裂修复模式或特定修复结果的一个或多个组分。例如，Cotta-Ramusino还描述其中添加单链寡核苷酸“供体模板”的基因组编辑***；将供体模板并入细胞DNA的靶区域中，该靶区域由基因组编辑***切割，并且可以导致靶序列中的变化。

在某些实施例中，基因组编辑***在不引起单链或双链断裂的情况下修饰靶序列，或修饰靶序列中或附近的基因的表达。例如，基因组编辑***可包括融合至作用于DNA的功能结构域的RNA指导的核酸酶，由此修饰靶序列或其表达。作为一个实例，RNA指导的核酸酶可连接至(例如融合至)胞苷脱氨酶功能结构域，并且可通过产生所靶向的C至A取代来操作。示例性核酸酶/脱氨酶融合体描述于Komor 2016中，将其通过引用并入本文。可替代地，基因组编辑***可利用裂解失活的(即，“死”)核酸酶，例如失活Cas9(dCas9)，并且可通过在细胞DNA的一个或多个所靶向区域上形成稳定复合物来操作，由此干扰涉及一个或多个所靶向区域的功能，包括但不限于mRNA转录、染色质重塑等。在某些实施例中，基因组编辑***可以包括RNA指导的解旋酶，其解旋靶序列内或近端的DNA，而不会引起单链或双链断裂。例如，基因组编辑***可以包括RNA指导的解旋酶，其被配置为在靶序列内或附近缔合以解旋DNA并诱导对靶序列的可及性。在某些实施例中，RNA指导的解旋酶可以与被配置为缺乏切割活性的失活指导RNA复合，从而允许DNA解旋而不引起DNA断裂。

指导RNA(gRNA)分子

术语“指导RNA”和“gRNA”是指促进RNA指导的核酸酶(如Cpf1分子)与细胞中的靶序列(如基因组或附加体序列)的特异性缔合(或“靶向”)的任何核酸。gRNA可以是单分子(包含单一RNA分子，并且可替代地称为嵌合)或模块(包含多于一个、并且典型地两个单独的RNA分子，例如crRNA和tracrRNA，其通常例如通过双链化彼此缔合)。在整个文献中描述了gRNA及其组分(例如，参见Briner 2014，将其通过引用并入；Cotta-Ramusino)。可以根据本文的实施例使用的模块性和单分子gRNA的实例包括但不限于SEQ ID NO:29-31和38-51所示的序列。可以根据本文的实施例使用的gRNA近端和尾结构域的实例包括但不限于SEQID NO:32-37所示的序列。

在细菌和古细菌中，II型CRISPR***通常包含RNA指导的核酸酶蛋白(例如Cas9)、包括与外来序列互补的5’区的CRISPR RNA(crRNA)和包括与crRNA的3’区互补并形成双链体的5’区的反式激活crRNA(tracrRNA)。虽然并非旨在受限于任何理论，但认为此双链体有助于形成Cas9/gRNA复合物，并且是所述复合物的活性所需的。在II型CRISPR***经改适用于基因编辑中时，发现crRNA和tracrRNA可以接合成单一单分子或嵌合指导RNA，在一个非限制性实例中借助桥接crRNA(在其3’末端)和tracrRNA(在其5’末端)的互补区的四核苷酸(例如GAAA)“四环(tetraloop)”或“接头”序列来接合。(Mali 2013；Jiang 2013；Jinek2012；全部通过引用并入本文)。

指导RNA不论是单分子或模块都包括“靶向结构域”，所述靶向结构域与靶序列内的靶结构域完全或部分互补，所述靶序列例如期望编辑的细胞基因组中的DNA序列。靶向结构域在文献中通过多种名称来提及，包括但不限于“指导序列”(Hsu 2013，通过引用并入本文)、“互补性区域”(Cotta-Ramusino)、“间隔子”(Briner 2014)和一般性地称为“crRNA”(Jiang)。不论给予其何种名称，靶向结构域典型地长度为10-30个核苷酸，并且在某些实施例中长度为16-24个核苷酸(例如，长度为16、17、18、19、20、21、22、23或24个核苷酸)，并且在Cas9 gRNA情形中位于5’末端处或5’末端附近，并且在Cpf1 gRNA情形中位于3’末端处或3’末端附近。

除了靶向结构域以外，gRNA典型地(但不一定，如下文所讨论)包括多个可影响gRNA/Cas9复合物的形成或活性的域。例如，如上文所提及，通过gRNA的第一和第二互补性结构域形成的双链化结构(也称为重复:抗重复双链体)与Cas9的识别(REC)叶相互作用，并且可以介导Cas9/gRNA复合物的形成(Nishimasu 2014；Nishimasu 2015；两者均通过引用并入本文)。应注意，第一和/或第二互补性结构域可含有一个或多个多聚腺苷酸段，其可以由RNA聚合酶识别为终止信号。因此，第一和第二互补性结构域的序列任选地经修饰以消除这些段，并促进gRNA的体外转录的完成，例如通过使用如Briner 2014中所述的A-G交换或A-U交换来修饰。对第一和第二互补性结构域的这些和其他类似修饰在本披露的范围内。

与第一和第二互补性结构域一起，Cas9 gRNA典型地包括两个或更多个其他双链化区域，该两个或更多个另外的双链化区域在体内但不一定在体外参与核酸酶活性。(Nishimasu 2015)。在第二互补性结构域的3’部分附近的第一茎环1被不同地称为“近端结构域”(Cotta-Ramusino)、“茎环1”(Nishimasu 2014和2015)以及“连结(nexus)”(Briner2014)。一个或多个其他茎环结构通常存在于gRNA的3’末端附近，其数目依物种而变：化脓链球菌gRNA典型地包括两个3’茎环(总计四个茎环结构，包括重复:抗重复双链体)，而金黄色葡萄球菌和其他物种仅具有一个(总计三个茎环结构)。对根据物种组织化的保守茎环结构(更通常地，和gRNA结构)的描述于Briner 2014中提供。

虽然前述说明集中于用于Cas9的gRNA，但应了解，存在其他RNA指导的核酸酶，其利用在一些方面与针对这一点描述的那些gRNA不同的gRNA。例如，Cpf1(“来自普雷沃菌属和弗朗西斯菌属1的CRISPR”)是最近发现的RNA指导的核酸酶，其发挥功能不需要tracrRNA。(Zetsche 2015，通过引用并入本文)。用于Cpf1基因组编辑***的gRNA通常包括靶向结构域和互补性结构域(替代性地称为“把手”)。还应注意，在用于Cpf1的gRNA中，靶向结构域通常存在于3’末端处或附近，而不是如上文结合Cas9 gRNA所述的5’末端(把手位于Cpf1 gRNA的5’末端处或5’末端附近)。Cpf1 gRNA的示例性靶向结构域在表6和表12中示出。

但本领域技术人员将了解，虽然在来自不同原核物种的gRNA之间或在Cpf1与Cas9gRNA之间可能存在结构差异，但gRNA的操作原理通常是一致的。因为这种操作一致性，gRNA可在广义上通过其靶向结构域序列来定义，并且技术人员将了解，可将给定靶向结构域序列并入任何适宜gRNA中，包括单分子或嵌合gRNA，或包括一种或多种化学修饰和/或序列修饰(取代、另外的核苷酸、截短等)的gRNA。因此，为了便于呈现本披露，gRNA可仅在其靶向结构域序列方面加以描述。

更通常地，技术人员将了解，本披露的一些方面涉及可以使用多种RNA指导的核酸酶实施的***、方法和组合物。为此，除非另外指定，否则术语gRNA应理解为不仅涵盖那些与Cas9或Cpf1的特定种类相容的gRNA，还涵盖可以用于任何RNA指导的核酸酶的任何适宜gRNA。通过说明，在某些实施例中，术语gRNA可以包括与存在于2类CRISPR***(例如II型或V型或CRISPR***)中的任何RNA指导的核酸酶或从其衍生或改适的RNA指导的核酸酶一起使用的gRNA。

gRNA设计

先前已经描述了用于靶序列的选择和验证以及脱靶分析的方法(参见，例如，Mali2013；Hsu 2013；Fu 2014；Heigwer 2014；Bae 2014；Xiao 2014)中。这些参考文献中的每一篇都是通过引用并入本文。作为非限制性实例，gRNA设计可包括使用软件工具来优化对应于使用者的靶序列的潜在靶序列的选择，例如以使全基因组的总脱靶活性降至最低。虽然脱靶活性不限于切割，但每个脱靶序列处的切割效率可以例如使用实验衍生的加权方案来预测。这些和其他指导选择方法详细描述于Maeder和Cotta-Ramusino中。

设计为靶向破坏CCAAT盒靶区域的gRNA的靶向结构域序列包括但不限于SEQ IDNO:1002。在某些实施例中，包含SEQ ID NO:1002所示序列的gRNA可以与Cpf1蛋白或经修饰的Cpf1蛋白复合，以在CCAAT盒靶区域中产生改变。在某些实施例中，可以将包含表9、表12或表13所示的任何Cpf1 gRNA的gRNA与Cpf1蛋白或经修饰的Cpf1蛋白复合以形成RNP(“gRNA-Cpf1-RNP”)以在CCAAT盒靶区域中产生改变。在某些实施例中，经修饰的Cpf1蛋白可以是His-AsCpf1-nNLS(SEQ ID NO:1000)或His-AsCpf1-sNLS-sNLS(SEQ ID NO:1001)。在某些实施例中，gRNA-Cpf1-RNP的Cpf1分子可以由SEQ ID NO:1000、1001、1008-1018、1032、1035-39(Cpf1多肽序列)或SEQ ID NO:1019-1021所示的序列编码(Cpf1多核苷酸序列)。

gRNA修饰

gRNA的活性、稳定性或其他特征可以通过并入某些修饰来改变。作为一个实例，瞬时表达或递送的核酸可能易于被例如细胞核酸酶降解。因此，本文所述的gRNA可以含有引入针对核酸酶的稳定性的一个或多个经修饰核苷或核苷酸。虽然不希望受理论束缚，但还应相信，本文所述的某些经修饰gRNA在引入细胞中时可展现降低的先天性免疫反应。本领域技术人员将了解一般在细胞(例如哺乳动物细胞)中响应外源核酸(尤其那些病毒或细菌来源的核酸)观察到的某些细胞反应。此类反应可以包括诱导细胞因子表达和释放以及细胞死亡，可通过本文所呈现的修饰来减少或完全消除。

这个章节中讨论的某些示例性修饰可以包括于gRNA序列内的任一位置，包括但不限于在5’末端处或5’末端附近(例如，在5’末端的1-10、1-5或1-2个核苷酸内)和/或在3’末端处或3’末端附近(例如，在3’末端的1-10、1-5或1-2个核苷酸内)。在一些情形中，修饰定位于功能基序内，例如Cas9 gRNA的重复-抗重复双链体、Cas9或Cpf1 gRNA的茎环结构和/或gRNA的靶向结构域。

作为一个实例，gRNA的5’末端可以包括真核mRNA帽结构或帽类似物(例如，G(5’)ppp(5’)G帽类似物、m7G(5’)ppp(5’)G帽类似物或3’-O-Me-m7G(5’)ppp(5’)G抗反向帽类似物(ARCA))，如下所示：

该帽或帽类似物可以在gRNA的化学合成或者体外转录期间被包括。

按类似方式，gRNA的5’末端可能缺少5’三磷酸基团。例如，体外转录的gRNA可能经磷酸酶处理(例如，使用小牛肠碱性磷酸酶)以移除5’三磷酸基团。

另一常见修饰包括在gRNA的3’末端添加多个(例如，1-10、10-20或25-200个)腺嘌呤(A)残基，称为polyA段。可在化学合成期间，在体外转录后使用多聚腺苷聚合酶(例如，大肠杆菌(E.coli)多聚(A)聚合酶)，或在体内借助多聚腺苷酸化序列，将polyA段添加至gRNA，如Maeder中所述。

应注意，本文所述的修饰可以按任一适宜方式组合，例如不论是在体内从DNA载体转录的gRNA，或者是在体外转录的gRNA，都可以包括5’帽结构或帽类似物中的一种或两种以及3’polyA段。

指导RNA可以在3’末端U核糖处经修饰。例如，U核糖的两个末端羟基可以被氧化为醛基，并且伴随核糖环的打开，以提供如下所示的经修饰核苷：

其中“U”可以是未经修饰或经修饰的尿苷。

3’末端U核糖可以经如下所示的2’3’环状磷酸酯修饰：

其中“U”可以是未经修饰或经修饰的尿苷。

指导RNA可以例如通过并入本文所述的一个或多个经修饰核苷酸而含有可以针对降解稳定的3’核苷酸。在某些实施例中，尿苷可以由经修饰尿苷(例如，5-(2-氨基)丙基尿苷和5-溴代尿苷)或由本文所述的任何经修饰尿苷替代；腺苷和鸟苷可以由经修饰腺苷和鸟苷(例如，在8位处具有修饰，例如8-溴代鸟苷)或由本文所述的任何经修饰腺苷和鸟苷替代。

在某些实施例中，可以将糖修饰的核糖核苷酸并入gRNA中，例如，其中2’OH-基团由选自以下的基团替代：H，-OR，-R(其中R可以是例如烷基、环烷基、芳基、芳烷基、杂芳基或糖)，卤代，-SH，-SR(其中R可以是例如烷基、环烷基、芳基、芳烷基、杂芳基或糖)，氨基(其中氨基可以是例如NH₂；烷基氨基、二烷基氨基、杂环基、芳基氨基、二芳基氨基、杂芳基氨基、二杂芳基氨基或氨基酸)；或氰基(-CN)。在某些实施例中，磷酸骨架可以如本文所述经修饰，例如经硫代磷酸酯(PhTx)基团修饰。在某些实施例中，gRNA的一个或多个核苷酸可以各自独立地是经修饰或未经修饰的核苷酸，包括但不限于2’-糖修饰的，例如2’-O-甲基、2’-O-甲氧基乙基，或2’-氟修饰的，包括例如，2’-F或2’-O-甲基腺苷(A)、2’-F或2’-O-甲基胞苷(C)、2’-F或2’-O-甲基尿苷(U)、2’-F或2’-O-甲基胸苷(T)、2’-F或2’-O-甲基鸟苷(G)、2’-O-甲氧基乙基-5-甲基尿苷(Teo)、2’-O-甲氧基乙基腺苷(Aeo)、2’-O-甲氧基乙基-5-甲基胞苷(m5Ceo)及其任何组合。

指导RNA还可以包括“锁定”核酸(LNA)，其中2’OH-基团可以例如通过C1-6亚烷基C1-6亚杂烷基桥连接至同一核糖的4’碳。可使用任何适宜部分来提供此类桥，包括但不限于亚甲基、亚丙基、醚或氨基桥；O-氨基(其中氨基可以是例如NH₂；烷基氨基、二烷基氨基、杂环基、芳基氨基、二芳基氨基、杂芳基氨基或二杂芳基氨基、乙二胺或聚氨基)和氨基烷氧基或O(CH₂)_n-氨基(其中氨基可以是例如NH₂；烷基氨基、二烷基氨基、杂环基、芳基氨基、二芳基氨基、杂芳基氨基或二杂芳基氨基、乙二胺或聚氨基)。

在某些实施例中，gRNA可以包括经修饰核苷酸，其为多环状(例如，三环；和“解锁”形式，如二醇核酸(GNA)(例如，R-GNA或S-GNA，其中核糖被附接至磷酸二酯键的二醇单元置换)，或苏糖核酸(TNA，其中核糖被α-L-苏呋喃糖基(threofuranosyl)-(3’→2’)置换)。

通常，gRNA包括糖基核糖，其为具有氧的5元环。示例性的经修饰gRNA可以包括但不限于核糖中氧的替代(例如，经硫(S)、硒(Se)或亚烷基，例如亚甲基或亚乙基)；双键的添加(例如，以用环戊烯基或环己烯基替代核糖)；核糖的缩环(例如，以形成环丁烷或氧杂环丁烷的4元环)；核糖的扩环(例如，以形成具有另外的碳或杂原子的6元环或7元环，例如脱水己糖醇、阿卓糖醇、甘露醇、环己烷基、环己烯基以及吗啉代，其也具有氨基磷酸酯骨架)。尽管大多数的糖类似物改变位于2’位，但其他位点也适于修饰，包括4’位。在某些实施例中，gRNA包含4’-S、4’-Se或4’-C-氨基甲基-2’-O-Me修饰。

在某些实施例中，可以将脱氮核苷酸(例如，7-脱氮-腺苷)并入gRNA中。在某些实施例中，可以将O-烷基化和N-烷基化核苷酸(例如，N6-甲基腺苷)并入gRNA中。在某些实施例中，gRNA分子中的一个或多个或所有核苷酸是脱氧核苷酸。

在某些实施例中，本文使用的gRNA可以是经修饰的或未修饰的gRNA。在某些实施例中，gRNA可以包括一个或多个修饰。在某些实施例中，一个或多个修饰可包括硫代磷酸酯连接修饰、二硫代磷酸酯(PS2)连接修饰、2’-O-甲基修饰或其组合。在某些实施例中，一个或多个修饰可以在gRNA的5’末端、在gRNA的3’末端或其组合。

在某些实施例中，gRNA修饰可包含一个或多个二硫代磷酸酯(PS2)键修饰。

在一些实施例中，本文使用的gRNA包括一个或多个或一段脱氧核糖核酸(DNA)碱基，在本文中也称为“DNA延伸”。在一些实施例中，本文使用的gRNA在gRNA的5’末端、gRNA的3’末端或其组合处包括DNA延伸。在某些实施例中，DNA延伸可以是1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99或100个DNA碱基长。例如，在某些实施例中，DNA延伸可以是1、2、3、4、5、10、15、20或25个DNA碱基长。在某些实施例中，DNA延伸可以包括一个或多个选自腺嘌呤(A)、鸟嘌呤(G)、胞嘧啶(C)或胸腺嘧啶(T)的DNA碱基。在某些实施例中，DNA延伸包括相同的DNA碱基。例如，DNA延伸可以包括一段腺嘌呤(A)碱基。在某些实施例中，DNA延伸可以包括一段胸腺嘧啶(T)碱基。在某些实施例中，DNA延伸包括不同DNA碱基的组合。在某些实施例中，DNA延伸可包含表18所示的序列。例如，DNA延伸可包含SEQ ID NO:1235-1250所示的序列。在某些实施例中，本文使用的gRNA包括DNA延伸以及一个或多个硫代磷酸酯键修饰、一个或多个二硫代磷酸酯(PS2)键修饰、一个或多个2’-O-甲基修饰或其组合。在某些实施例中，一个或多个修饰可以在gRNA的5’末端、在gRNA的3’末端或其组合。在某些实施例中，包括DNA延伸的gRNA可包含表13所示的包括DNA延伸的序列。在一个特定的实施例中，包括DNA延伸的gRNA可包含SEQ ID NO:1051所示的序列。在某些实施例中，包括DNA延伸的gRNA可包含选自下组的序列，该组由以下组成：SEQ ID NO:1046-1060、1067、1068、1074、1075、1078、1081-1084、1086-1087、1089-1090、1092-1093、1098-1102和1106。不希望被理论所束缚，可以预期的是，本文中可以使用任何DNA延伸，只要它不与gRNA靶向的靶核酸杂交并且还相对于不包含此类DNA延伸的gRNA在靶核酸位点处表现出编辑增加。

在一些实施例中，本文使用的gRNA包括一个或多个或一段核糖核酸(RNA)碱基，在本文中也称为“RNA延伸”。在一些实施例中，本文使用的gRNA在gRNA的5’末端、gRNA的3’末端或其组合处包括RNA延伸。在某些实施例中，RNA延伸可以是1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99或100个RNA碱基长。例如，在某些实施例中，RNA延伸可以是1、2、3、4、5、10、15、20或25个RNA碱基长。在某些实施例中，RNA延伸可以包括一个或多个选自腺嘌呤(rA)、鸟嘌呤(rG)、胞嘧啶(rC)或尿嘧啶(rU)的RNA碱基，其中“r”代表RNA，2’-羟基。在某些实施例中，RNA延伸包括相同的RNA碱基。例如，RNA延伸可以包括一段腺嘌呤(rA)碱基。在某些实施例中，RNA延伸包括不同RNA碱基的组合。在某些实施例中，RNA延伸可包含表18所示的序列。例如，RNA延伸可包含1231-1234、1251-1253所示的序列。在某些实施例中，本文使用的gRNA包括RNA延伸以及一个或多个硫代磷酸酯键修饰、一个或多个二硫代磷酸酯(PS2)键修饰、一个或多个2’-O-甲基修饰或其组合。在某些实施例中，一个或多个修饰可以在gRNA的5’末端、在gRNA的3’末端或其组合。在某些实施例中，包括RNA延伸的gRNA可包含表13所示的包括RNA延伸的序列。在gRNA的5’末端包含RNA延伸的gRNA可包含选自由SEQ ID NO:1042-1045、1103-1105组成的组的序列。在gRNA的3’末端包括RNA延伸的gRNA可包含选自由SEQ ID NO:1070-1075、1079、1081、1098-1100组成的组的序列。

预期本文中使用的gRNA也可以包括RNA延伸和DNA延伸。在某些实施例中，RNA延伸和DNA延伸两者可以都在gRNA的5’末端、gRNA的3’末端或其组合处。在某些实施例中，RNA延伸在gRNA的5’末端，并且DNA延伸在gRNA的3’末端。在某些实施例中，RNA延伸在gRNA的3’端，并且DNA延伸在gRNA的5’端。

在一些实施例中，将在3’末端包括硫代磷酸酯修饰以及在5’末端包括DNA延伸的gRNA与RNA指导的核酸酶例如Cpf1复合以形成RNP，然后将所述RNP用于离体(即在此类细胞来源的受试者体外)编辑造血干细胞(HSC)或CD34+细胞的HBG基因座。

本文所用的gRNA的实例包括SEQ ID NO:1051所示的序列。

失活gRNA分子

根据本披露的失活指导RNA(dgRNA)分子包括包含降低的、低的或不可检测的切割活性的失活指导RNA分子。与活性指导RNA的靶向结构域序列相比，失活指导RNA的靶向结构域序列的长度短1、2、3、4、5、6、7、8、9或10个核苷酸。在某些实施例中，失活指导RNA分子可包含靶向结构域，其包含15个或更少核苷酸的长度、14个或更少核苷酸的长度、13个或更少核苷酸的长度、12个或更少核苷酸的长度或11个或更少核苷酸的长度。在一些实施例中，对失活指导RNA进行配置，使得它们不提供RNA指导的核酸酶切割事件。可以通过去除gRNA靶向结构域序列的5’末端来生成失活指导RNA，从而导致截短的靶向结构域序列。例如，如果配置为提供切割事件(即，长度为17个核苷酸或更多)的gRNA序列具有长度为20个核苷酸的靶向结构域序列，则可以通过从gRNA序列的5’末端去除5个核苷酸来产生失活指导RNA。例如，本文中使用的dgRNA可包含例如，表8、9或13所示的靶向结构域，该靶向结构域已从gRNA序列的5’末端截短并且长度为15个核苷酸或更少。在某些实施例中，dgRNA可以被配置为结合(或缔合)在有待编辑的靶区域(例如，CCAAT盒靶区域、13nt靶区域、近端HBG1/2启动子靶序列)内或近端的核酸序列。在某些实施例中，“近端”可表示靶区域(例如，CCAAT盒靶区域、13nt靶区域、近端HBG1/2启动子靶序列)的10、25、50、100或200个核苷酸内的区域。在某些实施例中，失活指导RNA未配置为将外源反式作用因子募集至靶区域。在某些实施例中，dgRNA被配置为使得当与RNA指导的核酸酶复合时，其不提供DNA切割事件。技术人员将理解，可以将失活指导RNA分子设计为包含与靶核酸中靶区域近端或内的区域互补的靶向结构域。在某些实施例中，失活指导RNA包含与双链DNA的转录链或非转录链互补的靶向结构域序列。如本文在“gRNA修饰”部分中针对指导RNA所描述的，本文的dgRNA可以在dgRNA的5’和3’末端包括修饰。例如，在某些实施例中，失活指导RNA可以在RNA的5’末端包括抗反向帽类似物(ARCA)。在某些实施例中，dgRNA可在3’末端包括聚A尾。

在某些实施例中，将失活指导RNA与本文披露的基因组编辑***和方法一起使用可增加活性指导RNA的总编辑水平。在某些实施例中，将失活指导RNA与本文披露的基因组编辑***及其方法一起使用可增加缺失的频率。在某些实施例中，所述缺失可以从活性指导RNA的剪切位点向失活指导RNA结合位点延伸。以此方式，失活指导RNA可以改变活性指导RNA的方向性，并使编辑朝向期望的靶区域定向。

如本文所用，术语“失活gRNA”和“截短的gRNA”可互换使用。

RNA指导的核酸酶

根据本披露的RNA指导的核酸酶包括但不限于天然存在的2类的CRISPR核酸酶，如Cpf1和Cas9，以及由其衍生或获得的其他核酸酶。还显示出某些RNA指导的核酸酶，例如Cas9，也具有解旋酶活性，使它们能够解旋核酸。在某些实施例中，根据本披露的RNA指导的解旋酶可以是本文所述的和上文标题“RNA指导的核酸酶”部分中所述的任何RNA核酸酶。在某些实施例中，RNA指导的核酸酶未配置为将外源反式作用因子募集到靶区域。在某些实施例中，RNA指导的解旋酶可以是被配置为缺乏核酸酶活性的RNA指导的核酸酶。例如，在某些实施例中，RNA指导的解旋酶可以是缺乏核酸酶活性但仍保留其解旋酶活性的催化失活性RNA指导的核酸酶。在某些实施例中，可将RNA指导的核酸酶突变以消除其核酸酶活性(例如，失活Cas9)，从而产生无法切割核酸但仍可解旋DNA的催化失活性RNA指导的核酸酶。在某些实施例中，RNA指导的解旋酶可以与本文所述的任何失活指导RNA复合。例如，催化活性的RNA指导的解旋酶(例如，Cas9或Cpf1)可以与失活指导RNA形成RNP复合物，从而导致催化失活性死RNP(dRNP)。在某些实施例中，催化失活性RNA指导的解旋酶(例如，失活Cas9)和失活指导RNA可以形成dRNP。这些dRNP尽管不能提供切割事件，但仍保留其解旋酶活性，这对于解旋核酸很重要。

在功能方面，RNA指导的核酸酶被定义为如下的那些核酸酶：(a)与gRNA相互作用(例如复合)；和(b)与gRNA一起缔合或任选地切割或修饰DNA的靶区域，该靶区域包括(i)与gRNA的靶向结构域互补的序列，以及任选地，(ii)称为“原型间隔子邻近基序”或“PAM”的另一序列，其更详细地描述于下文中。在说明以下实例时，RNA指导的核酸酶可以在广义上依据其PAM特异性和切割活性来定义，即使在共享相同PAM特异性或切割活性的个别RNA指导的核酸酶之间可能存在变异。本领域技术人员将理解，本披露的一些方面涉及可以使用具有某种PAM特异性和/或切割活性的任何适宜RNA指导的核酸酶实施的***、方法和组合物。为此，除非另外指定，否则术语RNA指导的核酸酶应理解为通用术语，并不限于RNA指导的核酸酶的任何特定类型(例如，Cas9与Cpf1)、物种(例如，化脓链球菌与金黄色葡萄球菌)或变异(例如，全长与截短或***；天然存在的PAM特异性与工程改造的PAM特异性等)。例如，在某些实施例中，RNA指导的核酸酶可以是Cas-Φ(Pausch2020)。

多种RNA指导的核酸酶可能需要PAM与原型间隔子之间的不同顺序关系。通常，Cas9识别原型间隔子3’的PAM序列。另一方面，Cpf1通常识别原型间隔子5’的PAM序列。

除了识别PAM和原型间隔子的特定顺序定向以外，RNA指导的核酸酶还可以识别特定PAM序列。例如，金黄色葡萄球菌Cas9识别NNGRRT或NNGRRV的PAM序列，其中N个残基紧靠由gRNA靶向结构域所识别区域的3’。酿脓链球菌Cas9识别NGG PAM序列。并且新凶手弗朗西斯菌(F.novicida)Cpf1识别TTN PAM序列。已经识别了多种RNA指导的核酸酶的PAM序列，并且Shmakov 2015描述了用于识别新的PAM序列的策略。还应注意，工程改造的RNA指导的核酸酶可具有与参考分子的PAM特异性不同的PAM特异性(例如，在工程改造的RNA指导的核酸酶的情形中，参考分子可以是衍生出RNA指导的核酸酶的天然存在的变体，或与工程改造的RNA指导的核酸酶具有最大氨基酸序列同源性的天然存在的变体)。可以根据本文的实施例使用的PAM的实例包括但不限于SEQ ID NO:199-205所示的序列。

除了其PAM特异性以外，RNA指导的核酸酶可通过其DNA切割活性来表征：天然存在的RNA指导的核酸酶典型地在靶核酸中形成DSB，但是已产生仅生成SSB的工程改造的变体(如以上讨论和Ran和Hsu 2013中讨论，通过引用并入本文)，或完全不剪切的工程改造的变体。

Cas9

已确定化脓链球菌Cas9的晶体结构(Jinek 2014)以及与单分子指导RNA和靶DNA复合的金黄色葡萄球菌Cas9的晶体结构(Nishimasu 2014；Anders2014；和Nishimasu2015)。

天然存在的Cas9蛋白包含两个叶：识别(REC)叶和核酸酶(NUC)叶；每一叶包含特定的结构和/或功能域。REC叶包含富精氨酸桥螺旋(BH)结构域，以及至少一个REC结构域(例如REC1结构域和任选地REC2结构域)。REC叶与其他已知蛋白不共享结构相似性，指示其是独特的功能域。不希望受限于任何理论，突变分析提出BH和REC域的特殊功能作用：BH结构域显现在gRNA:DNA识别中发挥作用，而REC结构域被认为与gRNA的重复:抗重复双链体相互作用并介导Cas9/gRNA复合物的形成。

NUC叶包含RuvC结构域、HNH结构域和PAM相互作用(PI)结构域。RuvC结构域与逆转录病毒整合酶超家族成员共享结构相似性，并且切割靶核酸的非互补(即底部)链。其可从两个或更多个***RuvC基序(例如酿脓链球菌和金黄色葡萄球菌中的RuvC I、RuvCII和RuvCIII)形成。同时，HNH结构域在结构上与HNN内切核酸酶基序类似，并且切割靶核酸的互补(即顶部)链。顾名思义，PI结构域有助于PAM特异性。可以根据本文的实施例使用的编码Cas9 RuvC样和Cas9 HNH样结构域的多肽序列的实例在SEQ ID NO:15-23、52-123(RuvC样结构域)和SEQ ID NO:24-28、124-198(HNH样结构域)中示出。

虽然Cas9的某些功能与上文所述的特定结构域相关(但不一定完全取决于所述结构域)，但这些和其他功能可以由其他Cas9结构域或任一叶上的多个结构域来介导或影响。例如，在化脓链球菌Cas9中，如在Nishimasu 2014中所述，gRNA的重复:抗重复双链体落在REC叶与NUC叶之间的沟中，并且双链体中的核苷酸与BH、PI和REC结构域中的氨基酸相互作用。第一茎环结构中的一些核苷酸也与多个结构域(PI、BH和REC1)中的氨基酸相互作用，第二和第三茎环(RuvC和PI结构域)中的一些核苷酸也是如此。可以根据本文的实施例使用的编码Cas9分子的多肽序列的实例在SEQ ID NO:1-2、4-6、12和14中示出。

Cpf1

与crRNA和包括TTTN PAM序列的双链(ds)DNA靶复合的氨基酸球菌属(Acidaminococcus sp.)Cpf1的晶体结构已经由Yamano 2016(通过引用并入本文)解析。Cpf1像Cas9一样有两个叶：REC(识别)叶和NUC(核酸酶)叶。REC叶包括REC1和REC2结构域，其缺少与任何已知蛋白质结构的相似性。同时，NUC叶包括三个RuvC结构域(RuvC-I、-II和-III)和BH结构域。然而，与Cas9相反，Cpf1 REC叶缺少HNH结构域，并且包括同样缺少与已知蛋白质结构的相似性的其他结构域：结构上独特的PI结构域、三个楔形(WED)结构域(WED-I、-II和-III)和核酸酶(Nuc)结构域。

虽然Cas9和Cpf1共享结构和功能的相似性，但应了解，某些Cpf1活性是由与任何Cas9域不同的结构域介导的。例如，靶DNA的互补链的切割似乎是由Nuc结构域介导，所述Nuc结构域在顺序上和空间上与Cas9的HNH结构域不同。另外，Cpf1 gRNA的非靶向部分(把手)采用假结(pseudoknot)结构，而不是Cas9gRNA中由重复:抗重复双链体形成的茎环结构。

在某些实施例中，Cpf1蛋白可以是经修饰的Cpf1蛋白。在某些实施例中，经修饰的Cpf1蛋白可包括一个或多个修饰。在某些实施例中，修饰可以是但不限于Cpf1核苷酸序列或Cpf1氨基酸序列中的一个或多个突变、一个或多个另外的序列例如His标签或核定位信号(NLS)或其组合。在某些实施例中，经修饰的Cpf1在本文中也可以称为Cpf1变体。

在某些实施例中，Cpf1蛋白可衍生自选自由以下组成的组的Cpf1蛋白：氨基酸球菌属菌株BV3L6 Cpf1蛋白(AsCpf1)、毛螺菌科细菌ND2006 Cpf1蛋白(LbCpf1)和毛螺菌科细菌MA2020(Lb2Cpf1)。在某些实施例中，Cpf1蛋白可包含选自由以下组成的组的序列：SEQID NO:1016-1018，其分别具有SEQ ID NO:1019-1021的密码子优化的核酸序列。

在某些实施例中，经修饰的Cpf1蛋白可包含核定位信号(NLS)。例如，但并非进行限制，可用于结合本文披露的方法和组合物的NLS序列将包含能够促进蛋白质导入细胞核的氨基酸序列。可用于结合本文披露的方法和组合物的NLS序列为本领域中已知。此类NLS序列的实例包括具有如下氨基酸序列的核质蛋白NLS：KRPAATKKAGQAKKKK(SEQ ID NO:1006)和具有氨基酸序列PKKKRKV(SEQ ID NO:1007)的猿猴病毒40“SV40”NLS。

在某些实施例中，修饰的Cpf1蛋白的NLS序列定位于Cpf1蛋白序列的C末端处或定位在Cpf1蛋白序列的C末端附近。例如，但并非进行限制，修饰的Cpf1蛋白可以选自以下:His-AsCpf1-nNLS(SEQ ID NO:1000)；His-AsCpf1-sNLS(SEQ ID NO:1008)和His-AsCpf1-sNLS-sNLS(SEQ ID NO:1001)，其中“His”是指六组氨酸纯化序列，“AsCpf1”是指氨基酸球菌属物种Cpf1蛋白序列，“nNLS”是指核质蛋白NLS，并且“sNLS”是指SV40 NLS。NLS序列的同一性和C末端位置的另外的排列(例如附加两个或更多个nNLS序列或nNLS和sNLS序列(或其他NLS序列)的组合以及有和没有纯化序列(例如六个组氨酸序列)的序列)在本披露的主题范围内。

在某些实施例中，修饰的Cpf1蛋白的NLS序列可以定位于Cpf1蛋白序列的N末端处或定位在Cpf1蛋白序列的N末端附近。例如，但并非进行限制，经修饰的Cpf1蛋白可以选自以下：His-sNLS-AsCpf1(SEQ ID NO:1009)、His-sNLS-sNLS-AsCpf1(SEQ ID NO:1010)和sNLS-sNLS-AsCpf1(SEQ ID NO:1011)。NLS序列的同一性和N末端位置的另外的排列(例如附加两个或更多个nNLS序列或nNLS和sNLS序列(或其他NLS序列)的组合以及有和没有纯化序列(例如六个组氨酸序列)的序列)在本披露的主题范围内。

在某些实施例中，经修饰的Cpf1蛋白可包含定位于Cpf1蛋白序列的N末端和C末端处或定位在Cpf1蛋白序列的N末端和C末端附近的NLS序列。例如，但并非进行限制，经修饰的Cpf1蛋白可以选自以下：His-sNLS-AsCpf1-sNLS(SEQ ID NO:1012)和His-sNLS-sNLS-AsCpf1-sNLS-sNLS(SEQ ID NO:1013)。NLS序列的同一性和N末端/C末端位置的另外的排列(例如附加两个或更多个nNLS序列或nNLS和sNLS序列(或其他NLS序列)的组合至N末端/C末端位置，以及有和没有纯化序列(例如六组氨酸序列))的序列在本披露的主题范围内。

在某些实施例中，修饰的Cpf1蛋白可包含Cpf1蛋白序列的一个或多个半胱氨酸残基处的改变(例如，缺失或取代)。例如，但并非进行限制，经修饰的Cpf1蛋白可包含在选自由以下组成的组的位置处的改变：C65、C205、C334、C379、C608、C674、C1025以及C1248。在某些实施例中，经修饰的Cpf1蛋白可包含一个或多个半胱氨酸残基取代丝氨酸或丙氨酸。在某些实施例中，经修饰的Cpf1蛋白可包含选自由以下组成的组的改变：C65S、C205S、C334S、C379S、C608S、C674S、C1025S以及C1248S。在某些实施例中，经修饰的Cpf1蛋白可包含选自由以下组成的组的改变：C65A、C205A、C334A、C379A、C608A、C674A、C1025A以及C1248A。在某些实施例中，经修饰的Cpf1蛋白可包含在位置C334和C674或C334、C379、和C674处的改变。在某些实施例中，经修饰的Cpf1蛋白可包含以下改变：C334S和C674S，或C334S、C379S以及C674S。在某些实施例中，经修饰的Cpf1蛋白可包含以下改变：C334A和C674A，或C334A、C379A以及C674A。在某些实施例中，经修饰的Cpf1蛋白可包含一个或多个半胱氨酸残基改变以及一个或多个NLS序列(例如，His-AsCpf1-nNLS Cys-less(SEQ ID NO:1014)或His-AsCpf1-nNLS Cys-low(SEQ ID NO:1015))的引入。在各种实施例中，在一个或多个半胱氨酸残基中包含缺失或取代的Cpf1蛋白展现出减少的聚集。

在某些实施例中，本领域已知的其他经修饰的Cpf1蛋白可与本文所述的方法和***一起使用。例如，在某些实施例中，经修饰的Cpf1可以是含有突变S542R/K548V/N552R(“Cpf1 RVR”)的Cpf1。Cpf1 RVR已显示切割具有TATV PAM的靶位点。在某些实施例中，经修饰的Cpf1可以是含有突变S542R/K607R(“Cpf1RR”)的Cpf1。Cpf1 RR已显示切割具有TYCV/CCCC PAM的靶位点。

在一些实施例中，本文使用了Cpf1变体，其中该Cpf1变体包含AsCpf1(氨基酸球菌属物种BV3L6)的选自由以下组成的组的一个或多个残基处的突变：11、12、13、14、15、16、17、34、36、39、40、43、46、47、50、54、57、58、111、126、127、128、129、130、131、132、133、134、135、136、157、158、159、160、161、162、163、164、165、166、167、168、169、170、171、172、173、174、175、176、177、178、532、533、534、535、536、537、538、539、540、541、542、543、544、545、546、547、548、549、550、551、552、553、554、555、556、565、566、567、568、569、570、571、572、573、574、575、592、593、594、595、596、597、598、599、600、601、602、603、604、605、606、607、608、609、610、611、612、613、614、615、616、617、618、619、620、626、627、628、629、630、631、632、633、634、635、636、637、638、642、643、644、645、646、647、648、649、651、652、653、654、655、656、676、679、680、682、683、684、685、686、687、688、689、690、691、692、693、707、711、714、715、716、717、718、719、720、721、722、739、765、768、769、773、777、778、779、780、781、782、783、784、785、786、870、871、872、873、874、875、876、877、878、879、880、881、882、883、884或1048或AsCpf1直向同源物、同源物或变体的相应位置。

在某些实施例中，本文使用的Cpf1变体可以包括Zhang等人的国际公开号WO2017/184768 A1(“768公开”(其通过引用并入本文))中描述的任何Cpf1蛋白。

在某些实施例中，本文中使用的经修饰的Cpf1蛋白(也称为Cpf1变体)可以由SEQID NO:1000、1001、1008-1018、1032、1035-39、1094-1097、1107-09(Cpf1多肽序列)或SEQID NO:1019-1021、1110-17(Cpf1多核苷酸序列)所示的任何序列编码。表14列出了示例性的Cpf1变体氨基酸和核苷酸序列。这些序列在图40中示出，其中详细说明了六组氨酸序列(带下划线的字母)和NLS序列(粗体字母)的位置。NLS序列的同一性和N末端/C末端位置的另外的排列(例如附加两个或更多个nNLS序列或nNLS和sNLS序列(或其他NLS序列)的组合至N末端/C末端位置，以及有和没有纯化序列(例如六组氨酸序列))的序列在本披露的主题范围内。

在某些实施例中，本文披露的任何Cpf1蛋白或经修饰的Cpf1蛋白可与包含SEQ IDNO 1002和/或1004所示的靶向结构域的一种或多种gRNA复合，以改变CCAAT盒靶区域。在某些实施例中，本文披露的任何Cpf1蛋白或经修饰的Cpf1蛋白可以与包含表12或表13所示的序列的一种或多种gRNA复合。在某些实施例中，经修饰的Cpf1蛋白可以是His-AsCpf1-nNLS(SEQ ID NO:1000)或His-AsCpf1-sNLS-sNLS(SEQ ID NO:1001)。在某些实施例中，本文中使用的经修饰的Cpf1蛋白可以由SEQ ID NO:1000、1001、1008-1018、1032、1035-39、1094-1097、1107-09(Cpf1多肽序列)或SEQ ID NO:1019-1021、1110-17(Cpf1多核苷酸序列)所示的任何序列编码。在某些实施例中，经修饰的Cpf1蛋白可包含SEQ ID NO:1097所示的序列。

在某些实施例中，经修饰的Cpf1蛋白可以包括Kleinstiver 2019中所述的Cpf1变体。例如不限于，在某些实施例中，经修饰的Cpf1蛋白可以是enAsCas12a。在某些实施例中，经修饰的Cpf1蛋白可以用TTTV PAM切割靶位点。在某些实施例中，经修饰的Cpf1蛋白可以用NWYN PAM切割靶位点。

RNA指导的核酸酶的修饰

上述RNA指导的核酸酶具有可用于多种应用的活性和特性，但技术人员将了解，RNA指导的核酸酶在某些情况下也可以经修饰，以改变切割活性、PAM特异性或其他结构或功能特征。

首先参看改变切割活性的修饰，上文已描述降低或消除NUC叶内结构域活性的突变。可在RuvC结构域中、在Cas9 HNH结构域中或在Cpf1 Nuc结构域中进行的示例性突变描述于Ran&Hsu 2013和Yamano 2016中，以及Cotta-Ramusino中。通常，降低或消除两个核酸酶结构域之一中的活性的突变导致具有切口酶活性的RNA指导的核酸酶，但应注意，切口酶活性的类型根据哪个结构域失活而变化。作为一个实例，Cas9的RuvC结构域的失活将导致切割如下所示的互补或顶部链的切口酶(其中C表示切割位点)。

另一方面，Cas9 HNH结构域的失活导致切割底部或非互补链的切口酶。

对于化脓链球菌(Kleinstiver 2015a)和金黄色葡萄球菌(Kleinstiver2015b)，相对于天然存在的Cas9参考分子的PAM特异性的修饰已经由Kleinstiver等人描述。Kleinstiver等人还描述了改进Cas9的靶向保真性的修饰(Kleinstiver 2016)。Kleinstiver等人还描述了提供增加的活性和改进的靶向范围(Kleinstiver 2019)的Cpf1修饰。这些参考文献中的每一篇都是通过引用并入本文。

如Zetsche 2015和Fine 2015(均通过引用并入本文)所述，RNA指导的核酸酶已分为两个或更多个部分。

在某些实施例中，RNA指导的核酸酶可以是尺寸经优化的或截短的，例如通过一个或多个缺失来进行，该缺失减小核酸酶的尺寸，同时仍保留gRNA关联、靶标和PAM识别以及切割活性。在某些实施例中，RNA指导的核酸酶以共价或非共价方式，任选地通过接头结合至另一多肽、核苷酸或其他结构。示例性的结合的核酸酶和接头由Guilinger 2014(通过引用并入本文用于所有目的)描述。

RNA指导的核酸酶还任选地包括标签，例如但不限于核定位信号，以促进RNA指导的核酸酶蛋白移动至细胞核中。在某些实施例中，RNA指导的核酸酶可以并入C末端和/或N末端核定位信号。核定位序列是本领域中已知的并且描述于Maeder和其他文献中。

前述修饰列表旨在具有示例性，并且技术人员根据本披露将了解，在某些应用中，其他修饰可以是可能的或期望的。因此，为简洁起见，参考特定RNA指导的核酸酶呈现本披露的示例性***、方法和组合物，但应理解，所用RNA指导的核酸酶可以不改变其操作原理的方式经修饰。此类修饰在本披露的范围内。

编码RNA指导的核酸酶的核酸

本文提供编码RNA指导的核酸酶(例如Cas9、Cpf1或其功能片段)的核酸。先前已描述编码RNA指导的核酸酶的示例性核酸(参见，例如，Cong 2013；Wang 2013；Mali 2013；Jinek 2012)。

在一些情形中，编码RNA指导的核酸酶的核酸可以是合成的核酸序列。例如，合成核酸分子可以经化学修饰。在某些实施例中，编码RNA指导的核酸酶的mRNA将具有一种或多种(例如，所有)以下特性：其可以被加帽；多聚腺苷酸化；以及经5-甲基胞苷和/或假尿苷取代。

合成的核酸序列也可以经密码子优化，例如，至少一个非常见密码子或较不常见的密码子已经常见密码子替代。例如，合成核酸可以引导经优化信使mRNA的合成，例如，针对在哺乳动物表达***中的表达进行优化，例如，本文所述。密码子优化的Cas9编码序列的实例呈现于Cotta-Ramusino中。

另外，或可替代地，编码RNA指导的核酸酶的核酸可包含核定位序列(NLS)。核定位序列是本领域中已知的。

候选分子的功能分析

候选RNA指导的核酸酶、gRNA和其复合物可以通过本领域中已知的标准方法来评估。参见，例如Cotta-Ramusino。RNP复合物的稳定性可通过差示扫描荧光法来评估，如下文所述。

差示扫描荧光法(DSF)

包含gRNA和RNA指导的核酸酶的核糖核蛋白(RNP)复合物的热稳定性可以通过DSF来测量。DSF技术测量蛋白质的热稳定性，所述热稳定性可以在有利条件下(例如添加结合RNA分子，例如gRNA)增加。

DSF测定可以根据任何适宜方案来进行，并且可以用于任何适宜环境中，包括但不限于(a)测试不同条件(例如gRNA:RNA指导的核酸酶蛋白的不同化学计量比，不同缓冲溶液等)以鉴别RNP形成的最佳条件；和(b)测试RNA指导的核酸酶和/或gRNA的修饰(例如化学修饰、序列改变等)以鉴别改进RNP形成或稳定性的那些修饰。DSF测定的一个读出是RNP复合物的熔融温度的位移；相对高的位移表明，相对于特征为较低位移的参考RNP复合物，RNP复合物更稳定(并且可能因此具有更高活性或更有利的形成动力学、降解动力学或另一功能特征)。在作为筛选工具布置DSF测定时，可指定阈值熔融温度位移，使得输出是熔融温度位移等于或高于阈值的一种或多种RNP。例如，阈值可以是5℃-10℃(例如5°、6°、7°、8°、9°、10°)或更高，并且输出可以是一种或多种特征为熔融温度位移大于或等于该阈值的RNP。

DSF测定条件的两个非限制性实例陈述于下文中：

为了确定形成RNP复合物的最佳溶液，将水+10x SYPRO

(生命技术公司(Life Techonologies)目录号S-6650)中固定浓度(例如2μM)的Cas9分配至384孔板中。然后添加稀释于具有不同pH和盐的溶液中的等摩尔量的gRNA。在室温下孵育10分钟并短暂离心以移除任何气泡后，使用Bio-Rad CFX384^TM Real-Time System C1000 Touch^TM热循环仪和Bio-Rad CFX Manager软件运行从20℃至90℃的梯度，每10秒温度增加1℃。

第二测定由以下步骤组成：在来自上文测定1的最适缓冲液中混合不同浓度的gRNA与固定浓度(例如2μM)的Cas9，并在384孔板中孵育(例如，在室温下10分钟)。添加等体积的最适缓冲液+10x SYPRO

(生命技术公司目录号S-6650)，并且将板用

B粘合剂(MSB-1001)密封。在短暂离心以移除任何气泡后，使用Bio-RadCFX384^TMReal-Time System C1000 Touch^TM热循环仪和Bio-Rad CFX Manager软件运行从20℃至90℃的梯度，每10秒温度增加1℃。

基因组编辑策略

在本披露的各个实施例中，上述基因组编辑***用于在细胞内或从细胞获得的DNA的靶向区中产生编辑(即改变)。本文描述产生特定编辑的各种策略，并且这些策略通常是在所需修复结果、个别编辑(例如SSB或DSB)的数目和定位以及此类编辑的靶位点方面加以描述。

涉及SSB或DSB的形成的基因组编辑策略是通过修复结果来表征，这些修复结果包括：(a)所靶向区域的全部或部分的缺失；(b)所靶向区域的全部或部分中的***或其替代；或(c)所靶向区域的全部或部分的中断。此分组并不旨在具有限制性，或结合于任何具体理论或模型，而仅是为了便于呈现而提供。技术人员将了解，所列结果不会相互排斥，并且一些修复可导致其他结果。除非另外指定，否则对特定编辑策略或方法的描述不应理解为需要特定的修复结果。

所靶向区域的替代通常涉及用同源序列替代所靶向区域内现有序列的全部或部分，例如通过基因修正或基因转变来进行，两种修复结果是通过HDR路径介导。HDR是通过使用供体模板来促进，所述供体模板可以是单链或双链的，如下文更详细地描述。单链或双链模板可以是外源的，在这种情形中其将促进基因修正，或者所述模板可以是内源的(例如细胞基因组内的同源序列)，以促进基因转变。外源模板可以具有不对称悬突(即，模板中与DSB位点互补的部分可在3’或5’方向上偏移，而不是位于供体模板内的中心)，例如如Richardson 2016(通过引用并入本文)所述。在模板为单链的情况下，其可以对应于所靶向区域的互补(顶部)或非互补(底部)链。

在一些情形中，通过在所靶向区域中或周围形成一个或多个切口来促进基因转变和基因修正，如在Ran&Hsu 2013和Cotta-Ramusino中所述。在一些情形中，双重切口酶策略用于形成两个偏移SSB，其又形成具有悬突(例如5’悬突)的单一DSB。

所靶向序列的全部或部分的中断和/或缺失可通过多种修复结果来实现。作为一个实例，可通过同时产生两个或更多个侧接所靶向区域的DSB使序列缺失，然后在修复DSB时切除所述所靶向区域，如在Maeder中针对LCA10突变所述。作为另一实例，可在修复前通过以下方式产生的缺失来中断序列：形成具有单链悬突的双链断裂，之后对悬突进行核酸外切加工。

靶序列中断的一个特定子集是通过在所靶向序列内形成***缺失来介导，其中修复结果典型地是通过NHEJ路径(包括Alt-NHEJ)来介导。NHEJ由于其与***缺失突变的关联而称为“错误倾向”修复路径。然而，在一些情形中，DSB是通过NHEJ修复，并且不改变其周围的序列(所谓的“完美”或“无瘢痕”修复)；这通常需要DSB的两端完美连接。同时，插缺被认为是从DNA游离端在连接前的酶加工产生，其在一个或两个游离端的一条或两条链中添加和/或移除核苷酸。

由于游离DSB末端的酶加工可具有随机性，***缺失突变往往是可变的，沿分布发生，并且可能受到多种因素影响，包括特定靶位点、所用细胞类型、所用基因组编辑策略等。即使如此，有可能引起关于***缺失形成的有限泛化：通过修复单一DSB形成的缺失最常在1-50bp范围内，但是可能达到大于100-200bp。通过修复单一DSB形成的***往往较短，并且常包括紧密围绕断裂位点的序列的短重复。然而，有可能获得大的***，并且在这些情形中，***的序列通常已经被追溯至基因组的其他区域或追溯至存在于细胞中的质粒DNA。

***缺失突变和经配置以产生***缺失的基因组编辑***可用于例如在不需要产生特定的最终序列时和/或在可耐受移码突变的情况下中断靶序列。其还可以用于偏好特定序列的环境中，只要某些所需序列往往优先通过给定位点处的SSB或DSB的修复而发生即可。***缺失突变还是可用于评估或筛选特定基因组编辑***和其组分的活性的工具。在这些和其他环境中，***缺失可以通过以下各项来表征：(a)其在与基因组编辑***接触的细胞的基因组中的相对和绝对频率，和(b)相对于未编辑序列的数值差异的分布，例如±1、±2、±3等。作为一个实例，在先导发现(lead-finding)环境中，可基于在受控条件下的***缺失读出筛选多种gRNA，以鉴别最有效驱动靶位点处的切割的那些gRNA。可以选择以阈值频率或以高于阈值的频率产生***缺失或产生***缺失的特定分布的指导以供进一步研究和开发。***缺失频率和分布还可以用作读出，用于评估不同的基因组编辑***实施或配置和递送方法，例如通过保持gRNA不变并改变某些其他反应条件或递送方法。

多重策略

根据本披露的基因组编辑***也可以用于多重基因编辑以在相同基因座或不同基因座中产生两个或更多个DSB。本文披露的任何RNA指导的核酸酶和gRNA都可以在基因组编辑***中用于多重基因编辑。涉及形成多个DSB或SSB的编辑策略描述于例如Cotta-Ramusino中。在某些实施例中，可以在基因组编辑***中使用多种gRNA和RNA指导的核酸酶，以将改变(例如，缺失，***)引入HBG1和/或HBG2的CCAAT盒靶区域。在某些实施例中，RNA指导的核酸酶可以是Cpf1或经修饰的Cpf1。

供体模板设计

供体模板设计详细描述于文献中，例如Cotta-Ramusino中。DNA寡聚体供体模板(寡脱氧核苷酸或ODN)可以是单链(ssODN)或双链(dsODN)的，可以用于促进基于HDR的DSB修复或加强整体编辑率，并且尤其可用于将改变引入靶DNA序列中、将新序列***靶序列中、或完全替代靶序列。

不论是单链或双链，供体模板通常包括与待切割的靶序列内或附近(例如侧接或邻近)的DNA区域同源的区域。这些同源区域在本文中称作“同源臂”，并且示意性地示于下文中：

[5’同源臂]-[替代序列]-[3’同源臂]。

同源臂可具有任何适宜长度(如果仅使用一个同源臂，包括0个核苷酸)，并且3’和5’同源臂可以具有相同长度或可以具有不同长度。适当同源臂长度的选择可能受到多种因素影响，例如对避免与某些序列(例如Alu重复序列或其他极为常见的元件)的同源性或微同源性的期望。例如，可以缩短5’同源臂以避免序列重复元件。在其他实施例中，可以缩短3’同源臂以避免序列重复元件。在一些实施例中，可以同时缩短5’和3’同源臂以避免包括某些序列重复元件。另外，一些同源臂设计可以改进编辑效率或增加所需修复结果的频率。例如，Richardson 2016(通过引用并入本文)发现，单链供体模板的3’和5’同源臂的相对不对称性影响修复率和/或结果。

供体模板中的替代序列已在其他地方进行了描述，包括在Cotta-Ramusino中。替代序列可以是任何适宜长度(如果所需修复结果是缺失，那么包括0个核苷酸)，并且相对于需要编辑的细胞内的天然存在的序列，典型地包括1、2、3或更多个序列修饰。一种常见序列修饰涉及改变天然存在的序列以修复突变，所述突变与需要治疗的疾病或病症相关。另一常见序列修饰涉及改变一个或多个序列，所述序列互补或然后RNA指导的核酸酶的PAM序列或用于产生SSB或DSB的一种或多种gRNA的靶向结构域，以在将替代序列并入靶位点中之后减少或消除靶位点的重复切割。

如果使用线性ssODN，其可以经配置以(i)退火至靶核酸的带切口链，(ii)退火至靶核酸的完整链，(iii)退火至靶核酸的正链，和/或(iv)退火至靶核酸的负链。ssODN可以具有任何合适的长度，例如大约、至少或不超过80-200个核苷酸(例如80、90、100、110、120、130、140、150、160、170、180、190，或200个核苷酸)。

应注意，模板核酸也可以是核酸载体，例如病毒基因组或环状双链DNA，例如质粒。包含供体模板的核酸载体可以包括其他编码或非编码元件。例如，模板核酸可以作为病毒基因组的部分来递送(例如在AAV或慢病毒基因组中)，其包括某些基因组骨架元件(例如在AAV基因组情形中，末端反向重复序列)并且任选地包括编码gRNA和/或RNA指导的核酸酶的其他序列。在某些实施例中，供体模板可以邻近或侧接由一种或多种gRNA识别的靶位点，以促进在供体模板的一端或两端上形成游离DSB，该供体模板可以参与使用相同gRNA修复在细胞DNA中形成的相应SSB或DSB。适合用作供体模板的示例性核酸载体描述于Cotta-Ramusino中，其通过引用并入本文。

不论使用何种形式，模板核酸都可以设计为避免不期望的序列。在某些实施例中，可以缩短一个或两个同源臂以避免与某些序列重复元件(例如，Alu重复、LINE元件等)重叠。

在某些实施例中，ssODN供体模板中可以包括沉默的非致病性的SNP，以允许鉴定基因编辑事件。

在某些实施例中，供体模板可以是与待切割的靶序列之内或附近的DNA区域非同源的非特异性模板。在某些实施例中，用于靶向BCL11Ae中的GATA1结合基序的供体模板可以包括但不限于与BCL11Ae中的GATA1结合基序内或附近的DNA区域不同源的非靶特异性模板。在某些实施例中，用于靶向13nt靶区域的供体模板可包括但不限于与13nt靶区域内或附近的DNA区域不同源的非靶特异性模板。

如本文所用的术语，供体模板或模板核酸是指可与RNA核酸酶分子和一种或多种gRNA分子结合使用以改变(例如，缺失、破坏或修饰)靶DNA序列的核酸序列。在某些实施例中，模板核酸导致HBG1和/或HBG2的CCAAT盒靶区域的改变(例如缺失)。在某些实施例中，所述改变是非天然发生的改变。在某些实施例中，HBG1和/或HBG2的CCAAT靶区域的非天然发生的改变可包括18nt靶区域、11nt靶区域、4nt靶区域或1nt靶区域、或其组合。在某些实施例中，所述改变是天然发生的改变。在某些实施例中，HBG1和/或HBG2的CCAAT盒靶区域的天然发生的改变可包括13nt靶区域、c.-117G>A靶区域或其组合。在某些实施例中，模板核酸是ssODN。在某些实施例中，ssODN是正链或负链。

例如，用于在18nt靶区域(HBG1 c.-104至-121、HBG2 c.-104至-121或其组合)处引入18nt缺失的模板核酸可包含5’同源臂、替代序列和3’同源臂，其中替代序列为0个核苷酸或0bp。在某些实施例中，5’同源臂可以是长度约25至约200个核苷酸或更多，例如，长度至少约25、50、75、100、125、150、175或200个核苷酸。在某些实施例中，5’同源臂包含约50至100bp，例如55至95、60至90，70至90或80至90bp与18nt靶区域的5’同源。在某些实施例中，3’同源臂可以是长度约25至约200个核苷酸或更多，例如，长度至少约25、50、75、100、125、150、175或200个核苷酸。在某些实施例中，3’同源臂包含约50至100bp，例如55至95、60至90，70至90或80至90bp与18nt靶区域的3’同源。在某些实施例中，5’和3’同源臂的长度是对称的。在某些实施例中，5’和3’同源臂的长度是不对称的。在某些实施例中，模板核酸是ssODN。在某些实施例中，ssODN是正链。在某些实施例中，ssODN是负链。在某些实施例中，ssODN包含以下、基本上由以下组成或由以下组成：SEQ ID NO:974(OLI16409)或SEQ IDNO:975(OLI16410)。

在某些实施例中，用于在11nt靶区域(HBG1 c.-105至-115、HBG2 c.-105至-115或其组合)处引入11nt缺失的模板核酸可包含5’同源臂、替代序列和3’同源臂，其中替代序列为0个核苷酸或0bp。在某些实施例中，5’同源臂可以是长度约25至约200个核苷酸，例如，长度至少约25、50、75、100、125、150、175或200个核苷酸。在某些实施例中，5’同源臂包含约50至100bp，例如55至95、60至90，70至90或80至90bp与11nt靶区域的5’同源。在某些实施例中，3’同源臂可以是长度约25至约200个核苷酸，例如，长度至少约25、50、75、100、125、150、175或200个核苷酸。在某些实施例中，3’同源臂包含约50至100bp，例如55至95、60至90，70至90或80至90bp与11nt靶区域的3’同源。在某些实施例中，5’和3’同源臂的长度是对称的。在某些实施例中，5’和3’同源臂的长度是不对称的。在某些实施例中，模板核酸是ssODN。在某些实施例中，ssODN是正链。在某些实施例中，ssODN是负链。在某些实施例中，ssODN包含以下、可以基本上由以下组成或由以下组成：SEQ ID NO:976(OLI16411)或SEQ ID NO:978(OLI16413)。

在某些实施例中，用于在4nt靶区域(HBG1 c.-112至-115、HBG2 c.-112至-115或其组合)处引入4nt缺失的模板核酸可包含5’同源臂、替代序列和3’同源臂，其中替代序列为0个核苷酸或0bp。在某些实施例中，5’同源臂可以是长度约25至约200个核苷酸，例如，长度至少约25、50、75、100、125、150、175或200个核苷酸。在某些实施例中，5’同源臂包含约50至100bp，例如55至95、60至90，70至90或80至90bp与4nt靶区域的5’同源。在某些实施例中，3’同源臂可以是长度约25至约200个核苷酸，例如，长度至少约25、50、75、100、125、150、175或200个核苷酸。在某些实施例中，3’同源臂包含约50至100bp，例如55至95、60至90，70至90或80至90bp与4nt靶区域的3’同源。在某些实施例中，5’和3’同源臂的长度是对称的。在某些实施例中，5’和3’同源臂的长度是不对称的。在某些实施例中，模板核酸是ssODN。在某些实施例中，ssODN是正链。在某些实施例中，ssODN是负链。在某些实施例中，ssODN包含以下、基本上由以下组成或由以下组成：SEQ ID NO:984(OLI16419)、SEQ ID NO:985(OLI16420)、SEQ ID NO:986(OLI16421)、SEQ ID NO:987(OLI16422)、SEQ ID NO:988(OLI16423)、SEQID NO:989(OLI16424)、SEQ ID NO:990(OLI16425)、SEQ ID NO:991(OLI16426)、SEQ IDNO:992(OLI16427)、SEQ ID NO:993(OLI16428)、SEQ ID NO:994(OLI16429)、或SEQ ID NO:995(OLI16430)。

在某些实施例中，用于在1nt靶区域(HBG1 c.-116、HBG2 c.-116或其组合)处引入1nt缺失的模板核酸可包含5’同源臂、替代序列和3’同源臂，其中替代序列为0个核苷酸或0bp。在某些实施例中，5’同源臂可以是长度约25至约200个核苷酸，例如，长度至少约25、50、75、100、125、150、175或200个核苷酸。在某些实施例中，5’同源臂包含约50至100bp，例如55至95、60至90，70至90或80至90bp与1nt靶区域的5’同源。在某些实施例中，3’同源臂可以是长度约25至约200个核苷酸，例如，长度至少约25、50、75、100、125、150、175或200个核苷酸。在某些实施例中，3’同源臂包含约50至100bp，例如55至95、60至90，70至90或80至90bp与1nt靶区域的3’同源。在某些实施例中，5’和3’同源臂的长度是对称的。在某些实施例中，5’和3’同源臂的长度是不对称的。在某些实施例中，模板核酸是ssODN。在某些实施例中，ssODN是正链。在某些实施例中，ssODN是负链。在某些实施例中，ssODN包含以下、基本上由以下组成或由以下组成：SEQ ID NO:982(OLI16417)或SEQ ID NO:983(OLI16418)。

在某些实施例中，CCAAT盒靶区域处的改变重现或类似于天然发生的改变，如13nt缺失。在某些实施例中，用于在13nt靶区域(HBG1 c.-116、HBG2 c.-116或其组合)处引入13nt缺失的模板核酸可包含5’同源臂、替代序列和3’同源臂，其中替代序列为0个核苷酸或0bp。在某些实施例中，5’同源臂可以是长度约25至约200个核苷酸，例如，长度至少约25、50、75、100、125、150、175或200个核苷酸。在某些实施例中，5’同源臂包含约50至100bp，例如55至95、60至90，70至90或80至90bp与13nt靶区域的5’同源。在某些实施例中，3’同源臂可以是长度约25至约200个核苷酸，例如，长度至少约25、50、75、100、125、150、175或200个核苷酸。在某些实施例中，3’同源臂包含约50至100bp，例如55至95、60至90，70至90或80至90bp与13nt靶区域的3’同源。在某些实施例中，5’和3’同源臂的长度是对称的。在某些实施例中，5’和3’同源臂的长度是不对称的。在某些实施例中，模板核酸是ssODN。在某些实施例中，ssODN是正链。在某些实施例中，ssODN是负链。在某些实施例中，ssODN包含以下、基本上由以下组成或由以下组成：SEQ ID NO:979(OLI16414)或SEQ ID NO:977(OLI16412)。

在某些实施例中，CCAAT盒靶区域处的改变重现或类似于天然发生的改变，如在-117G>A靶区域从G取代为A。在某些实施例中，用于在-117G>A靶区域(HBG1 c.-117G>A，HBG2c.-117G>A或其组合)处引入-117G>A取代的模板核酸可包含5’同源臂、替代序列和3’同源臂，其中替代序列为0个核苷酸或0bp。在某些实施例中，5’同源臂可以是长度约100至约200个核苷酸，例如长度至少约100、125、150、175或200个核苷酸。在某些实施例中，5’同源臂包含约50至100bp，例如55至95、60至90、70至90或80至90bp与-117G>A靶区域的5’同源。在某些实施例中，3’同源臂可以是长度约25至约200个核苷酸，例如，长度至少约25、50、75、100、125、150、175或200个核苷酸。在某些实施例中，3’同源臂包含约50至100bp，例如55至95、60至90、70至90或80至90bp与-117G>A靶区域的3’同源。在某些实施例中，5’和3’同源臂的长度是对称的。在某些实施例中，5’和3’同源臂的长度是不对称的。在某些实施例中，模板核酸是ssODN。在某些实施例中，ssODN是正链。在某些实施例中，ssODN是负链。在某些实施例中，ssODN包含以下、基本上由以下组成或由以下组成：SEQ ID NO:980(OLI16415)或SEQ IDNO:981(OLI16416)。

在某些实施例中，5’同源臂包含5’硫代磷酸酯(PhTx)修饰。在某些实施例中，3’同源臂包含3’PhTx修饰。在某些实施例中，模板核酸包含5’和3’PhTx修饰。

在某些实施例中，用于在CCAAT盒靶区域处引入改变(例如缺失)的ssODN可以与RNA核酸酶和靶向CCAAT靶区域的一种或多种gRNA结合使用，例如，表6、表12、表13中披露的gRNA。

靶细胞

根据本披露的基因组编辑***可以用于操作或改变细胞，例如以编辑或改变靶核酸。在各个实施例中，操作可在体内进行或离体进行。

可以根据本披露的实施例操作或改变多种细胞类型，并且在一些情形中，例如在体内应用中，例如通过将根据本披露的基因组编辑***递送至多个细胞类型来改变或操作多个细胞类型。然而，在其他情形中，可能需要将操作或改变限制于特定的一个或多个细胞类型。例如，在一些情况下可能需要编辑具有有限分化潜力的细胞或最终分化细胞，例如在Maeder情形中的感光细胞，其中预期基因型的修饰会导致细胞表型变化。然而，在其他情形中，可能需要编辑分化程度较低的、多潜能或多能性的干细胞或祖细胞。举例来说，细胞可以是胚胎干细胞、诱导型多能干细胞(iPSC)、造血干细胞/祖细胞(HSPC)或其他干细胞或祖细胞类型，其分化为与给定应用或适应证相关的细胞类型。

作为推论，根据所靶向的一种或多种细胞类型和/或所需编辑结果，所改变或操作的细胞不同地为***细胞或非***细胞。

在离体操作或改变细胞时，细胞可以立即使用(例如施用于受试者)，或可以维持或储存细胞以供将来使用。本领域技术人员将了解，可以使用本领域已知的任何适宜方法将细胞维持在培养中或储存(例如冷冻于液氮中)。

基因组编辑***的实施：递送、配制和施用途径

如上文所讨论的，本披露的基因组编辑***可以用任何适宜方式来实施，意味着此类***的组分(包括但不限于RNA指导的核酸酶、gRNA和可选供体模板核酸)可以用任何适宜形式或形式的组合来递送、配制或施用，从而在细胞、组织或受试者中导致基因组编辑***的转导、表达或引入和/或引起所需的修复结果。表2和3展示基因组编辑***实施方式的若干非限制性实例。但本领域技术人员将了解，这些列表不是综合性的，并且其他实施是可能的。尤其参照表2，该表示例了包含单gRNA和任选供体模板的基因组编辑***的若干示例性实施方式。然而，根据本披露的基因组编辑***可以并入多种gRNA、多种RNA指导的核酸酶以及其他组分，例如蛋白质，并且基于该表中所示的原理，多种实施将为技术人员所了解。在该表中，[N/A]指示，基因组编辑***不包括所指示的组分。

表2

表3总结了用于如本文所述的基因组编辑***的组分的各种递送方法。同样，该列表旨在是示例性而不是限制性的。

表3

基因组编辑***的基于核酸的递送

可以通过本领域已知的方法或如本文所述将编码根据本披露的基因组编辑***的各种元件的核酸施用于受试者或递送至细胞。例如，可以通过例如载体(例如，病毒或非病毒载体)、非载体基方法(例如，使用裸DNA或DNA复合物)或其组合递送编码RNA指导的核酸酶的DNA和/或编码gRNA的DNA、以及供体模板核酸。

编码基因组编辑***或其组分的核酸可以作为裸DNA或RNA直接递送至细胞，例如借助转染或电穿孔来递送，或者可以缀合至促进靶细胞(例如，红血球、HSC)摄取的分子(例如，N-乙酰半乳糖胺)。也可以使用核酸载体，如表3中总结的载体。

核酸载体可以包含编码基因组编辑***组分(例如RNA指导的核酸酶、gRNA和/或供体模板)的一个或多个序列。载体还可以包含编码信号肽(例如，用于核定位、核仁定位或线粒体定位)的序列，其与编码蛋白质的序列缔合(例如***其中或与其融合)。作为一个实例，核酸载体可以包括Cas9编码序列，其包括一个或多个核定位序列(例如，来自SV40的核定位序列)。

核酸载体还可以包括任何适宜数目的调节/控制元件，例如，启动子、增强子、内含子、多聚腺苷酸化信号、科扎克(Kozak)共有序列或内部核糖体进入位点(IRES)。这些元件为本领域中所熟知，并且描述于Cotta-Ramusino中。

根据本披露的核酸载体包括重组病毒载体。示例性病毒载体展示于表3中，并且其他适宜病毒载体以及其使用和产生描述于Cotta-Ramusino中。还可以使用本领域已知的其他病毒载体。另外，可以使用病毒颗粒来递送呈核酸和/或肽形式的基因组编辑***组分。例如，可以组装“空”病毒颗粒以含有任何适宜负荷。病毒载体和病毒颗粒也可以经工程改造以并入靶向配体，从而改变靶组织特异性。

除了病毒载体以外，可以使用非病毒载体来递送编码根据本披露的基因组编辑***的核酸。非病毒核酸载体的一个重要分类是纳米颗粒，其可以是有机的或无机的。纳米颗粒为本领域所熟知，并且概述于Cotta-Ramusino中。可以使用任何适宜的纳米颗粒设计来递送基因组编辑***组分或编码此类组分的核酸。例如，在本披露的某些实施例中，有机(例如脂质和/或聚合物)纳米颗粒可以适合用作递送媒介物。用于纳米颗粒配制品和/或基因转移的示例性脂质显示于表4中，并且表5列示用于基因转移和/或纳米颗粒配制品的示例性聚合物。

表4：用于基因转移的脂质

表5：用于基因转移的聚合物

非病毒载体任选地包括靶向修饰以改进摄取和/或选择性靶向某些细胞类型。这些靶向修饰可以包括例如细胞特异性抗原、单克隆抗体、单链抗体、适体、聚合物、糖(例如，N-乙酰半乳糖胺(GalNAc))和细胞穿透肽。此类载体还任选地使用致融性和核内体去稳定肽/聚合物，经历酸触发的构象变化(例如，加速负荷的核内体逃逸)，和/或并入刺激可裂解的聚合物，例如用于在细胞区室中释放。例如，可以使用在还原性细胞环境中裂解的基于二硫化物的阳离子型聚合物。

在某些实施例中，除了基因组编辑***的组分(例如，本文所述的RNA指导的核酸酶组分和/或gRNA组分)以外，递送一种或多种核酸分子(例如，DNA分子)。在某些实施例中，该核酸分子是与基因组编辑***的一个或多个组分同时递送。在某些实施例中，该核酸分子是在递送基因组编辑***的一个或多个组分之前或之后(例如，小于约30分钟、1小时、2小时、3小时、6小时、9小时、12小时、1天、2天、3天、1周、2周或4周)递送。在某些实施例中，该核酸分子是通过与递送基因组编辑***的一个或多个组分(例如，RNA指导的核酸酶组分和/或gRNA组分)不同的方式来递送。核酸分子可以通过本文所述的任何递送方法来递送。例如，核酸分子可以通过病毒载体(例如，整合缺陷型慢病毒)来递送，并且RNA指导的核酸酶分子组分和/或gRNA组分可以通过电穿孔来递送，例如，使得可以降低由核酸(例如，DNA)引起的毒性。在某些实施例中，该核酸分子编码治疗性蛋白质，例如，本文所述的蛋白质。在某些实施例中，该核酸分子编码RNA分子，例如，本文所述的RNA分子。

RNP和/或编码基因组编辑***组分的RNA的递送

可以通过本领域已知的方法将RNP(gRNA与RNA指导的核酸酶的复合物)和/或编码RNA指导的核酸酶和/或gRNA的RNA递送至细胞中或施用给受试者，其中一些方法描述于Cotta-Ramusino中。在体外，编码RNA指导的核酸酶的和/或编码gRNA的RNA可以通过例如显微注射、电穿孔、瞬时细胞压缩或挤压来递送(参见，例如，Lee 2012)。还可以使用脂质介导的转染、肽介导的递送、GalNAc或其他缀合物介导的递送和其组合进行体外和体内递送。保护性、交互式、非冷凝(PINC)***可用于递送。

在体外，经由电穿孔递送包含将细胞与编码RNA指导的核酸酶和/或gRNA的RNA(具有或不具有供体模板核酸分子)在盒、室或比色皿中混合，并且施加一个或多个限定持续时间和幅度的电脉冲。用于电穿孔的***和方案为本领域中已知，并且任何适宜的电穿孔工具和/或方案可以结合本披露的各个实施例使用。

施用途径

可以通过任何适宜模式或途径(局部或全身)将基因组编辑***或使用此类***改变或操作的细胞施用于受试者。全身施用模式包括口服和肠胃外途径。肠胃外途径包括例如静脉内、骨髓内、动脉内、肌内、真皮内、皮下、鼻内和腹膜内途径。全身施用的组分可以经修饰或配制以靶向例如HSC(造血干细胞/祖细胞)或红系祖细胞或前体细胞。

局部施用模式包括例如骨髓内注射至骨小梁中或股骨内注射到髓隙中，以及输注至门静脉中。在某些实施例中，与全身施用(例如，静脉内)时相比，在局部施用(例如，直接施用至骨髓中)时，显著较少量的组分(与全身方法相比)可以发挥作用。局部施用模式可以降低或消除在全身性施用治疗有效量的组分时可能发生的潜在毒副作用的发生率。

施用可以作为定期推注(例如静脉内)或作为持续输注从内部储库或从外部储库(例如从静脉内注射袋或可植入泵)提供。组分可以局部施用，例如，通过从持续释放药物递送装置中连续释放。

另外，组分可以经配制以容许经延长时段释放。释放***可以包括生物可降解材料或通过扩散释放所并入组分的材料的基质。组分可以在释放***中均匀或者非均匀分配。多种释放***可以是有用的，但适当***的选择将取决于具体应用所需要的释放速率。不可降解和可降解的释放***均可以被使用。适宜释放***包括聚合物和聚合基质、非聚合基质或无机和有机赋形剂和稀释剂，例如但不限于碳酸钙和糖(例如，海藻糖)。释放***可以是天然的或合成的。然而，合成释放***是优选的，因为其通常更可靠、更具可重现性并且产生更明确的释放曲线。可以选择释放***材料，使得具有不同分子量的组分是通过穿过材料扩散或通过材料降解而释放。

代表性的合成生物可降解聚合物包括例如：聚酰胺，例如聚(氨基酸)和聚(肽)；聚酯，例如聚(乳酸)、聚(乙醇酸)、聚(乳酸-共-乙醇酸)和聚(己内酯)；聚(酸酐)；聚原酸酯；聚碳酸酯；和其化学衍生物(取代、添加化学基团，例如，烷基、亚烷基、羟化、氧化和本领域技术人员常规进行的其他修饰)、共聚物和其混合物。代表性的合成非生物可降解聚合物包括例如：聚醚，例如聚(氧化乙烯)、聚(乙二醇)和聚(环氧丁烷)；乙烯基聚合物-聚丙烯酸酯和聚甲基丙烯酸酯，例如甲基、乙基、其他烷基、甲基丙烯酸羟乙酯、丙烯酸和甲基丙烯酸和其他，例如聚(乙烯醇)、聚(乙烯基吡咯烷酮)和聚(乙酸乙烯酯)；聚(氨酯)；纤维素和其衍生物，例如烷基、羟烷基、醚、酯、硝化纤维素和各种醋酸纤维素；聚硅氧烷；和其任何化学衍生物(取代、添加化学基团，例如，烷基、亚烷基、羟化、氧化和本领域技术人员常规进行的其他修饰)、共聚物和其混合物。

也可以使用聚(丙交酯共乙交酯)微球。典型地，微球是由乳酸和乙醇酸的聚合物构成，其经结构化以形成空心球体。球体的直径可以是约15-30微米，并且可以加载本文所述的组分。在一些实施例中，基因组编辑***、***组分和/或编码***组分的核酸与嵌段共聚物例如泊洛沙姆或泊洛沙明一起递送。

组分的多模或差别递送

技术人员根据本披露将了解，本文所披露的基因组编辑***的不同组分可以一起或分开并且同时或不同时递送。可能尤其期望基因组编辑***组分的分开和/或异步递送以提供对基因组编辑***功能的时间或空间控制并限制由其活性引起的某些效应。

如本文所用，不同或差别模式是指递送模式，这些递送模式赋予受试组分分子(例如，RNA指导的核酸酶分子、gRNA、模板核酸或有效负载)不同的药效学或药物代谢动力学特性。例如，递送模式可以导致不同的组织分布，不同的半衰期或不同的时间分布，例如，在所选区室、组织或器官中。

一些递送的模式(例如，通过例如通过自主复制或***细胞核酸中而在细胞或细胞后代中持续存在的核酸载体来递送)导致组分更持久的表达和存在。实例包括病毒(例如，AAV或慢病毒)递送。

举例来说，基因组编辑***的组分(例如，RNA指导的核酸酶和gRNA)可以通过在所递送组分在体内或在特定区室、组织或器官中的所得半衰期或持久性方面不同的模式进行递送。在某些实施例中，gRNA可以通过此类模式进行递送。RNA指导的核酸酶分子组分可以通过导致在体内或特定区室或组织或器官中更低持久性或更少暴露的模式进行递送。

更通常地，在某些实施例中，使用第一递送模式来递送第一组分，并且使用第二递送模式来递送第二组分。第一递送模式赋予第一药效学或药物代谢动力学特性。第一药效学特性可以是例如组分或编码该组分的核酸在体内、区室、组织或器官中的分布、持久性或暴露。第二递送模式赋予第二药效学或药物代谢动力学特性。第二药效学特性可以是例如组分或编码该组分的核酸在体内、区室、组织或器官中的分布、持久性或暴露。

在某些实施例中，第一药效学或药物代谢动力学特性(例如，分布、持久性或暴露)比第二药效学或药物代谢动力学特性更受限。

在某些实施例中，第一递送模式经选择以优化(例如，最小化)药效学或药物代谢动力学特性(例如，分布、持久性或暴露)。

在某些实施例中，第二递送模式经选择以优化(例如，最大化)药效学或药物代谢动力学特性(例如，分布、持久性或暴露)。

在某些实施例中，第一递送模式包含使用相对持久的元件，例如，核酸，例如，质粒或病毒载体，例如，AAV或慢病毒。由于此类载体相对持久，从其转录的产物将相对持久。

在某些实施例中，第二递送模式包含相对瞬时元件，例如，RNA或蛋白质。

在某些实施例中，第一组分包含gRNA，并且递送模式相对持久，例如，gRNA是从质粒或病毒载体(例如，AAV或慢病毒)转录。这些基因的转录将具有极小生理学意义，因为这些基因不编码蛋白质产物，并且这些gRNA不能够单独起作用。第二组分(RNA指导的核酸酶分子)是以瞬时方式递送，例如，作为mRNA或作为蛋白质递送，从而确保完整的RNA指导的核酸酶分子/gRNA复合物仅在短时段内存在并有活性。

此外，这些组分可以不同的分子形式或用不同的互为补充以增强安全性和组织特异性的递送载体进行递送。

差别递送模式的使用可以增强性能、安全性和/或功效，例如，可以减少最终脱靶修饰的可能性。通过较不持久的模式递送免疫原性组分(例如，Cas9分子)可以降低免疫原性，因为来自细菌源Cas酶的肽通过MHC分子展示于细胞表面上。两部分式递送***可以改善这些缺点。

差别递送模式可以用于将组分递送至不同但重叠的靶区域。在靶区域的重叠以外，活性复合物的形成被最小化。因此，在某些实施例中，第一组分(例如，gRNA)是通过第一递送模式进行递送，其导致第一空间(例如，组织)分布。第二组分(例如，RNA指导的核酸酶分子)是通过第二递送模式进行递送，其导致第二空间(例如，组织)分布。在某些实施例中，第一模式包含选自脂质体、纳米颗粒(例如，聚合纳米颗粒)和核酸的第一元件，例如，病毒载体。第二模式包含选自该组的第二元件。在某些实施例中，第一递送模式包含第一靶向元件，例如，细胞特异性受体或抗体，并且第二递送模式不包括该元件。在某些实施例中，第二递送模式包含第二靶向元件(例如，第二细胞特异性受体或第二抗体)。

当在病毒递送载体、脂质体或聚合纳米颗粒中递送RNA指导的核酸酶分子时，存在递送至多个组织并且在多个组织中具有治疗活性的可能性，但此时可能希望仅靶向单一组织。两部分式递送***可以解决这一挑战并且增强组织特异性。如果将gRNA分子和RNA指导的核酸酶分子包装于具有不同但重叠的组织向性的分开的递送媒介物中，那么完全功能复合物仅在两种载体所靶向的组织中形成。

实例

通过以下非限制性实例进一步说明上述原理和实施例：

实例1：含有靶向CCAAT盒的gRNA的gpf的Cpf1 RNP支持人造血干/祖细胞中的基因编辑

设计了Cpf1指导RNA，HBG1-1(即，OLI13620(表6))以HBG远端靶向CCAAT盒。为了确定在CD34+细胞中递送氨基酸球菌属物种Cpf1(“AsCpf1”)的最佳核定位信号配置，将HBG1-1 gRNA与AsCpf1的两个核定位信号(NLS)变体(即His-AsCpf1-nNLS(SEQ ID NO:1000)和His-AsCpf1-sNLS-sNLS(SEQ ID NO:1001))复合。“His”是指六组氨酸的纯化序列，“AsCpf1”是指氨基酸球菌属物种Cpf1蛋白序列，“nNLS”是指核质蛋白NLS，并且“sNLS”是指SV40 NLS。

简而言之，将mPB CD34+细胞用X-Vivo-10中的人细胞因子预刺激2天，然后用5μM或20μM的RNP电穿孔。电穿孔三天后提取基因组DNA，并对HBG PCR产物进行下一代测序。与测试的Cpf1 NLS变体(“His-AsCpf1-sNLS-sNLS_HBG1-1 RNP”或“His-AsCpf1-nNLS_HBG1-1RNP”)复合的HBG1-1 gRNA支持CD34+细胞的13nt靶位点处的编辑。在测试的最高剂量下，His-AsCpf1-sNLS-sNLS_HBG1-1 RNP产生了60.6％的经编辑的等位基因，并且His-AsCpf1-nNLS_HBG1-1 RNP产生了51.1％的经编辑的等位基因(图3A)。

表6：用于靶向CD34⁺细胞中CCAAT盒的HBG1-1 gRNA序列

实例2：靶向CCAAT盒的Cpf1 RNP与ssODN供体的共递送支持人造血干/祖细胞中的基因编辑

将包含与His-AsCpf1-sNLS-sNLS变体复合的HBG1-1 gRNA的RNP(“His-AsCpf1-sNLS-sNLS_HBG1-1 RNP”)跟单链寡脱氧核苷酸供体修复模板(ssODN)通过电穿孔共递送到mPB CD34+细胞。OLI16430和OLI16424 ssODN被设计为“编码”4个核苷酸缺失，并且OLI16409和OLI16410 ssODN被设计为“编码”18个核苷酸缺失(表7)。4nt和18nt缺失都破坏了HBG远端CCAAT盒，并与HBG表达的诱导有关。ssODN包括90个核苷酸长的同源臂(位于编码的缺失序列的侧翼)以产生完全缺失。修饰ssODN，使其在5’和3’末端含有硫代磷酸酯(PhTx)(OLI16430、OLI16424、OLI16409和OLI16410，表7)。简而言之，将在补充有人细胞因子的培养基中预刺激两天的成人mPB CD34+细胞用5μM RNP电穿孔，该RNP包含与HBG1-1gRNA(“His-AsCpf1-sNLS-sNLS_HBG1-1 RNP”)复合的His-AsCpf1-sNLS-sNLS蛋白，单独或与2.5μM的ssODN供体(OLI16430、OLI164324、OLI16409或OLI16410)之一组合。RNP和编码18nt缺失的具有正链同源臂的ssODN供体(OLI16409)的共递送将编辑频率从没有供体情况下的39.5％提高到73.3％，如通过电穿孔后72小时对提取的基因组DNA的HBG PCR产物的测序分析确定的(图4A)。

表7：单链脱氧核苷酸供体修复模板“编码”CCAAT盒处或附近的缺失或突变

对靶位点处缺失的特定类型和大小的进一步分析表明，在存在18nt正链供体(OLI16409)的情况下，57.3％的等位基因(相比之下，当单独递送His-AsCpf1-sNLS-sNLS_HBG1-1 RNP时是7.5％的等位基因)携带18nt缺失(图4B)。ssODN共递送介导了DNA DSB的精确修复，因为18nt缺失代表ssODN OLI16409和His-AsCpf1-sNLS-sNLS_HBG1-1 RNP共递送产生的所有***缺失的71.2％，然而，当单独递送His-AsCpf1-sNLS-sNLS_HBG1-1 RNP时，18nt缺失仅代表产生的所有***缺失的19.0％(图4C)。

尽管图4A-4C中的数据最初表明，Cpf1 RNP与ssODN供体的共递送增加了基因组DNA的精确基因编辑，导致18nt缺失，但随后进行的重复实例2实验的测试证实了这些数据是实验的假象。尽管如此，从随后使用指导RNA HBG1-1和ssODN OLI16409测试AsCpf1 RNP的重复实验中获得的数据表明，ssODN供体的共递送支持人mPB-CD34+细胞中总编辑的增加，尽管与针对“-18nt缺失”的DNA DSB的精确修复无关(参见实例10)。

实例3：含有靶向HBG启动子的远端CCAAT盒区域的gRNA的Cpf1 RNP支持人造血干/ 祖细胞中的基因编辑，所述基因编辑促进红系后代中HbF蛋白表达的诱导

具有包含SEQ ID NO:1002的靶向结构域(表9)的指导RNAHBG1-1(表8)靶向HBG启动子内的位点(图5A)。HBG1-1 gRNA(SEQ ID NO:1022)与野生型AsCpf1(AsCpf1-sNLS-sNLS，SEQ ID NO:1001)复合形成RNP(“AsCpf1-HBG1-1-RNP”，表8)。然后使用Amaxa核苷酸转染仪(龙沙公司(Lonza))或MaxCyte GT(MaxCyte公司(MaxCyte,Inc.))电穿孔设备将这种复合物(5μM或20μM)电穿孔到动员的外周血(mPB)衍生的CD34+细胞中。在电穿孔后三天，通过对PCR扩增的靶位点的Illumina测序(NGS)分析靶位点处的***/缺失水平。AsCpf1-HBG1-1-RNP在Amaxa和MaxCyte电穿孔***上分别支持43％和17％的中靶编辑(图6A(Amaxa)和6B(MaxCyte))。在对mPB CD34+细胞进行编辑后，进行了18天的离体分化为红系谱系(Giarratana 2011)。然后，通过UPLC测量γ-珠蛋白链的相对表达水平(相比于总β样珠蛋白链)(图6A(Amaxa)和6B(MaxCyte))。AsCpf1-HBG1-1-RNP导致γ-珠蛋白表达增加，比在模拟电穿孔的mPB CD34+细胞衍生的细胞中检测到的水平高多达21％(图6A)。

表8：RNP组分

表9：指导RNA靶向结构域序列

实例4：当与化脓链球菌Cas9RNP共递送时，在HBG启动子的CCAAT盒区域处的Cpf1 RNP编辑效率提高，而对生存力没有影响

假设Cpf1-RNP与近端靶向性化脓链球菌Cas9 RNP的共递送，无论是催化失活还是引入单个切口，都可以增强靶位点处的编辑水平。为了增强HBG启动子的远端CCAAT盒区域处的Cpf1-RNP介导的编辑，将HBG1-1-AsCpf1H800A-RNP(由His-AsCpf1-sNLS-sNLS-H800A(SEQ ID NO:1032)与如表8所示的具有3’修饰的HBG1-1 gRNA(SEQ ID NO:1041)复合构成)与以下共递送到mPB CD34+细胞中：(1)化脓链球菌Cas9 D10ARNP，其含有与选自以下的全长指导RNA(100mer)复合的Cas9 D10A蛋白(His-NLS-SpCas9D10A，SEQ ID NO:1034)：(a)SpA gRNA(表8，9；图5B)(“SpA-D10A-RNP”，表8)或(b)SpG gRNA(表8，9；图5C)(“SpG-D10A-RNP”，表8))；(2)化脓链球菌WT Cas9 RNP，其含有与选自以下的截短的失活指导RNA(95mer-具有缩短的原间隔子区域)复合的WT Cas9蛋白(SpCas9WT，SEQ ID NO:1033)：(a)tSpA dgRNA(表8、9；图5E)(“tSpA-Cas9-RNP”，表8)；(b)Sp182 dgRNA(表8，9；图5F)(“Sp182-Cas9-RNP”，表8)；或(c)tSpA-Cas9-RNP和Sp182-Cas9-RNP(表8，9，图5D)。使用MaxCyte GT设备(MaxCyte公司)对RNP复合物进行电穿孔。然后在电穿孔后三天，通过对PCR扩增的靶位点的Illumina测序(NGS)分析靶位点处的***/缺失水平。在所有测试的组合中，无论使用的化脓链球菌Cas9酶(D10A或WT)和PAM方向如何，总编辑增加，超过在单独HBG1-1-AsCpf1H800A-RNP的Maxcyte递送后观察到的水平(图7和表10)。此外，共递送化脓链球菌Cas9 RNP时对mPB CD34+细胞的生存力没有有害影响(图8)。

表10：在测试的最大RNP剂量下，每种RNP组合的***缺失和γ-珠蛋白表达的汇总

实例5：Cpf1编辑谱可以用化脓链球菌Cas9-D10A-RNP的共递送操作

除了将HBG1-1-AsCpf1H800A-RNP与化脓链球菌Cas9-D10A-RNP共递送至mPB CD34+细胞时观察到的总编辑增加外(图7)，还观察到***缺失谱的变化。通过D10A酶在Cpf1-RNP靶位点近端引入单链断裂(图9A)改变了***缺失的方向性、长度和/或位置(图9B)。例如，Sp182-D10A-RNP强烈地将谱移向D10ARNP引入的切口位点，其中各种长度的缺失从Cpf1剪切位点向上游切口位点延伸(Sp182-D10A-RNP，图9B)。SpA-D10A-RNP也促进了缺失的产生从HBG1-1-AsCpf1H800A-RNP剪切位点延伸到D10A酶引入的切口位点(此处位于下游)，但在这种情况下，还产生了明显来自切口位点但并未完全延伸到HBG1-1-AsCpf1H800A-RNP剪切位点的另外缺失(SpA-D10A-RNP，图9B)。

化脓链球菌Cas9-D10A-RNP靶位点相对于Cpf1-RNP靶位点的方向、靶链和距离可能导致由另外DNA缺口促进的突变的位置和长度方面的差异(图9A)。应当注意，在某些应用中，***缺失谱的这种定向操作(即，Cpf1-RNP和化脓链球菌Cas9 D10A-RNP结合位点之间发生***缺失的频率增加)可用于有利于所期望的编辑结果，从而提高有效***缺失率(例如，会破坏靶位点的***缺失)。在这种情况下，为了破坏dCCAAT靶区域并诱导HbF蛋白表达，HBG1-1-AsCpf1H800A-RNP与化脓链球菌D10A-RNP的共递送导致γ珠蛋白水平增加16.7％(SpG-D10A-RNP)或19.0％(SpA-D10A-RNP)，高于在模拟电穿孔细胞中检测到的水平，如电穿孔后红系分化18天后通过UPLC分析检测到的(图7和表10)。将HBG1-1-AsCpf1H800A-RNP与SpA-D10A-RNP配对时(相比于SpG-D10A-RNP)有效***缺失的频率更高，因为从较低的编辑水平(SpA-D10A-RNP情况下为42.6％，相比于SpG-D10A-RNP情况下为88.6％)实现了较高的HbF水平增加(Cas9D10A-SpA-RNP情况下为19％，相比于SpG-D10A-RNP情况下为16.7％)(图7和表10)。

实例6：Cpf1编辑在含有失活指导RNA的化脓链球菌Cas9 WT RNP存在下增加，而不改变编辑谱

当使用MaxCyte电穿孔仪设备将HBG1-1-AsCpf1H800A-RNP(固定剂量为6μM)与增加剂量的Sp182-Cas9-RNP(与截短的95mer失活gRNA，Sp182复合)共递送至mPB CD34+细胞时，观察到编辑加强高达大于10倍(最高剂量的Sp182-Cas9-RNP编辑情况下为85.4％，相比之下，单独递送HBG1-1-AsCpf1H800A-RNP情况下为8.0％)(图7)。本文通过共递送Sp182-Cas9-RNP达到的编辑水平也大大超过了当以高达20uM的剂量单独递送HBG1-1-AsCpf1H800A-RNP时使用MaxCyte电穿孔仪设备获得的编辑水平(图6B)。与通过共递送D10A-RNP观察到的结果相反(在实例5中)，通过共递送HBG1-1-AsCpf1H800A-RNP与Sp182-Cas9-RNP(与截短的gRNA复合的Cas9-WT)实现的编辑增加与对***缺失谱的明显影响无关。在电穿孔细胞中检测到的***缺失以近似对称的方式以Cpf1剪切位点为中心，并且在Sp182-Cas9-RNP靶位点未检测到***缺失(图10A)。值得注意的是，总***缺失的96％破坏了远端CCAAT盒，而总***缺失的79.5％破坏了CCAAT盒基序的3个或更多个核苷酸(图10B)。使用HBG1-1-AsCpf1H800A-RNP(由His-AsCpf1-sNLS-sNLS-H800A(SEQ ID NO:1032)与HBG1-1 gRNA(SEQ ID NO:1022)复合构成)和Sp182-Cas9-RNP的进一步剂量优化使得在电穿孔后120小时mPB-CD34+细胞中的编辑水平高达92％(使用MaxCyte装置)，并导致红系衍生细胞中的γ链表达水平比背景高32％(在经处理的细胞中41％的γ链，在模拟处理的细胞中8％)(图11)。这些结果证明由WT化脓链球菌Cas9蛋白与截短的gRNA复合构成的RNP可以增加近端结合的Cpf1-RNP的编辑，而不会在其自身的结合位点引入可检测的编辑水平，也不会明显影响Cpf1-RNP产生的***缺失的长度或方向。在这里，Sp182-Cas9-RNP提供的编辑增强使得能在HBG启动子处对HBG1-1-AsCpf1H800A-RNP进行高编辑，其中高频率的***缺失破坏远端CCAAT盒靶基序并导致电穿孔细胞的混合红系后代中治疗相关水平的γ链表达。

实例7：用靶向远端CCAAT盒的Cpf1 gRNA编辑的细胞群内的克隆HbF分布

接下来进行单细胞实验以评估在用HBG1-1-AsCpf1H800A-RNP(由His-AsCpf1-sNLS-sNLS-H800A(SEQ ID NO:1032)与表8显示的具有3’修饰的HBG1-1 gRNA(SEQ ID NO:1041)复合构成)+Sp182-Cas9-RNP组合电穿孔的mPB CD34+细胞衍生的红系细胞中γ链表达水平的分布(图5F，表8)。在电穿孔后48小时过程中使其恢复后，通过荧光激活细胞分选术(FACS)以1个细胞/孔在非组织培养处理的384孔板中分选细胞。然后使细胞分化并克隆扩增18天成为红系谱系(改编自Giarratana 2011)。进行了UPLC分析，以确定衍生自最初编辑的mPB-CD34+细胞总群体的细胞的克隆性红系后代中γ链表达水平的分布(γ链/[总β样链]的百分比)。认为为了获得功能性益处并减轻与镰状细胞病相关的症状，约30％的红系细胞的胎儿血红蛋白水平应大于30％。在分析的克隆中，83.1％的克隆的γ链水平高于从模拟电穿孔的mPB CD34+细胞衍生的红系细胞克隆中检测到的中值水平(中值＝18.8％)，64.2％的克隆的γ链水平超过了总β样链的30％并且35.8％的克隆的γ链水平超过了总β样链的48.8％(对照细胞中值水平为30％+18.8％)(图12)。

实例8：靶向HBG启动子区的Cpf1 gRNA的筛选

为鉴定可以用作单个RNP的组分或与“增强元件”组合以增加CD34+细胞中HBG启动子区的编辑并诱导修饰的细胞的红系后代中胎儿血红蛋白表达的其他AsCpf1 gRNA，设计了靶向HBG启动子的几个结构域(表11)的His-AsCpf1-NLS-NLS(“AsCpf1”，SEQ ID NO:1000)；AsCpf1 S542R/K607R(“AsCpf1 RR”，SEQ ID NO:1036)；或AsCpf1 S542R/K548V/N552R(“AsCpf1RVR”，SEQ ID NO:1037)gRNA序列(在表12中列出)。AsCpf1 RR和AsCpf1 RVR是工程改造的AsCpf1变体，其分别识别TYCV/ACCC/CCCC和TATV/RATR PAM(Gao2017)。

表11：HBG基因组区的亚结构域

表12：Cpf1指导RNA

将与包含来自表12的gRNA靶向结构域的单gRNA(对于使用的特定Cpf1分子，参见gRNA ID名称)复合的含有AsCpf1蛋白(SEQ ID NO:1000)、AsCpf1RR蛋白(SEQ ID NO:1036)或AsCpf1 RVR(SEQ ID NO:1037)的RNP(5μM)使用Amaxa电穿孔仪设备(龙沙公司(Lonza))递送至动员的外周血(mPB)CD34+细胞。72小时后，从细胞中提取基因组DNA，并通过PCR扩增的靶位点的Illumina测序(NGS)分析靶位点处的***/缺失水平。每种gRNA的编辑百分比(***缺失＝缺失和***)显示于上表12中。在某些实施例中，包含表12中所示的一种或多种gRNA的Cpf1 RNP可以用于靶向表11中列出的区域以诱导HbF表达，并且可以与“加强元件”共递送以与单独的Cpf1 RNP的编辑水平相比实现更高的编辑水平。

实例9：靶向CCAAT盒的HBG1-1-Cpf1 RNP与ssODN的共递送支持人造血干/祖细胞中基因编辑的增加

产生“18nt缺失”(HBGΔ-104:-121)的100nt ssODN(即，ssODN OLI16431(SEQ IDNO:1040)表7)与Cpf1 RNP共递送，以进一步研究编辑结果。

简而言之，将在补充了人细胞因子的培养基中预刺激两天的成人mPB CD34+细胞用RNP电穿孔，该RNP包含与经修饰的HBG1-1 gRNA(SEQ ID NO:1041，表8)复合的His-AsCpf1-sNLS-sNLS H800A蛋白(SEQ ID NO:1032，表8)(“His-AsCpf1-sNLS-sNLS H800A_HBG1-1 RNP”)(单独的(6μM)或跟OLI16431(0.5-6μM)组合)。RNP和编码18nt缺失的具有正链同源臂的ssODN供体(OLI16431)的共递送将编辑频率从没有供体情况下的8.0％提高到75.6％，如通过电穿孔后72小时对提取的基因组DNA的HBG PCR产物的测序分析确定的(图13A)。这种编辑水平使HbF水平比背景值增加约24％(图13A)。另外，应当注意，在任何测试剂量下，通过DAPI排除或集落形成潜力(图13C)测得的观察到的细胞生存力未降低(图13B)。

实例10：优化HBG1-1-Cpf1 RNP和OLI16431的剂量，以最大化RNP靶向的远端CCAAT 盒位点的编辑

当共递送ssODN与RNP时，已显示出增加的编辑(参见，例如，实例9)，使用相同的方法来优化每个组分的剂量，以使总编辑最大化。简而言之，用RNP建立剂量矩阵，该RNP包含与未经修饰的HBG1-1 gRNA(SEQ ID NO:1022，表8)复合的His-AsCpf1-sNLS-sNLS H800A蛋白(SEQ ID NO:1032，表8)(“His-AsCpf1-sNLS-sNLS H800A_HBG1-1 RNP”)，与0-12μM的OLI16431(SEQ ID NO:1040，表7)以0-12μM共递送。使用与8μM OLI16431共递送的剂量为8μM的His-AsCpf1-sNLS-sNLS H800A_HBG1-1 RNP，当通过对从红系培养14天后从细胞中提取的基因组DNA的HBG PCR产物进行测序分析进行测量时，实现89.4％的***缺失最大值(图14A)。在这些剂量条件下，这与HbF水平增加到比背景高>32％一致(图14A)。该样品(His-AsCpf1-sNLS-sNLS H800A_HBG1-1 RNP[8μM]+OLI16431[8μM])的生存力在电穿孔后48小时及红系培养14天后均与未经处理的对照样品相当(图14B)。

然而，当单独将>8μM的OLI16431电穿孔进入细胞而没有RNP时，观察到假象。在这些条件下，电穿孔后48小时进行PCR扩增时会产生假阳性结果，这很可能是由于***中过多的ssODN(参见图14A，对于只有OLI16431的情况在48小时处为8μM和12μM(黑柱))。在较低剂量的ssODN和以后的时间点，这种假阳性现象不再明显(图14A，对于只有OLI16431的情况在48小时处为4μM和6μM(黑色柱)并且对于只有OLI16431的情况在14天处为4μM、6μM、8μM和12μM(浅灰色柱))。另外，在单独使用ssODN的组中观察到的细胞生存力下降(图14B，在仅使用12μM OLI16431情况下在48小时处下降至约57％(黑色柱))可能是复合因素。ssODN剂量为4μM和6μM时没有假阳性结果，表明该假象可能是由于过量的ssODN。这些因素，以及分别在只有8μM和12μM OLI16431的组中观察到的基线HbF水平(图14A，灰点，如与阴性对照相比)提供了把握，即随着添加ssODN，RNP编辑的实质性和持续性增强是真实的，而不是假象。

实例11：含有多种Cpf1和靶向HBG启动子区域的gRNA的RNP支持人造血干/祖细胞中的基因编辑，所述基因编辑促进红系后代中HbF蛋白表达的诱导

将包含SEQ ID NO:1022、1023、1041-1093、1098-1106(表13)的指导RNA与各种Cpf1变体酶(SEQ ID NO:1032、1094-1097、1107-1109，表14)复合，形成各种RNP复合物(表15)。RNP含有具有gRNA的5’末端修饰和/或3’末端的修饰的gRNA(表13)。包含SEQ ID NO:1022、1023、1041-1084、1098-1106(表13)的指导RNA在远端CCAAT盒靶区域具有相同的预期切割位点，相关的靶向结构域含有SEQ ID NO:1002(HBG1-1)、SEQ ID NO:1254(HBG1-1-21mer)、SEQ ID NO:1256(HBG1-1-22mer)、SEQ ID NO:1258(HBG1-1-23mer)(分别针对包含20mer、21mer、22mer或23mer原间隔子序列的gRNA)所示序列(表15，表16)。在某些情况下，还测试了靶向HBG启动子内其他位置的gRNA，包括指导RNASEQ ID NO:1085-1096，其包含含有SEQ ID NO:1260(AsCpf1 HBG1启动子1(21mer))、SEQ ID NO:1262(AsCpf1 HBG1启动子2(21mer))或SEQ ID NO:1264(AsCpf1 HBG1启动子6(21mer))所示的序列的靶向结构域(表16，表17)。表15提供了在实例11-13中测试的每种RNP的列表以及形成每种RNP复合物的gRNA的SEQ ID NO和Cpf1变体的SEQ ID NO。有关每种gRNA和Cpf1变体的其他信息，分别可以在表13和表14中找到。

实例11和12中使用的gRNA是化学合成的。用于寡核苷酸合成的化学品购自生物自形成公司(BioAutomation)、格兰研究公司(Glen Research)、密理博西格玛公司(Millipore Sigma)、西格玛奥德里奇公司(Sigma-Aldrich)、化学基因公司(ChemGenes)和赛默飞世尔科技公司(Thermo Fisher Scientific)。用于合成的固体支持物是ChemGenes的Unylinker

CPG树脂、2’-TBDMS rU

CPG树脂或2’-O-甲基腺苷(N-Bz)Icaa

CPG树脂。RNA(TBDMS保护的)和DNA亚磷酰胺购自赛默飞世尔科技公司。在某些实施例中，在硫化步骤期间用来自格兰研究公司的DDTT(3-((二甲基氨基-亚甲基)氨基)-3H-1,2,4-二噻唑-3-硫酮)溶液引入硫代磷酸酯。使用标准RNA和DNA亚磷酰胺化学方法，在BioAutomation MerMade 12合成仪或GE

OligoPilot 100合成仪上合成寡核苷酸。合成后，将寡核苷酸从固体支持物上切割下来，并使用氢氧化铵/甲胺和TEA-3HF在两步过程中脱保护。脱盐后，在制备型HPLC上使用反相色谱法纯化寡核苷酸。

首先，测试了使用包含gRNA(具有gRNA的5’末端修饰)的RNP进行编辑的效果。简而言之，在补充有SCF、TPO和FLT3的X-Vivo 10培养基中进行预刺激48小时后，通过MaxCyte电穿孔将RNP复合物(6.0μM和12μM)递送至1x10⁶mPB CD34+细胞。在电穿孔后72小时，通过对PCR扩增的靶位点的Illumina测序(NGS)分析靶位点处的***/缺失水平。结果证明，包含不具有修饰的gRNA的RNP(RNP33，也称为HBG1-1-AsCpf1 RNP，表8)或包含具有5’末端修饰(包括添加5nt RNA(RNP37)，10nt RNA(RNP38)，25nt RNA(RNP39)，60nt RNA(RNP40)，5nt DNA(RNP41)，10nt DNA(RNP42)，25nt DNA(RNP43)和60nt DNA(RNP44))的gRNA的RNP(表15)支持中靶编辑(图15)。

接下来，测试了Cpf1 RNP与Sp182失活RNP(包含与化脓链球菌Cas9(SEQ ID NO:1033)复合的SEQ ID NO:1027(表8)的失活gRNA)或ssODN OLI16431(SEQ ID NO:1040，表7)的共递送的效果。简而言之，在补充有SCF、TPO和FLT3的X-Vivo 10培养基中进行48小时预刺激后，经由MaxCyte电穿孔将具有不同浓度(6μM、8μM、8μM和12μM)的RNP33(无5’或3’gRNA修饰，表15)复合物的给药矩阵与Sp182 RNP(8μM、8μM、6μM和4μM)或ssODN OLI16431(8μM、8μM、6μM和4μM)共递送到5.25x10⁶mPB CD34+细胞。电穿孔后，将细胞放回培养另外48小时。然后，将一部分CD34细胞分离，以进行gDNA提取并在混合细胞群体中进行***缺失定量。另外，为了调查表型祖细胞和表型造血干细胞(HSC)的编辑，通过免疫表型分型(Notta 2011)表征了HSPC亚群(在其余的CD34细胞中)，并通过荧光激活细胞分选术(FACS)进行分离。通过用针对hCD34、hCD38、hCD45RA、hCD90和hCD123的抗体染色细胞，在电穿孔后的48小时进行免疫表型分型。表型HSC定义为hCD34亮hCD38 hCD90+hCD45RA-，并且祖细胞定义为hCD34亮CD38+。通过FACS对这两个群体进行分选，并提取DNA以确定这些亚群中的编辑水平。通过PCR扩增的靶的Illumina测序(NGS)分析靶标位点处的***/缺失水平。结果表明，RNP33与“加强元件”Sp182 RNP或ssODN OLI16431的共递送提供支持中靶编辑(图16A-16B)，其水平高于单独递送RNP33时观察到的水平(图15)。

接下来，测试了RNP33(无5’或3’gRNA修饰，表15)、RNP43(+25DNA5’gRNA修饰，表15)或RNP34(1xPS2-OMe+1xOMe 3’gRNA，表15)与Sp182 dgRNA(表9)或ssODN OLI16431(表7)的共递送的效果。简而言之，在补充有SCF、TPO和FLT3的X-Vivo 10培养基中进行预刺激48小时后，通过MaxCyte电穿孔将RNP33、RNP34或RNP43复合物(8μM)与Sp182 RNP(8μM)或ssODN OLI16431(8μM)共递送至5.25x10⁶mPB CD34+细胞。在电穿孔后，将细胞放回培养另外48小时，然后分类为表型祖细胞和表型HSC级分以进行***缺失定量。在电穿孔后48小时，通过对PCR扩增的靶位点的Illumina测序(NGS)分析靶位点处的***/缺失水平。结果证明，与“加强元件”Sp182 RNP或ssODN OLI16431共递送的含有带有5’修饰或3’修饰的gRNA的RNP支持中靶编辑(图17)。测试的两个加强元件均提供了与RNP34和RNP33可比较的编辑水平。当与不具有加强元件情况下的编辑水平进行比较时，虽然两个加强元件都增强了RNP33编辑，但是RNP43编辑仅在添加Sp182 RNP情况下增加(图15、17)。

接下来，测试了不同的Cpf1蛋白对RNP编辑的影响。用包含各种Cpf1蛋白的RNP进行了化学计量比较(gRNA:Cpf1)。简而言之，RNP(RNP64、RNP63、RNP45，表15)以2或4的化学计量(gRNA:Cpf1复合比)递送，其中gRNA摩尔过量。在补充有SCF、TPO和FLT3的X-Vivo 10培养基中进行预刺激48小时后，所有RNP均通过MaxCyte电穿孔以8μM递送至1x10⁶CD34+细胞。电穿孔后，在***缺失定量之前，将细胞放回培养另外72小时。结果表明，在测试浓度下，化学计量比改变时编辑率没有差异(图18)。RNP45(包含Cpf1蛋白SEQ ID NO:1094)优于RNP63(包含Cpf1蛋白SEQ ID NO:1095)和RNP64(包含Cpf1 SEQ ID NO:1109)。

接下来，测试了Sp182 RNP或ssODN OLI16431与含有不同Cpf1蛋白的各种RNP的共递送的效果。简而言之，单独将RNP(RNP33、RNP64、RNP63、RNP45，表15)或与Sp182 RNP或ssODN OLI16431组合递送。在补充有SCF、TPO和FLT3的X-Vivo 10培养基中进行预刺激48小时后，所有试剂均通过MaxCyte电穿孔以8μM递送至1x10⁶CD34+细胞。电穿孔后，在***缺失定量之前，将细胞放回培养另外72小时。结果表明，对于所有测试的RNP，“加强元件”Sp182RNP或ssODN OLI16431增强编辑(图19)。

测试了使用含有具有各种5’DNA延伸的gRNA的RNP或不带5’DNA延伸的RNP(RNP45)与或不与ssODN OLI16431共递送情况下进行编辑的效果。简而言之，在补充有SCF、TPO和FLT3的X-Vivo 10培养基中进行预刺激48小时后，经由MaxCyte电穿孔将浓度8μM的RNP(RNP45(无5’修饰)、RNP46、RNP47、RNP48、RNP49、RNP50、RNP51、RNP52、RNP53、RNP54、RNP55、RNP56以及RNP57，表15)单独或与8μM ssODN OLI16431共递送至1x10⁶CD34+细胞。电穿孔后，在***缺失定量之前将细胞放回培养。结果证明，所有RNP都支持中靶编辑(图20)。

测试了使用RNP(包括具有相同5’DNA延伸但不同3’gRNA修饰的gRNA)进行编辑的效果，以评估3’gRNA修饰的影响。简而言之，在补充有SCF、TPO和FLT3的X-Vivo 10培养基中进行48小时预刺激后，经由MaxCyte电穿孔以8μM的浓度将包含具有匹配的5’末端但不同的3’gRNA修饰的gRNA的RNP(RNP49相比于RNP58和RNP59相比于RNP60)递送至1x10⁶个CD34+细胞。电穿孔后，在***缺失定量之前将细胞放回培养。在两个比较中，在电穿孔后24小时，含有具有3’PS-OMe的gRNA的RNP优于未经修饰的3’版本(图21)。

接下来，针对RNP58测试了不同浓度的Cpf1和gRNA。简而言之，将RNP58(+25DNA5’gRNA修饰和1xPS-OMe 3’gRNA修饰，表15)经由MaxCyte电穿孔以2:1、1:1或0.5:1摩尔比的化学计量(gRNA:Cpf1的复合比)在预刺激48小时后递送至1x10⁶个CD34+细胞。电穿孔后，在***缺失定量之前将细胞放回培养。在所有测试剂量下，当RNP以2:1的比例复合时，编辑效果最佳(图22A-22B)。

进一步测试了使用RNP(包括具有相同5’DNA延伸但不同3’gRNA修饰的gRNA)进行编辑的效果，以评估3’gRNA修饰的影响。简而言之，预刺激48小时后，通过MaxCyte电穿孔将包含具有匹配的5’末端但不同的3’gRNA修饰的gRNA的RNP(RNP58、RNP2、RNP3、RNP4、RNP5、RNP6、RNP7、RNP8、RNP9、RNP10)以不同的浓度(1μM、2μM、4μM)递送至1x10⁶个CD34+细胞。电穿孔后，在***缺失定量之前将细胞放回培养。结果证明，所有RNP都支持按中靶编辑(图23A-23B)。

接下来，测试了由RNP进行的编辑，所述RNP包括靶向HBG启动子各个区域的具有3’gRNA修饰或5’和3’修饰的gRNA。那些包括指导RNA SEQ ID NO:1085-1096，其包含靶向结构域SEQ ID NO:1260(AsCpf1 HBG1启动子-1(21mer))、1262(AsCpf1 HBG1启动子-2(21mer))、1264(AsCpf1 HBG1启动子-6)(21mer))(表16，表17)。代替远端CCAAT盒靶区域，将这些gRNA配置为在选自表11的区域内提供编辑事件。简而言之，在补充有SCF、TPO和FLT3的X-Vivo 10培养基中进行48小时预刺激后，将包括含有未经修饰的5’gRNA和1xPS-OMe 3’gRNA修饰的gRNA的RNP(RNP11、RNP16、RNP19和RNP22，表15)、包括含有+20DNA+2xPS 5’gRNA修饰和1xPS-OMe 3’gRNA修饰的gRNA的RNP(RNP12、RNP21和RNP24，表15)、包括含有+25DNA5’gRNA修饰和1xPS-OMe 3’gRNA修饰的gRNA的RNP(RNP58和RNP20，表15)通过MaxCyte电穿孔以8μM的浓度递送至1x10⁶个CD34+细胞。在对mPB CD34+细胞进行编辑后，进行了18天的离体分化为红系谱系(Giarratana 2011)，其中在培养的第14天分离了gDNA用于***缺失分析。简而言之，如上所述，将RNP递送至CD34+细胞。在补充有SCF、TPO和FLT3的X-Vivo10培养基中恢复48小时后，对经处理的细胞进行计数并转移至红系分化培养基中，其中在第4、7、10和14天进行细胞计数和补料，并在第18天进行红系收集。然后对这些CD34+衍生的红系细胞进行计数，并在HPLC级水中溶解，然后过滤除去细胞碎片。然后，通过UPLC测量每个样品的γ-珠蛋白链的相对表达水平(相比于总β样珠蛋白链)，其中通过逐渐增加含0.1％三氟乙酸的乙腈与含0.1％三氟乙酸的水的比例来实现蛋白分离(图24A-24C)。图24A-24C显示出所有RNP支持中靶编辑。但是，仅在某些靶位点进行编辑会导致HBF表达增加。使用不同浓度(0、1μM、2μM、4μM)的RNP58进行了相同的实验(图25)。

接下来，测试了不同的Cpf1蛋白对RNP编辑的影响。简而言之，在补充有SCF、TPO和FLT3的X-Vivo 10培养基中进行48小时预刺激后，将包括与不同Cpf1蛋白复合的gRNA(包含SEQ ID NO:1051(+25DNA 5’gRNA修饰和1xPS-OMe3’gRNA修饰，表13))的RNP58、RNP26、RNP27和RNP28(表15)通过MaxCyte电穿孔以8μM递送至1x10⁶个CD34+细胞。结果证明，所有RNP都支持中靶编辑(图26)。

接下来，测试了含有具有不同5’gRNA修饰和相同3’修饰的gRNA的不同RNP的效果。简而言之，在补充有SCF、TPO和FLT3的X-Vivo 10培养基中进行48小时预刺激后，将RNP(RNP58(+25DNA 5’gRNA修饰和1xPS-OMe 3’gRNA修饰)、RNP29(+25DNA+2xPS 5’gRNA修饰和1xPS-OMe 3’gRNA修饰)、RNP30(聚A RNA+2xPS 5’gRNA修饰和1xPS-OMe 3’gRNA修饰)和RNP31(聚U RNA+2xPS 5’gRNA修饰和1xPS-OMe 3’gRNA修饰)(表15)通过MaxCyte电穿孔以1μM、2μM或4μM递送至1x10⁶个CD34+细胞(由于细胞的可用性，未在1μM下测试RNP30)。结果证明，所有RNP都支持中靶编辑(图27)。

接下来，测试了不同的Cpf1蛋白对RNP编辑的影响。简而言之，在补充有SCF、TPO和FLT3的X-Vivo 10培养基中进行48小时预刺激后，将包括与不同Cpf1蛋白复合的gRNA(包含SEQ ID NO:1051(+25DNA 5’gRNA修饰和1xPS-OMe3’gRNA修饰，表13))的RNP58、RNP27和RNP26(表15)通过MaxCyte电穿孔以2μM或4μM递送至1x10⁶个CD34+细胞。为了研究混合CD34、表型祖细胞和表型造血干细胞(HSC)的编辑，对HSPC亚群进行了表征。因此，在电穿孔后，将细胞放回培养另外48小时，然后分类为祖细胞和HSC级分以进行***缺失定量。在电穿孔后48小时，通过对PCR扩增的靶位点的Illumina测序(NGS)分析靶位点处的***/缺失水平。结果证明，所有RNP都支持混合CD34、表型祖细胞和表型造血干细胞中的中靶编辑(图28)。

接下来，测试了RNP与Sp182 RNP(包含与化脓链球菌Cas9(SEQ ID NO:1033)复合的SEQ ID NO:1027(表8)的失活gRNA)或ssODN OLI16431(SEQ ID NO:1040，表7)的共递送对含有不同Cpf1蛋白的RNP的效果。简而言之，在补充有SCF、TPO和FLT3的X-Vivo 10培养基中进行预刺激48小时后，通过MaxCyte电穿孔将RNP61、RNP62，RNP34(表15)以8μM与Sp182RNP(8μM)或ssODN OLI16431(8μM)共递送至25x10⁶个mPB CD34+细胞。为了研究混合CD34、表型祖细胞和表型造血干细胞(HSC)的编辑，对HSPC亚群进行了表征。因此，在电穿孔后，将细胞放回培养另外48小时，然后分类为祖细胞和HSC级分以进行***缺失定量。在电穿孔后48小时，通过对PCR扩增的靶位点的Illumina测序(NGS)分析靶位点处的***/缺失水平。结果证明，与“加强元件”Sp182 RNP或ssODN OLI16431共递送的RNP支持中靶编辑(图29)。在电穿孔后24小时还将这些细胞的一部分冷冻保存，以在体内植入模型中进一步表征(参见实例12)。

接下来，测试了RNP58和RNP32编辑的效果。简而言之，在补充有SCF、TPO和FLT3的X-Vivo 10培养基中进行预刺激48小时后，通过MaxCyte电穿孔将RNP58和RNP32(表15)以2μM递送至6x10⁶个mPB CD34+细胞。为了研究混合CD34、表型祖细胞和表型HSC的编辑，对HSPC亚群进行了表征。因此，在电穿孔后，将细胞放回培养另外48小时，然后分类为祖细胞和HSC级分以进行***缺失定量。在电穿孔后48小时，通过对PCR扩增的靶位点的Illumina测序(NGS)分析靶位点处的***/缺失水平。结果证明RNP58和RNP32支持中靶编辑(图30)。

在补充有SCF、TPO和FLT3的X-Vivo 10培养基中进行预刺激48小时后，通过MaxCyte电穿孔将RNP58和RNP1以2μM至8μM的浓度递送至25x10⁶个mPB CD34+细胞(表15)。为了研究混合CD34、表型祖细胞和表型造血干细胞(HSC)的编辑，对HSPC亚群进行了表征。因此，在电穿孔后，将细胞放回培养另外48小时，然后分类为祖细胞和HSC级分以进行***缺失定量。在电穿孔后48小时，通过对PCR扩增的靶位点的Illumina测序(NGS)分析靶位点处的***/缺失水平。结果证明测试的RNP支持中靶编辑(图31)。在电穿孔后24小时还将这些细胞的一部分冷冻保存，以在体内植入模型中进一步表征(参见实例12)。

实例12：将经编辑的mPB CD34+细胞输注到NOD,B6.SCID Il2rγ-/-Kit(W41/W41) 小鼠中导致长期植入和HbF诱导

为了确定与ssODN OLI16431(SEQ ID NO:1040，表7)共递送的RNP34和RNP33(表15)的递送是否在长期繁殖的造血干细胞中实现编辑，将来自动员外周血(mPB)的成人CD34+细胞输注入未辐照的NOD,B6.SCID Il2rγ-/-Kit(W41/W41)(杰克森(Jackson)实验室储备名称：NOD.Cg-Kit<W-41J>Tyr<+>Prkdc<scid>Il2rg<tm1Wjl>/ThomJ)(“NBSGW”)小鼠。简而言之，在补充有SCF、TPO和FLT3的X-Vivo 10培养基中进行48小时预刺激后，将mPB CD34+细胞用8μM剂量的RNP和6μM ssODN OLI16431通过MaxCyte电穿孔以62.5x10⁶/mL进行电穿孔。24小时后，将mCD34+细胞冷冻保存。五天后，将mPB CD34+细胞解冻，并通过静脉内尾静脉注射以每只小鼠100万个细胞输注入NBSGW小鼠。八周后，对小鼠实施安乐死，并从股骨、胫骨和骨盆骨中收集骨髓(BM)。通过FACS分离分别鉴定为CD15+、CD19+、糖蛋白A(GlyA，CD235a+)和谱系阴性CD34+的细胞的骨髓亚群，并提取DNA以确定每个这些级分的编辑水平。图32描绘了由下一代测序确定的未分级BM或按流分选的各单独BM亚群的***缺失的频率。

接下来，为了确定与Sp182 RNP(包含与化脓链球菌Cas9(SEQ ID NO:1033)复合的SEQ ID NO:1027(表8)的失活gRNA)共递送的RNP34或RNP33(表15)的递送是否在长期繁殖的造血干细胞中实现编辑，将来自动员的外周血(mPB)的成人CD34+细胞输注入未辐照的NBSGW小鼠中。简而言之，在补充有SCF、TPO和FLT3的X-Vivo 10培养基中进行48小时预刺激后，将mPB CD34+细胞用不同剂量的RNP和不同剂量的Sp182 RNP通过MaxCyte电穿孔以62.5x10⁶/mL进行电穿孔。24小时后，将mCD34+细胞冷冻保存。五天后，将mPB CD34+细胞解冻，并通过静脉内尾静脉注射以每只小鼠100万个细胞输注入NBSGW小鼠。八周后，对小鼠实施安乐死，并从股骨、胫骨和骨盆骨中收集骨髓(BM)。通过FACS分离分别鉴定为CD15+、CD19+、糖蛋白A(GlyA，CD235a+)和谱系阴性CD34+的细胞的骨髓亚群，并提取DNA以确定每个这些级分的编辑水平。图33A描绘了由下一代测序确定的未分级BM或按流分选的各单独BM亚群的***缺失的频率。

最后，分析了衍生自BM的CD34+细胞的长期HbF诱导。在红系分化条件下将BM细胞的等分试样培养18天(Giarratana 2011)，并通过UPLC评估HbF表达。简而言之，将在输注后8周从小鼠中提取的未分级的BM细胞置于红系培养条件下18天。在第7、10和14天进行细胞计数和补料，在第18天进行红系收集。然后对这些骨髓衍生的红系细胞进行计数，并在HPLC级水中溶解，然后过滤除去细胞碎片。然后，通过UPLC测量每个样品的γ-珠蛋白链的相对表达水平(相比于总β样珠蛋白链)，其中通过逐渐增加含0.1％三氟乙酸的乙腈与含0.1％三氟乙酸的水的比例来实现蛋白分离(图33B)。这些数据证明，通过与Sp182 RNP共递送的RNP34和RNP33编辑人CD34+细胞实现了稳健的长期HbF诱导。

接下来，为了确定与ssODN OLI16431(SEQ ID NO:1040，表7)共递送的RNP61或RNP62(表15)的递送是否在长期繁殖的造血干细胞中实现编辑，将来自mPB的成人CD34+细胞输注入未辐照的NBSGW小鼠中。简而言之，在补充有SCF、TPO和FLT3的X-Vivo 10培养基中进行48小时预刺激后，将mPB CD34+细胞用8μM RNP和8μM ssODN OLI16431通过MaxCyte电穿孔以62.5x10⁶/mL进行电穿孔。24小时后，将mCD34+细胞冷冻保存。四天后，将mPB CD34+细胞解冻，并通过静脉内尾静脉注射以每只小鼠100万个细胞输注入NBSGW小鼠。八周后，对小鼠实施安乐死，并从股骨、胫骨和骨盆骨中收集骨髓(BM)。通过FACS分离分别鉴定为CD15+、CD19+、糖蛋白A(GlyA，CD235a+)和谱系阴性CD34+的细胞的骨髓亚群，并提取DNA以确定每个这些级分的编辑水平。图34A描绘了由下一代测序确定的未分级BM或按流分选的各单独BM亚群的***缺失的频率。

最后，分析了衍生自BM的CD235a+(GlyA+)红系细胞的长期HbF诱导。在红系分化条件下将BM细胞的等分试样培养18天，并通过UPLC评估HbF表达。简而言之，将在输注后8周从小鼠中提取的未分级的BM细胞置于红系培养条件下18天。图34B描绘了红系细胞的HbF表达，计算为γ/β样链(％)。这些数据证明，通过与ssODN OLI16431共递送的RNP61和RNP62编辑人CD34+细胞实现了稳健的长期HbF诱导。

接下来，为了确定RNP1或RNP58(表15)的递送是否在长期繁殖的造血干细胞中实现编辑，将来自mPB的成人CD34+细胞输注入未辐照的NBSGW小鼠中。简而言之，在补充有SCF、TPO和FLT3的X-Vivo 10培养基中进行48小时预刺激后，将mPB CD34+细胞用4μM或8μMRNP1或2μM、4μM或8μM RNP58通过MaxCyte电穿孔以62.5x10⁶/mL进行电穿孔。24小时后，将mCD34+细胞冷冻保存。四天后，将mPB CD34+细胞解冻，并通过静脉内尾静脉注射以每只小鼠100万个细胞输注入NBSGW小鼠。八周后，对小鼠实施安乐死，并从股骨、胫骨和骨盆骨中收集骨髓(BM)。通过流式细胞术确定了BM中的人嵌合性和谱系重构(CD45+、CD14+、CD19+、糖蛋白A(GlyA、CD235a+)、谱系和CD34+以及小鼠CD45+标记表达)并进行了分析(图35)。GlyA+细胞的频率计算为BM中GlyA+细胞/总细胞。人嵌合性被定义为人CD45/(人CD45+mCD45)。

与模拟转染的mPB CD34+细胞相比，RNP转染的mPB CD34+细胞在移植后8周获得了相似的嵌合性和谱系分布，这证明编辑与保留造血干细胞的植入潜力是相当的。图36描绘了在输注后8周，由下一代测序确定的未分级BM的***缺失。图37显示了在具有2μM、4μM或8μM RNP58的BM、CD15+、CD19+、糖蛋白A(GlyA、CD235a+)和lin-CD34+细胞中***缺失率的频率。

还分析了来自经编辑的CD34+细胞的CD235a+(GlyA+)红系细胞的长期HbF诱导。通过荧光激活细胞分选术(FACS)分离从骨髓获得的GlyA+细胞，收集并在HPLC级水中裂解。然后通过UPLC评估裂解物的HbF表达。图38描绘了GlyA+细胞的HbF表达，计算为γ/β样链(％)。这些数据证明，在各种RNP58浓度下，对人CD34+细胞进行RNP58编辑实现稳健的长期HbF诱导。

重要的是，用不同浓度的RNP1或RNP58电穿孔的CD34⁺细胞维持其离体造血活性(即，与未处理的供体匹配的CD34⁺细胞阴性对照相比，红系和骨髓集落的量或多样性没有差异)，如在造血集落形成细胞(CFC)测定中确定的(图39)。

实例13：在HBG启动子远端CCAAT盒区域的NHEJ介导的4个核苷酸或更大的缺失被长期维持，并且促进HbF表达升高。

递送含有靶向HBG启动子区域(图41A)的Cas9或Cpf1酶的RNP导致产生大量***和缺失(***缺失)。这些包括衍生自微同源介导的末端连接(MMEJ)和非同源末端连接(NHEJ)修复机制的***缺失。如下所示，在长期干细胞群体(HSC)的编辑过程中，MMEJ修复机制未得到很好的利用，并且这种类型的编辑会随着时间的推移而丢失。

简而言之，在补充有SCF、TPO和FLT3的X-Vivo 10培养基中进行48小时预刺激后，将mPB CD34+细胞用Sp35 RNP经由MaxCyte电穿孔以62.5x10⁶/mL进行电穿孔。Sp35 RNP包含Sp35 gRNA(包含SEQ ID NO:339的靶向结构域(即，CUUGUCAAGGCUAUUGGUCA(RNA))；与化脓链球菌野生型(Wt)Cas9蛋白复合的SEQ ID NO:917(即，CTTGTCAAGGCTATTGGTCA(DNA))。24小时后，收集mPB CD34+细胞的等分试样用于预输注(CD34)***缺失分析，另一等分试样置于红系分化中，用于红系祖细胞后代的***缺失分析。将其余细胞冷冻保存并储存在液氮中，直至开始植入研究。在输注时，解冻mPB CD34+细胞并且经由静脉内尾静脉注射以每只小鼠100万个细胞输注入未辐照的NOD,B6.SCID Il2rγ-/-Kit(W41/W41)(杰克森实验室储备名称：NOD.Cg-Kit<W-41J>Tyr<+>Prkdc<scid>Il2rg<tm1Wjl>/ThomJ)(“NBSGW”)小鼠。十六周后，对小鼠实施安乐死，并从股骨、胫骨和骨盆骨中收集骨髓(BM)，并且通过FACS分离谱系阴性CD34+，并从预输注时收集的细胞、其红系后代(体外衍生)和体内16周时收集的细胞中提取DNA，以使用以下引物测定***缺失(***/缺失)：正向＝CATGGCGTCTGGACTAGGAG(SEQ ID NO:1266)和反向＝AAACACATTTCACAATCCCTGAAC(SEQ IDNO:1267)。分析每个检测到的缺失周围的读取序列，以鉴定其是否可能是MMEJ或NHEJ途径的DSB修复的结果。MMEJ与NHEJ的区别在于MMEJ使用了微同源序列。MMEJ修复依赖于DSB周围位于近端的核苷酸重复延伸(微同源物)的链切除和退火。所得的缺失去除微同源序列中的一个以及两个微同源之间的整个间插序列。因此，可能的MMEJ介导的缺失可以通过搜索缺失序列任一端处的核苷酸序列的存在来鉴定，该核苷酸序列在紧邻缺失另一端的区域重复。基于此，如果在缺失边界检测到2个碱基对(bp)或更多碱基对的延伸，并且在紧接缺失另一端的侧翼区域重复，则将缺失分类为“MMEJ”。将所有其他的缺失分类为NHEJ。

输注前，约30％的***缺失衍生自MMEJ修复(图41B，CD34，黑色条纹柱＝MMEJ，白色柱＝NHEJ)。在红系祖细胞中(基于CD34细胞的红系分化后检测到的***缺失)，MMEJ***缺失表示约36％的***缺失(图41B，Prog，黑色条纹柱＝MMEJ，白色柱＝NHEJ)。植入16周后，大部分MMEJ***缺失丢失(图41B，HSC，黑色条纹柱＝MMEJ，白色柱＝NHEJ)，其中NHEJ衍生的编辑被维持。其他人也观察到了这一观察(Bauer 2019，Wu 2019，Weber 2020)，并且似乎没有位点特异性。这有助于在体内较晚时间点，从构成大部分CD34+细胞预输注的主动循环和MMEJ倾向短寿命的祖细胞的主导群体到输出更为静止(和更少MMEJ倾向的)自我更新造血干细胞(HSC)的转变。虽然HSC在植入后长期提供造血重构，但在预输注的CD34+混合群体中，HSC代表了非常罕见的群体。这一发现强调需要使用编辑工具，通过NHEJ介导的修复而不是MMEJ修复产生HbF诱导***缺失，以实现持久的HbF表达。

另外，在HBG1/2启动子的远端CCAAT盒区域处的基因型与表型分析鉴定了导致大多数升高的HbF表达的突变。进行单细胞实验以评估衍生自在远端CCAAT盒区域处编辑的mPB CD34+细胞的红系细胞中γ链表达水平的分布。使用Sp35 RNP或RNP34(表15)+Sp182-Cas9-RNP(图5F，表8)，在该位点产生***缺失。简而言之，在补充有SCF、TPO和FLT3的X-Vivo 10培养基中进行48小时预刺激后，用与8μM Sp182-Cas9-RNP共递送的4μM Sp35 RNP或8μM HBG1-1-AsCpf1H800A-RNP(所有RNP以4:1gRNA:RNA指导的核酸酶的摩尔比)经由MaxCyte电穿孔，将mPB CD34+细胞以6.25x10⁶/mL(100μl)进行电穿孔。Sp35 RNP包含Sp35gRNA(包含SEQ ID NO:339的靶向结构域(即，CUUGUCAAGGCUAUUGGUCA(RNA))；与化脓链球菌野生型(Wt)Cas9蛋白复合的SEQ ID NO:917(即，CTTGTCAAGGCTATTGGTCA(DNA))。RNP34包含HBG1-1-AsCpf1H800A-RNP(由His-AsCpf1-sNLS-sNLS-H800A(SEQ ID NO:1032)与具有表8中所示的3’修饰的HBG1-1 gRNA(SEQ ID NO:1041)复合组成)。在电穿孔后48小时使其恢复后，通过荧光激活细胞分选术(FACS)以1个细胞/孔在非组织培养处理的384孔板中分选细胞。然后使细胞分化并克隆扩增18天成为红系谱系(改编自Giarratana 2011)。进行了UPLC分析，以确定衍生自最初编辑的mPB-CD34+细胞总群体的细胞的克隆性红系后代中G-γ链表达水平的分布(G-γ/[总β样链]的百分比)。在去核前，在来自第14天收集的每个克隆培养物等分试样的gDNA上进行测序分析(使用以下引物进行***缺失的等位基因鉴定和检测：正向＝CATGGCGTCTGGACTAGGAG(SEQ ID NO:1266)和反向＝AAACACATTTCACAATCCCTGAAC(SEQ ID NO:1267))和ddPCR(缺失g-γ编码序列的4.9kb片段的丢失)，并能够鉴定与特异性***缺失关联的仅含有一个编码G-γ的等位基因的克隆。与较小的***缺失相比，破坏3个以上核苷酸的***缺失通常与更高的HbF表达关联(图41C)。这一发现强调，使用在远端CCAAT盒区域处产生较大缺失的编辑工具将提供更高的HbF表达水平，可能是通过更有效地破坏抑制HBG表达的调节因子在该位点的结合。值得注意的是，在衍生自用Cpf1 RNP编辑的CD34细胞的克隆中检测到评估的大部分较大缺失，而在衍生自用Cas9 RNP编辑的CD34细胞的克隆中检测到评估的大部分较小缺失(图41D)，这表明使用Cpf1更频繁地发生较大缺失，从而导致与Cas9相比，在经Cpf1编辑的CD34细胞的红系后代中HbF升高的细胞比例可能更高。与这一结果一致，与spCas9样品相比，在衍生自最初由Cpf1或Cas9 RNP编辑的mPB-CD34+细胞总群体的细胞的克隆红系后代中，γ链表达水平的分布(γ链/[总β样链]的百分比)显示出Cpf1样品中更高频率的细胞具有高HbF(图41E)。在衍生自用Cpf1 RNP编辑的CD34+细胞的分析的克隆中，83.1％的克隆的γ链水平高于从模拟电穿孔的mPB CD34+细胞衍生的红系细胞克隆中检测到的中值水平(中值＝18.8％)，64.2％的克隆的γ链水平超过了总β样链的30％并且35.8％的克隆的γ链水平超过了总β样链的48.8％(对照细胞中值水平为30％+18.8％)。在衍生自用Cas9 RNP编辑的CD34+细胞的分析的克隆中，71.4％的克隆的γ链水平高于从模拟电穿孔的mPB CD34+细胞衍生的红系细胞克隆中检测到的中值水平(中值＝18.8％)，49.5％的克隆的γ链水平超过了总β样链的30％并且23.1％的克隆的γ链水平超过了总β样链的48.8％(对照细胞中值水平为30％+18.8％)。

实例14：靶向HBG启动子的远端CCAAT盒区域的Cpf1 RNP有效地产生4个核苷酸或更大的持久的NHEJ介导的缺失

使用MaxCyte GT(MaxCyte公司)电穿孔设备，将RNP(由靶向HBG启动子的远端CCAAT盒区域的指导RNA与Cpf1或Cas9酶复合组成)电穿孔至动员的外周血(mPB)衍生的CD34+细胞中。简而言之，在补充有SCF、TPO和FLT3的X-Vivo 10培养基中进行48小时预刺激后，用4μM Sp35 RNP(摩尔比为2:1的gRNA:RNA指导的核酸酶)或8μM RNP58(表15)(摩尔比为4:1的gRNA:RNA指导的核酸酶)将mPB CD34+细胞以62.5x10⁶/mL进行电穿孔。Sp35 RNP包含Sp35gRNA(包含SEQ ID NO:339的靶向结构域(即，CUUGUCAAGGCUAUUGGUCA)(RNA))；与化脓链球菌野生型(Wt)Cas9蛋白复合的SEQ ID NO:917(即，CTTGTCAAGGCTATTGGTCA)(DNA))。

在电穿孔24小时后，分析靶位点处的***/缺失的水平和谱。按照文库制备方法和分析，通过Illumina扩增子测序(ILL-seq)评估样品中存在的小的***缺失部分。在该分析中使用了预期的剪切位点周围的15bp窗口来计算编辑率。图55A和图55B中提供了用于产生靶向扩增子测序产物的寡核苷酸和扩增子。

为表征通过RNP32的编辑，对每个样品中产生的***缺失进行了分析和处理。通过着眼于1)靶区域内每个碱基的缺失百分比，2)***和缺失中心位置的分布，以及3)***和缺失长度的分布，对这些结果进行了汇总。为了进行这些分析，使用以下步骤处理了比对bam文件中读段的cigar字符串：

1)对在相同读段中出现的***缺失进行分组。

2)创建用于每个读段的***缺失的***缺失_id。***缺失_id是标识***缺失的字符串，显示为***缺失_起始_位置+_+***缺失_长度+_+ID。其中对于缺失，ID是NA，并且对于***，ID是***的序列。参见图55D中的实例。

3)使用相同的***缺失_id对读段进行分组。

4)对具有相同***缺失的读段的数目进行计数，并且计算其总分数(包括wt)和***缺失中的分数(不包括wt)。当样品具有不同的总编辑量时，***缺失中的分数允许在样品间进行比较。

如果2个碱基对或更多碱基对的延伸是缺失边界并在紧接缺失另一端侧翼的区域重复，则将缺失分类为“MMEJ”。将所有其他的缺失分类为NHEJ。表24显示了在通过RNP58或Sp35 RNP编辑的样品中检测到的***缺失。

递送含有靶向HBG启动子区域(图41A)的Cas9或Cpf1酶的RNP导致产生大量***和缺失(***缺失)。不同的酶具有不同的机理特性(包括相对于其与DNA靶位点的接合及其切割活性)，并且留下影响修复结果的不同DNA末端(Sternberg 2014，Strohkendl 2018，Swarts 2018)。值得注意的是，Cpf1编辑产生四个核苷酸的5’突出端，这与SpCas9编辑的平末端有很大不同(参见图41A)。由靶向远端盒的Cpf1和Cas9 RNP(分别为RNP58和Sp35RNP)介导的编辑谱的评估表明，由两种酶产生的***缺失通常以远端CCAAT盒区域为中心(图42H)，并且对于两个RNP，最常见的缺失的碱基在位置TSS:-113处(图42E和42F)。然而，在***的情况下，如通过单独的***缺失相对于HBG-TSS的位置、长度和序列所定义的，单独的***缺失的评估证明，在使用SpCas9或Cpf1 RNP编辑位点后，编辑结果存在差异。图42C和42D显示出分别通过Cpf1和Cas9 RNP产生的前20个***缺失。由Cas9产生的最丰富的***缺失是MMEJ介导的13bp的缺失157_-13_NA(HBG1/2c.-102至-114，表24)，更常见称为13bp的HPFH缺失，与Cpf1样品中检测到为3.36％相比，在Cas9样品中检测到为31.88％，(分别为图42D和42C)。由Cpf1产生的最丰富的***缺失是MMEJ介导18nt的缺失159_-18_NA(HBG1/2c.-104至-121，表24)，与Cas9样品中检测到为1.35％相比，在Cpf1样品中检测到为18.53％，(分别为图42C和42D)。在每个样品中检测到的五种最常见的NHEJ***缺失是对于Cpf1样品长度为3至7bp的缺失，以及对于Cas9为1至4bp的缺失和1bp的***(分别为图42C和42D)。表24中所示为两个样品中任一个检测到的>0.1％的***缺失完整的列表。

虽然在这两个样品中任一个中检测到的>0.1％的大多数***缺失也在其他样品中检测到(大于或小于0.1％)，但它们在所有***缺失中的相对频率因酶而异(表24和图42I)。值得注意的是，在Cas9(Sp35 RNP)样品中检测到的***为14.09％，但很少在Cpf1(RNP58)样品中检测到(0.47％)。此外，与Cas9 RNP(Sp35RNP)相比，用Cpf1 RNP(RNP58)编辑的CD34细胞中富集了更大的***缺失(图42J)。图42G显示了由每个RNP产生的***缺失长度的分布，并且图42A显示了由归类为NHEJ介导的***缺失的每个RNP产生的***缺失长度的分布。由Cpf1产生的大多数***缺失大于3bp(图42G)，这被证明与红系细胞中更高的HbF有关(图41C)。Cas9也产生大于3bp的缺失，然而，那些缺失主要是经由MMEJ修复途径产生，预期在预输注后在体内观察到的频率较低，因为CD34+细胞内的HSC罕见群体对该修复途径利用不充分。NHEJ是由HSC利用的主要修复途径(图41B)，因此对NHEJ介导的***缺失谱的评估提供了在输注CD34+细胞后预计在体内长期维持的***缺失类型的信息。

当与Cas9 RNP(Sp35 RNP)相比，Cpf1 RNP(RNP58)显示出向更大的NHEJ介导的***缺失(图42A)转移，其中对于Cas9，最常观察到的NHEJ***缺失长度为1bp(相比于Cpf1为5bp)，表明Cpf1对于HbF的稳健和持久诱导具有更有利的CD34+细胞编辑谱。

图42B显示了由RNP58(Cpf1)或Sp35 RNP(Cas9)编辑产生的、在远端CCAAT盒处>3bp的NHEJ介导的***缺失、>3bp的MMEJ介导的***缺失、以及≤3bp的***缺失百分比(由SpCas9产生的***缺失(左饼图)：NHEJ>3bp＝21.42％；≤3bp＝48.84％；MMEJ>3bp＝29.74％；通过RNP58产生的***缺失(右饼图)：NHEJ>3bp＝64.86％；≤3bp＝11.11％；MMEJ>3bp＝24.02％)。Cas9(Sp35RNP)编辑的细胞包含大量的长度小于3bp的小的***缺失，并且长度>3bp的***缺失(与HbF的最高水平关联)主要通过MMEJ途径介导(图42B)。相反，接近90％的由Cpf1(RNP 58)介导的***缺失的长度>3bp，大约三分之二的那些***缺失由NHEJ介导(图42B)，这表明预计体内长期维持高比例的长度>3bp的***缺失，并且MMEJ介导的***缺失的比率降低，有利于NHEJ介导的***缺失(图41B)。总之，这强调了最持久的NHEJ介导的***缺失使用RNP58是有效的(>3bp)，然而Sp35 RNP产生更低比例的有效***缺失，其中许多是不持久的(MMEJ介导的)。这表明RNP58是有利的编辑工具，该编辑工具通过NHEJ介导的修复产生HbF诱导***缺失，而不仅仅是经由MMEJ修复来实现持久的HbF表达。

实例15：将RNP32编辑的mPB CD34+细胞输注到NOD,B6.SCID Il2rγ-/-Kit(W41/ W41)小鼠中导致长期植入、***缺失维持和高HbF诱导

为了确定RNP32是否在长期繁殖的造血干细胞中实现编辑，将来自动员外周血(mPB)的成人CD34+细胞输注入未辐照的NOD,B6.SCID Il2rγ-/-Kit(W41/W41)(杰克森实验室储备名称：NOD.Cg-Kit<W-41J>Tyr<+>Prkdc<scid>Il2rg<tm1Wjl>/ThomJ)(“NBSGW”)小鼠。简而言之，在补充有SCF、TPO和FLT3的X-Vivo 10培养基中进行48小时预刺激后，用6μM RNP32(表15)(摩尔比为2:1的gRNA:RNA指导的核酸酶)或仅用缓冲液(“模拟”)，经由MaxCyte电穿孔将mPB CD34+细胞以62.5x10⁶/mL进行电穿孔。另外24小时后，冷冻保存mCD34+细胞。电穿孔后将一部分细胞置于体外培养中长达72h，并且每天收集gDNA用于***缺失分析。输注当天，将mPB CD34+细胞解冻，并经由静脉内尾静脉注射以每只小鼠100万个细胞注入NBSGW小鼠。十六周后，对小鼠实施安乐死，并从股骨、胫骨和骨盆骨中收集骨髓(BM)。

从预输注的CD34+细胞(电穿孔后24-72小时)和植入16周后的骨髓中分离基因组DNA。电穿孔后24小时，实现大约92％***缺失，如通过使用以下引物进行中靶PCR产物的Illumina测序所测量的：正向＝CATGGCGTCTGGACTAGGAG(SEQ ID NO:1266)和反向＝AAACACATTTCACAATCCCTGAAC(SEQ ID NO:1267)。

在电穿孔后体外培养24h至72h后的预输注细胞群体上进行了长度≤3bp的***缺失和长度>3bp的***缺失(归类为MMEJ或NHEJ介导的***缺失)的***缺失长度分布和分类的分析。如果在缺失边界检测到2个碱基对(bp)或更多碱基对的延伸，并且在紧接缺失另一端的侧翼区域重复，则将缺失分类为“MMEJ”。将所有其他的缺失分类为NHEJ。

图43H-K中所示的***缺失长度的分布，并且对于NHEJ***缺失，仅在图43D-G中，在所有时间点上均非常相似(图43D和43K)。很少检测到***，并且最常见的观察到的缺失大小为-18，明显对应于18bp的MMEJ缺失HBG1/2c.-104至-121的大小，并且是使用Cpf1编辑该位点后频率最高的修复结果(图42C、57，表25)。在NHEJ***缺失中最常见的观察到的缺失大小为5bp，如图43D-G中所示。

在所有时间点，观察到大小大于3bp的***缺失(与HbF诱导的最高水平关联)(图41C)占所有***缺失的近90％(图43A-C)。约三分之二的那些***缺失由NHEJ介导，这表明预计体内长期维持高比例的长度>3bp的***缺失，其中MMEJ介导的***缺失的比率降低，有利于NHEJ介导的***缺失(图41B)。

16周植入后，测量约96％的***缺失，证明***缺失维持在长期繁殖CD34+细胞内(图43A)。

接下来，经由FACS分析鉴定骨髓内的细胞的亚群以确定多谱系植入的水平。通过流式细胞术确定了BM中的人嵌合性和谱系重构(CD45+、CD15+、CD19+、糖蛋白A(GlyA、CD235a+)、谱系和CD34+以及小鼠CD45+标记表达)并对其进行了分析。GlyA+细胞的频率计算为BM中GlyA+细胞/总细胞。人嵌合性被定义为人CD45/(人CD45+mCD45)。分析表明高水平的人嵌合性，与模拟电穿孔细胞相比无差异。在模拟和RNP32编辑的小鼠组中(图43M)，实现大于90％的人嵌合性。另外，在用RNP32或模拟电穿孔细胞输注的小鼠中观察到B细胞、中性粒细胞、红系和CD34+细胞谱系的可比较的重构(图43M)。

还分析了衍生自RNP32编辑的CD34+细胞的CD235a+(GlyA+)红系细胞的长期HbF诱导。对获得自骨髓的GlyA+细胞进行γ珠蛋白表达染色，并且经由流式细胞术分析。经编辑的细胞证明全细胞型分布，其中约90％的细胞为F阳性(图43N)。另外，通过荧光激活细胞分选术(FACS)分离GlyA+细胞群体，收集并在HPLC级水中裂解。然后通过UPLC评估裂解物的HbF表达。图43O描绘了GlyA+群体内的HbF表达(超过50％)，该表达通过GlyA+细胞计算为γ/β样链(％)。

这些数据证明，对人CD34+细胞进行RNP32编辑实现稳健的长期HbF诱导。另外，RNP32编辑不会对CD34+细胞的植入和谱系重构能力产生负面影响。

实例16：将RNP32编辑的mPB CD34+细胞输注到NSG(NOD-SCID Il2rγ^无效)小鼠中，证明了编辑的细胞在20周内高度多克隆且稳定的植入，没有克隆性生长

为确定衍生自RNP32的***缺失(表15)是否在纵向上维持多克隆谱，将来自动员外周血(mPB)的成人CD34+细胞输注到未辐照的NSG(NOD-SCID Il2rγ^无效)(杰克森实验室储备名称：NOD.Cg-Prkdc^scid Il2rg^tm1Wjl/SzJ(“NSG”))小鼠。简而言之，在补充有SCF、TPO和FLT3的X-Vivo 10培养基中进行48小时预刺激后，将mPB CD34+细胞用6μM RNP32或仅用缓冲液(“模拟”)经由MaxCyte电穿孔以62.5x10⁶/mL进行电穿孔。另外24小时后，冷冻保存mCD34+细胞。输注当天，将mPB CD34+细胞解冻，并经由静脉内尾静脉注射以每只小鼠500万个细胞注入白消安处理的NSG小鼠。在输注后8、12、16和20周，经由尾部剪切从小鼠中收集血液，并且分离gDNA。在这些样品以及预输注CD34+细胞产物(电穿孔后24小时)上进行***缺失谱分析，以追踪多克隆性的维持。使用以下引物以检测***缺失:正向＝CATGGCGTCTGGACTAGGAG(SEQ ID NO:1266)和反向＝AAACACATTTCACAATCCCTGAAC(SEQ IDNO:1267)。在所分析的任何小鼠中没有发生显著的克隆性生长，证明在20周时间段内维持多种***缺失谱(图44A)。另外，在植入后20周，对小鼠实施安乐死，并且从股骨和胫骨收集骨髓(BM)。分离基因组DNA并且使用上文所述的引物进行***缺失谱分析。如在外周血中所看到的，观察到***缺失的各种阵列(图44B)。这证明造血是由大量经编辑的造血干细胞重构的，表明RNP介导的基因修饰并未削弱经编辑的CD34细胞群内HSC体内植入和自我更新的能力。另外，未观察到克隆性生长，表明在由RNP修饰CD34细胞后，未产生具有不可控的致瘤潜能增殖的细胞。显性克隆的出现可能表明不受控增殖或肿瘤发生，这用RNP32编辑的情况下未见。

实例17：使用RNP32用于治疗镰状细胞病

如本文所述，可以开发用于镰状细胞病(SCD)的自体细胞疗法，该自体细胞疗法包含来自SCD的患者的CD34+细胞，这些CD34+细胞用在HBG1和HBG2启动子处的AsCas12a(Cpf1)RNP编辑，以诱导抗镰状化胎儿血红蛋白的表达。该自体细胞疗法是对SCD的治疗方法，其通过直接靶向编码胎儿γ珠蛋白链的HBG1和HBG2基因的启动子，以促进抗镰状化胎儿血红蛋白的表达(图45)。

使用从三名独立的正常成人供体和四名SCD患者供体获得的CD34+细胞测定RNP32编辑对于这样的细胞疗法的效率，并且对其进行比较。在两个独立的实验中使用七个批次的动员外周血CD34+细胞(表)。

表19：CD34+细胞批次

简而言之，将来自正常或SCD供体的CD34+细胞在由X-Vivo 10组成的培养基中在37℃、5％二氧化碳(CO2)下，在加湿培养箱中预刺激2天，该培养基补充有1X Glutamax、100ng/mL干细胞因子(SCF)、100ng/mL血小板生成素(TPO)以及100ng/mL FMS样酪氨酸激酶3配体(Flt3L)。培养2天后，收集细胞并且重悬于MaxCyte电穿孔缓冲液中。经由MaxCyte GT电穿孔设备，将RNP32(6μM，gRNA/蛋白质摩尔比为2)递送至CD34+细胞。每个OC-100盒可以使用1x10⁶至6.25x10⁶个细胞进行电穿孔。然而，由于可获得自SCD供体的细胞数目有限，每个批次使用0.4x10⁶至1x10⁶个细胞进行电穿孔(图46B)。然后向这些细胞中添加预热的完全培养基，以给出最终细胞密度大约为1×10⁶个细胞/mL(假设加工过程中细胞损失大约10％)。然后，将电穿孔细胞以及未处理的对照细胞(未经历电穿孔的细胞)置于37℃、5％CO₂下的加湿培养箱中。在电穿孔后第1、2和3天，对细胞的等分试样计数以确定生存力，并且收获细胞用于进一步分析。

在电穿孔后第1至3天，在正常和用RNP32处理的SCD CD34+细胞之间得到可比较的生存力(图46A，图46B)。生存力最低的两个样品(一个SCD和一个正常供体CD34+细胞)与电穿孔时使用的低细胞数一致(图46B)。

将电穿孔的CD34+细胞以浓度为2,000至4,000个细胞/μL重悬在快速提取物(Quick Extract)中。通过在热循环仪中使裂解物经受以下条件进行粗基因组脱氧核糖核酸(gDNA)提取：在65℃下持续15min，然后在95℃下持续10min。然后，通过使用以下引物通过下一代测序分析粗gDNA的***缺失：正向＝CATGGCGTCTGGACTAGGAG(SEQ ID NO:1266)和反向＝AAACACATTTCACAATCCCTGAAC(SEQ ID NO:1267)。RNP32编辑的正常供体CD34+细胞与SCD CD34+细胞一样有效(图47A，图47C)。电穿孔后第1天***缺失水平可变(正常，40.07％至84.39％；SCD，46.78％至79.50％)，但至电穿孔后第3天在正常(83.13％至97.17％)和SCD CD34+细胞(83.04％至95.78％)均增加至大约90％(图47C，图47B(第3天))。在第1天观察到的可变编辑水平可能与本实验中使用的较低细胞数量有关，这受到如上所述来自SCD供体的细胞的可用性的限制。

RNP32识别HBG1和HBG2启动子。在两个位点处的切割可以导致4.9kb间插序列的缺失。为评估4.9kb缺失的频率，设计了两种ddPCR测定(中靶扩增子和参考扩增子)(图48A)。引物和探针的相对位置在图48A中示出，并且这些序列在图48B中提供。对于每个样品，向PCR板中的液滴发生器(伯乐公司)中添加大约1.1ng的gRNA，并且按照制造商的说明生成液滴。然后将板移至热循环仪，并且运行以下方案：98℃下1个循环持续10分钟，94℃下40个循环持续30秒，以及94℃下持续2分钟，随后98℃下1个循环持续10分钟，并且在4℃下保持。之后，将板移至液滴读数器(伯乐公司)用于定量，并且对以下液滴进行计数：a)阴性，b)中靶扩增子和参考扩增子均为阳性，c)仅中靶扩增子为阳性，d)仅参考扩增子为阳性。为确定4.9kb缺失的百分比，将以下方程应用于每个样品。

*参考校正因子计算为对照样品的[(中靶浓度)/(参考浓度)]的平均数。

RNP32的中靶编辑也导致HBG1和HBG2启动子之间4.9kb片段的缺失，该缺失在电穿孔后第1天，在正常(16.4％至38.5％)和SCD CD34+细胞(20.7％至32.4％)中以大约27％的β珠蛋白基因座的频率发生(图49A，图49B)。

还表征了正常和SCD CD34+细胞的红系后代，并且确定了RNP32编辑的CD34+细胞分化为红系细胞的能力。简而言之，在电穿孔后第1天(如上所述)，使用Giarratana及其同事(Giarratana，2005)开发的改进的三步分化方案，在红系诱导培养基中培养120,000个细胞以产生红系细胞。将CD34+细胞在由伊斯科夫改良杜尔贝科氏培养基(IMDM)组成的步骤1培养基中培养7天，该培养基补充有1X GlutaMAX(吉博科公司(Gibco))、100U/mL青霉素、100mg/mL链霉素、5％人AB+血浆、330μg/mL全人转铁蛋白、20mg/mL人胰岛素、2U/mL肝素、1μM氢化可的松、3U/mL重组人红细胞生成素(EPO)、100ng/mL SCF以及5ng/mL白介素(IL)-3。在第7天，将细胞转移至步骤2培养基中并培养4天，该步骤2培养基除不含氢化可的松和IL-3外，与步骤1培养基相同。接下来，将细胞在步骤3培养基中培养7天，该步骤3培养基类似于步骤2培养基，但不添加SCF，并且用5％敲除血清替代物(吉博科公司)替换5％人AB+血浆。在18天培养结束时，将10μL的细胞用90μL的红系荧光激活细胞分选术(FACS)主混合物在4℃下染色15min，并且在Guava easyCyte 12HT流式细胞仪上获取以确定去核频率。将每个样品中多达120mL的细胞悬浮液在500x g下旋转5分钟，以将每个样品的总体积减少至20mL。然后使细胞悬浮液通过Acrodisc WBC注射器式过滤器以去除有核细胞，并且将所得RBC用于本实例中列出的这些实验中的进一步分析。

当放置在红系诱导条件下时，正常和SCD CD34+细胞(RNP32编辑的细胞和未编辑的细胞)经历稳健的扩增，在18天内跨所有实验组中平均扩增23,000倍(图50A，表20)。至第18天，培养物由成红细胞、RBC和挤出的细胞核(排出的核)组成(数据未显示)。跨所有组大约80％的红系细胞达到末端成熟并失去其细胞核(图50B)。总之，通过使用或不使用RNP32电穿孔的正常和SCD CD34+细胞实现了可比较的倍数扩增和末端成熟。

表20：CD34+细胞的红系后代的表型表征

还对由RNP32编辑后的正常核SCD CD34+细胞的红系后代中的HbF诱导进行表征，并且进行珠蛋白链分析。使用通过Masala和Manca(Masala 1994)描述的方法改进的反相超高效液相色谱(RP-UPLC)分析各种血红蛋白亚基的表达。将来自上述红系分化的过滤后的1x10⁶个细胞用磷酸盐缓冲盐水(PBS)-0.5％牛血清白蛋白(BSA)洗涤一次，并且然后在50μL液相色谱-质谱(LC-MS)级水中裂解。将样品装载至安捷伦公司(Agilent)1290UPLC***上。随后在220nm(无参考波长)下进行洗脱。按照以下顺序洗脱这些珠蛋白链：β、α、AγT(常见Aγ变体，HBG1的基因产物)、Gγ(HBG2的基因产物)以及Aγ(HBG1的基因产物)。每个峰下的曲线下面积接近每个珠蛋白链的相对丰度，并且用于计算HbF水平。因为HbA由α2β2组成且HbF由α2γ2组成，将HbF表达水平计算为(Aγ+Gγ)/(Aγ+Gγ+β)(％)，或(AγT+Aγ+Gγ)/(AγT+Aγ+Gγ+β)(％)，标记为γ/β样(％)。

使用Thorpe所述的方法(Thorpe 1994)，确定过滤后的RBC中HbF+细胞(表达HbF的细胞)的频率。简而言之，将上述红系分化的RBC用4％甲醛固定，用冰冷丙酮透化，用PBS-0.5％BSA洗涤，并且用HbF+细胞FACS主混合物染色。将细胞用PBS-0.5％BSA洗涤，重悬于含有NucRed(2滴/mL)的0.5％PBS中，并且在Guava流式细胞仪上获取。

衍生自正常和用RNP32电穿孔的SCD CD34+细胞的红系细胞表现出升高的且全细胞型HbF表达。在经处理的正常供体组中测得的HbF平均值为43.26％(38.38％至51.60％)，并且在经处理的SCD供体组中测得的HbF平均值为54.21％(48.63％至58.99％)，与在未处理的正常供体组和SCD供体组的背景值分别为13.98％(10.49％至17.97％)和21.16％(16.54％至27.92％)相比显著增加(图51A，表20)。另外，平均>92％的RBC(衍生自每一供体类型(正常或SCD供体)的RNP32电穿孔的CD34+细胞)是HbF+(正常，90.61％至93.85％；SCD，93.29％至94.50％)(图51B，表20)，与衍生自各自未处理的CD34+细胞的RBC(正常，37.76％至58.23％；SCD，50.09％至71.27％)相比显著升高。因此，高RNP32编辑水平导致体外红系分化后升高的HbF水平，其中超过50％的HbF在RNP32衍生的红细胞中测得(图51C)。

进行了几项测定，以证明未处理的镰状细胞患者细胞中胎儿血红蛋白升高的临床相关性，以及在较小程度上正常供体的未处理细胞中胎儿血红蛋白升高的临床相关性，如图51B中所示。由于用于将CD34+细胞分化为RBC以进行那些分析的体外培养物，在衍生自SCD患者的未处理细胞中存在高背景HbF。使用这些培养条件这是预期的，并且先前已由Métais等人报告(Métais 2019)。当与未经修饰的细胞相比，这可能部分掩盖了在经修饰的细胞中实现的益处的最大范围。

为评估HbF诱导对因缺氧诱导的HbS聚合导致的RBC镰状化的影响，将衍生自未编辑的SCD CD34+细胞(未编辑的对照细胞)的未处理RBC和衍生自编辑的SCD CD34+细胞的RBC与氧清除剂焦亚硫酸钠溶液一起孵育，以去除细胞悬浮液中的氧，从而将这些细胞放置在极低的氧张力下。然后，确定并且比较衍生自未编辑的SCD CD34+细胞的镰状RBC和衍生自RNP-32编辑的SCD CD34+细胞的镰状RBC的百分比。

简而言之，首先诱导细胞产生红系细胞。从如上所述的红系分化测定中收集一百万个RNP32编辑的RBC，并且用PBS-0.5％BSA洗涤。然后将细胞沉淀重悬于20μL PBS中，并且与20μL重量/体积为2％的焦亚硫酸钠(于水中)混合。然后，将一滴(大约20μL)该细胞混合物置于显微镜载玻片上，用盖玻片覆盖，并且密封边缘。在成像和分析形态变化之前，将载玻片在室温下储存1至4小时。平均镰状化频率从未处理的SCD RBC(平均HbF为19.9％)中的38.3％降低至RNP32编辑的SCD RBC(平均HbF为53.8％)中的10.6％，表明与SCD患者的未编辑的RBC相比，SCD患者的RNP32编辑的RBC镰状化形态降低约4倍(图52)。焦亚硫酸钠导致极度缺氧，低于生理学上通常观察到的水平，因此预期体内编辑的细胞中镰状化RBC的百分比更低。

还评估了SCD RBC的变形能力。为了评估脱氧时HbF诱导是否会降低SCD RBC的刚性并改善其变形能力，在Lorrca血细胞计数器上对来自SCD患者的未处理的RBC和来自SCD患者的RNP32编辑的RBC进行分析，其中在氧张力降低的情况下施加了剪切应力(图53A)。从红系分化中过滤后，收集了一千五百万个RBC(如上所述)，并用PBS-0.5％BSA洗涤。将细胞以500x g离心5分钟，重悬于1.5ml的OXY ISO溶液(Lorrca)中，并且通过倒置轻轻混合。然后将细胞悬浮液装载至Lorrca血细胞计数器，其中根据制造商的说明进行氧扫描，以测量RBC在脱氧时于剪切应力下的变形能力。RBC变形能力表示为伸长指数(EI)(图53A)，并且“镰状化点”表示当SCD RBC开始镰状化且在脱氧期间丢失>5％的EI时的相对氧气压力。含有来自三个不同供体的健康成年人血红蛋白(HbA和HbF)的正常RBC未受到氧张力降低的影响(图53B)。相反，来自四个供体的SCD RBC在脱氧时变得刚性，如与氧耗竭相对应的伸长指数逐渐降低所示(图53C(黑色线))。与来自未处理的CD34+细胞的RBC相比，衍生自RNP32编辑的CD34+细胞的SCD RBC以较低的氧张力开始镰状化(表示为镰状化点)(图53C(灰色线)、53D，表21)。另外，脱氧RNP32处理的SCD RBC仍比未处理的SCD RBC更具柔性，如通过RNP32处理的SCD RBC观察到的最低伸长指数高于未处理的SCD RBC得到证明(图53E，表21)。

表21：RBC的变形能力评估的汇总

接下来，为评估衍生自RNP32编辑的CD34+细胞的SCD RBC的降低的镰状化和增加的柔性是否会导致流变行为改善，使用微流体平台评估RBC。微流体平台复制了微血管中的血流，用于直接观察在不同氧条件下培养的SCD RBC的混合流量。脱氧时，HbS的细胞内聚合使RBC变得不具柔性和且具有刚性，这相当于经过该微通道的速度下降。简而言之，将如上所述的红系诱导后过滤后的一亿五千万个RBC离心并重新悬浮在新鲜的步骤3培养基中，以至最终浓度为10x10⁶个细胞/mL。将培养的RBC用PBS洗涤，并且重悬于PBS中以实现20％目标血细胞比容。将15μL体积的培养的RBC在恒定压力下装载至设备上，并且经由气体混合***控制其经受不同水平的氧气。通过高速摄像机捕获流量，并且利用MATLAB中的Kanade-Lucus-Tomasi特征追踪来测定血液通过通道的速度。然后，在一系列氧气水平下测量细胞的速度。在静脉循环中观察到的典型氧水平为约4％至6％的氧。

正常供体的RBC未显示出氧依赖性的流变性损害(图54A，图54B)。虽然衍生自RNP32编辑的SCD CD34+细胞的RBC的流变行为未完全正常化，但与衍生自未处理的SCDCD34+细胞的RBC相比，它们在缺氧期间展现出较低程度的损害，并且在速度下降开始前需要更为极度的缺氧(衍生自未处理的SCD CD34+细胞的RBC为10％氧，衍生自RNP32编辑的SCD CD34+细胞的RBC为6％氧)。如图54C所示，与在生理氧水平下衍生自未处理的SCD CD34+细胞的RBC(三角形)相比，衍生自RNP32编辑的SCD CD34+细胞的RBC(圆圈)表现出显著改善的流变行为。来自正常供体的未编辑的RBC(菱形)未显示出氧依赖性的流变性损害。虽然衍生自RNP32编辑的SCD CD34+细胞的RBC的流变行为未完全正常化，但与衍生自未编辑的SCD患者CD34+细胞的RBC相比，它们在缺氧期间展现出较低程度的损害，并且需要更为极度的缺氧以开始速度下降。值得注意的是，典型地在静脉循环中观察到的氧水平下，与RBC衍生的正常供体细胞相比，衍生自RNP32编辑的CD34细胞的红细胞的速度几乎完全正常化。缺氧下的流变性损害的减小也与RBC中HbF水平的升高密切相关(图54D，图54E)。例如，图54E显示了，在4％的生理氧水平下，具有最高HbF水平的RBC展现出最高的速度。这表明，在非常高的HbF表达水平下，镰状化细胞患者的RBC的表型校正最大，如用衍生自RNP32编辑的SCDCD34+细胞的RBC观察到的(图54D，图54E)。

总之，进行了两项研究以询查用RNP32对SCD和正常CD34+细胞的编辑，并确定红系后代中的功能结果。RNP32有效地编辑正常和SCD CD34+细胞，在电穿孔后第3天实现大约90％***和/或缺失(***缺失)。用RNP32编辑CD34+细胞对红系分化或成熟没有负面影响。获得稳健的HbF表达，在衍生自RNP32编辑的正常和SCD CD34+细胞的RBC中分别平均占总血红蛋白的43.26％和54.21％，呈全细胞型方式分布(平均>92％的RBC)。与衍生自未处理的SCD CD34+细胞的RBC相比，在衍生自RNP32编辑的SCD CD34+细胞的RBC中高水平的HbF表达与镰状化降低、剪切应力下的变形能力改善以及脱氧时通过微流体通道的流量改善一致。通过在HBG1和HBG2启动子区域处RNP32对CD34+细胞的高效编辑，实现HbF的潜在地治疗相关水平。这相当于红细胞中的镰状化减少和流变性质改善，这对于使用RNP32治疗镰状细胞病的自体细胞疗法是有利的。

实例18：CD34+细胞中由RNP32产生的中靶***缺失的汇总分析

CRISPR/Cas编辑后，DNA修复机制(如非同源末端连接(NHEJ)和微同源介导的末端连接(MMEJ))产生高度异质的修复结果，这些结果包含数百种不同的基因型。当使用Cpf1(也称为AsCas12a)(用于RNP32的酶)时，产生的编辑结果尚未进行详细地表征。Cpf1编辑产生四个核苷酸的5’突出端(参见图55A)，这与SpCas9编辑的平末端有很大不同(参见图41A)。如该实例中所用，“剪切位点”用于指产生自RNP32编辑的预期突出端中间的位置(图55A，灰色虚线)。

DNA修复机制通常会产生范围从1到大约50个碱基对(bp)的大小的***缺失，典型地通过基于PCR的靶向测序测定进行检测。还描述了更复杂的基因组修复结果(错误！未找到参考源2018；错误！未找到参考源2018；错误！未找到参考源2020)，并且包括大于约50bp的中靶基因座的缺失，称为切除和易位。这些更复杂的重排需要其他方法用于精确定量(参见，例如，PCT/US 2018/012652)。

为确定由RNP32产生的***缺失谱，使用基于PCR的靶测序测定对由RNP32产生的远端CCAAT盒处的范围1bp至约50bp的大小的***缺失进行表征。在多种样品中研究了***缺失模式，跨越了不同基因型(正常相对于镰状细胞病)和动员方案(单独的普乐沙福相对于单独的G-CSF相对于G-CSF+普乐沙福)(表12)。该汇总分析证明，在CCAAT盒处的RNP编辑产生不同的***缺失谱，该***缺失谱在多种样品和编辑水平上重现。

表22：用于汇总分析的样品

将来自12个不同的供体(正常供体和SCD供体)的动员外周血CD34+细胞用于该汇总分析(表22)。使用大规模工艺生产正常供体的五个样品(表22，实验SCD1)。简而言之，leukopak(HemaCare公司或KeyBiologics公司)获得自用粒细胞群落刺激因子(G-CSF)和普乐沙福动员的正常供体。使用CliniMACS Plus***富集CD34+细胞，等分试样，在CryostorCS10中冷冻保存，并且储存在液氮气相中。将CD34+细胞解冻，在由X-Vivo 10组成的完全培养基中培养2天，该培养基补充有1X Glutamax、100ng/mL干细胞因子(SCF)、100ng/mL血小板生成素(TPO)以及100ng/mL FMS样酪蛋白激酶3配体(Flt3L)，与RNP32混合(gRNA/蛋白质摩尔比为2)至最终浓度为8μM，并且根据制造商的说明，使用Maxcyte GT电穿孔设备进行电穿孔。电穿孔后将细胞材料培养过夜，等分试样，并且在Cryostor CS10中冷冻保存，并且储存在液氮气相中，直至准备进行实验。

使用研究规模工艺生产九个样品(表22，SCD011和SCD014)。将细胞解冻，洗涤，并且以1x10⁶个细胞/mL在由X-Vivo 10组成的完全培养基中在37℃、5％二氧化碳(CO2)下，在加湿培养箱中培养2天，该培养基补充有1X Glutamax、100ng/mL干细胞因子(SCF)、100ng/mL血小板生成素(TPO)以及100ng/mL FMS样酪氨酸激酶3配体(Flt3L)。培养2天后，收集细胞并且重悬于Maxcyte电穿孔缓冲液中。将RNP32(gRNA/蛋白质摩尔比为2)添加至该细胞悬浮液以至最终浓度为6μM。将混合物转移至Maxcyte OC-100盒，并且根据制造商的说明用Maxcyte GT电穿孔设备进行电穿孔。电穿孔后，将细胞在完全培养基中培养1天，然后收获用于分析。

按照文库制备方法和分析，通过Illumina扩增子测序(ILL-seq)评估样品中存在的小的***缺失部分。在该分析中使用了预期的剪切位点周围的15bp窗口来计算编辑率。图55A和图55B中提供了用于产生靶向扩增子测序产物的寡核苷酸和扩增子。

5)对在相同读段中出现的***缺失进行分组。

6)创建用于每个读段的***缺失的***缺失_id。***缺失_id是标识***缺失的字符串，显示为***缺失_起始_位置+_+***缺失_长度+_+ID。其中对于缺失，ID是NA，并且对于***，ID是***的序列。参见图55D中的实例。

7)使用相同的***缺失_id对读段进行分组。

8)对具有相同***缺失的读段的数目进行计数，并且计算其总分数(包括wt)和***缺失中的分数(不包括wt)。当样品具有不同的总编辑量时，***缺失中的分数允许在样品间进行比较。

为了分析跨样品检测的单个***缺失的再现性，估计了跨样品检测到的这些***缺失的次数及其在***缺失中的平均百分比。当在特定样品中未检测到***缺失时，假定其百分比为0％。

在该分析中，每个RNP32编辑的样品的***缺失的总百分比在表23中示出。除了三个样品展现出约40％至53％之间的较低编辑外，所有这些样品(包括正常和SCD供体)展现出大于72.6％的整体编辑(范围从72.6％至89.2％)。展现出较低编辑的样品具有潜在地与用于电穿孔的较低细胞数量相关的低生存力。

表23：所有样品的编辑结果

供体类型	CEL ID	实验编号	总***缺失％
				正常	CEL238-001	SCD011	84.39％
SCD	CEL211-001	SCD011	79.50％
				正常	CEL021-014	SCD014	40.07％
正常	CEL042-001	SCD014	78.37％
				正常	CEL238-001	SCD014	80.70％
SCD	CEL211-001	SCD014	46.78％
				SCD	CEL239-001	SCD014	52.92％
SCD	CEL240-001	SCD014	75.38％
				SCD	CEL241-001	SCD014	72.63％
正常	CEL172-008	SCD1	88.91％
				正常	CEL182-008	SCD1	87.11％
正常	CEL171-008	SCD1	84.04％
				正常	CEL192-008	SCD1	89.24％
正常	CEL168-008	SCD1	88.76％

总计检测到385个独特的***缺失，仅计数表25中至少一个样品中发现的百分比超过0.1％(占总***缺失)的那些***缺失。

wt等位基因和前20个***缺失在图57中示出，连同其相对平均频率(所有样品中)。在所有样品中，最丰富的***缺失159_-18_NA，以平均15.15％存在。值得注意的是，平均以2.63％检测到***缺失157_-13_NA(更常见的称为13bp HPFH缺失)。13bp的缺失是与HbF升高相关的自然发生突变。

电穿孔后24-72小时的混合CD34+群体(祖细胞)的***缺失分析可以确定在该位点的编辑是否衍生自Cas12a或Cas9。在Cas12a的情况下，在该时间点检测到的最主要的***缺失是159_-18缺失，然而对于Cas9，频率最高的***缺失是157_-13缺失。另外，在该位点由Cas9产生的最常见的NHEJ***缺失是-1bp缺失(169_-1_NA，表24)，在此以约9.6％发生。相反，用Cas12a编辑后，产生的最常见的NHEJ***缺失是6bp和4bp缺失(165_-6_NA和167_-4_NA；表24，RNP58；表25，RNP32)。当与Cas9相比时，在该位点处Cpf1通常产生更大的NHEJ缺失。

电穿孔后24-72小时的混合CD34+群体(祖细胞)的***缺失分析可以确定在该位点的编辑(***缺失)是否衍生自Cpf1或Cas9。例如，在Cpf1的情况下，在该时间点检测到的最主要的***缺失是159_-18缺失，与SpCas9的平均百分比为1.35％相比(参见表24)，其为总***缺失的平均百分比的15.15％(表25)。然而，SpCas9的频率最高的***缺失是157_-13缺失，为总***缺失的平均百分比的31.88％(表24)，相对于Cpf1的频率最高的***缺失为总***缺失的平均百分比的2.63％(表25)。

***缺失中心点和***缺失长度的分布结果分别在图58和59中示出。最常见的***缺失中心位置(峰)位于距离剪切位点6b，位置为TSS:-113。在13bp和18bp处观察到缺失长度分布中的峰，主要对应于157_-13_NA和159_-18_NA MMEJ***缺失。由于MMEJ修复期间中切除并且利用了微同源序列，因此与经由NHEJ途径介导的那些缺失相比，该途径往往会产生更大的缺失。除那些之外，最常观察到的缺失长度是5bp(9.30％)(图60)。很少检测到***(总贡献为0.50％)。1bp和25bp之间的缺失在所有***缺失中总贡献为92.03％(3bp和25bp之间的缺失在所有***缺失中总贡献为85.85％，4bp和25bp的缺失在所有***缺失中总贡献为80.35％，以及5bp和25bp之间的缺失在所有***缺失中总贡献为72.04％)(表25)。总体而言，正常和SCD样品中，***缺失中心点的分布和***缺失长度均非常相似。如上述图41C所示，4bp和更长的***缺失的产生导致最高的HbF诱导。

沿靶区域缺失的碱基百分比的结果(缺失谱)在图61和图62中示出(归一化为相同的最大值1，用于样品之间的比较)。尽管总编辑值不同，所有样品的谱形状非常相似(表23)。在正常供体(正常)和镰状细胞病供体(SCD)样品或不同动员方案之间未观察到主要差异。缺失谱显示出，从剪切位点向TSS的分布峰(最常见地缺失的碱基)为6bp，在TSS:-113处。

在评估的任何样品中以0.1％检测到的总计385个***缺失中，在所有14个样品中检测到108个***缺失(图63和表25)。在所有14个样品中检测到以***缺失平均百分比大于0.22％存在的所有***缺失(总计55个***缺失，位于图64的灰色线上方，并且也在表25中)，并且总***缺失贡献为69.90％。总而言之，***缺失检测的再现性非常高。

为了更详细地了解跨所有样品检测到的***缺失之间每一单独的***缺失频率的一致性，计算了它们成对相关性图和R²。为了避免抽样偏差，当比较两个样品时，仅考虑两个样品中至少一个样品中最小百分比为0.1％(占所有***缺失)的***缺失。由于电穿孔所用细胞数量少，不包括编辑低于60％的三个样品(参见表22)，所有R²值大于0.8(数据未显示)。总而言之，具有高编辑的样品之间的***缺失百分比的相关性非常高。

总之，在该实例中测试的14个编辑的样品中的至少有一个样品中，总共385个独特的***缺失以高于0.1％的百分比被检测到。在所有样品中，最丰富的***缺失159_-18_NA，存在于平均15.15％的所有***缺失之间。平均以2.63％检测到***缺失157_-13_NA(更常见的称为13bp HPFH缺失)。尽管具有不同的总编辑值，所有编辑的样品的***缺失谱的形状在所有研究中非常相似。在正常供体和SCD供体样品或不同动员方案之间未观察到主要差异。

单个***缺失位置的评估显示出，由RNP32产生的***缺失主要以位置TSS:-113为中心，这也是观察到的最常见的缺失的碱基。***缺失长度分布的评估显示出，在-18和-13处的峰主要对应于MMEJ***缺失(159_-18_NA(最丰富的***缺失，以TSS:-104开始，并且长度为18个碱基)和157_-13_NA(以TSS:-102开始，13bp HPFH缺失))。除这些之外，最常观察到的缺失长度是5bp(9.30％)。很少检测到***(总贡献为0.50％)。1bp和25bp之间的缺失在所有***缺失中的总贡献为92.03％。总体而言，正常和SCD样品之间，***缺失长度的分布和中心位置非常相似。总计385个独特的***缺失中，在所有14个样品中检测到108个***缺失。在所有14个样品中检测到以***缺失平均百分比大于0.22％存在的所有***缺失(总计55个***缺失)，并且总***缺失贡献为69.90％。检测到的***缺失(不包括编辑低于60％的三个样品)中的成对相关性的R²值大于0.8。

该数据证明，在HBG1/2远端CCAAT盒处的RNP32编辑导致独特的***缺失特征，该特征可跨多种样品和编辑水平上重现。

实例19：正常供体CD34+细胞RNP32编辑效率包括4.9kb片段缺失的分析

对获得自四个独立的正常成年人供体的动员外周血CD34+细胞中RNP32的中靶编辑效率，以及两个RNP32剪切位点之间的4.9kb片段缺失的频率进行评估。另外，还在分选自总CD34+细胞的HSPC的几个亚群中测量了中靶***缺失水平和4.9kb缺失的频率，以解决表型长期造血干细胞(LT-HSC)是否可以用RNP32有效编辑。

从HemaCare获得四个正常供体的Leukopak(用粒细胞群落刺激因子(G-CSF)加上Mozobil处理或单独用G-CSF处理)。使用CliniMACS***(美天旎公司(Miltenyi))富集CD34+细胞(批次：CEL045-002、CEL046-004、CEL047-002和CEL021-021)，等分试样，并且在Cryostor CS10中冷冻保存。将细胞解冻，洗涤，并且以1x10⁶个细胞/mL在由X-Vivo 10组成的完全培养基中在37℃、5％二氧化碳(CO2)下，在加湿培养箱中培养2天，该培养基补充有1X Glutamax、100ng/mL干细胞因子(SCF)、100ng/mL血小板生成素(TPO)以及100ng/mL FMS样酪氨酸激酶3配体(Flt3L)。培养2天后，收集细胞并且重悬于Maxcyte电穿孔缓冲液中。将RNP32(gRNA/蛋白质摩尔比为2)添加至该细胞悬浮液以至最终浓度为6μM。将混合物转移至Maxcyte OC-100盒，并且根据制造商的说明用Maxcyte GT电穿孔设备进行电穿孔。

RNP32识别HBG1和HBG2启动子。在两个位点处的切割可以导致4.9kb间插序列的缺失。为确定4.9kb片段缺失的频率，如实例17中所述进行两种ddPCR测定(参考扩增子和中靶扩增子)(参见图48A-48D)。简而言之，将用RNP32电穿孔后第1天和第2天的细胞，和分选的细胞以浓度为2,000至4,000个细胞/μL重悬在快速提取物(Quick Extract)中。通过在热循环仪中使裂解物经受以下条件进行粗基因组脱氧核糖核酸(gDNA)提取：在65℃下持续15min，然后在95℃下持续10min。然后，通过下一代测序(使用图55A中列出的引物)和通过数字液滴聚合酶链反应(ddPCR)评估的4.9kb片段缺失，分析粗gDNA的***缺失(***和缺失)。

RNP32以RNP浓度和时间依赖性方式编辑了正常供体CD34+细胞的HBG1和HBG2启动子，而没有显著影响细胞的生存力(图65A、65B、图66以及图67)。在8μM(测试的RNP32的最高浓度)下，在电穿孔后第1天在正常供体CD34+细胞中达到平均为86％的中靶***缺失水平，并且在电穿孔后第2天升至91％(图68)。在较低的RNP浓度下增加更明显，其中电穿孔后第1天和第2天，1μM下的平均***缺失水平从62％上升至77％。电穿孔后第2天，当用≥3μMRNP32转染CD34+细胞时，常规地实现了≥85％的中靶***缺失水平。

用RNP32编辑CD34+细胞分别导致HBG1和HBG2基因启动子处的两个RNP32剪切位点之间4.9kb间隔片段的频繁缺失。平均而言，在用≥2μM的RNP32电穿孔后第1天和第2天，CD34+细胞中大约35％的β珠蛋白基因座具有4.9kb片段缺失(图69A、图69B以及图70)。CD34+细胞中4.9kb片段缺失与***缺失的比率在用≥2μM的RNP32电穿孔后第1天大约为0.47，第2天降低至大约0.40。

CD34+细胞是异质的，并且包含谱系限制性祖细胞、MPP以及自我更新的LT-HSC。由于LT-HSC将负责为患者造血***提供长期重构，该群体中的高水平编辑与治疗的持久性相关。为确定是否对CD34+细胞的不同亚群进行了类似编辑，评估了CMP、MPP以及表型LT-HSC(由表面免疫表型定义)中的中靶***缺失水平，并且与跨多个RNP浓度的总CD34+细胞中的中靶***缺失水平进行比较。

简而言之，使用BD荧光激活细胞分选术(FACS)Aria融合细胞分选器(BD生物科学公司(BD Biosciences))在用RNP32电穿孔后两天分选CD34+细胞，以获得三个HSPC亚群，包括表型LT-HSC、多能祖细胞(MPP)和普通髓样祖细胞(CMP)。设置门控以收集以下富集的CD34+细胞亚群：表型LT-HSC(P7、CD34亮、CD38低/阴性、CD90+、CD45RA-)，MPP(P6、CD34亮、CD38低/阴性、CD90-、CD45RA-)，以及CMP(P9、CD34亮、CD38高、CD123+、CD45RA-)。

这三个亚群中，跨所有评估的RNP浓度中(图71A、图71B以及图72)，CMP始终具有最高的中靶***缺失水平，并且表型LT-HSC具有最低的中靶***缺失水平(使用图55B中所列出的引物经由NGS分析)(研究MAX072)。尽管如此，在≥3μM RNP32时，表型LT-HSC中的中靶***缺失水平达到≥85％，与总CD34+细胞中检测到的中靶***缺失水平类似，表明自我更新LT-HSC可以使用RNP32有效地编辑(图71A、图71B以及图72)。

RNP32编辑导致在所有经测试的造血干细胞和祖细胞的三个亚群中4.9kb片段的缺失(图73A和图74)。这三个亚群中，跨所评估的所有RNP浓度中，CMP始终具有最高水平的4.9kb片段缺失，并且表型LT-HSC具有最低水平的4.9kb片段缺失。跨所有RNP浓度，总CD34+细胞、CMP、MPP和表型LT-HSC中4.9kb片段与***缺失的平均比率分别为大约0.43、0.49、0.33以及0.25(图73B)，证明由于因RNP32编辑，LT-HSC的4.9kb片段的缺失频率低于其短期对应物。保留4.9kb的编辑间区域是有益的，因为4.9kb片段的较高缺失导致HbF产生较低。因此，由RNP32编辑的LT-HSC中4.9kb片段较低水平的缺失是有利的。本文中的这些结果证明，用RNP32编辑可以产生具有临床相关水平的健康HbF的细胞。

总之，用RNP32电穿孔正常人供体CD34+细胞后，评估HBG1和HBG2启动子之间的中靶***缺失水平和相关的4.9kb片段缺失。RNP32高效编辑CD34+细胞，跨多个RNP批次和细胞供体批次中实现了一致的编辑。当用≥3μM RNP32电穿孔时，常规地实现CD34+细胞中大于85％的中靶***缺失。当用≥3μM RNP32电穿孔时，还观察到总CD34+细胞和分选的表型LT HSC之间的可比较的***缺失水平。两个RNP32剪切位点之间的4.9kb片段的丢失以细胞亚群体依赖性的频率发生。总CD34+细胞以大约每个***缺失0.4的频率丢失4.9kb片段。在CD34+细胞的表型LT-HSC子集中，该频率降至大约每个***缺失0.25。

实例20：使用编辑的造血干细胞治疗β-血红蛋白病

本文披露的方法和基因组编辑***可用于在有需要的患者中治疗β-血红蛋白病，如镰状细胞病或β-地中海贫血。例如，可以以自体程序对衍生自患者的细胞进行基因组编辑。对患者细胞进行离体校正和将细胞重新引入患者体内可能会导致HbF表达增加并治疗β-血红蛋白病。

例如，HSC可使用本领域技术人员众所周知的技术从患有β-血红蛋白病的患者的骨髓中提取。HSC可以使用本文披露的用于基因组编辑的方法进行修饰。例如，由靶向HBG基因中的一个或多个区域的与RNA指导的核酸酶复合的指导RNA(gRNA)构成的RNP可用于编辑HSC。在某些实施例中，RNA指导的核酸酶可以是Cpf1蛋白。在某些实施例中，Cpf1蛋白可以是经修饰的Cpf1蛋白。在某些实施例中，经修饰的Cpf1蛋白可以由SEQ ID NO:1000、1001、1008-1018、1032、1035-39、1094-1097、1107-09(Cpf1多肽序列)或SEQ ID NO:1019-1021、1110-17(Cpf1多核苷酸序列)所示的序列编码。例如，经修饰的Cpf1蛋白可以由SEQ ID NO:1097所示的序列编码。在某些实施例中，gRNA可以是经修饰的或未经修饰的gRNA。在某些实施例中，gRNA可包含表6、表12或表13所示的序列。例如，在某些实施例中，gRNA可包含SEQID NO:1051所示的序列。在某些实施例中，RNP复合物可包含表15所示的RNP复合物。例如，RNP复合物可以包括包含SEQ ID NO:1051所示的序列的gRNA和由SEQ ID NO:1097所示的序列编码的经修饰的Cpf1蛋白(RNP32，表15)。在某些实施例中，相对于未经修饰的HSC，经修饰的HSC在人HBG1基因、HBG2基因、或两者中的***缺失的频率或水平增加。在某些实施例中，经修饰的HSC可以分化为表达增加水平的HbF的红系细胞。可以选择经修饰的HSC的群体，以通过输注或本领域技术人员已知的其他方法重新引入患者体内。可以基于例如经修饰的HSC的红系后代的HbF表达增加或经修饰的HSC的***缺失频率增加来选择用于重新引入的经修饰的HSC的群体。在一些实施例中，在细胞重新引入之前的任何形式的消融可用于增强经修饰的HSC的植入。在其他实施例中，可以使用技术人员熟知的技术(例如，单采血液分离术(apheresis)或白细胞单采术(leukapheresis))从患有β-血红蛋白病的患者中提取外周血干细胞(PBSC)，并且可以从PBSC中去除干细胞。如上所述的基因组编辑方法可以在干细胞上进行，并且经修饰的干细胞可以如上所述被重新引入患者体内。

表14：Cpf1蛋白变体

表15：RNP复合物

表16：Cpf1 HBG1靶向结构域和预期的切割位点

表17：Cpf1 HBG2靶向结构域和预期的切割位点

表18：gRNA 5’延伸

表13：Cpf1指导RNA

表24：Sp35 RNP和RNP58的***缺失

表25：RNP32***缺失

序列

根据本披露内容的基因组编辑***组分(包括但不限于，RNA指导的核酸酶、指导RNA、供体模板核酸、编码核酸酶或指导RNA的核酸、以及任何前述的部分或片段)，用序列表中表示的核苷酸和氨基酸序列例示。序列表中表示的序列不旨在是限制性的，而是说明性的基因组编辑***及其组分部分的某些原理，组合本披露内容，将通知本领域技术人员另外的本披露内容范围内的实施和修饰。

通过引用并入

本文提及的所有出版物、专利和专利申请都通过引用以其整体而特此并入，如同每一单独的出版物、专利或专利申请具体且单独地指明通过引用而并入一样。在有冲突的情况下，以本申请(包括本文的任何定义)为准。

等效物

本领域技术人员仅使用常规实验就将认识到或能够确定本文所述的具体实施例的许多等效物。此类等效物旨在由以下权利要求涵盖。

参考文献

Ahern et al.,Br J Haematol 25(4):437-444(1973)

Akinbami Hemoglobin 40:64-65(2016)

Aliyu et al.Am J Hematol 83:63-70(2008)

Anders et al.Nature 513(7519):569-573(2014)

Angastiniotis&Modell Ann N Y Acad Sci 850:251-269(1998)

Bae et al.Bioinformatics 30(10):1473-1475(2014)

Barbosa et al.Braz J Med Bio Res 43(8):705-711(2010)

Bauer et al.Nat.Med.25(5):776-783(2019)

Bothmer et al.CRISPR J 3(3):177-187(2020)

Bouva Hematologica 91(1):129-132(2006)

Briner et al.Mol Cell 56(2):333-339(2014)

Brousseau Am J Hematol 85(1):77-78(2010)

Caldecott Nat Rev Genet 9(8):619-631(2008)

Canvers et al.Nature 527(12):192-197(2015)

Chang et al.Mol Ther Methods Clin Dev 4:137-148(2017)

Chassanidis Ann Hematol 88(6):549-555(2009)

Chylinski et al.RNA Biol 10(5):726-737(2013)

Cong et al.Science 399(6121):819-823(2013)

Costa et al.,Cad Saude Publica 18(5):1469-1471(2002)

Davis&Maizels 2 Proc Natl Acad Sci USA 111(10):E924-932(2014)

Fine et al.Sci Rep.5:10777(2015)

Frit et al.DNA Repair(Amst)17:81-97(2014)

Fu et al.Nat Biotechnol 32:279-284(2014)

Gao et al.Nat Biotechnol.:35(8):789-792(2017)

Giarratana et al.Nat Biotechnol.23(1):69-74(2005)

Giarratana et al.Blood:118,5071-5079(2011)

Giannoukos et al.BMC Genomics 19(1):212(2018)

Guilinger et al.Nat Biotechnol 32:577-582(2014)

Heigwer et al.Nat Methods 11(2):122-123(2014)

Hsu et al.Nat Biotechnol 31(9):827-832(2013)

Iyama&Wilson DNA Repair(Amst)12(8):620-636(2013)

Jiang et al.Nat Biotechnol 31(3):233-239(2013)

Jinek et al.Science 337(6096):816-821(2012)

Jinek et al.Science 343(6176):1247997(2014)

Kleinstiver et al.Nature 523(7561):481-485(2015a)

Kleinstiver et al.Nat Biotechnol 33(12):1293-1298(2015b)

Kleinstiver et al.Nature 529(7587):490-495(2016)

Kleinstiver et al.Nat Biotechnol 37(3):276-282(2019)

Komor et al.Nature 533(7603):420-424(2016)

Kosicki et al.Nat Biotechnol 36(8):765-771(2018)

Lee et al.Nano Lett 12(12):6322-6327(2012)

Lewis“Medical-Surgical Nursing:Assessment and Management of ClinicalProblems”(2014)

Li Cell Res 18(1):85-98(2008)

Makarova et al.Nat Rev Microbiol 9(6):467-477(2011)

Mali et al.Science 339(6121):823-826(2013)

Mantovani et al.Nucleic Acids Res 16(16):7783-7797(1988)

Masala Methods Enzymol.231:21-44(1994)

Marteijn et al.Nat Rev Mol Cell Biol 15(7):465-481(2014)

Martyn et al.,Biochim Biophys Acta 1860(5):525-536(2017)

Métais et al.Blood Adv.3(21):3379-92(2019)

Nishimasu et al.Cell 156(5):935-949(2014)

Nishimasu et al.Cell 162:1113-1126(2015)

Notta et al.Science 333(6039):218-21(2011)

Pausch et al.Science 369(6501):333-337(2020)

Ran&Hsu Cell 154(6):1380-1389(2013)

Richardson et al.Nat Biotechnol 34:339-344(2016)

Swarts et al.May 22:e1481.doi:10.1002/wrna.1481.Epub ahead ofprint.PMID:29790280(2018)

Shmakov et al.Molecular Cell 60(3):385-397(2015)

Sternberg et al.Nature 507(7490):62-67(2014)

Strohkendl et al.Mol.Cell 71:816-824(2018)

Superti-Furga et al.EMBO J 7(10):3099-3107(1988)

Thein Hum Mol Genet 18(R2):R216-223(2009)

Thorpe et al.Br J Haematol.87(1):125-132(1994)

Tsai et al.Nat Biotechnol 34(5):483(2016)

Waber et al.Blood 67(2):551-554(1986)

Wang et al.Cell 153(4):910-918(2013)

Weber et al.Sci Adv.6(7):eaay9392(2020)

Wu et al.Nat.Med.25(5):776-83(2019)

Xiao et al.Bioinformatics 30(8):1180-1182(2014)

Xu et al.Genes Dev 24(8):783-798(2010)

Yamano et al.Cell 165(4):949-962(2016)

Zetsche et al.Nat Biotechnol 33(2):139-42(2015)

Claims

1.一种经修饰的细胞的第一群体，所述第一群体包含

多个经修饰的CD34+或造血干细胞，

所述多个经修饰的细胞中的一个或多个细胞在HBG基因启动子中具有***缺失，

作为整体的所述多个经修饰的细胞包括HBG1启动子、HBG2启动子或其组合中的HBG1/2c.-104至-121缺失，并且

所述HBG1/2 c.-104至-121缺失占作为整体的所述多个经修饰的细胞中的***缺失的2％或更多。

2.如权利要求1所述的经修饰的细胞的第一群体，其中所述HBG1/2 c.-104至-121缺失占作为整体的所述多个经修饰的细胞中的***缺失的小于25％。

3.一种经修饰的细胞的第一群体，所述第一群体包含

多个经修饰的CD34+或造血干细胞，

所述多个经修饰的细胞中的一个或多个细胞在HBG基因启动子中包括***缺失，并且

在作为整体的所述多个经修饰的细胞中，60％或更多的***缺失是至少4个碱基对的缺失。

4.如权利要求1-3中任一项所述的经修饰的细胞的第一群体，所述第一群体通过包括以下的方法产生：将包括第一指导RNA(gRNA)和Cpf1 RNA指导的核酸酶或经修饰的Cpf1RNA指导的核酸酶的第一RNP复合物，递送至包含多个未经修饰的CD34+或造血干细胞的未经修饰的细胞的第一群体，以产生所述***缺失，所述第一gRNA包括第一gRNA靶向结构域。

5.一种经修饰的细胞的第一群体，所述第一群体包含：

多个经修饰的CD34+或造血干细胞，

在作为整体的所述多个经修饰的细胞中，60％或更多的***缺失是至少4个碱基对的缺失；

所述***缺失通过将包括第一gRNA和Cpf1 RNA指导的核酸酶或经修饰的Cpf1 RNA指导的核酸酶的第一RNP复合物递送至包含多个未经修饰的CD34+或造血干细胞的未经修饰的细胞的第一群体来产生，所述第一gRNA包括第一gRNA靶向结构域。

6.如权利要求1-5中任一项所述的经修饰的细胞的第一群体，其中在作为整体的所述多个经修饰的细胞中，25％或更多的***缺失是至少4个碱基对的缺失，并且通过修复机制而不是微同源介导的末端连接(MMEJ)修复来引入。

7.如权利要求1-5中任一项所述的经修饰的细胞的第一群体，其中在作为整体的所述多个经修饰的细胞中，25％或更多的***缺失是至少4个碱基对的缺失，并且通过非同源末端连接(NHEJ)修复来引入。

8.如权利要求1-7中任一项所述的经修饰的细胞的第一群体，其中在作为整体的所述多个经修饰的细胞中，50％或更多的***缺失是1个碱基对和25个碱基对之间的缺失。

9.如权利要求1-7中任一项所述的经修饰的细胞的第一群体，其中在作为整体的所述多个经修饰的细胞中，50％或更多的***缺失是3个碱基对和25个碱基对之间的缺失。

10.如权利要求1-7中任一项所述的经修饰的细胞的第一群体，其中在作为整体的所述多个经修饰的细胞中，50％或更多的***缺失是4个碱基对和25个碱基对之间的缺失。

11.如权利要求1-7中任一项所述的经修饰的细胞的第一群体，其中在作为整体的所述多个经修饰的细胞中，50％或更多的***缺失是5个碱基对和25个碱基对之间的缺失。

12.如权利要求1-11中任一项所述的经修饰的细胞的第一群体，其中作为整体的所述多个经修饰的细胞包含以下缺失：

HBG1启动子、HBG2启动子或其组合中的HBG1/2 c.-104至-121缺失，所述HBG1/2 c.-104至-121缺失占作为整体的所述多个经修饰的细胞中的***缺失的2％或更多；以及

HBG1启动子、HBG2启动子或其组合中的HBG1/2 c.-110至-115缺失，所述HBG1/2 c.-110至-115缺失占作为整体的多个经修饰的细胞中的***缺失的2％或更多。

13.如权利要求1-12中任一项所述的经修饰的细胞的第一群体，其中作为整体的所述多个经修饰的细胞包含以下缺失：

HBG1启动子、HBG2启动子或其组合中的HBG1/2 c.-104至-121缺失，所述HBG1/2 c.-104至-121缺失占作为整体的所述多个经修饰的细胞中的***缺失的1％至15.5％；

HBG1启动子、HBG2启动子或其组合中的HBG1/2 c.-110至-115缺失，所述HBG1/2 c.-110至-115缺失占作为整体的所述多个经修饰的细胞中的***缺失的1％至6％；

HBG1启动子、HBG2启动子或其组合中的HBG1/2 c.-112至-115缺失，所述HBG1/2 c.-112至-115缺失占作为整体的所述多个经修饰的细胞中的***缺失的1％至6％；

HBG1启动子、HBG2启动子或其组合中的HBG1/2 c.-113至-115缺失，所述HBG1/2 c.-113至-115缺失占作为整体的所述多个经修饰的细胞中的***缺失的1％至6％；

HBG1启动子、HBG2启动子或其组合中的HBG1/2 c.-111至-115缺失，所述HBG1/2 c.-111至-115缺失占作为整体的所述多个经修饰的细胞中的***缺失的1％至6％；

HBG1启动子、HBG2启动子或其组合中的HBG1/2 c.-111至-117缺失，所述HBG1/2 c.-111至-117缺失占作为整体的所述多个经修饰的细胞中的***缺失的1％至6％；

HBG1启动子、HBG2启动子或其组合中的HBG1/2 c.-102至-114缺失，所述HBG1/2 c.-102至-114缺失占作为整体的所述多个经修饰的细胞中的***缺失的1％至6％；

HBG1启动子、HBG2启动子或其组合中的HBG1/2 c.-114至-118缺失，所述HBG1/2 c.-114至-118缺失占作为整体的所述多个经修饰的细胞中的***缺失的1％至6％；

HBG1启动子、HBG2启动子或其组合中的HBG1/2 c.-112至-116缺失，所述HBG1/2 c.-112至-116缺失占作为整体的所述多个经修饰的细胞中的***缺失的1％至6％；以及

HBG1启动子、HBG2启动子或其组合中的HBG1/2 c.-113至-117缺失，所述HBG1/2 c.-113至-117缺失占作为整体的多个经修饰的细胞中的***缺失的1％至6％。

14.如权利要求1-13中任一项所述的经修饰的细胞的第一群体，其中作为整体的所述多个经修饰的细胞包含存在于图56A所示的所有14个样品中的108个缺失。

15.如权利要求1-13中任一项所述的经修饰的细胞的第一群体，其中作为整体的所述多个经修饰的细胞包含在表25中被鉴定为具有***缺失的平均百分比为0.1％或更多的***缺失。

16.如权利要求1-15中任一项所述的经修饰的细胞的第一群体，其中作为整体的所述多个经修饰的细胞包含表25所示的***缺失。

17.如权利要求1-16中任一项所述的经修饰的细胞的第一群体，其中作为整体的所述多个经修饰的细胞包含比经修饰的细胞的第二群体多至少10％的至少4个碱基对的缺失，所述经修饰的细胞的第二群体包含多个经修饰的CD34+或造血干细胞，

所述经修饰的细胞的第二群体中的一个或多个经修饰的细胞在HBG基因启动子中具有***缺失；并且

所述经修饰的细胞的第二群体的***缺失通过将包含第二gRNA和Cas9 RNA指导的核酸酶的第二RNP复合物递送至包含多个未经修饰的CD34+或造血干细胞的未经修饰的细胞的第二群体来产生，所述第二gRNA包括包含SEQ ID NO:339的第二gRNA靶向结构域。

18.如权利要求1-17中任一项所述的经修饰的细胞的第一群体，其中作为整体的所述多个经修饰的细胞包含比经修饰的细胞的第二群体多至少10％的由NHEJ修复机制引入的至少4个碱基对的缺失，所述经修饰的细胞的第二群体包含多个经修饰的CD34+或造血干细胞，

所述经修饰的细胞的第二群体中的一个或多个经修饰的细胞在HBG基因启动子中包含***缺失；并且

19.如权利要求4-18所述的经修饰的细胞的第一群体，其中将所述第一RNP复合物通过电穿孔递送至所述未经修饰的细胞的第一群体。

20.如权利要求17或18所述的经修饰的细胞的第一群体，其中将所述第二RNP复合物通过电穿孔递送至所述未经修饰的细胞的第二群体。

21.如权利要求1-20中任一项所述的经修饰的细胞的第一群体，其中所述未经修饰的细胞的第一群体来自患有镰状细胞病的受试者。

22.如权利要求17或18所述的经修饰的细胞的第一群体，其中所述未经修饰的细胞的第二群体来自患有镰状细胞病的受试者。

23.如权利要求4-22中任一项所述的经修饰的细胞的第一群体，其中与所述未经修饰的细胞的第一群体相比，所述经修饰的细胞的第一群体包含较高的HbF水平。

24.如权利要求17或18所述的经修饰的细胞的第一群体，其中与所述经修饰的细胞的第二群体相比，所述经修饰的细胞的第一群体包含较高的HbF水平。

25.如权利要求4-24中任一项所述的经修饰的细胞的第一群体，所述第一gRNA包括5’末端和3’末端、在5’末端的DNA延伸、以及在3’末端的2’-O-甲基-3’-硫代磷酸酯修饰。

26.如权利要求25所述的经修饰的细胞的第一群体，其中所述DNA延伸包含SEQ ID NO:1235-1250所示的序列。

27.如权利要求4-26中任一项所述的经修饰的细胞的第一群体，其中所述第一gRNA靶向结构域包含SEQ ID NO:1254。

28.如权利要求4-27中任一项所述的经修饰的细胞的第一群体，其中所述gRNA包含SEQID NO:1051。

29.如权利要求4-28中任一项所述的经修饰的细胞的第一群体，其中所述经修饰的Cpf1包含SEQ ID NO:1097。

30.如权利要求1-29中任一项所述的经修饰的细胞的第一群体，其中HBG基因启动子中的所述***缺失在CCAAT盒靶区域中。

31.一种诱导胎儿血红蛋白(HbF)在经修饰的细胞的第一群体中表达的方法，所述经修饰的细胞的第一群体包含多个经修饰的CD34+或造血干细胞，所述方法包括：

将包括第一指导RNA(gRNA)和Cpf1 RNA指导的核酸酶或经修饰的Cpf1 RNA指导的核酸酶的第一RNP复合物递送至包含多个未经修饰的CD34+或造血干细胞的未经修饰的细胞的第一群体，以产生***缺失，所述第一gRNA包括第一gRNA靶向结构域，

每个经修饰的CD34+或造血干细胞在HBG基因启动子中包含***缺失，

与所述未经修饰的细胞的第一群体相比，所述经修饰的细胞的第一群体包含较高的HbF水平。

32.如权利要求31所述的诱导HbF表达的方法，其中所述经修饰的细胞的第一群体包含如权利要求1-30中任一项所述的经修饰的细胞的第一群体。

33.一种降低从经修饰的细胞的第一群体培养的红细胞(RBC)的第一群体中的镰状化的方法，所述经修饰的细胞的第一群体包含多个来自患有镰状细胞病的受试者的经修饰的CD34+细胞，所述方法包括：

a)将包括第一gRNA和Cpf1 RNA指导的核酸酶或经修饰的Cpf1 RNA指导的核酸酶的第一RNP复合物递送至包含来自所述受试者的多个未经修饰的CD34+细胞的未经修饰的细胞的第一群体，以产生***缺失，所述第一gRNA包括第一gRNA靶向结构域，每个经修饰的CD34+细胞在HBG基因启动子中包含***缺失，在作为整体的所述多个经修饰的CD34+细胞中，60％或更多的***缺失是至少4个碱基对的缺失；以及

b)从包含所述多个经修饰的CD34+细胞的细胞的所述第一群体培养所述RBC的第一群体，

与包含从所述未经修饰的细胞的第一群体培养的多个RBC的RBC的第二群体相比，所述RBC的第一群体在脱氧时展现出显著降低的镰状化。

34.如权利要求33所述的降低镰状化的方法，其中与所述RBC的第二群体相比，所述RBC的第一群体以显著较低的氧张力镰状化。

35.如权利要求34所述的降低镰状化的方法，其中所述氧张力通过相对氧气压力测量。

36.如权利要求33-35中任一项所述的降低镰状化的方法，其中与所述RBC的第二群体相比，所述RBC的第一群体在脱氧时具有显著较高的最小伸长指数。

37.如权利要求33-35中任一项所述的降低镰状化的方法，其中与包含从所述未经修饰的细胞的第一群体培养的多个RBC的RBC的第二群体相比，所述RBC的第一群体在脱氧时具有显著较高的速度。

38.如权利要求33-35中任一项所述的降低镰状化的方法，其中与包含从所述未经修饰的细胞的第一群体培养的多个RBC的RBC的第二群体相比，所述RBC的第一群体包含较高的HbF水平。

39.如权利要求33-38中任一项所述的降低镰状化的方法，其中所述经修饰的细胞的第一群体包含如权利要求1-30中任一项所述的经修饰的细胞的第一群体。

40.一种减轻有需要的受试者中镰状细胞病的一种或多种症状的方法，所述方法包括：

a)将包括第一gRNA和Cpf1 RNA指导的核酸酶或经修饰的Cpf1 RNA指导的核酸酶的第一RNP复合物递送至包含多个未经修饰的CD34+或造血干细胞的未经修饰的细胞的第一群体以产生***缺失，每个经修饰的CD34+或造血干细胞在HBG基因启动子中包含***缺失，作为整体的多个所述经修饰的CD34+或造血干细胞中的60％或更多的***缺失是至少4个碱基对的缺失；以及

b)向所述受试者施用包含所述多个经修饰的CD34+或造血干细胞的经修饰的细胞的第一群体，以减轻一种或多种镰状细胞病症状。

41.如权利要求40所述的方法，所述方法进一步包括在施用后1周和5年之间的一个或多个时间段检测经修饰的红系后代细胞群体，所述经修饰的红系后代细胞群体包含从所述经修饰的细胞的第一群体培养的多个经修饰的红系后代细胞。

42.如权利要求40或41所述的方法，其中所述方法导致在骨髓中多个HSC克隆的长期植入。

43.如权利要求40-42中任一项所述的方法，其中与健康受试者相比，所述方法导致至少50％的总血红蛋白的长期表达。

44.如权利要求40-43中任一项所述的方法，其中所述经修饰的细胞的第一群体包含如权利要求1-30中任一项所述的经修饰的细胞的第一群体。