CN116669775A

CN116669775A - 用修饰的核酸内切酶进行的基因编辑

Info

Publication number: CN116669775A
Application number: CN202180089299.0A
Authority: CN
Inventors: 布伦特·E·斯特德; 托马斯·A·麦克默罗; 奥迪肖·K·伊斯拉埃尔
Original assignee: Specific Biologics Inc
Current assignee: Specific Biologics Inc
Priority date: 2020-11-04
Filing date: 2021-11-04
Publication date: 2023-08-29
Also published as: IL302583A; EP4240839A1; AU2021373368A9; WO2022097070A9; US20240150796A1; KR20230131178A; CA3197414A1; WO2022097070A1; JP2023548391A; AU2021373368A1

Abstract

一种具有独特结合和裂解特性的工程化核酸酶，以及使用所述修饰的核酸内切酶进行基因编辑来改变细胞基因表达的方法。

Description

用修饰的核酸内切酶进行的基因编辑

交叉引用

本申请要求2020年11月4日提交的美国临时申请序列第63/109,396号的权益，其通过引用以其整体并入本文。

背景

细胞疗法注射健康的人类细胞来再生受损组织，产生缺失或故障的酶或蛋白质，或利用免疫细胞功能作为包括癌症在内的无数疾病的药物治疗。大约1/3的美国人在一生中会受到癌症影响，并且预计还会上升。癌症可以发生在几乎每一个器官***，包括***、肺、***、结肠、膀胱、皮肤和血液。大多数治疗施用大剂量的有毒物质(化疗药物和放疗)，这些物质具有偏离靶(off-target)和大范围的副作用，并且通常包括受影响组织的侵入性切除。免疫疗法使用患者自身的免疫***来靶向并杀死癌细胞。细胞免疫疗法包括通常通过基因编辑对患者的免疫细胞进行编程，以靶向这些细胞来选择性地杀死癌细胞。改变患者的免疫细胞来攻击肿瘤有可能成为一种有效的、并且侵入性较小的治疗。再生受损组织或产生缺失或故障酶的工程化细胞疗法也使用患者自身的细胞，并且通常是通过基因编辑技术编程的诱导多能干细胞。基因编辑技术的应用可以改变患者的免疫细胞或干细胞，并用作各种疾病和状况的疗法或治疗的一部分。

基因编辑是一种基因治疗方法，其依赖于设计师核酸酶(designer nucleases)来识别并切割特定的DNA序列，并且然后利用先天的细胞DNA修复途径，即非同源末端连接(NHEJ)和同源定向修复(HDR)，以在基因组中引入靶向修饰。这些核酸酶可以被设计为在感兴趣的靶基因座精确引入双链断裂。基因编辑通过在离体和体内环境两者下实现靶向性破坏、***、切除和校正，打开了永久修饰感兴趣的基因组序列的可能性。现有的基因编辑技术，诸如CRISPR-Cas9(和Cas9融合物)、兆核酸酶、锌指蛋白、IIS型限制性核酸内切酶(FokI和FokI融合物)和TALEN在引入指定长度的基因缺失或在足够数量的细胞中准确修复靶基因以作为许多遗传疾病的有意义的治疗剂的能力方面受到限制。此外，对于高度可编程的RNA引导的核酸酶，诸如单体Cas9，研究表明，可预测地结合、裂解和修复仅其靶位点的特异性是有限的，这引起了人们对可能无意中导致患者的继发性疾病的细胞基因组DNA的潜在有害变化的担忧。

作为构成细菌先天性免疫***的II型CRISPR***的一个组分，Cas9(CRISPR相关)蛋白因其易于使用而引起了基因组编辑领域的模式转变。对Cas9进行编程以裂解期望的序列是将Cas9相关引导RNA(guide RNA)的序列改变为与靶位点互补的简单问题。Cas9靶向编程的简易性与其他试剂(锌指核酸酶(ZFN)、兆核酸酶、转录激活因子样效应物核酸酶(TALEN))所需的更密集的蛋白质工程形成对比。Cas9与来自II型CRISPR***的蛋白质一起，已经在各种生物体中用于无数的基因组编辑应用，并且现在正在进入人类治疗应用领域。以Specific Biologics(Toronto，Ontario，CA)的名义公布的国际专利申请(PCT/IB2020/054229，其内容通过引用并入本文)描述了双重裂解嵌合核酸酶TevSaCas9的一种形式，其包含I-TevI核酸酶结构域的氨基酸1-92、包含I-TevI接头区的氨基酸93-169的接头区和金黄色葡萄球菌(Staphylococcus aureus)Cas9(“saCAS9”)结构域。它还描述了制造TevSaCas9的方法。修饰TevSaCas9以将免疫细胞修饰成靶向癌症相关的细胞可以使癌症治疗细胞疗法更加高效和有效。此外，修饰TevSaCas9以修饰干细胞可以使受损组织的治疗或缺失酶或蛋白质的替换更有效。

免疫***通过识别表面蛋白(抗原)来识别外来物体和/或细胞。存在于T细胞表面的受体靶向抗原并激活T细胞以及启动其他下游免疫途径。嵌合抗原受体T细胞(CAR-T细胞)是产生人工T细胞受体(TCR)的遗传修饰的T细胞，用于免疫疗法以及血液和实体肿瘤的治疗。CAR-T细胞疗法是一种细胞疗法，其中从患者获取T细胞并进行遗传改变以识别癌细胞特异性抗原。修饰的细胞被注射回患者，以靶向并破坏癌组织。T细胞可以从患者的血液(自体)或健康献血者的血液(同种异体)收集。在抗原识别后，刺激的CAR-T细胞增加增殖、细胞毒性和分泌额外的因子，如细胞因子、白细胞介素和生长因子，以激活其他类型的细胞。期望在细胞疗法(诸如嵌合抗原受体T细胞疗法)中敲除基因以限制细胞耗竭、毒性和***性肿瘤发生(Lui J等人,(2019),Front Immunol,10(456):1-8)。

目前的技术主要依赖于使用病毒载体来产生细胞疗法。病毒载体的使用是高效的；然而，关于安全性的问题仍然存在。用于改变细胞疗法的随机***可以破坏脱靶内源性基因功能并导致肿瘤发生(即，癌症)和细胞毒性。需要一种安全有效的工具来精确破坏靶基因和整合外源DNA以产生有效的细胞疗法。将CRISPR技术应用于细胞疗法能够更好地修饰CAR T细胞的嵌合抗原受体和内源性基因，并克服T细胞疗法的目前局限性。虽然这些进展有望彻底改变整个领域，但目前的基因编辑方法受到修饰功效、与核酸酶特异性相关的安全性顾虑以及基因编辑工具向靶细胞类型的递送的限制。本发明的第一次迭代被有意地设计成修饰免疫细胞(诸如T细胞)或诱导多能干细胞(iPSC)的DNA以将它们工程化用于基因敲除(单独地和同时地二者)或外源基因诸如嵌合抗原受体(CAR)的表达，以提高效率。本发明还可以用于工程化其他类型的细胞。

概述

本文描述了嵌合核酸酶(称为“TevSaCas9”)，其包含I-TevI结构域的修饰形式、接头肽和RNA引导的核酸酶金黄色葡萄球菌Cas9(“SaCas9”)结构域的修饰形式，设计为靶向基因以消除宿主排斥并提高细胞治疗的有效性。当递送到靶向细胞时，新的嵌合核酸酶在存在外源供体DNA的情况下代替DNA序列，或者在不存在外源供体DNA的情况下缺失DNA。本发明的另一方面涉及编辑基因和用本文所述的编辑的基因产生细胞疗法的方法。本文还描述了由I-TevI结构域和CasX或Cas12核酸酶形成的嵌合核酸酶。

本文描述了：(a)TevSaCas9的新的类似物，其靶向B2M、TRAC1、TRCB1和/或HLA-A基因以产生不合框缺失(out-of-frame deletions)；(b)核酸酶和适合电穿孔的外源供体DNA的制剂；(c)同时靶向细胞中B2M、TRAC1、TRCB1和/或HLA-A的一种或更多种的核酸酶制剂(多重基因破坏)；(d)本发明的一种形式，其含有外源供体DNA，当与TevSaCas9核酸酶一起递送时，所述TevSaCas9核酸酶靶向于AAVS1基因中的安全港位点，能够在核酸酶靶向的两个位点之间整合；和(e)嵌合核酸酶的新类似物，其包含修饰的I-TevI结构域、接头结构域和RNA引导的核酸酶结构域。

在一个方面中，本文描述了制备遗传工程化细胞组合物的方法，包括向离体细胞群体施用嵌合核酸酶，所述嵌合核酸酶包含修饰的I-TevI核酸酶结构域、接头、RNA引导的核酸酶金黄色葡萄球菌Cas9结构域和引导RNA，其中所述细胞群体包括免疫细胞和多能细胞中的一种或更多种。在某些实施方案中，修饰的I-TevI核酸酶结构域包括与SEQ ID NO:8至少85％、90％、95％、97％、98％、99％相同的氨基酸序列。在某些实施方案中，修饰的I-TevI核酸酶结构域包含选自T11V、V16I、N14G、E25D、K26R、R27A、E36S、K37N、G38N、C39V、S41H、L45F、F49Y、I60V和E81I中的任何一种或更多种的取代。在某些实施方案中，修饰的I-TevI核酸酶结构域包含K26R取代。在某些实施方案中，修饰的I-TevI核酸酶结构域包括SEQID NO:8。在某些实施方案中，接头包括与SEQ ID NO:9-14或59中的任一种至少85％、90％、95％、97％、98％、99％相同的氨基酸序列。在某些实施方案中，接头包含选自T95S、S101Y、A119D、K120N、K135N、K135R、P126S、D127K、N140S、T147I、Q158R、A161V或S165G中的任何一种或更多种的取代。在某些实施方案中，接头包含选自T95S、V117F、K135R、N140S或Q158R中的任何一种或更多种的取代。在某些实施方案中，接头是选自SEQ ID NO:9-14或59中的任一种的肽。在某些实施方案中，RNA引导的核酸酶金黄色葡萄球菌Cas9结构域包括SEQ IDNO:15、16、26、27或28中的任一种。在某些实施方案中，RNA引导的核酸酶金黄色葡萄球菌Cas9结构域包括与SEQ ID NO:15、16、26、27或28中的任一种至少85％、90％、95％、97％、98％、99％相同或与SEQ ID NO:15、16、26、27或28中的任一种相同的氨基酸序列。在某些实施方案中，RNA引导的核酸酶金黄色葡萄球菌Cas9结构域包含选自T267A、L325F、V327I、D333G、A336S、I341L、E345D、D348N、K352E、S360A、T368A、N369E、N371E、S372P、E373K、K386T、N393R、H408N、N410S、I414M、A415T、T438S、Y467F、N471K、D485E、M489F、E506K、R409K、T510E、N515K、Y518F、A539P、F550Y、N551H、S596A、T602I、A611S、I617V、T620K、G654E、N667D、R685K、K695Q、I706V、K722T、A723T、K724N、M731T、F732V、K735Q、S739N、P741L、E742G、E746D、Q747D、I754D、T755I、H757R、K760Q、H761S、P778I、E781K、I783V、N784D、D785E、T786L、L787V、Y788H、K792E、D794T、T798R、L799I、V801I、N803S、L804I、N805K、G806N、D813G、K814E、L818I、I819F、S822P、E824G、L841T、G847S、D848N、Y857H、V875I、I876V、N884K、A888V、L890R、D894G、D895H、P897L、V903I、G920D、F924L、N929Y、E936D、N937G、V941I、N942D、S943L、C945A、E947K、K951R、L952Q、S956N、N957E、Q958K、A959S、N974D、G975K、V983A、N984S、N985D、D986G、I991V、V993L、M995F、I996V、T999N、Y1000K、R1001E、E1002D、L1004I、E1005K、N1006M、M1007N、D1009L、K1010S、R1011T、P1012S、P1013F、I1015L、I1016R、A1020G、S1021K、Q1024K、K1027S、E1039K、H1045K、I0148M或K1050M中的任何一种或更多种的取代。在某些实施方案中，RNA引导的核酸酶金黄色葡萄球菌Cas9结构域包含D10E取代。在某些实施方案中，修饰的I-TevI核酸酶结构域包括SEQ ID NO:8，接头包括SEQ ID NO:9-14或59中的任一种，并且RNA引导的核酸酶金黄色葡萄球菌Cas9结构域包括SEQ ID NO:15、16、26、27或28中的任一种。在某些实施方案中，修饰的I-TevI核酸酶结构域包括与SEQ ID NO:8中的任一种至少85％、90％、95％、97％、98％、99％相同或与SEQ ID NO:8中的任一种相同的氨基酸序列，接头结构域包括与SEQ ID NO:9-14中的任一种至少85％、90％、95％、97％、98％、99％相同或与SEQ ID NO:9-14中的任一种相同的氨基酸序列，并且RNA引导的核酸酶金黄色葡萄球菌Cas9结构域包括与SEQ ID NO:15、16、26、27或28的任一种至少85％、90％、95％、97％、98％、99％相同的氨基酸序列。在某些实施方案中，嵌合核酸酶对双链DNA中的I-TevI识别位点具有裂解活性。在某些实施方案中，所述嵌合核酸酶被递送至靶细胞的基因组DNA。在某些实施方案中，细胞群体包括免疫细胞。在某些实施方案中，免疫细胞是T细胞。在某些实施方案中，免疫细胞是自然杀伤(NK)细胞。在某些实施方案中，细胞群体包括多能细胞。在某些实施方案中，多能细胞是诱导多能细胞。在某些实施方案中，多能细胞包括造血干细胞或其前体。在某些实施方案中，多能细胞包括间充质干细胞或其前体。在某些实施方案中，多能细胞是诱导多能细胞。在某些实施方案中，使用DNA表达盒将所述嵌合核酸酶递送至靶细胞的基因组DNA。在某些实施方案中，所述方法不使用病毒载体。在某些实施方案中，使用电穿孔将所述嵌合核酸酶施用至所述离体的细胞群体。在某些实施方案中，电穿孔以1000至2500V的电流施加。在某些实施方案中，该方法还进一步包括向细胞群体施用供体DNA。在某些实施方案中，供体DNA包含钝端和两个核苷酸的3’突出端。在某些实施方案中，供体DNA包含在感兴趣的外源基因侧翼的5’和3’同源物。在某些实施方案中，所述供体DNA包含外源基因。在某些实施方案中，在不存在供体DNA的情况下施用嵌合核酸酶。在某些实施方案中，嵌合核酸酶修饰靶细胞的基因组DNA以缺失一个或更多个确定长度的基因组DNA。在某些实施方案中，所述外源基因表达嵌合抗原受体。在某些实施方案中，所述嵌合核酸酶靶向并裂解B2M基因、TRAC1基因、TRCB1基因、HLA-A基因或HLA-B基因。在某些实施方案中，所述嵌合核酸酶的引导RNA包括SEQ ID NO:17或SEQID NO:18，或其片段；其中所述嵌合核酸酶靶向并裂解B2M基因。在某些实施方案中，所述嵌合核酸酶的引导RNA包括SEQ ID NO:19或其片段；其中所述嵌合核酸酶靶向并裂解TRAC1基因。在某些实施方案中，所述嵌合核酸酶的引导RNA包括SEQ ID NO:20或其片段；其中所述嵌合核酸酶靶向TRCB1基因。在某些实施方案中，所述嵌合核酸酶的引导RNA包括SEQ IDNO:21或其片段；其中所述嵌合核酸酶靶向并裂解HLA-A基因。在某些实施方案中，所述嵌合核酸酶的引导RNA包括SEQ ID NO:22或其片段；其中所述嵌合核酸酶靶向AAVS1基因。在某些实施方案中，在存在外源供体DNA的情况下，AAVS1基因被靶向。在某些实施方案中，嵌合核酸酶靶向AAVS1基因上的两个位点。在某些实施方案中，外源供体DNA被整合在AAVS1基因上的两个靶向位点之间。在某些实施方案中，引导RNA包含以下的一种或更多种：非天然核苷间键、核酸模拟物、修饰的糖部分和修饰的核碱基。在某些实施方案中，非天然核苷间键包含以下的一种或更多种：硫代磷酸酯、磷酰胺酯、非磷酸二酯、杂原子、手性硫代磷酸酯、二硫代磷酸酯、磷酸三酯、氨基烷基磷酸三酯、3’-亚烷基膦酸酯、5’-亚烷基膦酸酯、手性膦酸酯、次膦酸酯、3’-氨基磷酰胺酯、氨基烷基磷酰胺酯、磷酸二胺酯、硫羰基磷酰胺酯、硫羰基烷基膦酸酯、硫羰基烷基磷酸三酯、硒磷酸酯和硼烷磷酸酯。在某些实施方案中，核酸模拟物包含肽核酸(PNA)、吗啉代核酸、环己烯基核酸(CeNA)或锁核酸(LNA)中的一种或更多种。在某些实施方案中，修饰的糖部分包含2’-O-(2-甲氧基乙基)、2’-二甲基氨基氧基乙氧基、2’-二甲基氨基乙氧基乙氧基、2’-O-甲基和2’-氟中的一种或更多种。在某些实施方案中，修饰的核碱基包含以下的一种或更多种：5-甲基胞嘧啶；5-羟甲基胞嘧啶；黄嘌呤；次黄嘌呤；2-氨基腺嘌呤；腺嘌呤的6-甲基衍生物；鸟嘌呤的6-甲基衍生物；腺嘌呤的2-丙基衍生物；鸟嘌呤的2-丙基衍生物；2-硫尿嘧啶；2-硫代胸腺嘧啶；2-硫代胞嘧啶；5-卤尿嘧啶；5-卤胞嘧啶；5-丙炔基尿嘧啶；5-丙炔基胞嘧啶；6-偶氮尿嘧啶；6-偶氮胞嘧啶；6-偶氮胸腺嘧啶；假尿嘧啶；4-硫尿嘧啶；8-卤素；8-氨基；8-硫醇；8-硫代烷基；8-羟基；5-卤素；5-溴；5-三氟甲基；5-取代的尿嘧啶；5-取代的胞嘧啶；7-甲基鸟嘌呤；7-甲基腺嘌呤；2-F-腺嘌呤；2-氨基腺嘌呤；8-氮杂鸟嘌呤；8-氮杂腺嘌呤；7-去氮鸟嘌呤；7-去氮腺嘌呤；3-去氮鸟嘌呤；3-去氮腺嘌呤；三环嘧啶；苯噁嗪胞苷；吩噻嗪胞苷；取代的苯噁嗪胞苷；咔唑胞苷；吡啶吲哚胞苷；7-去氮腺嘌呤；7-去氮鸟苷；2-氨基吡啶；2-吡啶酮；5-取代的嘧啶；6-氮杂嘧啶；N-2、N-6或O-6取代的嘌呤；2-氨基丙基腺嘌呤；5-丙炔基尿嘧啶；和5-丙炔基胞嘧啶。

在一个方面，本文描述了包含修饰的I-TevI核酸酶结构域和/或I-TevI接头结构域、CasX多肽和引导RNA的嵌合核酸酶，其中所述嵌合核酸酶任选地包含核定位信号。在某些实施方案中，修饰的I-TevI核酸酶结构域和/或I-TevI接头结构域包含对应于SEQ IDNO:53中所列的未修饰的I-TevI核酸酶的K26、T95、V117、K135、N140和Q158的一个或更多个氨基酸残基处的修饰。在某些实施方案中，修饰的I-TevI核酸酶结构域和/或I-TevI接头结构域包含对应于SEQ ID NO:53中所列的未修饰的I-TevI核酸酶的V117的氨基酸处的氨基酸修饰。在某些实施方案中，修饰的I-TevI核酸酶结构域和/或I-TevI接头结构域包含对应于SEQ ID NO:53中所列的未修饰的I-TevI核酸酶的V117F的氨基酸修饰。在某些实施方案中，修饰的I-TevI核酸酶结构域和/或I-TevI接头结构域包含对应于SEQ ID NO:53中所列的未修饰的I-TevI核酸酶的V117、K135和N140的氨基酸处的氨基酸修饰。在某些实施方案中，修饰的I-TevI核酸酶结构域和/或I-TevI接头结构域接头包含对应于SEQ ID NO:53中所列的未修饰的I-TevI核酸酶的V117F、K135R和N140S的氨基酸修饰。在某些实施方案中，修饰的I-TevI核酸酶结构域和/或接头包含对应于SEQ ID NO:53中所列的未修饰的I-TevI核酸酶的K135和N140的氨基酸处的氨基酸修饰。在某些实施方案中，修饰的I-TevI核酸酶结构域和/或I-TevI接头结构域包含对应于SEQ ID NO:53中所列的未修饰的I-TevI核酸酶的K135R和N140S的氨基酸修饰。在某些实施方案中，修饰的I-TevI核酸酶结构域和/或I-TevI接头结构域包含对应于SEQ ID NO:53中所列的未修饰的I-TevI核酸酶的K26、T95和Q158的氨基酸处的氨基酸修饰。在某些实施方案中，修饰的I-TevI核酸酶结构域和/或接头包含对应于SEQ ID NO:53中所列的未修饰的I-TevI核酸酶的K26R、T95S和Q158R的氨基酸修饰。在某些实施方案中，修饰的I-TevI核酸酶结构域和/或I-TevI接头结构域包括与SEQID NO:53至少约85％、90％、95％、97％、98％、99％相同或与SEQ ID NO:53相同的氨基酸序列。在某些实施方案中，CasX多肽包括与SEQ ID NO:52至少约85％、90％、95％、97％、98％、99％相同或与SEQ ID NO:52相同的氨基酸序列。在某些实施方案中，Cas12多肽包含选自R11K、R12K、V14S、K15A、S17N、N18A、A22V、G23S、T25S、P38D、K41K、E42K、N46K、L47R、N53V、I54M、P57V、T61N、S62A、R63A、A64N、E75K、H82Q、Q89K、P104S、N106K、I113K、N199K、S124T、S125A、C133G、Y137F、N145S、D146E、H151Y、S161A、R165K、N177S、L180A、R202K、N205T、G215A、C219Y、V236I、T241S、L248I、I254V、S269G、I290V、E291D、V297I、Q299R、I314L、E318D、Q323L、L333V、E359D、D360M、K362R、Q366S、N367G、L368V、A369T、G370A、Y371E、H404Y、H409Y、G410A、E411G、Y417F、V428I、E429A、S432T、K433S、L437R、S443A、A451V、I464L、A470M、I502V、L503V、I531L、G537K、L540I、N553S、I559L、S563G、V571L、N579Q、H589T、S607L、L608I、L620I、R623K、R624K、L644V、S646P、M652V、I657V、R679E、L684S、N686G、H689D、S696G、T702A、T737S、L742F、Y744H、Q748H、M751V、I753V、A771T、R777K、P792T、S818T、R823G、V824M、E826V、K827R、A832S、T833D、M836A、I839L、G841N、V846A、N860T、V862E、D864E、V867A、V877G、S883K、S889R、G890D、S894F、K908Q、N913D、F916H、T918V、R936N、Q938N、Y940F、K942S、S963A、R966K、K967R或K968R中的任何一种或更多种的取代。在某些实施方案中，CasX多肽来自浮霉菌门(Planctomycetes)细菌。在某些实施方案中，CasX多肽来自δ变形菌纲(Deltaproteobacteria)。在某些实施方案中，嵌合核酸酶还包含引导RNA。在某些实施方案中，引导RNA靶向哺乳动物细胞中的基因组靶。在某些实施方案中，引导RNA靶向哺乳动物细胞中的致癌突变。在某些实施方案中，哺乳动物细胞是人类细胞。在某些实施方案中，引导RNA靶向细菌或病毒序列。在某些实施方案中，引导RNA包含以下的一种或更多种：非天然核苷间键、核酸模拟物、修饰的糖部分和修饰的核碱基。在某些实施方案中，非天然核苷间键包含以下的一种或更多种：硫代磷酸酯、磷酰胺酯、非磷酸二酯、杂原子、手性硫代磷酸酯、二硫代磷酸酯、磷酸三酯、氨基烷基磷酸三酯、3’-亚烷基膦酸酯、5’-亚烷基膦酸酯、手性膦酸酯、次膦酸酯、3’-氨基磷酰胺酯、氨基烷基磷酰胺酯、磷酸二胺酯、硫羰基磷酰胺酯、硫羰基烷基膦酸酯、硫羰基烷基磷酸三酯、硒磷酸酯和硼烷磷酸酯。在某些实施方案中，核酸模拟物包含肽核酸(PNA)、吗啉代核酸、环己烯基核酸(CeNA)或锁核酸(LNA)中的一种或更多种。在某些实施方案中，修饰的糖部分包含2’-O-(2-甲氧基乙基)、2’-二甲基氨基氧基乙氧基、2’-二甲基氨基乙氧基乙氧基、2’-O-甲基和2’-氟中的一种或更多种。在某些实施方案中，修饰的核碱基包含以下的一种或更多种：5-甲基胞嘧啶；5-羟甲基胞嘧啶；黄嘌呤；次黄嘌呤；2-氨基腺嘌呤；腺嘌呤的6-甲基衍生物；鸟嘌呤的6-甲基衍生物；腺嘌呤的2-丙基衍生物；鸟嘌呤的2-丙基衍生物；2-硫尿嘧啶；2-硫代胸腺嘧啶；2-硫代胞嘧啶；5-卤尿嘧啶；5-卤胞嘧啶；5-丙炔基尿嘧啶；5-丙炔基胞嘧啶；6-偶氮尿嘧啶；6-偶氮胞嘧啶；6-偶氮胸腺嘧啶；假尿嘧啶；4-硫尿嘧啶；8-卤素；8-氨基；8-硫醇；8-硫代烷基；8-羟基；5-卤素；5-溴；5-三氟甲基；5-取代的尿嘧啶；5-取代的胞嘧啶；7-甲基鸟嘌呤；7-甲基腺嘌呤；2-F-腺嘌呤；2-氨基腺嘌呤；8-氮杂鸟嘌呤；8-氮杂腺嘌呤；7-去氮鸟嘌呤；7-去氮腺嘌呤；3-去氮鸟嘌呤；3-去氮腺嘌呤；三环嘧啶；苯噁嗪胞苷；吩噻嗪胞苷；取代的苯噁嗪胞苷；咔唑胞苷；吡啶吲哚胞苷；7-去氮腺嘌呤；7-去氮鸟苷；2-氨基吡啶；2-吡啶酮；5-取代的嘧啶；6-氮杂嘧啶；N-2、N-6或O-6取代的嘌呤；2-氨基丙基腺嘌呤；5-丙炔基尿嘧啶；和5-丙炔基胞嘧啶。本文还描述了编码嵌合核酸酶的核酸或多于一个核酸。在某些实施方案中，嵌合核酸酶和/或引导RNA可操作地偶联到真核启动子、增强子或多腺苷酸化位点中的一种或更多种。在某些实施方案中，核酸是选自质粒、慢病毒载体和腺相关病毒载体以及腺病毒载体的表达载体。在某些实施方案中，嵌合核酸酶被配制成向个体施用。本文还描述了包含嵌合核酸酶和药学上可接受的赋形剂、稀释剂或载体的组合物。本文还描述了包含包封在脂质纳米颗粒中的嵌合核酸酶的组合物。在某些实施方案中，脂质纳米颗粒包含阳离子和/或中性脂质。

在一个方面，本文描述了包含修饰的I-TevI核酸酶结构域和/或I-TevI接头结构域、Cas12多肽和引导RNA的嵌合核酸酶，其中所述嵌合核酸酶包含核定位信号。在某些实施方案中，修饰的I-TevI核酸酶结构域和/或I-TevI接头结构域包含对应于SEQ ID NO:53中所列的未修饰的I-TevI核酸酶的K26、T95、V117、K135、N140和Q158的一个或更多个氨基酸残基处的修饰。在某些实施方案中，修饰的I-TevI核酸酶结构域和/或I-TevI接头结构域包含对应于SEQ ID NO:53中所列的未修饰的I-TEVI核酸酶的V117的氨基酸处的氨基酸修饰。在某些实施方案中，修饰的I-TevI核酸酶结构域和/或I-TevI接头结构域包含对应于SEQID NO:53中所列的未修饰的I-TEVI核酸酶的V117F的氨基酸修饰。在某些实施方案中，修饰的I-TevI核酸酶结构域和/或I-TevI接头结构域包含对应于SEQ ID NO:53中所列的未修饰的I-TevI核酸酶的V117、K135和N140的氨基酸处的氨基酸修饰。在某些实施方案中，修饰的I-TevI核酸酶结构域和/或I-TevI接头结构域接头包含对应于SEQ ID NO:53中所列的未修饰的I-TevI核酸酶的V117F、K135R和N140S的氨基酸修饰。在某些实施方案中，修饰的I-TevI核酸酶结构域和/或接头包含对应于SEQ ID NO:53中所列的未修饰的I-TevI核酸酶的K135和N140的氨基酸处的氨基酸修饰。在某些实施方案中，修饰的I-TevI核酸酶结构域和/或I-TevI接头结构域包含对应于SEQ ID NO:53中所列的未修饰的I-TevI核酸酶的K135R和N140S的氨基酸修饰。在某些实施方案中，修饰的I-TevI核酸酶结构域和/或I-TevI接头结构域包含对应于SEQ ID NO:53中所列的未修饰的I-TevI核酸酶的K26、T95和Q158的氨基酸处的氨基酸修饰。在某些实施方案中，修饰的I-TevI核酸酶结构域和/或接头包含对应于SEQ ID NO:53中所列的未修饰的I-TevI核酸酶的K26R、T95S和Q158R的氨基酸修饰。在某些实施方案中，修饰的I-TevI核酸酶结构域和/或I-TevI接头结构域包括与SEQ ID NO:53至少约85％、90％、95％、97％、98％、99％相同或与SEQ ID NO:53相同的氨基酸序列。在某些实施方案中，Cas12多肽来自氨基酸球菌属物种(Acidaminococcus sp.)BV3L6。在某些实施方案中，Cas12多肽包括与SEQ ID NO:51至少约85％、90％、95％、97％、98％、99％相同或与SEQ ID NO:51相同的氨基酸序列。在某些实施方案中，Cas12多肽包含选自T1S、Q2N、E4S、G5E、N8H、L9K、K28E、H29N、I30L、Q31T、E32A、Q33Y、F35M、I36V、E37N、E38D、A41L、N43S、D44E、H45N、E48K、I52V、R55K、T59Y、Y60F、A61I、D62E、Q63E、C64T、Q66K、L67H、Q69A、L70I、N74P、S76Y、A77K、D80T、S81A、Y82F、E85D、E88L、T90N、R91N、N92T、A93N、I95R、E97I、A99D、T100N、Y101C、N103K、A104S、H106A、D107G、I110E、R112K、T113V、D114P、R159K、S169V、S185A、A187S、I192L、D195E、K201I、T212K、R218N、N223T、I228T、S233G、I236L、E237D、V239I、F242V、Q249C、Y257F、V279T、I284V、F305Y、N313S、S324N、I329L、S331A、T337E、L338K、L345I、E349Q、S357L、I358A、N386D、I393V、L396A、I400L、S403N、V408I、Q409E、G427D、K428D、Q436A、L442I、S468V、Q469L、S472A、L473V、L479T、E487D、S488D、A497V、L510I、A516V、K522Q、Q535S、M536N、S541D、V545E、K549Q、N550Q、G552C、V557E、N559E、S586N、Y596Q、A601S、I604L、A613D、S628N、E637T、A657D、K660R、G663N、Q665K、C673H、L683V、L697V、A711G、L717F、Q723E、A733L、E735D、Y740F、K751E、K756A、G766A、I778V、R793P、L844F、I858V、S865T、I874L、H898N、I903V、I916A、L931F、K941N、N945Q、V951I、S958T、V959A、D965E、I938V、H984Q、A1009S、C1024Y、G1037S、T1049E、G1055R、T1056N、Y1068F、L1075A、V1083R、K1085G、L1097I、H1104K、D1106N、D1111N、L1122K、A1134D、V1138I、D1147A、V1160E、P1161F、R1171Q、R1173E、Y1176L、N1205T、D1207N、S1220L、V1221T、A1230E、N1237S、L1243I、M1259K、Q1274L、G1291A、Q1295N、A1299N或L1304K中的任何一种或更多种的取代。在某些实施方案中，嵌合核酸酶对双链DNA中的I-TevI识别位点具有裂解活性。在某些实施方案中，嵌合核酸酶还包含引导RNA。在某些实施方案中，引导RNA靶向哺乳动物细胞中的基因组靶。在某些实施方案中，引导RNA靶向哺乳动物细胞中的致癌突变。在某些实施方案中，哺乳动物细胞是人类细胞。在某些实施方案中，引导RNA靶向细菌或病毒序列。在某些实施方案中，引导RNA包含以下的一种或更多种：非天然核苷间键、核酸模拟物、修饰的糖部分和修饰的核碱基。在某些实施方案中，非天然核苷间键包含以下的一种或更多种：硫代磷酸酯、磷酰胺酯、非磷酸二酯、杂原子、手性硫代磷酸酯、二硫代磷酸酯、磷酸三酯、氨基烷基磷酸三酯、3’-亚烷基膦酸酯、5’-亚烷基膦酸酯、手性膦酸酯、次膦酸酯、3’-氨基磷酰胺酯、氨基烷基磷酰胺酯、磷酸二胺酯、硫羰基磷酰胺酯、硫羰基烷基膦酸酯、硫羰基烷基磷酸三酯、硒磷酸酯和硼烷磷酸酯。在某些实施方案中，核酸模拟物包含肽核酸(PNA)、吗啉代核酸、环己烯基核酸(CeNA)或锁核酸(LNA)中的一种或更多种。在某些实施方案中，修饰的糖部分包含2’-O-(2-甲氧基乙基)、2’-二甲基氨基氧基乙氧基、2’-二甲基氨基乙氧基乙氧基、2’-O-甲基和2’-氟中的一种或更多种。在某些实施方案中，修饰的核碱基包含以下的一种或更多种：5-甲基胞嘧啶；5-羟甲基胞嘧啶；黄嘌呤；次黄嘌呤；2-氨基腺嘌呤；腺嘌呤的6-甲基衍生物；鸟嘌呤的6-甲基衍生物；腺嘌呤的2-丙基衍生物；鸟嘌呤的2-丙基衍生物；2-硫尿嘧啶；2-硫代胸腺嘧啶；2-硫代胞嘧啶；5-卤尿嘧啶；5-卤胞嘧啶；5-丙炔基尿嘧啶；5-丙炔基胞嘧啶；6-偶氮尿嘧啶；6-偶氮胞嘧啶；6-偶氮胸腺嘧啶；假尿嘧啶；4-硫尿嘧啶；8-卤素；8-氨基；8-硫醇；8-硫代烷基；8-羟基；5-卤素；5-溴；5-三氟甲基；5-取代的尿嘧啶；5-取代的胞嘧啶；7-甲基鸟嘌呤；7-甲基腺嘌呤；2-F-腺嘌呤；2-氨基腺嘌呤；8-氮杂鸟嘌呤；8-氮杂腺嘌呤；7-去氮鸟嘌呤；7-去氮腺嘌呤；3-去氮鸟嘌呤；3-去氮腺嘌呤；三环嘧啶；苯噁嗪胞苷；吩噻嗪胞苷；取代的苯噁嗪胞苷；咔唑胞苷；吡啶吲哚胞苷；7-去氮腺嘌呤；7-去氮鸟苷；2-氨基吡啶；2-吡啶酮；5-取代的嘧啶；6-氮杂嘧啶；N-2、N-6或O-6取代的嘌呤；2-氨基丙基腺嘌呤；5-丙炔基尿嘧啶；和5-丙炔基胞嘧啶。本文还描述了编码嵌合核酸酶的核酸或多于一个核酸。在某些实施方案中，嵌合核酸酶和/或引导RNA可操作地偶联到真核启动子、增强子或多腺苷酸化位点中的一种或更多种。在某些实施方案中，核酸是选自质粒、慢病毒载体和腺相关病毒载体以及腺病毒载体的表达载体。在某些实施方案中，嵌合核酸酶被配制成向个体施用。本文还描述了包含嵌合核酸酶和药学上可接受的赋形剂、稀释剂或载体的组合物。本文还描述了包含包封在脂质纳米颗粒中的嵌合核酸酶的组合物。在某些实施方案中，脂质纳米颗粒包含阳离子和/或中性脂质。

在一个方面，本文描述了包含修饰的I-TevI核酸酶结构域和/或I-TevI接头结构域、修饰的Cas9多肽和引导RNA的嵌合核酸酶，其中修饰的I-TevI核酸酶结构域和/或I-TevI接头结构域包含对应于SEQ ID NO:53中所列的未修饰的I-TevI核酸酶的K26R、T95S和Q158R的氨基酸修饰，并且修饰的Cas9多肽包含对应于SEQ ID NO:54中所列的未修饰的Cas9的或D10E的氨基酸修饰。在某些实施方案中，修饰的I-TevI核酸酶结构域和/或I-TevI接头结构域包括与SEQ ID NO:53至少约80％、90％、95％、97％、98％、99％相同或与SEQ IDNO:53相同的氨基酸序列。在某些实施方案中，所述嵌合核酸酶包含核定位信号。在某些实施方案中，Cas9多肽来自金黄色葡萄球菌。在某些实施方案中，核定位信号包括SV40核定位信号，其包含氨基酸序列SEQ ID NO:55(PKKKRKV)。在某些实施方案中，核定位信号包括核质蛋白核定位信号，其包含氨基酸序列SEQ ID NO:56(KRPAATKKAGQAKKKK)。在某些实施方案中，修饰的I-TevI接头结构域包括与SEQ ID NO:57至少约85％、90％、95％、97％、98％、99％相同的氨基酸序列。在某些实施方案中，修饰的I-TevI核酸酶结构域包括与SEQ IDNO:58至少约85％、90％、95％、97％、98％、99％相同的氨基酸序列。在某些实施方案中，嵌合核酸酶对双链DNA中的I-TevI识别位点具有裂解活性。在某些实施方案中，嵌合核酸酶还包含引导RNA。在某些实施方案中，引导RNA靶向哺乳动物细胞中的基因组靶。在某些实施方案中，引导RNA靶向哺乳动物细胞中的致癌突变。在某些实施方案中，哺乳动物细胞是人类细胞。在某些实施方案中，引导RNA靶向细菌或病毒序列。在某些实施方案中，引导RNA包含以下的一种或更多种：非天然核苷间键、核酸模拟物、修饰的糖部分和修饰的核碱基。在某些实施方案中，非天然核苷间键包含以下的一种或更多种：硫代磷酸酯、磷酰胺酯、非磷酸二酯、杂原子、手性硫代磷酸酯、二硫代磷酸酯、磷酸三酯、氨基烷基磷酸三酯、3’-亚烷基膦酸酯、5’-亚烷基膦酸酯、手性膦酸酯、次膦酸酯、3’-氨基磷酰胺酯、氨基烷基磷酰胺酯、磷酸二胺酯、硫羰基磷酰胺酯、硫羰基烷基膦酸酯、硫羰基烷基磷酸三酯、硒磷酸酯和硼烷磷酸酯。在某些实施方案中，核酸模拟物包含肽核酸(PNA)、吗啉代核酸、环己烯基核酸(CeNA)或锁核酸(LNA)中的一种或更多种。在某些实施方案中，修饰的糖部分包含2’-O-(2-甲氧基乙基)、2’-二甲基氨基氧基乙氧基、2’-二甲基氨基乙氧基乙氧基、2’-O-甲基和2’-氟中的一种或更多种。在某些实施方案中，修饰的核碱基包含以下的一种或更多种：5-甲基胞嘧啶；5-羟甲基胞嘧啶；黄嘌呤；次黄嘌呤；2-氨基腺嘌呤；腺嘌呤的6-甲基衍生物；鸟嘌呤的6-甲基衍生物；腺嘌呤的2-丙基衍生物；鸟嘌呤的2-丙基衍生物；2-硫尿嘧啶；2-硫代胸腺嘧啶；2-硫代胞嘧啶；5-卤尿嘧啶；5-卤胞嘧啶；5-丙炔基尿嘧啶；5-丙炔基胞嘧啶；6-偶氮尿嘧啶；6-偶氮胞嘧啶；6-偶氮胸腺嘧啶；假尿嘧啶；4-硫尿嘧啶；8-卤素；8-氨基；8-硫醇；8-硫代烷基；8-羟基；5-卤素；5-溴；5-三氟甲基；5-取代的尿嘧啶；5-取代的胞嘧啶；7-甲基鸟嘌呤；7-甲基腺嘌呤；2-F-腺嘌呤；2-氨基腺嘌呤；8-氮杂鸟嘌呤；8-氮杂腺嘌呤；7-去氮鸟嘌呤；7-去氮腺嘌呤；3-去氮鸟嘌呤；3-去氮腺嘌呤；三环嘧啶；苯噁嗪胞苷；吩噻嗪胞苷；取代的苯噁嗪胞苷；咔唑胞苷；吡啶吲哚胞苷；7-去氮腺嘌呤；7-去氮鸟苷；2-氨基吡啶；2-吡啶酮；5-取代的嘧啶；6-氮杂嘧啶；N-2、N-6或O-6取代的嘌呤；2-氨基丙基腺嘌呤；5-丙炔基尿嘧啶；和5-丙炔基胞嘧啶。本文还描述了编码嵌合核酸酶的核酸或多于一个核酸。在某些实施方案中，嵌合核酸酶和/或引导RNA可操作地偶联到真核启动子、增强子或多腺苷酸化位点中的一种或更多种。在某些实施方案中，核酸是选自质粒、慢病毒载体和腺相关病毒载体以及腺病毒载体的表达载体。在某些实施方案中，嵌合核酸酶被配制成向个体施用。本文还描述了包含嵌合核酸酶和药学上可接受的赋形剂、稀释剂或载体的组合物。本文还描述了包含包封在脂质纳米颗粒中的嵌合核酸酶的组合物。在某些实施方案中，脂质纳米颗粒包含阳离子和/或中性脂质。

附图简述

本发明的以下详述参考了附图，附图构成本发明的一部分，并且在附图中通过说明的方式示出了可以实施本发明的具体实施方案。这些实施方案被足够详细地描述以使得本领域技术人员能够实践本发明。在不脱离本发明的范围的情况下，可以采用其他实施方案，并且可以进行结构和逻辑改变。现在仅以示例的方式参考附图，在附图中：

图1A到图1F描绘了TevSaCas9与多个引导RNA复合并电穿孔到细胞中以破坏编码内源性T细胞受体的基因并***编码外源性嵌合抗原受体(CAR)的序列的机制的图解。

图2A和图2B说明，靶向B2M基因的TevSaCas9裂解B2M基因。

图3A和图3B说明，靶向AAVS1基因的TevSaCas9裂解AAVS1基因。

图4A和图4B显示代表在TevSaCas9裂解后的B2M基因中的靶位点(黑色)和供体修复模板(灰色)***切割位点并且发生修复的图解。

图5A和图5B是描绘基因组内的AAVS1安全港位点被TevSaCas9裂解后(黑色)的图解，并显示***切割位点的GFP报告基因的表达。

图6说明，使用SEQ ID NO:20中的引导，靶向TRBC1基因的TevSaCas9裂解哺乳动物细胞基因组中的TRBC1靶位点。

图7A说明含有单个LoxP位点的双链DNA寡核苷酸向AAVS1靶位点的***。

图8A和图8B说明，电穿孔的核糖核蛋白TevSaCas9编辑哺乳动物细胞中的B2M靶位点。

图9A和图9B说明，I-TevI与Cas12a的融合被引导RNA激活以裂解双链DNA底物。

图10说明TevSaCas9裂解HEK293细胞的B2M基因，具有不同的核定位信号(NLS)。

详述

在以下描述中，阐述了某些细节，诸如具体数量、尺寸，等等，从而提供对本文公开的本发明实施方案的透彻理解。然而，对于本领域技术人员来说明显的是，本公开内容可以在没有这样具体细节的情况下实施。在许多情况下，关于这些考虑等的细节已经被省略，因为这样的细节对于获得对本公开内容的完整理解不是必要的，并且在相关领域的普通技术人员的技能范围内。

离体基因编辑方法

本公开内容描述了嵌合核酸酶和离体基因编辑方法，其表现出优于现有基因编辑技术和方法的以下优点。例如，当并且如果核酸酶在两个位点裂解时，它会裂解出精确长度的DNA(～30-38个碱基，取决于I-TevI和SaCas9靶向的位点)。本文所述的方法可以从基因组产生30个、31个、32个、33个、34个、35个、36个、37个、38个、39个或40个核苷酸的精确缺失。因此，可以在基因中选择靶位点，以产生精确长度的缺失，从而在细胞中将基因不合框地敲除(knock the gene out-of-frame in a cell)。在所述核酸酶的一种实施方案中，核酸酶靶向并裂解B2M基因(SEQ ID NO:1)(也称为MHC I类分子的β链、β-2-微珠蛋白、IMD43)，从而以多个不合框缺失破坏B2M的阅读框。在所述核酸酶的另一种实施方案中，核酸酶靶向并裂解B2M基因(SEQ ID NO:2)，从而以单个不合框缺失破坏阅读框。在所述核酸酶的又一种实施方案中，核酸酶靶向并裂解TRAC基因(SEQ ID NO:3)(也称为TRA、IMD7、TCRA、TRCA、T细胞受体α基因座、TCRD和T细胞受体基因座)，从而以单个不合框缺失破坏阅读框。所述核酸酶的另一种实施方案，核酸酶靶向并裂解TRCB基因(SEQ ID NO:4)(也称为T细胞受体β基因座、TCRBC1、BV05S1J2.2)，从而以单个不合框缺失破坏阅读框。所述核酸酶的另一种形式靶向并裂解HLA-A基因(SEQ ID NO:5)(也称为主要组织相容性复合体I类A、HLA I类组织相容性抗原、Aα链、HLAA、HLA I类组织相容性抗原、A-1α链、MHC I类抗原HLA-A重链、白细胞抗原I-A类和人类白细胞抗原A)，从而以单个不合框缺失破坏阅读框。上述两种或更多种核酸酶的组合可以同时破坏细胞中相应基因的阅读框。在存在外源供体DNA的情况下，所述核酸酶被设计成比现有技术或实践在更高百分比的细胞中替换靶DNA序列。所述核酸酶的另一种实施方案靶向并裂解AAVS1基因座(SEQ ID NO:6)(也称为腺相关病毒整合位点1和AAV)。在本文描述的实施方案的另一个形式[0025]，即靶向并裂解AAVS1基因座(SEQ ID NO:7)的核酸酶，是针对供体DNA的双链片段，其末端补充核酸酶裂解位点以靶向DNA***。

本公开内容描述了使用所述核酸酶对细胞群体进行遗传工程以在基因组位置***、修饰、缺失或替换核苷酸序列的方法。所述步骤包括形成嵌合核酸酶引导RNA复合物并向细胞施用所述嵌合核酸酶引导RNA复合物。这种施用可以使用电穿孔或脂质介导的转染方法(例如阳离子脂质)中的一种或更多种进行。可选地，可以使用选自电穿孔、病毒转导和/或脂质介导的转染的方法将编码引导RNA和/或嵌合核酸酶的核酸或多于一个核酸转移到细胞中。在要添加基因组序列以改变基因组的实施方案中，也可以施用供体DNA以实现***或改变。供体DNA可以适当地作为线性化的DNA、质粒DNA或病毒载体提供。

在一个方面，本文描述的离体基因编辑方法用于产生CAR T或CAR NK细胞。如图1A中所示，纯化的TevSaCas9蛋白1与多个引导RNA 2混合复合形成核糖核蛋白复合物3。编码含有被TevSaCas9靶向的一个或更多个位点的互补末端的外源供体CAR的供体DNA 4也与核糖核蛋白复合物3混合。如图1B中所示，编码由基因组DNA 7表达的内源性T细胞受体6的T细胞群体5暴露于核糖核蛋白复合物3和供体DNA 4的混合物。向混合物施加电脉冲8以使细胞膜9透化图1C。如图1D中所示，核糖核蛋白复合物3和供体DNA 4通过透化的细胞膜进入T细胞。核糖核蛋白复合物3通过一个或更多个核定位序列(“NLS”)靶向细胞核10。如图1E中所示，核糖核蛋白复合物3将与其在基因组DNA 7上的靶位点结合。如图1F中所示，核糖核蛋白复合物3将裂解基因组DNA 7以创建确定长度的缺失12，或者如果存在相容的供体DNA 13，则将供体DNA 13***到裂解的位点。缺失的基因组DNA 7的区域破坏编码内源性T细胞受体6的基因，并且供体DNA 13编码外源的CAR 14使T细胞靶向新的抗原。

所要求保护的多肽被设计成修饰免疫细胞(诸如T细胞)、造血干细胞、间充质干细胞或诱导多能干细胞(iPSC)的DNA，使所述细胞工程化以获得免疫耐受性和/或表达外源性基因，诸如嵌合抗原受体(CAR)，尽管不仅限于这些细胞类型。可以通过本文描述的方法和核酸酶离体修饰的细胞类型包括免疫细胞，诸如T细胞或NK细胞；或多能细胞，诸如间充质干细胞、造血干细胞或使用本领域已知技术另外诱导为多能性的细胞。

此外，本公开内容涉及：对人类细胞基因组中DNA序列的全部或部分进行靶向基因破坏以不合框地敲除基因的方法，包括以下步骤：(a)将细胞离体暴露于核酸酶；(b)向细胞群体施加1000-2500V之间的电流，以使膜透化，从而允许所要求保护的核酸酶进入细胞。也可以施加1000-1500V、1501-1700V、1701-1900V、1901-2100V或2101-2500V之间的其他电流范围。核酸酶也可以使用脂转染或基于聚合物的转染或使用病毒载体诸如腺相关病毒或慢病毒递送到细胞。核酸酶还可以作为核糖核蛋白复合物、编码核酸酶的DNA或编码核酸酶的信使RNA递送。在真核细胞中，所述核酸酶(包括TevSaCas9)可以通过一个或更多个核定位序列(“NLS”)靶向细胞核。对于产生免疫耐受细胞的应用，将核酸酶的混合物应用于靶向细胞群体中B2M、TRAC1、TRBC1、HLA-A或者AAVS1(SEQ ID NO:1-6)中的一种或更多种。将核酸酶靶向精确基因组位置的特定引导RNA可以与核酸酶包含在一起、由核酸或信使RNA编码。对于靶向DNA替换、修复或向基因组位置的***的应用，供体DNA也可以作为分离和纯化的核酸、线性双链DNA、质粒或病毒载体被包含。供体DNA可以与核酸酶和引导RNA一起提供，或者以单独的制剂单独提供，或者通过与递送核酸酶和引导RNA不同的方法递送。

本文还描述了一种将确定长度的DNA序列靶向***人类细胞的方法，包括以下步骤：(A)将细胞离体暴露于新核酸酶；(b)向细胞群体施加1000-2500V之间的电流，以使膜透化，从而允许所要求保护的核酸酶进入细胞。

在真核细胞中，所述核酸酶(包括TevSaCas9)可以通过一个或更多个核定位序列(“NLS”)靶向细胞核。对于产生免疫耐受细胞的应用，将核酸酶的混合物应用于靶向细胞群体中B2M、TRAC1、TRBC1、HLA-A或者AAVS1(SEQ ID NO:1-6)中的一种或更多种。

在存在外源供体DNA的情况下，细胞可以通过非同源末端连接使用定向连接将外源DNA序列(全部或部分)***靶基因组DNA的两个裂解位点之间。

对于工程化CAR-T细胞的应用，AAVS1安全港位点被包含编码嵌合抗原受体(CAR)的DNA序列(SEQ ID NO:7)的外源供体DNA靶向(SEQ ID NO:6)。

本申请涉及一种新的修饰的TevSaCas9核酸酶，其包含嵌合核酸酶，该嵌合核酸酶含有I-TevI结构域、接头结构域、SaCas9结构域和引导RNA的不同组合。特别地，嵌合核酸酶可以包含：(a)I-TevI结构域，其包含与SEQ ID NO:8中的氨基酸序列具有至少约80％、85％、90％、95％、97％、98％、99％同一性或与SEQ ID NO:8中的氨基酸序列相同的氨基酸序列；(b)接头结构域，其包含与SEQ ID NO:9-14中的任一种中的氨基酸序列具有至少约80％、85％、90％、95％、97％、98％、99％同一性或与SEQ ID NO:9-14中的任一种中的氨基酸序列相同的氨基酸序列；和/或saCas9，其包含与SEQ ID NO:15-16中的任一种中的氨基酸序列具有至少约80％、85％、90％、95％、97％、98％、99％同一性或与SEQ ID NO:15-16中的任一种中的氨基酸序列相同的氨基酸序列。

靶向B2M基因的嵌合核酸酶包含(a)如上所述的嵌合核酸酶；和(b)引导RNA，其包含与SEQ ID NO:17或SEQ ID NO:18的序列具有至少约90％、95％、97％、98％、99％同一性或相同的RNA序列。

靶向TRAC基因的嵌合核酸酶包含：(a)如上所述的嵌合核酸酶；和(b)引导RNA，其包含与SEQ ID NO:19的序列具有至少约90％、95％、97％、98％、99％同一性或相同的RNA序列。

靶向TRBC基因的嵌合核酸酶包含：(a)如上所述的嵌合核酸酶；和(b)引导RNA，其包含与SEQ ID NO:20的序列具有至少约90％、95％、97％、98％、99％同一性或相同的RNA序列。

靶向HLA-A基因的嵌合核酸酶包含：(a)如上所述的嵌合核酸酶；和(b)引导RNA，其包含与SEQ ID NO:21的序列具有至少约90％、95％、97％、98％、99％同一性或相同的RNA序列。

靶向AAVS1基因的嵌合核酸酶包含：(a)如上所述的嵌合核酸酶；和(b)引导RNA，其包含与SEQ ID NO:22的序列具有至少约90％、95％、97％、98％、99％同一性或相同的RNA序列。

所要求保护的发明的一种实施方案是用于同时编辑多个基因以产生免疫耐受细胞的组合物。特别地，组合物涉及在上一段中讨论的嵌合核酸酶的混合物联合与嵌合核酸酶成等摩尔比的根据序列SEQ ID NO:17和19-21的引导RNA的混合物。在另一种实施方案中，组合物涉及在上一段中讨论的嵌合核酸酶的混合物联合与嵌合核酸酶成等摩尔比的根据序列SEQ ID NO:18-21的引导RNA的混合物。

要求保护的发明的一种实施方案是包含I-TevI结构域、接头结构域和RNA引导的核酸酶结构域的不同组合的其他嵌合核酸酶的组合物。特别地，组合物涉及SEQ ID NO:44–49的嵌合核酸酶。

在一个方面，本文描述的核酸酶是由两种不同的核酸酶形成的嵌合核酸酶。嵌合核酸酶可用于本文所述的离体基因编辑应用和用于体内应用。

在一个方面，本文描述了包含修饰的I-TevI核酸酶结构域和/或I-TevI接头结构域、CasX多肽和引导RNA的嵌合核酸酶，其中所述嵌合核酸酶任选地包含核定位信号。在某些实施方案中，CasX多肽来自浮霉菌门细菌。在某些实施方案中，CasX多肽来自δ变形菌纲。在某些实施方案中，修饰的I-TevI核酸酶结构域和/或I-TevI接头结构域包含对应于SEQID NO:53中所列的未修饰的I-TevI核酸酶的V117的氨基酸处的氨基酸修饰。在某些实施方案中，修饰的I-TevI核酸酶结构域和/或I-TevI接头结构域包含对应于SEQ ID NO:53中所列的未修饰的I-TevI核酸酶的V117F的氨基酸修饰。在某些实施方案中，修饰的I-TevI核酸酶结构域和/或I-TevI接头结构域包含对应于SEQ ID NO:53中所列的未修饰的I-TevI核酸酶的V117、K135和N140的氨基酸处的氨基酸修饰。在某些实施方案中，修饰的I-TevI核酸酶结构域和/或I-TevI接头结构域接头包含对应于SEQ ID NO:53中所列的未修饰的I-TevI核酸酶的V117F、K135R和N140S的氨基酸修饰。在某些实施方案中，修饰的I-TevI核酸酶结构域和/或接头包含对应于SEQ ID NO:53中所列的未修饰的I-TevI核酸酶的K135和N140的氨基酸处的氨基酸修饰。在某些实施方案中，修饰的I-TevI核酸酶结构域和/或I-TevI接头结构域包含对应于SEQ ID NO:53中所列的未修饰的I-TevI核酸酶的K135R和N140S的氨基酸修饰。在某些实施方案中，修饰的I-TevI核酸酶结构域和/或I-TevI接头结构域包含对应于SEQ ID NO:53中所列的未修饰的I-TevI核酸酶的K26、T95和Q158的氨基酸处的氨基酸修饰。在某些实施方案中，修饰的I-TevI核酸酶结构域和/或接头包含对应于SEQ ID NO:53中所列的未修饰的I-TevI核酸酶的K26R、T95S和Q158R的氨基酸修饰。在某些实施方案中，修饰的I-TevI核酸酶结构域和/或I-TevI接头结构域包括与SEQ ID NO:53至少约85％、90％、95％、97％、98％、99％相同或与SEQ ID NO:53相同的氨基酸序列。在某些实施方案中，CasX多肽包括与SEQ ID NO:52至少约85％、90％、95％、97％、98％、99％相同或与SEQ ID NO:52相同的氨基酸序列。在某些实施方案中，Cas12多肽包含选自R11K、R12K、V14S、K15A、S17N、N18A、A22V、G23S、T25S、P38D、K41K、E42K、N46K、L47R、N53V、I54M、P57V、T61N、S62A、R63A、A64N、E75K、H82Q、Q89K、P104S、N106K、I113K、N199K、S124T、S125A、C133G、Y137F、N145S、D146E、H151Y、S161A、R165K、N177S、L180A、R202K、N205T、G215A、C219Y、V236I、T241S、L248I、I254V、S269G、I290V、E291D、V297I、Q299R、I314L、E318D、Q323L、L333V、E359D、D360M、K362R、Q366S、N367G、L368V、A369T、G370A、Y371E、H404Y、H409Y、G410A、E411G、Y417F、V428I、E429A、S432T、K433S、L437R、S443A、A451V、I464L、A470M、I502V、L503V、I531L、G537K、L540I、N553S、I559L、S563G、V571L、N579Q、H589T、S607L、L608I、L620I、R623K、R624K、L644V、S646P、M652V、I657V、R679E、L684S、N686G、H689D、S696G、T702A、T737S、L742F、Y744H、Q748H、M751V、I753V、A771T、R777K、P792T、S818T、R823G、V824M、E826V、K827R、A832S、T833D、M836A、I839L、G841N、V846A、N860T、V862E、D864E、V867A、V877G、S883K、S889R、G890D、S894F、K908Q、N913D、F916H、T918V、R936N、Q938N、Y940F、K942S、S963A、R966K、K967R或K968R中的任何一种或更多种的取代。在某些实施方案中，所述嵌合核酸酶包含核定位信号。在某些实施方案中，核定位信号包括SV40核定位信号，其包含氨基酸序列SEQ ID NO:55(PKKKRKV)。在某些实施方案中，核定位信号包括核质蛋白核定位信号，其包含氨基酸序列SEQ ID NO:56(KRPAATKKAGQAKKKK)。在某些实施方案中，修饰的I-TevI接头结构域包括与SEQ ID NO:57至少约85％、90％、95％、97％、98％、99％相同的氨基酸序列。在某些实施方案中，修饰的I-TevI核酸酶结构域包括与SEQ ID NO:58至少约85％、90％、95％、97％、98％、99％相同的氨基酸序列。

在一个方面，本文描述了包含修饰的I-TevI核酸酶结构域和/或I-TevI接头结构域、Cas12多肽和引导RNA的嵌合核酸酶，其中所述嵌合核酸酶包含核定位信号。在某些实施方案中，Cas12多肽来自氨基酸球菌属物种BV3L6。在某些实施方案中，修饰的I-TevI核酸酶结构域和/或I-TevI接头结构域包含对应于SEQ ID NO:53中所列的未修饰的I-TevI核酸酶的V117的氨基酸处的氨基酸修饰。在某些实施方案中，修饰的I-TevI核酸酶结构域和/或I-TevI接头结构域包含对应于SEQ ID NO:53中所列的未修饰的I-TevI核酸酶的V117F的氨基酸修饰。在某些实施方案中，修饰的I-TevI核酸酶结构域和/或I-TevI接头结构域包含对应于SEQ ID NO:53中所列的未修饰的I-TevI核酸酶的V117、K135和N140的氨基酸处的氨基酸修饰。在某些实施方案中，修饰的I-TevI核酸酶结构域和/或I-TevI接头结构域接头包含对应于SEQ ID NO:53中所列的未修饰的I-TevI核酸酶的V117F、K135R和N140S的氨基酸修饰。在某些实施方案中，修饰的I-TevI核酸酶结构域和/或接头包含对应于SEQ ID NO:53中所列的未修饰的I-TevI核酸酶的K135和N140的氨基酸处的氨基酸修饰。在某些实施方案中，修饰的I-TevI核酸酶结构域和/或I-TevI接头结构域包含对应于SEQ ID NO:53中所列的未修饰的I-TevI核酸酶的K135R和N140S的氨基酸修饰。在某些实施方案中，修饰的I-TevI核酸酶结构域和/或I-TevI接头结构域包含对应于SEQ ID NO:53中所列的未修饰的I-TevI核酸酶的K26、T95和Q158的氨基酸处的氨基酸修饰。在某些实施方案中，修饰的I-TevI核酸酶结构域和/或接头包含对应于SEQ ID NO:53中所列的未修饰的I-TevI核酸酶的K26R、T95S和Q158R的氨基酸修饰。在某些实施方案中，修饰的I-TevI核酸酶结构域和/或I-TevI接头结构域包括与SEQ ID NO:53至少约85％、90％、95％、97％、98％、99％相同或与SEQ ID NO:53相同的氨基酸序列。在某些实施方案中，Cas12多肽包括与SEQ ID NO:51至少约85％、90％、95％、97％、98％、99％相同或与SEQ ID NO:51相同的氨基酸序列。在某些实施方案中，Cas12多肽包含选自T1S、Q2N、E4S、G5E、N8H、L9K、K28E、H29N、I30L、Q31T、E32A、Q33Y、F35M、I36V、E37N、E38D、A41L、N43S、D44E、H45N、E48K、I52V、R55K、T59Y、Y60F、A61I、D62E、Q63E、C64T、Q66K、L67H、Q69A、L70I、N74P、S76Y、A77K、D80T、S81A、Y82F、E85D、E88L、T90N、R91N、N92T、A93N、I95R、E97I、A99D、T100N、Y101C、N103K、A104S、H106A、D107G、I110E、R112K、T113V、D114P、R159K、S169V、S185A、A187S、I192L、D195E、K201I、T212K、R218N、N223T、I228T、S233G、I236L、E237D、V239I、F242V、Q249C、Y257F、V279T、I284V、F305Y、N313S、S324N、I329L、S331A、T337E、L338K、L345I、E349Q、S357L、I358A、N386D、I393V、L396A、I400L、S403N、V408I、Q409E、G427D、K428D、Q436A、L442I、S468V、Q469L、S472A、L473V、L479T、E487D、S488D、A497V、L510I、A516V、K522Q、Q535S、M536N、S541D、V545E、K549Q、N550Q、G552C、V557E、N559E、S586N、Y596Q、A601S、I604L、A613D、S628N、E637T、A657D、K660R、G663N、Q665K、C673H、L683V、L697V、A711G、L717F、Q723E、A733L、E735D、Y740F、K751E、K756A、G766A、I778V、R793P、L844F、I858V、S865T、I874L、H898N、I903V、I916A、L931F、K941N、N945Q、V951I、S958T、V959A、D965E、I938V、H984Q、A1009S、C1024Y、G1037S、T1049E、G1055R、T1056N、Y1068F、L1075A、V1083R、K1085G、L1097I、H1104K、D1106N、D1111N、L1122K、A1134D、V1138I、D1147A、V1160E、P1161F、R1171Q、R1173E、Y1176L、N1205T、D1207N、S1220L、V1221T、A1230E、N1237S、L1243I、M1259K、Q1274L、G1291A、Q1295N、A1299N或L1304K中的任何一种或更多种的取代。在某些实施方案中，所述嵌合核酸酶包含核定位信号。在某些实施方案中，核定位信号包括SV40核定位信号，其包含氨基酸序列SEQ ID NO:55(PKKKRKV)。在某些实施方案中，核定位信号包括核质蛋白核定位信号，其包含氨基酸序列SEQ ID NO:56(KRPAATKKAGQAKKKK)。在某些实施方案中，修饰的I-TevI接头结构域包括与SEQ ID NO:57至少约85％、90％、95％、97％、98％、99％相同的氨基酸序列。在某些实施方案中，修饰的I-TevI核酸酶结构域包括与SEQ ID NO:58至少约85％、90％、95％、97％、98％、99％相同的氨基酸序列。

在一个方面，本文描述了包含修饰的I-TevI核酸酶结构域和/或I-TevI接头结构域、修饰的Cas9多肽和引导RNA的嵌合核酸酶，其中修饰的I-TevI核酸酶结构域和/或I-TevI接头结构域包含对应于SEQ ID NO:53中所列的未修饰的I-TevI核酸酶的K26R、T95S和Q158R的氨基酸修饰，并且修饰的Cas9多肽包含对应于SEQ ID NO:54中所列的未修饰的Cas9的D10E的氨基酸修饰。在某些实施方案中，修饰的I-TevI核酸酶结构域和/或I-TevI接头结构域包括与SEQ ID NO:53至少约80％、90％、95％、97％、98％、99％相同或与SEQ IDNO:53相同的氨基酸序列。在某些实施方案中，所述嵌合核酸酶包含核定位信号。在某些实施方案中，Cas9多肽来自金黄色葡萄球菌。在某些实施方案中，核定位信号包括SV40核定位信号，其包含氨基酸序列SEQ ID NO:55(PKKKRKV)。在某些实施方案中，核定位信号包括核质蛋白核定位信号，其包含氨基酸序列SEQ ID NO:56(KRPAATKKAGQAKKKK)。在某些实施方案中，修饰的I-TevI接头结构域包括与SEQ ID NO:57至少约85％、90％、95％、97％、98％、99％相同的氨基酸序列。在某些实施方案中，修饰的I-TevI核酸酶结构域包括与SEQ IDNO:58至少约85％、90％、95％、97％、98％、99％相同的氨基酸序列。

本文所述的嵌合核酸酶可以包含本文所述的Cas12、Cas9、CasX或I-TevI核酸酶的功能片段。这样的功能片段可以包含N-末端缺失、C-末端缺失或保留核酸酶N-和C-末端的中间缺失中的一种或更多种。I-TevI核酸酶的这样的功能片段还可以包含I-TevI核酸酶结构域的氨基酸1-93、I-TevI接头片段的氨基酸94-150、锌指结构域的氨基酸151-170、或人工接头结构域的氨基酸171-180中的一种或更多种。I-TevI核酸酶结构域的氨基酸R28是DNA裂解必需的。锌指结构域的氨基酸C152、C154、C165和C168是I-TevI核酸酶结构域有效裂解DNA必需的。SaCas9结构域的这样的功能片段也可以包含一个或更多个氨基酸。本文描述了某些功能片段(参考SEQ ID NO:54)。核酸酶叶(nuclease lobe)的氨基酸1-39和434-1052，识别叶(recognition lobe)的氨基酸41-424。识别结构域的功能片段包括氨基酸41-72，其形成桥螺旋环以连接到N-末端核酸酶叶。氨基酸425-433包含接头环结构域，以连接识别环和C-末端核酸酶叶。核酸酶叶还包含RuvC-I结构域的氨基酸1-39、RuvC-II结构域的氨基酸434-479、RuvC-III结构域的氨基酸649-773、HNH结构域的氨基酸519-627、wedge(WED)结构域的氨基酸787-908、PAM相互作用(PI)结构域的氨基酸909-1052中的一个或更多个的功能片段。PAM相互作用结构域还包含拓扑异构酶同源性(TOPO)结构域的氨基酸909-967和C-末端结构域的氨基酸968-1052的功能片段。HNH结构域通过L1接头结构域的氨基酸480-518连接到RuvC-II结构域，并通过L2接头结构域的氨基酸628-648连接到RuvC-III结构域。RuvC-III和WED结构域通过磷酸锁环结构域的氨基酸774-786连接。saCas9结构域的氨基酸D10、H557和N580是DNA裂解必需的。

核酸酶

在一些实施方案中，修饰的TevSaCas9核酸酶的组合物包含本文所述的I-TevI、SaCas9结构域和引导RNA的不同组合。

在一个方面，本文描述了包含修饰的I-TevI核酸酶结构域和/或I-TevI接头结构域、CasX多肽和引导RNA的嵌合核酸酶，其中所述嵌合核酸酶任选地包含核定位信号。在某些实施方案中，修饰的I-TevI核酸酶结构域和/或I-TevI接头结构域包含对应于SEQ IDNO:53中所列的未修饰的I-TevI核酸酶的K26、T95、V117、K135、N140和Q158的一个或更多个氨基酸残基处的修饰。在某些实施方案中，修饰的I-TevI核酸酶结构域和/或I-TevI接头结构域包含对应于SEQ ID NO:53中所列的未修饰的I-TevI核酸酶的V117的氨基酸处的氨基酸修饰。在某些实施方案中，修饰的I-TevI核酸酶结构域和/或I-TevI接头结构域包含对应于SEQ ID NO:53中所列的未修饰的I-TevI核酸酶的V117F的氨基酸修饰。在某些实施方案中，修饰的I-TevI核酸酶结构域和/或I-TevI接头结构域包含对应于SEQ ID NO:53中所列的未修饰的I-TevI核酸酶的V117、K135和N140的氨基酸处的氨基酸修饰。在某些实施方案中，修饰的I-TevI核酸酶结构域和/或I-TevI接头结构域接头包含对应于SEQ ID NO:53中所列的未修饰的I-TevI核酸酶的V117F、K135R和N140S的氨基酸修饰。在某些实施方案中，修饰的I-TevI核酸酶结构域和/或接头包含对应于SEQ ID NO:53中所列的未修饰的I-TevI核酸酶的K135和N140的氨基酸处的氨基酸修饰。在某些实施方案中，修饰的I-TevI核酸酶结构域和/或I-TevI接头结构域包含对应于SEQ ID NO:53中所列的未修饰的I-TevI核酸酶的K135R和N140S的氨基酸修饰。在某些实施方案中，修饰的I-TevI核酸酶结构域和/或I-TevI接头结构域包含对应于SEQ ID NO:53中所列的未修饰的I-TevI核酸酶的K26、T95和Q158的氨基酸处的氨基酸修饰。在某些实施方案中，修饰的I-TevI核酸酶结构域和/或接头包含对应于SEQ ID NO:53中所列的未修饰的I-TevI核酸酶的K26R、T95S和Q158R的氨基酸修饰。在某些实施方案中，修饰的I-TevI核酸酶结构域和/或I-TevI接头结构域包括与SEQID NO:53至少约85％、90％、95％、97％、98％、99％相同或与SEQ ID NO:53相同的氨基酸序列。在某些实施方案中，CasX多肽包括与SEQ ID NO:52至少约85％、90％、95％、97％、98％、99％相同或与SEQ ID NO:52相同的氨基酸序列。在某些实施方案中，Cas12多肽包含选自R11K、R12K、V14S、K15A、S17N、N18A、A22V、G23S、T25S、P38D、K41K、E42K、N46K、L47R、N53V、I54M、P57V、T61N、S62A、R63A、A64N、E75K、H82Q、Q89K、P104S、N106K、I113K、N199K、S124T、S125A、C133G、Y137F、N145S、D146E、H151Y、S161A、R165K、N177S、L180A、R202K、N205T、G215A、C219Y、V236I、T241S、L248I、I254V、S269G、I290V、E291D、V297I、Q299R、I314L、E318D、Q323L、L333V、E359D、D360M、K362R、Q366S、N367G、L368V、A369T、G370A、Y371E、H404Y、H409Y、G410A、E411G、Y417F、V428I、E429A、S432T、K433S、L437R、S443A、A451V、I464L、A470M、I502V、L503V、I531L、G537K、L540I、N553S、I559L、S563G、V571L、N579Q、H589T、S607L、L608I、L620I、R623K、R624K、L644V、S646P、M652V、I657V、R679E、L684S、N686G、H689D、S696G、T702A、T737S、L742F、Y744H、Q748H、M751V、I753V、A771T、R777K、P792T、S818T、R823G、V824M、E826V、K827R、A832S、T833D、M836A、I839L、G841N、V846A、N860T、V862E、D864E、V867A、V877G、S883K、S889R、G890D、S894F、K908Q、N913D、F916H、T918V、R936N、Q938N、Y940F、K942S、S963A、R966K、K967R或K968R中的任何一种或更多种的取代。在某些实施方案中，CasX多肽来自浮霉菌门细菌。在某些实施方案中，CasX多肽来自δ变形菌纲。

在一个方面，本文描述了包含修饰的I-TevI核酸酶结构域和/或I-TevI接头结构域、Cas12多肽和引导RNA的嵌合核酸酶，其中所述嵌合核酸酶包含核定位信号。在某些实施方案中，修饰的I-TevI核酸酶结构域和/或I-TevI接头结构域包含对应于SEQ ID NO:53中所列的未修饰的I-TevI核酸酶的K26、T95、V117、K135、N140和Q158的一个或更多个氨基酸残基处的修饰。在某些实施方案中，修饰的I-TevI核酸酶结构域和/或I-TevI接头结构域包含对应于SEQ ID NO:53中所列的未修饰的I-TevI核酸酶的V117的氨基酸处的氨基酸修饰。在某些实施方案中，修饰的I-TevI核酸酶结构域和/或I-TevI接头结构域包含对应于SEQID NO:53中所列的未修饰的I-TevI核酸酶的V117F的氨基酸修饰。在某些实施方案中，修饰的I-TevI核酸酶结构域和/或I-TevI接头结构域包含对应于SEQ ID NO:53中所列的未修饰的I-TevI核酸酶的V117、K135和N140的氨基酸处的氨基酸修饰。在某些实施方案中，修饰的I-TevI核酸酶结构域和/或I-TevI接头结构域接头包含对应于SEQ ID NO:53中所列的未修饰的I-TevI核酸酶的V117F、K135R和N140S的氨基酸修饰。在某些实施方案中，修饰的I-TevI核酸酶结构域和/或接头包含对应于SEQ ID NO:53中所列的未修饰的I-TevI核酸酶的K135和N140的氨基酸处的氨基酸修饰。在某些实施方案中，修饰的I-TevI核酸酶结构域和/或I-TevI接头结构域包含对应于SEQ ID NO:53中所列的未修饰的I-TevI核酸酶的K135R和N140S的氨基酸修饰。在某些实施方案中，修饰的I-TevI核酸酶结构域和/或I-TevI接头结构域包含对应于SEQ ID NO:53中所列的未修饰的I-TevI核酸酶的K26、T95和Q158的氨基酸处的氨基酸修饰。在某些实施方案中，修饰的I-TevI核酸酶结构域和/或接头包含对应于SEQ ID NO:53中所列的未修饰的I-TevI核酸酶的K26R、T95S和Q158R的氨基酸修饰。在某些实施方案中，修饰的I-TevI核酸酶结构域和/或I-TevI接头结构域包括与SEQ ID NO:53至少约85％、90％、95％、97％、98％、99％相同或与SEQ ID NO:53相同的氨基酸序列。在某些实施方案中，Cas12多肽来自氨基酸球菌属物种BV3L6。在某些实施方案中，Cas12多肽包括与SEQ ID NO:51至少约85％、90％、95％、97％、98％、99％相同或与SEQ ID NO:51相同的氨基酸序列。在某些实施方案中，Cas12多肽包含选自T1S、Q2N、E4S、G5E、N8H、L9K、K28E、H29N、I30L、Q31T、E32A、Q33Y、F35M、I36V、E37N、E38D、A41L、N43S、D44E、H45N、E48K、I52V、R55K、T59Y、Y60F、A61I、D62E、Q63E、C64T、Q66K、L67H、Q69A、L70I、N74P、S76Y、A77K、D80T、S81A、Y82F、E85D、E88L、T90N、R91N、N92T、A93N、I95R、E97I、A99D、T100N、Y101C、N103K、A104S、H106A、D107G、I110E、R112K、T113V、D114P、R159K、S169V、S185A、A187S、I192L、D195E、K201I、T212K、R218N、N223T、I228T、S233G、I236L、E237D、V239I、F242V、Q249C、Y257F、V279T、I284V、F305Y、N313S、S324N、I329L、S331A、T337E、L338K、L345I、E349Q、S357L、I358A、N386D、I393V、L396A、I400L、S403N、V408I、Q409E、G427D、K428D、Q436A、L442I、S468V、Q469L、S472A、L473V、L479T、E487D、S488D、A497V、L510I、A516V、K522Q、Q535S、M536N、S541D、V545E、K549Q、N550Q、G552C、V557E、N559E、S586N、Y596Q、A601S、I604L、A613D、S628N、E637T、A657D、K660R、G663N、Q665K、C673H、L683V、L697V、A711G、L717F、Q723E、A733L、E735D、Y740F、K751E、K756A、G766A、I778V、R793P、L844F、I858V、S865T、I874L、H898N、I903V、I916A、L931F、K941N、N945Q、V951I、S958T、V959A、D965E、I938V、H984Q、A1009S、C1024Y、G1037S、T1049E、G1055R、T1056N、Y1068F、L1075A、V1083R、K1085G、L1097I、H1104K、D1106N、D1111N、L1122K、A1134D、V1138I、D1147A、V1160E、P1161F、R1171Q、R1173E、Y1176L、N1205T、D1207N、S1220L、V1221T、A1230E、N1237S、L1243I、M1259K、Q1274L、G1291A、Q1295N、A1299N或L1304K中的任何一种或更多种的取代。在某些实施方案中，嵌合核酸酶对双链DNA中的I-TevI识别位点具有裂解活性。

在一个方面，本文描述了包含修饰的I-TevI核酸酶结构域和/或I-TevI接头结构域、修饰的Cas9多肽和引导RNA的嵌合核酸酶，其中修饰的I-TevI核酸酶结构域和/或I-TevI接头结构域包含对应于SEQ ID NO:53中所列的未修饰的I-TevI核酸酶的K26R、T95S和Q158R的氨基酸修饰，并且修饰的Cas9多肽包含对应于SEQ ID NO:54中所列的未修饰的Cas9的或D10E的氨基酸修饰。在某些实施方案中，修饰的I-TevI核酸酶结构域和/或I-TevI接头结构域包括与SEQ ID NO:53至少约80％、90％、95％、97％、98％、99％相同或与SEQ IDNO:53相同的氨基酸序列。在某些实施方案中，所述嵌合核酸酶包含核定位信号。在某些实施方案中，Cas9多肽来自金黄色葡萄球菌。在某些实施方案中，核定位信号包括SV40核定位信号，其包含氨基酸序列SEQ ID NO:55(PKKKRKV)。在某些实施方案中，核定位信号包括核质蛋白核定位信号，其包含氨基酸序列SEQ ID NO:56(KRPAATKKAGQAKKKK)。在某些实施方案中，修饰的I-TevI接头结构域包括与SEQ ID NO:57至少约85％、90％、95％、97％、98％、99％相同的氨基酸序列。在某些实施方案中，修饰的I-TevI核酸酶结构域包括与SEQ IDNO:58至少约85％、90％、95％、97％、98％、99％相同的氨基酸序列。在某些实施方案中，嵌合核酸酶对双链DNA中的I-TevI识别位点具有裂解活性。

I-TevI结构域

SEQ ID NO:8中的序列是I-TevI的野生型形式，除了已知有助于增加蛋白质稳定性和防止N-末端降解的位置2的甘氨酸取代。关于本文提及的特定取代，编号对应于缺乏甘氨酸稳定化的蛋白质的野生型形式。因此，在I-TevI的稳定化形式中，SEQ ID NO:8位置27处的赖氨酸被称为K26，对应于位置2处没有甘氨酸的野生型位置。相应地提及其他I-TevI突变。已知有I-TevI结构域的几个I-TevI取代对I-TevI核酸酶活性几乎没有影响，包括T11V、V16I、N14G、E25D、K26R、R27A、E36S、K37N、G38N、C39V、S41H、L45F、F49Y、I60V、E81I(参考I-TevI的野生型形式)。I-TevI的核酸酶活性可以通过将含有I-TevI结构域的嵌合核酸酶与含有已知I-TevI靶的线性DNA混合并在琼脂糖凝胶上分辨裂解反应的产物来测定。如果I-TevI核酸酶是活性的，将存在预测大小的产物。在某些实施方案中，与野生型未修饰的I-TevI相比，对I-TevI的取代允许保留I-TevI核酸酶活性的至少50％、60％、70％、80％、90％或更多。

其他形式的I-TevI核酸酶结构域可能包含突变的不同组合，以改变I-TevI结构域靶向的位点或I-TevI结构域的活性，包括改变I-TevI识别的序列的突变，诸如K26和/或C39。其他形式的核酸酶可以用其他GIY-YIG核酸酶结构域取代I-TevI结构域，诸如I-BmoI、Eco29kI等。一些形式的I-TevI在表达于大肠杆菌(E.coli)中时由于加工而不包含Met1。

在某些实施方案中，修饰的I-TevI核酸酶结构域包括与SEQ ID NO:8至少85％、90％、95％、97％、98％、99％相同的氨基酸序列。在某些实施方案中，修饰的I-TevI核酸酶结构域包含选自T11V、V16I、N14G、E25D、K26R、R27A、E36S、K37N、G38N、C39V、S41H、L45F、F49Y、I60V和E81I中的任何一种或更多种的取代。在某些实施方案中，修饰的I-TevI核酸酶结构域包含K26R取代。在某些实施方案中，修饰的I-TevI核酸酶结构域包括SEQ ID NO:8。

接头结构域

在某些实施方案中，I-TevI核酸酶结构域通过接头连接到saCas9。接头可以包括I-TevI接头(I-TevI的氨基酸93-150)。接头可以可选地或还包含含有10至100个氨基酸的柔性氨基酸接头。这样的接头可以是非结构化的或包含Gly-Ser接头。

在某些实施方案中，接头包括与SEQ ID NO:9-14或59中的任一种至少85％、90％、95％、97％、98％、99％相同的氨基酸序列。在某些实施方案中，接头包含选自T95S、S101Y、A119D、K120N、K135N、K135R、P126S、D127K、N140S、T147I、Q158R、A161V或S165G中的任何一种或更多种的取代。在某些实施方案中，接头包含选自T95S、V117F、K135R、N140S或Q158R中的任何一种或更多种的取代。在某些实施方案中，接头是选自SEQ ID NO:9-14或59中的任一种的肽。

SaCas9结构域

核酸酶的其他形式可以用SEQ ID NO:25–28中的其他非天然存在的SaCas9或SpCas9结构域取代SaCas9结构域。嵌合核酸酶的其它形式可以用其它核酸酶，包括SEQ IDNO:44-48的嵌合核酸酶TevCas12a或SEQ ID NO:49的TevCasX取代SaCas9结构域。嵌合核酸酶的另外实施方案可以用将SaCas9结构域取代为其他1类或2类CRISPR-Cas蛋白、CRISPR-Cas3、CRISPR-Cascade、Cas13d。核酸酶的其他形式可以用其他异源多肽序列取代SaCas9结构域，所述其他异源多肽序列包括能够结合核酸的多肽序列、能够结合其他多肽序列的多肽序列、多肽靶向序列。其他异源序列可以包括1至10个其他多肽结构域。

在某些实施方案中，RNA引导的核酸酶金黄色葡萄球菌Cas9结构域包括SEQ IDNO:15、16、26、27或28中的任一种。在某些实施方案中，RNA引导的核酸酶金黄色葡萄球菌Cas9结构域包括与SEQ ID NO:15、16、26、27或28中的任一种至少85％、90％、95％、97％、98％、99％相同或与SEQ ID NO:15、16、26、27或28中的任一种相同的氨基酸序列。在某些实施方案中，RNA引导的核酸酶金黄色葡萄球菌Cas9结构域包含选自T267A、L325F、V327I、D333G、A336S、I341L、E345D、D348N、K352E、S360A、T368A、N369E、N371E、S372P、E373K、K386T、N393R、H408N、N410S、I414M、A415T、T438S、Y467F、N471K、D485E、M489F、E506K、R409K、T510E、N515K、Y518F、A539P、F550Y、N551H、S596A、T602I、A611S、I617V、T620K、G654E、N667D、R685K、K695Q、I706V、K722T、A723T、K724N、M731T、F732V、K735Q、S739N、P741L、E742G、E746D、Q747D、I754D、T755I、H757R、K760Q、H761S、P778I、E781K、I783V、N784D、D785E、T786L、L787V、Y788H、K792E、D794T、T798R、L799I、V801I、N803S、L804I、N805K、G806N、D813G、K814E、L818I、I819F、S822P、E824G、L841T、G847S、D848N、Y857H、V875I、I876V、N884K、A888V、L890R、D894G、D895H、P897L、V903I、G920D、F924L、N929Y、E936D、N937G、V941I、N942D、S943L、C945A、E947K、K951R、L952Q、S956N、N957E、Q958K、A959S、N974D、G975K、V983A、N984S、N985D、D986G、I991V、V993L、M995F、I996V、T999N、Y1000K、R1001E、E1002D、L1004I、E1005K、N1006M、M1007N、D1009L、K1010S、R1011T、P1012S、P1013F、I1015L、I1016R、A1020G、S1021K、Q1024K、K1027S、E1039K、H1045K、I0148M或K1050M中的任何一种或更多种的取代。在某些实施方案中，RNA引导的核酸酶金黄色葡萄球菌Cas9结构域包含D10E取代。在某些实施方案中，修饰的I-TevI核酸酶结构域包括SEQ ID NO:8，接头包括SEQ ID NO:9-14或59中的任一种，并且RNA引导的核酸酶金黄色葡萄球菌Cas9结构域包括SEQ ID NO:15、16、26、27或28中的任一种。在某些实施方案中，修饰的I-TevI核酸酶结构域包括与SEQ ID NO:8中的任一种至少85％、90％、95％、97％、98％、99％相同或与SEQ ID NO:8中的任一种相同的氨基酸序列，接头结构域包括与SEQ ID NO:9-14中的任一种至少85％、90％、95％、97％、98％、99％相同或与SEQ ID NO:9-14中的任一种相同的氨基酸序列，并且RNA引导的核酸酶金黄色葡萄球菌Cas9结构域包括与SEQ ID NO:15、16、26、27或28中的任一种至少85％、90％、95％、97％、98％、99％相同的氨基酸序列。

供体DNA和治疗性细胞群体

本文所述的方法和技术可用于细胞群体中细胞的离体遗传修饰。这样的离体修饰可用于产生治疗性细胞。这样的治疗性修饰可以包括基因组DNA序列的去除或破坏。其他治疗性修饰可以包括基因组DNA序列的替换或修复。本文所述的供体DNA可以靶向细胞基因组中的特定位点，诸如以替换或修复(即，纠正导致疾病的一种或更多种遗传突变)现有基因，或者靶向安全港位点，诸如AAVS1位点。外源供体DNA可以被配置为通过同源重组掺入。这样的用于通过同源重组掺入的外源供体DNA可以包含第一侧翼同源区、感兴趣的外源多核苷酸序列和第二侧翼同源区。可选地，外源供体DNA可以通过借助于非同源末端连接在单个双链断裂或双重双链断裂处掺入基因组位置而***基因组位置。

治疗性细胞或治疗性细胞群体可由多能细胞产生。在某些实施方案中，治疗性细胞或多能细胞群体包含鼠、犬、猫、马、猪、绵羊、牛或人类多能细胞中的任何一种或更多种或由其组成。在某些实施方案中，治疗性细胞或治疗性细胞群体包含多能细胞或由多能细胞组成。多能细胞可以从动物组织分离，或者使用已知诱导多能干细胞的方法诱导。

治疗性细胞或治疗性细胞群体可由免疫细胞产生。在某些实施方案中，治疗性细胞或治疗细胞群体包含鼠、犬、猫、马、猪、绵羊、牛或人类免疫细胞中的任何一种或更多种或由其组成。在某些实施方案中，治疗性细胞或治疗性细胞群体包含人类免疫细胞或由人类免疫细胞组成。

细胞可以是异质免疫细胞(例如外周血单个核细胞)的分离细胞群体，或者是特定免疫细胞(诸如淋巴细胞、T细胞、B细胞或NK细胞)的分离和纯化的群体。通过本领域已知的技术，诸如磁珠选择(正或负选择)，可以将这样的细胞群体分离到大于约80％、85％、90％或95％的高纯度。

治疗性细胞或治疗性细胞群体可由哺乳动物造血干细胞产生。在某些实施方案中，治疗性细胞或治疗细胞群体包含鼠、犬、猫、马、猪、绵羊、牛或人类造血干细胞中的任何一种或更多种或由其组成。在某些实施方案中，治疗性细胞或治疗性细胞群体包含人类造血干细胞或由人类造血干细胞组成。

治疗性细胞或治疗性细胞群体可由哺乳动物间充质干细胞产生。在某些实施方案中，治疗性细胞或治疗细胞群体包含鼠、犬、猫、马、猪、绵羊、牛或人类间充质干细胞中的任何一种或更多种或由其组成。在某些实施方案中，治疗性细胞或治疗性细胞群体包含间充质干细胞或由间充质干细胞组成。

在某些实施方案中，治疗性细胞是CAR T细胞。在某些实施方案中，治疗性细胞是CAR NK细胞。因此，将与本文所述的嵌合核酸酶一起递送的供体DNA可以编码嵌合抗原受体(CAR)。CAR通常包含来源于抗体的靶向部分、跨膜结构域和一个或更多个激活T细胞或NK细胞中细胞毒性活性的细胞内信号传导结构域。

在某些实施方案中，治疗性细胞是通用CAR T或具有降低的免疫原性的CAR T。这样降低的免疫原性可以通过在T细胞受体α链、T细胞受体β链或MHC基因(例如B2M、HLA-A、HLA-B或HLA-C)中引入一种或更多种破坏来实现。

当TevSaCas9嵌合核酸酶裂解双链DNA时，Cas9留下钝端，并且I-TevI留下两个核苷酸的3’突出端(two nucleotide 3’overhang)。提供的供体DNA可以包括钝端和两个核苷酸的3’突出端，其被配置为结合TevSaCas9裂解位点中产生的3’突出端。

在一个方面，供体DNA包含旨在***未知编码功能基因的基因组位点的DNA序列。这样的位点的一个实例是AAVS1。它还包括在靶基因组DNA中没有发现的DNA序列；这些序列可以编码有用的基因和/或其他DNA元件。在某些实施方案中，供体DNA包含被核酸酶裂解的相同长度的双链DNA，并且还包含与被TevSaCas9裂解的那些互补的DNA末端。在某些实施方案中，供体DNA包含被磷酸化的DNA的5’末端。在某些实施方案中，供体DNA包含含有I-TevI靶位点和SaCas9靶位点的环状双链DNA，其中从双链DNA裂解的产物包含与TevSaCas9裂解的那些互补的末端。

引导RNA

引导RNA的其他形式可能靶向B2M、TRAC、TRBC、HLA-A、AVVS1基因中相同的DNA区域，但包含不同的序列来解释群体中的遗传多态性。引导RNA的其他形式可能靶向B2M、TRAC、TRBC、HLA-A、AVVS1中的不同序列。引导RNA的其他形式可以靶向基因组中的其他序列，以将核酸酶重定向到另外的安全港位点，诸如hROSA26和CCR5。其他形式可能包含引导RNA的混合物，以靶向同一基因内的多个序列。所述发明的引导RNA可以包含单链，其包含活性的所有必需元件(例如，靶结合和核酸酶结合)。可选地，引导RNA可包含两个或更多个非共价结合的核酸，其由于两个或更多个核酸之间的碱基配对而形成单个部分。引导RNA的其他形式可能包括不同的核碱基以保持稳定性，所述核碱基包括但不限于5-甲基胞嘧啶；5-羟甲基胞嘧啶；黄嘌呤；次黄嘌呤；2-氨基腺嘌呤；腺嘌呤的6-甲基衍生物；鸟嘌呤的6-甲基衍生物；腺嘌呤的2-丙基衍生物；鸟嘌呤的2-丙基衍生物；2-硫代尿嘧啶；2-硫代胸腺嘧啶；2-硫代胞嘧啶；5-丙炔基尿嘧啶；5-丙炔基胞嘧啶；6-偶氮尿嘧啶；6-偶氮胞嘧啶；6-偶氮胸腺嘧啶；假尿嘧啶；4-硫尿嘧啶；8-卤代腺嘌呤；8-氨基腺嘌呤；8-硫代腺嘌呤；8-硫代烷基腺嘌呤；8-羟基腺嘌呤；8-卤鸟嘌呤；8-氨基鸟嘌呤；8-硫代鸟嘌呤；8-硫代烷基鸟嘌呤；8-羟基鸟嘌呤；5-卤尿嘧啶；5-溴尿嘧啶；5-三氟甲基尿嘧啶；5-卤胞嘧啶；5-溴胞嘧啶；5-三氟甲基胞嘧啶；5-取代的尿嘧啶；5-取代的胞嘧啶；7-甲基鸟嘌呤；7-甲基腺嘌呤；2-F-腺嘌呤；2-氨基腺嘌呤；8-氮杂鸟嘌呤；8-氮杂腺嘌呤；7-去氮鸟嘌呤；7-去氮腺嘌呤；3-去氮鸟嘌呤；3-去氮腺嘌呤；三环嘧啶；苯噁嗪胞苷；吩噻嗪胞苷；取代的苯噁嗪胞苷；咔唑胞苷；吡啶吲哚胞苷；7-去氮鸟苷；2-氨基吡啶；2-吡啶酮；5-取代的嘧啶；6-氮杂嘧啶；N-2、N-6或O-6取代的嘌呤；2-氨基丙基腺嘌呤；5-丙炔基尿嘧啶；和5-丙炔基胞嘧啶。其他形式的引导RNA可以包括其他核酸，诸如桥接核酸或锁核酸。

本文所述的引导RNA可以还包含一种或更多种非天然核苷间键、核酸模拟物、修饰的糖部分和修饰的核碱基。在某些实施方案中，非天然核苷间键包含以下的一种或更多种：硫代磷酸酯、磷酰胺酯、非磷酸二酯、杂原子、手性硫代磷酸酯、二硫代磷酸酯、磷酸三酯、氨基烷基磷酸三酯、3’-亚烷基膦酸酯、5’-亚烷基膦酸酯、手性膦酸酯、次膦酸酯、3’-氨基磷酰胺酯、氨基烷基磷酰胺酯、磷酸二胺酯、硫羰基磷酰胺酯、硫羰基烷基膦酸酯、硫羰基烷基磷酸三酯、硒磷酸酯和硼烷磷酸酯。在某些实施方案中，核酸模拟物包含肽核酸(PNA)、吗啉代核酸、环己烯基核酸(CeNA)或锁核酸(LNA)中的一种或更多种。在某些实施方案中，修饰的糖部分包含2’-O-(2-甲氧基乙基)、2’-二甲基氨基氧基乙氧基、2’-二甲基氨基乙氧基乙氧基、2’-O-甲基和2’-氟中的一种或更多种。在某些实施方案中，修饰的核碱基包含以下的一种或更多种：5-甲基胞嘧啶；5-羟甲基胞嘧啶；黄嘌呤；次黄嘌呤；2-氨基腺嘌呤；腺嘌呤的6-甲基衍生物；鸟嘌呤的6-甲基衍生物；腺嘌呤的2-丙基衍生物；鸟嘌呤的2-丙基衍生物；2-硫尿嘧啶；2-硫代胸腺嘧啶；2-硫代胞嘧啶；5-卤尿嘧啶；5-卤胞嘧啶；5-丙炔基尿嘧啶；5-丙炔基胞嘧啶；6-偶氮尿嘧啶；6-偶氮胞嘧啶；6-偶氮胸腺嘧啶；假尿嘧啶；4-硫尿嘧啶；8-卤素；8-氨基；8-硫醇；8-硫代烷基；8-羟基；5-卤素；5-溴；5-三氟甲基；5-取代的尿嘧啶；5-取代的胞嘧啶；7-甲基鸟嘌呤；7-甲基腺嘌呤；2-F-腺嘌呤；2-氨基腺嘌呤；8-氮杂鸟嘌呤；8-氮杂腺嘌呤；7-去氮鸟嘌呤；7-去氮腺嘌呤；3-去氮鸟嘌呤；3-去氮腺嘌呤；三环嘧啶；苯噁嗪胞苷；吩噻嗪胞苷；取代的苯噁嗪胞苷；咔唑胞苷；吡啶吲哚胞苷；7-去氮腺嘌呤；7-去氮鸟苷；2-氨基吡啶；2-吡啶酮；5-取代的嘧啶；6-氮杂嘧啶；N-2、N-6或O-6取代的嘌呤；2-氨基丙基腺嘌呤；5-丙炔基尿嘧啶；和5-丙炔基胞嘧啶。

供体DNA的组成：如上所讨论的双链供体DNA的其他形式包含不同的5’末端化学修饰，诸如生物素。供体DNA的其他形式可能包括核糖2’位置的稳定性修饰，包括但不限于2’-氟、2’-氨基和2’-O-甲基。供体DNA的其他形式可以包含3’末端修饰，诸如反向dT或生物素。供体DNA的其他形式可能包括锁核酸(LNA)，其中核糖糖的2’-O和4’-C原子通过亚甲基桥连接。双链供体DNA的其他形式可能包括含有TevSaCas9靶位点的环状质粒DNA，其中用TevSaCas9的裂解产生与基因组靶中的那些互补的DNA末端。双链供体DNA可以包括合成的或扩增的线性双链DNA。在某些实施方案中，使用病毒载体诸如腺相关病毒或慢病毒来提供供体DNA。

嵌合核酸酶的产生

本文所述的嵌合核酸酶可以以多种方式产生，包括使用大肠杆菌表达***，如WO2020225719A1中所述的。可选地，嵌合核酸酶可以由待修饰的靶细胞通过提供一种或更多种指导核酸酶在靶细胞中的表达和产生的遗传载体来产生。此外，载体可以提供序列以指导引导RNA的表达，从而将嵌合核酸酶靶向特定的基因组区域。

下面描述了用于产生本文所述的遗传工程细胞的示例性方法。

使细胞群体在T型烧瓶中生长至70％-90％汇合。通过离心收获细胞并在缓冲液T(Carlsbad,California,US)中重悬至1.0×10⁷个细胞/毫升(实际范围0.2-2×10⁷个细胞/毫升)。用本文所述的核酸酶电穿孔细胞，所述核酸酶包括选自SEQ ID NO:25-49的那些并用/>转染***(Thermo Fisher/>Waltham,Massachusetts,US)在2000伏(实际范围1100-2500)、20毫秒(实际范围10-30毫秒)和1个脉冲(实际范围1-4)在三(羟甲基)氨基甲烷或磷酸盐缓冲盐水中配制。用具有0.3g/L谷氨酰胺和2g/L葡萄糖(Sigma-/>Irvine,UK)、10％胎牛血清(Sigma-/>Oakville,Ontario,CA)、2mM L-谷氨酰胺和100单位青霉素和0.1mg链霉素/mL(Sigma-St.Louis,Missouri,US)的RPMI 1640回收细胞24小时。使用死细胞去除试剂盒(Miltenyi/>Somerville,Massachusetts,US)去除死细胞。通过经由聚合酶链式反应扩增靶基因并经由靶向扩增子测序(GENEWIZ,South Plainfield,NJ,US)测量编辑的细胞比例来测量敲除效率。扩增子测序是一种靶向下一代测序(targeted next generationsequencing)的方法，使您能够分析特定基因组区域的遗传变异。这种方法使用PCR来创建称为扩增子的DNA序列。来自不同样品的扩增子可以被多重化，也称为索引或汇集，这涉及向样品添加条形码(索引)，以便它们可以被识别。在多重化之前，用于扩增子测序的单个样品必须通过添加衔接子和经由PCR扩增富集靶区域来转化为文库。衔接子允许形成索引扩增子，并允许扩增子粘附到流通池以进行测序。扩增子测序通常用于细胞群体中的变体检测。

产生离体细胞疗法的方法

一种制造改良细胞疗法的方法：可以使用将核酸酶递送到细胞的其他方法，诸如脂质纳米颗粒、聚合物、病毒载体或细胞穿透肽。嵌合核酸酶或引导RNA可以以单链或双链形式作为DNA或RNA单独或组合递送。此外，嵌合核酸酶可以作为含有以下元件中的一种或更多种的RNA递送：5’帽、5’非翻译区、编码序列、3’非翻译区和多腺嘌呤(多-A)尾。RNA可以包括不同的核碱基以保持稳定性，所述核碱基包括但不限于5-甲基胞嘧啶；5-羟甲基胞嘧啶；黄嘌呤；次黄嘌呤；2-氨基腺嘌呤；腺嘌呤的6-甲基衍生物；鸟嘌呤的6-甲基衍生物；腺嘌呤的2-丙基衍生物；鸟嘌呤的2-丙基衍生物；2-硫代尿嘧啶；2-硫代胸腺嘧啶；2-硫代胞嘧啶；5-丙炔基尿嘧啶；5-丙炔基胞嘧啶；6-偶氮尿嘧啶；6-偶氮胞嘧啶；6-偶氮胸腺嘧啶；假尿嘧啶；4-硫尿嘧啶；8-卤代腺嘌呤；8-氨基腺嘌呤；8-硫代腺嘌呤；8-硫代烷基腺嘌呤；8-羟基腺嘌呤；8-卤鸟嘌呤；8-氨基鸟嘌呤；8-硫代鸟嘌呤；8-硫代烷基鸟嘌呤；8-羟基鸟嘌呤；5-卤尿嘧啶；5-溴尿嘧啶；5-三氟甲基尿嘧啶；5-卤胞嘧啶；5-溴胞嘧啶；5-三氟甲基胞嘧啶；5-取代的尿嘧啶；5-取代的胞嘧啶；7-甲基鸟嘌呤；7-甲基腺嘌呤；2-F-腺嘌呤；2-氨基腺嘌呤；8-氮杂鸟嘌呤；8-氮杂腺嘌呤；7-去氮鸟嘌呤；7-去氮腺嘌呤；3-去氮鸟嘌呤；3-去氮腺嘌呤；三环嘧啶；苯噁嗪胞苷；吩噻嗪胞苷；取代的苯噁嗪胞苷；咔唑胞苷；吡啶吲哚胞苷；7-去氮鸟苷；2-氨基吡啶；2-吡啶酮；5-取代的嘧啶；6-氮杂嘧啶；N-2、N-6或O-6取代的嘌呤；2-氨基丙基腺嘌呤；5-丙炔基尿嘧啶；和5-丙炔基胞嘧啶。

在另一种实施方案中，嵌合核酸酶可以作为整合载体递送，包括但不限于逆转录病毒载体、慢病毒载体、转座子载体和腺相关病毒载体。嵌合核酸酶也可以通过其他电穿孔***，包括但不限于NucleofectorTM(Lonza,Basel,Switzerland)、MaxCyte(Gaithersburg,MD)或(Bergisch Gladbach,Germany)递送。

嵌合核酸酶还可以被包含在包含一种或更多种药学上可接受的载体、稀释剂或赋形剂的药物组合物中。如本文使用的，术语“药学上可接受的赋形剂”是指与本发明药物组合物的活性成分(例如，本发明的化合物)相容(并且优选地能够使它稳定)并且对待治疗的受试者无害的载体和媒介物。例如，与本发明化合物形成特异性、更可溶的复合物的增溶剂可用作递送化合物的药物赋形剂。合适的载体和媒介物是本领域普通技术人员已知的。本文中使用的术语“赋形剂”将包括所有这样的载体、辅料(adjuvants)、稀释剂、溶剂或其他非活性添加剂。药物制剂可以包含本领域常用的惰性稀释剂，诸如例如水或其他溶剂、增溶剂和乳化剂，诸如乙醇、异丙醇、碳酸乙酯、乙酸乙酯、苯甲醇、苯甲酸苄酯、丙二醇、1,3-丁二醇、甘油、四氢呋喃醇、和脱水山梨醇的脂肪酸酯、环糊精、白蛋白、透明质酸、壳聚糖及其混合物。聚乙二醇(PEG)可用于获得所需的溶解度、稳定性、半衰期和其他药学上有利的性质。稳定化组分的代表性实例包括聚山梨醇酯80、L-精氨酸、聚乙烯吡咯烷酮、海藻糖，及它们的组合。可使用的其它赋形剂诸如溶液粘合剂或抗氧化剂包括但不限于丁基化羟基甲苯(BHT)、碳酸钙、磷酸钙(一氢)、硬脂酸钙、交联羧甲基纤维素、交联聚乙烯吡咯烷酮、柠檬酸、交联聚维酮、半胱氨酸、乙基纤维素、明胶、羟丙基纤维素、羟丙基甲基纤维素、乳糖、硬脂酸镁、麦芽糖醇、甘露醇、甲硫氨酸、甲基纤维素、对羟基苯甲酸甲酯、微晶纤维素、聚乙烯吡咯烷酮、聚维酮、预胶化淀粉、对羟基苯甲酸丙酯、棕榈酸视黄酯、虫胶、二氧化硅、羧甲基纤维素钠、柠檬酸钠、淀粉乙醇酸钠、山梨醇、淀粉(玉米)、硬脂酸、蔗糖、滑石、二氧化钛、维生素A、维生素E(α-生育酚)、维生素C和木糖醇。

某些实施方案

描述了本公开内容的某些特定编号的实施方案

1.一种多肽，包含修饰的I-TevI核酸酶结构域、接头和修饰的RNA引导的核酸酶结构域。

2.一种嵌合核酸酶，包含修饰的I-TevI核酸酶结构域、接头、RNA引导的核酸酶金黄色葡萄球菌Cas9结构域和引导RNA，其中所述嵌合核酸酶具有两个活性核酸酶位点。

3.根据实施方案2所述的嵌合核酸酶，其中所述修饰的I-TevI核酸酶结构域是SEQID NO:8或其片段。

4.根据实施方案2所述的嵌合核酸酶，其中所述接头是选自SEQ ID NO:9-14中任一种的肽或其片段。

5.根据实施方案2所述的嵌合核酸酶，其中所述RNA引导的核酸酶金黄色葡萄球菌Cas9结构域是SEQ ID NO:15、16、26、27或28中的任一种或其片段。

6.根据实施方案2所述的嵌合核酸酶，其中所述修饰的I-TevI核酸酶结构域是SEQID NO:8或其片段，所述接头是SEQ ID NO:9-14中的任一种或其片段，并且RNA引导的核酸酶金黄色葡萄球菌Cas9结构域是SEQ ID NO:15、16、26、27或28中的任一种或其片段。

7.一种破坏靶向哺乳动物基因的方法，包括施用根据实施方案6的嵌合核酸酶的步骤，其中修饰靶细胞的基因组DNA以破坏内源性基因的表达。

8.根据实施方案7所述的破坏靶向哺乳动物基因的方法，其中所有的靶向基因都被破坏。

9.根据实施方案7所述的破坏靶向哺乳动物基因的方法，其中部分的靶向基因被破坏。

10.一种编辑细胞的遗传组成的方法，包括施用根据实施方案6的嵌合核酸酶的步骤。

11.根据实施方案10所述的编辑细胞的遗传组成的方法，其中所述嵌合核酸酶在存在外源DNA的情况下施用。

12.根据实施方案10所述的编辑细胞的遗传组成的方法，其中将所述嵌合核酸酶施用于靶细胞的细胞核。

13.根据实施方案12所述的编辑细胞的遗传组成的方法，其中一个或更多个核定位序列用于施用嵌合核酸酶。

14.根据实施方案10所述的方法，其中将所述嵌合核酸酶递送至基因组DNA。

15.根据实施方案14所述的方法，其中将所述嵌合核酸酶递送至靶细胞的基因组DNA。

16.根据实施方案15所述的方法，其中所述靶细胞是免疫细胞。

17.根据实施方案16所述的方法，其中所述免疫细胞是T细胞。

18.根据实施方案15所述的方法，其中所述靶细胞是多能细胞。

19.根据实施方案18所述的方法，其中所述多能细胞是诱导多能细胞。

20.根据实施方案15所述的方法，其中使用DNA表达盒将所述嵌合核酸酶递送至靶细胞的基因组DNA。

21.根据实施方案10所述的方法，其中所述方法不使用病毒载体。

22.根据实施方案15所述的方法，其中所述嵌合核酸酶向分离的靶细胞施用。

23.根据实施方案22所述的方法，其中所述分离的靶细胞在离体培养物中分离。

24.根据实施方案23所述的方法，其中所述分离的靶细胞是外源供体细胞。

25.根据实施方案23所述的方法，其中将所述分离的靶细胞的离体培养物与嵌合核酸酶一起进行电穿孔。

26.根据实施方案25所述的方法，其中所述电穿孔以1000至2500V的电流施加。

27.根据实施方案20所述的方法，其中所述嵌合核酸酶在电穿孔之后离体渗透所述分离的靶细胞。

28.根据实施方案14所述的方法，其中所述细胞从由动物细胞、细菌细胞、昆虫细胞和植物细胞组成的组分离。

29.一种缺失确定长度的基因组DNA的方法，包括将根据实施方案6的嵌合核酸酶递送到靶细胞的步骤。

30.根据实施方案29所述的方法，其中所述修饰的基因组DNA通过不合框地敲除基因来破坏内源性基因的表达。

31.一种将一种或更多种确定长度的选定外源DNA***靶细胞DNA的方法，包括将根据实施方案6的嵌合核酸酶递送至靶细胞的步骤。

32.根据实施方案31所述的方法，其中所述施用的嵌合核酸酶在存在外源供体DNA的情况下将一个或更多个确定长度的选定外源DNA***靶细胞的DNA中。

33.根据实施方案32所述的方法，其中将所述外源供体DNA***靶细胞的DNA中。

34.根据实施方案31所述的方法，其中所述确定长度的选定DNA包含一个或更多个功能基因或其一个或更多个片段。

35.一种在靶细胞的DNA中缺失一个或更多个确定长度的选定DNA的方法，包括将根据实施方案6的嵌合核酸酶递送到靶细胞的步骤。

36.根据实施方案35所述的方法，其中所述嵌合核酸酶在不存在外源供体DNA的情况下施用。

37.根据实施方案32或35所述的方法，其中所述嵌合核酸酶修饰靶细胞的基因组DNA以表达一种或更多种外源基因。

38.一种在靶细胞中缺失一个或更多个确定长度的选定基因组DNA并在靶细胞的DNA中***一个或更多个确定长度的选定外源DNA的方法，包括将根据实施方案6的嵌合核酸酶递送到靶细胞的步骤，其中所述选定外源DNA***修饰的基因组DNA的缺失部分，或者***在选定基因组DNA的不同位置。

39.根据实施方案32、35或38所述的方法，其中所述外源基因表达嵌合抗原受体。

40.根据实施方案10所述的方法，其中所述嵌合核酸酶靶向靶向细胞的基因组DNA上的两个独立位点。

41.根据实施方案40所述的方法，其中靶细胞的基因组DNA在靶向细胞的基因组DNA上的独立位点之一处被裂解。

42.根据实施方案40所述的方法，其中靶细胞的基因组DNA在靶向细胞的基因组DNA上的两个独立位点处被裂解，在基因组DNA中产生两个裂解位点。

43.根据实施方案41或42所述的方法，其中裂解的基因组DNA的长度为30-36个碱基。

44.根据实施方案42所述的方法，其中裂解在存在外源供体DNA的情况下发生。

45.根据实施方案44所述的方法，其中将外源供体DNA***到两个裂解位点之间。

46.根据实施方案45所述的方法，其中将完整外源供体DNA***到两个裂解位点之间。

47.根据实施方案45所述的方法，其中将外源供体DNA的一部分***到两个裂解位点之间。

48.根据实施方案45-47所述的方法，其中外源供体DNA以特定取向***在两个裂解位点之间。

49.根据实施方案48所述的方法，其中外源供体DNA通过直接连接、微同源末端连接或非同源末端连接与基因组DNA结合。

50.根据实施方案41或42之一所述的方法，其中所述嵌合核酸酶的引导RNA是SEQID NO:17或SEQ ID NO:18或其片段；其中所述嵌合核酸酶靶向并裂解B2M基因。

51.根据实施方案50所述的方法，其中所述嵌合核酸酶产生B2M基因的不合框突变。

52.根据实施方案51所述的方法，其中所述不合框突变抑制适当的B2M蛋白的产生或功能。

53.根据实施方案41或42中任一项所述的方法，其中所述嵌合核酸酶的引导RNA是SEQ ID NO:19或其片段；其中所述嵌合核酸酶靶向并裂解TRAC1基因。

54.根据实施方案53所述的方法，其中所述嵌合核酸酶产生TRAC1基因的不合框突变。

55.根据实施方案54所述的方法，其中所述不合框突变抑制适当的TRAC1蛋白的产生或功能。

56.根据实施方案41或42中任一项所述的方法，其中所述嵌合核酸酶的引导RNA是SEQ ID NO:20或其片段；其中所述嵌合核酸酶靶向TRCB1基因。

57.根据实施方案56所述的方法，其中所述嵌合核酸酶产生TRCB1基因的不合框突变。

58.根据实施方案57所述的方法，其中所述不合框突变抑制适当的TRCB1蛋白的产生或功能。

59.根据实施方案41或42中任一项所述的方法，其中所述嵌合核酸酶的引导RNA是SEQ ID NO:21或其片段；其中所述嵌合核酸酶靶向并裂解HLA-A基因。

60.根据实施方案59所述的方法，其中所述嵌合核酸酶产生HLA-A基因的不合框突变。

61.根据实施方案60中任一项所述的方法，其中所述不合框突变抑制适当的HLA-A蛋白生成或功能。

62.根据实施方案41或42中任一项的方法，其中所述嵌合核酸酶的引导RNA是SEQID NO:22或其片段；其中所述嵌合核酸酶靶向AAVS1基因。

63.根据实施方案62所述的方法，其中所述AAVS1基因在存在外源供体DNA的情况下被靶向。

64.根据实施方案63所述的方法，其中AAVS1基因中的安全港位点被靶向。

65.根据实施方案63所述的方法，其中嵌合核酸酶靶向AAVS1基因上的两个位点。

66.根据实施方案65所述的方法，其中外源供体DNA被整合在AAVS1基因上的两个靶向位点之间。

67.根据实施方案63-66中任一项所述的方法，其中外源供体DNA包含表达嵌合抗原受体的DNA序列。

68.根据实施方案67所述的方法，其中整合的外源供体DNA通过非同源末端连接被保留。

69.根据实施方案67所述的方法，其中靶向SEQ ID NO:7的CD19的嵌合抗原受体被***到AAVS1位点中。

70.根据实施方案63所述的方法，其中将LoxP位点***到AAVS1中。

71.根据实施方案70所述的方法，其中LoxP位点为SEQ ID NO:24。

72.一种产生免疫耐受细胞的方法，包括施用两种或更多种根据实施方案6的嵌合核酸酶的混合物的步骤。

73.根据实施方案72所述的产生免疫耐受细胞的方法，包括施用嵌合核酸酶的混合物的步骤，其中所述嵌合核酸酶靶向选自由以下组成的组的一种或更多种基因：B2M、TRAC1、TRBC1、HLA-A和AAVS1。

74.根据实施方案73的产生免疫耐受细胞的方法，其中所述嵌合核酸酶的混合物包含选自由SEQ ID NO:17或18、19、20和21或其片段组成的组的多个引导RNA。

75.根据实施方案73所述的产生免疫耐受细胞的方法，其中含有多个引导RNA的嵌合核酸酶的所述混合物同时施用。

76.根据实施方案75所述的产生免疫耐受细胞的方法，其中所述混合物包含多个引导RNA，以靶向靶细胞的同一外源DNA内的多个序列。

77.根据实施方案75所述的产生免疫耐受细胞的方法，其中嵌合核酸酶和引导RNA的比例是等摩尔的。

78.一种制剂，包含根据实施方案2的嵌合核酸酶，包含嵌合核酸酶的混合物，所述嵌合核酸酶含有选自SEQ ID NO:17或18、19、20和21或其片段的引导RNA，其中所述嵌合核酸酶靶向靶细胞的同一外源DNA内的多个序列。

79.根据实施方案76所述的制剂，其中嵌合核酸酶和引导RNA的比例是等摩尔的。

80.根据实施方案1所述的多肽，包含SEQ ID NO:29-33中任一种的完整氨基酸序列或其片段。

81.根据实施方案1所述的多肽，包含SEQ ID NO:34-38中任一种的完整氨基酸序列或其片段。

82.根据实施方案1所述的多肽，包含SEQ ID NO:39-43中任一种的完整氨基酸序列或其片段。

83.根据实施方案1所述的多肽，包含SEQ ID NO:44-48中任一种的完整氨基酸序列或其片段。

84.一种多肽，包含SEQ ID NO:29的氨基酸序列的至少80％。

85.一种多肽，包含SEQ ID NO:29的氨基酸序列的至少85％。

86.一种多肽，包含SEQ ID NO:29的氨基酸序列的至少90％。

87.一种多肽，包含SEQ ID NO:29的氨基酸序列的至少95％。

88.一种多肽，包含SEQ ID NO:34的氨基酸序列的至少80％。

89.一种多肽，包含SEQ ID NO:34的氨基酸序列的至少85％。

90.一种多肽，包含SEQ ID NO:34的氨基酸序列的至少90％。

91.一种多肽，包含SEQ ID NO:34的氨基酸序列的至少95％。

92.一种多肽，包含SEQ ID NO:39的氨基酸序列的至少80％。

93.一种多肽，包含SEQ ID NO:39的氨基酸序列的至少85％。

94.一种多肽，包含SEQ ID NO:39的氨基酸序列的至少90％。

95.一种多肽，包含SEQ ID NO:39的氨基酸序列的至少95％。

96.一种多肽，包含SEQ ID NO:44的氨基酸序列的至少80％。

97.一种多肽，包含SEQ ID NO:44的氨基酸序列的至少85％。

98.一种多肽，包含SEQ ID NO:44的氨基酸序列的至少90％。

99.一种多肽，包含SEQ ID NO:44的氨基酸序列的至少95％。

100.一种药学上可接受的制剂，包含根据实施方案2的嵌合核酸酶。

101.一种药学上可接受的制剂，包含根据实施方案6的嵌合核酸酶。

102.根据实施方案6所述的药学上可接受的制剂，其中所述药学上可接受的制剂包括经历用核酸酶电穿孔的细胞。

103.根据实施方案100所述的药学上可接受的制剂，其中所述嵌合核酸酶是SEQID NO:25-49中的任一种。

104.根据实施方案100所述的药学上可接受的制剂，还包含外源供体DNA。

105.一种治疗疾病的方法，包括施用根据实施方案102的药学上可接受的制剂的步骤。

106.根据实施方案103所述的方法，其中所述疾病是癌症。

107.治疗疾病的方法，包括根据实施方案72产生免疫细胞的步骤，其中所述嵌合核酸酶修饰免疫细胞的DNA。

108.根据实施方案105的治疗疾病的方法，其中所述疾病是癌症。

109.一种支持人类的免疫耐受的方法，包括施用根据实施方案102的药学上可接受的制剂的步骤。

110.根据实施方案109所述的支持免疫耐受的方法，包括根据实施方案72的产生免疫细胞的步骤，其中所述嵌合核酸酶修饰免疫细胞的DNA。

111.根据实施方案33所述的方法，其中所述外源供体DNA选自由双链DNA、具有非互补末端的双链DNA或环状双链DNA组成的组。

112.根据实施方案111所述的方法，其中所述双链DNA的多核苷酸链具有相同的长度，并且都被根据实施方案6的同一嵌合核酸酶裂解。

113.根据实施方案111所述的方法，其中所述非互补DNA末端被根据实施方案6的同一嵌合核酸酶裂解。

114.根据实施方案111所述的方法，其中所述双链DNA或所述具有非互补末端的双链DNA都在5’末端磷酸化或化学修饰。

115.根据实施方案111所述的方法，其中所述双链DNA或所述具有非互补末端的双链DNA含有一个或更多个硫代磷酸酯键。

116.根据实施方案111所述的方法，其中所述双链DNA或所述具有非互补末端的双链DNA用生物素进行化学修饰。

117.根据实施方案111所述的方法，其中所述环状双链DNA包含I-TevI和SaCas9靶位点。

118.根据实施方案6所述的嵌合核酸酶，其中所述金黄色葡萄球菌Cas9结构域是SEQ ID NO:25-28之一。

119.根据实施方案6所述的嵌合核酸酶，其中所述RNA引导的核酸酶金黄色葡萄球菌Cas9结构域包含解释遗传多态性的序列。

120.根据实施方案6所述的嵌合核酸酶，其中所述RNA引导的核酸酶金黄色葡萄球菌Cas9结构域靶向靶细胞中基因组DNA上的安全港位点。

121.根据实施方案120所述的嵌合核酸酶，其中安全港是hROSA26和CCR5。

122.根据实施方案7的方法，其中所述嵌合核酸酶使用脂质纳米颗粒、聚合物、病毒载体或细胞穿透肽递送。

123.根据实施方案20所述的方法，其中细胞是肺细胞。

124.根据实施方案20所述的方法，其中嵌合核酸酶是SEQ ID NO:31的多肽。

125.根据实施方案20所述的方法，其中递送DNA表达盒以治疗遗传病。

126.一种嵌合核酸酶，所述嵌合核酸酶具有两个活性核酸酶位点，包含修饰的I-Tevl核酸酶结构域、接头和第二核酸酶结构域，其中活性位点的核酸酶活性是协调的。

127.根据实施方案126所述的嵌合核酸酶，其中第二核酸酶是修饰的RNA引导的核酸酶，并还包含引导RNA。

128.一种编辑基因组DNA的方法，包括向细胞或生物体施用根据实施方案126的嵌合核酸酶的步骤。

129.一种缺失确定长度的DNA分子的方法，包括将根据实施方案128的嵌合核酸酶递送至细胞或生物体的步骤。

130.一种替换来自DNA分子的选定序列的方法，包括将根据实施方案128的嵌合核酸酶递送至细胞或生物体的步骤。

131.一种多肽，包含SEQ ID NO:49的氨基酸序列的至少80％。

132.一种多肽，包含SEQ ID NO:49的氨基酸序列的至少85％。

133.一种多肽，包含SEQ ID NO:49的氨基酸序列的至少90％。

134.一种多肽，包含SEQ ID NO:49的氨基酸序列的至少95％。

定义和缩略语

除非另有定义，本文使用的所有技术术语、符号和其他科学术语旨在具有本公开内容所属领域的技术人员通常理解的含义。在某些情况下，为了清晰和/或便于参考，本文定义了具有普遍理解含义的术语；因此，在本文包括这样的定义不应解释为代表与本领域中通常理解的内容的实质性差异。

在本说明书和随后的权利要求书的框架内，除非另有指示，否则所有表示量、数量、百分比等的数字在所有情况下都应理解为前面有术语“约”。如本文所用，术语“约”定义为±10％。此外，除了下文具体指出的那些范围之外，数字实体的所有范围包括最大和最小数值的所有可能组合以及其中所有可能的中间范围。

本文中使用的术语“和/或”被定义为具有一个或另一个或二者的可能性。例如，“A和/或B”提供了仅具有A或仅具有B或A和B的组合的情况。如果权利要求书读作A和/或B和/或C，则组合物可以包括单独的A、单独的B、单独的C、A和B但不包括C、B和C但不包括A、A和C但不包括B、或所有三种A、B和C作为组分。

相对于参考多肽序列的序列同一性百分比(％)是在序列对齐并在必要时引入空位以实现最大序列同一性百分比之后，并且不考虑任何保守取代作为序列同一性的一部分，候选序列中与参考多肽序列中氨基酸残基相同的氨基酸残基的百分数，如使用序列比较计算机程序ALIGN-2计算的。ALIGN-2序列比较计算机程序由Genentech,Inc.编写，并且源代码已与用户文档一起在美国版权局注册，在美国版权局它以美国版权注册号TXU510087注册。ALIGN-2程序可以从Genentech,Inc.,South San Francisco,Calif.公开获得，也可以从源代码编译。ALIGN-2程序应编译为在UNIX操作***，包括digital UNIXV4.0D上使用。所有序列比较参数由ALIGN-2程序设置，并且没有改变。在采用ALIGN-2进行氨基酸序列比较的情况下，特定氨基酸序列A与、同或相对于特定氨基酸序列B的氨基酸序列同一性％(也可以替代地表述为特定氨基酸序列A与、同或相对于特定氨基酸序列B具有或包含一定的氨基酸序列同一性％)计算如下：100乘以分数X/Y，其中X是序列比对程序ALIGN-2在该程序对A和B的比对中评分为相同匹配的氨基酸残基的数目，并且其中Y是B中氨基酸残基的总数。应理解，在氨基酸序列A的长度不等于氨基酸序列B的长度的情况下，A对B的氨基酸序列同一性％将不等于B对A的氨基酸序列同一性％。除非另有特别说明，否则本文中使用的所有氨基酸序列同一性值％都是使用ALIGN-2计算机程序如前一段所述获得的。

本文描述的任何多肽、I-TevI结构域、接头结构域或Cas多肽核酸酶可以与本文提供的序列表中描述的任何列出的多肽具有至少约80％、85％、90％、95％、96％、97％、98％或99％的同一性或相同。在某些实施方案中，包含所述序列同一性的多肽可以保持多肽的野生型形式的核酸酶活性或由本文所述突变中的任何一种赋予的改变的核酸酶活性(例如，Cas9的D10E突变；或I-TevI的(K26R、T95S和Q158R突变)、(V117F突变)(K135R/N140S)、(V117F/K135R/N140S))。

在一些实施方案中，设想了本文提供的多肽和嵌合核酸酶的氨基酸序列变体。变体典型地在一个或更多个取代、缺失、添加和/或***方面不同于本文具体公开的多肽。这样的变体可以是天然存在的，或者可以是通过合成产生的，例如，通过修饰本文描述的一个或更多个多肽序列和评价如本文所述的多肽的一种或更多种生物活性和/或使用许多已知技术中的任何一种。可以进行缺失、***和取代的任何组合来得到最终构建体，条件是最终构建体具有期望的特征例如抗原结合。

如本文使用的，当在本文用于描述氨基酸序列或核酸序列时，相对于参考序列的术语“同源的”、“同源性”或“同源性百分比”可以使用Karlin和Altschul(Proc.Natl.Acad.Sci.USA 87:2264-2268,1990,修改为Proc.Natl.Acad.Sci.USA 90:5873-5877,1993)描述的公式来确定。这样的公式被并入Altschul等人(J.Mol.Biol.215:403-410,1990)的基本局部比对搜索工具(BLAST)程序中。序列的同源性百分比可以使用截至本申请提交日期的最新版本的BLAST来确定。本文描述的任何核酸或引导RNA可以包含与所述序列标识符至少约80％、85％、90％、95％、97％、98％、99％或100％的同源性，同时保持所述序列赋予的适当结合活性(例如，与基因或核酸酶的结合活性)。

冠词“一(a)”和“一(an)”在本文中用于指一个或多于一个(即至少一个)的该冠词的语法对象。本文中使用的术语“和/或”被定义为具有一个或另一个或二者的可能性。例如，“A和/或B”提供了仅具有A或仅具有B或A和B的组合的情况。如果权利要求书读作A和/或B和/或C，则组合物可以包括单独的A、单独的B、单独的C、A和B但不包括C、B和C但不包括A、A和C但不包括B、或所有三种A、B和C作为组分。

如本文所用，术语“施用(administer)”和“施用(administering)”是指将药物、药物治疗(medication)或其他形式的治疗剂分配或应用于患有疾病或状况的患者。

如本文所用，“缓冲液”是药学上可接受的并且能够将本发明的组合物维持在所需pH范围内的任何酸或盐组合。所公开组合物中的缓冲液将pH维持在约2至约8.5、约5.0至约8.0、约6.0至约7.5、约6.5至约7.5的范围内或约6.5。合适的缓冲液包括能够维持上述pH范围的任何药学上可接受的缓冲液，诸如例如乙酸盐、酒石酸盐、磷酸盐或柠檬酸盐缓冲液。在一种实施方案中，缓冲液是磷酸盐缓冲液。在另一种实施方案中，缓冲液是乙酸盐缓冲液。在一种实施方案中，缓冲液是磷酸氢二钠、氯化钠、氯化钾和磷酸二氢钾。

如本文所用，术语“嵌合抗原受体”是指已被遗传工程化以产生用于免疫疗法的人工T细胞受体的T细胞(也称为CAR T细胞)。

如本文所用，术语“嵌合核酸酶”是指包含一个或更多个提供序列特异性的DNA结合结构域和一个或更多个用于DNA裂解的核酸酶结构域的工程化蛋白。

如本文所用，术语“裂解(cleave)”或“裂解(to cleave)”或“裂解(cleaved)”或“裂解(cleavage)”是指DNA分子的一个或更多个磷酸二酯键的***。双链DNA在单个靶位点的裂解产生两个DNA片段，这两个片段可以通过非同源末端连接或同源定向修复来修复。双链DNA在两个靶位点的裂解产生三个片段，这三个片段可以通过非同源末端连接或同源定向修复来修复，并丢失或缺失中间片段。就本申请而言，在两个靶位点“裂解”基因组DNA可以产生可预测长度的缺失。

如本文提及DNA或RNA片段或靶位点所用的，术语“确定的”是指具有特定的核苷酸长度或特定的核苷酸序列。

如本文所用，术语“递送(deliver)”或“递送(to deliver)”或“递送(delivered)”或“递送(delivery)”是指直接发送基因编辑工具(例如，核酸酶、gRNA和/或外源供体DNA)到靶细胞，以在体内或离体实现细胞基因组DNA的遗传修饰。

术语“遗传工程”和语法等同物是指将一个或更多个缺失、***或取代引入靶细胞或个体的基因组。

如本文所用，术语“疾病”或“患病的”是指人类、动物或植物的结构或功能紊乱，尤其是产生特定体征或症状或影响特定位置且不仅仅是物理损伤的直接结果的紊乱。

如本文所用，术语“破坏”是指抑制或灭活基因的表达或功能的任何过程。“破坏表达”是指改变、抑制或消除遗传信息用于合成功能性基因产物(通常是蛋白质)的过程。

如本文所用，术语“一个或更多个结构域”是指给定蛋白质序列和三级结构的保守部分，其可以独立于蛋白质链的其余部分演化、发挥功能和存在。每个结构域形成紧凑的三维结构，并且通常可以独立地稳定和折叠。许多蛋白质由几个结构域组成。一个结构域可以出现在各种不同的蛋白质中。分子演化使用结构域作为构建模块，并且这些结构域可以以不同的排列重组以产生具有不同功能的蛋白质。一般来说，结构域的长度从大约50个氨基酸到多达1,500个氨基酸不等。结构域通常形成功能单位，诸如钙调素的钙结合EF手结构域。因为它们独立地是稳定的，结构域可以通过遗传工程在一种蛋白质和另一种蛋白质之间“交换”，以制造嵌合蛋白质。

如本文所用，术语“编辑(edit)”或“编辑(to edit)”或“编辑(editing)”是指一组改变生物体基因组DNA的技术。这些技术允许在基因组的特定位置添加、移除或改变遗传物质。

如本文所用，“有效量”是指足以引发所需应答的量。在本发明中，期望的生物应答是细胞，包括T细胞和多能干细胞的遗传修饰。

如本文所用，术语“电穿孔”是指一种微生物学技术，其中电场被施加到细胞以增加细胞膜的渗透性，允许化学物质、药物、DNA或蛋白质被引入细胞。

如本文所用，术语“内源性”是指生长或起源于生物体内部。

如本文所用，术语“等摩尔”是指具有等摩尔数或与之相关。

如本文所用，术语“离体”是指在外部环境中以自然条件的最小改变在来自生物体的组织内或组织上进行的实验或测量。离体表示待测试的样品已经从生物体提取。离体实验使得生物体的细胞或组织的使用能够在比体内实验(在完整的生物体中)更可控的条件下进行。离体样本用途的实例包括：(1)测定；(2)发现对生物体的癌细胞有效的癌症治疗剂；(3)测量物理、热、电、机械、光学和其他组织特性，特别是在可能无法维持生命的各种环境中(例如，在极端压力或温度)；(4)外科手术开发的现实模型；(5)研究不同能量类型与组织的相互作用。在本发明中，离体包括编辑细胞或组织，目的是向有相应需要的受试者移植或施用编辑的细胞或组织。

如本文所用，术语“供体DNA”或“外源供体DNA”是指与本文所述的核酸酶一起供应给细胞的DNA，该DNA旨在通过任何方法诸如非同源末端连接、同源定向修复、微同源定向修复或上述方法的任何组合***基因组。供体DNA可以***包含遗传元件诸如开放阅读框、外显子、内含子或非天然存在于生物体或细胞中的表达盒的核苷酸序列；或者可以修复或替换现有的基因。可选地，可***供体DNA以通过将错义、移码突变或终止密码子突变引入密码子区域或调节元件(例如，启动子、剪接供体/受体)来破坏内源基因。供体DNA可以通过，以非限制性实例的方式，质粒、线性单链或双链DNA、合成单链或双链DNA或病毒载体提供给本文描述的细胞或生物体。供体DNA不同于编码本文所述嵌合核酸酶和引导RNA的核酸和/或递送载体。

如本文所用，术语“表达盒”是指载体DNA的独特组分，其由可操作地连接到要由转染的细胞表达的调控序列的基因组成。在每一次成功的转染中，表达盒指导细胞的机器制造RNA和蛋白质。一些表达盒被设计用于蛋白质编码序列的模块克隆，使得相同的表达盒可以容易地被改变以制造不同的蛋白质。表达盒由一个或更多个基因和控制它们表达的序列组成。表达盒包含三个组成部分：启动子序列、开放阅读框和3’非翻译区，在真核生物中，该区域通常包含多腺苷酸化位点。只要使用正确的调控序列，不同的表达盒可以转染到不同的生物体中，包括细菌、酵母、植物和哺乳动物细胞。

如本文所用，术语“片段(fragment)”或“片段(fragments)”或“其片段(fragmentsthereof)”是指从较大实体断裂的一小部分。当提到核酸酶诸如Cas核酸酶或I-TevI核酸酶时，本文描述的片段包含来自N-末端、C-末端的氨基酸残基缺失，或保留核酸酶的酶活性的确定的内部缺失。缺失可以包括来自本文所述多肽的N-末端、C-末端或内部序列的1、2、3、4、5、6、7、8、9、10或更多个氨基酸缺失。

如本文所用，术语“功能基因”是指编码一个多肽链或其他基因产物的DNA的一部分。因此，“一个基因/一种酶”假说变成了“一个顺反子(基因)/一个多肽”假说或“一个基因/一个功能产物”假说。

如本文所用，术语“基因组DNA”或“gDNA”是指生物体的染色体DNA，代表其大部分遗传物质。它不同于细菌质粒DNA、互补DNA或线粒体DNA。

术语“免疫耐受”是指免疫***对有能力在给定生物体中引发免疫应答的物质或组织无响应的状态。

如本文所用，术语“包括”用于表示“包括但不限于”。“包括”和“包括但不限于”可互换使用。

如本文所用，术语“独立位点”是指靶上或靶内的区域，诸如DNA分子或蛋白质/肽，它们与另一个连接或彼此连接，但不是相同的序列，并被认为是独立的。

如本文所用，术语“诱导多能干细胞”是指可以直接从体细胞产生的多能干细胞类型。

如本文所用和特定于所要求保护的发明，术语“抑制(inhibit)”或“抑制(toinhibit)”或“抑制(inhibits)”或“抑制(inhibiting)”或“抑制(inhibition)”或“其抑制(inhibition thereof)”，是指减缓或阻止酶或其他试剂的功能或降低其活性的能力。

如本文所用，术语“***”用于指将整个基因或确定长度的DNA分子添加到细胞中，或将核苷酸子集添加和/或取代到基因中。

如本文所用，术语“接头”是指当RNA引导的核酸酶结构域(Cas9)与靶DNA序列结合时，氨基酸接头结构域确保I-TevI结构域的移动性以允许在细胞生理条件(通常：pH≈7.2，温度≈37℃，[K+]≈140mM，[Na+]≈5-15mM，[C1-]≈4mM，[Ca++]≈0.0001mM)下识别、结合和裂解其靶序列的情况。氨基酸接头的长度可影响Cas9靶位点与I-TevI靶位点之间优选的核苷酸数量。接头中的某些氨基酸也可与TevCas9所靶向的DNA序列进行特异性接触。这些接头-DNA接触可以影响I-TevI结构域的柔性。替换接头结构域中的氨基酸可影响接头结构域与DNA进行接触的能力。

如本文所用，术语“修饰(modify)”或“修饰(to modify)”或“修饰(modifies)”或“修饰的(modified)”或“修饰(modification)”是指通过改变生物体DNA内所需基因的核苷酸来改变植物、动物或微生物特征的技术。改变可以包括去除和/或添加核苷酸，包括整个基因和/或其片段。这些术语是指进行基本的或根本的改变以赋予新的功能，诸如通过工程化免疫细胞(诸如T细胞)或诱导多能干细胞(iPSC)来改变所述细胞的DNA以实现免疫耐受和/或表达外源基因(诸如嵌合抗原受体(CAR))，尽管不限于仅这些细胞类型。关于本申请，它通常是指细胞中DNA中核苷酸的添加或缺失。特别地，它是指I-TevI结构域的合成形式、接头肽和RNA引导的核酸酶的修饰形式，该核酸酶的修饰形式被设计成靶向基因以促进已知细胞疗法中的免疫原性。

如本文所用，术语“非同源末端连接”是指修复DNA中双链断裂的途径。NHEJ被称为“非同源的”，因为断裂末端被直接连接而不需要同源模板，这与同源定向修复相反，同源定向修复需要同源序列来指导修复。

如本文所用，术语“核酸酶”是指裂解核酸的核苷酸之间的磷酸二酯键的酶。

如本文所用，术语“核酸酶结构域”是指靶上负责DNA链的物理裂解并可引入单链或双链断裂的区域。例如，在一些实施方案中，核酸酶结构域可以指野生型I-TevI核酸酶结构域的氨基酸1-92或其具有改变的氨基酸序列和/或结合或核酸酶性质的变体。

如本文所用，术语“不合框突变(out-of-frame mutation)”或“框移位突变(frameshift mutation)”是指去除或添加一个或更多个核苷酸，严重破坏蛋白质的产生，导致完全无功能的蛋白质或根本不产生蛋白质。

待由本发明方法治疗的术语“患者”、“受试者”或“宿主”可以指人类或非人类动物。非人类动物包括伴侣动物(例如，猫、狗)和为食用而饲养的动物(即，食用动物)，诸如牛、猪和鸡。

术语“药学上可接受的制剂”是本领域公认的，并且是指药学上可接受的材料、组合物或载体，例如液体或固体填料、稀释剂、赋形剂、溶剂或包封材料，用于将任何本发明组合物或其组分从一个器官或身体的一部分携带或运输到另一个器官或身体的一部分。每种载体必须是“可接受的”，即与本发明组合物及其组分相容，并且不损害患者。可用作药学上可接受的载体的材料的一些实例包括：(1)糖，诸如右旋糖、乳糖、葡萄糖和蔗糖；(2)淀粉，诸如玉米淀粉和马铃薯淀粉；(3)纤维素及其衍生物，诸如微晶纤维素、羧甲基纤维素钠、甲基纤维素、乙基纤维素、羟丙基甲基纤维素(HPMC)和乙酸纤维素；(4)二醇，诸如丙二醇；(5)多元醇，诸如甘油、山梨糖醇、甘露醇和聚乙二醇；(6)酯，诸如油酸乙酯、山嵛酸甘油酯和月桂酸乙酯；(7)缓冲剂，诸如磷酸一氢盐和磷酸二氢盐、Tris/硼酸/EDTA和Tris/乙酸/EDTA；(8)无热原水；(9)等渗盐水；(10)林格氏溶液；(11)乙醇；(12)磷酸盐缓冲溶液；(13)聚山梨醇酯；(14)聚磷酸酯；和(15)在药物制剂中使用的其他无毒相容物质。所公开的赋形剂可以起到一种以上的作用。例如，增溶剂也可以是悬浮助剂、乳化剂、防腐剂等。

如本文所用，术语“多能干细胞”是指具有自我更新能力并产生身体组织中任何细胞的细胞类型。

本文所述的T细胞是一种参与适应性细胞免疫应答的免疫细胞。T细胞通过细胞表面分子CD3的表达来鉴定。当T细胞表达嵌合抗原受体(CAR)时，它们可以用作治疗细胞。

本文所述的NK细胞是一种参与免疫反应的免疫细胞。NK细胞通过细胞表面分子CD56的表达来鉴定。当NK细胞表达嵌合抗原受体(CAR)时，它们可以用作治疗细胞。

本文所述的造血干细胞(HSC)是一种未成熟的细胞，可发育成所有类型的血细胞，包括白细胞、红细胞和血小板。造血干细胞见于外周血和骨髓中。也称为血液干细胞。造血干细胞通过细胞表面分子CD34的表达来鉴定。

本文所述的间充质干细胞是可分化成多种细胞类型的多能基质细胞，包括成骨细胞(骨细胞)、软骨细胞(chondrocyte)(软骨细胞(cartilage cell))、肌细胞(肌肉细胞)和脂肪细胞(adipocyte)(脂肪细胞(fat cell))。

如本文所用，术语“多肽”是指由大量氨基酸残基结合在一起形成链的线性有机聚合物，形成蛋白质分子的一部分(或全部)。

如本文提及蛋白质产生或功能所用的，术语“适当的”是指产生基本上正常或天然形式的蛋白质，其基本上保留其生物效应或活性或适合其如本文所述的预期用途。

如本文所用，术语“RNA引导的”或“引导RNA”是指涉及CRISPR和Cas9的原核DNA编辑。对于这种原核DNA编辑***，RNA引导的核酸酶赋予对CRISPR-Cas9***的靶序列特异性。这些gRNA是非编码的短RNA序列，与互补的靶DNA序列结合。

如本文所用，术语“选定DNA”是指从大量DNA序列选择或分离的。

如本文所用，术语“适当”是指充分地适合于某一用途或目的。

如本文所用，术语“一个或更多个靶位点”特别是就本发明而言是指基因中当用核酸酶靶向时将被核酸酶结合和/或裂解的位置。靶位点可以包含多个核苷酸，诸如I-TevI或CRISPR/Cas核酸酶的裂解位点，或I-TevI核酸酶或CRISPR/Cas引导RNA的DNA结合位点。靶位点可以在各种细胞类型和生物体中的任一个中的基因或基因间区域中。

如本文所用，术语“靶(target)”或“靶(targets)”或“靶向(to target)”或“靶向(targeting)”是指关于本申请的发明，使用例如选择的或工程化的DNA结合结构域或引导RNA将核酸酶瞄准或导向特定的、选择的DNA序列。

如本文所用，术语“病毒载体”是指通常用于将遗传物质递送到细胞中的工具。该过程可以在活生物体内(体内)或在细胞培养中(体外的)进行。病毒载体的实例包括AAV载体、慢病毒载体和腺病毒载体。

如本文所用，术语“同时”是指同一时间或基本上同一时间施用CRISPR/Cas9复合物与多个gRNA。应当理解，某些程序可以以顺序发生但间隔很小的步骤来执行。例如，电穿孔细胞，然后在大约一小时内施用供体DNA。

如本文所用，术语“取代”是指用不同的氨基酸替换序列中的氨基酸。如本文所用，简写X10Y表示，氨基酸Y已经“取代”了在序列的第10位发现的氨基酸X。例如，W26C表示，氨基酸色氨酸-26(Trp,W)变为半胱氨酸(Cys)。类似地，符号AAX表示，AA是取代X位置发现的氨基酸的氨基酸。例如，Lys26表示用赖氨酸替换序列中第26位的氨基酸。任一种简写的使用是可以互换的。此外，氨基酸的一字母缩写或三字母缩写的使用也是可以互换的。

如本文所用，术语“治疗”包括使得状况、疾病、疾患等改善的任何效果，例如减轻、减少、调节或消除。如本文所用，“治疗”可包括预防性治疗和治疗性治疗二者。例如，治疗性治疗可包括延迟、抑制或阻止囊性纤维化或非小细胞肺癌的进展、减少或消除与囊性纤维化或非小细胞肺癌相关的症状。预防性治疗可包括预防、抑制或延迟囊性纤维化或非小细胞肺癌的发作。

缩写

本文使用的缩写定义如下：

AA 氨基酸

AAVS1 腺相关病毒整合位点1

B2Mβ-2 微球蛋白

CAR 嵌合抗原受体

Cas9 CRISPR相关蛋白9

Cpf1 来自普氏菌属(Prevotella)和弗朗西斯氏菌属(Francisella)的CRISPR 1

CRISPR 成簇调控间隔短回文重复序列

CFTR 囊性纤维化跨膜传导调节基因

DNA 脱氧核糖核酸

E.Coli 大肠杆菌(Escherichia coli)

EDTA 乙二胺四乙酸

EGFR 表皮生长因子受体

HDR 同源定向修复

HLA-A 组织相容性抗原，α链

IPSC 诱导多能干细胞

NHEJ 非同源末端连接

NLS 核定位信号

PCR 聚合酶链式反应

RNA 核糖核酸

saCas9 金黄色葡萄球菌Cas9

scCas9 犬链球菌(Streptococcus canis)Cas9

spCas9 酿脓链球菌(Streptococcus pyogenes)Cas9

TALEN 转录激活样效应核酸酶

TCR T细胞受体

TevCas9 修饰的I-TevI结构域、接头肽和修饰的RNA引导的核酸酶金黄色葡萄球菌Cas9

TRAC1 T细胞受体α链恒定

TRBC1 T细胞受体β恒定1

ZFN 锌指核酸酶

实施例

以下说明性实施例代表本文所述组合物和方法的实施方案，并不意味着以任何方式进行限制。

实施例1-TevSaCas9裂解靶位点

图2A说明，使用SEQ ID NO:17中的引导RNA靶向B2M基因的TevSaCas9在体外裂解B2M DNA底物。随着时间的推移，裂解反应的产物在琼脂糖凝胶上显现。图2B是用融合到可裂解GFP标签的TevSaCas9的质粒DNA形式转染的哺乳动物细胞，在处理48小时后使用Cytation5(Biotek Instruments Inc,VT,USA)上的相差和GFP成像来成像。图2C表明由质粒DNA编码的TevSaCas9在B2M基因处的编辑，如通过从收获的细胞提取的基因组DNA的PCR扩增和T7核酸内切酶I裂解测定检测的。图2D表明使用与靶向SEQ ID NO:17的B2M的引导RNA复合并转染到哺乳动物细胞中的纯化的SEQ ID NO:29的TevSaCas9蛋白或SEQ ID NO:32的包含V117F/K135R/N140S突变的TevSaCas9蛋白在B2M基因处的编辑。从收获的细胞提取基因组DNA并通过PCR扩增和T7核酸内切酶I裂解测定来检测在B2M基因的编辑。

图3A说明，针对SEQ ID NO:22中的引导，靶向AAVS1基因的TevSaCas9裂解哺乳动物细胞基因组中的AAVS1靶位点(目标靶，on target)但不裂解偏离靶(off-target)序列。从收获的细胞提取基因组DNA并通过PCR扩增和T7核酸内切酶I裂解测定来检测在AAVS1基因的编辑。在计算机预测的前5个偏离靶位点处的编辑也用T7核酸内切酶I裂解测定测量，没有检测到偏离靶。图3B显示AAVS1的目标靶和偏离靶位点的序列。灰色突出显示的序列表示引导RNA靶位点。小写核苷酸表示与目标靶不匹配的位置。加下划线的序列表示推定的I-TevI结合和裂解位点。图3C表明SEQ ID NO:37的TeV[VKN]-SaCas9[D10E]和SEQ ID NO:33的TeV[KTQ]-SaCas9[WT]在哺乳动物细胞中AAVS1基因处的活性。从收获的细胞提取基因组DNA并通过PCR扩增和T7核酸内切酶I裂解测定来检测在AAVS1基因的编辑。

图6说明，使用SEQ ID NO:20中的引导，靶向TRBC1基因的TevSaCas9裂解哺乳动物细胞基因组中的TRBC1靶位点。从收获的细胞提取基因组DNA并通过PCR扩增和T7核酸内切酶I裂解测定来检测在TRBC1基因的编辑。

实施例2-TevSaCas9将供体DNA***特定基因组位点

图4A显示表示B2M基因中TevSaCas9裂解后的靶位点(黑色)和供体寡核苷酸修复模板(灰色)向切割位点的***，以及发生寡核苷酸修复的示意图。图4B说明供体寡核苷酸修复模板的***。示出了用针对B2M的TevSaCas9和包含独特限制性酶位点的修复模板转染的细胞的T7核酸内切酶I裂解测定(“T7E1”)和限制性酶消化(“RE”)的结果。从收获的细胞提取基因组DNA并通过PCR扩增和T7核酸内切酶I裂解测定来检测在B2M基因的编辑。寡核苷酸修复模板的***通过限制性酶消化来测量。

图5A和图5B是描绘基因组内被TevSaCas9裂解后的AAVS1安全港位点(黑色)的示意图。灰色显示的是大约1.2千碱基的绿色荧光蛋白(GFP)报告基因构建体，其末端与TevSaCas9切割位点相容。在报道基因加TevSaCas9细胞中观察到GFP荧光，但在只有报道基因的细胞中没有观察到。图5B表明GFP报告基因在HEK293细胞中在AAVS1位点的***和表达。共转染后48小时，对用含有和不含报告基因构建体的TevSaCas9处理的细胞成像。GFP阳性细胞的存在表明GFP报告基因的表达。

图7A是包含单个LoxP位点的双链DNA寡核苷酸修复模板(“RT”)的序列的示意图。小写显示的是BglII限制性酶位点，并且加下划线的是单个LoxP位点。图7B表明，含有单个LoxP位点的双链DNA寡核苷酸向AAVS1靶位点的***。显示了用靶向AAVS1的TevSaCas9、有和没有包含BglII和LoxP位点的修复模板(RT)转染的细胞的T7核酸内切酶I裂解测定(“T7E1”)和限制性酶消化(“RE”)的结果。从收获的细胞提取基因组DNA并通过PCR扩增和T7E1测定来检测在AAVS1基因的编辑。寡核苷酸修复模板的***通过RE消化来测量。用包含RT的TevSaCas9处理的细胞显示预期大小的RE消化产物，表明RT***在AAVS1靶位点。

图8A说明，电穿孔的核糖核蛋白TevSaCas9编辑哺乳动物细胞中的B2M靶位点。HEK293细胞用1.5μM的靶向B2M的TevSaCas9核糖核蛋白复合物电穿孔，在转染***(Thermo Fisher/>Waltham,Massachusetts,US)上使用1150伏，2个脉冲，各20毫秒。显示了TevSaCas9处理的或模拟电穿孔细胞的T7核酸内切酶I裂解测定(“T7E1”)的结果。从收获的细胞提取基因组DNA并通过PCR扩增和T7核酸内切酶I裂解测定来检测在B2M基因的编辑。图8B表明，可以使用电穿孔的TevSaCas9核糖核蛋白复合物将供体DNA整合到B2M靶位点。HEK293细胞如(A)中所示电穿孔，但包括2μg含有绿色荧光蛋白(GFP)报告基因的线性化供体DNA(RT)。然后使用荧光激活细胞分选将GFP阳性细胞分选为单细胞，并扩增细胞克隆群体。通过提取基因组DNA样品并扩增B2M基因座来检测GFP报告基因的存在。在克隆2中观察到琼脂糖凝胶上对应于供体DNA构建体大小的条带(用*表示)，表明报告基因成功整合到B2M靶位点。图8C表明，诱导的供体DNA可整合到多能干细胞(iPSC)中的B2M靶位点。用7.5μg靶向B2M的TevSaCas9核糖核蛋白复合物在有和没有2μg含mCherry荧光报告基因的线性化供体DNA(“RT”)的情况下电穿孔iPSC。模拟电穿孔仅用细胞进行。从收获的细胞提取基因组DNA，并且PCR扩增B2M基因座。仅在存在RT的情况下在琼脂糖凝胶上观察到对应于供体DNA构建体大小的条带(用*表示)，表明供体DNA***到B2M基因座。

实施例3-具有不同核定位信号(NLS)的TevSaCas9裂解靶位点

图10说明使用不同的核定位信号(NLS)时SEQ ID NO:32的TevSaCas9对HEK293细胞的B2M基因的裂解。所示为靶向B2M的TevSaCas9的T7核酸内切酶I裂解测定(“T7E1”)的结果，所述TevSaCas9具有由人类流感血凝素(HA)序列分隔的两个SEQ ID NO:56的C-末端核质蛋白NLS(“核质蛋白”)、由HA序列分隔的两个SEQ ID NO:55的SV40NLS(“二分SV40”)或HA序列后跟两个SV40 NLS(“串联SV40”)。还显示了用脂转染试剂处理的细胞(“模拟”)。从收获的细胞提取基因组DNA并通过PCR扩增和T7核酸内切酶I裂解测定来检测在B2M基因的编辑。

实施例4-I-TevI与Cas12a的融合物裂解双链DNA

图9A和图9B说明，SEQ ID NO:47的I-TevI与Cas12a的融合物被引导RNA激活以裂解双链DNA底物。使用SEQ ID NO:50中的引导RNA，靶向AAVS1基因的纯化的Cas12a和TevCas12在体外裂解AAVS1 DNA底物。标有“C”的泳道表示仅蛋白质的样品。随着时间的推移的裂解反应的产物在琼脂糖凝胶上显现。由Cas12a裂解产生的两条带表明单一切割。出乎意料的是，观察到TevCas12a的几种裂解产物，表明在存在引导RNA的情况下，TevCas12a非特异性地裂解双链DNA。图9B表明，TevCas12a裂解细胞中的AAVS1靶位点。用靶向AAVS1的Cas12a和TevCas12a脂感染HEK293细胞。从收获的细胞提取基因组DNA并通过PCR扩增和T7核酸内切酶I裂解测定来检测在AAVS1基因的编辑。在Cas12a和TevCas12a样品中明显更多产物的存在表明TevCas12a裂解细胞中的AAVS1基因。

虽然本文已经示出和描述了本发明的优选实施方案，但对于本领域技术人员将明显的是，这样的实施方案仅通过实例的方式提供。本领域技术人员现在将想到许多变化、改变和替换，而不偏离本发明。应当理解，可以在实践本发明时采用本文描述的本发明的实施方案的各种替代方案。

本说明书中提及的所有出版物、专利申请、发布的专利和其他文件通过引用并入本文，如同每个单独的出版物、专利申请、发布的专利或其他文件被具体和单独地指示为通过引用以其整体并入。通过引用并入的教科书中所包含的定义在与本公开内容中的定义相矛盾的范围内被排除。

尽管已经讨论了本发明的具体实施方案，但是上述说明书是说明性的而不是限制性的。在回顾本说明书后，本发明的许多变型对于本领域技术人员来说将变得明显。本发明的全部范围应该通过参考权利要求书及其等同物的全部范围和说明书以及这样的变型来确定。

除非另外指明，否则本说明书和权利要求书中使用的表示成分、反应条件等的数量的所有数字应被理解为在所有情况下用术语“约”来修饰。因此，除非相反地指出，在本说明书和所附权利要求书中所列出的数值参数是可以取决于试图通过本发明获得的期望特性而变化的近似值。

以上讨论意在说明本发明的原理和各种实施方案。一旦充分理解上述公开内容，许多变化、组合和修改对本领域技术人员来说将变得明显。意图将以下权利要求解释为包含所有此类变化和修改。

序列

SEQ ID NO 1

ATTCCTGAAGCTGACAGCATTCGGGCCGAGATGTCTCGCTCCGTGGCCTTAGCTGTGCTCGCGCTACTCTCTCTTTCTGGCCTGGAGGCTATCCAGCGTACTCCAAAGATTCAGGTTTACTCACGTCATCCAGCAGAGAATGGAAAGTCAAATTTCCTGAATTGCTATGTGTCTGGGTTTCATCCATCCGACATTGAAGTTGACTTACTGAAGAATGGAGAGAGAATTGAAAAAGTGGAGCATTCAGACTTGTCTTTCAGCAAGGACTGGTCTTTCTATCTCTTGTACTACACTGAATTCACCCCCACTGAAAAAGATGAGTATGCCTGCCGTGTGAACCATGTGACTTTGTCACAGCCCAAGATAGTTAAGTGGGATCGAGACATGTAAGCAGCATCATGGAGGTTTGAAGATGCCGCATTTGGATTGGATGAATTCCAAATTCTGCTTGCTTGCTTTTTAATATTGATATGCTTATACACTTACACTTTATGCACAAAATGTAGGGTTATAATAATGTTAACATGGACATGATCTTCTTTATAATTCTACTTTGAGTGCTGTCTCCATGTTTGATGTATCTGAGCAGGTTGCTCCACAGGTAGCTCTAGGAGGGCTGGCAACTTAGAGGTGGGGAGCAGAGAATTCTCTTATCCAACATCAACATCTTGGTCAGATTTGAACTCTTCAATCTCTTGCACTCAAAGCTTGTTAAGATAGTTAAGCGTGCATAAGTTAACTTCCAATTTACATACTCTGCTTAGAATTTGGGGGAAAATTTAGAAATATAATTGACAGGATTATTGGAAATTTGTTATAATGAATGAAACATTTTGTCATATAAGATTCATATTTACTTCTTATACATTTGATAAAGTAAGGCATGGTTGTGGTTAATCTGGTTTATTTTTGTTCCACAAGTTAAATAAATCATAAAACTTGATGTGTTATCTCTTATATCTCACTCCCACTATTACCCCTTTATTTTCAAACAGGGAAACAGTCTTCAAGTTCCACTTGGTAAAAAATGTGAACCCCTTGTATATAGAGTTTGGCTCACAGTGTAAAGGGCCTCAGTGATTCACATTTTCCAGATTAGGAATCTGATGCTCAAAGAAGTTAAATGGCATAGTTGGGGTGACACAGCTGTCTAGTGGGAGGCCAGCCTTCTATATTTTAGCCAGCGTTCTTTCCTGCGGGCCAGGTCATGAGGAGTATGCAGACTCTAAGAGGGAGCAAAAGTATCTGAAGGATTTAATATTTTAGCAAGGAATAGATATACAATCATCCCTTGGTCTCCCTGGGGGATTGGTTTCAGGACCCCTTCTTGGACACCAAATCTATGGATATTTAAGTCCCTTCTATAAAATGGTATAGTATTTGCATATAACCTATCCACATCCTCCTGTATACTTTAAATCATTTCTAGATTACTTGTAATACCTAATACAATGTAAATGCTATGCAAATAGTTGTTATTGTTTAAGGAATAATGACAAGAAAAAAAAGTCTGTACATGCTCAGTAAAGACACAACCATCCCTTTTTTTCCCCAGTGTTTTTGATCCATGGTTTGCTGAATCCACAGATGTGGAGCCCCTGGATACGGAAGGCCCGCTGTACTTTGAATGACAAATAACAGATTTAAAATTTTCAAGGCATAGTTTTATACCTGA

长度：1675

类型：DNA

生物体：智人(HOMO SAPIENS)

特征：β-2-微球蛋白(B2M)编码序列

其他信息：SaCas9引导RNA序列用下划线标出。

SEQ ID NO 2

ATTCCTGAAGCTGACAGCATTCGGGCCGAGATGTCTCGCTCCGTGGCCTTAGCTGTGCTCGCGCTACTC TCTCTTTCTGGCCTGGAGGCTATCCAGCGTACTCCAAAGATTCAGGTTTACTCACGTCATCCAGCAGAGAATGGAAAGTCAAATTTCCTGAATTGCTATGTGTCTGGGTTTCATCCATCCGACATTGAAGTTGACTTACTGAAGAATGGAGAGAGAATTGAAAAAGTGGAGCATTCAGACTTGTCTTTCAGCAAGGACTGGTCTTTCTATCTCTTGTACTACACTGAATTCACCCCCACTGAAAAAGATGAGTATGCCTGCCGTGTGAACCATGTGACTTTGTCACAGCCCAAGATAGTTAAGTGGGATCGAGACATGTAAGCAGCATCATGGAGGTTTGAAGATGCCGCATTTGGATTGGATGAATTCCAAATTCTGCTTGCTTGCTTTTTAATATTGATATGCTTATACACTTACACTTTATGCACAAAATGTAGGGTTATAATAATGTTAACATGGACATGATCTTCTTTATAATTCTACTTTGAGTGCTGTCTCCATGTTTGATGTATCTGAGCAGGTTGCTCCACAGGTAGCTCTAGGAGGGCTGGCAACTTAGAGGTGGGGAGCAGAGAATTCTCTTATCCAACATCAACATCTTGGTCAGATTTGAACTCTTCAATCTCTTGCACTCAAAGCTTGTTAAGATAGTTAAGCGTGCATAAGTTAACTTCCAATTTACATACTCTGCTTAGAATTTGGGGGAAAATTTAGAAATATAATTGACAGGATTATTGGAAATTTGTTATAATGAATGAAACATTTTGTCATATAAGATTCATATTTACTTCTTATACATTTGATAAAGTAAGGCATGGTTGTGGTTAATCTGGTTTATTTTTGTTCCACAAGTTAAATAAATCATAAAACTTGATGTGTTATCTCTTATATCTCACTCCCACTATTACCCCTTTATTTTCAAACAGGGAAACAGTCTTCAAGTTCCACTTGGTAAAAAATGTGAACCCCTTGTATATAGAGTTTGGCTCACAGTGTAAAGGGCCTCAGTGATTCACATTTTCCAGATTAGGAATCTGATGCTCAAAGAAGTTAAATGGCATAGTTGGGGTGACACAGCTGTCTAGTGGGAGGCCAGCCTTCTATATTTTAGCCAGCGTTCTTTCCTGCGGGCCAGGTCATGAGGAGTATGCAGACTCTAAGAGGGAGCAAAAGTATCTGAAGGATTTAATATTTTAGCAAGGAATAGATATACAATCATCCCTTGGTCTCCCTGGGGGATTGGTTTCAGGACCCCTTCTTGGACACCAAATCTATGGATATTTAAGTCCCTTCTATAAAATGGTATAGTATTTGCATATAACCTATCCACATCCTCCTGTATACTTTAAATCATTTCTAGATTACTTGTAATACCTAATACAATGTAAATGCTATGCAAATAGTTGTTATTGTTTAAGGAATAATGACAAGAAAAAAAAGTCTGTACATGCTCAGTAAAGACACAACCATCCCTTTTTTTCCCCAGTGTTTTTGATCCATGGTTTGCTGAATCCACAGATGTGGAGCCCCTGGATACGGAAGGCCCGCTGTACTTTGAATGACAAATAACAGATTTAAAATTTTCAAGGCATAGTTTTATACCTGA

长度：1675

类型：DNA

生物体：智人

特征：β-2-微球蛋白(B2M)编码序列

其他信息：SaCas9引导RNA序列用下划线标出。

SEQ ID NO 3

TTTTGAAACCCTTCAAAGGCAGAGACTTGTCCAGCCTAACCTGCCTGCTGCTCCTAGCTCCTGAGGCTCAGGGCCCTTGGCTTCTGTCCGCTCTGCTCAGGGCCCTCCAGCGTGGCCACTGCTCAGCCATGCTCCTGCTGCTCGTCCCAGTGCTCGAGGTGATTTTTACCCTGGGAGGAACCAGAGCCCAGTCGGTGACCCAGCTTGGCAGCCACGTCTCTGTCTCTGAAGGAGCCCTGGTTCTGCTGAGGTGCAACTACTCATCGTCTGTTCCACCATATCTCTTCTGGTATGTGCAATACCCCAACCAAGGACTCCAGCTTCTCCTGAAGTACACATCAGCGGCCACCCTGGTTAAAGGCATCAACGGTTTTGAGGCTGAATTTAAGAAGAGTGAAACCTCCTTCCACCTGACGAAACCCTCAGCCCATATGAGCGACGCGGCTGAGTACTTCTGTGCTGTGAGTGATCTCGAACCGAACAGCAGTGCTTCCAAGATAATCTTTGGATCAGGGACCAGACTCAGCATCCGGCCAAATATCCAGAACCCTGACCCTGCCGTGTACCAGCTGAGAGACTCTAAATCCAGTGACAAGTCTGTCTGCCTATTCACCGATTTTGATTCTCAAACAAATGTGTCACAAAGTAAGGATTCTGATGTGTATATCACAGACAAAACTGTGCTAGACATGAGGTCTATGGACTTCAAGAGCAACAGTGCTGTGGCCTGGAGCAACAAATCTGACTTTGCATGTGCAAACGCCTTCAACAACAGCATTATTCCAGAAGACACCTTCTTCCCCAGCCCAGAAAGTTCCTGTGATGTCAAGCTGGTCGAGAAAAGCTTTGAAACAGATACGAACCTAAACTTTCAAAACCTGTCAGTGATTGGGTTCCGAATCCTCCTCCTGAAAGTGGCCGGGTTTAATCTGCTCATGACGCTGCGGCTGTGGTCCAGCTGAGATCTGCAAGATTGTAAGACAGCCTGTGCTCCCTCGCTCCTTCCTCTGCATTGCCCCTCTTCTCCCTCTCCAAACAGAGGGAACTCTCCTACCCCCAAGGAGGTGAAAGCTGCTACCACCTCTGTGCCCCCCCGGTAATGCCACCAACTGGATCCTACCCGAATTTATGATTAAGATTGCTGAAGAGCTGCCAAACACTGCTGCCACCCCCTCTGTTCCCTTATTGCTGCTTGTCACTGCCTGACATTCACGGCAGAGGCAAGGCTGCTGCAGCCTCCCCTGGCTGTGCACATTCCCTCCTGCTCCCCAGAGACTGCCTCCGCCATCCCACAGATGATGGATCTTCAGTGGGTTCTCTTGGGCTCTAGGTCCTGGAGAATGTTGTGAGGGGTTTATTTTTTTTTAATAGTGTTCATAAAGAAATACATAGTATTCTTCTTCTCAAGACGTGGGGGGAAATTATCTCATTATCGAGGCCCTGCTATGCTGTGTGTCTGGGCGTGTTGTATGTCCTGCTGCCGATGCCTTCATTAAAATGATTTGGAA

长度：1508

类型：DNA

生物体：智人

特征：T细胞受体α恒定(TRAC)编码序列

其他信息：SaCas9引导RNA序列用下划线标出。

SEQ ID NO 4

GGGCTCCAGGCTGCTCTGTTGGGTGCTGCTTTGTCTCCTGGGAGCAGGCCCAGTAAAGGCTGGAGTCACTCAAACTCCAAGATATCTGATCAAAACGAGAGGACAGCAAGTGACACTGAGCTGCTCCCCTATCTCTGGGCATAGGAGTGTATCCTGGTACCAACAGACCCCAGGACAGGGCCTTCAGTTCCTCTTTGAATACTTCAGTGAGACACAGAGAAACAAAGGAAACTTCCCTGGTCGATTCTCAGGGCGCCAGTTCTCTAACTCTCGCTCTGAGATGAATGTGAGCACCTTGGAGCTGGGGGACTCGGCCCTTTATCTTTGCGCCAGCAGCCGGACAGGGGGCGTAAAGAATTCACCCCTCCACTTTGGGAACGGGACCAGGCTCACTGTGACAGAGGACCTGAACAAGGTGTTCCCACCCGAGGTCGCTGTGTTTGAGCCATCAGAAGCAGAGATCTCCCACACCCAAAAGGCCACACTGGTGTGCCTGGCCACAGGCTTCTTCCCTGACCACGTGGAGCTGAGCTGGTGGGTGAATGGGAAGGAGGTGCACAGTGGGGTCAGCACGGACCCGCAGCCCCTCAAGGAGCAGCCCGCCCTCAATGACTCCAGATACTGCCTGAGCAGCCGCCTGAGGGTCTCGGCCACCTTCTGGCAGAACCCCCGCAACCACTTCCGC TGTCAAGTCCAGTTCTACGGGCTCTCGGAGAATGACGAGTGGACCCAGGATAGGGCCAAACCCGTCACCCAGATCGTCAGCGCCGAGGCCTGGGGTAGAGCAGACTGTGGCTTTACCTCGGTGTCCTACCAGCAAGGGGTCCTGTCTGCCACCATCCTCTATGAGATCCTGCTAGGGAAGGCCACCCTGTATGCTGTGCTGGTCAGCGCCCTTGTGTTGATGGCCATGGTCAAGAGAAAGGATTTCTGAAGGCAGCCCTGGAAGTGGAGTTAGGAGCTTCTAACCCGTCATGGTTTCAATACACATTCTTCTTTTGCCAGCGCTTCTGAAGAGCTGCTCTCACCTCTCTGCATCCCAATAGATATCCCCCTATGTGCATGCACACCTGCACACTCACGGCTGAAATCTCCCTAACCCAGGGGGACCTTAGCATGCCTAAGTGACTAAACCAATAAAAATGTTCTGGTCTGGCCTGAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

长度：1221

类型：DNA

生物体：智人

特征：T细胞受体β恒定(TRBC)编码序列

其他信息：突出显示了TevSaCas9靶向的序列。I-TevI位点带下划线，Cas9引导RNA序列带双下划线，并且PAM序列小写。

SEQ ID NO 5

GATGGCCGTCATGGCGCCCCGAACCCTCCTCCTGCTACTCTCGGGGGCCCTGGCCCTGACCCAGACCTGGGCGGGCTCCCACTCCATGAGGTATTTCTTCACATCCGTGTCCCGGCCCGGCCGCGGGGAGCCCCGCTTCATCGCCGTGGGCTACGTGGACGACACGCAGTTCGTGCGGTTCGACAGCGACGCCGCGAGCCAGAAGATGGAGCCGCGGGCGCCGTGGATAGAGCAGGAGGGGCCGGAGTATTGGGACCAGGAGACACGGAATATGAAGGCCCACTCACAGACTGACCGAGCGAACCTGGGGACCCTGCGCGGCTACTACAACCAGAGCGAGGACGGTTCTCACACCATCCAGATAATGTATGGCTGCGACGTGGGGCCGGACGGGCGCTTCCTCCGCGGGTACCGGCAGGACGCCTACGACGGCAAGGATTACATCGCCCTGAACGAGGACCTGCGCTCTTGGACCGCGGCGGACATGGCAGCTCAGATCACCAAGCGCAAGTGGGAGGCGGTCCATGCGGCGGAGCAGCGGAGAGTCTACCTGGAGGGCCGGTGCGTGGACGGGCTCCGCAGATACCTGGAGAACGGGAAGGAGACGCTGCAGCGCACGGACCCCCCCAAGACACATATGACCCACCACCCCATCTCTGACCATGAGGCCACCCTGAGGTGCTGGGCCCTGGGCTTCTACCCTGCGGAGATCACACTGACCTGGCAGCGGGATGGGGAGGACCAGACCCAGGACACGGAGCTCGTGGAGACCAGGCCTGCAGGGGATGGAACCTTCCAGAAGTGGGCGGCTGTGGTGGTGCCTTCTGGAGAGGAGCAGAGATACACCTGCCATGTGCAGCATGAGGGTCTGCCCAAGCCCCTCACCCTGAGATGGGAGCTGTCTTCCCAGCCCACCATCCCCATCGTGGGCATCATTGCTGGCCTGGTTCTCCTTGGAGCTGTGATCACTGGAGCTGTGGTCGCTGCCGTGATGTGGAGGAGGAAGAGCTCAGATAGAAAAGGAGGGAGTTACACTCAGGCTGCAAGCAGTGACAGTGCCCAGGGCTCTGATGTGTCTCTCACAGCTTGTAAAGTGTGAGACAGCTGCCTTGTGTGGGACTGAGAGGCAAGAGTTGTTCCTGCCCTTCCCTTTGTGACTTGAAGAACCCTGACTTTGTTTCTGCAAAGGCACCTGCATGTGTCTGTGTTCGTGTAGGCATAATGTGAGGAGGTGGGGAGAGCACCCCACCCCCATGTCCACCATGACCCTCTTCCCACGCTGACCTGTGCTCCCTCTCCAATCATCTTTCCTGTTCCAGAGAGGTGGGGCTGAGGTGTCTCCATCTCTGTCTCAACTTCATGGTGCACTGAGCTGTAACTTCTTCCTTCCCTATTAAAATTAGAACCTGAGTATAAAAAAAAAAAAAAAAAAAA

长度：1434

类型：DNA

生物体：智人

特征：主要组织相容性复合体，I类,A(HLA-A)编码序列

SEQ ID NO 6

GTCAGCGCCCCCCGCCCGGCGTCTCCCGGGGCCAGGTCCACCCTCTG

CTGCGCCACCTGGGGCATCCTCCTTCCCCGTTGCCAGTCTCGATCCG

CCCCGTCGTTCCTGGCCCTGGGCTTTGCCACCCTATGCTGACACCCC

GTCCCAGTCCCCCTTACCATTCCCCTTCGACCACCCCACTTCCGAATT

GGAGCCGCTTCAACTGGCCCTGGGCTTAGCCACTCTGTGCTGACCAC

TCTGCCCCAGGCCTCCTTACCATTCCCCTTCGACCTACTCTCTTCCGC

ATTGGAGTCGCTTTAACTGGCCCTGGCTTTGGCAGCCTGTGCTGACC

CATGCAGTCCTCCTTACCATCCCTCCCTCGACTTCCCCTCTTCCGATG

TTGAGCCCCTCCAGCCGGTCCTGGACTTTGTCTCCTTCCCTGCCCTGC

CCTCTCCTGAACCTGAGCCAGCTCCCATAGCTCAGTCTGGTCTATCTG

CCTGGCCCTGGCCATTGTCACTTTGCGCTGCCCTCCTCTCGCCCCCGA

GTGCCCTTGCTGTGCCGCCGGAACTCTGCCCTCTAACGCTGCCGTCT

CTCTCCTGAGTCCGGACCACTTTGAGCTCTACTGGCTTCTGCGCCGC

CTCTGGCCCACTGTTTCCCCTTCCCAGGCAGGTCCTGCTTTCTCTGAC

CTGCATTCTCTCCCCTGGGCCTGTGCCGCTTTCTGTCTGCAGCTTGTG

GCCTGGGTCACCTCTACGGCTGGCCCAGATCCTTCCCTGCCGCCTCC

TTCAGGTTCCGTCTTCCTCCACTCCCTCTTCCCCTTGCTCTCTGCTGT

GTTGCTGCCCAAGGATGCTCTTTCCGGAGCACTTCCTTCTCGGCGCT

GCACCACGTGATGTCCTCTGAGCGGATCCTCCCCGTGTCTGGGTCCT

CTCCGGGCATCTCTCCTCCCTCACCCAACCCCATGCCGTCTTCACTCG

CTGGGTTCCCTTTTCCTTCTCCTTCTGGGGCCTGTGCCATCTCTCGTT

TCTTAGGATGGCCTTCTCCGACGGATGTCTCCCTTGCGTCCCGCCTCC

CCTTCTTGTAGGCCTGCATCATCACCGTTTTTCTGGACAACCCCAAAG

TACCCCGTCTCCCTGGCTTTAGCCACCTCTCCATCCTCTTGCTTTCTTT

GCCTGGACACCCCGTTCTCCTGTGGATTCGGGTCACCTCTCACTCCTT

TCATTTGGGCAGCTCCCCTACCCCCCTTACCTCTCTAGTCTGTGCTAG

CTCTTCCAGCCCCCTGTCATGGCATCTTCCAGGGGTCCGAGAGCTCA

GCTAGTCTTCTTCCTCCAACCCGGGCCCCTATGTCCACTTCAGGACA

GCATGTTTGCTGCCTCCAGGGATCCTGTGTCCCCGAGCTGGGACCAC

CTTATATTCCCAGGGCCGGTTAATGTGGCTCTGGTTCTGGGTACTTTTA

TCTGTCCCCTCCACCCCACAGTGGGGCCACTAGGGACAGGATTGGTG

ACAGAAAAGCCCCATCCTTAGGCCTCCTCCTTCCTAGTCTCCTGATAT

TGGGTCTAACCCCCACCTCCTGTTAGGCAGATTCCTTATCTGGTGACA

CACCCCCATTTCCTGGAGCCATCTCTCTCCTTGCCAGAACCTCTAAGG

TTTGCTTACGATGGAGCCAGAGAGGATCCTGGGAGGGAGAGCTTGG

CAGGGGGTGGGAGGGAAGGGGGGGATGCGTGACCTGCCCGGTTCTC

AGTGGCCACCCTGCGCTACCCTCTCCCAGAACCTGAGCTGCTCTGAC

GCGGCCGTCTGGTGCGTTTCACTGATCCTGGTGCTGCAGCTTCCTTAC

ACTTCCCAAGAGGAGAAGCAGTTTGGAAAAACAAAATCAGAATAAG

TTGGTCCTGAGTTCTAACTTTGGCTCTTCACCTTTCTAGTCCCCAATTT

ATATTGTTCCTCCGTGCGTCAGTTTTACCTGTGAGATAAGGCCAGTAG

CCAGCCCCGTCCTGGCAGGGCTGTGGTGAGGAGGGGGGTGTCCGTG

TGGAAAACTCCCTTTGTGAGAATGGTGCGTCCTAGGTGTTCACCAGG

TCGTGGCCGCCTCTACTCCCTTTCTCTTTCTCCATCCTTCTTTCCTTAAAGAGTCCCCAGTGCTATCTGGGACATATTCCTCCGCCCAGAGCAGGGTCCCGCTTCCCTAAGGCCCTGCTCTGGGCTTCTGGGTTTGAGTCCTTGGCAAGCCCAGGAGAGGCGCTCAGGCTTCCCTGTCCCCCTTCCTCGTCCACCATCTCATGCCCCTGGCTCTCCTGCCCCTTCCCTACAGGGGTTCCTGGCTCTGCTCTTCAGACTGAGCCCCGTTCCCCTGCATCCCCGTTCCCCTGCATCCCCCTTCCCCTGCATCCCCCAGAGGCCCCAGGCCACCTACTTGGCCTGGACCCCACGAGAGGCCACCCCAGCCCTGTCTACCAGGCTGCCTTTTGGGTGGATTCTCCTCCAACTGTGGGGTGACTGCTTGGCAAACTCACTCTTCGGGGTATCCCAGGAGGCCTGGAGCATTGGGGTGGGCTGGGGTTCAGAGAGGAGGGATTCCCTTCTCAGGTTACGTGGCCAAGAAGCAGGGGAGCTGGGTTTGGGTCAGGTCTGGGTGTGGGGTGACCAGCTTATGCTGTTTGCCCAGGACAGCCTAGTTTTAGCACTGAAACCCTCAGTCCTAGGAAAACAGGGATGGTTGGTCACTGTCTCTGGGTGACTCTTGATTCCCGGCCAGTTTCTCCACCTGGGGCTGTGTTTCTCGTCCTGCATCCTTCTCCAGGCAGGTCCCCAAGCATCGCCCCCCTGCTGTGGCTGTTCCCAAGTTCTTAGGGTACCCCACGTGGGTTTATCAACCACTTGGTGAGGCTGGTACCCTGCCCCCATTCCTGCACCCCAATTGCCTTAGTGGCTAGGGGGTTGGGGGCTAGAGTAGGAGGGGCTGGAGCCAGGATTCTTAGGGCTGAACAGAGAAGAGCTGGGGGCCTGGGCTCCTGGGTTTGAGAGAGGAGGGGCTGGGGCCTGGACTCCTGGGTCCGAGGGAGGAGGGGCTGGGGCCTGGACTCCTGGGTCTGAGGGTGGAGGGACTGGGGGCCTGGACTCCTGGGTCCGAGGGAGGAGGGGCTGGGGCCTGGACTCGTGGGTCTGAGGGAGGAGGGGCTGGGGGCCTGGACTTCTGGGTCTTAGGGAGGCGGGGCTGGGCCTGGACCCCTGGGTCTGAATGGGGAGAGGCTGGGGGCCTGGACTCCTTCATCTGAGGGCGGAAGGGCTGGGGCCTGGCCTCCTGGGTTGAATGGGGAGGGGTTGGGCCTGGACTCTGGAGTCCCTGGTGCCCAGGCCTCAGGCATCTTTCACAGGGATGCCTGTACTGGGCAGGTCCTTGAAAGGGAAAGGCCCATTGCTCTCCTTGCCCCCCTCCCCTATCGCCATGACAACTGGGTGGAAATAAACGAGCCGAGTTCATCCCGTTCCCAGGGCACGTGCGGCCCCTTCACAGCCCGAGTTTCCATGACCTCATGCTCTTGGCCCTCGTAGCTCCCTCCCGCCTCCTCCAGATGGGCAGCTTTGGAGAGGTGAGGGACTTGGGGGGTAATTTATCCCGTGGATCTAGGAGTTTAGCTTCACTCCTTCCTCAGCTCCAGTTCAGGTCCCGGAGCCCACCCAGTGTCCACAAGGCCTGGGGCAAGTCCCTCCTCCGACCCCCTGGACTTCGGCTTTTGTCCCCCCAAGTTTTGGACCCCTAAGGGAAGAATGAGAAACGGTGGCCCGTGTCAGCCCCTGGCTGCAGGGCCCCGTGCAGAGGGGGCCTCAGTGAACTGGAGTGTGACAGCCTGGGGCCCAGGCACACAGGTGTGCAGCTGTCTCACCCCTCTGGGAGTCCCGCCCAGGCCCCTGAGTCTGTCCCAGCACAGGGTGGCCTTCCTCCACCCTGCATAGCCCTGGGCCCACGGCTTCGTTCCTGCAGAGTATCTGCTGGGGTGGTTTCCGAGCTTGACCCTTGGAAGGACCTGGCTGGGTTTAAGGCAGGAGGGGCTGGGGGCCAGGACTCCTGGCTCTGAAGGAGGAGGGGCTGGAACCTCTTCCCTAGTCTGAGCACTGGAAGCGCCACCTGTGGGTGGTGACGGGGGTTTTGCCGTGTCTAACAGGTACCATGTGGGGTTCCCGCACCCAGATGAGAAGCCCCCTCCCTTCCCCGTTCACTTCCTGTTTGCAGATAGCCAGGAGTCCTTTCGTGGTTTCCACTGAGCACTGAAGGCCTGGCCGGCCTGACCACTGGGCAACCAGGCGTATCTTAAACAGCCAGTGGCCAGAGGCTGTTGGGTCATTTTCCCCACTGTCCTAGCACCGTGTCCCTGGATCTGTTTTCGTGGCTCCCTCTGGAGTCCCGACTTGCTGGGACACCGTGGCTGGGGTAGGTGCGGCTGACGGCTGTTTCCCACCCCCAG

长度：4427

类型：DNA

生物体：智人

特征：腺相关病毒整合位点1(AAVS1)非编码序列

SEQ ID NO 7

5’-GGGCAGAGCGCACATCGCCCACAGTCCCCGAGAAGTTGGGGGGAGGGGTCGGCAATTGAACCGGTGCCTAGAGAAGGTGGCGCGGGGTAAACTGGGAAAGTGATGTCGTGTACTGGCTCCGCCTTTTTCCCGAGGGTGGGGGAGAACCGTATATAAGTGCAGTAGTCGCCGTGAACGTTCTTTTTCGCAACGGGTTTGCCGCCAGAACACAGGTGTCGTGACGCGGGATCCGCCACCATGCTTCTCCTGGTGACAAGCCTTCTGCTCTGTGAGTTACCACACCCAGCATTCCTCCTGATCCCAGACATCCAGATGACACAGACTACATCCTCCCTGTCTGCCTCTCTGGGAGACAGAGTCACCATCAGTTGCAGGGCAAGTCAGGACATTAGTAAATATTTAAATTGGTATCAGCAGAAACCAGATGGAACTGTTAAACTCCTGATCTACCATACATCAAGATTACACTCAGGAGTCCCATCAAGGTTCAGTGGCAGTGGGTCTGGAACAGATTATTCTCTCACCATTAGCAACCTGGAGCAAGAAGATATTGCCACTTACTTTTGCCAACAGGGTAATACGCTTCCGTACACGTTCGGAGGGGGGACTAAGTTGGAAATAACAGGCTCCACCTCTGGATCCGGCAAGCCCGGATCTGGCGAGGGATCCACCAAGGGCGAGGTGAAACTGCAGGAGTCAGGACCTGGCCTGGTGGCGCCCTCACAGAGCCTGTCCGTCACATGCACTGTCTCAGGGGTCTCATTACCCGACTATGGTGTAAGCTGGATTCGCCAGCCTCCACGAAAGGGTCTGGAGTGGCTGGGAGTAATATGGGGTAGTGAAACCACATACTATAATTCAGCTCTCAAATCCAGACTGACCATCATCAAGGACAACTCCAAGAGCCAAGTTTTCTTAAAAATGAACAGTCTGCAAACTGATGACACAGCCATTTACTACTGTGCCAAACATTATTACTACGGTGGTAGCTATGCTATGGACTACTGGGGTCAAGGAACCTCAGTCACCGTCTCCTCAGCGGCCGCAATTGAAGTTATGTATCCTCCTCCTTACCTAGACAATGAGAAGAGCAATGGAACCATTATCCATGTGAAAGGGAAACACCTTTGTCCAAGTCCCCTATTTCCCGGACCTTCTAAGCCCTTTTGGGTGCTGGTGGTGGTTGGGGGAGTCCTGGCTTGCTATAGCTTGCTAGTAACAGTGGCCTTTATTATTTTCTGGGTGAGGAGTAAGAGGAGCAGGCTCCTGCACAGTGACTACATGAACATGACTCCCCGCCGCCCCGGGCCCACCCGCAAGCATTACCAGCCCTATGCCCCACCACGCGACTTCGCAGCCTATCGCTCCAGAGTGAAGTTCAGCAGGAGCGCAGACGCCCCCGCGTACCAGCAGGGCCAGAACCAGCTCTATAACGAGCTCAATCTAGGACGAAGAGAGGAGTACGATGTTTTGGACAAGAGACGTGGCCGGGACCCTGAGATGGGGGGAAAGCCGAGAAGGAAGAACCCTCAGGAAGGCCTGTACAATGAACTGCAGAAAGATAAGATGGCGGAGGCCTACAGTGAGATTGGGATGAAAGGCGAGCGCCGGAGGGGCAAGGGGCACGATGGCCTTTACCAGGGTCTCAGTACAGCCACCAAGGACACCTACGACGCCCTTCACATGCAGGCCCTGCCCCCTCGCTAA-3’

3’-CCCCCGTCTCGCGTGTAGCGGGTGTCAGGGGCTCTTCAACCCCCCTCCCCAGCCGTTAACTTGGCCACGGATCTCTTCCACCGCGCCCCATTTGACCCTTTCACTACAGCACATGACCGAGGCGGAAAAAGGGCTCCCACCCCCTCTTGGCATATATTCACGTCATCAGCGGCACTTGCAAGAAAAAGCGTTGCCCAAACGGCGGTCTTGTGTCCACAGCACTGCGCCCTAGGCGGTGGTACGAAGAGGACCACTGTTCGGAAGACGAGACACTCAATGGTGTGGGTCGTAAGGAGGACTAGGGTCTGTAGGTCTACTGTGTCTGATGTAGGAGGGACAGACGGAGAGACCCTCTGTCTCAGTGGTAGTCAACGTCCCGTTCAGTCCTGTAATCATTTATAAATTTAACCATAGTCGTCTTTGGTCTACCTTGACAATTTGAGGACTAGATGGTATGTAGTTCTAATGTGAGTCCTCAGGGTAGTTCCAAGTCACCGTCACCCAGACCTTGTCTAATAAGAGAGTGGTAATCGTTGGACCTCGTTCTTCTATAACGGTGAATGAAAACGGTTGTCCCATTATGCGAAGGCATGTGCAAGCCTCCCCCCTGATTCAACCTTTATTGTCCGAGGTGGAGACCTAGGCCGTTCGGGCCTAGACCGCTCCCTAGGTGGTTCCCGCTCCACTTTGACGTCCTCAGTCCTGGACCGGACCACCGCGGGAGTGTCTCGGACAGGCAGTGTACGTGACAGAGTCCCCAGAGTAATGGGCTGATACCACATTCGACCTAAGCGGTCGGAGGTGCTTTCCCAGACCTCACCGACCCTCATTATACCCCATCACTTTGGTGTATGATATTAAGTCGAGAGTTTAGGTCTGACTGGTAGTAGTTCCTGTTGAGGTTCTCGGTTCAAAAGAATTTTTACTTGTCAGACGTTTGACTACTGTGTCGGTAAATGATGACACGGTTTGTAATAATGATGCCACCATCGATACGATACCTGATGACCCCAGTTCCTTGGAGTCAGTGGCAGAGGAGTCGCCGGCGTTAACTTCAATACATAGGAGGAGGAATGGATCTGTTACTCTTCTCGTTACCTTGGTAATAGGTACACTTTCCCTTTGTGGAAACAGGTTCAGGGGATAAAGGGCCTGGAAGATTCGGGAAAACCCACGACCACCACCAACCCCCTCAGGACCGAACGATATCGAACGATCATTGTCACCGGAAATAATAAAAGACCCACTCCTCATTCTCCTCGTCCGAGGACGTGTCACTGATGTACTTGTACTGAGGGGCGGCGGGGCCCGGGTGGGCGTTCGTAATGGTCGGGATACGGGGTGGTGCGCTGAAGCGTCGGATAGCGAGGTCTCACTTCAAGTCGTCCTCGCGTCTGCGGGGGCGCATGGTCGTCCCGGTCTTGGTCGAGATATTGCTCGAGTTAGATCCTGCTTCTCTCCTCATGCTACAAAACCTGTTCTCTGCACCGGCCCTGGGACTCTACCCCCCTTTCGGCTCTTCCTTCTTGGGAGTCCTTCCGGACATGTTACTTGACGTCTTTCTATTCTACCGCCTCCGGATGTCACTCTAACCCTACTTTCCGCTCGCGGCCTCCCCGTTCCCCGTGCTACCGGAAATGGTCCCAGAGTCATGTCGGTGGTTCCTGTGGATGCTGCGGGAAGTGTACGTCCGGGACGGGGGAGCGATT-5’

长度：1707

类型：双链DNA

生物体：人工的

特征：将靶向CD19的嵌合抗原受体***AAVS1位点；DNA方向用5’或3’表示；2个核苷酸的突出端用下划线表示

其他信息：

SEQ ID NO 8

MGKSGIYQIKNTLNNKVYVGSAKDFEKRWKRHFKDLEKGCHSSIKLQRSFNKHGNVFECSILEEIPYEKDLIIERENFWIKELNSKINGYNIA

长度：93

类型：氨基酸

生物体：人工的

特征：I-TEVI结构域

其他信息：

SEQ ID NO 9

DATFGDTCSTHPLKEEIIKKRSETFKAKMLKLGPDGRKALYSKPGSKNGRWNPETHKFCKCGVRIQTSAYTCSKCRNGGSGGS

长度：83

类型：氨基酸

生物体：人工的

特征：接头结构域

其他信息：V117F；突变带下划线

SEQ ID NO 10

DATFGDTCSTHPLKEEIIKKRSETVKAKMLKLGPDGRKALYSRPGSKSGRWNPETHKFCKCGVRIQTSAYTCSKCRNGGSGGS

长度：83

类型：氨基酸

生物体：人工的

特征：接头结构域

其他信息：K135R/N140S；突变带下划线

SEQ ID NO 11

DATFGDTCSTHPLKEEIIKKRSETFKAKMLKLGPDGRKALYSRPGSKSGRWNPETHKFCKCGVRIQTSAYTCSKCRNGGSGGS

长度：83

类型：氨基酸

生物体：人工的

特征：接头结构域

其他信息：V117F/K135R/N140S；突变带下划线

SEQ ID NO 12

DATFGDTCSTHPLKEEIIKKRSETVKAKMLKLGPDGRKALYSRPGSKSGRWNPETHKFCKCGVRIQTSAYTCSKCRNGGSGGTGGS

长度：86

类型：氨基酸

生物体：人工的

特征：接头结构域变体

其他信息：

SEQ ID NO 13

DATFGDTCSTHPLKEEIIKKRSETVKAKMLKLGPDGRKALYSRPGSKSGRWNPETHKFCKCGVRIQTSAYTCSKCRNGGGGSGGGGS

长度：87

类型：氨基酸

生物体：人工的

特征：接头结构域变体

其他信息：

SEQ ID NO 14

DATFGDTCSTHPLKEEIIKKRSETVKAKMLKLGPDGRKALYSRPGSKSGRWNPETHKFCKCGVRIQTSAYTCSKCRNKESGSVSSEQLAQFRSLD

长度：95

类型：氨基酸

生物体：人工的

特征：接头结构域变体

其他信息：

SEQ ID NO 15

MKRNYILGLDIGITSVGYGIIDYETRDVIDAGVRLFKEANVENNEGRRSKRGARRLKRRRRHRIQRVKKLLFDYNLLTDHSELSGINPYEARVKGLSQKLSEEEFSAALLHLAKRRGVHNVNEVEEDTGNELSTKEQISRNSKALEEKYVAELQLERLKKDGEVRGSINRFKTSDYVKEAKQLLKVQKAYHQLDQSFIDTYIDLLETRRTYYEGPGEGSPFGWKDIKEWYEMLMGHCTYFPEELRSVKYAYNADLYNALNDLNNLVITRDENEKLEYYEKFQIIENVFKQKKKPTLKQIAKEILVNEEDIKGYRVTSTGKPEFTNLKVYHDIKDITARKEIIENAELLDQIAKILTIYQSSEDIQEELTNLNSELTQEEIEQISNLKGYTGTHNLSLKAINLILDELWHTNDNQIAIFNRLKLVPKKVDLSQQKEIPTTLVDDFILSPVVKRSFIQSIKVINAIIKKYGLPNDIIIELAREKNSKDAQKMINEMQKRNRQTNERIEEIIRTTGKENAKYLIEKIKLHDMQEGKCLYSLEAIPLEDLLNNPFNYEVDHIIPRSVSFDNSFNNKVLVKQEENSKKGNRTPFQYLSSSDSKISYETFKKHILNLAKGKGRISKTKKEYLLEERDINRFSVQKDFINRNLVDTRYATRGLMNLLRSYFRVNNLDVKVKSINGGFTSFLRRKWKFKKERNKGYKHHAEDALIIANADFIFKEWKKLDKAKKVMENQMFEEKQAESMPEIETEQEYKEIFITPHQIKHIKDFKDYKYSHRVDKKPNRELINDTLYSTRKDDKGNTLIVNNLNGLYDKDNDKLKKLINKSPEKLLMYHHDPQTYQKLKLIMEQYGDEKNPLYKYYEETGNYLTKYSKKDNGPVIKKIKYYGNKLNAHLDITDDYPNSRNKVVKLSLKPYRFDVYLDNGVYKFVTVKNLDVIKKENYYEVNSKCYEEAKKLKKISNQAEFIASFYNNDLIKINGELYRVIGVNNDLLNRIEVNMIDITYREYLENMNDKRPPRIIKTIASKTQSIKKYSTDILGNLYEVKSKKHPQIIKKG

长度：1,053

类型：氨基酸

生物体：金黄色葡萄球菌

特征：

其他信息：

SEQ ID NO 16

MKRNYILGLEIGITSVGYGIIDYETRDVIDAGVRLFKEANVENNEGRRSKRGARRLKRRRRHRIQRVKKLLFDYNLLTDHSELSGINPYEARVKGLSQKLSEEEFSAALLHLAKRRGVHNVNEVEEDTGNELSTKEQISRNSKALEEKYVAELQLERLKKDGEVRGSINRFKTSDYVKEAKQLLKVQKAYHQLDQSFIDTYIDLLETRRTYYEGPGEGSPFGWKDIKEWYEMLMGHCTYFPEELRSVKYAYNADLYNALNDLNNLVITRDENEKLEYYEKFQIIENVFKQKKKPTLKQIAKEILVNEEDIKGYRVTSTGKPEFTNLKVYHDIKDITARKEIIENAELLDQIAKILTIYQSSEDIQEELTNLNSELTQEEIEQISNLKGYTGTHNLSLKAINLILDELWHTNDNQIAIFNRLKLVPKKVDLSQQKEIPTTLVDDFILSPVVKRSFIQSIKVINAIIKKYGLPNDIIIELAREKNSKDAQKMINEMQKRNRQTNERIEEIIRTTGKENAKYLIEKIKLHDMQEGKCLYSLEAIPLEDLLN

NPFNYEVDHIIPRSVSFDNSFNNKVLVKQEENSKKGNRTPFQYLSSSDSK

ISYETFKKHILNLAKGKGRISKTKKEYLLEERDINRFSVQKDFINRNLVD

TRYATRGLMNLLRSYFRVNNLDVKVKSINGGFTSFLRRKWKFKKERNK

GYKHHAEDALIIANADFIFKEWKKLDKAKKVMENQMFEEKQAESMPE

IETEQEYKEIFITPHQIKHIKDFKDYKYSHRVDKKPNRELINDTLYSTRKD

DKGNTLIVNNLNGLYDKDNDKLKKLINKSPEKLLMYHHDPQTYQKLK

LIMEQYGDEKNPLYKYYEETGNYLTKYSKKDNGPVIKKIKYYGNKLNA

HLDITDDYPNSRNKVVKLSLKPYRFDVYLDNGVYKFVTVKNLDVIKKE

NYYEVNSKCYEEAKKLKKISNQAEFIASFYNNDLIKINGELYRVIGVNN

DLLNRIEVNMIDITYREYLENMNDKRPPRIIKTIASKTQSIKKYSTDILGN

LYEVKSKKHPQIIKKG

长度：1,053

类型：氨基酸

生物体：人工的特征：SACAS9 D10E突变体

其他信息：突变带下划线

SEQ ID NO 17

CGCUACUCUCUCUUUCUGGCC

长度：21

类型：RNA

生物体：人工的特征：靶向B2M基因

其他信息：

SEQ ID NO 18

AGCGCGAGCACAGCUAAGGCC

长度：21

类型：RNA

生物体：人工的特征：靶向B2M基因

其他信息：

SEQ ID NO 19

UUUUGUCUGUGAUAUACACAU

长度：21

类型：RNA

生物体：人工的

特征：靶向TRAC基因

其他信息：

SEQ ID NO 20

CUUGACAGCGGAAGUGGUUGC

长度：21

类型：RNA

生物体：人工的

特征：靶向TRBC基因

其他信息：

SEQ ID NO 21

UGGGUCAGGGCCAGGGCCCCC

长度：21

类型：RNA

生物体：人工的

特征：靶向HLA-A基因

其他信息：

SEQ ID NO 22

CCCUGCUCUGGGCUUCUGGGU

长度：21

类型：RNA

生物体：人工的

特征：靶向AAVS1位点

其他信息：

SEQ ID NO 23

长度：1707

类型：双链DNA

生物体：人工的

其他信息：

SEQ ID NO 24

5'-TCTTAAGATCTTTGCTTTCCCTTCTCTATAACTTCGTATAGCATACATTATACGAAGTTATATTCGTCT-3'

3'-CCAGAATTCTAGAAACGAAAGGGAAGAGATATTGAAGCATATCGTATGTAATATGCTTCAATATAAGCAGA-5'

长度：71

类型：双链DNA

生物体：人工的

特征：将LOXP盒***AAVS1位点；DNA方向用5’或3’表示

其他信息：2个核苷酸的突出端用下划线表示

SEQ ID NO 25

MKRNYILGLEIGITSVGYGIIDYETRDVIDAGVRLFKEANVENNEGRRSKRGARRLKRRRRHRIQRVKKLLFDYNLLTDHSELSGINPYEARVKGLSQKLSEEEFSAALLHLAKRRGVHNVNEVEEDTGNELSTKEQISRNSKALEEKYVAELQLERLKKDGEVRGSINRFKTSDYVKEAKQLLKVQKAYHQLDQSFIDTYIDLLETRRTYYEGPGEGSPFGWKDIKEWYEMLMGHCTYFPEELRSVKYAYNADLYNALNDLNNLVITRDENEKLEYYEKFQIIENVFKQKKKPTLKQIAKEILVNEEDIKGYRVTSTGKPEFTNLKVYHDIKDITARKEIIENAELLDQIAKILTIYQSSEDIQEELTNLNSELTQEEIEQISNLKGYTGTHNLSLKAINLILDELWHTNDNQIAIFNRLKLVPKKVDLSQQKEIPTTLVDDFILSPVVKRSFIQSIKVINAIIKKYGLPNDIIIELAREKNSKDAQKMINEMQKRNRQTNERIEEIIRTTGKENAKYLIEKIKLHDMQEGKCLYSLEAIPLEDLLNNPFNYEVDHIIPRSVSFDNSFNNKVLVKQEEASKKGNRTPFQYLSSSDSKISYETFKKHILNLAKGKGRISKTKKEYLLEERDINRFSVQKDFINRNLVDTRYATRGLMNLLRSYFRVNNLDVKVKSINGGFTSFLRRKWKFKKERNKGYKHHAEDALIIANADFIFKEWKKLDKAKKVMENQMFEEKQAESMPEIETEQEYKEIFITPHQIKHIKDFKDYKYSHRVDKKPNRELINDTLYSTRKDDKGNTLIVNNLNGLYDKDNDKLKKLINKSPEKLLMYHHDPQTYQKLKLIMEQYGDEKNPLYKYYEETGNYLTKYSKKDNGPVIKKIKYYGNKLNAHLDITDDYPNSRNKVVKLSLKPYRFDVYLDNGVYKFVTVKNLDVIKKENYYEVNSKCYEEAKKLKKISNQAEFIASFYNNDLIKINGELYRVIGVNNDLLNRIEVNMIDITYREYLENMNDKRPPRIIKTIASKTQSIKKYSTDILGNLYEVKSKKHPQIIKKG

长度：1,053

类型：氨基酸

生物体：人工的

特征：SACAS9 D10E+N580A突变体

其他信息：突变带下划线

SEQ ID NO 26

MKRNYILGLAIGITSVGYGIIDYETRDVIDAGVRLFKEANVENNEGRRSKRGARRLKRRRRHRIQRVKKLLFDYNLLTDHSELSGINPYEARVKGLSQKLSEEEFSAALLHLAKRRGVHNVNEVEEDTGNELSTKEQISRNSKALEEKYVAELQLERLKKDGEVRGSINRFKTSDYVKEAKQLLKVQKAYHQLDQSFIDTYIDLLETRRTYYEGPGEGSPFGWKDIKEWYEMLMGHCTYFPEELRSVKYAYNADLYNALNDLNNLVITRDENEKLEYYEKFQIIENVFKQKKKPTLKQIAKEILVNEEDIKGYRVTSTGKPEFTNLKVYHDIKDITARKEIIENAELLDQIAKILTIYQSSEDIQEELTNLNSELTQEEIEQISNLKGYTGTHNLSLKAINLILDELWHTNDNQIAIFNRLKLVPKKVDLSQQKEIPTTLVDDFILSPVVKRSFIQSIKVINAIIKKYGLPNDIIIELAREKNSKDAQKMINEMQKRNRQTNERIEEIIRTTGKENAKYLIEKIKLHDMQEGKCLYSLEAIPLEDLLNNPFNYEVDHIIPRSVSFDNSFNNKVLVKQEEASKKGNRTPFQYLSSSDSKISYETFKKHILNLAKGKGRISKTKKEYLLEERDINRFSVQKDFINRNLVDTRYATRGLMNLLRSYFRVNNLDVKVKSINGGFTSFLRRKWKFKKERNKGYKHHAEDALIIANADFIFKEWKKLDKAKKVMENQMFEEKQAESMPEIETEQEYKEIFITPHQIKHIKDFKDYKYSHRVDKKPNRELINDTLYSTRKDDKGNTLIVNNLNGLYDKDNDKLKKLINKSPEKLLMYHHDPQTYQKLKLIMEQYGDEKNPLYKYYEETGNYLTKYSKKDNGPVIKKIKYYGNKLNAHLDITDDYPNSRNKVVKLSLKPYRFDVYLDNGVYKFVTVKNLDVIKKENYYEVNSKCYEEAKKLKKISNQAEFIASFYNNDLIKINGELYRVIGVNNDLLNRIEVNMIDITYREYLENMNDKRPPRIIKTIASKTQSIKKYSTDILGNLYEVKSKKHPQIIKKG

长度：1,053

类型：氨基酸

生物体：人工的

特征：SACAS9 D10A+N580A突变体

其他信息：突变带下划线

SEQ ID NO 27

MDKKYSIGLEIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLRKQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFESPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASAGELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKQYRSTKEVLDATLIHQSITGLYETRIDLSQLGGD

长度：1,368

类型：氨基酸

生物体：人工的

特征：SPCAS9 D10E,D1135E,R1335Q,T1337R突变体

其他信息：突变带下划线

SEQ ID NO 28

MDKKYSIGLEIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLRKQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDAIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFESPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASAGELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKQYRSTKEVLDATLIHQSITGLYETRIDLSQLGGD

长度：1,368

类型：氨基酸

生物体：人工的

特征：SPCAS9 D10E,H840A,D1135E,R1335Q,T1337R突变体

其他信息：突变带下划线

SEQ ID NO:29

MGKSGIYQIKNTLNNKVYVGSAKDFEKRWKRHFKDLEKGCHSSIKLQRSFNKHGNVFECSILEEIPYEKDLIIERENFWIKELNSKINGYNIADATFGDTCSTHPLKEEIIKKRSETVKAKMLKLGPDGRKALYSKPGSKNGRWNPETHKFCKCGVRIQTSAYTCSKCRNGGSGGTGGSGKRNYILGLDIGITSVGYGIIDYETRDVIDAGVRLFKEANVENNEGRRSKRGARRLKRRRRHRIQRVKKLLFDYNLLTDHSELSGINPYEARVKGLSQKLSEEEFSAALLHLAKRRGVHNVNEVEEDTGNELSTKEQISRNSKALEEKYVAELQLERLKKDGEVRGSINRFKTSDYVKEAKQLLKVQKAYHQLDQSFIDTYIDLLETRRTYYEGPGEGSPFGWKDIKEWYEMLMGHCTYFPEELRSVKYAYNADLYNALNDLNNLVITRDENEKLEYYEKFQIIENVFKQKKKPTLKQIAKEILVNEEDIKGYRVTSTGKPEFTNLKVYHDIKDITARKEIIENAELLDQIAKILTIYQSSEDIQEELTNLNSELTQEEIEQISNLKGYTGTHNLSLKAINLILDELWHTNDNQIAIFNRLKLVPKKVDLSQQKEIPTTLVDDFILSPVVKRSFIQSIKVINAIIKKYGLPNDIIIELAREKNSKDAQKMINEMQKRNRQTNERIEEIIRTTGKENAKYLIEKIKLHDMQEGKCLYSLEAIPLEDLLNNPFNYEVDHIIPRSVSFDNSFNNKVLVKQEENSKKGNRTPFQYLSSSDSKISYETFKKHILNLAKGKGRISKTKKEYLLEERDINRFSVQKDFINRNLVDTRYATRGLMNLLRSYFRVNNLDVKVKSINGGFTSFLRRKWKFKKERNKGYKHHAEDALIIANADFIFKEWKKLDKAKKVMENQMFEEKQAESMPEIETEQEYKEIFITPHQIKHIKDFKDYKYSHRVDKKPNRELINDTLYSTRKDDKGNTLIVNNLNGLYDKDNDKLKKLINKSPEKLLMYHHDPQTYQKLKLIMEQYGDEKNPLYKYYEETGNYLTKYSKKDNGPVIKKIKYYGNKLNAHLDITDDYPNSRNKVVKLSLKPYRFDVYLDNGVYKFVTVKNLDVIKKENYYEVNSKCYEEAKKLKKISNQAEFIASFYNNDLIKINGELYRVIGVNNDLLNRIEVNMIDITYREYLENMNDKRPPRIIKTIASKTQSIKKYSTDILGNLYEVKSKKHPQIIKKG

长度：1,232

类型：氨基酸

生物体：人工的

特征：合成多肽；Tev[WT]-saCas9[WT]

其他信息：

SEQ ID NO:30

MGKSGIYQIKNTLNNKVYVGSAKDFEKRWKRHFKDLEKGCHSSIKLQRSFNKHGNVFECSILEEIPYEKDLIIERENFWIKELNSKINGYNIADATFGDTCSTHPLKEEIIKKRSETFKAKMLKLGPDGRKALYSKPGSKNGRWNPETHKFCKCGVRIQTSAYTCSKCRNGGSGGTGGSGKRNYILGLDIGITSVGYGIIDYETRDVIDAGVRLFKEANVENNEGRRSKRGARRLKRRRRHRIQRVKKLLFDYNLLTDHSELSGINPYEARVKGLSQKLSEEEFSAALLHLAKRRGVHNVNEVEEDTGNELSTKEQISRNSKALEEKYVAELQLERLKKDGEVRGSINRFKTSDYVKEAKQLLKVQKAYHQLDQSFIDTYIDLLETRRTYYEGPGEGSPFGWKDIKEWYEMLMGHCTYFPEELRSVKYAYNADLYNALNDLNNLVITRDENEKLEYYEKFQIIENVFKQKKKPTLKQIAKEILVNEEDIKGYRVTSTGKPEFTNLKVYHDIKDITARKEIIENAELLDQIAKILTIYQSSEDIQEELTNLNSELTQEEIEQISNLKGYTGTHNLSLKAINLILDELWHTNDNQIAIFNRLKLVPKKVDLSQQKEIPTTLVDDFILSPVVKRSFIQSIKVINAIIKKYGLPNDIIIELAREKNSKDAQKMINEMQKRNRQTNERIEEIIRTTGKENAKYLIEKIKLHDMQEGKCLYSLEAIPLEDLLNNPFNYEVDHIIPRSVSFDNSFNNKVLVKQEENSKKGNRTPFQYLSSSDSKISYETFKKHILNLAKGKGRISKTKKEYLLEERDINRFSVQKDFINRNLVDTRYATRGLMNLLRSYFRVNNLDVKVKSINGGFTSFLRRKWKFKKERNKGYKHHAEDALIIANADFIFKEWKKLDKAKKVMENQMFEEKQAESMPEIETEQEYKEIFITPHQIKHIKDFKDYKYSHRVDKKPNRELINDTLYSTRKDDKGNTLIVNNLNGLYDKDNDKLKKLINKSPEKLLMYHHDPQTYQKLKLIMEQYGDEKNPLYKYYEETGNYLTKYSKKDNGPVIKKIKYYGNKLNAHLDITDDYPNSRNKVVKLSLKPYRFDVYLDNGVYKFVTVKNLDVIKKENYYEVNSKCYEEAKKLKKISNQAEFIASFYNNDLIKINGELYRVIGVNNDLLNRIEVNMIDITYREYLENMNDKRPPRIIKTIASKTQSIKKYSTDILGNLYEVKSKKHPQIIKKG

长度：1,232

类型：氨基酸

生物体：人工的

特征：合成多肽；Tev[V117F]-saCas9[WT]

其他信息：突变带下划线

SEQ ID NO:31

MGKSGIYQIKNTLNNKVYVGSAKDFEKRWKRHFKDLEKGCHSSIKLQRSFNKHGNVFECSILEEIPYEKDLIIERENFWIKELNSKINGYNIADATFGDTCSTHPLKEEIIKKRSETVKAKMLKLGPDGRKALYSRPGSKSGRWNPETHKFCKCGVRIQTSAYTCSKCRNGGSGGTGGSGKRNYILGLDIGITSVGYGIIDYETRDVIDAGVRLFKEANVENNEGRRSKRGARRLKRRRRHRIQRVKKLLFDYNLLTDHSELSGINPYEARVKGLSQKLSEEEFSAALLHLAKRRGVHNVNEVEEDTGNELSTKEQISRNSKALEEKYVAELQLERLKKDGEVRGSINRFKTSDYVKEAKQLLKVQKAYHQLDQSFIDTYIDLLETRRTYYEGPGEGSPFGWKDIKEWYEMLMGHCTYFPEELRSVKYAYNADLYNALNDLNNLVITRDENEKLEYYEKFQIIENVFKQKKKPTLKQIAKEILVNEEDIKGYRVTSTGKPEFTNLKVYHDIKDITARKEIIENAELLDQIAKILTIYQSSEDIQEELTNLNSELTQEEIEQISNLKGYTGTHNLSLKAINLILDELWHTNDNQIAIFNRLKLVPKKVDLSQQKEIPTTLVDDFILSPVVKRSFIQSIKVINAIIKKYGLPNDIIIELAREKNSKDAQKMINEMQKRNRQTNERIEEIIRTTGKENAKYLIEKIKLHDMQEGKCLYSLEAIPLEDLLNNPFNYEVDHIIPRSVSFDNSFNNKVLVKQEENSKKGNRTPFQYLSSSDSKISYETFKKHILNLAKGKGRISKTKKEYLLEERDINRFSVQKDFINRNLVDTRYATRGLMNLLRSYFRVNNLDVKVKSINGGFTSFLRRKWKFKKERNKGYKHHAEDALIIANADFIFKEWKKLDKAKKVMENQMFEEKQAESMPEIETEQEYKEIFITPHQIKHIKDFKDYKYSHRVDKKPNRELINDTLYSTRKDDKGNTLIVNNLNGLYDKDNDKLKKLINKSPEKLLMYHHDPQTYQKLKLIMEQYGDEKNPLYKYYEETGNYLTKYSKKDNGPVIKKIKYYGNKLNAHLDITDDYPNSRNKVVKLSLKPYRFDVYLDNGVYKFVTVKNLDVIKKENYYEVNSKCYEEAKKLKKISNQAEFIASFYNNDLIKINGELYRVIGVNNDLLNRIEVNMIDITYREYLENMNDKRPPRIIKTIASKTQSIKKYSTDILGNLYEVKSKKHPQIIKKG

长度：1,232

类型：氨基酸

生物体：人工的

特征：合成多肽；Tev[K135R/N140S]-saCas9[WT]

其他信息：突变带下划线

SEQ ID NO:32

MGKSGIYQIKNTLNNKVYVGSAKDFEKRWKRHFKDLEKGCHSSIKLQRSFNKHGNVFECSILEEIPYEKDLIIERENFWIKELNSKINGYNIADATFGDTCSTHPLKEEIIKKRSETFKAKMLKLGPDGRKALYSRPGSKSGRWNPETHKFCKCGVRIQTSAYTCSKCRNGGSGGTGGSGKRNYILGLDIGITSVGYGIIDYETRDVIDAGVRLFKEANVENNEGRRSKRGARRLKRRRRHRIQRVKKLLFDYNLLTDHSELSGINPYEARVKGLSQKLSEEEFSAALLHLAKRRGVHNVNEVEEDTGNELSTKEQISRNSKALEEKYVAELQLERLKKDGEVRGSINRFKTSDYVKEAKQLLKVQKAYHQLDQSFIDTYIDLLETRRTYYEGPGEGSPFGWKDIKEWYEMLMGHCTYFPEELRSVKYAYNADLYNALNDLNNLVITRDENEKLEYYEKFQIIENVFKQKKKPTLKQIAKEILVNEEDIKGYRVTSTGKPEFTNLKVYHDIKDITARKEIIENAELLDQIAKILTIYQSSEDIQEELTNLNSELTQEEIEQISNLKGYTGTHNLSLKAINLILDELWHTNDNQIAIFNRLKLVPKKVDLSQQKEIPTTLVDDFILSPVVKRSFIQSIKVINAIIKKYGLPNDIIIELAREKNSKDAQKMINEMQKRNRQTNERIEEIIRTTGKENAKYLIEKIKLHDMQEGKCLYSLEAIPLEDLLNNPFNYEVDHIIPRSVSFDNSFNNKVLVKQEENSKKGNRTPFQYLSSSDSKISYETFKKHILNLAKGKGRISKTKKEYLLEERDINRFSVQKDFINRNLVDTRYATRGLMNLLRSYFRVNNLDVKVKSINGGFTSFLRRKWKFKKERNKGYKHHAEDALIIANADFIFKEWKKLDKAKKVMENQMFEEKQAESMPEIETEQEYKEIFITPHQIKHIKDFKDYKYSHRVDKKPNRELINDTLYSTRKDDKGNTLIVNNLNGLYDKDNDKLKKLINKSPEKLLMYHHDPQTYQKLKLIMEQYGDEKNPLYKYYEETGNYLTKYSKKDNGPVIKKIKYYGNKLNAHLDITDDYPNSRNKVVKLSLKPYRFDVYLDNGVYKFVTVKNLDVIKKENYYEVNSKCYEEAKKLKKISNQAEFIASFYNNDLIKINGELYRVIGVNNDLLNRIEVNMIDITYREYLENMNDKRPPRIIKTIASKTQSIKKYSTDILGNLYEVKSKKHPQIIKKG

长度：1,232

类型：氨基酸

生物体：人工的

特征：合成多肽；Tev[V117F/K135R/N140S]-saCas9[WT]

其他信息：突变带下划线

SEQ ID NO:33

MGKSGIYQIKNTLNNKVYVGSAKDFERRWKRHFKDLEKGCHSSIKLQRSFNKHGNVFECSILEEIPYEKDLIIERENFWIKELNSKINGYNIADASFGDTCSTHPLKEEIIKKRSETVKAKMLKLGPDGRKALYSKPGSKNGRWNPETHKFCKCGVRIRTSAYTCSKCRNGGSGGTGGSGKRNYILGLDIGITSVGYGIIDYETRDVIDAGVRLFKEANVENNEGRRSKRGARRLKRRRRHRIQRVKKLLFDYNLLTDHSELSGINPYEARVKGLSQKLSEEEFSAALLHLAKRRGVHNVNEVEEDTGNELSTKEQISRNSKALEEKYVAELQLERLKKDGEVRGSINRFKTSDYVKEAKQLLKVQKAYHQLDQSFIDTYIDLLETRRTYYEGPGEGSPFGWKDIKEWYEMLMGHCTYFPEELRSVKYAYNADLYNALNDLNNLVITRDENEKLEYYEKFQIIENVFKQKKKPTLKQIAKEILVNEEDIKGYRVTSTGKPEFTNLKVYHDIKDITARKEIIENAELLDQIAKILTIYQSSEDIQEELTNLNSELTQEEIEQISNLKGYTGTHNLSLKAINLILDELWHTNDNQIAIFNRLKLVPKKVDLSQQKEIPTTLVDDFILSPVVKRSFIQSIKVINAIIKKYGLPNDIIIELAREKNSKDAQKMINEMQKRNRQTNERIEEIIRTTGKENAKYLIEKIKLHDMQEGKCLYSLEAIPLEDLLNNPFNYEVDHIIPRSVSFDNSFNNKVLVKQEENSKKGNRTPFQYLSSSDSKISYETFKKHILNLAKGKGRISKTKKEYLLEERDINRFSVQKDFINRNLVDTRYATRGLMNLLRSYFRVNNLDVKVKSINGGFTSFLRRKWKFKKERNKGYKHHAEDALIIANADFIFKEWKKLDKAKKVMENQMFEEKQAESMPEIETEQEYKEIFITPHQIKHIKDFKDYKYSHRVDKKPNRELINDTLYSTRKDDKGNTLIVNNLNGLYDKDNDKLKKLINKSPEKLLMYHHDPQTYQKLKLIMEQYGDEKNPLYKYYEETGNYLTKYSKKDNGPVIKKIKYYGNKLNAHLDITDDYPNSRNKVVKLSLKPYRFDVYLDNGVYKFVTVKNLDVIKKENYYEVNSKCYEEAKKLKKISNQAEFIASFYNNDLIKINGELYRVIGVNNDLLNRIEVNMIDITYREYLENMNDKRPPRIIKTIASKTQSIKKYSTDILGNLYEVKSKKHPQIIKKG

长度：1,232

类型：氨基酸

生物体：人工的

特征：合成多肽；Tev[K26R/T95S/Q158R]-saCas9[WT]

其他信息：突变带下划线

SEQ ID NO:34

MGKSGIYQIKNTLNNKVYVGSAKDFEKRWKRHFKDLEKGCHSSIKLQRSFNKHGNVFECSILEEIPYEKDLIIERENFWIKELNSKINGYNIADATFGDTCSTHPLKEEIIKKRSETVKAKMLKLGPDGRKALYSKPGSKNGRWNPETHKFCKCGVRIQTSAYTCSKCRNGGSGGTGGSGKRNYILGLEIGITSVGYGIIDYETRDVIDAGVRLFKEANVENNEGRRSKRGARRLKRRRRHRIQRVKKLLFDYNLLTDHSELSGINPYEARVKGLSQKLSEEEFSAALLHLAKRRGVHNVNEVEEDTGNELSTKEQISRNSKALEEKYVAELQLERLKKDGEVRGSINRFKTSDYVKEAKQLLKVQKAYHQLDQSFIDTYIDLLETRRTYYEGPGEGSPFGWKDIKEWYEMLMGHCTYFPEELRSVKYAYNADLYNALNDLNNLVITRDENEKLEYYEKFQIIENVFKQKKKPTLKQIAKEILVNEEDIKGYRVTSTGKPEFTNLKVYHDIKDITARKEIIENAELLDQIAKILTIYQSSEDIQEELTNLNSELTQEEIEQISNLKGYTGTHNLSLKAINLILDELWHTNDNQIAIFNRLKLVPKKVDLSQQKEIPTTLVDDFILSPVVKRSFIQSIKVINAIIKKYGLPNDIIIELAREKNSKDAQKMINEMQKRNRQTNERIEEIIRTTGKENAKYLIEKIKLHDMQEGKCLYSLEAIPLEDLLNNPFNYEVDHIIPRSVSFDNSFNNKVLVKQEENSKKGNRTPFQYLSSSDSKISYETFKKHILNLAKGKGRISKTKKEYLLEERDINRFSVQKDFINRNLVDTRYATRGLMNLLRSYFRVNNLDVKVKSINGGFTSFLRRKWKFKKERNKGYKHHAEDALIIANADFIFKEWKKLDKAKKVMENQMFEEKQAESMPEIETEQEYKEIFITPHQIKHIKDFKDYKYSHRVDKKPNRELINDTLYSTRKDDKGNTLIVNNLNGLYDKDNDKLKKLINKSPEKLLMYHHDPQTYQKLKLIMEQYGDEKNPLYKYYEETGNYLTKYSKKDNGPVIKKIKYYGNKLNAHLDITDDYPNSRNKVVKLSLKPYRFDVYLDNGVYKFVTVKNLDVIKKENYYEVNSKCYEEAKKLKKISNQAEFIASFYNNDLIKINGELYRVIGVNNDLLNRIEVNMIDITYREYLENMNDKRPPRIIKTIASKTQSIKKYSTDILGNLYEVKSKKHPQIIKKG

长度：1,232

类型：氨基酸

生物体：人工的

特征：合成多肽；Tev[WT]-saCas9[D10E]

其他信息：突变带下划线

SEQ ID NO:35

MGKSGIYQIKNTLNNKVYVGSAKDFEKRWKRHFKDLEKGCHSSIKLQRSFNKHGNVFECSILEEIPYEKDLIIERENFWIKELNSKINGYNIADATFGDTCSTHPLKEEIIKKRSETFKAKMLKLGPDGRKALYSKPGSKNGRWNPETHKFCKCGVRIQTSAYTCSKCRNGGSGGTGGSGKRNYILGLEIGITSVGYGIIDYETRDVIDAGVRLFKEANVENNEGRRSKRGARRLKRRRRHRIQRVKKLLFDYNLLTDHSELSGINPYEARVKGLSQKLSEEEFSAALLHLAKRRGVHNVNEVEEDTGNELSTKEQISRNSKALEEKYVAELQLERLKKDGEVRGSINRFKTSDYVKEAKQLLKVQKAYHQLDQSFIDTYIDLLETRRTYYEGPGEGSPFGWKDIKEWYEMLMGHCTYFPEELRSVKYAYNADLYNALNDLNNLVITRDENEKLEYYEKFQIIENVFKQKKKPTLKQIAKEILVNEEDIKGYRVTSTGKPEFTNLKVYHDIKDITARKEIIENAELLDQIAKILTIYQSSEDIQEELTNLNSELTQEEIEQISNLKGYTGTHNLSLKAINLILDELWHTNDNQIAIFNRLKLVPKKVDLSQQKEIPTTLVDDFILSPVVKRSFIQSIKVINAIIKKYGLPNDIIIELAREKNSKDAQKMINEMQKRNRQTNERIEEIIRTTGKENAKYLIEKIKLHDMQEGKCLYSLEAIPLEDLLNNPFNYEVDHIIPRSVSFDNSFNNKVLVKQEENSKKGNRTPFQYLSSSDSKISYETFKKHILNLAKGKGRISKTKKEYLLEERDINRFSVQKDFINRNLVDTRYATRGLMNLLRSYFRVNNLDVKVKSINGGFTSFLRRKWKFKKERNKGYKHHAEDALIIANADFIFKEWKKLDKAKKVMENQMFEEKQAESMPEIETEQEYKEIFITPHQIKHIKDFKDYKYSHRVDKKPNRELINDTLYSTRKDDKGNTLIVNNLNGLYDKDNDKLKKLINKSPEKLLMYHHDPQTYQKLKLIMEQYGDEKNPLYKYYEETGNYLTKYSKKDNGPVIKKIKYYGNKLNAHLDITDDYPNSRNKVVKLSLKPYRFDVYLDNGVYKFVTVKNLDVIKKENYYEVNSKCYEEAKKLKKISNQAEFIASFYNNDLIKINGELYRVIGVNNDLLNRIEVNMIDITYREYLENMNDKRPPRIIKTIASKTQSIKKYSTDILGNLYEVKSKKHPQIIKKG

长度：1,232

类型：氨基酸

生物体：人工的

特征：合成多肽；Tev[V117F]-saCas9[D10E]

其他信息：突变带下划线

SEQ ID NO:36

MGKSGIYQIKNTLNNKVYVGSAKDFEKRWKRHFKDLEKGCHSSIKLQRSFNKHGNVFECSILEEIPYEKDLIIERENFWIKELNSKINGYNIADATFGDTCSTHPLKEEIIKKRSETVKAKMLKLGPDGRKALYSRPGSKSGRWNPETHKFCKCGVRIQTSAYTCSKCRNGGSGGTGGSGKRNYILGLEIGITSVGYGIIDYETRDVIDAGVRLFKEANVENNEGRRSKRGARRLKRRRRHRIQRVKKLLFDYNLLTDHSELSGINPYEARVKGLSQKLSEEEFSAALLHLAKRRGVHNVNEVEEDTGNELSTKEQISRNSKALEEKYVAELQLERLKKDGEVRGSINRFKTSDYVKEAKQLLKVQKAYHQLDQSFIDTYIDLLETRRTYYEGPGEGSPFGWKDIKEWYEMLMGHCTYFPEELRSVKYAYNADLYNALNDLNNLVITRDENEKLEYYEKFQIIENVFKQKKKPTLKQIAKEILVNEEDIKGYRVTSTGKPEFTNLKVYHDIKDITARKEIIENAELLDQIAKILTIYQSSEDIQEELTNLNSELTQEEIEQISNLKGYTGTHNLSLKAINLILDELWHTNDNQIAIFNRLKLVPKKVDLSQQKEIPTTLVDDFILSPVVKRSFIQSIKVINAIIKKYGLPNDIIIELAREKNSKDAQKMINEMQKRNRQTNERIEEIIRTTGKENAKYLIEKIKLHDMQEGKCLYSLEAIPLEDLLNNPFNYEVDHIIPRSVSFDNSFNNKVLVKQEENSKKGNRTPFQYLSSSDSKISYETFKKHILNLAKGKGRISKTKKEYLLEERDINRFSVQKDFINRNLVDTRYATRGLMNLLRSYFRVNNLDVKVKSINGGFTSFLRRKWKFKKERNKGYKHHAEDALIIANADFIFKEWKKLDKAKKVMENQMFEEKQAESMPEIETEQEYKEIFITPHQIKHIKDFKDYKYSHRVDKKPNRELINDTLYSTRKDDKGNTLIVNNLNGLYDKDNDKLKKLINKSPEKLLMYHHDPQTYQKLKLIMEQYGDEKNPLYKYYEETGNYLTKYSKKDNGPVIKKIKYYGNKLNAHLDITDDYPNSRNKVVKLSLKPYRFDVYLDNGVYKFVTVKNLDVIKKENYYEVNSKCYEEAKKLKKISNQAEFIASFYNNDLIKINGELYRVIGVNNDLLNRIEVNMIDITYREYLENMNDKRPPRIIKTIASKTQSIKKYSTDILGNLYEVKSKKHPQIIKKG

长度：1,232

类型：氨基酸

生物体：人工的

特征：合成多肽；Tev[K135R/N140S]-saCas9[D10E]

其他信息：突变带下划线

SEQ ID NO:37

MGKSGIYQIKNTLNNKVYVGSAKDFEKRWKRHFKDLEKGCHSSIKLQRSFNKHGNVFECSILEEIPYEKDLIIERENFWIKELNSKINGYNIADATFGDTCSTHPLKEEIIKKRSETFKAKMLKLGPDGRKALYSRPGSKSGRWNPETHKFCKCGVRIQTSAYTCSKCRNGGSGGTGGSGKRNYILGLEIGITSVGYGIIDYETRDVIDAGVRLFKEANVENNEGRRSKRGARRLKRRRRHRIQRVKKLLFDYNLLTDHSELSGINPYEARVKGLSQKLSEEEFSAALLHLAKRRGVHNVNEVEEDTGNELSTKEQISRNSKALEEKYVAELQLERLKKDGEVRGSINRFKTSDYVKEAKQLLKVQKAYHQLDQSFIDTYIDLLETRRTYYEGPGEGSPFGWKDIKEWYEMLMGHCTYFPEELRSVKYAYNADLYNALNDLNNLVITRDENEKLEYYEKFQIIENVFKQKKKPTLKQIAKEILVNEEDIKGYRVTSTGKPEFTNLKVYHDIKDITARKEIIENAELLDQIAKILTIYQSSEDIQEELTNLNSELTQEEIEQISNLKGYTGTHNLSLKAINLILDELWHTNDNQIAIFNRLKLVPKKVDLSQQKEIPTTLVDDFILSPVVKRSFIQSIKVINAIIKKYGLPNDIIIELAREKNSKDAQKMINEMQKRNRQTNERIEEIIRTTGKENAKYLIEKIKLHDMQEGKCLYSLEAIPLEDLLNNPFNYEVDHIIPRSVSFDNSFNNKVLVKQEENSKKGNRTPFQYLSSSDSKISYETFKKHILNLAKGKGRISKTKKEYLLEERDINRFSVQKDFINRNLVDTRYATRGLMNLLRSYFRVNNLDVKVKSINGGFTSFLRRKWKFKKERNKGYKHHAEDALIIANADFIFKEWKKLDKAKKVMENQMFEEKQAESMPEIETEQEYKEIFITPHQIKHIKDFKDYKYSHRVDKKPNRELINDTLYSTRKDDKGNTLIVNNLNGLYDKDNDKLKKLINKSPEKLLMYHHDPQTYQKLKLIMEQYGDEKNPLYKYYEETGNYLTKYSKKDNGPVIKKIKYYGNKLNAHLDITDDYPNSRNKVVKLSLKPYRFDVYLDNGVYKFVTVKNLDVIKKENYYEVNSKCYEEAKKLKKISNQAEFIASFYNNDLIKINGELYRVIGVNNDLLNRIEVNMIDITYREYLENMNDKRPPRIIKTIASKTQSIKKYSTDILGNLYEVKSKKHPQIIKKG

长度：1,232

类型：氨基酸

生物体：人工的

特征：合成多肽；Tev[V117F/K135R/N140S]-saCas9[D10E]

其他信息：突变带下划线

SEQ ID NO:38

MGKSGIYQIKNTLNNKVYVGSAKDFERRWKRHFKDLEKGCHSSIKLQRSFNKHGNVFECSILEEIPYEKDLIIERENFWIKELNSKINGYNIADASFGDTCSTHPLKEEIIKKRSETVKAKMLKLGPDGRKALYSKPGSKNGRWNPETHKFCKCGVRIRTSAYTCSKCRNGGSGGTGGSGKRNYILGLEIGITSVGYGIIDYETRDVIDAGVRLFKEANVENNEGRRSKRGARRLKRRRRHRIQRVKKLLFDYNLLTDHSELSGINPYEARVKGLSQKLSEEEFSAALLHLAKRRGVHNVNEVEEDTGNELSTKEQISRNSKALEEKYVAELQLERLKKDGEVRGSINRFKTSDYVKEAKQLLKVQKAYHQLDQSFIDTYIDLLETRRTYYEGPGEGSPFGWKDIKEWYEMLMGHCTYFPEELRSVKYAYNADLYNALNDLNNLVITRDENEKLEYYEKFQIIENVFKQKKKPTLKQIAKEILVNEEDIKGYRVTSTGKPEFTNLKVYHDIKDITARKEIIENAELLDQIAKILTIYQSSEDIQEELTNLNSELTQEEIEQISNLKGYTGTHNLSLKAINLILDELWHTNDNQIAIFNRLKLVPKKVDLSQQKEIPTTLVDDFILSPVVKRSFIQSIKVINAIIKKYGLPNDIIIELAREKNSKDAQKMINEMQKRNRQTNERIEEIIRTTGKENAKYLIEKIKLHDMQEGKCLYSLEAIPLEDLLNNPFNYEVDHIIPRSVSFDNSFNNKVLVKQEENSKKGNRTPFQYLSSSDSKISYETFKKHILNLAKGKGRISKTKKEYLLEERDINRFSVQKDFINRNLVDTRYATRGLMNLLRSYFRVNNLDVKVKSINGGFTSFLRRKWKFKKERNKGYKHHAEDALIIANADFIFKEWKKLDKAKKVMENQMFEEKQAESMPEIETEQEYKEIFITPHQIKHIKDFKDYKYSHRVDKKPNRELINDTLYSTRKDDKGNTLIVNNLNGLYDKDNDKLKKLINKSPEKLLMYHHDPQTYQKLKLIMEQYGDEKNPLYKYYEETGNYLTKYSKKDNGPVIKKIKYYGNKLNAHLDITDDYPNSRNKVVKLSLKPYRFDVYLDNGVYKFVTVKNLDVIKKENYYEVNSKCYEEAKKLKKISNQAEFIASFYNNDLIKINGELYRVIGVNNDLLNRIEVNMIDITYREYLENMNDKRPPRIIKTIASKTQSIKKYSTDILGNLYEVKSKKHPQIIKKG

长度：1,232

类型：氨基酸

生物体：人工的

特征：合成多肽；Tev[K26R/T95S/Q158R]-saCas9[D10E]

其他信息：突变带下划线

SEQ ID NO:39

MGKSGIYQIKNTLNNKVYVGSAKDFEKRWKRHFKDLEKGCHSSIKLQRSFNKHGNVFECSILEEIPYEKDLIIERENFWIKELNSKINGYNIADATFGDTCSTHPLKEEIIKKRSETVKAKMLKLGPDGRKALYSKPGSKNGRWNPETHKFCKCGVRIQTSAYTCSKCRNGGSGGTGGSGKRNYILGLDIGITSVGYGIIDYETRDVIDAGVRLFKEANVENNEGRRSKRGARRLKRRRRHRIQRVKKLLFDYNLLTDHSELSGINPYEARVKGLSQKLSEEEFSAALLHLAKRRGVHNVNEVEEDTGNELSTKEQISRNSKALEEKYVAELQLERLKKDGEVRGSINRFKTSDYVKEAKQLLKVQKAYHQLDQSFIDTYIDLLETRRTYYEGPGEGSPFGWKDIKEWYEMLMGHCTYFPEELRSVKYAYNADLYNALNDLNNLVITRDENEKLEYYEKFQIIENVFKQKKKPTLKQIAKEILVNEEDIKGYRVTSTGKPEFTNLKVYHDIKDITARKEIIENAELLDQIAKILTIYQSSEDIQEELTNLNSELTQEEIEQISNLKGYTGTHNLSLKAINLILDELWHTNDNQIAIFNRLKLVPKKVDLSQQKEIPTTLVDDFILSPVVKRSFIQSIKVINAIIKKYGLPNDIIIELAREKNSKDAQKMINEMQKRNRQTNERIEEIIRTTGKENAKYLIEKIKLHDMQEGKCLYSLEAIPLEDLLNNPFNYEVDAIIPRSVSFDNSFNNKVLVKQEENSKKGNRTPFQYLSSSDSKISYETFKKHILNLAKGKGRISKTKKEYLLEERDINRFSVQKDFINRNLVDTRYATRGLMNLLRSYFRVNNLDVKVKSINGGFTSFLRRKWKFKKERNKGYKHHAEDALIIANADFIFKEWKKLDKAKKVMENQMFEEKQAESMPEIETEQEYKEIFITPHQIKHIKDFKDYKYSHRVDKKPNRELINDTLYSTRKDDKGNTLIVNNLNGLYDKDNDKLKKLINKSPEKLLMYHHDPQTYQKLKLIMEQYGDEKNPLYKYYEETGNYLTKYSKKDNGPVIKKIKYYGNKLNAHLDITDDYPNSRNKVVKLSLKPYRFDVYLDNGVYKFVTVKNLDVIKKENYYEVNSKCYEEAKKLKKISNQAEFIASFYNNDLIKINGELYRVIGVNNDLLNRIEVNMIDITYREYLENMNDKRPPRIIKTIASKTQSIKKYSTDILGNLYEVKSKKHPQIIKKG

长度：1,232

类型：氨基酸

生物体：人工的

特征：合成多肽；Tev[WT]-saCas9[H557A]

其他信息：突变带下划线

SEQ ID NO:40

MGKSGIYQIKNTLNNKVYVGSAKDFEKRWKRHFKDLEKGCHSSIKLQRSFNKHGNVFECSILEEIPYEKDLIIERENFWIKELNSKINGYNIADATFGDTCSTHPLKEEIIKKRSETFKAKMLKLGPDGRKALYSKPGSKNGRWNPETHKFCKCGVRIQTSAYTCSKCRNGGSGGTGGSGKRNYILGLDIGITSVGYGIIDYETRDVIDAGVRLFKEANVENNEGRRSKRGARRLKRRRRHRIQRVKKLLFDYNLLTDHSELSGINPYEARVKGLSQKLSEEEFSAALLHLAKRRGVHNVNEVEEDTGNELSTKEQISRNSKALEEKYVAELQLERLKKDGEVRGSINRFKTSDYVKEAKQLLKVQKAYHQLDQSFIDTYIDLLETRRTYYEGPGEGSPFGWKDIKEWYEMLMGHCTYFPEELRSVKYAYNADLYNALNDLNNLVITRDENEKLEYYEKFQIIENVFKQKKKPTLKQIAKEILVNEEDIKGYRVTSTGKPEFTNLKVYHDIKDITARKEIIENAELLDQIAKILTIYQSSEDIQEELTNLNSELTQEEIEQISNLKGYTGTHNLSLKAINLILDELWHTNDNQIAIFNRLKLVPKKVDLSQQKEIPTTLVDDFILSPVVKRSFIQSIKVINAIIKKYGLPNDIIIELAREKNSKDAQKMINEMQKRNRQTNERIEEIIRTTGKENAKYLIEKIKLHDMQEGKCLYSLEAIPLEDLLNNPFNYEVDAIIPRSVSFDNSFNNKVLVKQEENSKKGNRTPFQYLSSSDSKISYETFKKHILNLAKGKGRISKTKKEYLLEERDINRFSVQKDFINRNLVDTRYATRGLMNLLRSYFRVNNLDVKVKSINGGFTSFLRRKWKFKKERNKGYKHHAEDALIIANADFIFKEWKKLDKAKKVMENQMFEEKQAESMPEIETEQEYKEIFITPHQIKHIKDFKDYKYSHRVDKKPNRELINDTLYSTRKDDKGNTLIVNNLNGLYDKDNDKLKKLINKSPEKLLMYHHDPQTYQKLKLIMEQYGDEKNPLYKYYEETGNYLTKYSKKDNGPVIKKIKYYGNKLNAHLDITDDYPNSRNKVVKLSLKPYRFDVYLDNGVYKFVTVKNLDVIKKENYYEVNSKCYEEAKKLKKISNQAEFIASFYNNDLIKINGELYRVIGVNNDLLNRIEVNMIDITYREYLENMNDKRPPRIIKTIASKTQSIKKYSTDILGNLYEVKSKKHPQIIKKG

长度：1,232

类型：氨基酸

生物体：人工的

特征：合成多肽；Tev[V117F]-saCas9[H557A]

其他信息：突变带下划线

SEQ ID NO:41

MGKSGIYQIKNTLNNKVYVGSAKDFEKRWKRHFKDLEKGCHSSIKLQRSFNKHGNVFECSILEEIPYEKDLIIERENFWIKELNSKINGYNIADATFGDTCSTHPLKEEIIKKRSETVKAKMLKLGPDGRKALYSRPGSKSGRWNPETHKFCKCGVRIQTSAYTCSKCRNGGSGGTGGSGKRNYILGLDIGITSVGYGIIDYETRDVIDAGVRLFKEANVENNEGRRSKRGARRLKRRRRHRIQRVKKLLFDYNLLTDHSELSGINPYEARVKGLSQKLSEEEFSAALLHLAKRRGVHNVNEVEEDTGNELSTKEQISRNSKALEEKYVAELQLERLKKDGEVRGSINRFKTSDYVKEAKQLLKVQKAYHQLDQSFIDTYIDLLETRRTYYEGPGEGSPFGWKDIKEWYEMLMGHCTYFPEELRSVKYAYNADLYNALNDLNNLVITRDENEKLEYYEKFQIIENVFKQKKKPTLKQIAKEILVNEEDIKGYRVTSTGKPEFTNLKVYHDIKDITARKEIIENAELLDQIAKILTIYQSSEDIQEELTNLNSELTQEEIEQISNLKGYTGTHNLSLKAINLILDELWHTNDNQIAIFNRLKLVPKKVDLSQQKEIPTTLVDDFILSPVVKRSFIQSIKVINAIIKKYGLPNDIIIELAREKNSKDAQKMINEMQKRNRQTNERIEEIIRTTGKENAKYLIEKIKLHDMQEGKCLYSLEAIPLEDLLNNPFNYEVDAIIPRSVSFDNSFNNKVLVKQEENSKKGNRTPFQYLSSSDSKISYETFKKHILNLAKGKGRISKTKKEYLLEERDINRFSVQKDFINRNLVDTRYATRGLMNLLRSYFRVNNLDVKVKSINGGFTSFLRRKWKFKKERNKGYKHHAEDALIIANADFIFKEWKKLDKAKKVMENQMFEEKQAESMPEIETEQEYKEIFITPHQIKHIKDFKDYKYSHRVDKKPNRELINDTLYSTRKDDKGNTLIVNNLNGLYDKDNDKLKKLINKSPEKLLMYHHDPQTYQKLKLIMEQYGDEKNPLYKYYEETGNYLTKYSKKDNGPVIKKIKYYGNKLNAHLDITDDYPNSRNKVVKLSLKPYRFDVYLDNGVYKFVTVKNLDVIKKENYYEVNSKCYEEAKKLKKISNQAEFIASFYNNDLIKINGELYRVIGVNNDLLNRIEVNMIDITYREYLENMNDKRPPRIIKTIASKTQSIKKYSTDILGNLYEVKSKKHPQIIKKG

长度：1,232

类型：氨基酸

生物体：人工的

特征：合成多肽；Tev[K135R/N140S]-saCas9[H557A]

其他信息：突变带下划线

SEQ ID NO:42

MGKSGIYQIKNTLNNKVYVGSAKDFEKRWKRHFKDLEKGCHSSIKLQRSFNKHGNVFECSILEEIPYEKDLIIERENFWIKELNSKINGYNIADATFGDTCSTHPLKEEIIKKRSETFKAKMLKLGPDGRKALYSRPGSKSGRWNPETHKFCKCGVRIQTSAYTCSKCRNGGSGGTGGSGKRNYILGLDIGITSVGYGIIDYETRDVIDAGVRLFKEANVENNEGRRSKRGARRLKRRRRHRIQRVKKLLFDYNLLTDHSELSGINPYEARVKGLSQKLSEEEFSAALLHLAKRRGVHNVNEVEEDTGNELSTKEQISRNSKALEEKYVAELQLERLKKDGEVRGSINRFKTSDYVKEAKQLLKVQKAYHQLDQSFIDTYIDLLETRRTYYEGPGEGSPFGWKDIKEWYEMLMGHCTYFPEELRSVKYAYNADLYNALNDLNNLVITRDENEKLEYYEKFQIIENVFKQKKKPTLKQIAKEILVNEEDIKGYRVTSTGKPEFTNLKVYHDIKDITARKEIIENAELLDQIAKILTIYQSSEDIQEELTNLNSELTQEEIEQISNLKGYTGTHNLSLKAINLILDELWHTNDNQIAIFNRLKLVPKKVDLSQQKEIPTTLVDDFILSPVVKRSFIQSIKVINAIIKKYGLPNDIIIELAREKNSKDAQKMINEMQKRNRQTNERIEEIIRTTGKENAKYLIEKIKLHDMQEGKCLYSLEAIPLEDLLNNPFNYEVDAIIPRSVSFDNSFNNKVLVKQEENSKKGNRTPFQYLSSSDSKISYETFKKHILNLAKGKGRISKTKKEYLLEERDINRFSVQKDFINRNLVDTRYATRGLMNLLRSYFRVNNLDVKVKSINGGFTSFLRRKWKFKKERNKGYKHHAEDALIIANADFIFKEWKKLDKAKKVMENQMFEEKQAESMPEIETEQEYKEIFITPHQIKHIKDFKDYKYSHRVDKKPNRELINDTLYSTRKDDKGNTLIVNNLNGLYDKDNDKLKKLINKSPEKLLMYHHDPQTYQKLKLIMEQYGDEKNPLYKYYEETGNYLTKYSKKDNGPVIKKIKYYGNKLNAHLDITDDYPNSRNKVVKLSLKPYRFDVYLDNGVYKFVTVKNLDVIKKENYYEVNSKCYEEAKKLKKISNQAEFIASFYNNDLIKINGELYRVIGVNNDLLNRIEVNMIDITYREYLENMNDKRPPRIIKTIASKTQSIKKYSTDILGNLYEVKSKKHPQIIKKG

长度：1,232

类型：氨基酸

生物体：人工的

特征：合成多肽；Tev[V117F/K135R/N140S]-saCas9[H557A]

其他信息：突变带下划线

SEQ ID NO:43

MGKSGIYQIKNTLNNKVYVGSAKDFERRWKRHFKDLEKGCHSSIKLQRSFNKHGNVFECSILEEIPYEKDLIIERENFWIKELNSKINGYNIADASFGDTCSTHPLKEEIIKKRSETVKAKMLKLGPDGRKALYSKPGSKNGRWNPETHKFCKCGVRIRTSAYTCSKCRNGGSGGTGGSGKRNYILGLDIGITSVGYGIIDYETRDVIDAGVRLFKEANVENNEGRRSKRGARRLKRRRRHRIQRVKKLLFDYNLLTDHSELSGINPYEARVKGLSQKLSEEEFSAALLHLAKRRGVHNVNEVEEDTGNELSTKEQISRNSKALEEKYVAELQLERLKKDGEVRGSINRFKTSDYVKEAKQLLKVQKAYHQLDQSFIDTYIDLLETRRTYYEGPGEGSPFGWKDIKEWYEMLMGHCTYFPEELRSVKYAYNADLYNALNDLNNLVITRDENEKLEYYEKFQIIENVFKQKKKPTLKQIAKEILVNEEDIKGYRVTSTGKPEFTNLKVYHDIKDITARKEIIENAELLDQIAKILTIYQSSEDIQEELTNLNSELTQEEIEQISNLKGYTGTHNLSLKAINLILDELWHTNDNQIAIFNRLKLVPKKVDLSQQKEIPTTLVDDFILSPVVKRSFIQSIKVINAIIKKYGLPNDIIIELAREKNSKDAQKMINEMQKRNRQTNERIEEIIRTTGKENAKYLIEKIKLHDMQEGKCLYSLEAIPLEDLLNNPFNYEVDAIIPRSVSFDNSFNNKVLVKQEENSKKGNRTPFQYLSSSDSKISYETFKKHILNLAKGKGRISKTKKEYLLEERDINRFSVQKDFINRNLVDTRYATRGLMNLLRSYFRVNNLDVKVKSINGGFTSFLRRKWKFKKERNKGYKHHAEDALIIANADFIFKEWKKLDKAKKVMENQMFEEKQAESMPEIETEQEYKEIFITPHQIKHIKDFKDYKYSHRVDKKPNRELINDTLYSTRKDDKGNTLIVNNLNGLYDKDNDKLKKLINKSPEKLLMYHHDPQTYQKLKLIMEQYGDEKNPLYKYYEETGNYLTKYSKKDNGPVIKKIKYYGNKLNAHLDITDDYPNSRNKVVKLSLKPYRFDVYLDNGVYKFVTVKNLDVIKKENYYEVNSKCYEEAKKLKKISNQAEFIASFYNNDLIKINGELYRVIGVNNDLLNRIEVNMIDITYREYLENMNDKRPPRIIKTIASKTQSIKKYSTDILGNLYEVKSKKHPQIIKKG

长度：1,232

类型：氨基酸

生物体：人工的

特征：合成多肽；Tev[K26R/T95S/Q158R]-saCas9[H557A]

其他信息：突变带下划线

SEQ ID NO:44

MGKSGIYQIKNTLNNKVYVGSAKDFEKRWKRHFKDLEKGCHSSIKLQR

SFNKHGNVFECSILEEIPYEKDLIIERENFWIKELNSKINGYNIADATFGD

TCSTHPLKEEIIKKRSETVKAKMLKLGPDGRKALYSKPGSKNGRWNPET

HKFCKCGVRIQTSAYTCSKCRNGGSGGTGGSGTQFEGFTNLYQVSKTL

RFELIPQGKTLKHIQEQGFIEEDKARNDHYKELKPIIDRIYKTYADQCLQ

LVQLDWENLSAAIDSYRKEKTEETRNALIEEQATYRNAIHDYFIGRTDN

LTDAINKRHAEIYKGLFKAELFNGKVLKQLGTVTTTEHENALLRSFDKF

TTYFSGFYENRKNVFSAEDISTAIPHRIVQDNFPKFKENCHIFTRLITAVPS

LREHFENVKKAIGIFVSTSIEEVFSFPFYNQLLTQTQIDLYNQLLGGISRE

AGTEKIKGLNEVLNLAIQKNDETAHIIASLPHRFIPLFKQILSDRNTLSFIL

EEFKSDEEVIQSFCKYKTLLRNENVLETAEALFNELNSIDLTHIFISHKKL

ETISSALCDHWDTLRNALYERRISELTGKITKSAKEKVQRSLKHEDINLQ

EIISAAGKELSEAFKQKTSEILSHAHAALDQPLPTTLKKQEEKEILKSQL

DSLLGLYHLLDWFAVDESNEVDPEFSARLTGIKLEMEPSLSFYNKARNY

ATKKPYSVEKFKLNFQMPTLASGWDVNKEKNNGAILFVKNGLYYLGI

MPKQKGRYKALSFEPTEKTSEGFDKMYYDYFPDAAKMIPKCSTQLKAV

TAHFQTHTTPILLSNNFIEPLEITKEIYDLNNPEKEPKKFQTAYAKKTGDQ

KGYREALCKWIDFTRDFLSKYTKTTSIDLSSLRPSSQYKDLGEYYAELN

PLLYHISFQRIAEKEIMDAVETGKLYLFQIYNKDFAKGHHGKPNLHTLY

WTGLFSPENLAKTSIKLNGQAELFYRPKSRMKRMAHRLGEKMLNKKL

KDQKTPIPDTLYQELYDYVNHRLSHDLSDEARALLPNVITKEVSHEIIKD

RRFTSDKFFFHVPITLNYQAANSPSKFNQRVNAYLKEHPETPIIGIDRGER

NLIYITVIDSTGKILEQRSLNTIQQFDYQKKLDNREKERVAARQAWSVV

GTIKDLKQGYLSQVIHEIVDLMIHYQAVVVLENLNFGFKSKRTGIAEKA

VYQQFEKMLIDKLNCLVLKDYPAEKVGGVLNPYQLTDQFTSFAKMGTQ

SGFLFYVPAPYTSKIDPLTGFVDPFVWKTIKNHESRKHFLEGFDFLHYDV

KTGDFILHFKMNRNLSFQRGLPGFMPAWDIVFEKNETQFDAKGTPFIAG

KRIVPVIENHRFTGRYRDLYPANELIALLEEKGIVFRDGSNILPKLLENDD

SHAIDTMVALIRSVLQMRNSNAATGEDYINSPVRDLNGVCFDSRFQNPE

WPMDADANGAYHIALKGQLLLNHLKESKDLKLQNGISNQDWLAYIQE

LRN

长度：1,486

类型：氨基酸

生物体：人工的特征：合成多肽；Tev[WT]-Cas12a[WT]

其他信息：

SEQ ID NO:45MGKSGIYQIKNTLNNKVYVGSAKDFEKRWKRHFKDLEKGCHSSIKLQRSFNKHGNVFECSILEEIPYEKDLIIERENFWIKELNSKINGYNIADATFGDTCSTHPLKEEIIKKRSETFKAKMLKLGPDGRKALYSKPGSKNGRWNPETHKFCKCGVRIQTSAYTCSKCRNGGSGGTGGSGTQFEGFTNLYQVSKTLRFELIPQGKTLKHIQEQGFIEEDKARNDHYKELKPIIDRIYKTYADQCLQLVQLDWENLSAAIDSYRKEKTEETRNALIEEQATYRNAIHDYFIGRTDNLTDAINKRHAEIYKGLFKAELFNGKVLKQLGTVTTTEHENALLRSFDKFTTYFSGFYENRKNVFSAEDISTAIPHRIVQDNFPKFKENCHIFTRLITAVPSLREHFENVKKAIGIFVSTSIEEVFSFPFYNQLLTQTQIDLYNQLLGGISREAGTEKIKGLNEVLNLAIQKNDETAHIIASLPHRFIPLFKQILSDRNTLSFILEEFKSDEEVIQSFCKYKTLLRNENVLETAEALFNELNSIDLTHIFISHKKLETISSALCDHWDTLRNALYERRISELTGKITKSAKEKVQRSLKHEDINLQEIISAAGKELSEAFKQKTSEILSHAHAALDQPLPTTLKKQEEKEILKSQLDSLLGLYHLLDWFAVDESNEVDPEFSARLTGIKLEMEPSLSFYNKARNYATKKPYSVEKFKLNFQMPTLASGWDVNKEKNNGAILFVKNGLYYLGIMPKQKGRYKALSFEPTEKTSEGFDKMYYDYFPDAAKMIPKCSTQLKAVTAHFQTHTTPILLSNNFIEPLEITKEIYDLNNPEKEPKKFQTAYAKKTGDQKGYREALCKWIDFTRDFLSKYTKTTSIDLSSLRPSSQYKDLGEYYAELNPLLYHISFQRIAEKEIMDAVETGKLYLFQIYNKDFAKGHHGKPNLHTLYWTGLFSPENLAKTSIKLNGQAELFYRPKSRMKRMAHRLGEKMLNKKLKDQKTPIPDTLYQELYDYVNHRLSHDLSDEARALLPNVITKEVSHEIIKDRRFTSDKFFFHVPITLNYQAANSPSKFNQRVNAYLKEHPETPIIGIDRGERNLIYITVIDSTGKILEQRSLNTIQQFDYQKKLDNREKERVAARQAWSVVGTIKDLKQGYLSQVIHEIVDLMIHYQAVVVLENLNFGFKSKRTGIAEKAVYQQFEKMLIDKLNCLVLKDYPAEKVGGVLNPYQLTDQFTSFAKMGTQSGFLFYVPAPYTSKIDPLTGFVDPFVWKTIKNHESRKHFLEGFDFLHYDVKTGDFILHFKMNRNLSFQRGLPGFMPAWDIVFEKNETQFDAKGTPFIAGKRIVPVIENHRFTGRYRDLYPANELIALLEEKGIVFRDGSNILPKLLENDDSHAIDTMVALIRSVLQMRNSNAATGEDYINSPVRDLNGVCFDSRFQNPEWPMDADANGAYHIALKGQLLLNHLKESKDLKLQNGISNQDWLAYIQELRN

长度：1,486

类型：氨基酸

生物体：人工的

特征：合成多肽；Tev[V117F]-Cas12a[WT]

其他信息：突变带下划线

SEQ ID NO:46

MGKSGIYQIKNTLNNKVYVGSAKDFEKRWKRHFKDLEKGCHSSIKLQRSFNKHGNVFECSILEEIPYEKDLIIERENFWIKELNSKINGYNIADATFGDTCSTHPLKEEIIKKRSETVKAKMLKLGPDGRKALYSRPGSKSGRWNPETHKFCKCGVRIQTSAYTCSKCRNGGSGGTGGSGTQFEGFTNLYQVSKTLRFELIPQGKTLKHIQEQGFIEEDKARNDHYKELKPIIDRIYKTYADQCLQLVQLDWENLSAAIDSYRKEKTEETRNALIEEQATYRNAIHDYFIGRTDNLTDAINKRHAEIYKGLFKAELFNGKVLKQLGTVTTTEHENALLRSFDKFTTYFSGFYENRKNVFSAEDISTAIPHRIVQDNFPKFKENCHIFTRLITAVPSLREHFENVKKAIGIFVSTSIEEVFSFPFYNQLLTQTQIDLYNQLLGGISREAGTEKIKGLNEVLNLAIQKNDETAHIIASLPHRFIPLFKQILSDRNTLSFILEEFKSDEEVIQSFCKYKTLLRNENVLETAEALFNELNSIDLTHIFISHKKLETISSALCDHWDTLRNALYERRISELTGKITKSAKEKVQRSLKHEDINLQEIISAAGKELSEAFKQKTSEILSHAHAALDQPLPTTLKKQEEKEILKSQLDSLLGLYHLLDWFAVDESNEVDPEFSARLTGIKLEMEPSLSFYNKARNYATKKPYSVEKFKLNFQMPTLASGWDVNKEKNNGAILFVKNGLYYLGIMPKQKGRYKALSFEPTEKTSEGFDKMYYDYFPDAAKMIPKCSTQLKAVTAHFQTHTTPILLSNNFIEPLEITKEIYDLNNPEKEPKKFQTAYAKKTGDQKGYREALCKWIDFTRDFLSKYTKTTSIDLSSLRPSSQYKDLGEYYAELNPLLYHISFQRIAEKEIMDAVETGKLYLFQIYNKDFAKGHHGKPNLHTLYWTGLFSPENLAKTSIKLNGQAELFYRPKSRMKRMAHRLGEKMLNKKLKDQKTPIPDTLYQELYDYVNHRLSHDLSDEARALLPNVITKEVSHEIIKDRRFTSDKFFFHVPITLNYQAANSPSKFNQRVNAYLKEHPETPIIGIDRGERNLIYITVIDSTGKILEQRSLNTIQQFDYQKKLDNREKERVAARQAWSVVGTIKDLKQGYLSQVIHEIVDLMIHYQAVVVLENLNFGFKSKRTGIAEKAVYQQFEKMLIDKLNCLVLKDYPAEKVGGVLNPYQLTDQFTSFAKMGTQSGFLFYVPAPYTSKIDPLTGFVDPFVWKTIKNHESRKHFLEGFDFLHYDVKTGDFILHFKMNRNLSFQRGLPGFMPAWDIVFEKNETQFDAKGTPFIAGKRIVPVIENHRFTGRYRDLYPANELIALLEEKGIVFRDGSNILPKLLENDDSHAIDTMVALIRSVLQMRNSNAATGEDYINSPVRDLNGVCFDSRFQNPEWPMDADANGAYHIALKGQLLLNHLKESKDLKLQNGISNQDWLAYIQELRN

长度：1,486

类型：氨基酸

生物体：人工的

特征：合成多肽；Tev[K135R/N140S]-Cas12a[WT]

其他信息：突变带下划线

SEQ ID NO:47

MGKSGIYQIKNTLNNKVYVGSAKDFEKRWKRHFKDLEKGCHSSIKLQRSFNKHGNVFECSILEEIPYEKDLIIERENFWIKELNSKINGYNIADATFGDTCSTHPLKEEIIKKRSETFKAKMLKLGPDGRKALYSRPGSKSGRWNPETHKFCKCGVRIQTSAYTCSKCRNGGSGGTGGSGTQFEGFTNLYQVSKTLRFELIPQGKTLKHIQEQGFIEEDKARNDHYKELKPIIDRIYKTYADQCLQLVQLDWENLSAAIDSYRKEKTEETRNALIEEQATYRNAIHDYFIGRTDNLTDAINKRHAEIYKGLFKAELFNGKVLKQLGTVTTTEHENALLRSFDKFTTYFSGFYENRKNVFSAEDISTAIPHRIVQDNFPKFKENCHIFTRLITAVPSLREHFENVKKAIGIFVSTSIEEVFSFPFYNQLLTQTQIDLYNQLLGGISREAGTEKIKGLNEVLNLAIQKNDETAHIIASLPHRFIPLFKQILSDRNTLSFILEEFKSDEEVIQSFCKYKTLLRNENVLETAEALFNELNSIDLTHIFISHKKLETISSALCDHWDTLRNALYERRISELTGKITKSAKEKVQRSLKHEDINLQEIISAAGKELSEAFKQKTSEILSHAHAALDQPLPTTLKKQEEKEILKSQLDSLLGLYHLLDWFAVDESNEVDPEFSARLTGIKLEMEPSLSFYNKARNYATKKPYSVEKFKLNFQMPTLASGWDVNKEKNNGAILFVKNGLYYLGIMPKQKGRYKALSFEPTEKTSEGFDKMYYDYFPDAAKMIPKCSTQLKAVTAHFQTHTTPILLSNNFIEPLEITKEIYDLNNPEKEPKKFQTAYAKKTGDQKGYREALCKWIDFTRDFLSKYTKTTSIDLSSLRPSSQYKDLGEYYAELNPLLYHISFQRIAEKEIMDAVETGKLYLFQIYNKDFAKGHHGKPNLHTLYWTGLFSPENLAKTSIKLNGQAELFYRPKSRMKRMAHRLGEKMLNKKLKDQKTPIPDTLYQELYDYVNHRLSHDLSDEARALLPNVITKEVSHEIIKDRRFTSDKFFFHVPITLNYQAANSPSKFNQRVNAYLKEHPETPIIGIDRGERNLIYITVIDSTGKILEQRSLNTIQQFDYQKKLDNREKERVAARQAWSVVGTIKDLKQGYLSQVIHEIVDLMIHYQAVVVLENLNFGFKSKRTGIAEKAVYQQFEKMLIDKLNCLVLKDYPAEKVGGVLNPYQLTDQFTSFAKMGTQSGFLFYVPAPYTSKIDPLTGFVDPFVWKTIKNHESRKHFLEGFDFLHYDVKTGDFILHFKMNRNLSFQRGLPGFMPAWDIVFEKNETQFDAKGTPFIAGKRIVPVIENHRFTGRYRDLYPANELIALLEEKGIVFRDGSNILPKLLENDDSHAIDTMVALIRSVLQMRNSNAATGEDYINSPVRDLNGVCFDSRFQNPEWPMDADANGAYHIALKGQLLLNHLKESKDLKLQNGISNQDWLAYIQELRN

长度：1,486

类型：氨基酸

生物体：人工的

特征：合成多肽；Tev[V117F/K135R/N140S]-Cas12a[WT]

其他信息：突变带下划线

SEQ ID NO:48

MGKSGIYQIKNTLNNKVYVGSAKDFERRWKRHFKDLEKGCHSSIKLQRSFNKHGNVFECSILEEIPYEKDLIIERENFWIKELNSKINGYNIADASFGDTCSTHPLKEEIIKKRSETVKAKMLKLGPDGRKALYSKPGSKNGRWNPETHKFCKCGVRIRTSAYTCSKCRNGGSGGTGGSGTQFEGFTNLYQVSKTLRFELIPQGKTLKHIQEQGFIEEDKARNDHYKELKPIIDRIYKTYADQCLQLVQLDWENLSAAIDSYRKEKTEETRNALIEEQATYRNAIHDYFIGRTDNLTDAINKRHAEIYKGLFKAELFNGKVLKQLGTVTTTEHENALLRSFDKFTTYFSGFYENRKNVFSAEDISTAIPHRIVQDNFPKFKENCHIFTRLITAVPSLREHFENVKKAIGIFVSTSIEEVFSFPFYNQLLTQTQIDLYNQLLGGISREAGTEKIKGLNEVLNLAIQKNDETAHIIASLPHRFIPLFKQILSDRNTLSFILEEFKSDEEVIQSFCKYKTLLRNENVLETAEALFNELNSIDLTHIFISHKKLETISSALCDHWDTLRNALYERRISELTGKITKSAKEKVQRSLKHEDINLQ

EIISAAGKELSEAFKQKTSEILSHAHAALDQPLPTTLKKQEEKEILKSQL

DSLLGLYHLLDWFAVDESNEVDPEFSARLTGIKLEMEPSLSFYNKARNY

ATKKPYSVEKFKLNFQMPTLASGWDVNKEKNNGAILFVKNGLYYLGI

MPKQKGRYKALSFEPTEKTSEGFDKMYYDYFPDAAKMIPKCSTQLKAV

TAHFQTHTTPILLSNNFIEPLEITKEIYDLNNPEKEPKKFQTAYAKKTGDQ

KGYREALCKWIDFTRDFLSKYTKTTSIDLSSLRPSSQYKDLGEYYAELN

PLLYHISFQRIAEKEIMDAVETGKLYLFQIYNKDFAKGHHGKPNLHTLY

WTGLFSPENLAKTSIKLNGQAELFYRPKSRMKRMAHRLGEKMLNKKL

KDQKTPIPDTLYQELYDYVNHRLSHDLSDEARALLPNVITKEVSHEIIKD

RRFTSDKFFFHVPITLNYQAANSPSKFNQRVNAYLKEHPETPIIGIDRGER

NLIYITVIDSTGKILEQRSLNTIQQFDYQKKLDNREKERVAARQAWSVV

GTIKDLKQGYLSQVIHEIVDLMIHYQAVVVLENLNFGFKSKRTGIAEKA

VYQQFEKMLIDKLNCLVLKDYPAEKVGGVLNPYQLTDQFTSFAKMGTQ

SGFLFYVPAPYTSKIDPLTGFVDPFVWKTIKNHESRKHFLEGFDFLHYDV

KTGDFILHFKMNRNLSFQRGLPGFMPAWDIVFEKNETQFDAKGTPFIAG

KRIVPVIENHRFTGRYRDLYPANELIALLEEKGIVFRDGSNILPKLLENDD

SHAIDTMVALIRSVLQMRNSNAATGEDYINSPVRDLNGVCFDSRFQNPE

WPMDADANGAYHIALKGQLLLNHLKESKDLKLQNGISNQDWLAYIQE

LRN

长度：1,486

类型：氨基酸

生物体：人工的特征：合成多肽；Tev[K26R/T95S/Q158R]-Cas12a[WT]

其他信息：突变带下划线

SEQ ID NO:49

MGKSGIYQIKNTLNNKVYVGSAKDFEKRWKRHFKDLEKGCHSSIKLQR

SFNKHGNVFECSILEEIPYEKDLIIERENFWIKELNSKINGYNIADATFGD

TCSTHPLKEEIIKKRSETVKAKMLKLGPDGRKALYSKPGSKNGRWNPET

HKFCKCGVRIQTSAYTCSKCRNGGSGGTGGSQEIKRINKIRRRLVKDSN

TKKAGKTGPMKTLLVRVMTPDLRERLENLRKKPENIPQPISNTSRANLN

KLLTDYTEMKKAILHVYWEEFQKDPVGLMSRVAQPAPKNIDQRKLIPV

KDGNERLTSSGFACSQCCQPLYVYKLEQVNDKGKPHTNYFGRCNVSEH

ERLILLSPHKPEANDELVTYSLGKFGQRALDFYSIHVTRESNHPVKPLEQ

IGGNSCASGPVGKALSDACMGAVASFLTKYQDIILEHQKVIKKNEKRLA

NLKDIASANGLAFPKITLPPQPHTKEGIEAYNNVVAQIVIWVNLNLWQK

LKIGRDEAKPLQRLKGFPSFPLVERQANEVDWWDMVCNVKKLINEKK

EDGKVFWQNLAGYKRQEALLPYLSSEEDRKKGKKFARYQFGDLLLHL

EKKHGEDWGKVYDEAWERIDKKVEGLSKHIKLEEERRSEDAQSKAAL

TDWLRAKASFVIEGLKEADKDEFCRCELKLQKWYGDLRGKPFAIEAEN

SILDISGFSKQYNCAFIWQKDGVKKLNLYLIINYFKGGKLRFKKIKPEAF

EANRFYTVINKKSGEIVPMEVNFNFDDPNLIILPLAFGKRQGREFIWNDL

LSLETGSLKLANGRVIEKTLYNRRTRQDEPALFVALTFERREVLDSSNIKP

MNLIGIDRGENIPAVIALTDPEGCPLSRFKDSLGNPTHILRIGESYKEKQR

TIQAAKEVEQRRAGGYSRKYASKAKNLADDMVRNTARDLLYYAVTQD

AMLIFENLSRGFGRQGKRTFMAERQYTRMEDWLTAKLAYEGLPSKTYL

SKTLAQYTSKTCSNCGFTITSADYDRVLEKLKKTATGWMTTINGKELK

VEGQITYYNRYKRQNVVKDLSVELDRLSEESVNNDISSWTKGRSGEAL

SLLKKRFSHRPVQEKFVCLNCGFETHADEQAALNIARSWLFLRSQEYK

KYQTNKTTGNTDKRAFVETWQSFYRKKLKEVWKPAV

长度：1,156

类型：氨基酸

生物体：人工的特征：合成多肽；Tev[WT]-CasX

其他信息：

SEQ ID NO 50

UAAUUUCUACUCUUGUAGAU

长度：20

类型：RNA

生物体：人工的特征：靶向AAVS1基因

其他信息：

SEQ ID 51[Cas12a]

TQFEGFTNLYQVSKTLRFELIPQGKTLKHIQEQGFIEEDKARNDHYKEL

KPIIDRIYKTYADQCLQLVQLDWENLSAAIDSYRKEKTEETRNALIEEQA

TYRNAIHDYFIGRTDNLTDAINKRHAEIYKGLFKAELFNGKVLKQLGTV

TTTEHENALLRSFDKFTTYFSGFYENRKNVFSAEDISTAIPHRIVQDNFP

KFKENCHIFTRLITAVPSLREHFENVKKAIGIFVSTSIEEVFSFPFYNQLLT

QTQIDLYNQLLGGISREAGTEKIKGLNEVLNLAIQKNDETAHIIASLPHRF

IPLFKQILSDRNTLSFILEEFKSDEEVIQSFCKYKTLLRNENVLETAEALF

NELNSIDLTHIFISHKKLETISSALCDHWDTLRNALYERRISELTGKITKS

AKEKVQRSLKHEDINLQEIISAAGKELSEAFKQKTSEILSHAHAALDQPL

PTTLKKQEEKEILKSQLDSLLGLYHLLDWFAVDESNEVDPEFSARLTGIK

LEMEPSLSFYNKARNYATKKPYSVEKFKLNFQMPTLASGWDVNKEKN

NGAILFVKNGLYYLGIMPKQKGRYKALSFEPTEKTSEGFDKMYYDYFP

DAAKMIPKCSTQLKAVTAHFQTHTTPILLSNNFIEPLEITKEIYDLNNPEK

EPKKFQTAYAKKTGDQKGYREALCKWIDFTRDFLSKYTKTTSIDLSSLR

PSSQYKDLGEYYAELNPLLYHISFQRIAEKEIMDAVETGKLYLFQIYNKD

FAKGHHGKPNLHTLYWTGLFSPENLAKTSIKLNGQAELFYRPKSRMKR

MAHRLGEKMLNKKLKDQKTPIPDTLYQELYDYVNHRLSHDLSDEARA

LLPNVITKEVSHEIIKDRRFTSDKFFFHVPITLNYQAANSPSKFNQRVNA

YLKEHPETPIIGIDRGERNLIYITVIDSTGKILEQRSLNTIQQFDYQKKLD

NREKERVAARQAWSVVGTIKDLKQGYLSQVIHEIVDLMIHYQAVVVLE

NLNFGFKSKRTGIAEKAVYQQFEKMLIDKLNCLVLKDYPAEKVGGVLN

PYQLTDQFTSFAKMGTQSGFLFYVPAPYTSKIDPLTGFVDPFVWKTIKN

HESRKHFLEGFDFLHYDVKTGDFILHFKMNRNLSFQRGLPGFMPAWDI

VFEKNETQFDAKGTPFIAGKRIVPVIENHRFTGRYRDLYPANELIALLEE

KGIVFRDGSNILPKLLENDDSHAIDTMVALIRSVLQMRNSNAATGEDYI

NSPVRDLNGVCFDSRFQNPEWPMDADANGAYHIALKGQLLLNHLKES

KDLKLQNGISNQDWLAYIQELRNSEQ ID 52[CasX]

QEIKRINKIRRRLVKDSNTKKAGKTGPMKTLLVRVMTPDLRERLENLRK

KPENIPQPISNTSRANLNKLLTDYTEMKKAILHVYWEEFQKDPVGLMSR

VAQPAPKNIDQRKLIPVKDGNERLTSSGFACSQCCQPLYVYKLEQVNDK

GKPHTNYFGRCNVSEHERLILLSPHKPEANDELVTYSLGKFGQRALDFY

SIHVTRESNHPVKPLEQIGGNSCASGPVGKALSDACMGAVASFLTKYQD

IILEHQKVIKKNEKRLANLKDIASANGLAFPKITLPPQPHTKEGIEAYNN

VVAQIVIWVNLNLWQKLKIGRDEAKPLQRLKGFPSFPLVERQANEVDW

WDMVCNVKKLINEKKEDGKVFWQNLAGYKRQEALLPYLSSEEDRKK

GKKFARYQFGDLLLHLEKKHGEDWGKVYDEAWERIDKKVEGLSKHIK

LEEERRSEDAQSKAALTDWLRAKASFVIEGLKEADKDEFCRCELKLQK

WYGDLRGKPFAIEAENSILDISGFSKQYNCAFIWQKDGVKKLNLYLIIN

YFKGGKLRFKKIKPEAFEANRFYTVINKKSGEIVPMEVNFNFDDPNLIIL

PLAFGKRQGREFIWNDLLSLETGSLKLANGRVIEKTLYNRRTRQDEPAL

FVALTFERREVLDSSNIKPMNLIGIDRGENIPAVIALTDPEGCPLSRFKDSL

GNPTHILRIGESYKEKQRTIQAAKEVEQRRAGGYSRKYASKAKNLADD

MVRNTARDLLYYAVTQDAMLIFENLSRGFGRQGKRTFMAERQYTRME

DWLTAKLAYEGLPSKTYLSKTLAQYTSKTCSNCGFTITSADYDRVLEKL

KKTATGWMTTINGKELKVEGQITYYNRYKRQNVVKDLSVELDRLSEES

VNNDISSWTKGRSGEALSLLKKRFSHRPVQEKFVCLNCGFETHADEQA

ALNIARSWLFLRSQEYKKYQTNKTTGNTDKRAFVETWQSFYRKKLKE

VWKPAV

SEQ ID NO:53[I-TEVI WT核酸酶结构域和接头结构域]MKSGIYQIKNTLNNKVYVGSAKDFEKRWKRHFKDLEKGCHSSIKLQRSFNKHGNVFECSILEEIPYEKDLIIERENFWIKELNSKINGYNIADATFGDTCSTHPLKEEIIKKRSETVKAKMLKLGPDGRKALYSKPGSKNGRWNPETHKFCKCGVRIQTSAYTCSKCRN

SEQ ID NO:54[CAS9 WT]

KRNYILGLDIGITSVGYGIIDYETRDVIDAGVRLFKEANVENNEGRRSKR

GARRLKRRRRHRIQRVKKLLFDYNLLTDHSELSGINPYEARVKGLSQKL

SEEEFSAALLHLAKRRGVHNVNEVEEDTGNELSTKEQISRNSKALEEKYVAELQLERLKKDGEVRGSINRFKTSDYVKEAKQLLKVQKAYHQLDQSFIDTYIDLLETRRTYYEGPGEGSPFGWKDIKEWYEMLMGHCTYFPEELRSVKYAYNADLYNALNDLNNLVITRDENEKLEYYEKFQIIENVFKQKKKPTLKQIAKEILVNEEDIKGYRVTSTGKPEFTNLKVYHDIKDITARKEIIENAELLDQIAKILTIYQSSEDIQEELTNLNSELTQEEIEQISNLKGYTGTHNLSLKAINLILDELWHTNDNQIAIFNRLKLVPKKVDLSQQKEIPTTLVDDFILSPVVKRSFIQSIKVINAIIKKYGLPNDIIIELAREKNSKDAQKMINEMQKRNRQTNERIEEIIRTTGKENAKYLIEKIKLHDMQEGKCLYSLEAIPLEDLLNNPFNYEVDHIIPRSVSFDNSFNNKVLVKQEENSKKGNRTPFQYLSSSDSKISYETFKKHILNLAKGKGRISKTKKEYLLEERDINRFSVQKDFINRNLVDTRYATRGLMNLLRSYFRVNNLDVKVKSINGGFTSFLRRKWKFKKERNKGYKHHAEDALIIANADFIFKEWKKLDKAKKVMENQMFEEKQAESMPEIETEQEYKEIFITPHQIKHIKDFKDYKYSHRVDKKPNRELINDTLYSTRKDDKGNTLIVNNLNGLYDKDNDKLKKLINKSPEKLLMYHHDPQTYQKLKLIMEQYGDEKNPLYKYYEETGNYLTKYSKKDNGPVIKKIKYYGNKLNAHLDITDDYPNSRNKVVKLSLKPYRFDVYLDNGVYKFVTVKNLDVIKKENYYEVNSKCYEEAKKLKKISNQAEFIASFYNNDLIKINGELYRVIGVNNDLLNRIEVNMIDITYREYLENMNDKRPPRIIKTIASKTQSIKKYSTDILGNLYEVKSKKHPQIIKKG

SEQ ID NO:55[SV40核定位序列]

PKKKRKV

SEQ ID NO:56[核质蛋白核定位序列]

KRPAATKKAGQAKKKK

SEQ ID NO:57[I-TevI接头片段]

DATFGDTCSTHPLKEEIIKKRSETVKAKMLKLGPDGRKALYSKPGSKNGRWNPETHKFCKCGVRIQTSAYTCSKCRN

SEQ ID 58[I-TevI核酸酶结构域]

SEQ ID 59[I-TevI接头结构域]

DATFGDTCSTHPLKEEIIKKRSETVKAKMLKLGPDGRKALYSKPGSKNGRWNPETHKFCKCGVRIQTSAYTCSKCRNGGSGGS。

Claims

1.一种制造遗传工程化细胞组合物的方法，包括向离体细胞群体施用嵌合核酸酶，所述嵌合核酸酶包含修饰的I-TevI核酸酶结构域、接头、RNA引导的核酸酶金黄色葡萄球菌(Staphylococcus aureus)Cas9结构域和引导RNA。

2.根据权利要求1所述的方法，其中所述细胞群体包括免疫细胞和多能细胞中的一种或更多种。

3.根据权利要求1所述的方法，其中所述修饰的I-TevI核酸酶结构域包括与SEQ IDNO:8至少85％、90％、95％、97％、98％、99％相同的氨基酸序列。

4.根据权利要求1至3中任一项所述的方法，其中所述修饰的I-TevI核酸酶结构域包含选自由以下组成的组的至少一个取代：T11V、V16I、N14G、E25D、K26R、R27A、E36S、K37N、G38N、C39V、S41H、L45F、F49Y、I60V和E81I。

5.根据权利要求1至3中任一项所述的方法，其中所述修饰的I-TevI核酸酶结构域包含K26R取代。

6.根据权利要求1所述的方法，其中所述修饰的I-TevI核酸酶结构域包括SEQ ID NO:8。

7.根据权利要求1至6中任一项所述的方法，其中所述接头包括与SEQ ID NO:9-14或59中任一项至少85％、90％、95％、97％、98％、99％相同的氨基酸序列。

8.根据权利要求1至6中任一项所述的方法，其中所述接头包含选自由以下组成的组的至少一个取代：T95S、S101Y、A119D、K120N、K135N、K135R、P126S、D127K、N140S、T147I、Q158R、A161V或S165G。

9.根据权利要求1至6中任一项所述的方法，其中所述接头包含选自由以下组成的组的至少一个取代：T95S、V117F、K135R、N140S或Q158R。

10.根据权利要求1至6中任一项所述的方法，其中所述接头包括选自由SEQ ID NO:9-14或59组成的组的氨基酸序列。

11.根据权利要求1至10中任一项所述的方法，其中所述RNA引导的核酸酶金黄色葡萄球菌Cas9结构域包括SEQ ID NO:15、16、26、27或28中的任一项。

12.根据权利要求1至10中任一项所述的方法，其中所述RNA引导的核酸酶金黄色葡萄球菌Cas9结构域包括与SEQ ID NO:15、16、26、27或28中的任一项至少85％、90％、95％、97％、98％、99％相同或与SEQ ID NO:15、16、26、27或28中的任一项相同的氨基酸序列。

13.根据权利要求11或12所述的方法，其中所述金黄色葡萄球菌Cas9结构域包括SEQID NO:15，具有选自由D10A、D10E、H557A、N580A、H840A、D1135E、R1335Q和T1337R组成的组的至少一个取代。

14.根据权利要求12所述的方法，其中所述RNA引导的核酸酶金黄色葡萄球菌Cas9结构域包含D10E取代。

15.根据权利要求11或12所述的方法，其中所述金黄色葡萄球菌Cas9结构域包括SEQID NO:15，具有取代D10E和选自由H557A、N580A、H840A、D1135E、R1335Q和T1337R组成的组的至少一种取代。

16.根据权利要求11或12所述的方法，其中所述金黄色葡萄球菌Cas9结构域包括SEQID NO:15，具有取代D10A和选自由H557A、N580A、H840A、D1135E、R1335Q和T1337R组成的组的至少一种取代。

17.根据权利要求11或12所述的方法，其中所述金黄色葡萄球菌Cas9结构域包括SEQID NO:15，具有取代H557A和选自由N580A、H840A、D1135E、R1335Q和T1337R组成的组的至少一种取代。

18.根据权利要求1至14中任一项所述的方法，其中所述修饰的I-TevI核酸酶结构域包括SEQ ID NO:8，所述接头包括SEQ ID NO:9-14或59中的任一种，并且所述RNA引导的核酸酶金黄色葡萄球菌Cas9结构域包括SEQ ID NO:15、16、26、27或28中的任一种。

19.根据权利要求1至14中任一项所述的方法，其中所述修饰的I-TevI核酸酶结构域包括与SEQ ID NO:8至少85％、90％、95％、97％、98％、99％相同或与SEQ ID NO:8相同的氨基酸序列，所述接头结构域包括与SEQ ID NO:9-14中的任一种至少85％、90％、95％、97％、98％、99％相同或与SEQ ID NO:9-14中的任一种相同的氨基酸序列，并且所述RNA引导的核酸酶金黄色葡萄球菌Cas9结构域包括与SEQ ID NO:15、16、26、27或28的任一种至少85％、90％、95％、97％、98％、99％相同的氨基酸序列。

20.根据权利要求1至19中任一项所述的方法，其中所述嵌合核酸酶具有针对双链DNA中的I-TevI识别位点的裂解活性。

21.根据权利要求1至19中任一项所述的方法，其中所述嵌合核酸酶被递送至靶细胞的基因组DNA。

22.根据权利要求1至21中任一项所述的方法，其中所述细胞群体包括免疫细胞。

23.根据权利要求22所述的方法，其中所述免疫细胞是T细胞。

24.根据权利要求22所述的方法，其中所述免疫细胞是自然杀伤(NK)细胞。

25.根据权利要求1至24中任一项所述的方法，其中所述细胞群体包括多能细胞。

26.根据权利要求25所述的方法，其中所述多能细胞是诱导多能细胞。

27.根据权利要求25所述的方法，其中所述多能细胞包括造血干细胞或其前体。

28.根据权利要求25所述的方法，其中所述多能细胞包括间充质干细胞或其前体。

29.根据权利要求25中任一项所述的方法，其中所述多能细胞是诱导多能细胞。

30.根据权利要求1至29中任一项所述的方法，其中使用DNA表达盒将所述嵌合核酸酶递送至所述靶细胞的基因组DNA。

31.根据权利要求1至30中任一项所述的方法，其中所述方法不使用病毒载体。

32.根据权利要求1至31中任一项所述的方法，其中使用电穿孔将所述嵌合核酸酶施用到所述离体细胞群体。

33.根据权利要求32所述的方法，其中所述电穿孔以1000至2500V的电流施加。

34.根据权利要求1至33中任一项所述的方法，还包括向所述细胞群体施用供体DNA。

35.根据权利要求34所述的方法，其中所述供体DNA包含感兴趣的外源基因。

36.根据权利要求34或35所述的方法，其中所述供体DNA包括钝端和两个核苷酸的3’突出端。

37.根据权利要求34或35所述的方法，其中所述供体DNA包含在感兴趣的外源基因侧翼的5’和3’同源物。

38.根据权利要求1至33中任一项所述的方法，其中所述嵌合核酸酶在不存在供体DNA的情况下施用。

39.根据权利要求1至38中任一项所述的方法，其中所述嵌合核酸酶修饰所述靶细胞的基因组DNA以缺失一个或更多个确定长度的基因组DNA。

40.根据权利要求36或37所述的方法，其中所述外源基因表达嵌合抗原受体。

41.根据权利要求1至37中任一项所述的方法，其中所述嵌合核酸酶靶向并裂解B2M基因、TRAC1基因、TRCB1基因、HLA-A基因或HLA-B基因。

42.根据权利要求1至37中任一项所述的方法，其中所述嵌合核酸酶的引导RNA包括SEQID NO:17或SEQ ID NO:18或其片段；其中所述嵌合核酸酶靶向并裂解B2M基因。

43.根据权利要求1至37中任一项所述的方法，其中所述嵌合核酸酶的引导RNA包括SEQID NO:20或其片段；其中所述嵌合核酸酶靶向TRCB1基因。

44.根据权利要求1至37中任一项所述的方法，其中所述嵌合核酸酶的引导RNA包括SEQID NO:21或其片段；其中所述嵌合核酸酶靶向并裂解HLA-A基因。

45.根据权利要求1至37中任一项所述的方法，其中所述嵌合核酸酶的引导RNA包括SEQID NO:22或其片段；其中所述嵌合核酸酶靶向AAVS1基因。

46.根据权利要求45所述的方法，其中所述AAVS1基因在存在外源供体DNA的情况下被靶向。

47.根据权利要求45或46所述的方法，其中所述嵌合核酸酶靶向所述AAVS1基因上的两个位点。

48.根据权利要求47所述的方法，其中所述外源供体DNA被整合在所述AAVS1基因上的两个靶向位点之间。

49.根据权利要求1至48中任一项所述的方法，其中所述引导RNA包含以下的一种或更多种：非天然核苷间键、核酸模拟物、修饰的糖部分和修饰的核碱基。

50.根据权利要求49所述的方法，其中所述非天然核苷间键包含以下的一种或更多种：硫代磷酸酯、磷酰胺酯、非磷酸二酯、杂原子、手性硫代磷酸酯、二硫代磷酸酯、磷酸三酯、氨基烷基磷酸三酯、3’-亚烷基膦酸酯、5’-亚烷基膦酸酯、手性膦酸酯、次膦酸酯、3’-氨基磷酰胺酯、氨基烷基磷酰胺酯、磷酸二胺酯、硫羰基磷酰胺酯、硫羰基烷基膦酸酯、硫羰基烷基磷酸三酯、硒磷酸酯和硼烷磷酸酯。

51.根据权利要求49所述的嵌合核酸酶，其中所述核酸模拟物包含肽核酸(PNA)、吗啉代核酸、环己烯基核酸(CeNA)或锁核酸(LNA)中的一种或更多种。

52.根据权利要求49所述的嵌合核酸酶，其中所述修饰的糖部分包含2’-O-(2-甲氧基乙基)、2’-二甲基氨基氧基乙氧基、2’-二甲基氨基乙氧基乙氧基、2’-O-甲基和2’-氟中的一种或更多种。

53.根据权利要求49所述的嵌合核酸酶，其中所述修饰的核碱基包含以下的一种或更多种：5-甲基胞嘧啶；5-羟甲基胞嘧啶；黄嘌呤；次黄嘌呤；2-氨基腺嘌呤；腺嘌呤的6-甲基衍生物；鸟嘌呤的6-甲基衍生物；腺嘌呤的2-丙基衍生物；鸟嘌呤的2-丙基衍生物；2-硫尿嘧啶；2-硫代胸腺嘧啶；2-硫代胞嘧啶；5-卤尿嘧啶；5-卤胞嘧啶；5-丙炔基尿嘧啶；5-丙炔基胞嘧啶；6-偶氮尿嘧啶；6-偶氮胞嘧啶；6-偶氮胸腺嘧啶；假尿嘧啶；4-硫尿嘧啶；8-卤素；8-氨基；8-硫醇；8-硫代烷基；8-羟基；5-卤素；5-溴；5-三氟甲基；5-取代的尿嘧啶；5-取代的胞嘧啶；7-甲基鸟嘌呤；7-甲基腺嘌呤；2-F-腺嘌呤；2-氨基腺嘌呤；8-氮杂鸟嘌呤；8-氮杂腺嘌呤；7-去氮鸟嘌呤；7-去氮腺嘌呤；3-去氮鸟嘌呤；3-去氮腺嘌呤；三环嘧啶；苯噁嗪胞苷；吩噻嗪胞苷；取代的苯噁嗪胞苷；咔唑胞苷；吡啶吲哚胞苷；7-去氮腺嘌呤；7-去氮鸟苷；2-氨基吡啶；2-吡啶酮；5-取代的嘧啶；6-氮杂嘧啶；N-2、N-6或O-6取代的嘌呤；2-氨基丙基腺嘌呤；5-丙炔基尿嘧啶；和5-丙炔基胞嘧啶。

54.一种嵌合核酸酶，包含修饰的I-TevI核酸酶结构域和/或I-TevI接头结构域和CasX多肽，其中所述嵌合核酸酶任选地包含引导RNA和/或核定位信号。

55.一种嵌合核酸酶，包含修饰的I-TevI核酸酶结构域和/或I-TevI接头结构域和Cas12多肽，其中所述嵌合核酸酶任选地包含引导RNA和/或核定位信号。

56.一种嵌合核酸酶，包含修饰的I-TevI核酸酶结构域和/或I-TevI接头结构域和Cas9多肽，其中所述嵌合核酸酶任选地包含引导RNA和/或核定位信号。

57.根据权利要求54或55所述的嵌合核酸酶，其中所述修饰的I-TevI核酸酶结构域和/或所述I-TevI接头结构域包含对应于TevI SEQ ID NO:53的K26、T95、V117、K135、N140和Q158的一个或更多个氨基酸残基处的修饰。

58.根据权利要求54至57中任一项所述的嵌合核酸酶，其中所述修饰的I-TevI核酸酶结构域和/或所述I-TevI接头结构域包含对应于TevI SEQ ID NO:53的V117的氨基酸处的氨基酸修饰。

59.根据权利要求54至57中任一项所述的嵌合核酸酶，其中所述修饰的I-TevI核酸酶结构域和/或所述I-TevI接头结构域包含对应于TevI SEQ ID NO:53的V117F的氨基酸修饰。

60.根据权利要求54至57中任一项所述的嵌合核酸酶，其中所述修饰的I-TevI核酸酶结构域和/或所述I-TevI接头结构域包含对应于SEQ ID NO:53的V117、K135和N140的氨基酸处的氨基酸修饰。

61.根据权利要求54至57中任一项所述的嵌合核酸酶，其中所述修饰的I-TevI核酸酶结构域和/或所述I-TevI接头结构域接头包含对应于SEQ ID NO:53的V117F、K135R和N140S的氨基酸修饰。

62.根据权利要求54至57中任一项所述的嵌合核酸酶，其中所述修饰的I-TevI核酸酶结构域和/或所述接头包含对应于SEQ ID NO:53的K135和N140的氨基酸处的氨基酸修饰。

63.根据权利要求54至57中任一项所述的嵌合核酸酶，其中所述修饰的I-TevI核酸酶结构域和/或所述I-TevI接头结构域包含对应于SEQ ID NO:53的K135R和N140S的氨基酸修饰。

64.根据权利要求54至57中任一项所述的嵌合核酸酶，其中所述修饰的I-TevI核酸酶结构域和/或所述I-TevI接头结构域包含对应于SEQ ID NO:53的K26、T95和Q158的氨基酸处的氨基酸修饰。

65.根据权利要求54至57中任一项所述的嵌合核酸酶，其中所述修饰的I-TevI核酸酶结构域和/或所述接头包含对应于SEQ ID NO:53的K26R、T95S和Q158R的氨基酸修饰。

66.根据权利要求54至64中任一项所述的嵌合核酸酶，其中所述修饰的I-TevI核酸酶结构域和/或所述I-TevI接头结构域包括与SEQ ID NO:53至少约85％、90％、95％、97％、98％、99％相同或与SEQ ID NO:53相同的氨基酸序列。

67.根据权利要求54至56中任一项所述的嵌合核酸酶，其中所述修饰的I-TevI核酸酶结构域包含SEQ ID NO:53的残基1-92，和任选地对应于T11V、V16I、N14G、E25D、K26R、E36S、K37N、G38N、C39V、S41H、L45F、F49Y、I60V和E81I的修饰。

68.根据权利要求54至56中任一项所述的嵌合核酸酶，其中所述I-TevI接头结构域包含SEQ ID NO:53的残基93-169，和任选地选自由T95S、S101Y、V117F、A119D、K120N、K135N、K135R、P126S、D127K、N140S、T147I、Q158R、A161V和S165G组成的组的至少一种修饰。

69.根据权利要求54至56中任一项所述的嵌合核酸酶，(a)所述修饰的I-TevI核酸酶结构域包含SEQ ID NO:53的残基1-92，和任选地对应于T11V、V16I、N14G、E25D、K26R、E36S、K37N、G38N、C39V、S41H、L45F、F49Y、I60V和E81I的修饰；和(b)所述I-TevI接头结构域包含SEQ ID NO:53的残基93-169，和任选地选自由T95S、S101Y、V117F、A119D、K120N、K135N、K135R、P126S、D127K、N140S、T147I、Q158R、A161V和S165G组成的组的至少一种修饰。

70.根据权利要求54或57至66中任一项所述的嵌合核酸酶，其中所述CasX多肽包括与SEQ ID NO:52至少约85％、90％、95％、97％、98％、99％相同或与SEQ ID NO:52相同的氨基酸序列。

71.根据权利要求54或57至66中任一项所述的嵌合核酸酶，其中所述CasX多肽来自δ变形菌纲(Deltaproteobacteria)。

72.根据权利要求55或57至66中任一项所述的嵌合核酸酶，其中所述Cas12多肽来自氨基酸球菌属物种(Acidaminococcus sp.)BV3L6。

73.根据权利要求55或57至66中任一项所述的嵌合核酸酶，其中所述Cas12多肽包括与SEQ ID NO:51至少约85％、90％、95％、97％、98％、99％相同或与SEQ ID NO:51相同的氨基酸序列。

74.根据权利要求56至66中任一项所述的嵌合核酸酶，其中所述Cas9多肽包括与SEQID NO:15至少约85％、90％、95％、97％、98％、99％相同或与SEQ ID NO:15相同的氨基酸序列。

75.根据权利要求56至66中任一项所述的嵌合核酸酶，其中所述Cas9多肽来自金黄色葡萄球菌。

76.根据权利要求56至66中任一项所述的方法，其中所述Cas9结构域包含SEQ ID NO:15，具有选自由D10A、D10E、H557A、N580A、H840A、D1135E、R1335Q和T1337R组成的组的至少一个取代。

77.根据权利要求56至66中任一项所述的嵌合核酸酶，其中所述Cas9多肽包括与SEQID NO:27或28至少约85％、90％、95％、97％、98％、99％相同或与SEQ ID NO:27或28相同的氨基酸序列。

78.根据权利要求56至66中任一项所述的嵌合核酸酶，其中所述Cas9多肽来自酿脓链球菌(Streptococcus pyogenes)。

79.根据权利要求56至66中任一项所述的方法，其中所述Cas9结构域包括野生型酿脓链球菌Cas9序列，具有选自由D10A、D10E、D1135E、R1335Q、T1337R和H840A组成的组的至少一个取代。

80.根据权利要求55至64中任一项所述的嵌合核酸酶，其中所述嵌合核酸酶具有针对双链DNA中的I-TevI识别位点的裂解活性。

81.一种嵌合核酸酶，包含修饰的I-TevI核酸酶结构域和/或I-TevI接头结构域、修饰的Cas9多肽和任选的引导RNA，其中所述修饰的I-TevI核酸酶结构域和/或I-TevI接头结构域包含对应于SEQ ID NO:53的K26R、T95S和Q158R的至少一个氨基酸修饰，并且所述修饰的Cas9多肽包含对应于SEQ ID NO:54中所列的未修饰的Cas9的或D10E的氨基酸修饰。

82.根据权利要求81所述的嵌合核酸酶，其中所述修饰的I-TevI核酸酶结构域和/或I-TevI接头结构域包括与SEQ ID NO:53至少约80％、90％、95％、97％、98％、99％相同或与SEQ ID NO:53相同的氨基酸序列。

83.根据权利要求81或82所述的嵌合核酸酶，其中所述嵌合核酸酶包含核定位信号。

84.根据权利要求81至83中任一项所述的嵌合核酸酶，其中所述Cas9多肽来自金黄色葡萄球菌。

85.根据权利要求54至84中任一项所述的嵌合核酸酶，其中所述核定位信号包括SV40核定位信号，所述SV40核定位信号包含氨基酸序列SEQ ID NO:55(PKKKRKV)。

86.根据权利要求54至84中任一项所述的嵌合核酸酶，其中所述核定位信号包括核质蛋白核定位信号，所述核质蛋白核定位信号包含氨基酸序列SEQ ID NO:56(KRPAATKKAGQAKKKK)。

87.根据权利要求54至86中任一项所述的嵌合核酸酶，其中所述修饰的I-TevI接头结构域包括与SEQ ID NO:57至少约85％、90％、95％、97％、98％、99％相同的氨基酸序列。

88.根据权利要求54至87中任一项所述的嵌合核酸酶，其中所述修饰的I-TevI核酸酶结构域包括与SEQ ID NO:58至少约85％、90％、95％、97％、98％、99％相同的氨基酸序列。

89.根据权利要求49至82中任一项所述的嵌合核酸酶，其中所述嵌合核酸酶具有针对双链DNA中I-TevI识别位点的裂解活性。

90.根据权利要求49至88中任一项所述的嵌合核酸酶，其中所述引导RNA靶向哺乳动物细胞中的基因组靶。

91.根据权利要求49至88中任一项所述的嵌合核酸酶，其中所述引导RNA靶向哺乳动物细胞中的致癌突变。

92.根据权利要求91所述的嵌合核酸酶，其中所述哺乳动物细胞是人类细胞。

93.根据权利要求49至88中任一项所述的嵌合核酸酶，其中所述引导RNA靶向细菌或病毒序列。

94.根据权利要求49至93中任一项所述的嵌合核酸酶，其中所述引导RNA包含以下的一种或更多种：非天然核苷间键、核酸模拟物、修饰的糖部分和修饰的核碱基。

95.根据权利要求94所述的嵌合核酸酶，其中所述非天然核苷间键包含以下的一种或更多种：硫代磷酸酯、磷酰胺酯、非磷酸二酯、杂原子、手性硫代磷酸酯、二硫代磷酸酯、磷酸三酯、氨基烷基磷酸三酯、3’-亚烷基膦酸酯、5’-亚烷基膦酸酯、手性膦酸酯、次膦酸酯、3’-氨基磷酰胺酯、氨基烷基磷酰胺酯、磷酸二胺酯、硫代磷酰胺酯、硫羰基烷基膦酸酯、硫羰基烷基磷酸三酯、硒磷酸酯和硼烷磷酸酯。

96.根据权利要求94所述的嵌合核酸酶，其中所述核酸模拟物包含肽核酸(PNA)、吗啉代核酸、环己烯基核酸(CeNA)或锁核酸(LNA)中的一种或更多种。

97.根据权利要求94所述的嵌合核酸酶，其中所述修饰的糖部分包含2’-O-(2-甲氧基乙基)、2’-二甲基氨基氧基乙氧基、2’-二甲基氨基乙氧基乙氧基、2’-O-甲基和2’-氟中的一种或更多种。

98.根据权利要求94所述的嵌合核酸酶，其中所述修饰的核碱基包含以下的一种或更多种：5-甲基胞嘧啶；5-羟甲基胞嘧啶；黄嘌呤；次黄嘌呤；2-氨基腺嘌呤；腺嘌呤的6-甲基衍生物；鸟嘌呤的6-甲基衍生物；腺嘌呤的2-丙基衍生物；鸟嘌呤的2-丙基衍生物；2-硫尿嘧啶；2-硫代胸腺嘧啶；2-硫代胞嘧啶；5-卤尿嘧啶；5-卤胞嘧啶；5-丙炔基尿嘧啶；5-丙炔基胞嘧啶；6-偶氮尿嘧啶；6-偶氮胞嘧啶；6-偶氮胸腺嘧啶；假尿嘧啶；4-硫尿嘧啶；8-卤素；8-氨基；8-硫醇；8-硫代烷基；8-羟基；5-卤素；5-溴；5-三氟甲基；5-取代的尿嘧啶；5-取代的胞嘧啶；7-甲基鸟嘌呤；7-甲基腺嘌呤；2-F-腺嘌呤；2-氨基腺嘌呤；8-氮杂鸟嘌呤；8-氮杂腺嘌呤；7-去氮鸟嘌呤；7-去氮腺嘌呤；3-去氮鸟嘌呤；3-去氮腺嘌呤；三环嘧啶；苯噁嗪胞苷；吩噻嗪胞苷；取代的苯噁嗪胞苷；咔唑胞苷；吡啶吲哚胞苷；7-去氮腺嘌呤；7-去氮鸟苷；2-氨基吡啶；2-吡啶酮；5-取代的嘧啶；6-氮杂嘧啶；N-2、N-6或O-6取代的嘌呤；2-氨基丙基腺嘌呤；5-丙炔基尿嘧啶；和5-丙炔基胞嘧啶。

99.一种核酸或多于一种核酸，所述核酸编码权利要求49至93中任一项的嵌合核酸酶和/或引导RNA。

100.根据权利要求99所述的核酸，其中所述嵌合核酸酶和/或所述引导RNA可操作地偶联到真核启动子、增强子或多腺苷酸化位点中的一个或更多个。

101.根据权利要求99或100所述的核酸，其中所述核酸是选自质粒、慢病毒载体、腺相关病毒载体和腺病毒载体的表达载体。

102.根据权利要求49至98中任一项所述的嵌合核酸酶，所述嵌合核酸酶被配制用于向个体施用。

103.一种组合物，包含权利要求49至98中任一项的嵌合核酸酶和药学上可接受的赋形剂、稀释剂或载体。

104.一种组合物，包含包封在脂质纳米颗粒中的权利要求49至98中任一项的嵌合核酸酶。

105.根据权利要求104所述的组合物，其中所述脂质纳米颗粒包含阳离子和/或中性脂质。