CN103097527A

CN103097527A - 用于将转基因***安全港座位的内切核酸酶的用途

Info

Publication number: CN103097527A
Application number: CN2011800192449A
Authority: CN
Inventors: O·达诺斯; A·杜克赖特
Original assignee: Cellectis SA
Current assignee: Cellectis SA
Priority date: 2010-02-26
Filing date: 2011-02-28
Publication date: 2013-05-08
Also published as: EP2539445A1; AU2011219716A1; EP2539445B1; US20130227715A1; US9290748B2; JP2013520190A; CA2791116A1; US20110239319A1; WO2011104382A1

Abstract

本发明涉及能切割位于“安全港座位”，即允许转基因的安全的表达的座位的靶序列的内切核酸酶。本发明还涉及该内切核酸酶用于将转基因***细胞，组织或个体的用途。

Description

用于将转基因***安全港座位的内切核酸酶的用途

【技术领域】

本发明涉及能切割位于“安全港座位”，即允许转基因的安全的表达的座位的靶序列的内切核酸酶。本发明还涉及该内切核酸酶用于将转基因***细胞，组织或生物的用途。

【背景技术】

【大范围核酸酶】

大范围核酸酶，也称之为寻靶内切核酸酶，是在活细胞内诱导双-链断裂和重组中使用的第1内切核酸酶（Rouet et al.PNAS 199491:6064-6068;Rouet et al.Mol Cell Biol.199414:8096-8106;Choulikaet al.Mol Cell Biol.199515:1968-1973;Puchta et al.PNAS 199693:5055-5060）。但是，它们的使用长期被它们的窄特异性限制。尽管已在过去数年鉴定几百种天然的大范围核酸酶，此多样性仍大大地不足以解释基因组复杂性，其在目标基因之内发现大范围核酸酶切割位点的概率仍极其低。这些发现凸显了对以与天然的内切核酸酶相同的选择性切割选择的序列的具有剪裁的特异性的人工内切核酸酶的需求。

大范围核酸酶作为衍生切割期望的靶序列的基因组加工工具的选择支架新出现了（Paques et al.Curr Gen Ther.20077:49-66）。允许加工具有修饰的特异性的大范围核酸酶的组合的组装过程已描述于Arnould et al.J Mol Biol.2006 355:443-458;Arnould et al.J Mol Biol.2007 371:49-65;Smith et al.NAR 200634:e149;Grizot et al.NAR2009 37:5405。简言之，这些过程依赖于具有不同于野生型大范围核酸酶的底物特异性仅少核苷酸的底物特异性的局部加工的变体的鉴定。在该蛋白中鉴定的达4组突变可然后组装进新蛋白，以便产生具有完全再设计的结合界面的新大范围核酸酶。

这些过程需要2个步骤，其中不同组的突变首先组装进切割回文靶的同源二聚体变体。2个同源二聚体可然后共表达，以便产生切割选择的非回文靶的异源二聚体大范围核酸酶。此过程的第1步骤仍是最挑战性的，且不可提前知道是否可以绝对确定度获得切割给定座位的大范围核酸酶。的确，并非所有序列等同可能被加工的大范围核酸酶切割，及在特定情况中，大范围核酸酶加工可被证明难（Galetto etal.Expert Opin Biol Ther.20099:1289-303）。

【适合于定点基因组修饰的其他酶】

已对于定点基因组修饰建议特化的酶如整合酶，重组酶，转座酶和内切核酸酶。数年来，这些酶的使用仍受到限制，由于向期望的靶位点再靶向它们的天然的特异性的挑战。的确，这些蛋白的靶位点，或具有足够的程度的序列同一性的序列，应存在于与待校正的突变相邻的序列中，或待灭活的基因之内，通常不是在这种情况中，除了在预加工的序列的情况中。会允许在基因治疗中使用这些DNA修饰酶的主要挑战依赖于再设计它们的DNA结合性质的可能性。已开发许多策略，旨在获得具有定制的底物特异性的人工蛋白。

早期使用自链霉菌属（Streptomyces）噬菌体PhiC31的整合酶用于在内源性座位中的靶向的基因转移。此酶介导通过在噬菌体附接位点（attP）和细菌附接位点（attB）之间定点反应来将噬菌体基因组重组到细菌染色体（Kuhstoss et al.J Mol Biol 1991 222:897-908;Rausch et al.NAR 1991 19:5187-5189）。此可自将attB位点携带进与attP带有部分同一性的天然基因组序列，称之为假attP位点（attP’）的质粒发生。PhiC31整合酶已用于转移几种转基因，包括hFIX，到人基因组中（Olivares et al.Nat Biotech 200220:1124-1128;Ginsburget al.Adv Genet 2005 54:179-187;Calos Curr Gene Ther 20066:633-645;Chalberg et al.J Mol Biol 2006 357:28-48;Aneja et al.JGene Med 2007 9:967-975）。其缺点是可发生整合的位点不可选择（Chalberg et al.J Mol Biol 2006 357:28-48），及不得不依赖于人基因组座位之内的假attP位点，用于精确的整合。然而主要整合位点见于第19染色体，已鉴定几百个其他整合座位（Chalberg et al.J MolBiol 2006 357:28-48）。在新近工作中，将PhiC31整合酶突变，以便增加在attP’位点整合的效率和特异性，为靶向选择的位点的加工的整合酶的开发铺了路（Keravala et al.Mol Ther 2009 17:112-120）。但是，加工的整合酶的开发落后于聚焦于靶向的重组酶和内切核酸酶***的类似努力。

定点重组酶，诸如自噬菌体P1的Cre重组酶，或自酿酒酵母（Saccharomyces cerevisiae）的Flp蛋白已用于诱导含有它们的同源位点的预加工的序列之间的重组。Cre重组酶认识及介导在2个同一的称之为loxP的34bp位点之间的重组（Abremski et al.Cell 198332:1301-1311）。许多年来，Cre来源的重组酶的限制一直是重复的loxP，或假loxP位点，必需存在，以便允许DNA在这2个位点之间整合。但是，此分子的DNA结合接口的定向进化已用于创建具有新特异性的重组酶（Buchholz et al.Nat Biotech 2001 19:1047-10使用DNA靶向酶诱导病毒序列的切除的框架。的确，用反转录病毒莫洛尼鼠白血病病毒载体***的工作显示了，当loxP位点导入综合反转录病毒载体的LTR中时，Cre的表达可导致2个loxP位点之间的全部序列的缺失（Choulika et al.J Virol 1996 70:1792-1798）。更最近，加工的Cre重组酶变体已用于自细胞切下HIV 1型原病毒（Sarkar et al.Science 2007 316:1912-1915）。重组酶再设计来靶向原病毒LTR，及用于诱导全部干扰序列的切除。加工尝试也已用Flp重组酶靶向FRT（Flp重组靶）序列来进行（Buchholzt et al.Nat Biotech 199816:657-662），及已获得认识非-天然Flp重组靶的变体（Voziyanov etal.J Mol Biol 2003 326:65-76）。但是，在当今无在非-预加工的座位中用该酶靶向的***的例。

转座子诸如Piggy Back和Sleeping Beauty可提供将序列***脊椎动物细胞的有效工具且已建议作为病毒介导的基因递送的替代，达到持久的表达（Izsvak et al.Mol ther 2004 9:147-156;Ivics et al.CurrGene Ther 2006 6:593-607;Mates et al.Nat Genet 2009 41:753-761）。转座子是基因递送的天然的手段，其中存在于DNA分子中的DNA序列通过转座酶的作用被***另一位置。加工的SB转座酶，称之为SB100X最近显示增加方法的效率（Mates et al.Nat Genet 200941:753-761）。转座在基因组水平上是随机的，例如，SB整合进TA二核苷酸（Vigdal et al.J Mol Biol 2002 323:441-452），且应因此不被认为是用于靶向的方法的工具。但是，进一步工作显示了在人细胞中，通过将转座酶催化性结构域融合到特定DNA结合结构域，由加工的转座酶介导的染色体转座的可能性（Ivics,et al.Mol Ther 200715:1137-1144），给新类别的靶向的工具的开发铺了路。

【基因治疗】

在几乎10年前通过基因治疗的几个X-SCID患者的成功的治疗是在基因治疗领域最重要的里程碑之一。此巨大的成就之后是在解决不同疾病，包括另一形式的SCID，大疱性表皮松解和利伯黑矇和其他的其他临床试验中显著成功。但是，这些初始成功长期被一系列严重的不利的事件，即X-SCID治疗的患者中白血病的呈现掩盖（Hacein-Bey-Abina et al.Science 2003 302:415-419;Hacein-Bey-Abina et al.J Clin Invest.2008 118:3132-3142;Howe et al.J Clin Invest.2008 118:3143-3150）。全部白血病的情况，但只有一例，可最终通过化学治疗治疗，及方法全局性地呈现为成功，但这些严重的不利效果凸显了当前基因治疗方法的主要风险。

由此本领域有对将基因***受试者基因组的安全的方法的需求。

这些日子开发用于治疗遗传的疾病的多数基因治疗流程基于变体等位基因与疾病-导致基因的另外的和功能拷贝的互补。在非-***组织，诸如视网膜中，递送此拷贝可使用，来源于例如，腺伴随病毒（AAV）的非整合载体实现。但是，当靶向干细胞，诸如造血干细胞（HSC）时，其命运是增殖，持续表达成为问题，及有对整合载体的需求。反转录病毒载体，其整合进基因组及随着宿主染色体复制，被证明为此目的有效，但它们的***的随机性质提起了各种关心，全部与基因表达关联。X-SCID试验中观察到的白血病的情况明显与整合位点附近的原-癌基因的活化关联。此外，转基因的不适当的表达可导致代谢或免疫学问题。最终，***可导致内源性基因的敲除。

定点整合会是病毒载体的随机整合的有希望的替代，由于其可缓和***诱变的风险（Kolb et al.Trends Biotechnol.2005 23:399-406;Porteus et al.Nat Biotechnol.2005 23:967-973;Paques et al.Curr GenTher.20077:49-66）。但是，加工用于靶向的重组的工具相对繁琐。此外，各工具具有关于活性和特异性的其固有性质。

因此，本领域有对允许转基因靶向的***基因组座位，其可被认为是用于基因添加的“安全港”的工具的需求。此外，如果此工具可用于***转基因，无论它们的序列为何，则极其有利，由此允许通过基因治疗使用相同的工具治疗多种疾病。而且，如果此工具允许将转基因以高功效***基因组，及导致转基因以高水平稳定的表达，则极其有利。

【发明概述】

本发明显著地针对以下实施方式：

实施方式1：能切割用于将转基因***个体的基因组的靶序列的变体内切核酸酶，其中

（i）所述基因组含有包含所述靶序列的座位；以及

（ii）所述靶序列位于离反转录病毒***位点（RIS）至多200kb的距离处，其中所述RIS既不与癌关联也不与异常细胞增殖关联。

实施方式2：根据实施方式1的内切核酸酶，其中所述转基因的***基本上不修饰位于靶序列附近的基因的表达。

实施方式3：根据实施方式1或2的内切核酸酶，其中所述靶序列位于离最近基因至少100kb的距离处。

实施方式4：根据实施方式1～3之任一项的内切核酸酶，其中所述RIS已在自通过由干细胞的转导的基因治疗治疗的患者的细胞中鉴定。

实施方式5：根据实施方式1～3之任一项的内切核酸酶，其中所述RIS已在自通过由造血干细胞的转导的基因治疗治疗的患者的细胞中鉴定。

实施方式6：根据实施方式1～5之任一项的内切核酸酶，其中所述内切核酸酶是寻靶内切核酸酶。

实施方式7：根据实施方式6的内切核酸酶，其中所述寻靶内切核酸酶是LAGLIDADG内切核酸酶家族的成员。

实施方式8：根据实施方式7的内切核酸酶，其中所述LAGLIDADG内切核酸酶家族的成员是I-CreI。

实施方式9：根据实施方式1～8之任一项的内切核酸酶，其中所述座位选自：人染色体6p25.1上的SH3座位，人染色体7q31.2上的SH4座位，人染色体21q21.1上的SH6座位，人染色体13q34上的SH12座位，人染色体3p12.2上的SH13座位，人第22染色体上的SH19座位，人染色体12q21.2上的SH20座位，人染色体3p24.1上的SH21座位，人染色体6p12.2上的SH33座位，人染色体2p16.1上的SH7座位和人第5染色体上的SH8座位。

实施方式10：实施方式1～9之任一项中定义的内切核酸酶用于将转基因***细胞或组织的基因组的体外或离体用途。

实施方式11：变体二聚I-CreI蛋白，其包含2个单体，所述2个单体包含与SEQ ID NO:1或SEQ ID NO:42具有至少80%同一性的序列，其中：

（i）所述二聚I-CreI蛋白能切割位于个体座位之内的靶序列，所述靶序列位于离反转录病毒***位点（RIS）至多200kb的距离处，及所述RIS既不与癌关联也不与异常细胞增殖关联；以及

（ii）所述靶序列不包含SEQ ID NO:4的序列。

实施方式12：根据实施方式11的二聚I-CreI蛋白，其中所述二聚I-CreI蛋白能切割位于人染色体6p25.1上的SH3座位之内的靶序列。

实施方式13：根据实施方式12的二聚I-CreI蛋白，其中所述靶序列包含SEQ ID NO:2的序列。

实施方式14：根据实施方式12或13的二聚I-CreI蛋白，其中所述蛋白包含：

（a）第1单体，其在SEQ ID NO:1的第30，38，70和75位包含氨基酸取代；以及

（b）第2单体，其在SEQ ID NO:1的第44，54，70和75位包含氨基酸取代。

实施方式15：根据实施方式14的二聚I-CreI蛋白，其中所述多肽包含：

（a）包含30G 38R 70D 75N 86D突变的第1单体；

（b）选自下列的第2单体：

（i）包含44A 54L 64A 70Q 75N 158R 162A突变的单体；

（ii）包含44A 54L 70Q 75Y 92R 158R 162A突变的单体；

（iii）包含4E 44A 54L 64A 70Q 75N 158R 162A突变的单体；

（iv）包含44A 54L 64A 70Q 75N 158W 162A突变的单体；

（v）包含44A 54L 70Q 75N突变的单体；

（vi）包含44A 54L 57E 70Q 75N 158R 162A突变的单体；以及

（vii）包含44V 54L 70Q 75N 77V突变的单体；

实施方式16：根据实施方式14的二聚I-CreI蛋白，其中所述多肽包含：

（a）包含30G 38R 70D 75N 81T 154G突变的第1单体；

（b）选自下列的第2单体：

（i）包含44A 54L 70Q 75N 105A 158R 162A突变的单体；

（ii）包含44A 54L 64A 70Q 75N 158R 162A突变的单体；

（iii）包含4E 44A 54L 64A 70Q 75N 158R 162A突变的单体；

（iv）包含44A 54L 64A 70Q 75N 158W 162A突变的单体；

（v）包含44A 54L 70Q 75N突变的单体；以及

（vi）包含44V 54L 70Q 75N 77V突变的单体；

实施方式17：根据实施方式14的二聚I-CreI蛋白，其中所述多肽包含：

（a）包含30G 38R 50R 70D 75N 142R突变的第1单体；

（b）选自下列的第2单体：

（i）包含44A 54L 70Q 75N 105A 158R 162A突变的单体；

（ii）包含44A 54L 64A 70Q 75N 158R 162A突变的单体；

（iii）包含44A 54L 70Q 75Y 92R 158R 162A突变的单体；

（iv）包含4E 44A 54L 64A 70Q 75N 158R 162A突变的单体；

（v）包含44A 54L 64A 70Q 75N 158W 162A突变的单体；

（vi）包含44A 54L 66C 70Q 71R 75N 151A 158R 162A突变的单体；

（vii）包含44A 54L 70Q 75N突变的单体；

（viii）包含44A 54L 57E 70Q 75N 158R 162A突变的单体；以及

（ix）包含44V 54L 70Q 75N 77V突变的单体；

实施方式18：根据实施方式11的二聚I-CreI蛋白，其中所述二聚I-CreI蛋白能切割位于人染色体7q31.2上的SH4座位之内的靶序列。

实施方式19：根据实施方式18的二聚I-CreI蛋白，其中所述靶序列包含SEQ ID NO:3的序列。

实施方式20：根据实施方式18或19的二聚I-CreI蛋白，其中所述蛋白包含：

（a）第1单体，其在SEQ ID NO:1的第24，70，75和77位包含氨基酸取代；以及

（b）第2单体，其在SEQ ID NO:1的第24，44和70位包含氨基酸取代。

实施方式21：根据实施方式20的二聚I-CreI蛋白，其中所述多肽包含：

（a）选自下列的第1单体：

（i）包含24V 44R 68Y 70S 75Y 77N突变的单体；

（ii）包含24V 68A 70S 75N 77R突变的单体；以及

（iii）包含24V 70D 75N 77R突变的单体；

（b）选自下列的第2单体：

（i）包含24V 44Y 70S突变的单体；以及

（ii）包含24V 44Y 70S 77V突变的单体。

实施方式22：根据实施方式11的二聚I-CreI蛋白，其中所述二聚I-CreI蛋白能切割位于人染色体21q21.1上的SH6座位之内的靶序列。

实施方式23：根据实施方式22的二聚I-CreI蛋白，其中所述靶序列包含SEQ ID NO:59的序列。

实施方式24：根据实施方式22或23的二聚I-CreI蛋白，其中所述蛋白包含：

（a）第1单体，其在SEQ ID NO:1的第44位，及任选地在第70和/或75位包含氨基酸取代；以及

（b）第2单体，其在SEQ ID NO:1的第28，40，44，70和75位包含氨基酸取代。

实施方式25：根据实施方式24的二聚I-CreI蛋白，其中所述多肽包含：

（a）包含44K 68T 70G 75N突变的第1单体；以及

（b）选自下列的第2单体：

（i）包含28Q 40R 44A 70L 75N 96R 111H 144S突变的单体；

（ii）包含7R 28Q 40R 44A 70L 75N 85R 103T突变的单体；

（iii）包含28Q 40R 44A 70L 75N 103S突变的单体；

（iv）包含24F 27V 28Q 40R 44A 70L 75N 99R突变的单体；

（v）包含7R 28Q 40R 44A 70L 75N 81T突变的单体；

（vi）包含7R 28Q 40R 44A 70L 75N 77V突变的单体；

（vii）包含7R 28Q 40R 44A 70L 75N 103T 121E 132V 160R突变的单体；

（viii）包含28Q 40R 44A 70L 75N突变的单体；

（ix）包含7R 28Q 40R 44A 70L 75N 103T突变的单体；以及

（x）包含28Q 34R 40R 44A 70L 75N 81V 103T 108V 160E突变的单体。

实施方式26：根据实施方式24的二聚I-CreI蛋白，其中所述多肽包含：

（a）包含44K突变，及任选地70S和/或75N突变的第1单体；以及

（b）选自下列的第2单体：

（i）包含28Q 40R 44A 70L 75N 96R 111H 144S突变的单体；

（ii）包含7R 28Q 40R 44A 70L 75N 85R 103T突变的单体；

（iii）包含28Q 40R 44A 70L 75N 103S突变的单体；

（iv）包含24F 27V 28Q 40R 44A 70L 75N 99R突变的单体；

（v）包含7R 28Q 40R 44A 70L 75N 81T突变的单体；

（vi）包含7R 28Q 40R 44A 70L 75N 103T 121E 132V 160R突变的单体；

（vii）包含7R 28Q 40R 44A 70L 75N 103T突变的单体；以及

（viii）包含28Q 34R 40R 44A 70L 75N 81V 103T 108V 160E突变的单体。

实施方式27：融合蛋白，其包含根据实施方式11～26之任一项的二聚I-CreI蛋白的单体。

实施方式28：根据实施方式27的融合蛋白，其中所述单体由包含SEQ ID NO:43的序列的肽接头连接。

实施方式29：根据实施方式27或28的融合蛋白，其中C-端单体还包含K7E和K96E突变，及其中N-端单体还包含E8K，E61R和G19S突变。

实施方式30：根据实施方式27～29之任一项的融合蛋白，其中所述融合蛋白包含选自下列的序列：SEQ ID NO:25～40和76～96。

实施方式31：核酸，其编码根据实施方式1～9之任一项的内切核酸酶或根据实施方式11～30之任一项的蛋白。

实施方式32：表达载体，其包含根据实施方式31的核酸。

实施方式33：根据实施方式32的表达载体，还包含靶向构建体，所述靶向构建体包含转基因和2个与侧接被实施方式1～9之任一项中定义的内切核酸酶或被实施方式11～30之任一项中定义的蛋白识别的靶序列的基因组序列同源的序列。

实施方式34：实施方式33的表达载体，其中所述转基因编码治疗性多肽。

实施方式35：根据实施方式32～34之任一项的表达载体，其用于基因治疗。

实施方式36：以下物质的组合：

●根据实施方式32的表达载体；以及

●包含靶向构建体的载体，所述靶向构建体包含转基因和2个与被实施方式1～9之任一项中定义的内切核酸酶或被实施方式11～30之任一项中定义的蛋白识别的靶序列的基因组序列同源的序列。

实施方式37：药物组合物，其包含：实施方式32～34之任一项中定义的表达载体或实施方式36中定义的组合，和药学有活性的载体。

实施方式38：通过基因治疗治疗个体的方法，包括给有需求的个体施用有效量的实施方式32～34之任一项中定义的表达载体或实施方式36中定义的组合。

实施方式39：获得适合于将转基因***个体的基因组的内切核酸酶的方法，包括下列步骤：

（a）选择，在所述个体的基因组之内，既不与癌关联也不与异常细胞增殖关联的反转录病毒***位点（RIS）；

（b）限定向所述RIS的上游延伸200kb和向所述RIS的下游延伸200kb的基因组区；以及

（c）鉴定能切割位于所述基因组区之内的靶序列的野生型内切核酸酶或构建变体内切核酸酶。

实施方式40：根据实施方式1～9之任一项的内切核酸酶，或根据实施方式11～30之任一项的蛋白，或根据实施方式31的核酸，或根据实施方式32～34之任一项的表达载体，或根据实施方式36的组合，用于将转基因***细胞，组织或非-人动物的基因组的用途，其中所述用途不是治疗剂。

实施方式41：实施方式40的用途，其用于制造遗传性病症的非-人动物模型。

实施方式42：实施方式40的用途，其用于产生重组蛋白。

实施方式43：非-人转基因动物，其在其基因组中包含：根据实施方式31的核酸，或根据实施方式32～34之任一项的表达载体，或根据实施方式36的组合。

【发明详述】

发明人在基因组之内鉴定了“安全港”座位，其允许通过靶向的***的转基因的安全的表达，其中（i）所述座位接近反在自通过基因治疗治疗的患者的细胞中鉴定的转录病毒***位点，及（ii）所述反转录病毒***不与癌或异常细胞增殖关联。如自以下说明和实施例立即明显，本发明的安全港座位可位于基因的内含子之内，或基因间区之内。

尤其是，发明人发现，内切核酸酶可以靶向所述用于基因添加的安全港的方式加工。

更特别，发明人加工了能识别及切割位于不同安全港座位之内的靶序列的几种I-CreI大范围核酸酶，例如SH6，SH3座位，SH4座位，SH12座位，SH13座位，SH19，SH20座位，SH21座位，SH33座位，SH7座位，SH8座位，SH18座位，SH31座位，SH38座位，SH39座位，SH41座位，SH42座位，SH43座位，SH44座位，SH45座位，SH46座位，SH47座位，SH48座位，SH49座位，SH50座位，SH51座位，SH52座位，SH70座位，SH71座位，SH72座位，SH73座位，SH74座位，SH75座位，SH101座位，SH106座位，SH107座位，SH102座位，SH105座位，SH103座位，SH104座位，SH113座位，SH109座位，SH112座位，SH108座位，SH110座位，SH114座位，SH116座位，SH111座位，SH115座位，SH121座位，SH120座位，SH122座位，SH117座位，SH118座位，SH119座位，SH123座位，SH126座位，SH128座位，SH129座位，SH124座位，SH131座位，SH125座位，SH127座位，SH130座位，SH11座位，SH17座位，SH23座位，SH34座位，SH40座位，SH53座位，SH54座位，SH55座位，SH56座位，SH57座位，SH58座位，SH59座位，SH60座位，SH61座位，SH62座位，SH65座位，SH67座位，SH68座位和SH69座位，其在本文进一步所述。

还显示，这些大范围核酸酶可有效切割它们的靶序列。

这些大范围核酸酶，以及其他酶如整合酶，重组酶和转座酶，可因此用作将转基因***安全港的工具，由此避免在基因治疗框内不利的事件诸如白血病的呈现。此外，这些大范围核酸酶，以及其他酶如整合酶，重组酶和转座酶可用于自单靶向构建体起始将任何转基因***安全港，不考虑转基因的序列。

【本发明的内切核酸酶和其用途】

本发明因此涉及：

●能切割用于将转基因***个体的基因组的靶序列的内切核酸酶，其中（i）所述基因组含有包含所述靶序列的座位，及（ii）所述靶序列位于离反转录病毒***位点（RIS）至多200kb的距离处，其中所述RIS既不与癌关联也不与异常细胞增殖关联。

●能切割用于将转基因***细胞或组织的基因组的靶序列的内切核酸酶的体外或离体用途，（i）所述基因组含有包含所述靶序列的座位，及（ii）所述靶序列位于离反转录病毒***位点（RIS）至多200kb的距离处，其中所述RIS既不与癌关联也不与异常细胞增殖关联。

●将转基因***个体的基因组的方法，包括下列步骤：（i）提供能切割靶序列的内切核酸酶，其中所述基因组含有包含所述靶序列的座位，及所述靶序列位于离反转录病毒***位点（RIS）至多200kb的距离处，其既不与癌关联也不与异常细胞增殖关联；（ii）使个体接触转基因及所述内切核酸酶，其中所述转基因被***所述个体的基因组的座位。

如本文所用，术语“内切核酸酶”指称能催化DNA或RNA分子，优选DNA分子之内的核酸之间的键的水解（切割）的任何野生型或变体酶。本发明的内切核酸酶不切割DNA或RNA分子，不考虑其序列，但在特定多核苷酸序列，还称之为“靶序列”或“靶位点”识别及切割DNA或RNA分子。称之为本发明的靶序列的靶序列被本发明的内切核酸酶识别及切割。

本发明的内切核酸酶可例如是自加工的锌-指结构域与限制酶诸如FokI（Porteus et al.Nat Biotechnol.2005 23:967-973）或化学内切核酸酶（Arimondo et al.Mol Cell Biol.2006 26:324-333;Simon et al.NAR 2008 36:3531-3538;Eisenschmidt et al.NAR 2005 33:7039-7047;Cannata et al.PNAS 2008 105:9576-9581）的催化性结构域的融合得到的寻靶内切核酸酶（Paques et al.Curr Gen Ther.2007 7:49-66），嵌合锌-指核酸酶（ZFN）。在化学内切核酸酶中，化学或肽切割物与核酸的聚合物或与识别特异性靶序列的另一DNA缀合，由此使切割活性靶向特定序列。

本发明的内切核酸酶优选是寻靶内切核酸酶，也名为大范围核酸酶。该寻靶内切核酸酶为本领域熟知（见例如Stoddard,QuarterlyReviews of Biophysics,2006,38:49–95）。寻靶内切核酸酶识别DNA靶序列及产生单链或双链断裂。寻靶内切核酸酶是高度特异性的，识别长度跨12～45bp（bp），通常长度跨14～40bp的DNA靶位点。本发明的寻靶内切核酸酶可例如对应于LAGLIDADG内切核酸酶，HNH内切核酸酶，或GIY-YIG内切核酸酶。该内切核酸酶的例包括：I-Sce I，I-Chu I，I-Cre I，I-Csm I，PI-Sce I，PI-Tli I，PI-Mtu I，I-CeuI，I-Sce II，I-Sce III，HO，PI-Civ I，PI-Ctr I，PI-Aae I，PI-Bsu I，PI-Dha I，PI-Dra I，PI-Mav I，PI-Mch I，PI-Mfu I，PI-Mfl I，PI-MgaI，PI-Mgo I，PI-Min I，PI-Mka I，PI-Mle I，PI-Mma I，PI-Msh I，PI-Msm I，PI-Mth I，PI-Mtu I，PI-Mxe I，PI-Npu I，PI-Pfu I，PI-RmaI，PI-Spb I，PI-Ssp I，PI-Fac I，PI-Mja I，PI-Pho I，PI-Tag I，PI-ThyI，PI-Tko I，PI-Tsp I，I-MsoI。

在优选的实施方式中，本发明的寻靶内切核酸酶是LAGLIDADG内切核酸酶诸如I-SceI，I-CreI，I-CeuI，I-MsoI和I-DmoI。

在最优选的实施方式中，所述LAGLIDADG内切核酸酶是I-CreI。野生型I-CreI是能切割22～24bp双链靶序列的同源二聚体寻靶内切核酸酶。I-CreI的野生型单体序列包括显示为SEQ ID NO:1的序列（其对应于pdb登录号No.1g9y的I-CreI序列）和显示为SwissProt登录号n°P05725的序列（尤其是显示为73版的序列,最后修改时间为2009年11月3日）。

在本专利申请中，I-CreI变体可在野生型I-CreI序列的第1甲硫氨酸之后包含另外的丙氨酸，及在C-端结尾处3个另外的氨基酸残基（见SEQ ID NO:42的序列和图11）。在野生型I-CreI序列的最后脯氨酸之后的这3个另外的氨基酸残基由2个另外的丙氨酸残基及1个天冬氨酸残基组成。这些另外的残基不影响酶的性质。为清楚起见，这些另外的残基不影响I-CreI或其变体中残基的编号。更特别，本文所用的编号完全指称SEQ ID NO:1的野生型I-CreI酶中残基的位置。例如，野生型I-CreI的第2残基实际上是SEQ ID NO:42的变体的第3残基，由于此变体在第1甲硫氨酸之后包含另外的丙氨酸。

在本申请中，I-CreI变体可为同源二聚体（包含2个同一单体的大范围核酸酶），异源二聚体（包含2个非-同一单体的大范围核酸酶）和单链。

本发明包括野生型（天然存在的）和变体内切核酸酶。在优选的实施方式中，本发明的内切核酸酶是“变体”内切核酸酶，即不在自然界天然地存在，及通过遗传加工或由随机诱变获得的内切核酸酶。本发明的变体内切核酸酶可例如通过将野生型，天然存在的，内切核酸酶的氨基酸序列中的至少1残基用不同氨基酸取代来获得。所述取代可例如通过定点诱变和/或由随机诱变来导入。在本发明的框架内，该变体内切核酸酶保持有功能，即它们保留识别及特别切割靶序列的能力。

本发明的变体内切核酸酶切割不同于对应的野生型内切核酸酶的靶序列的靶序列。例如，变体I-CreI内切核酸酶的靶序列不同于SEQID NO:4的序列。获得具有新特异性的该变体内切核酸酶的方法为本领域熟知。

本发明基于发现，该具有新特异性的变体内切核酸酶可用于将基因***细胞，组织或个体的基因组的“安全港”座位。

如本文所用，术语“座位”是染色体上DNA序列（例如基因）的特定物理位置。如在此说明书中使用，术语“座位”通常指称染色体上内切核酸酶的靶序列的特定物理位置。该座位，其包含被本发明的内切核酸酶识别及切割的靶序列，称之为“本发明的座位”。

理想情况下，***安全港座位应对其他基因的表达无冲击。测试这些性质是多步过程，及期望由生物信息学手段进行候选体安全港座位的第1预筛选。可由此首先鉴定靶向的***不可能导致***诱变的座位。

本发明的座位的主要特征之一是：（i）其位于在基因治疗临床试验中，自患者的细胞中观察到反转录病毒***的区，及（ii）所述反转录病毒***未相关于癌或异常细胞增殖。

的确，鉴定本发明的安全港座位的一种方式是使用由之前的基因治疗试验产生的数据。在X-SCID试验中，反转录病毒载体-运载的转基因紧邻LMO2和CCND2基因的***已显示相关于白血病。患者中载体***的追踪明显展示，在几年过程之后，携带此***的细胞数目胜过了其他修饰的细胞（Hacein-Bey-Abina et al.Science 2003302:415-9;Deichmann et al.J.of Clin.Invest.2007 117:2225-32,Cavazzana-Calvo et al.Blood 2007 109:4575-4581）。在另一临床试验中，在几个座位***被发现在2个患者中引发高增殖速度（Ott et al.Nat Med 2006 12:401-9）。在这些情况中，增殖似乎是MDS1-EVI1，PRDM16或SETBP1基因的***活化的结果。尽管起初未观察到恶性，EVII活化最终在两名患者中导致脊髓发育不良（Stein et al.,Nat.Med2010 16:198-205）。更通常，即便非致癌，自接近***子的基因的活化得到的细胞增殖可代表向恶性的第1步骤，由此导致有关安全性的潜在问题。为了更佳明白病毒载体整合的模式，及其在转化的细胞的命运上的潜在结果，已在自基因治疗试验的患者中进行反转录病毒***位点（RIS）的几个大规模研究（Mavilio et al.,Nat Med2006:1397-1402;Recchia et al.PNAS 2006:1457-62;Aiuti,et al.J ClinInvest 2007:2233-40;Schwarzwaelder et al.J Clin Invest 2007:2241-9;Deichmann et al.J Clin Invest 2007:2225-32）。未与白血病或与异常细胞增殖关联的RIS可被认为是安全港。因此，本发明的座位优选重叠或接近临床试验中鉴定的RIS，且仍不与癌或异常细胞增殖关联。

更特别，本发明的座位定义为包含位于离反转录病毒***位点（RIS）至多200，180，150，100或50kb的距离处的靶序列的座位，所述RIS既不与癌关联也不与异常细胞增殖关联。该座位称之为本发明的“安全港”座位（或本发明的座位），即对于转基因***安全的座位。

“反转录病毒***位点”（RIS）是指鉴定为在自通过用所述反转录病毒载体基因治疗治疗的患者的细胞中用于反转录病毒载体的***位点的基因组位点。该RIS为本领域熟知。它们包括但不限于Schwarzwaelder等人（J.Clin.Invest.2007117:2241），Deichmann等人（J.of Clin.Invest.2007117:2225），Aiuti等人（J.Clin.Invest.2007117:2233），Recchia等人（PNAS 2006103:1457）和Mavilio等人（Nature Medicine 12:1397,2006）中描述的那些。

“反转录病毒载体”是指源于自逆转录病毒科（retroviridae）的病毒的任何载体。

根据本发明的RIS既不与癌关联也不与异常细胞增殖关联。知道相关于白血病或异常细胞增殖的RIS为本领域熟知，和可容易排除由本领域技术人员。知道相关于白血病或异常细胞增殖的该RIS包括，例如，紧邻LMO2，CCND2，MDS1-EVI1，PRDM16和SETBP1基因的***位点。

在本发明的更优选的实施方式中，已在临床试验中，用作为干细胞的转导的细胞鉴定用于限定安全港座位的RIS。RIS可由此已在自通过由干细胞的转导的基因治疗治疗的患者的细胞中鉴定。

在本发明的另一最优选的实施方式中，已在对于SCID患者的临床试验中，用作为造血干细胞（HSC）的转导的细胞鉴定用于限定安全港座位的RIS。RIS可由此已在自通过由造血干细胞的转导的基因治疗治疗的患者的细胞中鉴定。

此外，可使用根据本发明的RIS的定义的更严格标准。

RIS之中，共同整合位点（CIS）是座位，其中RIS的表示的统计学可作为***之后细胞高增殖速度的结果解析。（Mikkers et al.,2003,Nat.Genet.32:153;Lund et al.,2002,Nat.Genet 32:160;Hemati et al.2004,PLOS Biol.2:e423;Suzuki et al.,2002,Nat.Genet.32:166-174;Deichman et al.J.of Clin.Invest.2007 117:2225-32）。例如，Deichman等人（J.of Clin.Invest.2007 117:2225-32）对自通过基因治疗治疗的9X-SCID患者的RIS进行测量，及发现了可明确地标位到人基因组的572个独特RIS。它们之中，它们定义了第2，第3，第4，第5和更高量级的CIS。第2量级的CIS被定义为在30kb距离之内2个反转录病毒***的发生，第3，第4和第5量级的CIS被定义为在50，100或200kb之内分别3，4或5个***的发生。122RIS见于47个不同CIS座位，在RIS的随机分布下预期的值的33倍。11个CIS发现定位紧邻原-癌基因，包括ZNF217，VAV-3，CCND2，LMO2，MDS1，BCL2L1，NOTCH2，SOCS2，RUNX1，RUNX3和SEPT6。

为了确保最大安全性，避免位于CIS之内的RIS可优选。因此，在本发明的优选的实施方式中，本发明的靶序列未位于CIS内。此外，所述靶序列或座位优选位于离作为共同整合位点（CIS）的部分的RIS至少50，100或200kb的距离处。

“共同整合位点”（CIS）是指30kb，50kb，100kb或200kb的基因组区，其中临床试验中鉴定的RIS过度存在（推定***的随机分布）。该CIS为本领域熟知及描述于Schwarzwaelder等人（J.Clin.Invest.2007 117:2241），Deichmann等人（J.of Clin.Invest.2007117:2225），Aiuti等人（J.Clin.Invest.2007117:2233），Recchia等人（PNAS 2006 103:1457），Mavilio等人（Nature Medicine 12:1397,2006）和Gabriel等人（Nat.Med.200915(12):143）。

除了接近RIS之外，靶向的整合进本发明的座位应不导致靶向的细胞中必要的功能的***。

因此，在本发明的特定实施方式中，***本发明的座位优选基本上不修饰位于靶序列附近的基因，例如最近基因的表达。

此外，在另一特定实施方式中，遗传元件***所述座位优选基本上不修饰所述细胞，组织或个体的表型（除了由于遗传元件的表达所致的表型）。”表型”是指细胞的，组织的或个体的可观察的特性。表型包括例如活力，细胞增殖和/或生长速率。本领域技术人员可例如通过分析相邻基因的表达模式，通过进行转录组的微-阵列研究和/或通过表征增殖和/或分化异常（如果任何）容易确证座位是本发明的安全港座位。

在仍另一特定实施方式中，本发明的座位不包含任何基因。不包含任何基因的座位指称不包含任何参考的或知道的基因的座位。在其他术语中，该座位不包含任何根据序列数据库诸如美国生物技术信息中心（NCBI）网站上可利用的那些的知道的基因。因此，本发明的靶序列和/本发明的或座位可有利地位于离最近基因至少1，5，10，25，50，100，180，200，250，300，400或500kb的距离处。

“基因”是指基本遗传单元，由沿着染色体以线性方式排列的编码特异性蛋白或蛋白段的DNA段组成。基因一般包括启动子，5’非翻译区，一个或更多编码序列（外显子），任选地内含子，3’非翻译区。基因可还包含终止子，增强子和/或沉默子。

“最近基因”是指位于分别最接近靶序列，靶序列的着丝粒和端粒的1，2或3个基因。

在优选的实施方式中，本发明的座位还允许转基因的稳定的表达。

在另一优选的实施方式中，本发明的靶序列在所述细胞，组织或个体的基因组之内仅存在一次。

一旦已选择该本发明的安全港座位，可然后（i）构建特异性识别及切割位于所述座位的之内靶序列的变体内切核酸酶，例如如在实施例1，2和5中描述，或（ii）测定是否知道的野生型内切核酸酶能切割位于所述座位之内的靶序列。或者，一旦已选择本发明的安全港座位，本领域技术人员可在其中***被知道的野生型或变体内切核酸酶识别及切割的靶序列。

因此，本发明针对获得适合于将转基因***个体的基因组的内切核酸酶的方法，包括下列步骤：

（a）选择和/或鉴定，在所述个体的基因组之内，既不与癌关联也不与异常细胞增殖关联的反转录病毒***位点（RIS）；

该内切核酸酶允许安全地将转基因***细胞，组织或个体的基因组，例如基本上不修饰地（i）最近基因的表达，和/或（ii）细胞，组织或个体的细胞增殖和/或生长速率。

当进行以上方法时，可当然应用以上提及的与本发明的座位相关的全部标准。例如，可排除作为CIS的部分的RIS，和/或在步骤（b）定义的基因组区可仅向所述RIS上游延伸50kb和向所述RIS下游延伸50kb，和/或包含靶序列的座位可不包含任何基因。

本发明的座位可例如对应于描述于下表A～C的SH3，SH4，SH6，SH12，SH13，SH19，SH20，SH21，SH33，SH7或SH8座位中的任何一个。

表A提供人基因组之内座位的位置，座位之内包含的靶序列，最接近RIS的位置以及描述RIS的出版物的引用，及切割座位的本发明的内切核酸酶的例。

表B提供有关位于本发明的座位的立即上游（在5’）和下游（在3’）的最近基因的信息。距离指示靶序列和基因的最近编码序列之间的距离。

表C和D提供与表B类似信息，但分别对于第2最近基因及对于第3最近基因。

表A’，B’，C’和D’提供类似于分别表A，B，C和D中的信息的更新的信息，对于一些座位及这些座位，即SH3，SH4，SH6，SH8和SH19之内的靶序列的关联的例。更新的定位信息通过引用人基因组组件的GRCh37/hg19版本给予。

本发明的座位也可对应于描述于下表A”～D”的SH18，SH31，SH38，SH39，SH41，SH42，SH43，SH44，SH45，SH46，SH47，SH48，SH49，SH50，SH51，SH52，SH70，SH71，SH72，SH73，SH74和SH75中的任何一个。

表A”提供人基因组之内的座位的位置，座位之内包含的靶序列，最接近RIS的位置以及描述RIS的出版物的引用，所述靶和最接近RIS之间的距离和切割座位的本发明的内切核酸酶的例。

表B”提供有关位于本发明的座位的立即上游（在5’）和下游（在3’）的最近基因的信息。距离指示靶序列和基因的最近编码序列之间的距离。

表C”和D”提供与表B”类似的信息，但分别对第2最近基因及对第3最近基因。

座位的位置，此座位内的靶和基因根据人基因组组件的GRCh37/hg19版本给予。

表A

表A’

表A”

表B

表B’

表B”

表C

表C’

表C”

表D

表D’

表D”

本发明的座位也可对应于描述于下表E和F的SH101，SH106，SH107，SH102，SH105，SH103，SH104，SH113，SH109，SH112，SH108，SH110，SH114，SH116，SH111，SH115，SH121，SH120，SH122，SH117，SH118，SH119，SH123，SH126，SH128，SH129，SH124，SH131，SH125，SH127和SH130中的任何一个。

表E提供人基因组之内的座位的位置，座位之内包含的靶序列，最接近RIS的位置以及描述RIS的出版物的引用，所述靶和最接近RIS之间的距离和切割座位的本发明的内切核酸酶的例。

表F提供有关位于本发明的座位的立即上游（在5’）和下游（在3’）的最近基因的信息。距离指示靶序列和基因的最近编码序列之间的距离。

座位的位置，此座位内的靶和基因在表E和F中根据人基因组组件的GRCh36.3/hg19版本给予。

表E

表F

名称	左基因1	Dist左Kb1	右基因1	Dist右Kb1
					SH101	PROK2	380	RYPB	213
SH106	SLC10A2	713	DAOA	1500
					SH107	SLC10A2	724	DAOA	1500
SH113	PDE7A	19	DNAJC5B	161
					SH109	RYBP	96	SHQ1	208
SH112	SND1	100	LEP	41
					SH108	TNFSF10	11	AADACL1	96
SH110	DNAH5	54	TRIO	146
					SH114	CUGBP2	120	USP6NL	5
SH116	ABCC13	66	HSPA13	3
					SH111	PRRT4	25	IMPDH1	11
SH115	LTA4H	151	ELK3	27
					SH121	MFHAS1	110	ERI1	0,37
SH120	ADAMDEC1	25	ADAM7	10
					SH122	ACE	3	KCNH6	24
SH126	TMEFF2	1500	SLC39A10	2000
					SH128	TMEFF2	1400	SLC39A10	2100
SH129	TMEFF2	1300	SLC39A10	2200
					SH124	TMEM144	145	RXFP1	122
SH131	FMOD	44	PRELP	81

本发明的座位也可对应于描述于下表G的SH125，SH127，SH130，SH102，SH105，SH103，SH104，SH117，SH118，SH119和SH123中的任何一个。

表G提供位于提及的基因的内含子的靶序列的例，及切割所述内含子座位的本发明的内切核酸酶的例。

表G

名称	座位内包含的靶序列的例:	Hit位置	基因	内含子
					SH125	ACAGGATCCAGTAAAGGAGCCGGC	内含子	GAS7	1
SH127	GCTGTACTATTTACGGTATTCAAT	内含子	WDR35	18
					SH130	ATAAACTTCGGTAAGACATCTCAA	内含子	GPR114	1
SH102	ATGAGATAATGTACAAGGTTTTGT	内含子	INPP4B	2
					SH105	CAGGGACTATTTACAAAAGATTGA	内含子	HMGA2	3
SH103	CCAAACCTAGGTAAGAGATATGAA	内含子	INPP4B	1
					SH104	TATAGATCAAGTAACAAGTGTAAT	内含子	PLXNA4	1
SH117	ACTGTATTTTGTAAAGTGTCCCTC	内含子	DNAH14	76
					SH118	TCTTCATGTTGTACCTTGTCCCCT	内含子	ABLIM2	1
SH119	ATCATCTGAGGTAAAGAGTTCTGA	内含子	MATR3	5
					SH123	GCTCTCTCTGGTACCTGATAGTGA	内含子	HPN	3

本发明的座位也可含有下表H中给予的SH11，SH12，SH13，SH17，SH19，SH20，SH21，SH23，SH33，SH34，SH40，SH53，SH54，SH55，SH56，SH57，SH58，SH59，SH60，SH61，SH62，SH65，SH67，SH68和SH69中的任何一个。

表H提供这些座位之内包含的靶序列，以及切割这些靶序列的本发明的内切核酸酶的例。

表H

在特定实施方式中，本发明的座位是SH3座位。术语“SH3座位”指称人第6染色体的位于对编码淋巴细胞抗原86的基因的约120kb着丝粒处的区（见例如www.ncbi.nlm.nih.gov/projects/mapview/maps.cgi?TAXID=9606&CHR=6&MAPS=ideogr%2Ccntg-r%2CugHs%2Cgenes&BEG=6432845&END=7232845&thmb=on,其显示第6染色体的6,430K～7,230K区），及在其他物种中的同源区。更精确地，SH3座位自显示于NC_000006.11的序列的第6850510位延伸到第6853677位。其包含SEQ ID NO:54的序列。

在另一特定实施方式中，本发明的座位是SH4座位。SH4座位在本文定义为人第7染色体的位于对含有MyoD家族抑制物结构域的座位（MDFIC）约320kb端粒处的区，或在另一物种中的同源区（见例如www.ncbi.nlm.nih.gov/projects/mapview/maps.cgi?TAXID=9606&CHR=7&MAPS=ideogr,cntg-r,ugHs,genes[113908811.00%3A114908811.00]&CMD=DN,其显示第7染色体的114,660K～115,660K区）。更精确地，SH4座位自显示于NC_000007.13的序列的第114972751位延伸到第114976380位。其包含SEQ ID NO:55的序列。

如本文所用，术语“转基因”指称编码多肽的序列。优选地，由转基因编码的多肽在***转基因的细胞，组织或个体中不表达，或表达，但无生物学活性。最优选，转基因编码个体治疗用有用的治疗性多肽。

在本发明的框内，个体可为人或非-人动物。个体优选是人。或者，个体可为非-人动物，优选脊椎动物和/或哺乳动物动物诸如例如小鼠，大鼠，兔，中国仓鼠，豚鼠或猴。本发明的细胞和组织优选来源于该人或非-人动物。

【源于I-CreI的本发明的内切核酸酶】

本发明的变体内切核酸酶可例如源于：

●野生型I-CreI大范围核酸酶，其为包含2个单体的同源二聚体蛋白，各这些单体包含SEQ ID NO:1的序列或显示于SwissProt登录n°P05725的序列；或

●包含2个单体的I-CreI大范围核酸酶，各这些单体包含SEQ IDNO:42的序列。该I-CreI大范围核酸酶，其识别野生型靶序列，已显示适合于加工具有新特异性的内切核酸酶。

因此，本发明属于二聚I-CreI蛋白，其包含2个单体，或由其组成，各单体包含与SEQ ID NO:1或SEQ ID NO:42具有至少80%，85%，86%，87%，88%，89%，90%，91%，92%，93%，94%，95%，96%，97%，98%或99%同一性的序列，或由其组成，其中所述二聚I-CreI蛋白能切割位于安全港座位之内的靶序列。

优选地，靶序列既不包含SEQ ID NO:4的序列，也不由其组成。

最优选，本发明的二聚I-CreI蛋白是异源二聚体蛋白。

说到具有与本发明的查询序列具有至少，例如，95%″同一性″的序列的蛋白，其期望蛋白序列与查询序列具有同一性，除序列可在查询序列的每各100个氨基酸包括达5个核苷酸突变之外。换言之，为获得具有与查询序列具有至少95%同一性的序列的蛋白，可***，删除或用另一核苷酸取代序列的达5%（100中的5个）的氨基酸。使用Needleman-Wunsch全局比对算法（Needleman and Wunsch,1970 J.Mol.Biol.48:443-453）的《针》程序发现2个序列的最佳比对（包括间隔），当考虑它们的全长时，可例如使用。针程序是例如在www.ebi.ac.uk可利用。根据本发明的同一性百分率可由此使用EMBOSS::针（全局）程序，用等于10.0的“Gap Open”参数，等于0.5的“Gap延伸”参数，及Blosum62矩阵来计算。

本发明的二聚I-CreI蛋白的各单体可例如相比野生型单体的序列（SEQ ID NO:1）或SEQ ID NO:42的单体包含至少，至多或约2，5，8，10，12，15，18，20或25个突变。换言之，本发明的单体包含不同于SEQ ID NO:1或SEQ ID NO:42由至少，至多或约2，5，8，10，12，15，18，20，25或30个突变的序列。

本发明的框内，突变优选对应于一个氨基酸用另一氨基酸取代。因此，本发明的优选的实施方式针对二聚I-CreI蛋白包含2个单体，或由其组成，所述单体包含与SEQ ID NO:1或SEQ ID NO:42具有至少80%同一性的序列，其中所述序列仅由氨基酸取代的存在不同于SEQ ID NO:1或SEQ ID NO:42。

本发明的单体的二聚I-CreI蛋白优选来源于包含SEQ ID NO:42的序列，或由SEQ ID NO:42的序列组成的单体。

突变优选位于涉及靶序列的识别的I-CreI序列的位置。的确，引导该突变允许设计具有新特异性的大范围核酸酶。

除了该突变之外，单体也可具有对应于下列的突变：

●改善蛋白向靶位点的结合和/或切割性质的突变，诸如例如G19S，G19A，F54L，S79G，E80K，F87L，V105A和/或I132V（见例如WO 2008/152524）；和/或

●导致获得专性异源二聚体的突变（见例如WO 2008/093249和Fajardo-Sanchez等人,Nucleic Acids Res.200836:2163-73）；和/或

●适合于产生融合蛋白的突变诸如，例如，融合蛋白的C-端单体中SEQ ID NO:1的5个最N-端氨基酸残基缺失；和/或

●由SEQ ID NO:1的第1和第2残基之间丙氨酸的***组成的突变，如在SEQ ID NO:42的单体的情况中。

除了与SEQ ID NO:1或SEQ ID NO:42同源的序列之外，本发明的单体的蛋白可包含在序列的NH₂末端和/或COOH末端添加的一个或更多氨基酸，诸如在蛋白，原肽和/或核定位信号的纯化中有用的Tag。尤其是，本发明的单体的蛋白可包含在SEQ ID NO:1的序列的COOH末端添加的AAD氨基酸，如在SEQ ID NO:42的单体的情况中。

在本说明书中，突变由SEQ ID NO:1上的位置，之后是取代位于SEQ ID NO:1的此位置的氨基酸的氨基酸的性质指示。例如，包含44A突变的单体指称I-CreI单体，其中SEQ ID NO:1的第44位的氨基酸（即谷氨酰胺,Q）用丙氨酸（A）取代。由此此单体不同于SEQID NO:1的野生型I-CreI单体至少以下氨基酸取代：Q44A。如上所解释，SEQ ID NO:42的I-CreI单体相比SEQ ID NO:1的I-CreI单体包含一些另外的氨基酸残基（见图11）。因此，在SEQ ID NO:42上，44A突变对应于在SEQ ID NO:42的第45位的谷氨酰胺用丙氨酸取代。

为例证目的，包含44A 54L 64A 70Q 75N 158R 162A突变的单体可例如具有SEQ ID NO:57的序列（当此单体直接来源于SEQ ID NO:1的I-CreI单体时）或SEQ ID NO:58的序列（当此单体直接来源于I-CreISEQ ID NO:42的单体时）。图12显示2个该单体之间的比对，及指示这些单体上44A 54L 64A 70Q 75N 158R和162A突变的位置。

本发明的二聚I-CreI蛋白的例，能切割位于SH3，SH4或SH6座位的靶序列，在以下进一步描述。

【能切割SH3座位的本发明的二聚I-CreI蛋白】

在优选的实施方式中，靶序列位于在SH3座位内（上文定义）。位于SH3之内的靶序列可例如包含SEQ ID NO:2，或SEQ ID NO:2的核苷酸2～23，或由其组成。实施例1公开能切割该靶序列的本发明的异源二聚体I-CreI蛋白的几例。此外，构建其他该蛋白的方法为本领域熟知及包括例如PCT申请WO 2006/097784，WO 2006/097853和WO 2009019614，及Arnould等人（J.Mol.Biol.,2006,355:443-458）中描述的那些。

该二聚蛋白的单体优选包含至少1，优选至少3，4，5或6个，位于选自下列的位置的氨基酸取代：SEQ ID NO:1的第4，24，26，28，30，32，33，38，44，50，54，57，64，66，70，71，75，77，81，86，92，105，142，151，154，158和162位，优选SEQ ID NO:1的第4，30，38，44，50，54，57，64，66，70，71，75，77，81，86，92，105，142，151，154，158和162位。所述取代可例如选自以下取代：4E，30G，38R，44A，50R，54L，57E，64A，66C，70Q，70D，71R，75N，75Y，77V，81T，86D，92R，105A，142R，151A，154G，158R，158W和162A。但是，二聚蛋白可任选地包含在第1位的突变，该突变对切割活性或对切割特异性无影响。

该二聚I-CreI蛋白可例如包含下列，或由下列组成：

●第1单体，其相比SEQ ID NO:1包含至少一个氨基酸取代，其中所述至少一个氨基酸取代位于选自下列的位置：SEQ ID NO:1的第30，38，50，70，75，81，86，142和154位。优选地，所述第1单体包含在下列位置的取代：SEQ ID NO:1的第30，38，70和75位。最优选，所述取代选自以下取代：30G，38R，50R，70D，75N，81T，86D，142R和154G。该单体可例如相比SEQ ID NO:1包含至少4，5或6个突变，和/或相比SEQ ID NO:1至多4，5，6，8，10，12或15个氨基酸突变；以及

●第2单体，其相比SEQ ID NO:1包含至少一个氨基酸取代，其中所述至少一个氨基酸取代位于选自下列的位置：SEQ ID NO:1的第4，44，54，57，64，66，70，71，75，77，92，105，151，158和162位。优选地，所述第2单体包含在下列位置的取代：SEQ ID NO:1的第44，54，70和75位。最优选，所述取代选自以下取代：4E，44A，54L，57E，64A，66C，70Q，71R，75N，75Y，77V，92R，105A，151A 158R，158W和162A。该单体可例如相比SEQ ID NO:1包含至少4，5或6个突变，和/或相比SEQ ID NO:1至多4，6，8，10，12或15个氨基酸突变。

在特定实施方式中，根据本发明的二聚I-CreI蛋白包含以下单体，或由以下单体组成：

（a）包含30G 38R 70D 75N 86D突变的第1单体；

（b）选自下列的第2单体：

（i）包含44A 54L 64A 70Q 75N 158R 162A突变的单体；

（ii）包含44A 54L 70Q 75Y 92R 158R 162A突变的单体；

（iii）包含4E 44A 54L 64A 70Q 75N 158R 162A突变的单体；

（iv）包含44A 54L 64A 70Q 75N 158W 162A突变的单体；

（v）包含44A 54L 70Q 75N突变的单体；

（vi）包含44A 54L 57E 70Q 75N 158R 162A突变的单体；以及

（vii）包含44V 54L 70Q 75N 77V突变的单体；

在另一特定实施方式中，根据本发明的二聚I-CreI蛋白包含以下单体，或由以下单体组成：

（a）包含30G 38R 70D 75N 81T 154G突变的第1单体；

（b）选自下列的第2单体：

（i）包含44A 54L 70Q 75N 105A 158R 162A突变的单体；

（ii）包含44A 54L 64A 70Q 75N 158R 162A突变的单体；

（iii）包含4E 44A 54L 64A 70Q 75N 158R 162A突变的单体；

（iv）包含44A 54L 64A 70Q 75N 158W 162A突变的单体；

（v）包含44A 54L 70Q 75N突变的单体；以及

（vi）包含44V 54L 70Q 75N 77V突变的单体；

在仍另一特定实施方式中，根据本发明的二聚I-CreI蛋白包含以下单体，或由以下单体组成：

（a）包含30G 38R 50R 70D 75N 142R突变的第1单体；

（b）选自下列的第2单体：

（i）包含44A 54L 70Q 75N 105A 158R 162A突变的单体；

（ii）包含44A 54L 64A 70Q 75N 158R 162A突变的单体；

（iii）包含44A 54L 70Q 75Y 92R 158R 162A突变的单体；

（iv）包含4E 44A 54L 64A 70Q 75N 158R 162A突变的单体；

（v）包含44A 54L 64A 70Q 75N 158W 162A突变的单体；

（vi）包含44A 54L 66C 70Q 71R 75N 151A 158R 162A突变的单体；

（vii）包含44A 54L 70Q 75N突变的单体；

（viii）包含44A 54L 57E 70Q 75N 158R 162A突变的单体；以及

（ix）包含44V 54L 70Q 75N 77V突变的单体。

二聚I-CreI蛋白的单体也可包含另外的突变，例如允许获得专性异源二聚体。本领域技术人员已知该突变及包括F ajardo-Sanchez等人（Nucleic Acids Res.2008 36:2163-73）中描述的那些。

在特定实施方式中，以上单体直接来源于SEQ ID NO:42的单体，及仅由指示的突变的存在而不同于SEQ ID NO:42的序列。

【能切割SH4座位的本发明的二聚I-CreI蛋白】

在优选的实施方式中，靶序列位于SH4座位之内（上文定义）。位于SH4之内的靶序列可例如包含SEQ ID NO:3，或SEQ ID NO:3的核苷酸2～23，或由其组成。实施例2公开能切割该靶序列的本发明的二聚I-CreI蛋白的几例。

该二聚蛋白的单体优选包含至少1，优选至少3，4，5或6个位于选自下列的位置的氨基酸取代：SEQ ID NO:1的第24，44，68，70，75和77位。所述取代可例如选自以下取代：24V，44R，44Y，68Y，68A，70S，70D，75Y，75N，77R，77N和77V。

该二聚I-CreI蛋白可例如包含以下单体，或由以下单体组成：

●第1单体，其相比SEQ ID NO:1包含至少一个氨基酸取代，其中所述至少一个氨基酸取代位于选自下列的位置：SEQ ID NO:1的第24，44，68，70，75和77位。优选地，第1单体包含在下列位置的取代：SEQ ID NO:1的第24，70，75和77位。最优选，所述取代选自以下取代：24V，44R，68Y，68A，70D，70S，75Y，75N，77N和77R。该单体可例如相比SEQ ID NO:1包含至少4，5或6个突变，和/或相比SEQ ID NO:1至多4，5，6，8，10，12或15个氨基酸突变；以及

●第2单体，其相比SEQ ID NO:1包含至少一个氨基酸取代，其中所述至少一个氨基酸取代位于选自下列的位置：SEQ ID NO:1的第24，44，70和77位。优选地，第2单体包含在下列位置的取代：SEQID NO:1的第24，44和70位。最优选，所述取代选自以下取代：24V，44Y，70S和77V。该单体可例如相比SEQ ID NO:1包含至少3或4个突变，和/或相比SEQ ID NO:1至多3，4，6，8，10，12或15个氨基酸突变。

（a）选自下列的第1单体：

（i）包含24V 44R 68Y 70S 75Y 77N突变的单体；

（ii）包含24V 68A 70S 75N 77R突变的单体；以及

（iii）包含24V 70D 75N 77R突变的单体；

（b）选自下列的第2单体：

（i）包含24V 44Y 70S突变的单体；以及

（ii）包含24V 44Y 70S 77V突变的单体。

二聚I-CreI蛋白的单体也可包含另外的突变，例如允许获得专性异源二聚体。本领域技术人员已知该突变及包括Fajardo-Sanchez等人（Nucleic Acids Res.200836:2163-73）中描述的那些。

【能切割SH6座位的本发明的二聚I-CreI蛋白】

在优选的实施方式中，靶序列位于SH6座位之内（上文定义）。位于SH6之内的靶序列可例如包含SEQ ID NO:59，或SEQ ID NO:59的核苷酸2～23，或由其组成。实施例5公开能切割该靶序列本发明的二聚I-CreI蛋白的几例。

该二聚蛋白的单体优选包含至少1，优选至少3，4，5或6个位于选自下列的位置的氨基酸取代：SEQ ID NO:1的第7，24，27，28，34，40，44，68，70，75，77，81，85，96，99，103，108，111，121，132，144和160位。所述取代可例如选自以下取代：7R，24F，27V，28Q，34R，40R，44A，44K，68T，70L，70G，70S，75N，77V，81T，81V，85R，96R，99R，103T，103S，108V，111H，121E，132V，144S,160R和160E。

该二聚I-CreI蛋白可例如包含以下单体，或由以下单体组成：

●第1单体，其相比SEQ ID NO:1包含至少一个氨基酸取代，其中所述至少一个氨基酸取代位于选自下列的位置：SEQ ID NO:1的第7，24，27，28，34，40，44，70，75，77，81，85，96，99，103，108，111，121，132，144和160位。优选地，第1单体包含在下列位置的取代：SEQ ID NO:1的第28，40，44，70和75位。最优选，所述取代选自以下取代：7R，24F，27V，28Q，34R，40R，44A，70L，75N，77V，81T，81V，85R，96R，99R，103T，103S，108V，111H，121E，132V，144S和160R et 160E。该单体可例如相比SEQ ID NO:1包含至少5或6个突变，和/或相比SEQ ID NO:1至多5，6，8，10，12，15或20个氨基酸突变；以及

●第2单体，其相比SEQ ID NO:1包含至少一个氨基酸取代，其中所述至少一个氨基酸取代位于选自下列的位置：SEQ ID NO:1的第44，68，70和75位。优选地，第2单体包含在下列位置的取代：SEQID NO:1的第44，70和75位。最优选，所述取代选自以下取代：44K，68T，70G，70S和75N。该单体可例如相比SEQ ID NO:1包含至少3或4个突变，和/或相比SEQ ID NO:1至多3，4，6，8，10，12或15个氨基酸突变。

（a）包含44K 68T 70G 75N突变的第1单体；以及

（b）选自下列的第2单体：

（i）包含28Q 40R 44A 70L 75N 96R 111H 144S突变的单体；

（ii）包含7R 28Q 40R 44A 70L 75N 85R 103T突变的单体；

（iii）包含28Q 40R 44A 70L 75N 103S突变的单体；

（iv）包含24F 27V 28Q 40R 44A 70L 75N 99R突变的单体；

（v）包含7R 28Q 40R 44A 70L 75N 81T突变的单体；

（vi）包含7R 28Q 40R 44A 70L 75N 77V突变的单体；

（vii）包含7R 28Q 40R 44A 70L 75N 103T 121E 132V 160R突变的单体；

（viii）包含28Q 40R 44A 70L 75N突变的单体；

（ix）包含7R 28Q 40R 44A 70L 75N 103T突变的单体；以及

（x）包含28Q 34R 40R 44A 70L 75N 81V 103T 108V 160E突变的单体。

（a）包含44K 70S 75N突变的第1单体；以及

（b）选自下列的第2单体：

（i）包含28Q 40R 44A 70L 75N 96R 111H 144S突变的单体；

（ii）包含7R 28Q 40R 44A 70L 75N 85R 103T突变的单体；

（iii）包含28Q 40R 44A 70L 75N 103S突变的单体；

（iv）包含24F 27V 28Q 40R 44A 70L 75N 99R突变的单体；

（v）包含7R 28Q 40R 44A 70L 75N 81T突变的单体；

（vi）包含7R 28Q 40R 44A 70L 75N 103T 121E 132V 160R突变的单体；

（vii）包含7R 28Q 40R 44A 70L 75N 103T突变的单体；以及

（viii）包含28Q 34R 40R 44A 70L 75N 81V 103T 108V 160E突变的单体。

二聚I-CreI蛋白的单体也可包含另外的突变，例如允许获得专性异源二聚体。本领域技术人员已知该突变及包括Fajardo-Sanchez等人（Nucleic Acids Res.2008 36:2163-73）中描述的那些。

【本发明的融合蛋白】

可构建包含融合在一起的二聚I-CreI蛋白的2个单体及保留亲本二聚I-CreI蛋白的生物学活性的融合蛋白（Grizot et al.NAR 200937:5405;Li et al.Nucleic Acids Res.2009 37:1650-62;Epinat et al.Nucleic Acids Res.2003 31:2952-62）。该融合蛋白通常称之为“单链大范围核酸酶”。

因此，本发明还涉及包含以上定义的二聚I-CreI蛋白的2个单体，或该单体的生物学活性片段的融合蛋白。在该融合蛋白中，以上定义的二聚I-CreI蛋白的第1和第2单体融合在一起，及任选地由接头诸如肽接头彼此连接。接头可例如包含SEQ ID NO:43或SEQ ID NO:326，或由其组成。

本发明的框内，需知，本发明的该融合蛋白能切割本发明的靶序列，即，其能与自其所来源的二聚I-CreI蛋白切割相同的靶序列。本发明的单链大范围核酸酶还包含上述专性异源二聚体突变，由此获得单链专性异源二聚体大范围核酸酶变体。

在第1版本的I-CreI单链（Epinat et al.NAR 2003 3:2952-2962;WO 03/078619）中，单链大范围核酸酶的N-端单体基本上由I-CreI氨基酸序列的第1～93位组成，然而C-端（I-CreI氨基酸序列的第8～163位）几乎完全是I-CreI单体。更最近，设计源于I-CreI同源二聚体大范围核酸酶的单链分子的新方式由2个几乎完全C-端和N-端I-CreI单体组成（见,例如WO 2009/095793）。此设计大大降低异地切割和毒性，同时增强功效。此单链分子的结构和稳定性非常类似于二聚变体的那些，且此分子呈现为在溶液中是单体。在全部方面，此单链分子与被认为是有关特异性的黄金标准的I-SceI表现同样好。这些性质将此新一代的大范围核酸酶放到基因组手术策略可利用的最佳分子剪刀之中，和应辅助用于单基因疾病，诸如例如严重的组合的免疫缺陷（SCID）的基因修正治疗，同时潜在地避免之前基因治疗方法的有害的效应。

除了以上描述的突变之外，可将另外的突变导入融合蛋白的各2单体的序列。例如，C-端单体可包含K7E和K96E突变，及N-端单体可包含E8K，E61R和G19S突变。

实施例1，2和5公开本发明的该融合蛋白的几例。

在特定实施方式中，本发明的融合蛋白包含与SEQ ID NO:25～40和76～96中的任何一种，或与其至少50，100，150或200个氨基酸的片段具有至少80%，85%，90%，95%，96%，97%，98%，99%或100%同一性的序列，或由其组成。

【核酸，本发明的载体和组合】

当将转基因***细胞，组织或动物的基因组时，本发明的内切核酸酶优选作为核酸分子而非作为蛋白导入所述细胞，组织或动物。

因此，本发明属于编码本发明的内切核酸酶，例如编码以上描述的二聚I-CreI蛋白或融合蛋白的核酸。当内切核酸酶是二聚I-CreI蛋白时，所述核酸包含至少2个编码序列，各单体一个。当内切核酸酶是融合蛋白时，所述核酸包含至少一个编码序列。可将内切核酸酶蛋白与各种细胞-穿透肽组合而产生重组蛋白；该组合的分子能以相比内切核酸酶单独更高得多的效率水平进入靶细胞。这些细胞-穿透肽由Diatos S.A.（WO01/64738;WO05/016960;WO03/018636;WO05/018650;WO07/069068）开发。申请人之前显示，内切核酸酶细胞-穿透肽组合可有效进入靶细胞，及该内化的内切核酸酶可作用于靶细胞基因组，由此产生DSB和进而刺激同源重组事件。申请人显示，内切核酸酶的复合3维结构未被细胞-穿透肽的存在所影响，且内切核酸酶的全部重要特异性也保持未受影响（数据未显示）。

本发明的另一方面是包含本发明的该核酸的载体。”载体”是指能运输已与其连接的另一核酸的核酸分子。

可在本发明中使用的载体包括但不限于病毒载体，质粒和YAC，其可由染色体，非染色体，半合成或合成核酸组成。优选的载体是能自主复制（附加型载体）和/或与它们连接的核酸表达的那些（表达载体）。大量的适合的载体为本领域技术人员已知和商业上可利用。

在优选的实施方式中，载体是病毒载体诸如例如源于下列的载体：反转录病毒，腺病毒，细小病毒（例如腺-相关病毒），冠状病毒，负链RNA病毒（例如正粘病毒诸如流感病毒,弹状病毒诸如狂犬病和水疱性口炎病毒,副粘病毒诸如麻疹和仙台病毒），正链RNA病毒诸如微小核糖核酸病毒和α病毒，或双链DNA病毒诸如腺病毒，疱疹病毒（例如单纯疱疹病毒1和2型,爱泼斯坦-巴尔病毒,巨细胞病毒）和痘病毒（例如痘苗,鸡痘和金丝雀痘）。优选的载体包括慢病毒载体，及特别自身-灭活慢病毒载体。

除了编码本发明的内切核酸酶的序列之外，载体也可包含元件，诸如：

●转录和翻译控制元件诸如启动子，增强子，多聚腺苷酸化位点，终止信号，内含子，等；

●多克隆位点；

●复制原点；

●选择标记物；

●转基因；和/或

●包含与围绕本文定义的基因组靶位点的区共享同源性的序列的靶向构建体。

在优选的实施方式中，所述载体是“表达载体”，即至少一个编码序列可操作地连接于转录和翻译控制元件的载体。在此实施方式的框内，编码本发明的内切核酸酶（例如编码以上描述的二聚I-CreI蛋白或融合蛋白）的核酸可操作地连接于转录和翻译控制元件。

在优选的实施方式中，本发明的载体包含靶向构建体，所述靶向构建体包含转基因和与侧接本文定义的靶序列（例如SEQ ID NO:2或3的靶序列）的基因组序列同源的2个序列。侧接靶序列的基因组序列优选紧密相邻于靶位点。

该靶向构建体为本领域技术人员熟知。为转基因的***，该构建一般包含：与侧接靶序列的上游（5’）基因组序列同源的第1序列，待***的转基因，及与侧接靶序列的下游（3’）基因组序列同源的第2片段。

″同源″旨在是与另一具有足够的同一性的序列，导致序列之间的同源重组，更特别彼此具有至少95%同一性，优选97%同一性和更优选99%同一性。

优选地，使用至少50bp，优选多于100bp和更优选多于200bp的同源序列。因此，靶向的DNA构建体优选为200bp～6000bp，更优选1000bp～2000bp。的确，共享的DNA同源性位于侧接断裂位点的上游和下游的区，和待导入的DNA序列应位于2臂之间。

靶向构建体也可包含2个同源性臂之间的阳性选择标记物，和在第1同源性臂上游或第2同源性臂下游的最终阴性选择标记物。标记物允许选择通过在靶位点的同源重组***了目标序列的细胞。

在实施例4中给出适合于将转基因***SH3或SH4座位的构建靶向构建体的方法。

编码本发明的内切核酸酶和靶向构建体的核酸也可位于2个分离载体上。因此，本发明也属于2个载体的组合，即：

●根据本发明的表达载体；以及

●包含靶向构建体的载体，所述靶向构建体包含转基因和2个与本发明的基因组序列的靶序列同源的序列。

【本发明的药物使用】

以上描述的载体和组合可例如用作药物。尤其是，这些载体和组合可用于基因治疗。

因此，本发明涉及本发明的载体或组合，其用作药物。在该载体和组合中，转基因编码治疗性多肽。

尤其是，可通过使用本发明的载体和组合的基因治疗所治疗的疾病包括但不限于X-SCID，SCID，大疱性表皮松解，利伯黑矇，血友病，地中海贫血，范科尼贫血和肌肉营养不良。

在这些疾病中，转基因编码以下治疗性多肽，分别：IL2RG，Gl7A1，Rp 65，血因子VIII和IX，血红素A和B，Fanc-A，Fanc-C（或其他范科尼贫血相关的基因），肌营养不良蛋白。

本发明还涉及药物组合物，其包含本发明的载体和组合和药学有活性的载体。

本发明也涉及通过基因治疗治疗个体的方法，包括给有需求的个体施用有效量的本发明的载体或组合。

″有效量″是指足以达到将转基因***待治疗的个体的基因组的量。该浓度可由本领域技术人员常规测定。

″有需求的受试者″是指可通过转基因的***治疗或预防的患或敏感于患遗传疾病的个体。在本发明的框内，待治疗的个体优选是人类。

【本发明的非药物使用】

以上描述的载体和组合不仅发现在基因治疗中使用，而且也在非药物使用诸如，例如，动物模型的产生和表达目标蛋白的重组细胞系的产生中使用。

因此，本发明涉及：

●本发明的内切核酸酶，核酸，表达载体或组合用于将转基因***细胞，组织或非-人动物的基因组的用途，其中所述用途不是治疗剂。

●将转基因***细胞，组织或非-人动物的基因组的方法，包括下列步骤：使所述细胞，组织或非-人动物接触本发明的内切核酸酶，核酸，表达载体或组合，由此将所述转基因***所述基因组。

在优选的实施方式中，以上使用或方法旨在将编码目标蛋白的转基因***细胞的基因组，以便获得用于蛋白产生的重组细胞系。用于构建用于蛋白产生的重组细胞系的适合的细胞包括但不限于人（例如PER.C6或HEK），中国卵巢仓鼠（CHO）和小鼠（NSE0）细胞。

在另一优选的实施方式中，以上使用旨在制造遗传性病症的非-人动物模型。

本发明也针对在其基因组中包含本发明的核酸，表达载体或组合的非-人转基因动物。

本文引用的全部参考文献，包括期刊文章或摘要，公开的专利申请，授权的专利或任何其他参考文献，完全通过引用并入本文，包括引用的参考文献中的全部数据，表，图和文本。

本发明还会通过下列实施例和图评价。

【附图说明】

图1代表实施例1中描述的大范围核酸酶的靶序列。

图2和3代表SCOH SH3大范围核酸酶对比I-SceI，和CHO中SCOH-RAG DNA剂量应答。

图4代表实施例2中描述的大范围核酸酶的靶序列。

图5和6代表SCOH SH4大范围核酸酶对比I-SceI，和CHO中的SCOH-RAG DNA剂量应答。

图7代表通过非同源端-接合（NHEJ）修复双-链断裂期间导致小缺失和***（InDel）产生的机理的略图。

图8代表用SH3或SH4大范围核酸酶切割后的***位点。

图9代表实施例5中描述的大范围核酸酶的靶序列。

图10代表SCOH SH6大范围核酸酶对比I-SceI，和在CHO中的SCOH-RAG DNA剂量应答。

图11代表SEQ ID NO:1的I-CreI单体和SEQ ID NO:42的I-CreI单体之间的序列比对。

图12代表SEQ ID NO:1的I-CreI单体和包含44A 54L 64A 70Q75N 158R和162A突变的2个I-CreI单体之间的序列比对。第1个（SEQ ID NO:57）直接来源于SEQ ID NO:1和第2个（SEQ ID NO:58）直接来源于SEQ ID NO:42。

图13～17例证实施例6～9。

【序列表说明】

SEQ ID NO:1显示野生型I-CreI单体的氨基酸序列。

SEQ ID NO:2显示位于SH3座位之内的本发明的靶序列的序列。

SEQ ID NO:3显示位于SH4座位之内的本发明的靶序列的序列。

SEQ ID NO:4显示野生型I-CreI同源二聚体蛋白的靶序列的序列。

SEQ ID NO:5～10代表图1上显示的序列。

SEQ ID NO:11～15代表实施例1中使用的寡核苷酸，引物和接头。

SEQ ID NO:16～19代表图4上显示的序列。

SEQ ID NO:20～24代表实施例2中使用的寡核苷酸，引物和接头。

SEQ ID NO:25～32代表在实施例1中构建的单链大范围核酸酶，分别称之为SCOH-SH3-b56-A，SCOH-SH3-b56-B，SCOH-SH3-b56-C，SCOH-SH3-b56-D，SCOH-SH3-b1-A，SCOH-SH3-b1-B，SCOH-SH3-b1-C和SCOH-SH3-b1-D。

SEQ ID NO:33～40代表在实施例2中构建的单链大范围核酸酶，分别称之为SCOH-SH4-b56-A，SCOH-SH4-b56-B，SCOH-SH4-b56-C，SCOH-SH4-b56-D，SCOH-SH4-b1-A，SCOH-SH4-b1-B，SCOH-SH4-b1-C和SCOH-SH4-b1-D。

SEQ ID NO:41代表阳性对照SCOH-RAG。

SEQ ID NO:42显示在第2位具有另外的丙氨酸的I-CreI单体，及在最后脯氨酸之后具有3个另外的残基的氨基酸序列。

SEQ ID NO:43显示RM2接头的氨基酸序列。

SEQ ID NO:44～49代表实施例3中使用的寡核苷酸，引物和接头。

SEQ ID NO:50～53代表实施例4中使用的寡核苷酸，引物和接头。

SEQ ID NO:54～55显示分别SH3，SH4和SH6座位中包含的序列。

SEQ ID NO:57显示源于包含44A 54L 64A 70Q 75N 158R 162A突变的SEQ ID NO:1的单体的单体。

SEQ ID NO:58显示包含44A 54L 64A 70Q 75N 158R 162A突变的源于SEQ ID NO:42的单体的单体。

SEQ ID NO:59显示位于SH6座位之内的本发明的靶序列的序列。

SEQ ID NO:60～64代表图9上显示的序列。

SEQ ID NO:65～75代表实施例5中使用的寡核苷酸，引物和接头。

SEQ ID NO:76～85代表在实施例5中构建的单链大范围核酸酶，分别称之为SCOH-SH6-b1-B，SCOH-SH6-b1-C，SCOH-SH6-b1-C，QCSH61-A01，QCSH61-E01，QCSH61-H0，QCSH62-A02，QCSH61-H01b，QCSH61-H01c和QCSH61-H01d。

SEQ ID NO:86～96代表能切割SH7座位（SEQ ID NO:86和87），SH8座位（SEQ ID NO:88），SH12座位（SEQ ID NO:89），SH13座位（SEQ ID NO:90），SH19座位（SEQ ID NO:91），SH20座位（SEQ ID NO:92），SH21座位（SEQ ID NO:93～95）和SH33座位（SEQ ID NO:96）的单链大范围核酸酶。

SEQ ID NO:97～104代表分别在SH12，SH13，SH19，SH20，SH21，SH33，SH7和SH8座位之内包含的序列。

SEQ ID NO:105～325代表在实施例6～9中和/或在表A′，A″，E，G和H中的任何一个中公开的序列。

SEQ ID NO:326显示BQY接头的氨基酸序列。

【实施例】

在下列实施例中，全部I-CreI变体通过SEQ ID NO:42的I-CreI单体的遗传加工来构建。

【实施例1：加工靶向SH3座位的大范围核酸酶】

SH3是存在于第6染色体的包含24bp非-回文靶（SEQ ID NO:2）的座位。如显示于表A，SH3位于Deichmann等人（J.of Clin.Invest.2007 117:2225）中公开的RIS附近。SH3序列未包括进Deichmann等人描述的任何CIS中。

能切割SEQ ID NO:2的靶序列的I-CreI异源二聚体使用源于Chames等人（Nucleic Acids Res.,2005,33,e178），Arnould等人（J.Mol.Biol.,2006,355,443～458），Smith等人（Nucleic Acids Res.,2006,34,e149），Arnould等人（Arnould et al.J Mol Biol.2007 371:49-65）描述的方法的方法鉴定。这些异源二聚体的一些然后克隆进用于评定在CHO细胞中SH3切割的哺乳动物表达载体。这些结果然后用于设计针对SEQ ID NO:2的靶序列的单链大范围核酸酶。将这些单链大范围核酸酶克隆进哺乳动物表达载体及在CHO细胞中测试SH3切割。在哺乳动物细胞中可观察到这些单链分子的SH3靶的强切割活性。

【实施例1.1．切割SH3的大范围核酸酶的鉴定】

由遗传加工构建异源二聚体形式的潜在地切割SH3靶序列的I-CreI变体。然后在酵母中共表达该变体对。共表达之后，获得3种分子，即2种同源二聚体及1种异源二聚体。然后测定是否异源二聚体能切割SEQ ID NO:2的SH3靶序列。

【（a）切割源于SH3靶序列的回文序列的I-CreI大范围核酸酶的变体的构建】

SH3序列部分是显示于图1的10AAT_P（SEQ ID NO:5），5AAG_P（SEQ ID NO:6），10AGG_P（SEQ ID NO:7）和5TTT_P（SEQ ID NO:8）靶序列的组合。这些序列被如在国际PCT申请WO2006/097784和WO 2006/097853，Arnould等人（J.Mol.Biol.,2006,355,443～458）和Smith等人（Nucleic Acids Res.,2006）描述获得的大范围核酸酶切割。由此，SH3应被自这些之前鉴定的大范围核酸酶得到的组合的变体切割。

2个回文靶，SH3.3和SH3.4，源于SH3（图1）。由于SH3.3和SH3.4是回文的，它们应被同源二聚体蛋白切割。因此，切割SEQ IDNO:9的SH3.3回文靶序列或SEQ ID NO:10的SH3.4回文靶序列的同源二聚体I-CreI变体使用源于Chames等人（Nucleic Acids Res.,2005,33,e178），Arnould等人（J.Mol.Biol.,2006,355,443～458），Smith等人（Nucleic Acids Res.,2006,34,e149）和Arnould等人（Arnould et al.J Mol Biol.2007371:49-65）描述的方法的方法构建。

【（b）靶载体的构建】

SEQ ID NO:11的寡核苷酸，对应于侧接有关口克隆序列的SH3靶序列，定购自PROLIGO。此寡聚体具有以下序列：TGGCATACAAGTTTCCAATACAAGGTACAAAGTCCTGACAATCGTCTGTCA。将由单链寡核苷酸的PCR扩增产生的双链靶DNA使用关口流程（INVITROGEN）克隆进pCLS1055酵母报告载体。

将酵母报告载体转化进FYBL2-7B酿酒酵母（Saccharomycescerevisiae）株，其具有以下基因型：MAT a，ura3△851，trp1△63，leu2△1，lys2△202。得到的株对应于报告子株（MilleGen）。

【（c）变体的共表达】

将编码切割SH3.4或SH3.3序列的变体的开放阅读框分别克隆进pCLS542表达载体及pCLS1107表达载体。使用标准流程提取来自这些变体的酵母DNA及用于转化大肠埃希氏菌（E.coli）。得到的质粒然后用于共转化酵母。在缺少亮氨酸及含有G418的合成的培养基上选择转化体。

【（d）共表达大范围核酸酶的克隆的交配及在酵母中筛选】

交配使用集落划线器（QpixII,Genetix）进行。将变体在覆盖YPD板的尼龙滤器上，使用低划线密度（4-6斑点/cm²）划线。在相同的滤器上进行第2划线过程，以对于各靶点斑由不同报告子-带有酵母株组成的第2层。膜放置在固体琼脂富含YPD的培养基上，及于30℃温育一夜，以允许交配。接下来，将滤器转移到合成的培养基，其缺少亮氨酸和色氨酸，添加G418，含半乳糖（2%）作为碳源，及于37℃温育5天，以选择携带表达的二倍体及靶载体。5天之后，滤器放置在含在0.5M磷酸钠缓冲剂中的0.02%X-Gal，pH7.0，0.1%SDS，6%二甲基甲酰胺（DMF），7mMβ-巯基乙醇，1%琼脂糖的固体琼脂糖培养基上及于37℃温育，以监控β-半乳糖苷酶活性。使用适当的软件进行由扫描及定量的结果分析。

【（e）结果】

在58个测试的组合中不同变体的共表达导致SH3靶上的切割。功能组合总结于下表I。在此表中，“+”指示在SH3靶序列上的功能组合，即，异源二聚体能切割SH3靶序列。

表I

结果，鉴定了能在酵母中切割SH3靶序列的几种异源二聚体I-CreI变体。

【实施例1.2．CHO细胞中染色体外模型SH3中靶向切割的验证】

在以上实施例1.1中描述了当形成异源二聚体时能在酵母中有效切割SH3靶的I-CreI变体。为了鉴定异源二聚体在CHO细胞中对SH3靶显示最大切割活性，在CHO细胞中使用染色体外测定比较了这些变体的一些的效率。在CHO细胞中的筛选是基于单-链退火（SSA）的检定，其中靶被大范围核酸酶的切割诱导同源重组和LagoZ报告基因（细菌lacZ基因的衍生物）的表达。

【（a）用于CHO筛选的载体中SH3靶的克隆】

对应于侧接有关口克隆序列的SH3靶序列的寡核苷酸，定购自PROLIGO（SEQ ID NO:12;TGGCATACAAGTTTCCAATACAAGGTACAAAGTCCTGACAATCGTCTGTCA）。使用关口流程（INVITROGEN）将由单链寡核苷酸的PCR扩增产生的双链靶DNA克隆进pCLS1058 CHO报告载体。由测序（MILLEGEN）确证克隆的靶。

【（b）大范围核酸酶的再克隆】

将编码上表I中鉴定的这些变体的开放阅读框亚-克隆进pCLS2437表达载体。ORF通过PCR在酵母DNA上使用SEQ ID NO:13和14的引物（5’-AAAAAGCAGGCTGGCGCGCCTACACAGCGGCCTTGCCACCATG-3’和5’-AGAAAGCTGGGTGCTAGCGCTCGAGTTATCAGTCGG-3’）扩增。PCR产物使用用于内部片段取代的AscI和XhoI限制酶克隆进CHO表达载体pCLS2437。由测序（MILLEGEN）确证通过连接和大肠埃希氏菌（E.coli）转化步骤得到的选择的克隆。

【（c）哺乳动物细胞中的染色体外测定】

将CHO K1细胞用

转染试剂根据提供商的流程（QIAGEN）转染。72小时转染之后，将培养基移出及添加150μl的用于β-半乳糖苷酶液体测定的裂解/泄漏缓冲剂（一般1l的缓冲剂含有100ml的裂解缓冲剂（Tris-HCl 10mM pH7.5,NaCl 150mM,Triton×1000.1%,BSA 0.1mg/ml,蛋白酶抑制物），10ml的Mg 100×缓冲剂（MgCl₂ 100mM,β-巯基乙醇35%），110ml ONPG 8mg/ml和780ml的磷酸钠0.1M pH7.5）。于37℃温育后，在420nm处测量OD。在自动化的Velocity11 BioCel平台上进行整个过程。

每测定，150ng的靶载体用12.5ng的两种变体各之一共转染。

【（d）结果】

将表I中描述的4种以下变体再克隆进pCLS2437：

●44A 54L 70Q 75Y 92R 158R 162A（称之为SH3.3-MA）；

●1V 44A 54L 64A 70Q 75N 158W 162A（称之为SH3.3-MB）；

●30G 38R 70D 75N 86D（称之为SH3.4-M1）；以及

●30G 38R 70D 75N 81T 154G（称之为SH3.4-M2）。

在CHO染色体外测定中，将这些I-CreI变体与针对SH3靶的异源二聚体一起检定。

表II显示对9种异源二聚体获得的功能组合。

表II

SH3序列的切割效率和重组分析展示，I-CreI变体的全部4种测试的组合能无另外的突变地将它们的切割活性自酵母转座到CHO细胞。

【实施例1.3．切割SH3的大范围核酸酶的共价组装为单链和改良】

在实施例1.1中鉴定的变体的共表达导致酵母中SH3靶的高切割活性。已就在哺乳动物表达***中SH3切割确认一些异源二聚体（实施例1.2.）。选择它们之一，显示于表III，用于进一步优化。

表III

SH3变体	I-CreI变体的氨基酸位置和残基
		SH3.3-MA	44A 54L 70Q 75Y 92R 158R 162A
SH3.4-M1	30G 38R 70D 75N 86D

MA x M1 SH3异源二聚体在酵母中给出高切割活性。SH3.3-MA是相比I-CreI野生型序列带有以下突变的SH3.3切割物：44A 54L 70Q75Y 92R 158R 162A。SH3.4-M1是相比I-CreI野生型序列带有以下突变的SH3.4切割物：30G 38R 70D 75N 86D。

使用SEQ ID NO:15的接头RM2（AAGGSDKYNQALSKYNQALSKYNQALSGGGGS）加工单链构建体，由此导致单链分子：MA-接头RM2-M1的产生。在此设计步骤期间，将G19S突变导入C-端M1变体。此外，将突变K7E，K96E导入MA变体和突变E8K，E61R导入M1变体，以创建单链分子：MA（K7E K96E）-接头RM2-M1（E8K E61R G19S），其还称之为SCOH-SH3-b1支架。一些另外的氨基-酸取代已在之前研究发现增强I-CreI衍生物的活性：异亮氨酸132用缬氨酸的取代（I132V）是它们之一。将I132V突变导入N-端和C-端蛋白片段的1个，2个或无编码序列。

分别基于最佳变体切割SH3.3（44A 54L 70Q 75Y 92R 158R162A）和SH3.4（30G 38R 50R 70D 75N 142R）作为同源二聚体，将相同的策略应用于第2支架，称之为SCOH-SH3-b56支架。

得到的蛋白显示于下表IV。就SH3靶切割，在CHO中检定全部单链分子。

【（a）单链分子的克隆】

一系列合成基因组件定购自MWG-EUROFINS。将编码靶向SH3的不同单链变体的合成基因使用AscI和XhoI限制性位点克隆进pCLS1853。

【（b）在哺乳动物细胞中的染色体外测定】

如在实施例1.2中描述转染CHO K1细胞。在72小时转染之后，培养基移出及添加150μl的用于β-半乳糖苷酶液体测定的裂解/泄漏缓冲剂。于37℃温育后，在420nm处测量OD。整个过程在自动化的Velocity11 BioCel平台上进行。每测定，150ng的靶载体用3.12～25ng的增加的量的变体DNA共转染（25ng的单链DNA对应于12,5ng+12,5ng的异源二聚体DNA）。最终，转染的DNA变体DNA量是3.12ng，6.25ng，12.5ng和25ng。转染的DNA的总量使用空载体（pCLS0002）完成为175ng（靶DNA,变体DNA,载体DNA）。

【（d）结果】

使用之前描述的CHO测定，随着我们的内部对照SCOH-RAG和I-Sce I大范围核酸酶监控单链分子针对SH3靶的活性。全部比较以3.12ng，6.25ng，12.5ng和25ng转染的变体DNA进行（图2和3）。全部单分子在如列于表IV的CHO测定中显示的SH3靶向切割活性。

表IV

变体依赖于它们带有的突变特征，在检定的剂量后共享特定行为（图2和3）。例如，SCOH-SH3-b1-C具有类似特征，及甚至更有活性。其活性在从低量到高量转染的最低DNA量达到最大。相比SCOH-SH3-b1-C，分子SCOH-SH3-b56-A在更高DNA剂量具有最大活性，但达到SCOH-SH3-b1-C的相当的活性水平和我们的内部标准。

描述的全部变体是有活性，和可用于将转基因***SH3座位。

【实施例2：加工靶向SH4座位的大范围核酸酶】

SH4是存在于第7染色体的座位。SH4座位包含24bp个SEQ IDNO:3的非-回文序列。如显示于表A，SH4位于Schwarzwaelder等人（J.Clin.Invest.2007 117:2241）公开的附近RIS。SH4序列未包括在Deichman等人描述的任何CIS中。

进行类似于在实施例1中以上描述的那些的实验以鉴定能切割SEQ ID NO:3的靶序列的I-CreI异源二聚体和单链大范围核酸酶。

【实施例2.1．切割SH4的大范围核酸酶的鉴定】

由遗传加工构建异源二聚体形式的潜在地切割SH4靶序列的I-CreI变体。该变体对然后在酵母中共表达。共表达之后，获得3种分子，即2种同源二聚体及1种异源二聚体。然后测定是否异源二聚体能切割SEQ ID NO:3的SH4靶序列。

【（a）切割源于SH4靶序列的回文序列的I-CreI大范围核酸酶的变体的构建】

SH4序列部分是显示于图4的10AAA_P（SEQ ID NO:4），5ACT_P（SEQ ID NO:16），10AAA_P（SEQ ID NO:4），5GGT_P（SEQ ID NO:17）靶的组合。这些序列被之前鉴定的，如在国际PCT申请WO 2006/097784和WO 2006/097853；Arnould et al.,J.Mol.Biol.,2006,355,443-458;Smith et al.,Nucleic Acids Res.,2006中描述获得的大范围核酸酶切割。由此，SH4应被自这些之前鉴定的大范围核酸酶得到的组合的变体切割。

筛选的过程使用源于Chames等人（Nucleic Acids Res.,2005,33,e178），Arnould等人（J.Mol.Biol.,2006,355,443～458），Smith等人（Nucleic Acids Res.,2006,34,e149）和Arnould等人（Arnould etal.J Mol Biol.2007 371:49-65）中描述的方法的方法进行，针对2个以下回文序列：SEQ ID NO:18的SH4.3序列和SEQ ID NO:19的SH4.4序列。

【（b）靶载体的构建】

实验过程如在实施例1.1中描述，例外是使用对应于SEQ ID NO:20的SH4靶序列的寡核苷酸（5’-TGGCATACAAGTTTTTAAAACACTGTACACCATTTTGACAATC GTCTGTCA-3’）。

【（c）变体的共表达】

自切割在pCLS542和pCLS1107表达载体中的SH4.3和SH4.4靶的变体的酵母DNA使用标准流程提取及用于转化大肠埃希氏菌（E.coli）。得到的质粒DNA然后用于共转化酵母株。在缺少亮氨酸及含有G418的合成的培养基上选择转化体。

【（d）共表达大范围核酸酶的克隆的交配及在酵母中筛选】

交配使用集落划线器进行（QpixII,Genetix）。将变体在覆盖YPD板的尼龙滤器上，使用低划线密度（4-6斑点/cm²）划线。在相同的滤器上进行第2划线过程，以对于各靶点斑由不同报告子-带有酵母株组成的第2层。膜放置在固体琼脂富含YPD的培养基上，及于30℃温育一夜，以允许交配。接下来，将滤器转移到合成的培养基，其缺少亮氨酸和色氨酸，添加G418，含半乳糖（2%）作为碳源，及于37℃温育5天，以选择携带表达的二倍体及靶载体。5天之后，滤器放置在含0.5M磷酸钠缓冲剂中的0.02%X-Gal，pH7.0，0.1%SDS，6%二甲基甲酰胺（DMF），7mM β-巯基乙醇，1%琼脂糖的固体琼脂糖培养基上及于37℃温育，以监控β-半乳糖苷酶活性。由扫描及定量的结果分析使用适当的软件进行。

【（e）结果】

切割SH4.3靶的变体及切割SH4.4靶的变体的共表达在6例中导致SH4靶的切割。功能组合总结于表V。

表V

【实施例2.2．在CHO细胞中的染色体外模型中SH4靶向切割的验证】

为了鉴定显示在CHO细胞中对于SH4靶的最大切割活性的异源二聚体，变体的几种组合以切割SH4靶的效率使用染色体外测定在CHO细胞中评定。在CHO细胞中的筛选是基于单-链退火（SSA）的检定，其中靶被大范围核酸酶的切割诱导同源重组和LagoZ报告基因（细菌lacZ基因的衍生物）的表达。

【（a）用于CHO筛选的载体中SH4靶的克隆】

靶克隆如下。对应于侧接有关口克隆序列的SH4靶序列的SEQ IDNO:21的寡核苷酸定购自PROLIGO（5’-TGGCATACAAGTTTTTAAAACACTGTACACCATTTTGACAATCGTCTGTCA-3’）。将由单链寡核苷酸的PCR扩增产生的双链靶DNA使用关口流程（INVITROGEN）克隆进CHO报告载体（pCLS1058）。克隆的片段由测序（MILLEGEN）确证。

【（b）大范围核酸酶的再克隆】

将切割以上得到的SH4.5和SH4.6靶的I-CreI变体的ORF亚-克隆进pCLS2437。ORF通过PCR在酵母DNA上使用引物SEQ ID NO:22和23（5’-AAAAAGCAGGCTGGCGCGCCTACACAGCGGCCTTGCCACCATG-3’和5’-AGAAAGCTGGGTGCTAGCGCTCGAGTTATCAGTCGG-3’）引物扩增。PCR产物使用用于内部片段取代的AscI和NheI限制性位点克隆进CHO表达载体pCLS2437。通过连接和大肠埃希氏菌（E.coli）转化步骤得到的选择的克隆由测序（MILLEGEN）确证。

【（c）哺乳动物细胞中的染色体外测定】

将CHO K1细胞用

转染试剂根据提供商的流程（QIAGEN）转染。72小时转染之后，将培养基移出及添加150μl的用于β-半乳糖苷酶液体测定的裂解/泄漏缓冲剂（一般1l的缓冲剂含有：100ml的裂解缓冲剂（Tris-HCl 10mM pH7.5,NaCl 150mM,Triton×1000.1%,BSA 0.1mg/ml,蛋白酶抑制物），10ml的Mg 100×缓冲剂（MgCl₂100mM,β-巯基乙醇35%），110ml ONPG 8mg/ml和780ml的磷酸钠0.1M pH7.5）。于37℃温育后，在420nm处测量OD。整个过程在自动化的Velocity11 BioCel平台上进行。每测定，150ng的靶载体用12.5ng的两种变体各之一共转染（切割回文SH4.3靶的12.5ng的变体和切割回文SH4.4靶的12.5ng的变体）。

【（d）结果】

选择显示于表VI及在以上实施例2.1中描述的4种变体用于进一步分析。

表VI

这些变体克隆进pCLS2437。然后，在CHO染色体外测定中，切割SH4.3或SH4.4靶的I-CreI变体与针对SH4靶的异源二聚体一起检定。切割效率和SH4序列重组的分析展示，全部I-CreI变体的测试的组合能无另外的突变地将它们的切割活性自酵母转座到CHO细胞（表VII）。

表VII

【实施例2.3．通过定点诱变的切割SH4的大范围核酸酶的共价组装为单链和改良】

实施例2.1中描述的变体的共表达导致在酵母中SH4靶的高切割活性。此外，已就SH4切割在哺乳动物表达***中确认一些它们（实施例2.2.）。

MA x M2SH4异源二聚体在酵母中给出高切割活性。SH4.3-MA是相比I-CreI野生型序列带有以下突变的SH4.3切割物：24V 44R 68Y70S 75Y 77N。SH4.4-M2是相比I-CreI野生型序列带有以下突变的SH4.4切割物：24V 44Y 70S 77V。

如在实施例1.3中描述，单链构建体使用接头RM2加工，由此导致称之为MA-接头RM2-M2的单链分子的产生。在此设计步骤期间，将G19S突变导入C-端M2突变体。此外，将K7E和K96E突变导入MA突变体，及E8K和E61R突变导入M2突变以便创建单链分子，其被称之为MA(K7E K96E)-接头RM2-M2（E8K E61R G19S），其还被称之为SCOH-SH4-b1支架。

将异亮氨酸132到缬氨酸（I132V）突变导入1个，无或2个N-端和C-端蛋白片段的编码序列。

将相同的策略基于对SH4.3（44R 68Y 70S 75Y 77N）和SH4.4（24V44Y 70S 77V）的良好切割物应用于第2支架。此支架还称之为SCOH-SH4-b56支架。

衍生的单链构建体的设计显示于表VIII。在CHO中测试单链构建体的诱导SH4靶的切割的能力。

【（a）单链分子的克隆】

一系列合成基因组件在MWG-EUROFINS中实施。将编码靶向SH4的不同单链变体的合成基因使用AscI和XhoI限制性位点克隆进pCLS1853。

【（b）哺乳动物细胞中的染色体外测定】

如以上所述转染CHO K1细胞。72小时转染之后，将培养基移出及添加150μl的用于β-半乳糖苷酶液体测定的裂解/泄漏缓冲剂。于37℃温育后，在420nm处测量OD。整个过程在自动化的Velocity11BioCel平台上进行。每测定，150ng的靶载体用3.12～25ng的增加的量的变体DNA共转染（25ng的单链DNA对应于12,5ng+12,5ng的异源二聚体DNA）。最终，转染的DNA变体DNA量是3.12ng，6.25ng，12.5ng和25ng。转染的DNA的总量使用空载体（pCLS0002）完成为175ng（靶DNA,变体DNA,载体DNA）。

【（c）结果】

使用之前描述的CHO测定通过与我们的内部对照SCOH-RAG和I-Sce I大范围核酸酶比较监控描述于表VIII的单链分子的针对SH4靶的活性。在3.12ng，6.25ng，12.5ng和25ng的DNA转染的剂量后进行全部活性评估。全部单链分子显示对SH4靶的活性，如报道于表VIII。

表VIII

变体依赖于它们带有的突变特征在检定的剂量后共享特定行为（图5和6）。例如，SCOH-SH4-b1C显示与内部标准SCOH-RAG（其活性从低量增加到高量）相同的范围之内的活性水平。在检定的DNA转染的剂量，其活性是更优于SCOH-SH4-B56A。

全部这些变体在不同强度水平有活性和可由此用于SH4基因组靶向。

【实施例3：人细胞系中SH座位上切割活性的检测】

已在实施例1和2中鉴定能在酵母及哺乳动物细胞（CHO K1细胞）中有效切割SH3和SH4靶的I-CreI变体。接下来测试了SH3和SH4大范围核酸酶切割它们的内源性DNA靶序列的效率。此例会展示，加工为切割SH3和SH4靶序列的大范围核酸酶在人细胞中切割它们的同源内源性位点。

由非同源端-接合（NHEJ）的双-链断裂的修复可产生小缺失和***（InDel）（图7）。本质上，此错误-倾向机理可对细胞存活有害，但在内源性座位提供大范围核酸酶活性的快速指示。

【实施例3.1：在内源性位点诱导的诱变的检测】

用于筛选具有改变的特异性的变体的在哺乳动物或酵母细胞中基于切割-诱导的重组的测定，描述于国际PCT申请WO 2004/067736；Epinat等人，Nucleic Acids Res.，2003，31:2952-2962；Chames等人，Nucleic Acids Res.，2005，33:e178和Arnould等人，J.Mol.Biol，2006，355:443-458。这些测定产生可由标准方法监控的功能性LacZ报告基因。

将对于克隆进pCLS1853质粒的SH3和SH4的单链I-CreI变体用于此实验。在实验之前日，将自人胚胎肾细胞系，293-H（Invitrogen）的细胞以1.2×10⁶细胞/皿的密度接种于10cm皿。次日，将细胞用3μg的空质粒或表达大范围核酸酶的质粒，使用阳离子脂质体（Invitrogen）转染。72小时转染之后，将细胞收集及稀释（稀释1/20）于新鲜培养基。7天的培养之后，将细胞收集及提取基因组DNA。

200ng的基因组DNA用于由PCR扩增扩增围绕大范围核酸酶切割位点的内源性座位。将对应于SH3座位的377bp片段使用特定PCR引物A(SEQ ID NO:44;5’-tgggggtcttactctgtttccc-3’）和B（SEQ ID NO:45;5’-aggagagtccttctttggcc-3’）扩增。将对应于SH4座位的396bp片段使用PCR引物C（SEQ ID NO:46;5’-gagtgatagcataatgaaaacc-3’）和D（SEQ ID NO:47;5’-ctcaccataagtcaactgtctc-3’）扩增。进行PCR扩增，以获得侧接有由提供测序服务的公司（GATC生物技术AG,德国），在454测序***（454Life Sciences）上提供的特定适体序列（SEQID NO:48;5’-CCATCTCATCCCTGCGTGTCTCCGACTCAG-3’和SEQ ID NO:495’-CCTATCCCCTGTGTGCCTTGGCAGTCTCAG-3’）的片段。从2扩增子组（各500ng）得到平均18,000个序列。测序之后，基于以上适体之第1中引导的条码序列鉴定不同样品。

然后分析序列中分别SH3或SH4的切割位点中***或缺失的存在。

【实施例3.2：结果】

表IX总结获得的结果。

表IX

从用靶向SH3座位的大范围核酸酶转染的细胞提取的基因组DNA的分析显示，在12841个分析的序列中56个（0.44%）在SH3的识别位点之内含有InDel事件。类似地，用靶向SH4座位的大范围核酸酶转染之后，在8259个分析的序列中的18个（0.22%）在SH4的识别位点之内含有InDel事件。

由于小缺失或***可与PCR或测序人工品相关，在用不表达大范围核酸酶的质粒转染之后分析相同的座位。SH3和SH4座位的分析揭示，实际上是无InDel事件可检测。的确，仅0.05%（1/2153）和0.02%（3/12811）的分析的序列含有突变。

而且，DNA***或缺失序列（图8）的尺寸分析揭示具有小***（<5bp）及小缺失（<10bp）的优势的类似类型的事件。

这些数据展示，加工为分别靶向SH3或SH4座位的大范围核酸酶在人细胞中有活性，和可切割它们的同源内源性序列。而且，其显示，大范围核酸酶具有在序列之内产生小InDel事件的能力，其会破坏基因ORF由此灭活对应的基因表达产物。

【实施例4：靶向人细胞中内源性SH3和SH4座位的基因】

为了确证加工的单链SH3和SH4大范围核酸酶的切割活性，接下来评价它们的刺激在内源性人SH3和SH4座位同源重组的能力。将细胞用单链分子SCOH-SH3-b1-C或SCOH-SH4-b1-C的哺乳动物表达质粒和包含靶向构建体的载体转染。包含靶向构建体的载体（也称之为“供体修复质粒”）是含有由侧接有2个与人SH3或SH4座位同源的序列的外源DNA序列组成的2.8kb序列的pCLS3777或pCLS3778质粒。与人SH3或SH4座位同源的序列具有1.5kb的长度。天然SH3或SH4座位被大范围核酸酶的切割产生用于同源重组的底物，其可使用供体修复质粒作为修复矩阵。由此，在SH3或SH4座位靶向的整合发生的频度是基因组SH3或SH4靶位点的切割效率的指标。

【实施例4.1：材料和方法】

【（a）大范围核酸酶表达质粒】

此例中使用的大范围核酸酶是克隆进哺乳动物表达载体的SCOH-SH3-b1-C和SCOH-SH4-b1-C，分别产生质粒pCLS2697和pCLS2705。

【（b）供体修复质粒】

对于SH3基因靶向实验，供体质粒含有：

●作为左同源性臂：SH3座位的PCR-产生的片段（第6染色体的第6850510～6852051位,NC_000006.11）。此片段具有1540bp的长度；

●作为右同源性臂：SH3座位的片段（第6染色体的第6852107～6853677位,NC_000006.11）。此片段具有1571bp的长度。

对于SH4基因靶向实验，供体质粒含有：

●作为左同源性臂：SH4座位的PCR-产生的片段（第7染色体的第114972751～114974269位,NC_000007.13）。此片段具有1519bp的长度；以及

●作为右同源性臂：SH4座位的片段（第7染色体的第114974316～114976380位,NC_000007.13）。此片段具有2065bp的长度。

对于SH3和SH4，左和右同源性臂分别被***含有2个CMV启动子和新霉素抗性基因的外源2.8kb DNA片段的上游（使用AscI位点）和下游（使用SbfI位点）。得到的质粒称之为pCLS3777（对于SH3）和pCLS3778（对于SH4）。

【（c）Sh3和Sh4基因靶向实验】

将人胚胎肾293H细胞（Invitrogen）以1×10⁶细胞每10cm皿的密度平铺到完全培养基（补充2mM L-谷氨酰胺,青霉素（100UI/ml），链霉素（100μg/ml），两性霉素B（Fongizone）（0.25μg/ml）（Invitrogen-Life Science）和10%FBS的DMEM）。次日，细胞用阳离子脂质体2000转染试剂（Invitrogen）根据提供商的流程转染。简言之，2μg的供体质粒用3μg的单链大范围核酸酶表达载体共转染。于37℃温育72小时之后，将细胞胰蛋白酶处理及以10或100细胞/孔平铺进96-孔板中的完全培养基。一旦细胞是80～100%汇合，基因组DNA提取用ZR-96基因组DNA试剂盒（Zymo research）根据提供商的流程进行。

【（d）基因靶向事件的PCR分析】

基因靶向频度通过在基因组DNA上使用以下引物PCR来测定：5’-CTGTGTGCTATGATCTTGCC-3’（SH3GHGF4;SEQ ID NO:50）和5’-CCTGTCTCTTGATCAGATCC-3’（NeoR2;SEQ ID NO:51）对于SH3，及5’-GTGGCCTCTCAGTCTGTTTA-3’（SH4GHGF2;SEQ ID NO:52）和5’-AGTCATAGCCGAATAGCCTC-3’（NeoR5;SEQ ID NO:53）对于SH4。PCR产生靶向特定PCR产物的2500bp（SH3）或2268bp（SH4）基因。SH3GHGF4和SH4GHGF2引物是位于供体修复质粒的左同源性臂上游的正向引物。NeoR引物是位于***供体修复质粒的2个同源性臂之间的外源DNA的反向引物。

【实施例4.2：结果】

人胚胎肾293H细胞用表达2个单链SH3或SH4大范围核酸酶之一的质粒和供体修复质粒pCLS3777或pCLS3778共转染。作为自发重组的对照，293H细胞也用供体修复质粒单独转染。细胞然后以10或100细胞/孔平铺到96-孔微平板。通过在材料和方法中描述的PCR分析源于这些细胞的基因组DNA的基因靶向。

在大范围核酸酶缺失（修复质粒单独）下，在10或100细胞组中分析的22560和18800细胞中无PCR阳性信号被检测到（对于SH3和SH4,分别）。

与此相反，在SH3大范围核酸酶存在下，在100细胞组中分析的18800细胞之中检测到12个阳性克隆，由此指示0.064%的重组频度。在SH4大范围核酸酶的存在下，在10细胞组中分析的3760细胞之中检测到11阳性，指示0.29%的重组频度。结果显示于下表X。这里所指的重组频度被低估，因为并非所有平铺的细胞再次起始***。平铺后的估计存活可由此估计为约33%。因此，重组频度是很可能被低估3倍。

表X

大范围核酸酶	细胞/孔	PCR+事件	基因靶向频度
				SH3	100	12/18800	0.064%
SH4	10	11/3760	0.29%
				SH4	100	15/18800	0.08%
无(有SH3修复质粒)	100	0/18800	NA
				无(有SH4修复质粒)	100	0/18800	NA

NA：不可应用的

这些结果展示，2个单链分子SCOH-SH3-b1-C和SCOH-SH4-b1-C能分别在内源性SH3和SH4座位诱导高水平的基因靶向。

【实施例5：加工靶向SH6座位的大范围核酸酶】

SH6是存在于第21染色体的包含24bp非-回文靶（TTAATACCCCGTACCTAATATTGC,SEQ ID NO:59）的座位。SH6位于Schwarzwaelder等人（J Clin Invest 2007:2241-9）中公开的RIS附近。SH6序列未包括在Deichman等人中描述的任何CIS中。

【实施例5.1．切割SH6的大范围核酸酶的鉴定】

由遗传加工构建异源二聚体形式的潜在地切割SH6靶序列的I-CreI变体。该变体对然后在酵母中共表达。共表达之后，获得3种分子，即2种同源二聚体及1种异源二聚体。然后测定是否异源二聚体能切割SEQ ID NO:59的SH6靶序列。

【（a）切割源于SH6靶序列的回文序列的I-CreI大范围核酸酶的变体的构建】

SH6序列部分是显示于图9的10AAT_P（SEQ ID NO:60），5CCC_P（SEQ ID NO:61），10AAT_P（SEQ ID NO:60），5TAG_P（SEQ ID NO:62）靶序列的组合。这些序列被如在国际PCT申请WO 2006/097784和WO 2006/097853，Arnould等人（J.Mol.Biol.,2006,355,443～458）和Smith等人（Nucleic Acids Res.,2006）描述获得的大范围核酸酶切割。由此，SH6应被自这些之前鉴定的大范围核酸酶得到的组合的变体切割。

2个回文靶，SH6.3和SH6.4，源于SH6（图9）。由于SH6.3和SH6.4是回文的，它们应被同源二聚体蛋白切割。因此，切割SEQ IDNO:63的SH6.3回文靶序列或SEQ ID NO:64的SH6.4回文靶序列的同源二聚体I-CreI变体使用源于Chames等人（Nucleic Acids Res.,2005,33,e178），Arnould等人（J.Mol.Biol.,2006,355,443～458），Smith等人（Nucleic Acids Res.,2006,34,e149）和Arnould等人（Arnould et al.J Mol Biol.2007371:49-65）描述的方法的方法构建。

【（b）靶载体的构建】

实验过程如在实施例1.1中描述，例外是使用对应于SH6靶序列的寡核苷酸（5’-TGGCATACAAGTTTTTAATACCCCGTACCTAATATTGCCAATCGTCTGTCA-3’）（SEQ ID NO:65）。

【（c）变体的共表达】

将酵母DNA从切割pCLS542和pCLS1107表达载体中的SH6.3和SH6.4靶的变体使用标准流程提取及用于转化大肠埃希氏菌（E.coli）。在缺少亮氨酸及含有G418的合成的培养基上选择转化体。

【（d）共表达大范围核酸酶的克隆的交配及在酵母中筛选】

【（e）结果】

在全部但2例中，切割SH6.4靶的10个变体及切割SH6.3靶的2个变体的共表达导致SH6.1靶的切割。这2例对应于未获得双转化体的。功能组合总结于表XI。

表XI

+指示功能组合

【实施例5.2．在CHO细胞中染色体外模型中SH6靶向切割的验证】

在以上实施例5.1中描述，当形成异源二聚体时，I-CreI变体在酵母中能有效切割SH6靶。为了鉴定在CHO细胞中对SH3靶显示最大切割活性的异源二聚体，使用在CHO细胞中的染色体外测定比较这些变体的一些的效率。在CHO细胞中的筛选是基于单-链退火（SSA）的检定，其中靶被大范围核酸酶的切割诱导同源重组和LagoZ报告基因（细菌lacZ基因的衍生物）的表达。

【（a）SH6靶克隆进用于CHO筛选的载体】

靶克隆如下：对应于侧接有关口克隆序列的SH6靶序列的寡核苷酸定购自PROLIGO5’-TGGCATACAAGTTTTTAATACCCCGTACCTAATATTGCCAATCGTCTGTCA-3’（SEQ ID NO:65）。将由单链寡核苷酸的PCR扩增产生的双链靶DNA使用关口流程（INVITROGEN）克隆进CHO报告载体（pCLS1058）。克隆的靶由测序（MILLEGEN）确证。

【（b）大范围核酸酶的再克隆】

将在实施例5.1中鉴定的切割SH6.3和SH6.4靶的I-CreI变体的ORF亚-克隆进pCLS2437。ORF通过PCR在酵母DNA上使用以下引物扩增：5’-AAAAAGCAGGCTGGCGCGCCTACACAGCGGCCTTGCCACCATG-3’（SEQ ID NO:66）和5’-AGAAAGCTGGGTGCTAGCGCTCGAGTTATCAGTCGG-3’（SEQ ID NO:67）引物。PCR产物使用用于内部片段取代的AscI和XhoI克隆进CHO表达载体pCLS2437。通过连接和大肠埃希氏菌（E.coli）转化步骤得到的选择的克隆由测序（MILLEGEN）确证。

【（c）哺乳动物细胞中的染色体外测定】

将CHO K1细胞用转染试剂根据提供商的流程（QIAGEN）转染。72小时转染之后，将培养基移出及添加150μl的用于β-半乳糖苷酶液体测定的裂解/泄漏缓冲剂（一般1l的缓冲剂含有：100ml的裂解缓冲剂（Tris-HCl 10mM pH7.5,NaCl 150mM,Triton×1000.1%,BSA 0.1mg/ml,蛋白酶抑制物），10ml的Mg 100×缓冲剂（MgCl₂ 100mM,β-巯基乙醇35%），110ml ONPG 8mg/ml和780ml的磷酸钠0.1M pH7.5）。于37℃温育后，在420nm处测量OD。整个过程在自动化的Velocity11 BioCel平台上进行。每测定，150ng的靶载体用12.5ng的两种变体各之一共转染（切割回文SH6.3靶的12.5ng的变体和切割回文SH6.4靶的12.5ng的变体）。

【（d）结果】

选择能在酵母中切割SH6的形成异源二聚体内切核酸酶的几个变体用于在瞬时转染中使用染色体外测定在CHO中确认。

能切割SH6.3的单体包含以下突变：44K 70S 75N（称之为SH63-M1-44K 70S 75N），和能切割SH6.4的单体包含以下突变：28Q40R 44A 70L 75N 96R 111H 144S（称之为SH6-4-MB-28Q 40R 44A70L 75N 96R 111H 144S）。

SH6序列的切割效率和重组的分析展示，I-CreI变体的测试的组合能无另外的突变地将其切割活性从酵母转座到CHO细胞。

【实施例5.3．切割SH6的大范围核酸酶的共价组装为单链和改良】

实施例5.1中描述的切割物的共表达导致酵母中SH6靶的高切割活性。已在哺乳动物表达***中就SH6切割确认它们之一（实施例5.2）。

M1x MA SH6异源二聚体在酵母中给出高切割活性。M1是相比I-CreI野生型序列带有以下突变的SH6.3切割物：44K 70S 75N。MA是相比I-CreI野生型序列带有以下突变的SH6.4切割物：7R 28Q 40R44A 70L 75N 103T 121E 132V 160R。

单链构建体使用接头RM2加工（AAGGSDKYNQALSKYNQALSKYNQALSGGGGS;SEQ ID NO:15）导致单链分子：MA-RM2-M1的产生。在此设计步骤期间，将G19S突变导入C-端M1突变体。此外，将突变K96E导入MA突变体和突变E8K，E61R导入M1突变体而创建单链分子：MA(K96E)-RM2-MA(E8K E61R)，其还被称之为SCOH-SH6b1支架。

4个另外的氨基-酸取代已见于之前研究增强I-CreI衍生物的活性：这些突变对应于苯丙氨酸54用亮氨酸（F54L），谷氨酸80用赖氨酸（E80K），缬氨酸105用丙氨酸（V105A）和异亮氨酸132用缬氨酸的取代（I132V）。将一些组合导入N-端和C-端蛋白片段的编码序列，及检定第1批得到的蛋白的诱导SH6靶切割的能力。

【（a）另外的突变导入SC-OH单链构建体】

通过使用盒自Stratagene/Agilent technologies Inc的QuikChange多位点-针对诱变试剂，根据生产商的使用说明导入另外的突变。第1组寡核苷酸用于将突变导入对应于第1单体的单链分子部分。第2组寡核苷酸设计为将相同的突变特别导入对应于第2单体的单链分子的第2部分，如显示于（见表XII）。

表XII

对关于此过程获得的分离的克隆测序，以确认获得的特定突变特征。然后相比如描述的初始构建体，在CHO SSA测定中测试目标特征。

【（b）哺乳动物细胞中的染色体外测定】

CHO K1细胞如上述转染。72小时转染之后，将培养基移出及添加150μl的用于β-半乳糖苷酶液体测定的裂解/泄漏缓冲剂。于37℃温育后，在420nm处测量OD。整个过程在自动化的Velocity11 BioCel平台上进行。

每测定，将150ng的靶载体用自3.12ng到25ng的增加的量的变体DNA(25ng的单链DNA对应于12,5ng+12,5ng的异源二聚体DNA）共转染。最终，转染的DNA变体DNA量是3.12ng，6.25ng，12.5ng和25ng。使用空载体（pCLS0001）转染的DNA的总量完成为175ng（靶DNA,变体DNA,载体DNA）。

【（c）结果】

使用之前描述的CHO测定，通过将形成异源二聚体的SH6.3-M1x SH6.4-MB和我们的内部对照SCOH-RAG和I-Sce I大范围核酸酶比较来监控针对SH6靶的SCOH-SH6-b1-C（pCLS2796）和SCOH-SH6-b1-B-(pCLS2928)单链分子的活性（见表XIII）。全部比较以3.12ng，6.25ng，12.5ng和25ng转染的变体DNA进行（图10）。相比起始的异源二聚体，2个单链大范围核酸酶能更有效切割SH6靶。最佳分子，SCOH-SH6-b1-C的活性，还通过在上述那些之中将另外的突变导入新批大范围核酸酶来改善。

表XIII

还将另外的突变根据材料和方法导入单链支架。将获得的及测试的分子列于表XIV。

表XIV

在描述的条件中全部变体是有活性的，及依赖于它们带有的突变特征，在检定的剂量后共享特定行为（图10）。例如，QCSH61-H01a，b，c，d与我们的内部标准SCOH-RAG具有类似特征。它们甚至以低剂量是非常有活性的分子。全部这些变体可用于SH6基因组靶向。

【实施例6：在人细胞中在内源性SH6座位的基因靶向】

为了确证加工的单链SH6大范围核酸酶的切割活性，评价它们的刺激在内源性SH6座位的同源重组的能力。将细胞用用于单链分子SCOH-QCSH6-H01（SEQ ID NO:81;pCLS3690）或SCOH-QC-SH6-H01-V2-7E-70R75D（SEQ ID NO:85;pCLS4373）的哺乳动物表达质粒和含有侧接有2个均1.5kb长，与SH6座位同源的序列的2.8kb的外源DNA序列的供体修复质粒pCLS3779（图13;SEQ ID NO:279）转染。天然SH6座位被大范围核酸酶的切割产生用于同源重组的底物，其可使用含有侧接有同源性臂的2.8kb的外源DNA的供体修复质粒作为修复基质。由此，在SH6座位靶向的整合发生的频度是基因组SH6靶位点的切割效率的指标。

【实施例6.1．材料和方法】

【（a）大范围核酸酶表达质粒】

此例中使用的大范围核酸酶是克隆进哺乳动物表达载体的SCOH-QCSH6-H01（SEQ ID NO:81）或SCOH-QC-SH6-H01-V2-7E-70R75D（SEQ ID NO:85），其分别产生质粒pCLS3690（图13）和pCLS4373。

【（b）供体修复质粒】

供体质粒含有SH6座位的PCR产生的1517bp片段（第21染色体的第18437771～18439287位,NC_000021.8）作为左同源性臂和SH6座位的1571bp片段（第21染色体的第18439343～18440846位,NC_000021.8）作为右同源性臂。将左和右同源性臂分别***含有2个CMV启动子和新霉素抗性基因的外源2.8kb DNA片段的上游（使用AscI位点）和下游（使用SbfI位点）。得到的质粒是pCLS3779（图13;SEQ ID NO:279）。

【（c）Sh6基因靶向实验】

人胚胎肾293H细胞（Invitrogen）以1×10⁶细胞每10cm皿的密度平铺到完全培养基（补充2mM L-谷氨酰胺,青霉素（100UI/ml），链霉素（100μg/ml），两性霉素B（Fongizone）（0.25μg/ml）（Invitrogen-Life Science）和10%FBS的DMEM）。次日，细胞用阳离子脂质体2000转染试剂（Invitrogen）根据提供商的流程转染。简言之，2μg的供体质粒用3μg的单链大范围核酸酶表达载体共转染。于37℃温育72小时之后，将细胞胰蛋白酶处理及以10或100细胞/孔平铺进96-孔板中的完全培养基。或者，于37℃温育72小时之后，将细胞胰蛋白酶处理及以300细胞每皿平铺进10cm皿中的完全培养基。于37℃温育2周后，挑选个体克隆细胞集落及平铺进96-孔板中的完全培养基。一旦细胞是80～100%汇合，基因组DNA提取用ZR-96基因组DNA试剂盒（Zymo research）根据提供商的流程进行。

【（d）基因靶向事件的PCR分析】

通过在基因组DNA上使用引物PCR来测定基因靶向的频度，所述引物为SH6GHGF3：5’-CAATGGAGTTTTGGAGCCAC-3’（SEQID NO:280）和NeoR9：5’-ATCAGAGCAGCCGATTGTCT-3’（SEQID NO:281）。PCR导致靶向特定PCR产物的2300bp基因（图14）。SH6GHGF3引物是位于供体修复质粒的左同源性臂上游的正向引物。NeoR9引物是位于***供体修复质粒的2个同源性臂之间的外源DNA的反向引物。

【实施例6.2．结果】

人胚胎肾293H细胞用2个载体共转染：表达2个单链SH6大范围核酸酶之一的质粒和供体修复质粒pCLS3779（图13;SEQ ID NO:279）。作为自发重组的对照，293H细胞也用供体修复质粒单独转染。细胞然后以10或100细胞/孔平铺进96-孔微平板或以300细胞/10cm皿，和2周后分离克隆集落及平铺进96-孔微平板。通过在材料和方法中描述的PCR分析源于这些细胞的基因组DNA的基因靶向。在大范围核酸酶缺失（修复质粒单独）下，在10或100细胞组中分析的67680细胞之中检测到5个PCR阳性信号，指示0.007%的自发重组频度。相反，在SCOH-QCSH6-H01（SEQ ID NO:81;pCLS3690）或SCOH-QC-SH6-H01-V2-7E-70R75D大范围核酸酶（SEQ ID NO:85;pCLS4773）的存在下，在10或100细胞组中分析的73320和18800细胞之中检测到177和35个阳性，分别指示0.24%和0.19%的重组频度。结果显示于表XV。这些结果展示，2个单链分子SCOH-QCSH6-H01（SEQ ID NO:81;pCLS3690）和SCOH-QC-SH6-H01-V2-7E-70R75D（SEQ ID NO:85;pCLS4773）能诱导高水平的在内源性sh6座位的基因靶向。

表XV：在人293H细胞中sh6座位的基因靶向事件的频度

NA：不可应用的

【实施例7：在基因靶向之后，在人细胞中内源性sh6座位的转基因表达】

为了确证sh6座位支持在加工的单链SH6大范围核酸酶sh6座位切割活性的转基因表达的能力，用含有新霉素-抗性基因表达盒的修复质粒进行基因靶向实验，和测量修饰的细胞在含有新霉素的培养基中生长的能力。新霉素的存在下细胞的存活和生长依赖于新霉素-抗性基因的表达，因此指示在靶向的整合后在SH6座位的转基因表达。

【实施例7.1．材料和方法】

【（a）大范围核酸酶表达质粒】

此例中使用的大范围核酸酶是克隆进哺乳动物表达载体的SCOH-QCSH6-H01（SEQ ID NO:81），其产生质粒pCLS3690。

【（b）供体修复质粒】

【（c）Sh6基因靶向实验】

人胚胎肾293H细胞（Invitrogen）以1×10⁶细胞每10cm皿的密度平铺到完全培养基（补充2mM L-谷氨酰胺,青霉素（100UI/ml），链霉素（100μg/ml），两性霉素B（Fongizone）（0.25μg/ml）（Invitrogen-Life Science）和10%FBS的DMEM）。次日，细胞用阳离子脂质体2000转染试剂（Invitrogen）根据提供商的流程转染。简言之，2μg的供体质粒用3μg的单链大范围核酸酶表达载体共转染。于37℃温育72小时之后，将细胞胰蛋白酶处理及以300细胞每皿平铺进10cm皿中的完全培养基。于37℃温育2周后，挑选个体克隆细胞集落及平铺进96-孔板中的完全培养基。于37℃温育1周之后，细胞胰蛋白酶处理，以2个重复平铺到96-孔板及于37℃温育。一旦细胞是80～100%汇合，基因组DNA提取在重复板之一上用ZR-96基因组DNA试剂盒（Zymo research）根据提供商的流程进行。其他重复用于分离基因-靶向的克隆，及扩展它们。

【（d）基因靶向的克隆的PCR鉴定】

通过在基因组DNA上使用引物PCR来测定基因靶向，所述引物为SH6GHGF3：5’-CAATGGAGTTTTGGAGCCAC-3’（SEQ ID NO:280）和NeoR9：5’-ATCAGAGCAGCCGATTGTCT-3’（SEQ ID NO:281）。PCR导致靶向特定PCR产物的2300bp基因（图14）。SH6GHGF3引物是位于供体修复质粒的左同源性臂上游的正向引物。NeoR9引物是位于***供体修复质粒的2个同源性臂之间的外源DNA的反向引物。

【（e）由DNA印迹的靶向的整合的验证】

自细胞克隆的基因组DNA用StuI或HindIII限制酶（NewEngland Biolabs）消化，通过在0.8%琼脂糖凝胶上电泳来分离及转移到硝酸纤维素膜。从与新霉素抗性基因同源的25ng的DNA片段，用³²P-放射性标记的dCTP和Rediprime II随机启动标记***（GEHealthcare），根据提供商的流程制备DNA探针，及添加到在杂交缓冲剂（NaPi 20mM,7%SDS,1mM EDTA）预温育的硝酸纤维素膜。于65℃过夜温育后，将膜洗涤及暴露于放射照相膜。放射照相上预期的条带的尺寸是：对于StuI消化是5.3kb，和对于HindIII消化是6.8kb（图15）。

【（f）新霉素-抗性测试】

由PCR鉴定的细胞克隆，如在SH6座位靶向，在G418抗生素的存在下以300细胞/孔平铺到96-孔微平板（PAA实验室）。于37℃10天的温育后，使用Vialight bioassay试剂盒（Lonza）和Victor发光读取器（Perkin Elmer）根据提供商的流程测量活力。

【实施例7.2．结果】

人胚胎肾293H细胞用2个载体共转染：表达2个单链SH6大范围核酸酶之一的质粒和供体修复质粒pCLS3779。细胞然后以300细胞每10cm 平铺，和2周后分离克隆集落，及平铺进96-孔微平板。通过在材料和方法中描述的PCR分析源于这些细胞的基因组DNA的基因靶向。基因组DNA然后用于由DNA印迹分析确证靶向的整合。克隆编号7和8显示预期的尺寸的条带，然而阴性对照克隆编号5和6则未显示（图16）。测试那些细胞克隆的在G418的存在下生存的能力（PAA实验室）。仅具有靶向的整合的克隆（编号7和8）以高于0.4mg/ml的浓度显示对G418的抗性（图16）。此指示，在sh6座位的靶向的整合可支持功能转基因表达。

【实施例8．在基因靶向之后，在人细胞中内源性sh6座位的相邻基因表达】

为了确证在sh6座位不搅乱相邻基因的表达地支持转基因整合的能力，用含有2.8kb外源DNA片段的修复质粒进行基因靶向实验，和细胞克隆鉴定为含有靶向的整合。测量sh6整合位点的上游和下游基因的表达，及与未经历靶向的整合的细胞克隆比较。

【实施例8.1．材料和方法】

【（a）大范围核酸酶表达质粒】

【（b）供体修复质粒】

【（c）Sh6基因靶向实验】

人胚胎肾293H细胞（Invitrogen）以1×10⁶细胞每10cm皿的密度平铺到完全培养基（补充2mM L-谷氨酰胺,青霉素（100UI/ml），链霉素（100μg/ml），两性霉素B（Fongizone）（0.25μg/ml）（Invitrogen-Life Science）和10%FBS的DMEM）。次日，细胞用阳离子脂质体2000转染试剂（Invitrogen）根据提供商的流程转染。简言之，2μg的供体质粒用3μg的单链大范围核酸酶表达载体共转染。于37℃温育72小时之后，将细胞胰蛋白酶处理及以300细胞每皿平铺进10cm皿中的完全培养基。于37℃温育2周后，挑选个体克隆细胞集落及平铺进96-孔板中的完全培养基。于37℃温育1周之后，将细胞胰蛋白酶处理，以2个重复平铺到96-孔板及于37℃温育。一旦细胞是80～100%汇合，基因组DNA提取在重复板之一上用ZR-96基因组DNA试剂盒（Zymo research）根据提供商的流程进行。其他重复用于分离基因-靶向的克隆，及扩展它们。

【（d）基因靶向的克隆的PCR鉴定】

通过在基因组DNA上使用引物PCR来测定基因靶向，所述引物为SH6GHGF3：5’-CAATGGAGTTTTGGAGCCAC-3’（SEQ ID NO:280）和NeoR9：5’-ATCAGAGCAGCCGATTGTCT-3’（SEQ ID NO:281）。PCR导致靶向特定PCR产物的2300bp基因（图XX）。SH6GHGF3引物（SEQ ID NO:280）是位于供体修复质粒的左同源性臂上游的正向引物。NeoR9引物（SEQ ID NO:281）是位于***供体修复质粒的2个同源性臂之间的外源DNA的反向引物。

【（e）自sh6座位上游和下游的基因的表达】

基因表达由定量RT-PCR测量。从亚汇合细胞克隆使用RNeasyRNA分离试剂盒（Qiagen）根据生产商的流程分离RNA。将3μg的RNA用于使用Superscript III第1-链试剂盒（Invitrogen）产生cDNA。对10ng的cDNA/12μL-反应，以一式两份样品，使用

预混合Ex Taq^TM DNA聚合酶（Lonza），在Stratagene MPX3000仪器上进行定量PCR。对于各基因，使用的引物将列于以下表：

由ROX参照染料标准化之后，用对荧光（dRn）的Stratagene软件测定阈值循环（Ct）。使用式2^{Ct(HPRT)-Ct(基因)}计算基因表达的强度，将持家基因HPRT的表达用作内部标准化因子。

【实施例8.2．结果】

人胚胎肾293H细胞用2个载体共转染：表达3个单链SH6大范围核酸酶之一的质粒和供体修复质粒pCLS3779。细胞然后以300细胞每10cm皿平铺，和2周后分离克隆集落及平铺进96-孔微平板。通过在材料和方法中描述的PCR分析源于这些细胞的基因组DNA的基因靶向。从显示靶向的整合和阴性对照的克隆分离RNA。进行定量RT-PCR，以测量靶向的整合座位周围的基因的表达。数据显示于图17，其中在用持家基因HPRT标准化之后，对于对3个个体靶向的克隆（KI）和3个个体非-靶向的克隆（WT）显示两份样品的平均强度。对测量的各5个基因未观察到显著差异，指示，在sh6座位的靶向的整合对相邻基因的表达无影响。

【实施例9：在人细胞中在内源性安全港座位的诱变】

为了确证加工的单链安全港大范围核酸酶的切割活性，评价它们的刺激在内源性人安全港座位的诱变的能力。细胞用用于单链分子的哺乳动物表达质粒转染。天然安全港座位被大范围核酸酶的切割产生用于非-同源端接合的底物，其为错误-倾向过程，和可在大范围核酸酶靶位点导致小***或缺失。由此，突变在内源性安全港座位发生的频度是基因组靶位点被大范围核酸酶的切割效率的指标。

【实施例9.1．材料和方法】

【（a）大范围核酸酶表达质粒】

此例中使用的大范围核酸酶的编码序列克隆进哺乳动物表达载体，其产生表XVI中列的质粒。

表XVI：靶向安全港序列的大范围核酸酶

【（b）安全港座位诱变实验】

人胚胎肾293H细胞（Invitrogen）以1×10⁶细胞每10cm皿的密度平铺到完全培养基（补充2mM L-谷氨酰胺,青霉素（100UI/ml），链霉素（100μg/ml），两性霉素B（Fongizone）（0.25μg/ml）（Invitrogen-Life Science）和10%FBS的DMEM）。次日，细胞用3μg的单链大范围核酸酶表达载体，使用阳离子脂质体2000转染试剂（Invitrogen），根据提供商的流程转染。于37℃温育2～6天后，将细胞胰蛋白酶处理及基因组DNA提取用DNeasy血和组织试剂盒（Qiagen）根据提供商的流程进行。

【（c）诱变事件的深度测序分析】

诱变频度通过深度测序分析测定。设计寡核苷酸用于各安全港靶周围的DNA片段的PCR扩增及列于表XVII。

表XVII：用于安全港靶的诱变分析的PCR引物

加入核苷酸，以获得侧接有由提供测序服务的公司（GATC生物技术AG,德国），在454测序***（454 Life Sciences）上提供的特定适体序列（5’-CCATCTCATCCCTGCGTGTCTCCGACTCAG-3’;SEQ ID NO:324）和（5’-CCTATCCCCTGTGTGCCTTGGCAGTCTCAG-3’;SEQ IDNO:325）的片段。从2～3个扩增子组（500ng各）得到18,000序列的平均。测序之后，基于导入以上适体的第1个的条码序列鉴定不同样品。

【实施例9.2．结果】

人胚胎肾293H细胞用表达单链安全港大范围核酸酶的质粒转染。于37℃温育2～6天后，将基因组DNA分离及使用PCR扩增大范围核酸酶靶位点周围的基因组序列。然后分析序列中各安全港靶的切割位点中***或缺失事件（InDel）的存在。结果总结于表XVIII。

表XVIII：由靶向安全港座位的大范围核酸酶的诱变

【实施例10：结论】

结果，实施例1，2，3和5展示，可获得能切割SH3，SH4和SH6座位的I-CreI异源二聚体蛋白和单链大范围核酸酶。而且，这些内切核酸酶能以强切割活性切割这些座位。

实施例4展示，能切割SH3和SH4座位的单链大范围核酸酶允许将转基因有效***人细胞的靶位点。

这些内切核酸酶可由此有利地用于将转基因***个体的SH3，SH4座位或SH6座位。

实施例6展示，本发明的至少2个单链分子能在内源性sh6座位诱导高水平的基因靶向。

实施例7展示，靶向的整合座位可支持功能性转基因表达。

实施例8展示，在座位的靶向的整合基本上不修饰位于靶序列附近的5个基因的表达。

实施例9展示，靶向安全港序列的不同大范围核酸酶的诱变频度，其为基因组靶位点被所述大范围核酸酶的切割效率的指标。

Claims

1.能切割用于将转基因***个体的基因组的靶序列的变体内切核酸酶，其中

（i）所述基因组含有包含所述靶序列的座位；以及

2.权利要求1的内切核酸酶，其中所述转基因的***基本上不修饰位于靶序列附近的基因的表达。

3.权利要求1或2的内切核酸酶，其中所述靶序列位于离最近基因至少100kb的距离处。

4.权利要求1～3之任一项的内切核酸酶，其中所述内切核酸酶是寻靶内切核酸酶。

5.权利要求1～4之任一项的内切核酸酶，其中所述内切核酸酶能切割位于选自下列的座位之内的靶序列：人染色体21q21.1上的SH6座位，人染色体6p25.1上的SH3座位，人染色体7q31.2上的SH4座位，人染色体13q34上的SH12座位，人染色体3p12.2上的SH13座位，人第22染色体上的SH19座位，人染色体12q21.2上的SH20座位，人染色体3p24.1上的SH21座位，人染色体6p12.2上的SH33座位，人染色体2p16.1上的SH7座位，人第5染色体上的SH8座位，SH18座位，SH31座位，SH38座位，SH39座位，SH41座位，SH42座位，SH43座位，SH44座位，SH45座位，SH46座位，SH47座位，SH48座位，SH49座位，SH50座位，SH51座位，SH52座位，SH70座位，SH71座位，SH72座位，SH73座位，SH74座位，SH75座位，SH101座位，SH106座位，SH107座位，SH102座位，SH105座位，SH103座位，SH104座位，SH113座位，SH109座位，SH112座位，SH108座位，SH110座位，SH114座位，SH116座位，SH111座位，SH115座位，SH121座位，SH120座位，SH122座位，SH117座位，SH118座位，SH119座位，SH123座位，SH126座位，SH128座位，SH129座位，SH124座位，SH131座位，SH125座位，SH127座位，SH130座位，SH11座位，SH17座位，SH23座位，SH34座位，SH40座位，SH53座位，SH54座位，SH55座位，SH56座位，SH57座位，SH58座位，SH59座位，SH60座位，SH61座位，SH62座位，SH65座位，SH67座位，SH68座位和SH69座位。

6.变体二聚I-CreI蛋白，其包含各包含与SEQ ID NO:1或SEQID NO:42具有至少80%同一性的序列的2个单体，其中：

（i）所述二聚I-CreI蛋白能切割位于个体的座位之内的靶序列，所述靶序列位于离反转录病毒***位点（RIS）至多200kb的距离处，及所述RIS既不与癌关联也不与异常细胞增殖关联；以及

（ii）所述靶序列不包含SEQ ID NO:4的序列。

7.权利要求6的二聚I-CreI蛋白，其中所述二聚I-CreI蛋白能切割位于选自下列的座位之内的靶序列：人染色体21q21.1上的SH6座位，人染色体6p25.1上的SH3座位，人染色体7q31.2上的SH4座位，人染色体13q34上的SH12座位，人染色体3p12.2上的SH13座位，人第22染色体上的SH19座位，人染色体12q21.2上的SH20座位，人染色体3p24.1上的SH21座位，人染色体6p12.2上的SH33座位，人染色体2p16.1上的SH7座位，人第5染色体上的SH8座位，SH18座位，SH31座位，SH38座位，SH39座位，SH41座位，SH42座位，SH43座位，SH44座位，SH45座位，SH46座位，SH47座位，SH48座位，SH49座位，SH50座位，SH51座位，SH52座位，SH70座位，SH71座位，SH72座位，SH73座位，SH74座位，SH75座位，SH101座位，SH106座位，SH107座位，SH102座位，SH105座位，SH103座位，SH104座位，SH113座位，SH109座位，SH112座位，SH108座位，SH110座位，SH114座位，SH116座位，SH111座位，SH115座位，SH121座位，SH120座位，SH122座位，SH117座位，SH118座位，SH119座位，SH123座位，SH126座位，SH128座位，SH129座位，SH124座位，SH131座位，SH125座位，SH127座位，SH130座位，SH11座位，SH17座位，SH23座位，SH34座位，SH40座位，SH53座位，SH54座位，SH55座位，SH56座位，SH57座位，SH58座位，SH59座位，SH60座位，SH61座位，SH62座位，SH65座位，SH67座位，SH68座位和SH69座位。

8.权利要求6或7的二聚I-CreI蛋白，其中所述二聚I-CreI蛋白能切割位于人染色体21q21.1上的SH6座位之内的靶序列。

9.权利要求8的二聚I-CreI蛋白，其中所述靶序列包含SEQ IDNO:59的序列。

10.融合蛋白，其包含权利要求6～9之任一项中定义的二聚I-CreI蛋白的单体。

11.权利要求10的融合蛋白，其中所述融合蛋白包含选自下列的序列：SEQ ID NO:81，82～85，294，295，76～80，25～40，86～96，127～150，182～213，235～270和275～278。

12.核酸，其编码权利要求1～5之任一项中定义的内切核酸酶或权利要求6～11之任一项中定义的蛋白。

13.表达载体，其包含权利要求12中定义的核酸。

14.权利要求13的表达载体，其还包含靶向构建体，所述靶向构建体包含：

转基因、和

与侧接被权利要求1～5之任一项中定义的内切核酸酶或权利要求6～11之任一项中定义的蛋白识别的靶序列的基因组序列同源的2个序列。

15.下列之组合：

●权利要求13中定义的表达载体；以及

●包含靶向构建体的载体，所述靶向构建体包含转基因和与被权利要求1～5之任一项中定义的内切核酸酶或权利要求6～11之任一项中定义的蛋白识别的靶序列的基因组序列同源的2个序列。

16.药物组合物，其包含：

权利要求14中定义的表达载体或权利要求15中定义的组合，及

药学可接受的载体。

17.权利要求1～5之任一项的内切核酸酶，或

权利要求6～11之任一项的蛋白，或

权利要求12的核酸，或

权利要求13或14的表达载体，或

权利要求15的组合，

用于将转基因***细胞，组织或非-人动物的基因组的用途，其中所述用途不是治疗性的。

18.权利要求17的用途，其用于制造遗传性病症的非-人动物模型。

19.权利要求17的用途，其用于产生重组蛋白。

20.获得适合于将转基因***个体的基因组的内切核酸酶的方法，包含下列步骤：

（a）在所述个体的基因组之内选择既不与癌关联也不与异常细胞增殖关联的反转录病毒***位点（RIS）；