CN100584945C

CN100584945C - 调节基因表达的核被膜和核纤层结合嵌合体

Info

Publication number: CN100584945C
Application number: CN03802361A
Authority: CN
Inventors: 世良尚
Original assignee: Syngenta Participations AG
Current assignee: Syngenta Participations AG
Priority date: 2002-01-18
Filing date: 2003-01-17
Publication date: 2010-01-27
Anticipated expiration: 2023-01-17
Also published as: WO2003062447A2; WO2003062447A3; US20050170348A1; AU2003212816B2; CA2472729A1; JP2005514957A; CN1617732A; EP1485108A2; EP1485108A4

Abstract

本发明涉及包含核被膜和/或和纤层结合结构域和DNA结合结构域的核酸靶特异性嵌合蛋白质。这些蛋白质，以及编码这些蛋白质的核酸，可以用于阻抑或下调选定的基因的表达的方法中。所述DNA结合结构域优选来自天然存在的锌指蛋白质(ZFP)或人工锌指蛋白质(AZP)。本发明还提供了基因调节的分子开关***。

Description

调节基因表达的核被膜和核纤层结合嵌合体

技术领域

本发明涉及包含核被膜(nuclear-envelope)和/或核纤层(nuclear-lamina)结合结构域和DNA结合结构域的核酸靶特异性嵌合蛋白质。这些蛋白质，以及编码这些蛋白质的核酸，可以用于调节基因表达的方法中，特别是用于阻抑或下调选定的靶基因的表达。所述DNA结合结构域优选来自天然存在的锌指蛋白质(ZFP)或人工锌指蛋白质(AZP)。本发明还涉及基因阻抑和去阻抑的分子开关***。

背景技术

基因转录阻抑可以通过多种机制完成。一个经典的例子是lac阻抑子，当其结合在lac操纵子上的靶序列时，其阻止RNA聚合酶结合并由此阻止转录的起始。真核生物中，存在其它的机制控制基因阻抑。例如，组成性异染色质中发现的基因是转录沉默的。异染色质不是随机定位的，其看来和核周边(nuclear periphery)有关[Cohen等，(2001)Trends Biochem.Sci.26：41-47]，暗示将基因带入异染色质附近或核周边可能至少部分地在基因沉默中起作用。

转录阻抑子也发现于真核生物的核周边中。某些情况下，看来这样的蛋白质当位于核周边时只具有阻抑子活性。高等真核生物(多细胞动物及以上)的核周边由具有内膜和外膜的核被膜(NE)和核纤层组成。核纤层位于内层核膜的下面，由称为核纤层蛋白和核纤层相关蛋白(LAP)的中间丝组成。某些LAP也是内层核膜的内在膜蛋白。Cohen等提供了关于几个不同物种的核纤层组合物的讨论。

Oct-1是一种老化相关胶原酶基因的阻抑子。实验证明Oct-1从核周边的解离诱导了胶原酶基因表达[Imai等(1997)Mol.Biol.Cell 8：2404-2419]。而且，当视网膜母细胞瘤蛋白(Rb)的活性形式和转录因子E2F关联时，复合物和核纤层蛋白A/C体内共定位于核周边并阻抑转录[Mancini等(1999)Dev.Biol.215：288-297]。也参与基因阻抑的小鼠germ-cell-less蛋白(germ-cell-less protein，GCL)，[Nili等(2001)J.Cell.Sci.114：3297-3307]，被报道在核纤层结合LAP2

[Cohen等]。

转录因子和其它DNA结合蛋白质以序列特异性的方式结合它们的靶以调节基因表达因而激活或阻抑靶基因的表达。基因表达调节可以通过时间(例如，在发育或细胞周期的不同时间)和/或空间(例如，在不同的组织中)实现。一些情况下，可能希望在特定的时间或特定的细胞类型中关闭非所需基因的表达。例如，和肿瘤相关联和肿瘤发生中激活的基因可能是阻抑的靶。因为异染色质和位于核周边的基因已知是沉默的，一个携带基因进入与核周边关联的序列特异性的方法可以提供沉默或下调(阻抑)那个靶基因表达的途径。或者，从阻抑状态释放基因(即去阻抑或激活这些基因)的方法也是有价值的。

然而，已知的转录因子具有有限的应用-这样的蛋白质用于控制和它们的天然靶序列相关的基因或用于一组有限制的密切相关的靶序列。一个克服这个缺点的方法是设计和构建具有预先确定的序列特异性的DNA结合蛋白质，特别是对大的，复杂的基因组中的唯一的靶序列。一个显示可以这样操纵的特别种类的蛋白质是锌指蛋白质(ZFP)。

ZFP是熟知的DNA结合蛋白质，其通过和ZFP的每个锌指的α-螺旋中特定氨基酸的靶序列相互作用识别和结合DNA靶序列。ZFP典型地含有3到9个且有时更多个锌指，而且存在许多类ZFP；综述见例如，Laity等，(2001)Curr.Opin.Struct.Biol.11：39-46。Cys₂His₂类ZFP被广泛研究并证明其在发展通用识别密码中有用，该密码可以涉及结合预先确定的DNA靶序列的人工锌指蛋白质(AZP)。见，例如，Wolfe等，(2000)Ann.Rev.Biophys.Biomol.Struct.29：183-212；；Choo等，(2000)Curr.Opin.Struct.Biol.10：411-416；Segal等，(1999)Proc.Natl.Acad.Sci.USA 96：2758-2763；Kim等，(1998)Proc.Natl.Acad.Sci.USA 95：2812-2817；和U.S.Serial No.09/911,261，Takashi Sera于2001年7月23日递交，名称为″Zinc Finger Domain Recognition Code and Uses Thereof″。

获得AZP可以设计能够调节和任何独特序列而不仅是已知的调节序列有关的靶基因的蛋白质。当这些AZP(或其它DNA结合蛋白质)和一或多个能够与核周边相关联的蛋白质结构域结合，就产生了一个嵌合蛋白质，其可以用来结合核靶基因关联的核苷酸序列并定位该靶基因于核周边以进行沉默或下调。当这些嵌合蛋白质的结构域被重排为分子开关***时，可能提供激活或阻抑基因表达的***。

发明内容

本发明涉及核酸靶特异性的嵌合蛋白质，其具有一或多个能够特异性结合与靶基因相关联的核苷酸序列的第一结构域并具有一或多个能够与核周边相关联或结合的第二结构域。这些蛋白质在调节基因表达中有用。

多个第一核第二结构域，优选1到5个额外的结构域还可以存在在本发明的嵌合蛋白质中。优选第一结构域是一种AZP且优选第二结构域是一种GCL蛋白质。在某些实施方案中，所述嵌合蛋白质可包括额外的结构域以易于细胞摄取和/或转运到核。

本发明其它方面提供了分离的编码本发明嵌合蛋白质的核酸，包含核酸的表达载体，和以所述表达载体(通过任何方法)转化的宿主细胞。这样的宿主细胞可以用于，例如通过在表达该嵌合蛋白质的条件下培养所述宿主细胞一段时间再回收该嵌合蛋白质的制备嵌合蛋白质的方法。另外宿主细胞可以用为表达载体的来源以通过基因转移方法输送所述嵌合蛋白质到细胞或生物体中。另外，本发明提供了这些嵌合蛋白质，核酸和表达载体的药物组合物。

本发明的另一个方面涉及将靶核酸与本发明嵌合蛋白质结合的方法，其通过将所述靶核酸(具有与靶基因相关联的核苷酸序列)与足够量的本发明的嵌合蛋白质接触足够的时间以便该蛋白质结合所述靶核酸而实现。在一个优选的实施方案中，所述嵌合蛋白质通过将一种核酸导入细胞中以进行体内结合。或者，本发明提供了可以用于体外结合分析的嵌合蛋白质。

本发明的另一方面提供了一种阻抑或下调靶基因表达的方法，包含将一种含有与靶基因相关联或足够近的核苷酸的核酸与本发明的足够量的嵌合蛋白质接触一段足够的时间，以便相对于合适的对照而言，所述蛋白质降低所述靶基因的表达水平。某些实施方案中，将嵌合蛋白质作为一种蛋白质或作为一种编码该嵌合蛋白质的核酸导入细胞或生物体中。

在试图结合靶核酸的方法或试图阻抑基因表达的方法中，所述靶基因编码，或所述靶核苷酸序列位点是来自或控制一种植物基因，一种哺乳动物基因，一种昆虫基因，一种酵母基因或来自一种病毒如DAN病毒。当所述靶基因或位点来自哺乳动物，它可能编码或控制一种细胞因子，一种白细胞介素，一种癌基因，一种抗血管发生因子，一种药物抗性基因和/或任何其它所需的允许选定的基因被带入核周边附近因而产生沉默或下调的靶。感兴趣的植物基因包括，但非限于，番茄，玉米，水稻和谷类植物的基因。而且，多种具有共同核苷酸靶序列的靶基因可以协同或同时被控制。

本发明的另一方面涉及用于基因阻抑的分子开关***。这些***包含(a)具有可以特异性结合与靶基因相关联的核苷酸序列的第一结构域的第一融合蛋白，和可以特异性结合一个二价配体的第一结合部分的第二结构域，其中所述配体可以被细胞摄取，及所述第一结构域和第二结构域互为异源；和(b)包含可以关联所述核周边核的第一结构域和可以特异性结合所述二价配体的第二结合部分的第二结构域的第二融合蛋白。所述第一融合蛋白的第一结构域和本发明的嵌合蛋白质的第一结构域相同；及所述第二融合蛋白的第一结构域和本发明的嵌合蛋白质的第二结构域相同。所述2个融合蛋白的第二结构域可以是分别对所述配体结合部分具有特异性的抗体的单链可变区(scFv)。

本发明的其它方面提供了分离的编码本发明基因阻抑的融合蛋白的核酸，包含这些核酸的表达载体，和用所述表达载体(通过任何方法)转化的宿主细胞。这样的宿主细胞可以用于通过培养所述宿主细胞一段时间并在一定条件下表达所述融合蛋白质及回收所述融合蛋白质的制备融合蛋白质的方法中。另外所述宿主细胞可以用作表达载体的来源以通过基因转移方法运送所述融合蛋白待细胞或生物体中。另外，本发明提供了这些融合蛋白，所述分子开关***，核酸和表达载体的药物组合物。

用于基因阻抑的分子开关可以用于在时间上或空间上阻抑靶基因表达的方法中，其通过(a)将含有具有与靶基因相关联的核苷酸序列的核酸的细胞或生物体与这些分子开关***接触，及(b)将所述细胞或生物体与所述分子开关相同的二价配体在同时或同地接触以在所述融合蛋白质间形成复合物因而通过将所述靶基因定位到核周边核周边来阻抑所述靶基因的表达。这个分子开关***的融合蛋白质可以作为蛋白质，一或多个编码一或多个这些蛋白质的核酸，或其组合导入细胞或生物体中。

本发明的另一方面涉及用于基因阻抑的分子开关***，即激活阻抑的基因。这些***包含(a)包含可以特异性结合于与靶基因相关联的核苷酸序列的第一结构域的，和可以特异性结合一种结合伴侣(bindingpartner)的第二结构域的第一融合蛋白，其中所述第一和第二结构域是互为异源的；和(b)包含可以与核周边关联的第一结构域和包含所述第一融合蛋白的第二结构域的结合伴侣的第二结构域的第二融合蛋白，所述第一结构域与所述第二结构域是异源的。所述第一融合蛋白的第一结构域与本发明的嵌合蛋白质的第一结构域是相同的；且所述第二融合蛋白的第一结构域与本发明的嵌合蛋白质的第二结构域是相同的。所述第一融合蛋白的第二结构域可以是S-蛋白且所述第二融合蛋白的第二结构域可以是S-标签，或反之亦然。

本发明的其它方面提供了分离的编码用于本发明基因去阻抑的这些融合蛋白的核酸，包含这些核酸的表达载体，和用所述表达载体(通过任何方法)转化的宿主细胞。这样的宿主细胞可以用于通过培养所述宿主细胞一段时间并在一定条件下表达所述融合蛋白及回收所述融合蛋白的制备所述融合蛋白的方法中。另外所述宿主细胞可以用作表达载体的来源以通过基因转移方法输送所述融合蛋白到细胞或生物体中。另外，本发明提供了这些融合蛋白，分子开关***，核酸和表达载体的药物组合物。

用于基因去阻抑的分子开关***可以用于时间或空间改变靶基因表达的方法中，其通过(a)将含有具有与靶基因相关联的核苷酸序列的靶核酸的细胞或生物体与这些分子开关***接触，和(b)将细胞或生物体和所述分子开关***的配体同时或同地接触以破坏第一和第二融合蛋白的关联因而通过从与核周边的关联中释放所述靶基因而使所述靶基因的表达去阻抑。这个分子开关***的融合蛋白可以作为蛋白质，一或多个编码一或多个这些蛋白的核酸，或其组合导入细胞或生物体中。

附图说明

图1显示使用本发明的嵌合蛋白质将一或多个靶基因带入核周边的附近而产生的单一或多个基因的阻抑。斜线阴影部分：核周边内部或相关联的靶蛋白；开放部分：已知的相互作用蛋白；点状阴影部分：AZP或ZFP；粗黑线：AZP或ZFP靶位点；细黑线：基因或基因组；NE：核被膜；NM：核膜。

具体实施方式

A.本发明的嵌合蛋白质

本发明涉及阻抑基因表达的靶特异性的嵌合蛋白质，所述阻抑通过将靶基因带入核周边的附近并由此沉默或下调那个基因的表达而进行。所述嵌合蛋白质包含至少2个异源结构域：可以特异性结合于与靶基因相关联的核苷酸序列的第一结构域，和可以通过结合或关联核被膜，核纤层，异染色质或三者任意组合中的蛋白而与核周边相关联的第二结构域。本发明的嵌合蛋白质在调节基因表达中有用，特别是阻抑或下调选定的基因的表达。例如，可能希望下调或关闭涉及肿瘤发生，细胞增殖和再生，血管发生(当发生如肿瘤的不利的血管形成时)，或植物特定发育或生长阶段的基因。类似地，本发明的嵌合蛋白质可以用于下调或关闭病毒基因。

如此处所用，术语“核周边”包括核被膜和核纤层。位于核周边附近的基因是物理性临近核周边及，根据本发明，其通过和结合或与核被膜或核纤层相关联的核被膜，核纤层或异染色质的部分的蛋白形成(共价或非共价)关联而定位。为本发明的目的，不需要确定关于核周边的基因的真实的物理位置，但应该可以测量和应用相对于正常表达水平，或其它表达对照水平的基因表达的减少。

如此处所用，术语“嵌合蛋白质”用来表明本发明的蛋白质是非天然存在的蛋白质。本发明的嵌合蛋白质是人工构建体，其组合了核酸结合结构域和可以不同来源的核周边相关联的结构域，即两个互为异源的结构域。当存在多个结构域时，只有一个核酸结合结构域与所述可以与核周边相关联的结构域来源不同便已足够。异源结构域的来源可以是，独立地，来自不同的物种，来自不同的生物体株，来自单一生物体的不同蛋白质或来自设计具有所需活性的人工蛋白质，并且没有一种组合会产生天然存在的蛋白质。

所述嵌合蛋白质的核酸结合结构域特异性结合于与所述靶基因关联的核苷酸序列。这个结构域的特性和性质通过需要被所述嵌合蛋白质结合的核苷酸序列确定。如此处所用，“特异性结合”表示，包括指一种DNA结合部分或蛋白(例如，作为整个蛋白，作为结构域，或存在于本发明的嵌合蛋白质中)与特定的核苷酸序列的结合或关联，与其结合其它核苷酸序列相比，达到可检测的程度(例如，至少背景水平的1.5倍)，并且在特定的条件下，如温度，离子强度，溶剂极性等基本上排除与其它核苷酸序列结合。凝胶迁移分析，本领域熟知，是用于分析和证实结合是否对特定核苷酸序列特异性的一种方法。

可能控制关于靶基因的核苷酸序列性质和位置。如此处所用，“靶多核苷酸”，“靶基因相关的核苷酸序列”或“标的核苷酸序列”或其它类似的术语指一部分双链多核苷酸，优选DNA，其被所述嵌合蛋白质的DNA结合结构域结合。这个标的核苷酸序列可位于任何位置，靠近或位于靶基因之内以被调节，所述位置适于阻抑所述靶基因的表达。例如，所述标的核苷酸序列可以位于所述编码区之内，其直接的上游或下游或其可以有一些距离(例如，几百个核苷酸)，如果选定的核苷酸序列还允许所述基因被带入核周边足够近的位置以相对于正常或其它对照水平减少所述基因的表达。标的核苷酸序列还可以是所用或部分靶基因的已知的转录控制元件。

标的核苷酸序列的长度可以从6-10核苷酸到大约50，60，70或更多的核苷酸的范围之间。适当的核苷酸序列长度的例子是大约8到大约30，大约10到25，和大约10到20个核苷酸。大约16个核苷酸的长度足够提供在人基因组中的独特靶位点。DNA结合结构域的特异性和亲和性，作为标的生物体和序列的性质是确定标的核苷酸序列的适当长度的所有因素。基于这样的考虑，本领域技术人员可以容易地确定标的核苷酸序列的长度和特性。

所述嵌合蛋白质的核酸结合结构域可以是具有DNA结合活性的已知的或人工DNA结合蛋白或其片段。DNA结合蛋白的实例包括但非限于锌指蛋白质(ZFP)，人工锌指蛋白质(AZP)，转录因子的DNA结合部分，核激素受体，同源盒结构域蛋白质如engrailed或antenopedia，螺旋-转角-螺旋基序蛋白质如λ阻抑子和tet阻抑子，Gal4，TATA结合蛋白质，螺旋-环-螺旋基序蛋白质如myc和myoD，亮氨酸拉链类型蛋白质如fos和jun，和β-折叠基序蛋白质如met，arc和mnt阻抑子，或任何那些蛋白质的DNA结合部分。这样的蛋白质和部分是本领域技术人员熟知的。

优选的本发明核酸结合结构域的DNA结合蛋白质是ZFP和AZP。存在许多ZFP，包括但非限于Cys₂His₂类(例如，SpIC和Zif268)，Cys6(例如，Gal4DNA结合蛋白质)和Cys4(例如，***受体)；可以使用具有所需核苷酸序列特异性的任何这些蛋白质。

“锌指蛋白质”，“锌指多肽”，“ZFP”，“人工锌指蛋白质”指具有被锌稳定的DNA结合结构域的多肽。单独的DNA结合结构域典型地指“指”，所ZFP或肽具有至少一个指，更典型地2个指，更优选地3个指，或更优选4或5个指，到至少6或更多个指。每个指结合DNA的3或4个碱基对。在ZFP和AZP的Cys₂-His₂类中，每个指是典型地大约30个氨基酸，锌螯合，DNA结合部分结构域。Cys₂-His₂类的代表序列基序是：Cys-(X)_2-4-Cys-(X)₁₂-His-(X)_3-5-His，其中X是任何氨基酸(SEQ ID NO：1)。两个不变组氨酸残基和两个不变半胱氨酸残基结合锌阳离子[见例如，Berg等，(1996)Science 271：1081-1085]。

本发明的一个实施方案中，嵌合蛋白质具有的第一结构域是包含至少一个锌指，每个锌指表示式是：-X₃-Cys-X_2-4-Cys-X₅-Z^-1-X-Z²-Z³-X₂-Z⁶-His-X_3-5-His-X₄-，(SEQ ID NO：2)的AZP，当存在多个锌指时，其互相独立地由0到10个氨基酸残基共价结合，其中X是任何氨基酸，Xn代表在多肽链中X出现的次数，Z^-1，Z²，Z³和Z⁶通过表1和2所示的识别密码确定(以下进一步解释)。

X表示的氨基酸形成Cys₂His₂锌指的骨架而且可以是已知的锌指骨架，共有骨架，通过变化任何已知这些骨架或任何人工骨架的序列得到的骨架。优选已知的骨架用于确定每个X的特性。某些实施方案中，确定X的骨架是来自Sp1，Sp1C或Zif268。优选的实施方案中，骨架具有Sp1C结构域2的序列(即，SpIC的中间锌指)，其序列是：Pro-Tyr-Lys-Cys-Pro-Glu-Cys-Gly-Lys-Ser-Phe-Ser-Z^-1-Ser-Z²-Z³-Leu-Gln-Z⁶-His-Gln-Arg-Thr-His-Thr-Gly-Glu-Lys-(SEQ ID NO：3)。这样的AZP在U.S.Serial No.09/911,261，Takashi Sera于2001年7月23日递交，中被更完全地描述。

本发明的AZP可以包含3到40个锌指，3到15个指，3到12个指，3到9个指或3到6个指，以及具有3，4，5，6，7，8或9个指的ZFP。

以上公式中Z^-1，Z²，Z³和Z⁶的锌指的4个核酸接触残基主要负责确定DNA结合的特异性和亲和性。这4个氨基酸残基还可以称作碱基接触氨基酸。这4个残基相对于第一共有组氨酸和第二共有半胱氨酸处于相同的位置。第一残基是第一共有组氨酸N末端侧的7个氨基酸和第二共有半胱氨酸C末端侧的6个氨基酸。第一残基也称作“-1位置”并且如此命名，因为它代表了紧接于锌指α螺旋N末端的残基(位置1是α螺旋第一个N末端残基)。其它3个氨基酸出现在α螺旋的位置2，3和6，也分别称作“2位置”，“3位置”，“6位置”。这4个位置也称作此处的Z²，Z³和Z⁶位置。

识别密码表提供了确定给定核苷酸序列的Z^-1，Z²，Z³和Z⁶特性的方法。在识别密码表中(及对于核苷酸序列的每4个碱基对部分)，碱基都是5’到3’顺序。然而，第4个碱基总是靶序列中第4个碱基的互补物。例如，如果靶序列是ATCC，则表示有义链靶序列是5’-ATCC-3’和反义链是3’-TAGG-5’。因此，当有义链序列ATCC翻译为下表1的氨基酸，第一碱基A表示在位置6有谷氨酰胺，第二碱基T表示在位置3有丝氨酸和第三碱基C表示在位置-1有谷氨酸。然而，因为第四碱基是C，它表示C的互补物，即G在表中而且有于鉴定位置2的氨基酸。这时，位置2的氨基酸是丝氨酸。

表1和2提供了AZP优选和替代的识别密码表分别用于本发明，总结为：

表1

	1<sup>st</sup>碱基	2<sup>nd</sup>碱基	3<sup>rd</sup>碱基	4<sup>th</sup>碱基
	1<sup>st</sup>碱基	2<sup>nd</sup>碱基	3<sup>rd</sup>碱基	4<sup>th</sup>碱基	G	Arg	His	Arg	Ser
A	Gln	Asn	Gln	Asn	G	Arg	His	Arg	Ser
A	Gln	Asn	Gln	Asn	T	Thr，Tyr，Leu	Ser	Thr，Met	Thr
C	Glu	Asp	Glu	Asp	T	Thr，Tyr，Leu	Ser	Thr，Met	Thr
C	Glu	Asp	Glu	Asp		位置6	位置3	位置-1	位置2

表2

	1<sup>st</sup>碱基	2<sup>nd</sup>碱基	3<sup>rd</sup>碱基	4<sup>th</sup>碱基
	1<sup>st</sup>碱基	2<sup>nd</sup>碱基	3<sup>rd</sup>碱基	4<sup>th</sup>碱基	G	Arg，Lys	His，Lys	Arg，Lys	Ser，Arg
A	Gln，Asn	Asn，Gln	Gln，Asn	Asn，Gln	G	Arg，Lys	His，Lys	Arg，Lys	Ser，Arg
A	Gln，Asn	Asn，Gln	Gln，Asn	Asn，Gln	T	Thr，Tyr，Leu，Ile，Met	Ser，Ala，Val，Thr	Thr，Met，Leu，Ile	Thr，Val，Ala
C	Glu，Asp	Asp，Glu	Glu，Asp	Asp，Glu	T	Thr，Tyr，Leu，Ile，Met	Ser，Ala，Val，Thr	Thr，Met，Leu，Ile	Thr，Val，Ala
C	Glu，Asp	Asp，Glu	Glu，Asp	Asp，Glu		位置6	位置3	位置-1	位置2

表2中，每个方框中所列的氨基酸的顺序从左到右表示该位置最优选到次优选的氨基酸。

这些识别密码表还可以如下描述。AZP的优选识别密码表(等同于表1)是对于每个4碱基靶序列，从5’到3’顺序：

(i)如果第一碱基是G，则Z⁶是精氨酸，如果第一碱基是A，则Z⁶是谷氨酰胺，如果第一碱基是T，则Z⁶是苏氨酸，酪氨酸或亮氨酸，如果第一碱基是C，则Z⁶是谷氨酸，

(ii)如果第二碱基是G，则Z³是组氨酸，如果第二碱基是A，则Z³是天冬酰胺，如果第二碱基是T，则Z³是丝氨酸，如果第二碱基是C，则Z³是天冬氨酸，

(iii)如果第三碱基是G，则Z^-1是精氨酸，如果第三碱基是A，则Z^-1是谷氨酰胺，如果第三碱基是T，则Z^-1是苏氨酸或甲硫氨酸，如果第三碱基是C，则Z^-1是谷氨酸，

(iv)如果第四碱基的互补物是G，则Z²是丝氨酸，如果第四碱基的互补物是A，则Z²是天冬酰胺，如果第四碱基的互补物是T，则Z²是苏氨酸，和如果第四碱基的互补物是C，则Z²是天冬氨酸。

以上识别密码(即，表1识别密码)的优选实施方案中，如果第一碱基是T，则Z⁶是苏氨酸；及如果第三碱基是T，则Z^-1是苏氨酸(表1)。

替代的识别密码表(等同于表2)也可以表示如下：

(i)如果第一碱基是G则Z⁶是精氨酸或赖氨酸，如果第一碱基是A，则Z⁶是谷氨酰胺或天冬酰胺，如果第一碱基是T，则Z⁶是苏氨酸，酪氨酸，亮氨酸，异亮氨酸或甲硫氨酸，如果第一碱基是C，则Z⁶是谷氨酸或天冬氨酸，

(ii)如果第二碱基是G，则Z³是组氨酸或赖氨酸，如果第二碱基是A，则Z³是天冬酰胺或谷氨酰胺，如果第二碱基是T，则Z³是丝氨酸，丙氨酸，缬氨酸或苏氨酸，如果第二碱基是C，则Z³是天冬氨酸或谷氨酸，

(iii)如果第三碱基是G，则Z^-1是精氨酸或赖氨酸，如果第三碱基是A，则Z^-1是谷氨酰胺或天冬酰胺，如果第三碱基是T，则Z^-1是苏氨酸，甲硫氨酸，亮氨酸或异亮氨酸，如果第三碱基是C，则Z^-1是谷氨酸或天冬氨酸，

(iv)如果第四碱基的互补物是G，则Z²是丝氨酸或精氨酸，如果第四碱基的互补物是A，则Z²是天冬酰胺或谷氨酰胺，如果第四碱基的互补物是T，则Z²是苏氨酸，缬氨酸或丙氨酸，和如果第四碱基的互补物是C，则Z²是天冬氨酸或谷氨酸。

为应用识别密码表设计和鉴定给定核苷酸序列的AZP，3N+1碱基对长的核苷酸序列被分为重叠的4碱基对片段，其中N是靶中重叠的4碱基对片段的数目，每个片段的第四碱基，到N-1片段，是紧接下一个片段的第一碱基。锌指中每个Z1，Z²，Z³和Z⁶的鉴定是按照识别密码表确定的。

本发明设计的锌指是互相直接共价连接或可以被1-10个氨基酸的接头分隔。接头氨基酸可以提供灵活性或某些程度的结构刚性。接头可以是，但不必须是通过ZFP对其同类核苷酸序列的所需亲和性所规定的。本领域技术人员已知测试和最佳化多种接头序列以改良AZP对其同类靶序列的结合亲和性。例如，6个锌指ZFP的一个有用的排列是前3个锌指不通过接头连接，第3和第4指间有一个灵活的氨基酸接头，最后3个指不通过接头连接。这个排列可以使每个3指基团独立结合其靶序列，同时最小化了对其它3指基团结合的空间障碍。

一个实施方案中，较长的基因组序列用使用灵活的接头连接于其它多指AZP的多指AZP定向，所述接头包括，但非限于，GGGGS，GGGS和GGS(这些序列可以分别是AZP中1-10个额外氨基酸的部分；SEQ IDNO：4，SEQ ID NO：4的2-5位残基；和SEQ ID NO：4的3-5位残基。)

另外，本发明嵌合蛋白质的核酸结合结构域可以设计为通过使用单个结构域或多个结构域结合非连续核苷酸序列。例如，6指AZP结合的核苷酸序列可以是具有间隔碱基(其不接触锌指)的10碱基对序列(被3个指识别)和第二个10碱基对序列(被其它3指识别)。间隔碱基的数目可以变化，所以可以在AZP的两个3指部分间使用适当设计的氨基酸接头补偿这个间隔的距离。靶结合位点中的间隔核酸碱基的范围可以是5-100，和优选10-20或更少，更优选10或更少，及更优选6或更少。当然，接头保持了连接的AZP部分间的阅读框架。

已知通过噬菌体展示，所及诱变，组合文库，计算机/推理设计，亲和性选择，PCR，克隆cDNA或基因组文库，合成构建体等设计和构建编码ZFP和AZP核酸的方法。(见例如，U.S.Pat.No.5,786,538；Wu等，Proc.Natl.Acad.Sci.USA 92：344-348(1995)；Jamieson等，Biochemistry 33：5689-5695(1994)；Rebar & Pabo，Science 263：671-673(1994)；Choo &Klug，Proc.Natl.Acad.Sci.USA 91：11168-11172(1994)；Desjarlais等，Proc.Natl.Acad.Sci.USA 89：7345-5349(1992)；Desjarlais等，Proc.Natl.Acad.Sci.USA 90：2256-2260(1993)；Desjarlais等，Proc.Natl.Acad.Sci.USA 91：11099-11103；Pomerantz等，Science 267：93-96(1995)；Pomerantz等，Proc.Natl.Acad.Sci.USA 92：9752-9756(1995)；Liu等，Proc.Natl.Acad.Sci.USA 94：5525-5530(1997)；Griesman & Berg，Science 275：657-661(1997)；和U.S.Serial No.09/911,261 to Sera filed July 23，2001(Sera的申请)。例如，Sera的申请描述了可以生产AZP组合文库的制备AZP的模块方法。这些AZP可以用于筛选和/或选择分析以鉴定结合靶基因或靶基因附近的AZP。一旦已知这样的AZP，它们可以作为本发明嵌合蛋白质的第一结构域。同样，通过无论体外或体内的筛选或选择步骤获得的任何AZP(或ZFP)可以用作第一结构域，只要这个AZP(或ZFP)通过本发明预期的方式特异性结合或关联靶基因。

根据本发明，本发明的嵌合蛋白质可以具有多个第一核酸结合结构域。每个这样的结构域特异性结合选定的核苷酸序列。这样的序列可以互相邻近或相隔一些距离，只要所述距离不阻止嵌合蛋白质定位于核周边和阻抑关联的靶基因的表达。当存在一个第一结构域，所述核苷酸序列相对于靶基因可以位于任何位置，只要嵌合蛋白质和核苷酸序列和核周边的结合或关联阻抑基因表达。额外的第一结构域可以加入本发明的嵌合蛋白质以增强转录阻抑。嵌合蛋白质具有1到6个第一结构域，1到3个第一结构域，或1个第一结构域。

其它转录阻抑子的实例包括，但非限于，人KOX-I蛋白的KRAB阻抑结构域(Thiesen等，New Biologist 2：363-374(1990)；Margolin等，Proc.Natl.Acad.Sci.U.S.A.91：4509-4513(1994)；Pengue等，Nucl.Acids Res.22：2908-2914(1994)；Witzgall等，Proc.Natl.Acad.Sci.U.S.A.91：4514-4518(1994))。KAP-1，KRAB共阻抑子，可以和KRAB应用(Friedman等proteins such as LAP 2p and the LAP 2p interaction region(amino acids138-524))。[Nili等，2001]。第二结构域的其它优选蛋白包括524-氨基酸小鼠GCL蛋白[Leatherman等(2000)Mech.Dev.92：145-153]，或任何其它GCL蛋白如来自果蝇或任何其它哺乳动物物种的蛋白。GCL可以通过纤层相关蛋白(LAP)间接结合核纤层。第二结构域的其它有用的蛋白(或它们的结合部分)包括Rb，Oct-1的过磷酸化形式和胰岛素激活子IPF/PDX-1(其在存在低葡萄糖时位于核膜)。对所有第二结构域，选择与靶基因来自相同物种的结构域可能是有用的。异染色质结合蛋白(或其具有结合活性的部分)还可以用作本发明嵌合蛋白质的第二结构域。有用的异染色质结合蛋白包括，但非限于，HP1和polycomb-group蛋白。

本发明的另一方面，核定位肽可以附于本发明嵌合蛋白质上以帮助蛋白到核的转运。所述核定位肽促进了存在于细胞质中的蛋白向核的转运。核定位肽可以单独使用或与其它结构域联合使用。核定位肽的一个例子是来自SV40巨大T抗原的肽，序列为Pro-Lys-Lys-Lys-Arg-Lys-Val(SEQ ID NO：9)。

另外，嵌合蛋白质可以具有附着的细胞摄取信号，单独或联合核定位肽使用，以帮助蛋白到细胞的转运。这样的细胞摄取信号包括，但非限于，最小的Tat蛋白转导结构域，其是人免疫缺陷病毒Tat蛋白的47-57位残基：YGRKKRRQRRR(SEQ ID NO：5)；Antenapedia(pAntp)同源结构域的43-58位残基：Arg-Gln-Ile-Lys-Ile-Trp-Phe-Gln-Asn-Arg-Arg-Met-Lys-Trp-Lys-Lys(SEQID NO：10)(Derossi等，(1994)J.Biol.Chem.269：10444-10450)；单纯疱疹病毒(HSV)VP22蛋白的267-300位残基：Asp-Ala-Ala-Thr-Ala-Thr-Arg-Gly-Arg-Ser-Ala-Ala-Ser-Arg-Pro-Thr-Glu-Arg-Pro-Arg-Ala-Pro-Ala-Arg-SerAla-Ser-Arg-Pro-Arg-Arg-Pro-Val-Glu(SEQ ID NO：11)(Elliott等(1997)Cell 88：223-233)；多种具有报道的细胞摄取信号活性的基本肽如Tyr-Ala-Arg-Ala-Ala-Ala-Arg-Gln-Ala-Arg-Ala(SEQ ID NO：12)(Ho等(2001)Cancer Res.61：474-477)，Arg-Arg-Arg-Arg-Arg-Arg-Arg-Arg-Arg(SEQ ID NO：13)，也已知为R9(Jin等(2001)Free Rad.Biol.Med.31：1509-1519)和R9的所用D-精氨酸形式(Winder等(2000)Proc.Natl.Acad.Sci.USA 97：13003-13008)；和Temsamani小组描述的肽，其包括可以携带物质跨过血脑屏障的肽，如WO00/32236，可以携带抗癌物进入癌细胞的肽，如WO00/32237描述，WO02/02595的抗生素肽的两性肽部分，WO02/053583描述的转运荷负电的物质进入细胞或细胞核的两性肽，荷WO02/067994的止痛分子的肽载体部分。

Temsamani描述的肽包括但非限于D-penetratin(rqikiwfqnrrmkwkk；所用的氨基酸是D形式)(SEQ ID NO：14)，pAntp和其活性变体，SynB1(RGGRLSYSRRRFSTSTGR)(SEQ ID NO：15)，L-SynB3(RRLSYSRRRF)(SEQ ID NO：16)，和D-SynB3(rrlsysrrrf；所用的氨基酸是D形式)(SEQ ID NO：17)。

为易于纯化，监测表达，或监测细胞和亚细胞定位，本发明的嵌合蛋白质还可以表达为具有如麦芽糖结合蛋白(“MBP”)，绿色荧光蛋白(GFP)，谷胱甘肽S转移酶(GST)，六组氨酸，c-myc，FLAG表位Asp-Tyr-Lys-Asp-Asp-Asp-Asp-Lys(SEQ ID NO：18)的这样的蛋白或蛋白部分的融合蛋白。

本发明的嵌合蛋白质可以合成制备或重组制备，优选重组，使用任何本领域已知的技术。当重组制备了蛋白，例如，通过编码嵌合蛋白质的DNA，密码使用可以优化以在蛋白表达的生物体中高表达。这样的生物体包括细菌，真菌，酵母，动物，昆虫和植物。更特异性地，生物体包括但非限于人，小鼠，大肠杆菌，谷类植物，水稻，番茄和玉米。当核酸用于输送本发明的嵌合蛋白质时，密码使用可以对接受核酸构建体的真核生物进行最优化。

可以使用本领域技术人员已知的任何适当的蛋白纯化的方法来纯化本发明的嵌合蛋白质[见例如，Sambrook等(1989)Molecular Cloning：ALaboratory Manual(2ded.，Cold Spring Harbor Laboratory Press，Plainview，New York]。另外，可以使用任何合适的宿主进行蛋白表达，例如，细菌细胞，昆虫细胞，酵母细胞，哺乳动物细胞，植物细胞等等。

本发明的嵌合蛋白质和编码其的核酸用来阻抑，下调或降低任何真核生物体的靶基因(通过其和特定核苷酸序列的关联确定)的表达，所述真核生物体包括酵母，动物和植物。所述靶基因可以编码任何需要阻抑表达的真核基因。例如，靶基因可以编码细胞因子，白细胞介素，癌基因，血管发生因子，抗血管发生因子，药物抗性基因，生长因子和/或肿瘤抑制因子。靶基因还可以是病毒基因，特别是DNA病毒。靶基因可以编码一个植物基因。这些植物基因的优选来源是番茄，玉米，水稻和谷类植物。

靶基因可以是癌基因，包括，但非限于，myc，jun，fos，myb，max，mad，rel，ets，bcl，myb，mos家族成员和相关的因子和修饰物。癌基因的描述见，例如，Cooper，Oncogenes，2nded.，The Jones and Bartlett Series inBiology，Boston，MA，Jones and Bartlett Publishers，1995。ets转录因子的综述见Waslylk等，Eur.J.Biochem.211：7-18(1993)。Myc癌基因的综述见例如，Ryan等，Biochem.J.314：713-21(1996)。Jun和fos转录因子的描述见例如，The Fos and Jun Families of Transcription Factors，Angel &Herrlich，eds.(1994)。max癌基因的综述见Hurlin等，Cold Spring Harb.Symp.Quant.Biol.59：109-16。myb基因家族的综述见Kanei-Ishii等，Curr.Top.Microbiol.Immunol.211：89-98(1996)。mos家族的综述见Yew等，Curr.Opin.Genet.Dev.3：19-25(1993)。

本发明的嵌合蛋白质可以用于阻抑疾病相关的基因的表达。一个实例中，疾病相关基因是癌基因，如BCR-ABL融合癌基因或ras癌基因，以及DNA结合结构域设计为结合DNA序列：GCAGAAGCC(SEQ ID NO：6)并且可以通过定位于核周边及通过结合转录过程中需要的一个序列而阻抑表达来阻抑BCR-ABL融合癌基因的表达。涉及疾病的转录因子的综述见Aso等，J Clin.Invest.97：1561-9(1996)。

B.应用方法

本发明另一方面涉及通过定位所述基因于核周边来阻抑或下调靶基因表达的方法。这个方法涉及将所述含有关联或足够接近所述靶基因的核苷酸序列的靶核酸与本发明的嵌合蛋白质接触。所述核酸可以存在于细胞或生物体中并且优选基因组DNA。然而，核酸还可以以染色体外DNA存在于核中。核苷酸序列和靶基因如上描述。足够接近靶基因的核苷酸序列以测量暴露于本发明的嵌合蛋白质后靶基因的阻抑或下调。

根据本发明，嵌合蛋白质可以作为蛋白质或作为编码该蛋白的核酸导入细胞。当应用蛋白时，嵌合蛋白质可以，任选地，具有细胞摄取信号和/或核定位信号以促进所述蛋白被细胞摄取及转运到核中。本领域技术人员可以容易地确定阻抑或下调靶基因表达所需的嵌合蛋白质的量。当应用核酸如RNA或DNA时，其可以以任何形式，包括作为裸露质粒或其它的DNA，在脂质体中，病毒载体中(包括RNA病毒和DNA病毒)，通过一种压力注射器如使用RNA或DNA的Powderject^TM***，或通过任何其它力便的手段运送。再者，基于靶细胞或生物体，本领域技术人员可以容易地确定阻抑或下调靶基因表达所需的核酸的量，运送配方和模式和核酸是DNA或RNA。优选应用DNA。

根据本发明，嵌合蛋白质在与靶基因相关联的核苷酸序列处结合靶核酸。已知确定结合是否发生和感兴趣的靶基因或蛋白发生阻抑的效率的方法。简言之，一个实施方案中，报道基因如3-葡萄糖苷酸酶，氯霉素乙酰基转移酶，β-半乳糖苷酶(β-gal)或绿色荧光蛋白(GFP)可操纵地连接于控制启动子的靶基因序列，连接到一个转化载体，及转化进动物或植物细胞。导入嵌合蛋白质后(作为蛋白或作为翻译生产该蛋白的核酸)，分析报道基因相对于适当的对照的水平。或者，通过Northern印迹或其它方式测量RNA的水平。后一种方法当不应用报道构建体时有用。

本发明试图调控的基因可能是组织特异性的或不是，可诱导的或不是，并且可能发生在动物细胞中，酵母细胞中，昆虫细胞中，或培养的或完整植物的植物细胞中。有用的阻抑水平可以变化，依赖于靶基因是如何被正常调控地，调控时变化的影响，和其它类似因素。希望地，基因表达的变化被修饰至少大约1.5倍到2倍，大约3倍到5倍，大约8到10到15倍，或甚至更大如20到25到30倍，及甚至40，50，75，或100倍，或更大。基因表达的变化程度在各个***还可以变化。使用的“生物体”是任何真核生物体，包括酵母，动物，禽类，昆虫，植物等等。动物包括，但非限于，哺乳动物(人，灵长类，等)，商业性的或农场动物(鱼类，鸡，牛，牲畜，猪，绵羊，山羊，火鸡等)，研究动物(小鼠，大鼠，兔子等)和宠物(狗，猫，鹦鹉和其它宠物鸟类，鱼类等)。如此处，特定的动物可以是多种动物群的成员。

本发明的嵌合蛋白质(或编码这些蛋白的核酸)可以用来，例如，阻抑，下调或降低大范围的植物和植物组织，优选对转化技术接受的，特别是单子叶植物和双子叶植物等高等植物的基因表达。

“植物”指处于任何发育阶段任何植物或植物的部分，包括种子，悬浮培养物，胚胎，分生区，愈合组织，叶子，根，芽，配偶体，孢子体，花粉，和小孢子，及其子代。还包括切下的部分，和细胞或组织培养物。如本发明所用，术语“植物组织”包括，但非限于，植物细胞，植物器官(例如，叶子，茎，根，***组织)，植物种子，原生质体，愈合组织，细胞培养物，和组织成结构和/或功能单位的任何细胞群。

特别优选的是单子叶植物如禾本科物种如高梁(Sorghum bicolor)和玉米(Zea mays)。本发明的分离的核酸和蛋白还可以用于以下属的物种中：北瓜(Cucurbita)，蔷薇科(Rosa)，葡萄(Vitis)，核桃(Juglans)，草莓(Fragaria)，莲花(Lotus)，苜蓿(Medicago)，红豆(Onobrychis)，三叶草(Trifolium)，胡芦巴(Trigonella)，豇豆(Vigna)，柑桔(Citrus)，亚麻(Linum)，天竺葵(Geranium)，木薯(Manihot)，野胡萝卜(Daucus)，拟南芥(Arabidopsis)，芸苔(Brassica)，萝卜(Raphanus)，芥子(Sinapis)，颠茄(Atropa)，辣椒(Capsicum)，曼陀罗(Datura)，黑茛菪的干叶(Hyoscyamus)，番茄(Lycopersicon)，烟草(Nicotiana)，茄属植物(Solanum)，矮牵牛花(Petunia)，洋地黄(Digitalis)，马乔莲(Majorana)，Ciahorium，向日葵(Helianthus)，莴苣(Lactuca)，雀麦(Bromus)，芦笋(Asparagus)，金鱼草属植物(Antirrhinum)，Heterocallis，Nemesis，天竺葵属的植物(Pelargonium)，Panieum，狼尾草(Pennisetum)，毛茛属植物(Ranunculus)，狗舌草(Senecio)，蛾蝶花(Salpiglossis)，甜瓜(Cucumis)，Browaalia，氨基乙酸(Glycine)，豌豆(Pisum)，豆科(Phaseolus)，黑麦草(Lolium)，水稻(Oryza)，燕麦(Avena)，大麦(Hordeum)，黑麦(Secale)，和小麦(Triticum)。

优选的植物和植物组织包括来自以下的那些：玉米(Zea mays)，双低油菜(甘蓝型油菜，大头茶属)，紫花苜蓿(Medicago sativa)，水稻(Oryzasativa)，黑麦(Secale cereale)，高梁(Sorghumbicolor，Sorghum vulgare)，向日葵(Helianthus annuus)，小麦(Triticum aestivum)，大豆(Glycine max)，烟草(Nicotiana tabacum)，马铃薯(Solanum tuberosum)，花生(Arachishypogaea)，棉花(Gossypium barbadense，Gossypium hirsutum)，甜马铃薯(Qpomoea batatus)，木薯(Manihot esculenta)，咖啡(Cqfea属)，椰子(Cocos nucijra)，菠萝(Ananas comosus)，柑桔树(柑桔属)，可可(Theobroma cacao)，茶(Camellia sinensis)，香蕉(Musa属)，鳄梨(Perseaamericana)，无花果树(Ficus casica)，番石榴(Psidium guajava)，芒果(Mangifera indica)，橄榄(Olea europaea)，木瓜(Carica papaya)，腰果(Anacardium occidentale)，澳大利亚坚果(Macadamia integr～fblia)，杏仁(Prunus amygdalus)，甜菜(Beta vulgaris)，甘蔗(Saccharum spp.)，浮萍(Lemna spp.)，燕麦，大麦，蔬菜，观赏植物，和松类。

优选的蔬菜包括番茄(Lycopersicon esculentum)，莴苣(例如，Lactuca sativa)，青豆(Phaseolus vulgaris)，利马豆(Phaseolus limensis)，豌豆(Lathyrus spp.)，和甜瓜类成员如黄瓜(C.sativus)，香瓜(Ccantalupensis)，和哈密瓜(C.melo)。

优选的观赏植物包括杜鹃花(Rhododendron spp.)，八仙花(Macrophylla hydrangea)，芙蓉(Hibiscus rosasanensis)，蔷薇(Rosa spp.)，郁金香(Tulipa spp.)，水仙花(Narcissus spp.)，矮牵牛花(Petunia hybrida)，康乃馨(Dianthus caryophyllus)，猩猩木(Euphorbiapulcherrima)，和菊花。

可以应用于本发明的松类包括，例如，松树如厚皮刺果松(Pinustaeda)，沼泽松(Pinus elliotii)，北美黄松(Pinus ponderosa)，黑松(Pinuscontorta)，和辐射松(Pinus radiata)；花旗松(Pseudotsuga menziesii)；西部铁杉(Isuga canadensis)；锡特卡云杉(Picea glauca)；红杉(Sequoiasempervirens)；冷杉如银枞(Abies amabilis)和胶冷杉(Abies balsamea)；和雪松如西部红松(Thuja plicata)和黄扁柏(Chamaecyparis nootkatensis)。

最优选地，本发明的植物和植物组织是农作物植物(例如，谷物，紫花苜蓿，向日葵，canola，大豆，棉花，花生，高粱，小麦，烟草，等)，更优选谷物和大豆植物，而更优选谷物植物。

如此处所用，“转基因植物”或“遗传修饰的植物”指在其基因组中包含一个异源多核苷酸(即，一个来自不是受体生物体的多核苷酸)的一种植物。通常及优选地，所述异源多核苷酸是稳定整合在所述基因组中，因而所述多核苷酸被传递给继承子代。所述异源多核苷酸可以单独整合进基因组或作为一个重组表达盒的一部分整合进基因组。所用“转基因”包括任何细胞，细胞系，愈合组织，组织，植物部分或植物，其基因型由于存在异源核酸而被改变，包括那些最初如此改变的转基因生物以及自最初的转基因生物有性繁殖或无性繁殖造成的基因型改变。此处所用术语“转基因”不涵盖通过传统植物育种方法或通过自然发生的事件如随机异体受精，非重组病毒感染，非重组细菌转化，非重组转座，或自发突变产生的基因组(染色体或染色体外)改变。

C.表达***

本发明还提供了包含本发明嵌合蛋白编码核酸的重组表达盒。编码本发明所需多核苷酸的核酸序列可以用来构建一个可以导入一个所需宿主细胞的重组表达盒。一个重组表达盒典型地包含本发明的可操纵地连接到转录起始调控序列的多核苷酸，所述转录起始调控序列指导所需宿主细胞，如转化植物的组织中所述多核苷酸的转录。表达载体可以是哺乳动物表达载体，昆虫表达载体，酵母表达载体或植物表达载体。当为了制备和纯化所述蛋白(其可以继而用于，例如本发明的方法中)而表达所述蛋白时，所述表达载体可以是细菌表达载体。表达载体是本领域熟知的而且为了需的目的可以容易地选择。

转录元件包括但非限于真核细胞中有活性的启动子，增强子，包括多聚腺苷酸信号或polyA tracts的转录终止信号，促进核苷酸细胞质转运的元件等等。

适当的转录终止元件包括SV40转录终止区和衍生于其的终止子。

任何哺乳动物，酵母，细菌，昆虫，病毒，其它真核表达载体或表达盒可以应用于本发明并且可以选自，例如，任何可商业获得的载体或表达盒，如得自Invitrogen Corporation(San Diego，Calif.)的pECP4或pRc/RSV，得自Stratagene(La Jolla，Calif.)的pXTl，pSG5，pPbac orpMbac，得自ClonTech(PaloAlto，Calif.)的pPUR orpMAM，和得自PromegaCorporation(Madison，Wis.)的pSVβ-gal，或重新或通过应用公开的或商业可获得的真核表达***合成。

表达盒中的各个元件可以衍生自多种来源并可以选择来在受体细胞的表达盒激活或寿命的位点的特异性。这种表达盒的操纵可以通过任何标准的分子生物学方法进行。

植物表达载体可以包括(1)一个克隆的位于5’和3’调控序列转录控制下的植物基因和(2)一个显性选择标记。这样的植物表达载体还可以含有，如果需要，一个启动子调控区(例如，产生可诱导的或组成性的，环境或发育调控的，或细胞或组织特异性的/选择性表达的调控区)，一个转录起始开始位点，一个核糖体结合位点，一个RNA加工位点，一个转录终止位点，和/或一个多聚腺苷酸信号。

用于在高等植物中表达基因的典型载体是本领域熟知的并且包括衍生自根瘤农杆菌的根瘤诱导(Ti)质粒的载体，如Rogers等，Meth.inEnzymol.，153：253-277(1987)描述。这些载体是植物整合载体，因为在转化时，所述载体整合载体DNA的一部分到宿主植物的基因组中。此处所用的示例根瘤农杆菌载体是质粒pKYLX6和pKYLX7，如Schardl等，Gene，61：1-11(1987)和Berger等，Proc.Natl.Acad.Sci.U.S.A.，86：8402-8406(1989)所述。另一个有用的载体是质粒pBI101.2。

细胞转化技术和基因输送方法(如体内用于输送基因的方法)是本领域熟知的。任何这样的技术可以用来分别输送编码本发明嵌合蛋白质的核酸到细胞或体内输送到对象的细胞中。

所用的术语“表达盒”指可以在适当的宿主细胞中指导特定核苷酸序列表达的DNA序列，包含可操纵地连接到感兴趣的核苷酸序列的启动子，所述核苷酸序列被可操纵地连接于终止信号。其还典型地包含为所述核苷酸序列适当翻译所需的序列。所述编码区通常编码感兴趣的蛋白但也可以编码感兴趣的功能性RNA，例如反义RNA或非翻译RNA，以有义方向或反义方向。包含感兴趣的核苷酸序列的表达盒可以是嵌合的，指至少其一个组分是与至少其另一个组分是异源的。所述表达盒还可以是一个天然存在的但以用于异源表达的重组形式获得的表达盒。然而典型地，所述表达盒是与宿主异源的，即所述表达盒的特定DNA序列不是宿主细胞天然存在的并且必须通过转化事件导入宿主细胞或宿主细胞的亲代中。当所述宿主细胞暴露于某些特定外部刺激时，所述表达盒中核苷酸序列的表达可能被只起始转录的组成性启动子或可诱导的启动子控制。多细胞生物体中，如植物，所述启动子还可以是特异性于特定组织或器官或发育的阶段。

多种启动子已知用于驱动动物细胞中基因的表达，如病毒衍生的SV40，CMV立即早期和，RSV启动子或真核衍生的

-酪蛋白，子宫珠蛋白，

-肌动蛋白或酪氨酸酶启动子。特定启动子不是本发明必需的，除非目的是获得暂时瞬时或组织特异性的表达。例如，可以选择只在所需组织或选定的细胞类型中有活性的启动子。组织特异性启动子的实例包括，但非限于，S1-和

-酪蛋白启动子，其特异性于乳腺组织(Platenburg等，Trans.Res.，3：99-108(1994)；和Maga等，Trans.Res.，3：36-42(1994))；烯醇丙酮酸磷酸羧激酶启动子，其在肝，肾，脂肪，空肠和乳腺组织中有活性，(McGrane等，J.Reprod.Fert.，41：17-23(1990))；酪氨酸酶启动子，其在肺和脾细胞中有活性，但在睾丸，脑，心，肝或肾中没有活性(Vile等，Canc.Res.，54：6228-6234(1994))；involucerin启动子，其只在扁平上皮的分化角化细胞中有活性(Carroll等，J.Cell Sci.，103：925-93C(1992))；及子宫珠蛋白启动子，其在肺和子宫内膜中有活性(Helftenbein等，Annal.N.Y.Acad.Sci.，622：69-79(1991))。

或者，细胞特异性增强序列可以用于控制表达，例如，人亲神经papovirus JCV增强子独自调控神经胶质细胞中的病毒转录(Remenick等，J.Virol.，65：5641-5646(1991))。另一种控制组织特异性表达的方法是使用一种激素应答元件(HRE)以确定一种启动子有活性的细胞系，例如，MMTV启动子在其被激活前需要结合一个激素受体，如孕酮受体到上游HRE(Beatc，FASEB J.，5：2044-2051(1991)；和Truss等，J.Steroid Biochem.Mol.Biol.，41：241-248(1992)).

一种植物启动子片段可以用于指导本发明的多核苷酸在一种再生植物的所有组织中表达。这样的启动子此处指“组成性”启动子并且其在大多环境条件和发育或细胞分化状态下有活性。组成性启动子的实施例包括花椰菜花叶病毒(CaMV)35S转录起始区，衍生自根瘤农杆菌T-DNA的P-或2’-启动子，泛素I启动子，Smas启动子，桂醇脱氢酶启动子(U.S.Patent No.5,683,439)，Nos启动子，pEmu启动子，核酮糖二磷酸羧化酶-加氢酶启动子，GRP1-8启动子，和其它本领域技术人员已知的多种植物基因转录起始区。

或者，所述植物启动子可以在特异性组织或在更精确的环境或发育控制下指导本发明多核苷酸的表达。这样的启动子这里指“可诱导的”启动子。通过可诱导的启动子影响转录的环境条件包括病原攻击，无氧条件，或光的存在。可诱导启动子的实例包括AdhI启动子，其被缺氧或冷刺激诱导，Hsp70启动子，其被热刺激诱导，和PPDK启动子，其被光诱导。发育控制下的启动子的实例包括在某些组织，如叶，根，果实，种子，或花中只，或优选引起转录的启动子。一个示例启动子是花药特异性启动子5126(U.S.Patent Nos.5,689,049和5,689,051)。操纵启动子可能还依赖于其在基因组中的位置而变化。因而，一个可诱导的启动子可能在某些位置是完全或部分组成性的。

可以应用异源和非异源(即内源)启动子指导本发明核酸的表达。这些启动子还可以用于，例如，重组表达盒以驱动反义核酸的表达以在所需组织中减少，增加，或改变本发明蛋白的浓度和/或组成。因而，某些实施方案中，核酸构建体包含在植物细胞，如玉米中有功能的启动子，其可操纵地连接于本发明的多核苷酸。用于这些实施方案的启动子包括驱动本发明多核苷酸表达的内源启动子。

一些实施方案中，分离的核酸作为启动子或增强子元件可被导入非异源形式的多核苷酸的适当位置(一般是上游)以便上或下调表达。例如，内源启动子可以通过突变，缺失，和/或取代被改变(U.S.Patent 5,565,350；PCT/US93/03868)，或分离的启动子可以以合适的方向和距本发明的基因适当的距离导入植物细胞中以便控制基因的表达。基因表达可以在适于植物生长的条件下调节以便改变植物细胞中本发明多肽的总浓度和/或改变组成。

多种启动子可用于本发明，特别是控制嵌合蛋白质表达的，选择可以部分基于所需蛋白表达的水平和所需组织特异性，瞬时特异性或环境特异性的控制，如果植物细胞具有任何一个。组成性和组织特异性启动子是特别感兴趣的。这样的组成性启动子包括，例如，Rsyn7的核心启动子，核心CaMV 35S启动子(Odell等(1985)Nature 313：810-812)，水稻肌动蛋白(McElroy等(1990)Plant Cell 2：163-171)；泛素(Christensen等(1989)Plant Mol.Biol.12：619-632和Christensen等(1992)Plant Mol.Biol.18：675-689)，pEMU(Last等(1991)Theor.Appl.Genet.81：581-588)，MAS(Velten等(1984)EMBOJ.3：2723-2730)，和例如U.S.Patent Nos.5,608,149；5,608,144；5,604,121；5,569,597；5,466,785；5,399,680；5,268,463；和5,608,142描述的组成性启动子。

组织特异性的启动子可以用于在特定植物组织提高表达。组织特异性启动子包括Yamamoto等(1997)Plant J.12(2)255-265，Kawamata等(1997)Plant Cell Physiol.38(7)：792-803，Hansen等(1997)Mol.Gen Genet.254(3)：337)，Russell等(1997)Transgenic Res.6(2)：157-168，Rinehart等(1996)Plant Physiol.112(3)：1331，Van Camp等(1996)Plant Physiol.112(2)：525-535，Canevascini等(1996)Plant Physiol.112(2)：513-524，Yamamoto等(1994)Plant Cell Physiol.35(5)：773-778，Lam(1994)Results Probl.CellDiffer.20：181-196，Orozco等(1993)Plant Mol.Biol.23(6)：1129-1138，Matsuoka等(1993)Proc Natl.Acad.Sci.USA 90(20)：9586-9590，和Guevara-Garcia等(1993)Plant J.4(3)：495-505描述的启动子。如果为了弱表达的需要，这样的启动子可以被修饰。

叶特异性启动子是本领域已知的，包括例如Yamamoto等(1997)Plant J.12(2)：255-265，Kwon等(1994)Plant Physiol.105：357-67，Yamamoto等(1994)Plant Cell Physiol.35(5)：773-778，Gotor等(1993)Plant J.3：509-18，Orozco等(1993)Plant Mol.Biol.23(6)：1129-1138，和Matsuoka等(1993)Proc.Natl.Acad.Sci.U.S.A.90(20)：9586-9590描述的那些。

组成性或可诱导和非组织特异性的或组织特异性的启动子的任意组合可以用于控制本发明嵌合蛋白质的表达。所需的控制可以是使用适当的启动子的瞬时，发育或环境控制。环境控制的启动子是那些对病原攻击，病原毒素，或其它外部化合物(例如，有意应用的小分子诱导物)发生反应的启动子。瞬时或发育启动子的实例是果实成熟依赖性启动子。特别优选的是可诱导的PR1启动子，玉米泛素启动子，和ORS。

根据例如组织类型，细胞类型，发育阶段，和/或环境条件，鉴定特定表达盒中启动子的方法是本领域熟知的。见，例如，The Maize Handbook，Chapters 114-115，Freeling和Walbot，Eds.，Springer，New York(1994)；Corn and Corn Improvement，Pedition，Chapter 6，Sprague和Dudley，Eds.，American Society of Agronomy，Madison，Wisconsin(1988)。

植物转化方法以及导入核苷酸序列进入植物的方法因进行转化的植物或植物细胞的类型，即单子叶植物或双子叶植物而可能变化。适当的导入核苷酸序列进入植物细胞和随后***植物基因组的方法包括微注射(Crossway等(1986)Biotechniques 4：320-334)，电穿孔(Riggs等(1986)Proc.Natl.Acad Sci.USA 83：5602-5606)，农杆菌介导的转化(Townsend等，U.S.Pat No.5,563,055)，直接基因转移(Paszkowski等(1984)EMBOJ.3：2717-2722)，和弹丸颗粒加速(见，例如，Sanford等，U.S.Patent No.4,945,050；Tomes等(1995)″Direct DNA Transfer into Intact Plant Cells viaMicroprojectile Bombardment，″in Plant Cell，Tissue，and Organ Culture：Fundamental Methods，ed.Gamborg和Phillips(Springer-Verlag，Berlin)；和McCabe等(1988)Biotechnology 6：923-926)。另见Weissinger等(1988)Ann.Rev.Genet.22：421-477；Sanford等(1987)Particulate Science andTechnology 5：27-37(洋葱)；Christou等(1988)Plant Physiol.87：671-674(大豆)；McCabe等(1988)BioTechnology 6：923-926(大豆)；Finer和McMullen(1991)In Vitro Cell Dev.Biol.2 7P：175-182(大豆)；Singh等(1998)Theor.Appl.Genet.96：319-324(大豆)；Datta等(1990)Biotechnology 8：736-740(水稻)；Klein等(1988)Proc.Natl.Acad Sci.USA 85：4305-4309(玉米)；Klein等(1988)Biotechnology 6：559-563(玉米)；Tomes，U.S.Patent No.5,240,855；Buising等，U.S.Patent Nos.5,322,783和5,324,646；Tomes等(1995)″Direct DNA Transfer into Intact PlantCells via Microprojectile Bombardment，″in Plant Cell Tissue，and OrganCulture：Fundamental Methods，ed.Gamborg(Springer-Verlag，Berlin)(玉米)；Klein等(1988)Plant Physiol.91：440-444(玉米)；Fromm等(1990)Biotechnology 8：833-839(玉米)；Hooykaas-Van Slogteren等(1984)Nature(London)311：763-764；Bowen等，U.S.Patent No.5,736,369(谷类)；Bytebier等(1987)Proc.Natl.Acad Sci.USA 84：5345-5349(Liliaceae)；DeWet等(1985)in The Experimental Manipulation of Ovule Tissues，ed.Chapman等(Longman，New York)，pp.197-209(花粉)；Kaeppleral.(1990)Plant Cell Reports 9：415-418和Kaeppler等(1992)Theor.Appl.Genet.84：560-566(whisker-mediated transformation)；D′Halluin等(1992)PlantCell 4：1495-1505(电穿孔)；Li等(1993)Plant Cell Reports 12：250-255和Christou和Ford(1995)Annals of Botany 75：407-413(水稻)；Osjoda等(1996)Nature Biotechnology 14：745-750(maize via Agrobacteriumtumefaciens)，所有都被并入参考。

修饰的植物可以通过传统方法生长为植物。见，例如，McCormick等(1986)Plant Cell.Reports：81-84。这些植物于是可以与相同的转化株或不同的株生长，和授粉，所得的杂种具有所需的鉴定的表型特征。可以生长2代或更多的子代以保证所述对象表型特征是稳定维持的并且遗传，然后收获种子以保证实现了所需的表型或其它特性。

D.基因阻抑的分子开关***

本发明的另一方面涉及控制基因表达的分子开关***，并且特别是使用本发明嵌合蛋白质的结构域阻抑或下调基因表达的分子开关***。这样的***(也称为“化学开关”)提供了进一步操纵调控或控制基因表达的时间或位置的工具。简言之，所述分子开关***导入了2个融合蛋白进入细胞或生物体，一个具有核酸结合结构域和另一个具有核周边结合结构域。这两个融合蛋白每个都具有特异性结合一个二价配体的一或另一个部分的第二结构域。导入二价配体进入含有所述2个融合蛋白的细胞或生物体，所述配体作为一个开关在3个实体中引发形成复合物。这个复合物于是与本发明嵌合蛋白质的功能相似，因为一旦形成，其可以携带靶基因与核周边关联以阻抑或下调基因表达。

一个实例是通过一个具有部分A和B的二价化学配体，编码AZP和特异性于部分A的抗体(或这个抗体的活性片段)的第一融合蛋白和编码可以与核周边相关联的结构域和特异性于部分B的抗体(或这个抗体的活性片段)的第二融合蛋白形成复合物。这两个融合蛋白可以分别或共同在相同的细胞中表达。将包括连接在一起的部分A和部分B的二价化学物加入细胞或生物体，每个融合蛋白对部分A或者部分B的亲和性介导了复合物的形成。

因而，本发明这个方面的第一融合蛋白包含可以特异性结合于与靶基因相关联的核苷酸序列的第一结构域，和可以特异性结合二价配体第一结合部分的第二结构域，所述配体可以被细胞摄取，其中第一和第二结构域是互相异源的。所述融合蛋白的第一结构域与本发明嵌合蛋白质的第一结构域相同。例如，第一融合蛋白的这个第一结构域可以是ZFP，AZP，亮氨酸拉链蛋白，螺旋-转角-螺旋蛋白，螺旋-环-螺旋蛋白，同源盒结构域蛋白，任何这些蛋白的DNA结合部分，或其任意组合。

同样，与靶基因相关联的核苷酸序列，和靶基因与本发明嵌合蛋白质描述的相同。

本发明这个方面的第二融合蛋白包含可以与核周边相关联的第一结构域和可以特异性结合二价配体第二结合部分的第二结构域，其中所述第一结构域与所述第二结构域是异源的。这些融合蛋白的第一结构域与本发明嵌合蛋白质的第二结构域是相同的。因而，所述第二融合蛋白的第一结构域结合核被膜，核纤层，异染色质，或其任意组合，以及所述第一结构域优选核被膜结合蛋白，核纤层结合蛋白，异染色质结合蛋白，任何这些蛋白的结合部分，或其任意组合。

这个分子开关***的第一和第二融合蛋白的第二结构域可以特异性结合二价配体的一个结合部分。所述第一融合蛋白结合所述二价配体的一个结合部分(例如，部分A)以及所述第二融合蛋白结合所述二价配体的另一个结合部分(例如，部分B)。一个实施方案中，每个融合蛋白的第二结构域可以是抗体的单链可变区(scFV)，所述抗体对所述二价配体的其各自的结合部分具有特异性。

部分A和B存在很多可能性。标准是所述部分具有足够的抗原性以可以选择对那个部分特异性的抗体。而且连接在一起的2个部分形成一个可以进入和在细胞内起作用以介导所述复合物形成的化合物。一个实施方案中，部分A具有例如如下的结构：

部分B具有例如如下的结构：

而且部分A和B可以通过适当长度的接头连接，所述接头具有如下所述的单位：

任何可以进入细胞并具有可以引起抗体的部分的化合物都适用于本发明的二价配体。本发明的这个实施方案允许通过在存在所述二价配体时形成复合物而将所述靶基因结构域序列特异性的定位于核周边。没有所述二价配体时，没有三级复合物形成。

一个优选的实施方案中，使用了一个化学开关，其是包含2个连接的化合物的二价化学物。这些化合物可以是通过一个短接头连接的任何可以引起抗体的化合物，例如，CH2CH2。一个优选的实施方案中，单链抗体(例如，单链F，(scFv))结合所述二价化学物的一部分，所述化学物连接单链抗体于核酸结合结构域。所述二价化合物的另一部分结合第二个单链抗体，例如，单链F，(scF_v)，其识别和结合可以与核周边相关联或结合的蛋白结构域。

另一个实施方案中，所述两个融合蛋白的第二结构域可以是突变的S-标签和S-蛋白(下述)，其只能在存在小分子或化学物时互相结合。这个小分子因而作为二价配体令所述两个融合蛋白形成单一的复合物以定位于核周边并导致基因阻抑或下调。

这个分子开关***可以用于以时间或空间方式调控靶基因阻抑的方法中。特别地，所述方法涉及将含有具有与靶基因相关联的核苷酸序列的靶核酸的细胞或生物体与本发明的分子开关***接触(如本部分所述)，并在一定时间或一定位置将细胞或生物体与合适的二价配体接触以形成具有所述融合蛋白的复合物并由此通过将靶基因定位于核周边而阻抑或下调靶基因的表达。由于应用了嵌合蛋白质，所述分子开关***的融合蛋白可以作为蛋白质，作为编码一或多个所述蛋白质的一或多个核酸，或作为其组合导入细胞或生物体中。当使用单一的核酸输送所述融合蛋白时，每个蛋自的表达可以共同或独立控制。同样，对于相同的靶基因，所述方法对于使用本发明的嵌合蛋白质的方法是有用的。

所述融合蛋白可以进行表达，分离和纯化，如上述嵌合蛋白质。同样，它们可以导入细胞或生物体中，如上述嵌合蛋白质。

E.基因去阻抑的分子开关***

可以以另一种形式提供分子开关***，其可以控制调控靶基因的去阻抑，即激活正在被阻抑的靶基因的表达。在本发明的这个方面，“开关”用来破坏两个融合蛋白间的相互作用(而不是如D部分所示促进相互作用)。而且，这些***(也称为“化学开关”)提供了另一种操纵调控或控制基因表达的时间或位置的工具。简言之，分子开关***导入了2个融合蛋白进入细胞或生物体中，一个具有核酸结合结构域及另一个具有核周边结合结构域。这两个融合蛋白都具有互相特异性结合的第二结构域，例如，第二结构域是另一个的结合伴侣(binding partners)。这个***中，导入所述融合蛋白导致了形成定位于核周边及阻抑或下调关联的靶基因表达的复合物。当化学开关在所需时间(或特定细胞类型)导入细胞或生物体中，其破坏所述复合物并消除了阻抑状态，即化学开关的存在导致了靶基因的去阻抑。

因而，本发明这个方面的第一融合蛋白包含可以特异性结合于与靶基因相关联的核苷酸序列的第一结构域，和可以特异性结合二价配体的第二结合部分的第二结构域，其中所述第一结构域与所述第二结构域是异源的。这些融合蛋白与D部分描述的那些不同。

所述融合蛋白的第一结构域与本发明嵌合蛋白质的第一结构域相同。例如，第一融合蛋白的这个第一结构域可以是ZFP，AZP，亮氨酸拉链蛋白，螺旋-转角-螺旋蛋白，螺旋-环-螺旋蛋白，同源盒结构域蛋白，任何这些蛋白的DNA结合部分，或其任意组合。同样，与所述靶基因关联的核苷酸序列，和靶基因与描述本发明嵌合蛋白质时的相同。

本发明这个方面的第二融合蛋白包含可以与核周边相关联的第一结构域和包含所述第一融合蛋白的第二结构域的结合伴侣的第二结构域，其中所述第一结构域与所述第二结构域异源。这些第二融合蛋白的第一结构域与本发明嵌合蛋白质的第二结构域相同。因此，所述第二融合蛋白的第一结构域结合核被膜，核纤层，异染色质，或其任何组合，而且所述第一结构域优选核被膜结合蛋白，核纤层结合蛋白，异染色质结合蛋白，任何这些蛋白的结合部分，或其任意组合。

这个分子开关***的第一和第二融合蛋白的第二结构域可以互相特异性结合。一个第二结构域的实例通过S-标签/S-蛋白***表示[Kim等(1993)Protein Sci.3：348-356]。S-标签是一个短肽(15个氨基酸)，S-蛋白是一个小蛋白(104个氨基酸)，而且可以交替用作所述2个融合蛋白任一个的第二结构域。S-标签和S-蛋白复合物的亲和性高(Kd＝1nM)。化学开关或配体于是是可以破坏S-标签和S-蛋白间相互作用的分子。例如，自由或缀合的S-标签蛋白可以作为化学开关。

这个分子开关***可以用于以时间或空间方式调控靶基因阻抑的方法。特别地，所述方法涉及将含有具有与靶基因相关联的核苷酸序列的靶核酸的细胞或生物体与本发明的分子开关***接触(如本部分所述)及在某一时间或位置将细胞或生物体与配体接触以破坏第一和第二融合蛋白的关联，由此阻抑所述靶基因的表达。由于应用了所述嵌合蛋白质，本分子开关***的融合蛋白可以作为蛋白质，作为编码一或多个蛋白的一或多个核酸，或作为其组合导入细胞或生物体中。当单一的核酸用于输送所述融合蛋白，每个蛋白的表达可以共同或单独控制。同样，所述方法对于相同的靶基因试图应用使用本发明嵌合蛋白质的方法是有用的。

这些融合蛋白还可以被表达，分离和纯化，如对嵌合蛋白质所描述的。同样，它们可以导入细胞或生物体中，如上述嵌合蛋白质。

F.药物配方

嵌合蛋白质，分子开关***(如部分D或E提供的)，(部分D或E)的多种融合蛋白或编码任何这些蛋白的核酸或本发明***的治疗配方通过将这些具有所需纯度与任选的生理可接受的载体，赋形剂或稳定剂混合而以冻干配方或水溶液的形式制备储存(Remington′s PharmaceuticalSciences16th edition，Osol，A.Ed.(1980))。可接受的载体，赋形剂，或稳定剂是在使用的剂量和浓度下对受体无毒的，并可以包括缓冲液如磷酸盐，柠檬酸盐，和其它有机酸；抗氧化剂包括抗坏血酸和甲硫氨酸；防腐剂(如十八烷基二甲基苄基氯化铵；氯化己烷双胺；杀藻胺，苯索氯铵；苯酚，丁基或苯甲醇；烷基对羟基苯甲酸酯如甲基或丙基对羟基苯甲酸酯；儿茶酚；间苯二酚；环己醇；3-戊醇；和m-甲酚)；低分子量(小于大约10个残基)多肽；蛋白质，如血清白蛋白，凝胶，或免疫球蛋白；亲水聚合物如聚乙烯吡咯烷酮；氨基酸如甘氨酸，谷氨酰胺，天冬酰胺，组氨酸，精氨酸，或赖氨酸；单糖，二糖，和其它碳水化合物，包括葡萄糖，甘露糖，或糊精；螯合剂如EDTA；糖如蔗糖，甘露糖，海藻糖或山梨醇；盐形成反离子(salt-forming counter-ions)如钠；金属复合物(例如，Zn-蛋白复合物)；和/或非离子表面活性剂如TWEEN，聚丙二醇与环氧乙烷的加聚物或聚乙二醇(PEG)。

如特定的治疗症状需要，此处的配方还可以含有一个以上的活性化合物，优选那些具有不相互产生反面影响的互补活性的化合物。这样的分子适于以组合存在有效于所需目的的量。

活性成分还可以包含在制备的微胶囊中，例如，分别通过凝聚技术或通过界面聚合，例如，羟甲基纤维素或凝胶微胶囊和聚(甲基丙烯酸甲酯)微胶囊，在胶状药物输送***或macroemulsion中。这样的技术揭示于Remington′s Pharmaceutical Sciences，16th edition，Osol，A.Ed.。

用于体内施用的配方是无菌的。而这个可以通过滤过无菌滤膜容易地完成，可以使用其它无菌方法，只要所述活性成分的活性不被破坏或改变。

可以制备持续释放制备物。合适的持续释放制备物的实例包括固体疏水聚合物的半透性基质，所述聚合物含有多肽变体，其基质是成形的物品，例如，膜，或微胶囊。持续释放基质的实例包括聚酯，水凝胶(例如聚(2-羟乙基-异丁烯酸盐)，或聚(乙烯醇))，聚交酯(U.S.Pat.No.3,773,919)，L-谷氨酸和y乙基-L-谷氨酸盐的共聚物，非可降解的乙烯-乙烯乙酸，可降解的乳酸-乙醇酸共聚物如LUPRON DEPOT(乳酸-乙醇酸共聚物和亮丙瑞林(leuprolide)乙酸组成的可注射的微球体)，和聚-D-(-)-3-羟基丁酸。聚合物如乙烯-乙烯乙酸和乳酸-乙醇酸能使分子释放超过100天，某种水凝胶释放蛋白时间较短。依赖于涉及的机制，为稳定可以设计合理的策略。例如，如果聚集机制被发现是通过含硫-二硫化物交换的分子间S-S键，则可以通过修饰巯基残基，冻干酸溶液，控制水分含量，使用适当的添加剂，和发展特异性的聚合物基质组合物来实现稳定。

本领域的技术人员可以容易地确定包含在任何药物组合物中所述嵌合蛋白质，(如部分D或E所提供的)分子开关***，(部分D或E的)多种融合蛋白或编码任何这些蛋白的核酸或本发明***的量及适当的预期使用剂量。

本发明中，多个公开，专利，和专利申请被引用。这些公开，专利和专利申请以其全文并入参考。

应理解和认为本领域技术人员可以变化本发明在示例实施方案中揭示的原理，所以这样的修改，变化和替代也包括在本发明的范围内。

实施例1

阻抑人VEGF-A

为下调人血管内皮生长因子A(VEGF-A)的表达，制备了编码含有524个氨基酸的小鼠GCL蛋白[Leatherman等(2000)]和靶向序列5′-GTGTGG GTG AGT GAG TGT G-3′(SEQ ID NO：7)的AZP的嵌合蛋白质(CPI-vegf)的重组构建体。编码另一个嵌合蛋白质(CP2-vegf)的第二构建体使用相同的小鼠GCL蛋白和靶向序列5′-GGG GCT GGG GGCGGT GTC T-3′(SEQ ID NO：8)的AZP制备。靶核苷酸序列来自人VEGF-A基因的启动子[Tischer等(1991)J.Biol.Chem.266：11947-11954]。所述AZP具有6个锌指，每个具有框架序列Pro-Tyr-Lys-Cys-Pro-Glu-Cys-Gly-Lys-Ser-Phe-Ser-Z^-1-Ser-Z²-Z³-Leu-Gln-Z6-His-Gln-Arg-Thr-His-Thr-Gly-Glu-Lys-(SEQ ID NO：3)；每个框架连接于下一个框架，没有多余的氨基酸残基。表3提供了确定DNA对CPI-vegf和CP2-vegf的结合特异性(Z^-1，Z²，Z³和Z⁶)的残基的身份。

为测试阻抑活性，所述嵌合蛋白质构建体被共转染至人组织细胞淋巴瘤细胞系U-937，其具有含有人VEGF-A天然启动子控制下的荧光素酶基因的荧光素酶基因报道质粒。这个荧光素酶基因报道质粒含有荧光素酶基因的VEGF-A基因上游的-2279到+1041位核苷酸[Liu等(2001)J.Biol.Chem.276：11323-11334]。对阳性对照，U-937细胞单独转染了所述荧光素酶基因报道质粒或共转染了所述荧光素酶基因报道质粒和一个无关靶序列的GCL和AZP(或其它DNA结合结构域)的嵌合蛋白质构建体(作为蛋白质或作为核酸)。相对于对照水平，荧光素酶活性的降低表明CPI-vegf和CP2-vegf下调了VEGF-A启动子活性。

或者，阻抑活性可以通过用CPI-vegf或CP2-vegf蛋白处理或通过用编码CP1-vegf或CP2-vegf蛋白的核酸转染U-937细胞，并且通过Northern印迹技术监控内源VEGF-A mRNA的水平来监控。

表3

蛋白质	结构域/靶核苷酸	Z<sup>-1</sup>	Z<sup>2</sup>	Z<sup>3</sup>	Z<sup>6</sup>
蛋白质	结构域/靶核苷酸	Z<sup>-1</sup>	Z<sup>2</sup>	Z<sup>3</sup>	Z<sup>6</sup>	CP1-vegf	1GTGT	Arg	Asn	Ser	Arg
	2TGGG	Arg	Asp	His	Thr	CP1-vegf	1GTGT	Arg	Asn	Ser	Arg
	2TGGG	Arg	Asp	His	Thr		3GTGA	Arg	Thr	Ser	Arg
	4AGTG	Thr	Asp	His	Gln		3GTGA	Arg	Thr	Ser	Arg
	4AGTG	Thr	Asp	His	Gln		5GAGT	Arg	Asn	Asn	Arg
	6TGTG	Thr	Asp	His	Thr		5GAGT	Arg	Asn	Asn	Arg
	6TGTG	Thr	Asp	His	Thr
CP2-vegf	1GGGG	Arg	Asp	His	Arg
CP2-vegf	1GGGG	Arg	Asp	His	Arg		2GCTG	Thr	Asp	Asp	Arg
	3GGGG	Arg	Asp	His	Arg		2GCTG	Thr	Asp	Asp	Arg
	3GGGG	Arg	Asp	His	Arg		4GGCG	Glu	Asp	His	Arg
	5GGTG	Thr	Asp	His	Arg		4GGCG	Glu	Asp	His	Arg
	5GGTG	Thr	Asp	His	Arg		6GTCT	Glu	Asn	Ser	Arg

序列表

<110>先正达合作有限公司

<120>调节基因表达的核被膜和核纤层结合嵌合体

<130>109845-163

<160>18

<170>PatentIn version 3.2

<210>1

<211>25

<212>PRT

<213>Artificial Sequence

<220>

<223>Zinc finger domain

<220>

<221>MISC_FEATURE

<222>(2)..(5)

<223>Amino acids 2-5 are Xaa wherein Xaa＝any amino acid，and up to

two amino acids can be missing.

<220>

<221>MISC_FEATURE

<222>(7)..(18)

<223>Xaa can be any amino acid

<220>

<221>MISC_FEATURE

<222>(20)..(24)

<223>Amino acids 20-24 are Xaa wherein Xaa＝any amino acid，and up to

two amino acids can be missing.

<400>1

Cya Xaa Xaa Xaa Xaa Cys Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa

1 5 10 15

Xaa Xaa His Xaa Xaa Xaa Xaa Xaa His

20 25

<210>2

<211>32

<212>PRT

<213>Artificial Sequence

<220>

<223>Zinc finger domain

<220>

<221>MISC_FEATURE

<222>(1)..(3)

<223>Xaa can be any amino acid

<220>

<221>MISC_FEATURE

<222>(5)..(8)

<223>Amino acids 5-8 are Xaa wherein Xaa＝any amino acid，and up to

two amino acids can be missing

<220>

<221>MISC_FEATURE

<222>(10)..(14)

<223>Xaa can be any amino acid

<220>

<221>MISC_FEATURE

<222>(15)..(15)

<223>Amino acid 15 is Z(-1)wherein Z(-1)＝Arg，Lys，Gln，Asn，Thr，

Met，Leu，Ile，Glu or Asp.

<220>

<221>MISC_FEATURE

<222>(16)..(16)

<223>Xaa can be any amino acid

<220>

<221>MISC_FEATURE

<222>(17)..(17)

<223>Amino acid 17 is Z2 wherein Z2＝Ser，Arg，Asn，Gln，Thr，Val，

Ala，Asp or Glu.

<220>

<22>MISC_FEATURE

<222>(18)..(18)

<223>Amino acid 18 is Z3 wherein Z3＝His，Lys，Asn，Gln，Ser，Ala，

Val，Thr，Asp or Glu..

<220>

<221>MISC_FEATURE

<222>(18)..(18)

<223>Amino acid 18 is Z3 wherein Z3＝His，Lys，Asn，Gln，Ser，Ala，

Val，Thr，Asp or Glu.

<220>

<221>MISC_FEATURE

<222>(19)..(20)

<223>Xaa can be any amino acid

<220>

<221>MISC_FEATURE

<222>(21)..(21)

<223>Amino acid 21 is Z6 wherein Z6＝Arg，Lys，Gln，Asn，Thr，Tyr，

Leu，Ile，Met，Glu or Asp.

<220>

<221>MISC_FEATURE

<222>(23)..(27)

<223>Amino acids 5-8 are Xaa wherein Xaa＝any amino acid，and up to

two amino acids can be missing

<220>

<221>MISC_FEATURE

<222>(29)..(32)

<223>Xaa can be any amino acid

<400>2

Xaa Xaa Xaa Cys Xaa Xaa Xaa Xaa Cys Xaa Xaa Xaa Xaa Xaa Xaa Xaa

1 5 10 15

Xaa Xaa Xaa Xaa Xaa His Xaa Xaa Xaa Xaa Xaa His Xaa Xaa Xaa Xaa

20 25 30

<210>3

<211>28

<212>PRT

<213>Artificial Sequence

<220>

<223>Zinc finger domain

<220>

<221>MISC_FEATURE

<222>(13)..(13)

<223>Amino acid 13 is Z(-1)wherein Z(-1)＝Arg，Lys，Gln，Asn，Thr，

Met，Leu，Ile，Glu or Asp.

<220>

<221>MISC_FEATURE

<222>(15)..(15)

<223>Amino acid 15 is Z2 wherein Z2＝Ser，Arg，Asn，Gln，Thr，Val，

Ala，Asp or Glu.

<220>

<221>MISC_FEATURE

<222>(16)..(16)

<223>Amino acid 16 is Z3 wherein Z3＝His，Lys，Asn，Gln，Ser，Ala，

Val，Thr，Asp or Glu.

<220>

<221>MISC_FEATURE

<222>(19)..(19)

<223>Amino acid 19 is Z6 wherein Z6＝Arg，Lys，Gln，Asn，Thr，Tyr，

Leu，Ile，Met，Glu or Asp.

<400>3

Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser Xaa Ser Xaa Xaa

1 5 10 15

Leu Gln Xaa His Gln Arg Thr His Thr Gly Glu Lys

20 25

<210>4

<211>5

<212>PRT

<213>Artificial Sequence

<220>

<223>peptide

<400>4

Gly Gly Gly Gly Ser

1 5

<210>5

<211>11

<212>PRT

<213>Human immunodeficiency virus

<220>

<221>misc_feature

<223>HIV Tat Protein domain

<400>5

Tyr Gly Arg Lys Lys Arg Arg Gln Arg Arg Arg

1 5 10

<210>6

<211>9

<212>DNA

<213>Human immunodeficiency virus

<220>

<221>misc_feature

<223>DNA binding domain

<400>6

gcagaagcc 9

<210>7

<211>19

<212>DNA

<213>Artificial Sequence

<220>

<223>DNA target sequence

<400>7

gtgtgggtga gtgagtgtg 19

<210>8

<211>19

<212>DMA

<213>Artificial Sequence

<220>

<223>DNA target sequence

<400>8

ggggctgggg gcggtgtct 19

<210>9

<211>7

<212>PRT

<213>Simian virus 40

<220>

<221>misc_feature

<223>Peptide from SV40 large T antigen

<400>9

Pro Lys Lys Lys Arg Lys Val

1 5

<210>10

<211>16

<212>PRT

<213>Artificial Sequence

<220>

<223>Peptide，residues 43-58 of the Antennapeida homeodomain Protein

<400>10

Arg Gln Ile Lys Ile Trp Phe Gln Asn Arg Arg Met Lys Trp Lys Lys

1 5 10 15

<210>11

<211>34

<212>PRT

<213>Herpes Simplex Virus

<220>

<221>misc_feature

<223>Residues 267-300 of the HSV VP22 protein

<400>11

Asp Ala Ala Thr Ala Thr Arg Gly Arg Ser Ala Ala Ser Arg Pro Thr

1 5 10 15

Glu Arg Pro Arg Ala Pro Ala Arg Ser Ala Ser Arg Pro Arg Arg Pro

20 25 30

Val Glu

<210>12

<211>11

<212>PRT

<213>Artificial Sequence

<220>

<223>Basic peptide with cellular uptake signal acitivty

<400>12

Tyr Ala Arg Ala Ala Ala Arg Gln Ala Arg Ala

1 5 10

<210>13

<211>9

<212>PRT

<213>Artificial Sequence

<220>

<223>Basic peptide with cellular uptake signal activity，“R9”

<400>13

Arg Arg Arg Arg Arg Arg Arg Arg Arg

1 5

<210>14

<211>16

<212>PRT

<213>Artificial Sequence

<220>

<223>D-penetratin peptide

<220>

<221>MISC_FEATURE

<222>(1)..(16)

<223>All amino acids are in the D-form.

<400>14

Arg Gln Ile Lys Ile Trp Phe Gln Asn Arg Arg Met Lys Trp Lys Lys

1 5 10 15

<210>15

<211>18

<212>PRT

<213>Artificial Sequence

<220>

<223>Peptide Syn B1 from Antennapedia homeodomain protein

<400>15

Arg Gly Gly Arg Leu Ser Tyr Ser Arg Arg Arg Phe Ser Thr Ser Thr

1 5 10 15

Gly Arg

<210>16

<211>10

<212>PRT

<213>Artificial Sequence

<220>

<223>L-SynB3 peptide from Antennapedia homeodomain protein

<400>16

Arg Arg Leu Ser Tyr Ser Arg Arg Arg Phe

1 5 10

<210>17

<211>10

<212>PRT

<213>Artificial Sequence

<220>

<223>D-SynB3 peptide from Antennapedia homeodomain protein

<220>

<221>MISC_FEATURE

<222>(1)..(10)

<223>All amino acids are in the D-form.

<400>17

Arg Arg Leu Ser Tyr Ser Arg Arg Arg Phe

1 5 10

<210>18

<211>8

<212>PRT

<213>Artificial Sequence

<220>

<223>Flag Epitope Peptide

<400>18

Asp Tyr Lys Asp Asp Asp Asp Lys

1 5

Claims

1、一种核酸靶特异性嵌合蛋白质，其包含一或多个可以特异性结合于与靶基因相关联的核苷酸序列的第一结构域和一或多个可以与核周边相关联的第二结构域，其中所述第一结构域选自包含一个锌指蛋白(ZFP)、一个人工锌指蛋白(AZP)、一个亮氨酸拉链蛋白、一个螺旋-转角-螺旋蛋白、一个螺旋-环-螺旋蛋白、一个同源盒结构域蛋白、任何一种上述蛋白的DNA结合部分、或其任意组合的组，其中至少一个所述第一结构域与至少一个所述第二结构域是异源的。

2、权利要求1的嵌合蛋白质，其中所述AZP包含至少一个锌指，如果存在其它的指，则所述至少一个锌指的指独立地通过0到10个氨基酸残基共价连接于所述其它的指，其中所述锌指的α-螺旋的-1，2，3和6位的氨基酸如下进行选择：

在-1位，氨基酸是精氨酸、谷氨酰胺、苏氨酸、甲硫氨酸或谷氨酸；

在2位，氨基酸是丝氨酸、天冬酰胺、苏氨酸或天冬氨酸；

在3位，氨基酸是组氨酸、天冬酰胺、丝氨酸或天冬氨酸；及

在6位，氨基酸是精氨酸、谷氨酰胺、苏氨酸、酪氨酸、亮氨酸或谷氨酸。

3、权利要求1或2的嵌合蛋白质，其中所述AZP包含至少一个锌指，每个锌指独立地表示为式-X₃-Cys-X_2-4-Cys-X₅-Z^-1-X-Z²-Z³-X₂-Z⁶-His-X_3-5-His-X₄-，如果存在其它的指，则所述至少一个锌指的指独立地通过0到10个氨基酸残基共价连接于所述其它的指；其中

X独立地是任何氨基酸且Xn表示多肽链中X出现的次数；

Z^-1是精氨酸、谷氨酰胺、苏氨酸、甲硫氨酸或谷氨酸；

Z²是丝氨酸、天冬酰胺、苏氨酸或天冬氨酸；

Z³是组氨酸、天冬酰胺、丝氨酸、或天冬氨酸；及

Z⁶是精氨酸、谷氨酰胺、苏氨酸、酪氨酸、亮氨酸或谷氨酸。

4、权利要求3的嵌合蛋白质，其中

Z^-1是精氨酸、谷氨酰胺、苏氨酸或谷氨酸；

Z²是丝氨酸、天冬酰胺、苏氨酸或天冬氨酸；

Z³是组氨酸、天冬酰胺、丝氨酸、或天冬氨酸；及

Z⁶是精氨酸、谷氨酰胺、苏氨酸或谷氨酸。

5、权利要求3或4的嵌合蛋白质，其中至少一个所述锌指的X位包含来自Zif268锌指、Sp1指或Sp1C指的相应的氨基酸。

6、权利要求1的嵌合蛋白质，其中所述一或多个第一结构域包含至少3个锌指，每个锌指表示为式-Pro-Tyr-Lys-Cys-Pro-Glu-Cys-Gly-Lys-Ser-Phe-Ser-Z^-1-Ser-Z²-Z³-Leu-Gln-Z⁶-His-Gln-Arg-Thr-His-Thr-Gly-Glu-Lys-，所述指直接互相结合，其中

Z^-1是精氨酸、谷氨酰胺、苏氨酸、甲硫氨酸或谷氨酸；

Z²是丝氨酸、天冬酰胺、苏氨酸或天冬氨酸；

Z³是组氨酸、天冬酰胺、丝氨酸、或天冬氨酸；及

7、权利要求6的嵌合蛋白质，其中

Z^-1是精氨酸、谷氨酰胺、苏氨酸或谷氨酸；

Z²是丝氨酸、天冬酰胺、苏氨酸或天冬氨酸；

Z³是组氨酸、天冬酰胺、丝氨酸、或天冬氨酸；及

Z⁶是精氨酸、谷氨酰胺、苏氨酸或谷氨酸。

8、权利要求2到7任一项的嵌合蛋白质，其中所述AZP包含3到15个锌指，其中任意一或多个由所述式表示。

9、权利要求8的嵌合蛋白质，其中所述AZP包含7、8或9个锌指。

10、权利要求9的嵌合蛋白质，其中所述AZP包含6个锌指。

11、前述权利要求任一项的嵌合蛋白质，其中所述一或多个第二结构域与核被膜、核纤层、异染色质、或其任意组合直接或间接相关联或与其结合。

12、权利要求11的嵌合蛋白质，其中一个所述第二结构域是GCL蛋白或GCL蛋白的结合部分。

13、权利要求11的嵌合蛋白质，其中所述一或多个第二结构域包含一个核被膜结合蛋白、核纤层结合蛋白、异染色质结合蛋白、可以与上述任一种蛋白相关联或结合的蛋白、任何一种上述蛋白的结合部分或其任意组合。

14、权利要求13的嵌合蛋白质，其中所述核纤层结合蛋白或所述核纤层结合蛋白的结合部分是核纤层蛋白或纤层结合蛋白。

15、权利要求13的嵌合蛋白质，其中所述异染色质结合蛋白或所述异染色质结合蛋白的结合部分选自于HP1或polycomb-group蛋白。

16、前述权利要求任一项的嵌合蛋白质，其包含1到6个第一结构域和1到6个第二结构域。

17、前述权利要求任一项的嵌合蛋白质，其进一步包含一个核定位信号。

18、前述权利要求任一项的嵌合蛋白质，其进一步包含一个细胞摄取信号。

19、权利要求18的嵌合蛋白质，其进一步包含一个核定位信号。

20、一种核酸，其包含编码权利要求1到19任一项的嵌合蛋白质的核苷酸序列。

21、一种表达载体，其包含权利要求19的核酸。

22、一种宿主细胞，其包含权利要求21的表达载体。

23、一种制备嵌合蛋白质的方法，其包含

(a)在表达所述嵌合蛋白质的条件下培养权利要求22的宿主细胞一段时间；及

(b)回收所述嵌合蛋白质。

24、权利要求21的表达载体，其中所述载体是适合转染进含有待调控的靶基因的细胞中的真核表达载体。

25、一种将靶核酸与嵌合蛋白质相结合的方法，其包含将含有与靶基因相关联的核苷酸序列的靶核酸与足够量的权利要求1到19任一项的嵌合蛋白质相接触一段足够的时间以便所述蛋白与所述靶核酸结合。

26、一种阻抑或下调靶基因表达的方法，其包含将含有与所述靶基因相关联的或足够接近的核苷酸序列的核酸与足够量的权利要求1到19任一项的嵌合蛋白质接触一段足够的时间以便所述嵌合蛋白质阻抑或下调所述靶基因的表达。

27、权利要求25或26的方法，其中所述嵌合蛋白质作为蛋白质或作为编码所述蛋白质的核酸被导入细胞或生物体中。

28、权利要求25到27任一项的方法，其中所述嵌合蛋白质进一步包含一个核定位信号。

29、权利要求25到28任一项的方法，其中所述嵌合蛋白质进一步包含一个细胞摄取信号。

30、权利要求25到29任一项的方法，其中所述靶基因编码一种哺乳动物基因、一种昆虫基因或一种酵母基因。

31、权利要求30的方法，其中所述靶基因来自哺乳动物并编码细胞因子、白细胞介素、癌基因、血管发生因子、抗血管发生因子、药物抗性蛋白、生长因子或肿瘤抑制因子。

32、权利要求25到29任一项的方法，其中所述靶基因编码病毒基因。

33、权利要求32的方法，其中所述病毒基因来自DNA病毒。

34、权利要求25到29任一项的方法，其中所述靶基因编码植物基因。

35、权利要求34的方法，其中所述植物基因来自番茄、玉米、水稻或谷类植物。

36、权利要求25到29任一项的方法，其中所述靶基因来自一种商品化的动物。

37、一种分子开关，其包含

(a)一种第一融合蛋白，其包含可以特异性结合于与靶基因相关联的核苷酸序列的第一结构域和可以特异性结合一种二价配体的第一结合部分的第二结构域，其中所述第一结构域选自包含一个锌指蛋白(ZFP)、一个人工锌指蛋白(AZP)、一个亮氨酸拉链蛋白、一个螺旋-转角-螺旋蛋白、一个螺旋-环-螺旋蛋白、一个同源盒结构域蛋白、任何一种上述蛋白的DNA结合部分、或其任意组合的组，所述配体可以被细胞摄取，其中所述第一结构域与所述第二结构域是异源的；及

(b)一种第二融合蛋白，其包含可以与核周边相关联的第一结构域和可以特异性结合所述二价配体的第二结合部分的第二结构域。

38、权利要求37的分子开关，其中每种融合蛋白的所述第二结构域是抗体的单链可变区(scFv)，所述单链可变区对所述二价配体中与其相应的结合部分具有特异性。

39、一种分子开关，其包含

(a)一种第一融合蛋白，其包含可以特异性结合于与靶基因相关联的核苷酸序列的第一结构域和可以特异性结合一种结合伴侣的第二结构域，其中所述第一结构域选自包含一个锌指蛋白(ZFP)、一个人工锌指蛋白(AZP)、一个亮氨酸拉链蛋白、一个螺旋-转角-螺旋蛋白、一个螺旋-环-螺旋蛋白、一个同源盒结构域蛋白、任何一种上述蛋白的DNA结合部分、或其任意组合的组，其中所述第一结构域与所述第二结构域是异源的；及

(b)一种第二融合蛋白，其包含可以与核周边相关联的第一结构域和包含所述第一融合蛋白的第二结构域的结合伴侣的第二结构域的，其中所述第一结构域与所述第二结构域是异源的。

40、权利要求39的分子开关，其中所述第一融合蛋白的第二结构域是S-蛋白及所述第二融合蛋白的第二结构域是S-标签，或反之亦然。

41、权利要求39或40的分子开关，其中所述AZP包含至少一个锌指，每个锌指独立地表示为式-X₃-Cys-X_2-4-Cys-X₅-Z^-1-X-Z²-Z³-X₂-Z⁶-His-X_3-5-His-X₄-，如果存在其它的指，则所述至少一个锌指的指独立地通过0到10个氨基酸残基共价连接于所述其它的指；其中

X独立地是任何氨基酸且Xn表示多肽链中X出现的次数；

Z^-1是精氨酸、谷氨酰胺、苏氨酸、甲硫氨酸或谷氨酸；

Z²是丝氨酸、天冬酰胺、苏氨酸或天冬氨酸；

Z³是组氨酸、天冬酰胺、丝氨酸、或天冬氨酸；及

42、权利要求41的分子开关，其中

Z^-1是精氨酸、谷氨酰胺、苏氨酸或谷氨酸；

Z²是丝氨酸、天冬酰胺、苏氨酸或天冬氨酸；

Z³是组氨酸、天冬酰胺、丝氨酸或天冬氨酸；及

Z⁶是精氨酸、谷氨酰胺、苏氨酸或谷氨酸。

43、权利要求41或42的分子开关，其中至少一个所述锌指的X位包含来自Zif268锌指、Sp1指或Sp1C指的相应氨基酸。

44、权利要求37到40任一项的分子开关，其中所述第一融合蛋白的第一结构域包含至少3个锌指，每个锌指表示为式-Pro-Tyr-Lys-Cys-Pro-Glu-Cys-Gly-Lys-Ser-Phe-Ser-Z^-1-Ser-Z²-Z³-Leu-Gln-Z⁶-His-Gln-Arg-Thr-His-Thr-Gly-Glu-Lys-，所述指直接互相连接，其中

Z^-1是精氨酸、谷氨酰胺、苏氨酸、甲硫氨酸或谷氨酸；

Z²是丝氨酸、天冬酰胺、苏氨酸或天冬氨酸；

Z³是组氨酸、天冬酰胺、丝氨酸或天冬氨酸；及

45、权利要求44的分子开关，其中

Z^-1是精氨酸、谷氨酰胺、苏氨酸或谷氨酸；

Z²是丝氨酸、天冬酰胺、苏氨酸或天冬氨酸；

Z³是组氨酸、天冬酰胺、丝氨酸或天冬氨酸；及

Z⁶是精氨酸、谷氨酰胺、苏氨酸或谷氨酸。

46、权利要求39到45任一项的分子开关，其中所述AZP包含3到15个锌指，其中任意一或多个锌指表示为所述的式，或其中所述第一融合蛋白的第一结构域包含3到15个锌指。

47、权利要求46的分子开关，其中所述AZP或所述第一结构域包含6，7，8或9个锌指。

48、权利要求37到47任一项的分子开关，其中所述第二融合蛋白的第一结构域与核被膜、核纤层、异染色质、或其任意组合直接或间接相关联或与其结合。

49、权利要求48的分子开关，其中所述第二融合蛋白的所述第一结构域是GCL蛋白或GCL蛋白的结合部分。

50、权利要求48的分子开关，其中所述第二融合蛋白的所述第一结构域包含核被膜结合蛋白、核纤层结合蛋白、异染色质结合蛋白、可以与前述任一种蛋白相关联或结合的蛋白、任何一种上述蛋白的结合部分、或其任意组合。

51、权利要求50的分子开关，其中所述核纤层结合蛋白或所述核纤层结合蛋白的结合部分是核纤层蛋白或纤层结合蛋白。

52、权利要求50的分子开关，其中所述异染色质结合蛋白或所述异染色质结合蛋白的结合部分选自HP1或polycomb-group蛋白。

53、一种编码权利要求37到52任一项的分子开关的第一或第二融合蛋白或两者的核酸。

54、权利要求53的核酸，其中所述第一和第二融合蛋白是协同调控的。

55、权利要求53的核酸，其中所述第一和第二融合蛋白是独立调控的。

56、一种表达载体，其包含权利要求53的核酸。

57、一种宿主细胞，其包含权利要求56的表达载体。

58、一种制备一或多种融合蛋白的方法，其包含

(a)在表达所述一或多种融合蛋白的条件下培养权利要求57的宿主细胞一段时间；及

(b)回收所述一或多种融合蛋白。

59、权利要求56的表达载体，其中所述载体是适于转染含有被调控的靶基因的细胞的真核表达载体。

60、一种在时间上或空间上阻抑靶基因表达的方法，其包含

(a)将含有靶核酸的细胞或生物体与权利要求37、38或39到52任一项的分子开关相接触，所述靶核酸具有与靶基因相关联的核苷酸序列，及

(b)将所述细胞或生物体与所述分子开关的二价配体在一定的时间或位置接触以在所述融合蛋白间形成一种复合物，由此阻抑所述靶基因的表达。

61、一种在时间上或空间上激活基因表达的方法，其包含

(a)将含有靶核酸的细胞或生物体与权利要求39到52任一项的分子开关接触，所述靶核酸具有与靶基因相关联的核苷酸序列，及

(b)将所述细胞或生物体与一个配体在一定的时间或位置接触以破坏第一和第二融合蛋白的关联由此使所述靶基因的表达去阻抑。

62、权利要求60或61的方法，其中所述分子开关的融合蛋白作为蛋白质、作为编码一或多种所述蛋白的一或多种核酸、或作为其组合被导入所述细胞或生物体中。