CN105074061B

CN105074061B - 位点特异性核酸酶活性的dna检测方法

Info

Publication number: CN105074061B
Application number: CN201380072819.2A
Authority: CN
Inventors: L·萨斯特里-登特; M·辛普森; Z·曹; W·陈; N·周; S·R·韦布
Original assignee: Dow AgroSciences LLC
Current assignee: Kedihua Agricultural Technology Co ltd
Priority date: 2012-12-13
Filing date: 2013-12-13
Publication date: 2021-03-09
Anticipated expiration: 2033-12-13
Also published as: RU2015128103A; KR20150094703A; CA2893579A1; ZA201504163B; US10344322B2; AR093979A1; WO2014093736A1; IL239382A0; US9493844B2; RU2678001C2; EP2931950A1; JP2016500264A; BR102013032129A2; CN105074061A; AU2017279660B2; US20170283865A1; AU2017279660A1; BR102013032129B1; AU2013359146B2; AU2013359146A1

Abstract

本公开提供了用于检测和鉴定含有被精确靶定(precision targeted)的基因组座位的植物事件的方法，以及包含这样的靶定基因组座位的植物和植物细胞的方法。该方法可以部署为高通量处理，用于筛选被靶定的基因组座位的完整性或破坏，且任选地用于检测被靶定的基因组座位处的供体DNA多核苷酸***。该方法可容易地用于鉴定通过使用位点特异性核酸酶所致的靶定方法产生的植物事件。

Description

位点特异性核酸酶活性的DNA检测方法

相关专利申请的相互援引

本申请要求获得于2012年12月13日提交的美国临时专利申请No. 61/736856的优先权。本申请通过提述并入前述每一项的全部内容。

电子提交的序列表的援引

序列表的正式拷贝作为ASCII格式的序列表通过EFS-Web电子提交，文件名为“DNADETECTION METHOD”，于2012年11月26日生成，大小为3,640字节，与专利说明书同时提交。在此ASCII格式化的文档中包含的序列表是专利说明书的一部分，本申请通过提述并入其全部内容。

发明领域

本发明部分涉及用于筛选植物事件的基因组座位的方法。更具体地，本公开部分地涉及用于检测和鉴定在被靶定的基因组座位内含有中断或破坏 (disruption)的植物事件的高通量方法。此外，本发明部分地涉及用于检测和鉴定***在被靶定的基因组座位内的外源供体DNA多核苷酸的植物事件的高通量方法。该方法可容易地应用于鉴定通过使用位点特异性核酸酶导致的靶定方法所产生的植物事件。

发明背景

植物的靶向基因组修饰一直是应用和基础研究中的一个长期存在而难以实现的目标。通过位点特异性核酸酶(锌指核酸酶(ZFN),大范围核酸酶, CRISPRS和TALENS)靶向并剪切基因组DNA的方法和组合物正在被开发用于实现这一目标。ZFN对基因组座位的位点特异性剪切可以用于，例如，诱导靶向突变、诱导细胞DNA序列的靶向缺失，和促进外源供体DNA多核苷酸靶向重组到预定的基因组座位内。参见，例如美国专利公开 No.20030232410；20050208489；20050026157；20050064474；和20060188987，和国际专利公开No.WO 2007/014275，本文通过提述并入其公开的全部内容用于所有目的。美国专利公开No.20080182332描述了使用非规范的 (non-canonical)锌指核酸酶(ZFN)靶向修饰植物基因组，美国专利公开No. 20090205083描述了ZFN介导的植物EPSPS基因组座位的靶向修饰。此外， Moehle等(2007)Proc.Natl.Acad.Sci.USA 104(9):3055-3060描述了使用设计的ZFN将基因靶向添加在指定的基因组座位处。当前的靶定方法通常涉及用含有至少一个转基因和位点特异性核酸酶(例如，ZFN)的供体DNA多核苷酸共转化植物组织，该核酸酶被设计成结合并剪切特定的基因组座位。供体DNA多核苷酸被稳定***在被剪切的基因组座位内，导致靶基因被添加在指定的基因组座位处。

不幸的是，报告和观察到的靶定基因组修饰的频率表明，靶定植物内的基因组座位是相对低效率的。由于所报告的低效率，必须从大量植物事件中筛选鉴定出含有被靶定的基因组座位的特定事件。最近报道的植物事件分析依赖于单一分析方法来确认靶定，可能导致对靶定频率的评估不准确及结果确信度低。

因此，本领域中需要快速鉴定含有被靶定的基因组座位的植物事件的筛选方法，这样的方法任选地可作为高通量方法应用。此外，由于靶向基因***与随机基因***伴随发生，期望的筛选方法可以在随机***的背景下特异性地鉴定出对基因组座位的靶向。

发明概要

在一个实施方案中，本公开涉及用于鉴定***在被靶定的基因组座位内的供体DNA多核苷酸的存在的方法，包括：在第一扩增反应中使用第一群寡核苷酸扩增包含该被靶定的基因组座位的基因组DNA样品，该群寡核苷酸在杂交条件下结合于该被靶定的基因组座位的近邻(proximal)，以藉此产生包含该被靶定的基因组座位的第一扩增子，和检测第一扩增子的存在或不存在，其中不存在该第一扩增子表明在被靶定的基因组座位内存在所述供体 DNA多核苷酸。

进一步的实施方案中，该方法包括在第二扩增反应中使用第二群寡核苷酸扩增基因组DNA样品，该群寡核苷酸在杂交条件下结合于该被靶定的基因组座位的近邻和供体DNA多核苷酸的内部，以产生包含至少一部分该被靶定的基因组座位及至少一部分所述供体DNA多核苷酸的第二扩增子，和检测第二扩增子的存在或不存在，其中存在该扩增子表明在该被靶定的基因组座位内存在所述供体DNA多核苷酸。

在又一实施方案中，该方法包括鉴定多个植物细胞中基因组座位的破坏，包括在第一扩增反应中使用多个寡核苷酸扩增包含该被破坏的基因组座位的基因组DNA样品，所述寡核苷酸在杂交条件下结合于被破坏的基因组座位的近邻，以产生包含该被破坏的基因组座位的第一扩增子，对第一扩增反应的结果进行定量，在第二扩增反应中使用多个寡核苷酸扩增包含该被破坏的基因组座位的基因组DNA样品，所述寡核苷酸在杂交条件下结合于被破坏基因组座位的近邻，以藉此产生包含该被破坏的基因组座位的第二扩增子，对第二扩增反应的结果进行定量，和比较该第一扩增反应和第二扩增反应的量，其中该第一扩增反应的量与第二扩增反应相比含有较低量的扩增产物，借此表明第一扩增子样品中的基因组座位被破坏。

在另一个实施方案中，本公开描述用于鉴定基因组座位的破坏的方法，包括在第一扩增反应中使用多个寡核苷酸扩增包含该被破坏基因组座位的基因组DNA样品，该寡核苷酸在杂交条件下结合于被破坏的基因组座位的近邻，以产生包含该被破坏的基因组座位的第一扩增子，和检测该第一扩增子的存在或不存在，其中不存在所述扩增子指示基因组座位的破坏。

该方法进一步的实施方案包括定量所述第一扩增反应的结果，定量所述第二扩增反应的结果，对第一扩增反应和第二扩增反应的结果进行比较，和确定被靶定的基因组座位内供体DNA多核苷酸的存在或不存在，其中如果不存在第一扩增子且存在第二扩增子，则确认该供体DNA多核苷酸***在该被靶定的基因组座位内。

作为一个实施方案，所述第一或第二扩增反应以多重格式在单个试管或孔中运行。

在另一个方面中，本公开的实施方案包括对第一和第二扩增反应的结果进行定量，其包括为第一与第二扩增反应中之一或二者产生标识谱(signature profile)。在该实施方案的一个示例性方面中，标识谱可选自下组：熔解温度曲线标识谱和荧光标识谱。

其他的实施方案包括从插层性DNA染料或荧光染料产生标识谱。其中，插层性染料包括花青染料，例如

染料。作为一个实施方案，

染料在扩增反应中的使用浓度小于10μM，小于4μM，或者小于2.7μM。在其他的实施方案中，荧光染料选自下组：HEX荧光染料，FAM 荧光染料，JOE荧光染料，TET荧光染料，Cy 3荧光染料，Cy 3.5荧光染料，Cy 5荧光染料，Cy 5.5荧光染料，Cy 7荧光染料，和ROX荧光染料。在一个实施方案中，所述第一或/和第二群多核苷酸包含荧光染料。

在实施方案中，本公开涉及用于鉴定被靶定的基因组座位内供体***的存在、以及选择在被靶定的基因组座位内包含供体***物的转基因事件的方法和组合物。额外的实施方案包括含有该转基因事件的植物。

进一步的实施方案可以包括双子叶植物，其中该双子叶植物选自下组：大豆植物、芥花植物(canola)、和棉花植物。此外，进一步的实施方案可以包括单子叶植物，其中该单子叶植物选自下组：玉米植物、水稻植物和小麦植物。

其他的实施方案包括被位点特异性核酸酶剪切的基因组座位。示例性位点特异性核酸酶可以包括锌指核酸酶、大范围核酸酶、CRISPR或TALEN 核酸酶，或者任何其它位点特异性核酸酶。

在另一个方面中，本公开的实施方案包括扩增反应，其中该扩增使用聚合酶链式反应完成。

本公开进一步的实施方案包括扩增子，其包括供体DNA多核苷酸和被靶定的基因组座位的5’接点和3’接点。此外，本公开的实施方案包括扩增子，其包括供体DNA多核苷酸和被靶定的基因组座位的5’接点或3’接点。

实施方案还包括含有至少一个基因表达盒的供体DNA多核苷酸。

除了上述示例性方面和实施方案之外，研读下面的说明书可以想到其他的方面和实施方案。

附图简述

图1例证了用于鉴定含有被靶定的基因组座位的植物事件的分析处理。

图2描述了被靶定的座位处ZFN定量PCR(qPCR)破坏测定的结果：事件的一个子集的筛选结果。箭头指示具有被破坏的座位(证据是可检测qPCR 信号的降低)的转基因事件。

图3描述了用内-外PCR扩增过程完成的筛选。图3A描绘了没有转基因***的被靶定的基因组座位(“座位”)。内-外PCR不会产生扩增产物。图 3B描述了具有被靶定的转基因***的座位。内-外PCR将产生来自该座位的5’端的2kb扩增子和来自3’端的1.5kb扩增子。

图4描绘了内-外PCR分析。图4A描述了从使用

染料 (Invitrogen,Carlsbad,CA)的扩增反应产生的荧光信号标识谱，其可用于鉴定阳性转基因***事件。图4B描述了从样品的扩增反应产生的熔解温度曲线标识谱，与阳性对照相比较，其可用于确认阳性荧光信号。

图5显示了使用本公开主题的破坏测定和内-外PCR反应而得到鉴定的被靶定的事件。

图6描绘了ZFN破坏测定。上面括号中显示的样品不含有被破坏的基因组座位，下面括号中显示的样品含有被破坏的基因组座位。

图7描绘了另一个ZFN破坏测定。上面括号中显示的样品不含有被破坏的基因组座位，下面括号中显示的样品含有被破坏的基因组座位。

图8描绘了ELP座位区的eZFN破坏测定。图8(a)提供了含有ELP的基因组片段的图解，该片段是由来自pDAB105818的T-链的整合产生的。这个示意图鉴定了用于破坏测定的引物和探针(MAS621,MAS622和探针 UPL67)的相对位置。图8(a)提供了354个pat阳性事件的筛选结果。被破坏的ELP座位由可检测qPCR信号的降低指示。因此，上面括号中显示的样品不含有被破坏的ELP基因组座位，下面括号中显示的样品含有被破坏的ELP 基因组座位。

图9描述了内-外PCR分析。图9A描述了使用

染料(Invitrogen,Carlsbad,CA)从5’供体/ELP座位接点的扩增反应生成的熔解温度信号谱，其可用于鉴定阳性转基因***事件。图9B描述了使用

染料 (Invitrogen,Carlsbad,CA)从3’供体/ELP座位接点的扩增反应生成的熔解温度信号谱，其可用于鉴定阳性转基因***事件。

图10提供了用于ELP座位破坏测定的具有相应锌指和ZF结合序列和水解探针的图解：eZFN8线代表用于检测eZFN8活性的探针，其具有位于结合位点序列SBS15590和SBS18473之间的间隔序列GTGAGA；eZFN1线代表用于检测eZFN1活性的探针，其具有位于第二组结合位点序列 SBS15590和SBS8196之间的间隔序列GTGGAT。上面的序列由SEQ ID NO:39示出，在图底部显示的互补序列由SEQ ID NO:40示出。

图11图解了标准化aad-1(圆形)和ELP拷贝数(加号)的重叠图。图11(a) 显示了与eZFN1切除子(excisor)杂交的1125个样品的破坏测定结果：425个的ELP拷贝数小于0.05(切割的(cut))，95个处于0.05和0.4之间(嵌合的)。图11(b)显示了与eZFN8切除子(excisor)杂交的697个样品的破坏测定结果： 488个的ELP拷贝数小于0.05，1个的ELP拷贝数在0.05和0.4之间。

图12提供了用eZFN1(pDAB105825)和eZFN8(pDAB105828)切割的ELP基因组座位样品的序列比对。ZFN识别位点之间的多核苷酸间隔序列用红框指示。用虚线(-)显示的碱基是缺失，代表序列中有最少一个碱基丢失。

详细说明

现在发明了一种用于快速筛选、鉴定和表征被位点特异性核酸酶所靶定的植物事件的新方法。该方法可用于通过进行第一扩增反应确定基因组靶座位是否被破坏来分析基因组靶座位的完整性。随后可以对于被鉴定为含有被破坏的基因组座位的事件通过第二扩增反应进行筛选，以确认该被靶定的基因组座位内外源供体DNA多核苷酸的存在。这样，可以对大量植物事件进行分析和筛选，以鉴定和选择在被靶定的基因组座位中***了供体DNA多核苷酸的特定事件。本公开主题进一步包括利用新型筛选方法选择的含有被核酸酶靶定的植物事件的植物和植物细胞。

本文证明了用于筛选基因组座位被破坏的植物事件的新方法，其是由位点特异性核酸酶的基因组DNA切割产生的。被破坏的基因组座位可以包括供体DNA多核苷酸的存在，或者被破坏的基因组座位可以包括***和/或缺失(也称作InDel)。该方法利用两个初始扩增反应作为筛选测定。第一扩增反应是破坏测定，其中通过扩增反应鉴定***在被靶定的基因组座位内的供体 DNA多核苷酸的存在，其中不存在扩增子表明在被靶定的基因组座位内存在供体DNA多核苷酸。第二扩增反应是“内-外”PCR扩增反应，用于筛选供体DNA多核苷酸被靶定的的基因组座位的3’和/或5’接点序列。含有3’和/ 或5’接点序列的扩增产物的存在指示供体DNA多核苷酸存在于该被靶定的基因组座位内。

通过利用两个截然不同的扩增反应筛选测定，破坏扩增反应和内- 外扩增反应，从大量非靶向事件中鉴定阳性靶事件的概率被大大增加。破坏扩增反应被设计成允许以高通量的方式对大量样品进行快速分析。而且，本测定能够同时对靶基因组座位内的供体DNA多核苷酸***或ZFN剪切事件进行鉴定和表征。内-外扩增反应提供了一种可选择的分析方法。本测定用于鉴定3'和5'接点的存在，以确认被靶定的基因组座位内***的供体DNA 多核苷酸的存在。内-外扩增反应可用于确认在破坏测定中鉴定的被靶定事件确实在基因组座位中含有完整、全长的被靶定***物。当破坏扩增反应与内-外扩增反应联合运行时，可以对汇编数据进行分析，以确定对供体DNA 多核苷酸进行基因组座位内的靶定的限制因素(例如，对于产生在被靶定的基因组座位内含有供体DNA多核苷酸的事件而言，ZFN剪切或供体***是限制因素)。利用两种具有不同方法学的不同筛选测定法，可以增加发现在靶基因组座位内含有供体DNA多核苷酸的被靶定事件的可能性。而且，所公开的方法可以部署为高通量测定，允许对样品的子集进行快速而有效的鉴定，然后可以通过其它分子确认方法对它们进行进一步的分析。所公开的筛选测定描述了用于鉴定和获得被靶定的转基因***事件的高质量、高通量处理方法。而且，该方法学易于应用于任何植物物种的分析。

除非另外指出，否则本文所用的所有技术和科学术语具有与本公开涉及领域中普通技术人员所普遍理解的相同的含义。在冲突的情况下，以本申请包括的定义为准。除非上下文另有要求，否则单数术语应包括复数，并且复数术语应包括单数。本文出于所有目的引用这里提到的所有出版物、专利和其他参考文献的全部内容作为参考，就如同每个单独的出版物或专利申请被具体而单独地指出一样，除非只有专利或专利公开的特定部分被指示为通过引用并入本文。

为了进一步阐明本公开，提供了如下的术语、缩写和定义。

如本文所使用的，术语“包括”、“包含”、“含有”、“涵盖”、“有”、“具有”、“包含”或“含有”，或其任何其它变型，均意图是非排他性的或开放式的。例如，包含系列元素的组合物、混合物、处理、方法、物品、或装置不一定仅限于那些元素，而是可以包括其它未明确列出的或者这种组合物、混合物、处理、方法、物品、或装置固有的元素。而且，除非明确说明与此相反，否则“或”是指包含性的“或”而不是排他性的“或”。例如，条件A或B可以被如下的任何一个满足：A为真(或存在)且B为假(或不存在)，A为假(或不存在) 且B为真(或存在)，和A和B都为真(或存在)。

另外，位于公开实施方案某一元素或组分之前的不定冠词“一”和“一个”意图对事件的数目，即元素或组分的发生数目，是无限制性的。因此，“一”或“一个”应该被理解为包括一个或至少一个，并且单数词形式的元素或组分也包括复数，除非该数字明显表示单数。

如本文所使用的，术语“发明”或“本发明”是非限制性术语，并且不意图指特定发明的任何单个实施方案，而是包括本申请中公开的所有可能的实施方案。

如本文所使用的，术语“植物”包括，但不仅限于，植物的任何后代、细胞、组织或部分。

本文描述了用于鉴定***在靶基因组座位内的供体DNA多核苷酸的存在的方法。用于***的DNA多核苷酸也指，并且意图包括，“外源”多核苷酸、“供体”多核苷酸或“分子”或“转基因”。

在某些实施方案中，供体DNA多核苷酸包括长度大于1kb，例如2-200 kb，2-10kb(或其间的任何数值)的序列(例如，编码序列，也被称为转基因)。供体DNA多核苷酸还可以包含至少一个位点特异性核酸靶位点，例如在供体DNA多核苷酸中可包含至少一个ZFN、大范围核酸酶、CRISPR或TALEN 靶位点。供体DNA多核苷酸可包括至少1个靶位点，例如一对ZFN、CRISPR 或TALEN，以识别和结合并剪切。典型地，核酸酶靶位点位于转基因序列的外部，例如，转基因序列的5'或3'侧，用于剪切并除去居间的转基因，如果需要的话。核酸酶剪切位点可以是供任何核酸酶用的。在某些实施方案中，双链供体DNA多核苷酸内包含的核酸酶靶位点所对应的核酸酶，与用于剪切供体DNA多核苷酸所***的内源基因组靶标的核酸酶是相同的核酸酶。

包含在本文所述的供体DNA多核苷酸序列内的转基因可以使用本领域已知的标准技术(如PCR)从质粒、细胞或其它来源加以分离。所用的供体 DNA多核苷酸序列可以包括不同类型的拓扑结构，包括环状超螺旋(circular supercoiled)、松环(circular relaxed)、线性等。作为备选，它们可使用标准寡核苷酸合成技术化学合成。此外，供体DNA多核苷酸序列可以被甲基化或者无甲基化。供体DNA多核苷酸序列可以处于细菌或酵母人工染色体(BAC 或YAC)的形式，或者作为质粒载体。供体DNA多核苷酸序列可以来自通过根癌土壤杆菌引入到植物细胞内的T链。

本文所述的双链供体DNA多核苷酸可以包括一个或多个非天然碱基和/ 或骨架。具体地，可以使用本文所述的方法***具有甲基化胞嘧啶的供体 DNA多核苷酸序列，以便在感兴趣区域实现转录静止状态。

供体DNA多核苷酸可以包含任何感兴趣的外源序列。示例性供体DNA 多核苷酸序列包括，但不仅限于，任何多肽编码序列(例如，cDNA)、启动子序列、增强子序列、表位标签、标记基因、切割酶识别位点和各种类型的表达构建体。标记基因包括，但不仅限于，编码介导除草剂抗性的蛋白质(例如，HPPD抗性、2,4-D抗性、草铵膦抗性、或草甘膦抗性，以及其它已知的除草剂抗性蛋白质)的序列，编码发色或荧光或化学发光蛋白(例如，绿色荧光蛋白、增强型绿色荧光蛋白、红色荧光蛋白、萤光素酶)的序列，和编码介导强化的细胞生长和/或基因扩增的蛋白质(例如，二氢叶酸还原酶)的序列。表位标签包括，例如，FLAG、HIS、MYC、TAP、HA或任何可检测氨基酸序列的一个或多个拷贝。

术语“多核苷酸”、“核酸”和“核酸分子”意在包括单数的核酸以及复数的核酸、核酸片段、变异体或其衍生物，或者构建体，例如，信使RNA(mRNA) 或质粒DNA(pDNA)。多核苷酸或核酸可以包含全长cDNA序列、或其片段的核苷酸序列，包括非翻译5'和3'序列和编码序列。除非另外指出，否则多核苷酸或核酸可以由任何多核糖核苷酸或多脱氧核糖核苷酸构成，其可以是未修饰的RNA或DNA或者被修饰的RNA或DNA。例如，多核苷酸或核酸可以包括单链和双链DNA，单链和双链区混合的DNA，单链和双链RNA，单链和双链区混合的RNA，包含DNA和RNA的杂交分子，其可以是单链的，或者更典型地是双链的，或者是单链和双链区的混合物。这些术语还涵盖多核苷酸或核酸的化学、酶促或代谢修饰的形式。

多核苷酸或核酸序列可以被称为是“分离的”，其中它已经从其天然环境中被移出。例如，为了本公开的目的，载体中含有的编码具有草甘膦抗性的多肽或多肽片段的异源多核苷酸或核酸被认为是分离的。分离多核苷酸或核酸的进一步的实例包括保持在异源宿主细胞内的重组多核苷酸，或者溶液中的(部分或基本上)纯化的多核苷酸或核酸。根据本公开实施方案的分离多核苷酸或核酸还包括合成产生的这些分子。处于DNA聚合物形式的分离多核苷酸或核酸可以包括cDNA、基因组DNA或合成DNA的一个或多个片段。

术语“基因”是指编码功能产物分子，即RNA或蛋白质的核酸序列，其任选地包括位于编码序列之前的调节序列(5’非编码序列)和之后的调节序列 (3’非编码序列)。

如本文所使用的，术语“编码区”是指编码特定氨基酸序列的DNA序列。“合适的调节序列”是指位于编码序列上游(5'非编码序列)、中间、或下游(3' 非编码序列)的核苷酸序列，其影响相关编码序列的转录、RNA加工或稳定性，或翻译。调节序列可以包括启动子、翻译前导序列、内含子、多腺苷酸化识别序列、RNA加工位点、效应子结合位点和茎环结构。

如本文所使用的，术语“多肽”意图包括单数的“多肽”和复数的“多肽”及其片段，并且指由通过酰胺键(也称为肽键)线性连接的单体(氨基酸)构成的分子。术语“多肽”是指由两个或多个氨基酸构成的任何链或多个链，并且不指产物的具体长度。因此，肽、二肽、三肽、寡肽、“蛋白质”、“氨基酸链”或任何其它用来指由两个或多个氨基酸构成的链或多个链的术语均包含在“多肽”的定义内，并且术语“多肽”可以用这些术语代替，或者可互换使用。多肽可以来自天然生物来源或者通过重组技术生产，但不一定是从指定核酸序列翻译的。它可以按照任何方式产生，包括化学合成。

“分离的”多肽或片段、变异体或其衍生物意指不处于其天然环境中的多肽。不需要特定水平的纯化。因此，提到“分离的”表示涉及“人力”的参与，如本文所述。例如，分离的多肽可以从其天然或固有环境中被移出。为本公开的目的，在宿主细胞中表达的重组多肽和蛋白质被认为是分离的，因为它们是已经通过任何合适的技术被分离、分级、或部分纯化或基本上纯化。

如本文所使用的，“天然”是指多核苷酸、基因或多肽在自然中出现(带有其自身的调节序列，如果存在的话)的状态。

如本文所使用的，“内源”是指多核苷酸、基因或多肽位于其生物体的天然位置或者在生物体的基因组中的天然形式。“内源多核苷酸”包括位于其在生物体基因组中的天然位置处的天然多核苷酸。“内源基因”包括位于其在生物体基因组中的天然位置处的天然基因。“内源多肽”包括位于其在生物体中的天然位置处的天然多肽。

如本文所使用的，“异源”是指通常不会在宿主生物体中出现，而是被引入到宿主生物体内的多核苷酸、基因或多肽。“异源多核苷酸”包括这样的天然编码区或其部分，其被再导入到源生物体内、但是其形式与相应的天然多核苷酸不同。“异源基因”包括这样的天然编码区或其部分，其被再导入到源生物体内，但其形式与相应的天然基因不同。例如，异源基因可以包括天然编码区，该天然编码区是被再导入到天然宿主体内的包含非天然调节区的嵌合基因的一部分。“异源多肽”包括被再引入到源生物体内的形式与相应的天然多肽不同、天然多肽。主题基因和蛋白可以和其它基因和蛋白融合，从而产生嵌合或融合蛋白。可以根据本主题公开的实施方案使用的基因和蛋白质不仅包括具体举例的全长序列，还包括这些序列、变异体、突变体、嵌合子或其融合物的部分、区段和/或片段(与全长分子相比，包括邻接片段和内部和/或末端缺失)。

在一个实施方案中，供体DNA多核苷酸包括编码任何多肽的多核苷酸编码，该多肽在细胞内的表达是期望的，该多核苷酸包括，但不仅限于，基因表达盒，其包括启动子、3’UTR、除草剂抗性性状、昆虫抗性性状、改良的油性状、农艺性状、和任何上述的功能性片段。编码序列可以是，例如， cDNA。

术语“启动子”指能够控制编码序列或功能性RNA表达的DNA序列。一般而言，编码序列位于启动子序列的3'。启动子可以整体来源于某个天然基因，或者也可以由源自不同的天然发现的启动子的不同元件组成，或者甚至包括合成DNA片段。本领域技术人员可以理解，不同的启动子可以在不同的组织或细胞类型中指导基因表达，或者在不同的发育阶段，或者响应不同的环境或生理条件指导基因表达。指导基因在大多数细胞类型中在大多数时间表达的启动子通常被称为“组成型启动子”。此外公认，因为在大多数情况下，调节序列的确切边界尚未完全确定，因此不同长度的DNA片段可以具有相同的启动子活性。

术语“可操作连接”是指单个核酸片段上核酸序列的关联，使得一个的功能受到另一个的影响。例如，当启动子能够影响编码序列的表达时(例如，编码序列在启动子的转录控制之下)，启动子与编码序列是可操作连接的。编码序列可以沿着有义或反义方向与调节序列操作连接。

如本文所使用的，术语“表达”是指来自本公开实施方案的核酸片段的有义(mRNA)或反义RNA的转录和稳定积累。表达还指mRNA翻译成多肽。

如本文所使用的，术语“过表达”是指表达高于相同或相关基因的内源表达。如果异源基因的表达高于与之相当的内源基因的表达，则异源基因被过表达。

如本文所使用的，术语“转化”是指将核酸或片段转移并整合到宿主生物体内，导致遗传上稳定的继承。含有被转化核酸片段的宿主生物体被称作“转基因”或“重组”或“被转化”的生物体。已知的转化方法包括根癌土壤杆菌介导的或者发根土壤杆菌介导的转化，磷酸钙转化，聚凝胺转化，原生质体融合，电穿孔，超声方法(例如，声致穿孔)，脂质体转化，显微注射，裸DNA，质粒载体，病毒载体，基因枪(微粒轰击)，碳化硅WHISKERS^TM介导的转化，气雾剂集束，或PEG转化，以及其它可能的方法。

如本文所使用的，术语“质粒”和“载体”是指经常携带基因的染色体外元件，其不是细胞核心代谢的一部分，通常处于环状双链DNA分子的形式。这样的元件可以是自主复制序列、基因组整合序列、噬菌体或核苷酸序列、线性或环状、单链或双链DNA或RNA，源自任何来源，其中若干核苷酸序列已经被连接或重组成一个独特的建构，该建构能够将用于所选基因产物的启动子片段和DNA序列连同合适的3'非翻译序列一起导入到细胞内。

如本文所使用的，术语“密码子简并性”是指遗传密码允许核苷酸序列变异而不影响所编码多肽的氨基酸序列的性质。技术人员熟知特定宿主细胞在使用核苷酸密码子来指定一定氨基酸时展现的“密码子偏好”。因此，在以改良在宿主细胞内的表达为目标合成基因时，理想的是设计基因使其密码子使用频率接近宿主细胞优选密码子的使用频率。

术语“密码子优化”在指示基因或用于转化各种生物体的核酸分子的编码区时，是指改变基因或核酸分子编码区中的密码子以反映宿主生物体的典型密码子用法，而不改变该DNA所编码的多肽。这种优化包括用一个或多个在该生物体基因中使用频率更高的密码子代替至少一个或者超过一个或者显著数目的密码子。

正如本领域已知的，术语“百分比同一性”(或“％同一性”)是两个或多个多肽序列或者两个或多个多核苷酸序列之间的关系，其是通过序列比较确定的。在本领域，“同一性”还意味着多肽或多核苷酸之间序列相关度的程度，视情况而定，可以通过这些序列字符串(string)之间的匹配度加以确定。“同一性”和“相似度”可以通过已知方法容易地计算，包括但不仅限于，在如下文献中公开的那些：1.)Computational Molecular Biology(Lesk,A.M.,编辑) Oxford University:NY(1988)；2.)Biocomputing:Informatics and GenomeProjects(Smith,D.W.,编辑)Academic:NY(1993)；3.)Computer Analysis of SequenceData,Part I(Griffin,A.M.和Griffin,H.G.,编辑)Humania:NJ (1994)；4.)SequenceAnalysis in Molecular Biology(von Heinje,G.,编辑) Academic(1987)；和5.)Sequence Analysis Primer(Gribskov,M.和Devereux,J., 编辑)Stockton:NY(1991)。

用于确定核酸和氨基酸序列同一性的技术是本领域已知的。通常，这些技术包括确定基因mRNA的核苷酸序列和/或确定由其编码的氨基酸序列，并将这些序列与另一核苷酸或氨基酸序列进行比较。基因组序列也以这种方式加以确定并进行比较。一般而言，同一性分别是指两个多核苷酸或多肽序列的确切的核苷酸对核苷酸或氨基酸对氨基酸对应程度。两个或多个序列 (多核苷酸或氨基酸)可以通过确定它们的百分比同一性进行比较。两个序列的百分比同一性，不论是核酸还是氨基酸序列，是两个对齐的序列之间确切匹配的数目除以较短序列的长度并乘以100。见Russell,R.,和Barton,G., “StructuralFeatures can be Unconserved in Proteins with Similar Folds,”J.Mol. Biol.244,332-350(1994),第337页，本申请通过提述并入其全部内容。

此外，确定同一性和相似度的方法被编码为公众可得的计算程序。序列比对和百分比同一性计算可以使用，例如VECTOR

软件包(Invitrogen, Carlsbad,CA)的AlignX程序或者LASERGENE^TM生物信息计算软件包 (DNASTAR Inc.,Madison,WI)的MEGALIGN^TM程序执行。序列的多重比对使用“Clustal比对方法”执行，其包括该算法的多种变型，包括“Clustal V比对法”，其对应于标记为Clustal V的算法(由Higgins和Sharp,CABIOS.5:151-153 (1989)；Higgins,D.G.等.,Comput.Appl.Biosci.,8:189-191(1992)公开)，并且可以在LASERGENE^TM生物信息学计算软件包(DNASTAR Inc.)的 MEGALIGN^TM程序中发现。对于多重比对，默认值相应于缺口罚分＝10和缺口长度罚分＝10。用于配对比对和使用Clustal法计算蛋白质序列百分比同一性的默认参数是KTUPLE＝1,GAP PENALTY(缺口罚分)＝3,WINDOW(窗口)＝5和DIAGONALS SAVED＝5。对于核酸，这些参数为KTUPLE＝2,GAPPENALTY＝5,WINDOW＝4和DIAGONALS SAVED＝4。在使用Clustal V程序进行序列比对之后，通过检查相同程序内的“序列距离”表有可能获得“百分比同一性”。此外，有“Clustal W算法”可用，其对应于标记为Clustal W的算法(如Higgins和Sharp,CABIOS.5:151-153(1989)；Higgins,D.G.等.,Comput. Appl.Biosci.8:189-191(1992)所述)，并可在LASERGENE^TM生物信息学计算软件包(DNASTAR Inc.)的MEGALIGN^TM v6.1程序中找到。多重比对的默认参数为(GAP PENALTY＝10,GAP LENGTH PENALTY(缺口长度罚分)＝0.2, 延迟发散序列(Delay Divergen Seqs)(％)＝30,DNA Transition Weight(DNA转换加权)＝0.5,Protein Weight Matrix(蛋白权重矩阵)＝Gonnet Series,DNA Weight Matrix(DNA权重矩阵)＝IUB)。在使用Clustal W程序进行序列比对之后，有可能通过检查相同程序内的“序列距离”表获得“百分比同一性”。

本公开实施方案的核酸探针和引物可以在杂交条件下与扩增反应内的靶DNA序列杂交。可以使用任何常规的核酸杂交和扩增方法鉴定***在靶基因组座位内的供体DNA多核苷酸的存在。核酸分子、寡核苷酸或其片段能够在某些条件下特异性杂交其它核酸分子。如本文所使用的，如果两个分子能够形成反平行双链核酸结构，则两个核酸分子被称作能够特异性彼此杂交。如果两个核酸分子显示完全的互补性，则一个核酸分子被称作是另一个核酸分子的“互补物”。如本文所使用的，当一个分子的每一个核苷酸均与另一个分子的核苷酸互补时，则该分子被称作显示“完全互补性”。显示完全互补性的分子一般以充分的稳定性彼此杂交，使它们在常规的“高严格性”条件下保持彼此退火。常规的高严格性条件如Sambrook等.,1989所述。

如果两个分子以充分的稳定性彼此杂交使得它们在至少常规的“低严格性”条件下保持彼此退火，则称它们显示“最低限度的互补性”。常规的低严格性条件如Sambrook等.,1989所述。为了使核酸分子能够用作引物或探针，仅需要序列显示最低限度的互补性，从而能够在所用的特定溶剂和盐浓度下形成稳定的双链结构。

影响杂交严格性的因素是本领域技术人员众所周知的，并且包括但不仅限于，温度、pH、离子强度和有机溶剂(例如甲酰胺和二甲基亚砜)的浓度。本领域技术人员已知，杂交严格性随着温度升高、离子强度降低和溶剂浓度降低而增加。

术语“严格条件”或“严格性条件”是关于核酸探针与靶核酸(即，感兴趣的特殊核酸序列)通过Sambrook等.,1989所讨论的特定杂交程序杂交而功能性定义的。

通常，严格条件是指其中盐浓度小于约1.5M Na⁺离子，通常大约0.01-1.0M Na⁺离子浓度(或其它盐)，pH 7.0-8.3，温度为，对于短探针(例如， 10-15个核苷酸)至少大约30℃，对于长探针(例如，大于50个核苷酸)至少大约60℃。严格条件也可以通过加入去稳定剂如甲酰胺加以实现。示例性的低严格条件包括在含有30-35％甲酰胺、1.0M NaCl、0.1％SDS(十二烷基硫酸钠)的缓冲溶液中在37℃杂交，并在1X-2X SSC(20X SSC＝3.0M NaCl/0.3 M柠檬酸三钠)中在50-55℃清洗。示例性中等严格条件包括在含有40-45％甲酰胺、1.0MNaCl、0.1％SDS的缓冲液中在37℃杂交，并在0.5X-1X SSC 中在50-55℃清洗。示例性高严格条件包括在含有50％甲酰胺、1.0M NaCl、 0.1％SDS的缓冲液中在37℃杂交，并在0.1XSSC中在60-65℃清洗。

特异性通常依赖于杂交后清洗而变化，其中关键因素是离子强度和最终清洗溶液的温度。对于DNA-DNA杂交体，T_m可以根据公式T_m＝81.5℃+16.6 (logM)+0.41(％GC)-0.61(％form.)-500/L来近似，其中M是单价阳离子的摩尔浓度，％GC是DNA中鸟嘌呤和胞嘧啶的百分比，％form.是杂交溶液中甲酰胺的百分比，L是杂交碱基对的长度(Meinkoth andWahl,1984)。T_m是50％的互补靶序列与完美匹配的探针杂交的温度(在限定离子强度和pH下)。每 1％错配T_m降低大约1℃；因此，可以调节T_m、杂交条件、和/或清洗条件以便使具有期望同一性的序列杂交。例如，如果追求具有90％同一性的序列，则T_m可以降低10℃。一般地，严格条件被选择为比特定序列及其互补物在限定离子强度和pH下的热熔点(T_m)低大约5℃。然而，极为的严格条件可以使杂交和/或清洗温度比热熔点(T_m)低6,7,8,9,或10℃；低严格条件可以使杂交和/或清洗温度比热熔点(T_m)低11-20℃。使用该公式、杂交和清洗组合物、和期望的T_m，普通技术人员可以理解，杂交严格性和/或清洗溶液的变化已被内在地描述。如果期望的错配程度导致T_m小于45℃(水性溶液)或 32℃(甲酰胺溶液)，则优选地增加SSC浓度，以便可以使用更高的温度。核酸杂交的详尽指导见Ausubel等.,Short Protocols in Molecular Biology,第 2-40页,第3版.(1997)和Sambrook等.(1989)。

在一个实施方案中，本主题公开涉及***在被靶定的基因组座位内的供体DNA多核苷酸的导入。这里所用的用于构建供体DNA多核苷酸的标准重组DNA和分子克隆技术是本领域众所周知的，并且在例如下列文献中有描述：Sambrook等.,Molecular Cloning:ALaboratory Manual,Second Edition,Cold Spring Harbor Laboratory Press,ColdSpring Harbor,NY(1989)；和Silhavy等.,Experiments with Gene Fusions,Cold SpringHarbor Laboratory Press,Cold Spring Harbor,NY(1984)；和Ausubel等.,CurrentProtocols in Molecular Biology,Greene Publishing Assoc.and Wiley-Interscience出版 (1987)。

在本文公开的方法中，可以采用多种在植物中指导基因表达的启动子。这些启动子可以选自组成型、化学调节型、诱导型、组织特异性，和种子优选的启动子。用于指导核酸表达的启动子取决于具体的应用。例如，通常使用适合于宿主细胞的强组成型启动子来表达和纯化表达蛋白。

优选的植物启动子的非限制性实例包括来自拟南芥泛素-10(ubi-10)的启动子序列(Callis,等.,1990,J.Biol.Chem.,265:12486-12493)；来自根瘤土壤杆菌甘露碱合成酶(Δmas)(Petolino等.,U.S.Patent No.6,730,824)和/或木薯叶脉花叶病毒(CsVMV)(Verdaguer等.,1996,Plant Molecular Biology 31:1129-1139)的启动子序列。其他组成型启动子包括，例如，核心花椰菜花叶病毒35S启动子(Odell等.(1985)Nature 313:810-812)；水稻肌动蛋白启动子(McElroy等.(1990)Plant Cell 2:163-171)；玉米泛素启动子(美国专利号 5,510,474；Christensen等.(1989)Plant Mol.Biol.12:619-632和Christensen等. (1992)Plant Mol.Biol.18:675-689)；pEMU启动子(Last等.(1991)Theor.Appl. Genet.81:581-588)；ALS启动子(美国专利号5,659,026)；玉米组蛋白启动子(Chabouté等.Plant Molecular Biology,8:179-191(1987))；等等。

其它可用的植物启动子包括组织特异性和诱导型启动子。诱导型启动子是能够响应诱导剂直接或间接激活一个或多个DNA序列转录的启动子。在没有诱导剂时，DNA序列或基因将不被转录。典型地，特异性结合诱导型调控元件从而激活转录的蛋白因子以无活性形式存在，其然后被诱导剂直接或间接转化成活性形式。诱导剂可以是化学试剂，例如蛋白、代谢物、生长调节剂、除草剂或酚类化合物，或由热、冷、盐或有毒元素直接施加的，或者通过病原体或致病剂如病毒的作用间接施加的生理胁迫。典型地，特异性结合诱导型调控元件从而激活转录的蛋白因子以无活性形式存在，其然后被诱导剂直接或间接转化成活性形式。诱导剂可以是化学试剂，例如蛋白、代谢物、生长调节剂、除草剂或酚类化合物，或由热、冷、盐或有毒元素直接施加的，或者通过病原体或致病剂如病毒的作用间接施加的生理胁迫。含有诱导型调节元件的植物细胞可以通过向细胞或植物外部施加诱导剂，例如通过喷洒、浇水、加热或类似的方法被暴露于诱导剂。

任何诱导型启动子均可用于本公开的实施方案。见Ward等.,Plant Mol.Biol.22:361-366(1993)。示例性诱导型启动子包括蜕皮激素受体启动子(美国专利No.6,504,082)；来自ACE1***的启动子，其响应铜(Mett等.,Proc. Natl.Acad.Sci.90:4567-4571(1993))；来自玉米的In2-1和In2-2，其响应苯磺酰胺除草剂安全剂(美国专利No.5,364,780；Hershey等.,Mol.Gen.Genetics 227:229-237(1991)和Gatz等.,Mol.Gen.Genetics 243:32-38(1994))；来自 Tn10的Tet抑制子(Gatz等.,Mol.Gen.Genet.227:229-237(1991)；或来自类固醇激素基因的启动子，其转录活性被糖皮质激素诱导(Schena等.,Proc.Natl. Acad.Sci.U.S.A.88:10421(1991)和McNellis等.,(1998)Plant J. 14(2):247-257)；玉米GST启动子，其被用作萌发前除草剂的疏水亲电子化合物激活(参见美国专利5,965,387和国际专利申请公开No.WO 93/001294)；和烟草PR-1a启动子，其被水杨酸激活(参见Ono S,Kusama M,Ogura R, Hiratsuka K.,“Evaluationof the Use of the Tobacco PR-1a Promoter to Monitor Defense Gene Expressionby the Luciferase Bioluminescence Reporter System,” Biosci BiotechnolBiochem.2011Sep 23；75(9):1796-800)。其他受化学调节的感兴趣启动子包括四环素诱导型和四环素阻遏型启动子(参见，例如Gatz等., (1991)Mol.Gen.Genet.227:229-237，和美国专利号5,814,618和5,789,156)。

其它感兴趣的可调节启动子包括冷响应调节元件和热休克调节元件，其转录可分别受到暴露于冷或热的影响(Takahashi等.,Plant Physiol.99:383-390, 1992)；醇脱氢酶基因的启动子(Gerlach等.,PNAS USA 79:2981-2985(1982)； Walker等.,PNAS 84(19):6624-6628(1987))，其被厌氧条件诱导；和来自豌豆 rbcS基因或豌豆psaDb基因的光诱导型启动子(Yamamoto等.,(1997)Plant J. 12(2):255-265)；光诱导型调节元件(Feinbaum等.,Mol.Gen.Genet.226:449, 1991；Lam和Chua,Science 248:471,1990；Matsuoka等.(1993)Proc.Natl. Acad.Sci.USA 90(20):9586-9590；Orozco等.(1993)Plant Mol.Bio.23(6):1129-1138)，植物激素诱导型调节元件(Yamaguchi-Shinozaki等.,PlantMol.Biol.15:905,1990；Kares等.,Plant Mol.Biol.15:225,1990)，和类似物。诱导型调控元件也可以是玉米In2-1或In2-2基因的启动子，其响应苯磺酰胺除草剂安全剂(Hershey等.,Mol.Gen.Gene.227:229-237,1991；Gatz等., Mol.Gen.Genet.243:32-38,1994)；和转座子Tn10的Tet阻遏子(Gatz等.,Mol. Gen.Genet.227:229-237,1991)。胁迫诱导型启动子包括盐/水胁迫诱导型启动子，例如P5CS(Zang等.,(1997)Plant Sciences 129:81-89)；低温诱导型启动子，如cor15a(Hajela等.,(1990)Plant Physiol.93:1246-1252),cor15b(Wilhelm 等.,(1993)Plant Mol Biol 23:1073-1077),wsc1(Ouellet等.,(1998)FEBSLett. 423-324-328),ci7(Kirch等.,(1997)Plant Mol Biol.33:897-909),ci21A(Schneider等.,(1997)Plant Physiol.113:335-45)；干旱诱导型启动子，如Trg-31(Chaudhary等.,(1996)Plant Mol.Biol.30:1247-57),rd29(Kasuga等.,(1999) NatureBiotechnology 18:287-291)；渗透诱导型启动子，如Rab17(Vilardell 等.,(1991)PlantMol.Biol.17:985-93)和osmotin(Raghothama等.,(1993)Plant Mol Biol 23:1117-28)；和热诱导启动子，如热休克蛋白(Barros等.,(1992)Plant Mol.19:665-75；Marrs等.,(1993)Dev.Genet.14:27-41),smHSP(Waters等., (1996)J.Experimental Botany 47:325-338)，和来自欧芹泛素启动子的热休克可诱导元件(WO 03/102198)。其它的胁迫诱导型启动子包括rip2(美国专利 No.5,332,808和美国公开No.2003/0217393)和rd29a(Yamaguchi-Shinozaki 等.,(1993)Mol.Gen.Genetics 236:331-340)。某些启动子受损伤诱导，包括土壤杆菌pMAS启动子(Guevara-Garcia等.,(1993)Plant J.4(3):495-505)和土壤杆菌ORF13启动子(Hansen等.,(1997)Mol.Gen.Genet.254(3):337-343)。

组织特异性启动子能够用于靶定特定植物组织内的强化的转录和/或表达。在提及“优先表达”时，其含义是指在特定植物组织中的表达水平高于在其它植物组织中的表达。这些类型启动子的实例包括种子优选表达，例如由菜豆蛋白启动子(Bustos等.,(1989)The Plant Cell Vol.1,839-853)，和和玉米球蛋白-1基因(Belanger,等.(1991)Genetics129:863-972)所提供的种子优选表达。对于双子叶植物，种子优选的启动子包括，但不仅限于，豆类β-菜豆蛋白、油菜籽蛋白、β-伴大豆球蛋白、大豆凝集素、十字花科蛋白等。对于单子叶植物，种子优选的启动子包括，但不仅限于，玉米15kDa玉米蛋白， 22kDa玉米蛋白，27kDa玉米蛋白，γ-玉米蛋白，waxy蛋白，shrunken 1， shrunken 2，球蛋白1等。种子优选的启动子也包括那些指导基因主要在种子中的特定组织中表达的启动子，例如γ-玉米醇溶蛋白的胚乳优选启动子，来自烟草的隐蔽启动子(cryptic promoter)(Fobert等.,(1994)T-DNA tagging of a seed coat-specific cryptic promoter in tobacco.PlantJ.4:567-577)，来自玉米的P-基因启动子(Chopra等.,(1996)Alleles of the maize Pgene with distinct tissue specificities encode Myb-homologous proteins withC-terminal replacements.Plant Cell 7:1149-1158,在Plant Cell.1997,1:109中勘误)，来自玉米的球蛋白-1启动子(Belenger and Kriz(1991)Molecular basis forAllelic Polymorphism of the maize Globulin-1gene.Genetics 129:863-972)，和指导在种皮或玉米粒外壳上表达的启动子，例如果皮特异性谷氨酰胺合成酶启动子 (Muhitch等.,(2002)Isolation of a Promoter Sequence From the Glutamine Synthetase_1- ₂Gene Capable of Conferring Tissue-Specific Gene Expression in TransgenicMaize.Plant Science 163:865-872)。

除了启动子之外，表达载体通常含有转录单元或表达盒，其含有在宿主细胞内，无论是原核生物还是真核生物，表达核酸所需的全部额外元件。因此，典型的表达盒包含与例如编码蛋白质的核酸序列可操作连接的启动子，和例如转录本的高效多聚腺苷酸化、转录终止、核糖体结合位点、或翻译终止所需的信号。盒的额外元件可以包括，例如增强子和异源剪切信号。

可以包括载体的其它组分，这也取决于基因的使用意图。实例包括可选择标志物、靶定序列或调节序列、转运肽序列，例如优化的转运肽序列(见美国专利No.5,510,471)，稳定化序列如RB7MAR(见Thompson and Myatt, (1997)Plant Mol.Biol.,34:687-692和国际专利公开No.WO9727207)，或前导序列、内含子等。关于植物表达载体和受体基因的实例的一般描述可以参见Gruber,等.,“Vectors for Plant Transformation”，收录于Methods in Plant Molecular Biology and Biotechnology,Glick等编辑；CRC Press pp.89-119(1993)。合适表达载体的选择取决于宿主和将表达载体引入宿主的方法。表达盒在感兴趣的异源核苷酸序列的3’端还包括在植物中具有功能的转录和翻译终止区。终止区可以是本公开实施方案的启动子核苷酸序列本来具有的，可以是感兴趣的DNA序列本来具有的，或者可以来自另一种来源。方便的终止区可以从根癌土壤杆菌的Ti质粒获得，例如章鱼碱合成酶和胭脂碱合成酶(nos)终止区(Depicker等.,Mol.and Appl.Genet.1:561-573(1982)和Shaw等.(1984)Nucleic Acids Research第12卷,第20期，第7831-7846页 (nos))；另见Guerineau等.Mol.Gen.Genet.262:141-144(1991)；Proudfoot,Cell 64:671-674(1991)；Sanfacon等.Genes Dev.5:141-149(1991)；Mogen等.Plant Cell 2:1261-1272(1990)；Munroe等.Gene 91:151-158(1990)；Ballas等., Nucleic Acids Res.17:7891-7903(1989)；Joshi等.Nucleic Acid Res. 15:9627-9639(1987)。

表达盒可以额外地含有5’前导序列。这些前导序列可以起增强翻译的作用。翻译前导子是本领域已知的，并且作为举例包括，小核糖核酸病毒前导序列，EMCV前导序列(脑心肌炎5'非编码区)，Elroy-Stein等.,Proc.Nat.Acad. Sci.USA 86:6126-6130(1989)；马铃薯Y病毒前导序列，例如，TEV前导序列(烟草蚀纹病毒)Carrington and Freed Journalof Virology,64:1590-1597 (1990)，MDMV前导序列(玉米矮花叶病毒)，Allison等.,Virology 154:9-20 (1986)；人免疫球蛋白重链结合蛋白(BiP)，Macejak等.,Nature 353:90-94 (1991)；来自苜蓿花叶病毒外壳蛋白mRNA(AMV RNA 4)的非翻译前导序列，Jobling等.,Nature 325:622-625(1987)；烟草花叶病毒前导序列(TMV)， Gallie等.,(1989)Molecular Biology of RNA,第237-256页；和玉米褪绿斑驳病毒前导序列(MCMV)Lommel等.,Virology 81:382-385(1991)。另见 Della-Cioppa等.,Plant Physiology 84:965-968(1987)。

构建体还可以含有增强翻译和/或mRNA稳定性的序列，例如内含子。这样的内含子的一个实例是拟南芥组蛋白H3.III变异体的基因II的第一内含子。Chaubet等.,Journalof Molecular Biology,225:569-574(1992)。

在那些期望将异源核苷酸序列的表达产物引导到特定的细胞器中，特别是质体、造粉质体或内质网，或分泌到细胞表面或细胞外的情况下，表达盒可以进一步包括转运肽的编码序列。这些转运肽是本领域众所周知的，并且包括但不仅限于，酰基载体蛋白的转运肽、RUBISCO的小亚基、植物EPSP 合成酶和向日葵(美国专利No.5,510,417)、玉蜀黍Brittle-1叶绿体转运肽 (Nelson等.,Plant Physiol 117(4):1235-1252(1998)；Sullivan等.,Plant Cell 3(12):1337-48；Sullivan等.,Planta(1995)196(3):477-84；Sullivan等.,J.Biol. Chem.(1992)267(26):18999-9004)等。此外，嵌合叶绿体转运肽是本领域已知的，例如优化的转运肽(美国专利No.5,510,471)。其他叶绿体转运肽先前在美国专利No.5,717,084和美国专利No.5,728,925中已有描述。本领域的技术人员将容易意识到，有多种选项可供用于将产物表达到特定的细胞器中。例如，大麦α淀粉酶序列经常被用于指导表达到内质网中(Rogers,J.Biol. Chem.260:3731-3738(1985))。

本领域的技术人员将意识到，使用重组DNA技术可以通过操纵例如核酸分子在宿主细胞内的数目、核酸分子的转录效率、所得核酸分子的翻译效率、和翻译后修饰的效率，提高对被转染核酸分子的表达控制。此外，启动子序列可以被遗传工程化，从而与天然启动子相比提高表达水平。用于控制核酸分子的表达的重组技术包括，但不仅限于，将核酸分子稳定整合到一个或多个宿主细胞染色体中，向质粒中添加载体稳定性序列，取代或修饰转录控制信号(例如，启动子、操纵子、增强子)，取代或修饰翻译控制信号(例如，核糖体结合位点、Shine-Dalgarno或Kozak序列)，修饰核酸分子以对应于宿主细胞的密码子使用，和删除使转录本不稳定的序列。

在转化载体中可以包含用于选择被转化细胞或组织或植物部分或植物的报告子或标记基因。可选择标志物的实例包括赋予对抗代谢物，例如除草剂或抗生素，的抗性的标记，例如二氢叶酸还原酶，其赋予对甲氨蝶呤的抗性(Reiss,Plant Physiol.(LifeSci.Adv.)13:143-149,1994；另见Herrera Estrella 等.,Nature 303:209-213,(1983)；Meijer等.,Plant Mol.Biol.16:807-820, (1991))；新霉素磷酸转移酶，其赋予对氨基糖苷类新霉素、卡那霉素和巴龙霉素的抗性(Herrera-Estrella,EMBO J.2:987-995,1983和Fraley等.,Proc.Natl. Acad.Sci USA 80:4803(1983))，和潮霉素磷酸转移酶，其赋予对潮霉素的抗性(Marsh,Gene 32:481-485,(1984)；另见Waldron等.,Plant Mol.Biol. 5:103-108,(1985)；Zhijian等.,Plant Science 108:219-227,(1995))；trpB，其允许细胞利用吲哚代替色氨酸；hisD，其允许细胞利用组氨醇代替组氨酸 (Hartman,Proc.Natl.Acad.Sci.,USA 85:8047,(1988))；甘露糖-6-磷酸异构酶，其允许细胞利用甘露糖(国际专利申请No.WO 94/20627)；鸟氨酸脱羧酶，其赋予对鸟氨酸脱羧酶抑制剂，2-(二氟甲基)-DL-鸟氨酸的抗性(DFMO； McConlogue,1987,收录于:Current Communications in Molecular Biology, Cold Spring Harbor Laboratory编辑)；和来自土曲霉的脱氨酶，其赋予对杀稻瘟菌素S的抗性(Tamura,Biosci.Biotechnol.Biochem.59:2336-2338,(1995))。

额外的可选择标志物包括，例如，突变体乙酰乳酸合成酶，其赋予咪唑啉酮或磺酰脲抗性(Lee等.,EMBO J.7:1241-1248,(1988))，突变体psbA，其赋予阿特拉津抗性(Smeda等.,Plant Physiol.103:911-917,(1993))，或突变体原卟啉原氧化酶(参见美国专利No.5,767,373)，或其它赋予对除草剂如草铵膦的抗性的标记。合适的可选择标志物基因的实例包括，但不仅限于，编码抗氯霉素(Herrera Estrella等.,EMBO J.2:987-992,(1983))；链霉素(Jones等., Mol.Gen.Genet.210:86-91,(1987))；壮观霉素(Bretagne-Sagnard等., Transgenic Res.5:131-137,(1996))；博莱霉素(Hille等.,PlantMol.Biol. 7:171-176,(1990))；磺酰胺(Guerineau等.,Plant Mol.Biol.15:127-136,(1990))；溴苯腈(Stalker等.,Science 242:419-423,(1988))；草甘膦(Shaw等.,Science233:478-481,(1986))；膦丝菌素(DeBlock等.,EMBO J.6:2513-2518,(1987)) 等的抗性的基因。

使用选择性基因的一个选项是草铵膦抗性编码DNA，并且在一个实施方案中，可以是膦丝菌素乙酰转移酶(pat)，在木薯叶脉花叶病毒启动子控制下的玉米优化的pat基因或bar基因。这些基因赋予对双丙氨磷的抗性。参见(见Wohlleben等.,(1988)Gene 70:25-37)；Gordon-Kamm等.,Plant Cell 2:603；1990；Uchimiya等.,BioTechnology 11:835,1993；White等.,Nucl.Acids Res.18:1062,1990；Spencer等.,Theor.Appl.Genet.79:625-631,1990；和 Anzai等.,Mol.Gen.Gen.219:492,1989)。pat基因的一个版本是玉米优化的pat基因，在美国专利No.6,096,947有描述。

此外，可以采用方便帮助鉴定含有编码该标志物的多核苷酸的植物细胞的标志物。在序列的存在会产生可测量的产物，并且生产该产物时不会破坏植物细胞的情况下，可打分的或可筛选的标志物是有用的。实例包括β-葡糖醛酸酶或uidA基因(GUS)，其编码各种生色底物已知的酶(例如，美国专利 No.5,268,463和5,599,670)；氯霉素乙酰转移酶(Jefferson等.The EMBO Journal第6卷第13期第3901-3907页)；和碱性磷酸酶。在一个优选实施方案中，所用的标志物是β-胡萝卜素或原维生素A(Ye等.,Science 287:303-305-(2000))。该基因已被用于提高水稻的营养，但在这种情况下它被用作可筛选标志物，通过该基因所提供的金黄色来检测与感兴趣基因连接的基因的存在。与使用该基因对植物产生营养贡献的情况不同，较小量的蛋白足以实现该目的。其它可筛选标志物包括一般的花青素/类黄酮的基因(见Taylor and Briggs,The Plant Cell(1990)2:115-127中所讨论的)，包括例如，R-座位基因，其编码的产物可以调节植物组织中花青素色素(红色)的产生(Dellaporta等, 收录于Chromosome Structure and Function,Kluwer AcademicPublishers, Appels and Gustafson eds.,pp.263-282(1988))；控制类黄酮色素生物合成的基因，如玉米C1基因(Kao等,Plant Cell(1996)8:1171-1179；Scheffler等,Mol.Gen.Genet.(1994)242:40-48)和玉米C2基因(Wienand等,Mol.Gen.Genet. (1986)203:202-207)；B基因(Chandler等,Plant Cell(1989)1:1175-1183)，p1 基因(Grotewold等,Proc.Natl.Acad.Sci USA(1991)88:4587-4591； Grotewold等,Cell(1994)76:543-553；Sidorenko等,Plant Mol.Biol. (1999)39:11-19)；青铜色(bronze)座位基因(Ralston等,Genetics(1988) 119:185-197；Nash等,Plant Cell(1990)2(11):1039-1049)，等等。

合适标记物的进一步的实例包括青色荧光蛋白(CYP)基因(Bolte等 (2004)J.Cell Science 117:943-54和Kato等(2002)Plant Physiol 129: 913-42)，黄色荧光蛋白基因(Evrogen公司的PHIYFP^TM；见Bolte等(2004)J. Cell Science 117:943-54)；lux基因，其编码一种荧光素酶，它的存在可以通过使用，例如，X-射线胶片、闪烁计数、荧光光度法、低光度摄影机、光子计数摄像机或多孔发光法等进行检测(Teeri等(1989)EMBO J.8:343)；绿色荧光蛋白(GFP)基因(Sheen等,Plant J.(1995)8(5):777-84)；和DsRed2，用该标记基因转化的植物细胞呈红色，因此可以通过目测筛选(Dietrich等(2002)Biotechniques 2(2):286-293)。其它的实例包括β-内酰胺酶基因(Sutcliffe,Proc. Nat'l.Acad.Sci.U.S.A.(1978)75:3737)，其编码各种发色底物已知的酶(例如 PADAC，一种发色头孢菌素)；xylE基因(Zukowsky等,Proc.Nat'l.Acad.Sci. U.S.A.(1983)80:1101)，其编码能够转化发色儿茶酚的邻苯二酚双加氧酶，α-淀粉酶基因(Ikuta等,Biotech.(1990)8:241)；和酪氨酸酶基因(Katz等,J. Gen.Microbiol.(1983)129:2703)，其编码能够将酪氨酸氧化成DOPA和多巴醌的酶，其进一步缩合形成容易检测的混合物黑色素。显然，许多这样的标记物是本领域技术人员可得并且已知的。

在某些实施方案中，核苷酸序列可以任选地和另一种感兴趣的核苷酸序列组合。术语“感兴趣的核苷酸序列”是指如下的核酸分子(其也可以被称作多核苷酸)，其可以是被转录的RNA分子以及DNA分子，编码期望的多肽或蛋白质，但也可以指不构成完整基因的核酸分子，并且其不必编码多肽或蛋白质(例如，启动子)。例如，在某些实施方案中，核酸分子可以和另一个组合或“堆叠”，其中另一种核酸可以提供针对草甘膦或其它除草剂的额外耐受性或抗性，和/或提供对选定的昆虫或疾病的抗性，和/或营养强化，和/或改良农艺特征，和/或提供额外的可用于饲料、食物、工业、药物或其它使用的蛋白或其它产物。植物基因组中两个或多个兴趣核酸序列的“堆叠”可以通过，例如，两个或多个事件的常规植物育种、用含有核酸的构建体转化植物、转基因植物的再转化、或通过同源重组的靶向整合添加新的性状，来实现。

这些感兴趣的核苷酸序列包括，但不仅限于，下面提供的那些实例：

1.赋予对害虫或疾病抗性的基因或编码序列(例如iRNA)

(A)植物抗病基因。植物防御经常通过植物中抗病基因(R)的产物与病原体中相应的无毒性(Avr)基因产物的特异性相互作用被激活。可以用克隆的抗性基因转化植物品种，从而构建对特定病原体株具有抗性的植物。这些基因的实例包括：抗叶霉病菌的番茄Cf-9基因(Jones等,1994Science 266:789)，编码抗丁香假单胞杆菌番茄致病变种的蛋白激酶的番茄Pto基因(Martin等, 1993Science 262:1432)，和抗丁香假单胞菌的拟南芥RSSP2基因(Mindrinos 等,1994Cell 78:1089)。

(B)苏云金芽孢杆菌蛋白、其衍生物或以其为模本的合成多肽，例如Bt δ-内毒素的多核苷酸序列(Geiser等,1986Gene 48:109)和植物杀虫(VIP)基因 (参见例如，truch等(1996)Proc.Natl.Acad.Sci.93:5389-94)。此外，编码δ-内毒素基因的DNA分子可以从美国典型培养物保藏中心(Rockville,Md.)购得， ATCC登录号为40098，67136，31995和31998。

(C)植物凝集素，例如，多种君子兰甘露糖结合性植物凝集素基因的核苷酸序列(Van Damme等,1994Plant Molec.Biol.24:825)。

(D)维生素结合蛋白，例如亲和素和亲和素类似物，其可用作针对昆虫害虫的杀幼虫剂。见美国专利No.5,659,026。

(E)酶抑制剂，例如蛋白酶抑制剂或淀粉酶抑制剂。这些基因的实例包括水稻半胱氨酸蛋白酶抑制剂(Abe等,1987J.Biol.Chem.262:16793)，烟草蛋白酶抑制剂I(Huub等,1993Plant Molec.Biol.21:985)，和α-淀粉酶抑制剂 (Sumitani等,1993Biosci.Biotech.Biochem.57:1243)。

(F)昆虫特异性激素或信息素，例如蜕皮激素和保幼激素或其变异体、基于它们的模拟物，或其拮抗剂或激动剂，例如杆状病毒表达的克隆保幼激素酯酶，保幼激素的灭活子(Hammock等,1990Nature 344:458)。

(G)昆虫特异性肽或神经肽，其在表达时会扰乱受影响害虫的生理机能(J.Biol.Chem.269:9)。这些基因的实例包括昆虫利尿激素受体(Regan,1994)，在太平洋折翅蠊(Diploptera punctata)中鉴定的allostatin(Pratt,1989)，和昆虫特异性麻痹神经毒素(美国专利No.5,266,361)。

(H)在自然界中由蛇、马蜂等产生的昆虫特异性毒液，例如蝎子昆虫毒性肽(Pang,1992Gene 116:165)。

(I)负责超富集单萜、倍半萜、甾体、异羟肟酸、苯丙烷衍生物或其它具有杀虫活性的非蛋白质分子的酶。

(J)参与生物活性分子修饰，包括翻译后修饰，的酶；例如糖酵解酶，蛋白水解酶，脂肪分解酶，核酸酶，环化酶，转氨酶，酯酶，水解酶，磷酸酶，激酶，磷酸化酶，聚合酶，弹性蛋白酶，几丁质酶和葡聚糖酶，无论是天然的还是合成。这些基因的实例包括中，马蹄莲基因(PCT公开的申请WO 93/02197)，几丁质酶编码序列(其可以从例如ATCC以登录号3999637和 67152获得)，烟草钩虫几丁质酶(Kramer等,1993Insect Molec.Biol.23:691)，和欧芹ubi4-2多聚泛素基因(Kawalleck等,1993Plant Molec.Biol.21:673)。

(K)刺激信号转导的分子。这些分子的实例包括绿豆钙调蛋白cDNA克隆的核苷酸序列(Botella等,1994Plant Molec.Biol.24:757)，和玉米钙调蛋白 cDNA克隆的核苷酸序列(Griess等,1994Plant Physiol.104:1467)。

(L)疏水矩肽(hydrophobic moment peptide)。见例如美国专利Nos. 5,659,026和5,607,914，后者教导了可赋予疾病抗性的合成抗微生物肽。

(M)膜透性酶，通道形成剂或通道阻断剂，例如杀菌肽-β裂解肽类似物 (Jaynes等,1993Plant Sci.89:43)，其赋予转基因烟草植物抵抗青枯病假单胞菌(Peudomonassolanacearum)。

(N)病毒侵入性蛋白或由其衍生的复杂毒素。例如，病毒衣壳蛋白在转化植物细胞的积累可赋予针对受该衣壳蛋白来源病毒以及相关病毒影响的病毒感染和/或疾病发展的抗性。已经给转化植物赋予了衣壳蛋白介导的针对苜蓿花叶病毒，黄瓜花叶病毒，烟草条纹病毒，马铃薯X病毒，马铃薯Y 病毒，烟草蚀纹病毒，烟草脆裂病毒和烟草花叶病毒转基因植物的抗性。参见，例如，Beachy等(1990)Ann.Rev.Phytopathol.28:451。

(O)昆虫特异性抗体或由其衍生的免疫毒素。因此，靶向昆虫肠道关键代谢功能的抗体可以使受影响的酶失活，杀死昆虫。例如，Taylor等(1994)，摘要#497，第七届国际分子植物-微生物相互作用研讨会(Seventh Int'l. Symposium on Molecular Plant-MicrobeInteractions)，显示了通过产生单链抗体片段导致转基因烟草中的酶失活。

(P)病毒特异性抗体。见例如Tavladoraki等(1993)Nature 266:469，其显示了表达重组抗体基因的转基因植物被保护免于病毒攻击。

(Q)由病原体或寄生虫自然产生的发育-阻滞(developmental-arrestive)蛋白。因此，真菌内切α-1,4-D多聚半乳糖醛酸酶通过溶解植物细胞壁的均聚 -α-1,4-D-半乳糖醛酸促进真菌定殖和植物营养素释放(Lamb等,1992) Bio/Technology 10:1436。Toubart等(1992Plant J.2:367)介绍了编码豆类植物内切多聚半乳糖醛酸酶抑制蛋白的基因的克隆和表征。

(R)由植物自然产生的发育-阻滞(developmental-arrestive)蛋白，例如大麦核糖体失活基因，其提供了针对真菌疾病的更高的抗性(Longemann等, 1992).Bio/Technology 10:3305。

(S)RNA干扰，其中RNA分子用于抑制靶基因的表达。一个实施例中的RNA分子是部分或完全双链的，其触发沉默响应，导致dsRNA被切割成小的干扰RNA，其随后被整合到靶复合体中，破坏同源的mRNA。见例如 Fire等人，美国专利6,506,559；Graham等人，6,573,099。

2.赋予除草剂抗性的基因

(A)编码针对可抑制生长点或分生组织的除草剂(例如，咪唑啉酮类(imidazalinone)、磺酰苯胺类(sulfonanilide)或磺酰脲类除草剂)的抗性或耐受性的基因。这类基因的实例编码一种突变的ALS酶(Lee等,1988EMBOJ. 7:1241)，其也被称作AHAS酶(Miki等,1990Theor.Appl.Genet.80:449)。

(B)一种或多种额外的编码针对草甘膦抗性或耐受性的基因，其中草甘膦抗性或耐受性是突变体EPSP合酶和aroA基因赋予的，或者是通过一些基因如GAT(草甘膦乙酰转移酶)或GOX(草甘膦氧化酶)和其它膦化合物，如草铵膦(pat和bar基因；DSM-2)，和芳氧基苯氧基羧酸和环己二酮(ACC酶抑制剂编码基因)所致的代谢失活而实现的。见例如美国专利No.4,940,835，其公开了可赋予草甘膦抗性的EPSP形式的核苷酸序列。编码突变体aroA 基因的DNA分子能够以ATCC登录号39256获得，该突变体基因的核苷酸序列在美国专利No.4,769,061中公开。欧洲专利申请No.0 333 033和美国专利No.4,975,374公开了可赋予除草剂如L-膦丝菌素抗性的谷氨酰胺合成酶基因的核苷酸序列。欧洲专利申请No.0 242 246提供了膦丝菌素乙酰转移酶基因的核苷酸序列。De Greef等(1989)Bio/Technology 7:61中描述了表达编码膦丝菌素乙酰转移酶活性的嵌合bar基因的转基因植物的产生。示例性的赋予针对芳氧基苯氧基羧酸和环己二酮(如稀禾定和甲禾灵(haloxyfop))的抗性的基因是Accl-S1,Accl-S2和Accl-S3基因，如Marshall等(1992)Theor. Appl.Genet.83:435所述。

(C)编码针对可抑制光合作用的除草剂(例如三嗪(psbA和gs+基因)和苄腈(腈水解酶基因))的抗性基因。Przibilla等(1991)Plant Cell 3:169描述了使用编码突变体psbA基因的质粒转化衣藻。腈水解酶基因的核苷酸序列在美国专利No.4,810,648中公开，含有这些基因的DNA分子可以通过ATCC 登录号53435,67441和67442获得。Hayes等(1992)Biochem.J.285:173中描述了编码谷胱甘肽S-转移酶的DNA的克隆和表达。

(D)编码针对可结合羟苯丙酮酸二加氧酶(HPPD)的除草剂的抗性基因， HPPD是催化对羟苯丙酮酸(HPP)反应形成尿黑酸的酶。这包括除草剂，例如异恶唑(EP418175,EP470856,EP487352,EP527036,EP560482,EP682659, 美国专利No.5,424,276)，特别是异恶唑草酮，其是玉米的选择性除草剂，二酮腈(diketonitrile)(EP496630,EP496631)，特别是2-氰基-3-环丙基 -1-(2-SO2CH3-4-CF3苯基)丙烷-1,3-二酮和2-氰基-3-环丙基-1-(2-SO2CH3-4-2,3Cl2苯基)丙烷-1,3-二酮，三酮类(EP625505，EP625508，美国专利No.5,506,195)，特别是磺草酮,和pyrazolinate。在植物中产生过量HPPD 的基因能够提供针对这些除草剂的耐受性或抗性，包括例如美国专利Nos. 6,268,549和6,245,968和美国专利申请公开No.20030066102中描述的基因。

(E)编码针对苯氧基生长素除草剂，如2,4-二氯苯氧乙酸(2,4-D)，的抗性或耐受性的基因，其也可以赋予针对芳氧苯氧基丙酸酯类(AOPP)除草剂的抗性或耐受性。这些基因的实例包括α-酮戊二酸依赖的双加氧酶(aad-1)基因，如美国专利No.7,838,733所述。

(F)编码针对苯氧基生长素除草剂，如2,4-二氯苯氧乙酸(2,4-D)，的抗性或耐受性的基因，其也可以赋予针对吡啶氧基生长素除草剂，如氟草烟或绿草定的抗性或耐受性。这些基因的实例包括α-酮戊二酸依赖的双加氧酶 (aad-12)基因，如WO 2007/053482 A2所述。

(G)编码针对麦草畏的抗性或耐受性的基因(见例如美国专利公开No.20030135879)。

(H)编码针对可抑制原卟啉原氧化酶(PPO)的除草剂的抗性或耐受性的基因(见美国专利No.5,767,373)。

(I)提供针对可结合光***II反应中心(PS II)核心蛋白的三嗪除草剂(例如莠去津)和尿素衍生物(如敌草隆)除草剂的抗性或耐受性的基因。见 Brussian等,(1989)EMBOJ.1989,8(4):1237-1245。

3.可赋予或贡献增值性状(Value-Added Trait)的基因

(A)通过例如用反义基因或硬脂酰-ACP去饱和酶转化玉米或芥属植物修饰脂肪酸代谢，从而增加植物的硬脂酸含量(Knultzon等,1992)Proc.Nat. Acad.Sci.USA 89:2624。

(B)降低植酸含量

(1)引入植酸酶编码基因，如黑曲霉菌植酸酶基因(Van Hartingsveldt 等,1993Gene 127:87)，提高植酸降解，向被转化植物添加更多游离磷酸盐。

(2)可引入降低植酸含量的基因。在玉米中，这可以通过例如，进行克隆，然后再导入负责以低植酸水平为特征的玉米突变体的单等位基因的相关DNA而实现(Raboy等,1990Maydica 35:383)。

(C)通过，例如，用编码可改变淀粉分支模式的酶的基因转化植物影响修饰碳水化合物组成。这些酶的实例包括，链球菌粘液果糖基转移酶基因 (Shiroza等,1988)J.Bacteriol.170:810，枯草芽孢杆菌果聚糖蔗糖酶基因 (Steinmetz等,1985Mol.Gen.Genel.200:220)，地衣芽孢杆菌α-淀粉酶(Pen 等,1992Bio/Technology 10:292)，番茄转化酶基因(Elliot等,1993),大麦淀粉酶基因(Sogaard等,1993J.Biol.Chem.268:22480)，和玉米胚乳淀粉分支酶 II(Fisher等,1993PlantPhysiol.102:10450)。

本文描述了用于鉴定在被靶定的基因组座位内***的供体DNA多核苷酸之存在的方法。作为进一步的实施方案，可以使用位点特异性核酸酶剪切未经修饰的内源植物基因组座位，先前被靶定的植物基因组座位，或先前被***的外源DNA。对内源基因组座位的靶定是本公开的一个实施方案。

在实施方案中，本文所描述的方法和组合物使用这样的位点特异性核酸酶，其包括工程化的(非自然存在的)大范围核酸酶(也称作归巢核酸内切酶)。归巢核酸内切酶或大范围核酸酶的识别序列，例如I-SceI,I-CeuI,PI-PspI, PI-Sce,I-SceIV,I-CsmI,I-PanI,I-SceII,I-PpoI,I-SceIII,I-CreI,I-TevI,I-TevII和 I-TevIII，是已知的。另见美国专利No.5,420,032；美国转录No.6,833,252； Belfort等.(1997)Nucleic Acids Res.25:3379–303388；Dujon等.(1989)Gene 82:115–118；Perler等.(1994)Nucleic AcidsRes.22,11127；Jasin(1996)Trends Genet.12:224–228；Gimble等.(1996)J.Mol.Biol.263:163–180；Argast等. (1998)J.Mol.Biol.280:345–353，和新英格兰生物实验室公司(New England Biolabs)产品目录。此外，可以工程化归巢核酸内切酶和大范围核酸酶的DNA 结合特异性以使之结合非天然靶位点。参见，例如，Chevalier等.(2002)Molec. Cell 10:895-905；Epinat等.(2003)Nucleic Acids Res.5 31:2952-2962；Ashworth 等.(2006)Nature 441:656-659；Paques等.(2007)Current Gene Therapy 7:49-66；美国专利公开No.20070117128。归巢核酸内切酶和大范围核酸酶的DNA结合结构域可以在核酸酶中与核酸酶作为一个整体被改变(即，使得核酸酶包含天然(cognate)剪切结构域)，或者可以和异源剪切结构域融合。

在其它实施方案中，在本文所述方法和组合物中使用的一种或多种核酸酶的DNA结合结构域包括天然存在的或被工程化的(非天然存在的)TAL效应器DNA结合结构域。参见，例如，美国专利公开No.20110301073，本申请通过提述并入其全部内容。已知黄单胞菌属的植物病原菌会在重要的作物中导致多种疾病。黄单胞菌的致病性依赖于一个保守的III型分泌(T3S)***，其将多种迥异的效应蛋白注入到植物细胞中。在这些注入的蛋白中包括转录激活子样(TALEN)效应器，它们模拟植物转录激活子并操纵植物转录(参见 Kay等(2007)Science 318:648-651)。这些蛋白质包含DNA结合结构域和转录激活结构域。其中了解得最清楚的TAL效应器是来自番茄疮痂病辣椒斑点病菌(Xanthomonas campestgrispv.Vesicatoria)的AvrBs3(见Bonas等(1989) Mol Gen Genet 218:127-136和WO2010079430)。TAL效应器含有一个具有串联重复的中心化结构域(centralizeddomain)，每个重复含有大约34个氨基酸，这些氨基酸对于这些蛋白质的DNA结合特异性是关键的。此外，它们含有核定位序列和酸性转录激活结构域(综述见Schornack S,等(2006)J Plant Physiol 163(3):256-272)。此外，在植物病原菌青枯病罗尔菌(Ralstoniasolanacearum)中，发现有两个基因，命名为brg11和hpx17，与青枯病罗尔菌生物变种菌株GMI1000和生物变种4菌株RS1000中的黄单胞菌AvrBs3 家族是同源的(见Heuer等(2007)Appl and Enviro Micro 73(13):4379-4384)。这些基因的核苷酸序列彼此98.9％相同，但差异在于hpx17重复结构域中存在一个1,575bp的缺失。然而，这两个基因产物与黄单胞菌的AvrBs3家族的蛋白的序列同一性均小于40％。参见例如，美国专利公开No.20110301073，本申请通过提述并入其全部内容。

这些TAL效应器的特异性取决于在所述串联重复中发现的序列。所述重复序列包含大约102bp，并且这些重复通常彼此之间91-100％同源(Bonas 等,同上)。这些重复序列的多态性通常位于位置12和13，并且在位置12 和13的高变性双残基的身份与TAL效应器靶序列中连续核苷酸的身份之间似乎有一对一的对应性(见Moscou and Bogdanove,(2009)Science 326:1501 and Boch等(2009)Science 326:1509-1512)。根据实验，这些TAL-效应器被 DNA识别的天然密码已被确定：位置12和13的HD序列导致与胞嘧啶(C) 结合，NG与T结合，NI与A,C,G或T结合，NN与A或G结合，ING与 T结合。人们已经将这些DNA结合重复序列组装成具有新组合和新数目的重复序列的蛋白质，从而制造出能够与新序列相互作用并在植物细胞中表达非内源报告基因的人工转录因子(Boch等,同上)。工程化的TAL蛋白已经与FokI剪切半结构域连接，从而产生在酵母报告子测定(基于质粒的靶标)中显示活性的TAL效应器结构域核酸酶融合物(TALEN)。

CRISPR(成簇的规律间隔的短回文重复序列(clustered regularly interspacedshort palindromic repeats)/Cas(CRISPR相关基因)核酸酶***是最近基于基因组改造用的细菌***构建的核酸酶***。它是基于许多细菌和古细菌的获得性免疫应答的一部分。当病毒或质粒侵入细菌时，入侵者的DNA 片段通过“免疫”应答而被转变成CRISPR RNA(crRNA)。然后，这种crRNA 通过部分互补的区域与另一类称作tracrRNA的RNA结合，从而将Cas9核酸酶引导到靶DNA中一个与crRNA同源的区域，称作“原间隔物” (“protospacer”)。Cas9剪切该DNA从而在双链断裂(DSB)处产生平末端，其剪切位点由crRNA转录本内所含的一个20个核苷酸长的引导序列所指定。 Cas9的位点特异性DNA识别和剪切同时需要crRNA和tracrRNA二者。人们现在已经对这个***进行了工程改造，使crRNA和tracrRNA合并到一个分子中(“单引导RNA”)，并且单引导RNA的crRNA等价部分可以被工程化，使其将Cas9核酸酶引导到靶向任何期望的序列(见Jinek等(2012)Science 337,p.816-821,Jinek等,(2013),eLife 2:e00471,和David Segal,(2013)eLife 2:e00563)。因此，CRISPR/Cas***可以被工程化，在基因组的期望靶点处产生双链断裂(DSB)，并且DSB的修复受到所用修复抑制子的影响，导致错误倾向修复(error-prone repair)增加。

在某些实施方案中，Cas蛋白可以是自然存在的Cas蛋白的“功能性衍生物”。天然序列多肽的“功能性衍生物”是与天然序列多肽具有共同的定性生物学性质的化合物。“功能性衍生物”包括，但不仅限于，天然序列的片段和天然序列多肽及其片段的衍生物，只要它们与相应的天然序列多肽具有共同的生物活性。本文预想的生物活性是功能衍生物将DNA底物水解成片段的能力。术语“衍生物”包括多肽的氨基酸序列变异体、共价修饰、及其融合物。 Cas多肽或其片段的合适衍生物包括但不仅限于：突变体、融合物、Cas多肽或其片段的共价修饰。Cas蛋白，其包括Cas蛋白质或其片段，以及Cas 蛋白或其片段的衍生物，可以从细胞获得，或者化学合成，或者通过这两种方法的组合获得。所述细胞可以是自然产生Cas蛋白的细胞，或者自然产生Cas蛋白并且被基因工程化从而以更高表达水平产生内源Cas蛋白或者从外源引入的核酸产生Cas蛋白的细胞，其中该核酸编码与内源Cas相同或不同的Cas。在一些情况下，细胞自然不产生Cas蛋白，而被基因工程化以产生 Cas蛋白。通过共表达Cas核酸酶和引导RNA将Cas蛋白被部署在哺乳动物细胞内(并推定其部署在植物细胞内)。两种形式的引导RNA可用于促进 Cas介导的基因组剪切，如Le Cong,F.,等.,(2013)Science 339(6121):819-823 所公开的。

在某些实施方案中，一种或多种用于体内剪切和/或靶向剪切细胞基因组的核酸酶的DNA结合结构域包括锌指蛋白。在一些实施方案中，锌指蛋白是非天然存在的，因为它被工程化成结合选定的靶标位点。见，例如，Beerli 等.(2002)Nature Biotechnol.20:135-141；Pab等.(2001)Ann.Rev.Biochem. 70:313-340；Isalan等.(2001)NatureBiotechnol.19:656-660；Segal等.(2001) Curr.Opin.Biotechnol.12:632-637；Choo等.(2000)Curr.Opin.Struct.Biol. 10:411-416；美国专利No.6,453,242；6,534,261；6,599,692；6,503,717； 6689,558；7,030,215；6,794,136；7,067,317；7,262,054；7,070,934；7,361,635； 7,253,273；和美国专利公开No.2005/0064474；2007/0218528；2005/0267061，本文通过提述并入它们的全部内容。

工程化的锌指结合结构域与自然存在的锌指蛋白相比可以具有新的结合特异性。工程化方法包括，但不仅限于，合理化设计和各种类型的选择。合理化设计包括，例如，使用包含三联体(或四联体)核苷酸序列和单独的锌指氨基酸序列的数据库，其中每个三联体或四联体核苷酸序列与结合该特定的三联体或四联体序列的锌指的一个或多个氨基酸序列相关联。见例如，美国专利No.6,453,242和6,534,261，本文通过提述并入它们的全部内容。

靶位点的选择；用于设计和构建融合蛋白(和编码它们的多核苷酸)的 ZFP和方法是本领域技术人员已知的，并且在下列文献中有详细描述：美国专利No.6,140,0815；789,538；6,453,242；6,534,261；5,925,523；6,007,988； 6,013,453；6,200,759；WO 95/19431；WO 96/06166；WO 98/53057；WO 98/54311；WO 00/27878；WO 01/60970WO 01/88197；WO 02/099084；WO 98/53058；WO 98/53059；WO 98/53060；WO 02/016536和WO 03/016496。

此外，如这些和其它参考文献中公开的，锌指结构域和/或多指锌指蛋白可以用任何合适的接头序列连接在一起，包括例如，长度为5个或更多个氨基酸的接头。对于长度为6个或更多个氨基酸的接头序列，另见美国专利 No.6,479,626；6,903,185；和7,153,949。本文所述的蛋白质可以包括该蛋白质的各个锌指之间的任何合适接头的组合。

因此，位点特异性核酸酶包括这样的DNA结合结构域，其特异性结合任何期望在其中***供体DNA多核苷酸(即包含至少一个转基因)的基因内的靶位点。

任何合适的剪切结构域都可以和DNA结合结构域可操作连接，以形成核酸酶融合蛋白。例如，ZFP DNA结合结构域已经和核酸酶结构域融合以产生ZFN——一种功能实体，其能够通过其工程化的(ZFP)DNA结合结构域识别意图的核酸靶，并通过核酸酶活性导致DNA在ZFP结合位点附近被切割。见例如Kim等.(1996)Proc Natl Acad Sci USA 93(3):1156-1160。更近期， ZFN已被用于在多种生物体中进行基因组修饰。见例如美国专利公开20030232410；20050208489；20050026157；20050064474；20060188987； 20060063231；和国际公开WO 07/014275。类似地，TALEN DNA结合结构域已经和核酸酶融合从而产生TALEN。见例如美国公开No.20110301073。

如上所述，剪切结构域和DNA结合结构域可以是异源的，例如锌指DNA 结合结构域和剪切结构域来自不同的核酸酶，或者TALEN DNA结合结构域和剪切结构域来自不同的核酸酶，或者大范围核酸酶的DNA结合结构域和剪切结构域来自不同的核酸酶。异源剪切结构域可以从任何核酸内切酶或核酸外切酶获得。可以作为剪切结构域来源的示例性核酸内切酶包括，但不仅限于，限制性核酸内切酶和归巢核酸内切酶。参见，例如，2002-2003年产品目录，New England Biolabs，Beverly,MA；和Belfort等.(1997)Nucleic Acids Res.25:3379-3388。其它切割DNA的酶是已知的(例如，S1核酸酶；绿豆核酸酶；胰DNA酶I；微球菌核酸酶；酵母HO核酸内切酶；另见Linn 等.(eds.)Nucleases,Cold Spring HarborLaboratory Press,1993)。一种或多种这样的酶(或其功能片段)可以用作剪切结构域和剪切半结构域的来源。

类似地，剪切半结构域可以来自任何需要二聚体化才具有剪切活性的核酸酶或其部分，如上面列出的。一般地，如果融合蛋白包含剪切半结构域，则需要两种融合蛋白才能剪切。作为备选，可以使用包含两个剪切半结构域的单个蛋白。两个剪切半结构域可以来自相同的核酸内切酶(或其功能片段)，或者各个剪切半结构域可以来自不同的核酸内切酶(或其功能片段)。此外，两个融合蛋白的靶位点优选地被如此彼此相对布置，使得两个融合蛋白与其各自靶位点的结合将剪切半结构域彼此置于如此的空间朝向，以允许各剪切半结构域形成一个功能性的剪切结构域，例如通过二聚体化。因此，在某些实施方案中，各靶位点的邻近边缘相隔5-8个核苷酸或15-18个核苷酸。然而，在两个靶位点之间可以间隔任何整数数目的核苷酸或核苷酸对(例如， 2-50个核苷酸对或以上)。在一般情况下，剪切位点位于靶位点之间。

限制性内切酶(限制酶)存在于许多物种中，并且能够序列特异性结合 DNA(在识别位点处)，并在结合位点处或其附近剪切DNA。某些限制酶(例如IIS型)在远离识别位点的位点处剪切DNA，并具有可分离的结合和剪切结构域。例如，IIS型酶Fok I催化DNA的双链剪切的位置在一条链上位于距离其识别位点9个核苷酸处，另一条链上位于距离识别位点13个核苷酸处。见，例如，美国专利No.5,356,802；5,436,150和5,487,994；以及Li等. (1992)Proc.Natl.Acad.Sci.USA 89:4275-4279；Li等.(1993)Proc.Natl.Acad. Sci.USA 90:2764-2768；Kim等.(1994a)Proc.Natl.Acad.Sci.USA 91:883-887； Kim等.(1994b)J.Biol.Chem.269:31,978-31,982。因此，在一个实施方案中，融合蛋白包括来自至少一个IIS型限制酶的剪切结构域(或剪切半结构域)和一个或多个锌指结合结构域，其可以是或者不是被工程化的。

一种示例性剪切结构域与结合结构域可以分离的IIS型限制酶是Fok I。这种酶作为二聚体发挥作用。Bitinaite等.,(1998)Proc.Natl.Acad.Sci.USA 95: 10,570-10,575。因此，为本公开的目的，在所公开的融合蛋白中使用的Fok I 酶的一部分视为剪切半结构域。因此，对于使用锌指-Fok I融合物的细胞序列的靶向双链剪切和/或靶向替换，可以使用两个各自包含Fok I剪切半结构域的融合蛋白来重建具有催化活性的剪切结构域。作为备选，也可以使用含有锌指结合结构域和两个Fok I剪切半结构域的单一多肽分子。在本公开的其它地方提供了使用锌指-Fok I融合物进行靶向剪切和靶向序列替换的参数。

剪切结构域或剪切半结构域可以是蛋白质的任何保留剪切活性的部分，或者任何保留多聚体化(例如二聚体化)以形成功能性剪切结构域的能力的部分。

示例性IIS型限制酶在国际专利申请公开WO 07/014275中有描述，本申请通过提述并入其全部内容。其他限制酶也包含分离的结合和剪切结构域，本公开也构想这些限制酶。参见，例如，Roberts等.(2003)Nucleic Acids Res. 31:418-420。

在某些实施方案中，剪切结构域包括一个或多个工程化的剪切半结构域 (也称作二聚体化结构域突变体)，其可最小化或阻止同型二聚体化 (homodimerization)，如例如美国专利公开No.20050064474；20060188987和 20080131962所述，本申请通过提述并入其全部内容。位于Fok I的446，447， 479，483，484，486，487，490，491，496，498，499，500，531，534，537，和538位的氨基酸残基均是影响Fok I剪切半结构域二聚体化的靶点。

可形成专性异二聚体的Fok I的示例性工程化剪切半结构域包括如下的一对：其中第一剪切半结构域在Fok I的490和538位处具有氨基酸残基突变，第二剪切半结构域在Fok I的486和499位处具有氨基酸残基突变。

因此，在一个实施方案中，490位处的突变用Lys(K)代替Glu(E)；538 位处的突变用Lys(K)代替Iso(I)；486位处的突变用Glu(E)代替Gln(Q)；499 位处的突变用Lys(K)代替Iso(I)。具体地，本文所述的工程化剪切半结构域是通过在一个剪切半结构域中突变位置490(E→K)和538(I→K)产生命名为“E490K:I538K”的工程化剪切半结构域，并在另一个剪切半结构域中突变位置486(Q→E)和499(I→L)产生命名为“Q486E:I499L”的工程化剪切半结构域而制备的。本文所述的工程化剪切半结构域是专性异源二聚体突变体，其中异常的剪切被最小化或消除。参见，例如美国专利公开号No.2008/0131962，本文通过提述并入其全部内容用于所有目的。在某些实施方案中，工程化的剪切半结构域在位置486、499和496处(相对于野生型Fok I编号)包括突变，例如在位置486处用Glu(E)残基代替野生型的Gln(Q)残基的突变，在位置499处用Leu(L)残基代替野生型的Iso(I)残基的突变，和在位置496处用Asp(D)或 Glu(E)残基代替野生型的Asn(N)残基(分别被称作“ELD”和“ELE”结构域)的突变。在其他实施方案中，工程化的剪切半结构域在位置490、538和537 处包括突变(相对于野生型Fok I编号)，例如在位置490处用Lys(K)残基代替野生型的Glu(E)残基的突变，在位置538处用Lys(K)残基代替野生型的Iso(I) 残基的突变，和在位置537处用Lys(K)或Arg(R)残基代替野生型的His(H) 残基(分别被称作“KKK”和“KKR”结构域)的突变。在其他实施方案中，工程化的剪切半结构域在位置490和537处包括突变(相对于野生型Fok I编号)，例如在位置490处用Lys(K)残基代替野生型的Glu(E)残基的突变，和在位置 537处用Lys(K)或Arg(R)残基代替野生型的His(H)残基(分别被称作“KIK”和“KIR”结构域)的突变。(参见美国专利公开No.20110201055)。在其它实施方案中，工程化的剪切半结构域包括“Sharkey”和/或“Sharkey”突变(见Guo等, (2010)J.Mol.Biol.400(1):96-107)。

本文所述的工程化剪切半结构域可以使用任何合适的方法制备，例如通过野生型剪切半结构域(Fok I)的定点突变，如美国专利公开No.20050064474； 20080131962；和20110201055所述。

作为备选，可以使用所谓的“裂切(split)-酶”技术在核酸靶位点处体内组装核酸酶(参见，例如美国专利公开No.20090068164)。这些裂切酶的组分可以在各别的表达构建体上表达，或者可以将它们连接在一个开放阅读框中，其中各个组件由，例如，自剪切2A肽或IRES序列所分隔。各组件可以是单独的锌指结合结构域，或者是大范围核酸酶的核酸结合结构域的结构域。

可以在使用核酸酶之前对核酸酶活性进行筛选，例如在基于酵母的染色体***中进行筛选，如WO 2009/042163和20090068164所述。核酸酶表达构建体可以使用本领域已知的技术容易地设计。见例如美国专利公开 20030232410；20050208489；20050026157；20050064474；20060188987； 20060063231；和国际公开WO 07/014275。核酸酶的表达可以在组成型启动子或诱导型启动子的控制之下。

“靶(标)”或“靶位点”或“被靶定的基因组座位”是这样的核酸序列：其限定核酸中的某个部分，当存在发生结合的充分条件时，结合分子(例如位点特异性核酸酶)将结合该部分。

在一个实施方案中，基因组座位序列包括存在于染色体、附加体、细胞器基因组(例如，线粒体，叶绿体)、人工染色体的那些，和存在于细胞中的任何其它类型的核酸，例如扩增的序列、双微染色体和内源性或感染性细菌和病毒的基因组。基因组座位序列可以是正常的(即，野生型)或突变的；突变序列可包括，例如，***(例如，先前***的外源多核苷酸)、缺失、易位、重排和/ 或点突变。基因组座位序列还可以包括若干不同等位基因中的一个。

作为本发明的实施方案，本文还描述了用于将供体DNA多核苷酸序列***在基因组座位内的方法。靶定基因组修饰的报告和观察的频率表明，靶定植物体内的基因组座位是相对低效率的。这些方法的成功率较低，部分是由于同源重组的效率低，以及供体非特异性***到靶位点之外的基因组区域内的频率高。本公开提供了用于鉴定被靶定的基因组座位内的供体DNA多核苷酸的方法。

本公开的方法涉及制作和使用位点特异性核酸酶(例如，与剪切结构域融合的工程化锌指结合结构域)，从而在细胞DNA中制造一个或多个靶向双链断裂。因为细胞DNA中的双链断裂会促进剪切位点附近的细胞修复机制达数千倍，所以这种靶向剪切几乎允许在基因组的任何位点对序列进行改变或替换 (通过同源性介导的修复)。

除了本文所述的融合分子之外，选定的基因组序列的靶向替换还需要引入替换或供体DNA多核苷酸序列。供体DNA多核苷酸序列可以在表达融合蛋白之前、同时、或之后引入到细胞内。供体DNA多核苷酸与基因组序列具有充分的同源性，从而支持它与具有同源性的基因组序列之间发生同源重组(或同源性指导的修复)。供体DNA多核苷酸与基因组座位之间大约25,50100, 200,500,750,1,000,1,500,2,000个核苷酸或更多的序列同源性(者或10-2,000个核苷酸之间的任何整数值，或者更多)将支持它们之间的同源重组。供体DNA多核苷酸序列的长度可以在10-5,000个核苷酸(或者其间的任何整数值的核苷酸)或者更长。可以显见，供体DNA多核苷酸序列通常与其替换的基因组序列并不相同。例如，供体DNA多核苷酸的序列与基因组序列相比可以含有一个或多个单碱基改变、***、缺失、倒置或重排，只要与染色体序列存在足够的同源性即可。作为备选，供体DNA多核苷酸序列可以含有非同源序列，该非同源序列侧翼是两个同源性的区域。此外，供体DNA多核苷酸序列可以包括载体分子，其含有与细胞染色质中感兴趣的区域不同源的序列。一般地，供体DNA多核苷酸序列的同源区与期望与之重组的基因组座位具有至少50％序列同一性。在某些实施方案中，存在60％,70％,80％,90％,95％, 98％,99％,或99.9％的序列同一性。可以存在1％-100％序列同一性之间的任何数值，这取决于供体DNA多核苷酸的长度。

DNA多核苷酸分子可以含有多个与细胞染色质同源的不连续区域。例如，对于通常不存在于感兴趣区域内的序列的靶向***，所述序列可以存在于供体DNA多核苷酸分子内，两侧是与感兴趣区域的序列同源的区域。

供体多核苷酸可以是DNA或RNA，单链的或双链的，并且可以线性或环状形式引入到细胞内。如果以线性形式引入，则供体序列的末端可以通过本领域技术人员已知的方法保护(例如，避免被核酸外切降解)。例如，将一个或多个双脱氧核苷酸残基添加到线性分子的3’端和/或将自身互补的寡核苷酸与一个或两个末端连接。参见，例如，Chang等.,(1987)Proc.Natl Acad. Sd.USA 84:4959-4963；Nehls等.,(1996)Science 272:886-889。用于保护外源多核苷酸免于降解的其它方法包括，但不仅限于，添加末端氨基和使用经过修饰的核苷酸间键，例如，硫代磷酸酯、氨基磷酸酯、和O-甲基核糖或脱氧核糖残基。

供体DNA多核苷酸可作为载体分子的一部分被引入到细胞内，该载体分子具有额外的序列，例如复制起点、启动子和编码抗生素抗性的基因。而且，供体DNA多核苷酸可以作为裸核酸引入，作为与如脂质体或泊洛沙姆等作用剂复合的核酸引入，或者可以通过细菌或病毒递送(例如，土壤杆菌属，根瘤菌NGR234，苜蓿中华根瘤菌(Sinorhizobiummeliloti)，Mesorhizobium loti，烟草花叶病毒，马铃薯X病毒，花椰菜花叶病毒和木薯叶脉花叶病毒)。参见例如，Chung等.(2006)Trends Plant Sd.11(1):1-4)。

不受限于任何理论，似乎细胞序列中双链断裂的存在，同时伴随与断裂的近邻或周围区域同源的外源DNA分子的存在，可以通过将序列信息从供体分子转移到细胞内(例如基因组或染色体)序列，即通过同源性指导的修复处理，也称作“基因转换(geneconversion)”，而激活修复该断裂的细胞机制。申请人的方法有利地将工程化ZFP的强大靶向能力与剪切结构域(或剪切半结构域)组合，从而将双链断裂特异性靶定到期望***外源序列的基因组区域。

对于染色体序列的改变(alteration)，不必将供体的整个序列都拷贝到染色体中，只要有足够的供体序列被拷贝从而实现期望的序列改变即可。

通过同源重组***供体序列的效率与细胞DNA中双链断裂和期望重组的位点之间的距离成反比。换言之，当双链断裂与期望重组的位点越接近时，观察到的同源重组效率越高。当重组的精确位点不预定时(例如，期望的重组事件可以在基因组序列的某个区间内发生时)，则对供体核酸以及剪切位点的长度和序列进行选择以获得期望的重组事件。当期望的事件被设计为改变基因组序列中的单个核苷酸对的序列时，细胞染色质在该核苷酸对任一侧的距其 10,000个核苷酸内被剪切。在某些实施方案中，剪切发生在要改变其序列的核苷酸对的任一侧的距其1,000,500,200,100,90,80,70,60,50,40,30,20, 10,5,或2个核苷酸，或者2-1,000个核苷酸之间的任意整数值内。

如上面详述的，两个融合蛋白，其每一个均包含锌指结合结构域和剪切半结构域，的结合位点可以相距5-8或15-18个核苷酸，从每个结合位点最接近另一个结合位点的边界开始测量，并且剪切发生在该结合位点之间。剪切发生于结合位点之间的单个位点还是多个位点不是重要的，因为被剪切的基因组序列将被供体序列代替。因此，对于通过靶向重组对单个核苷酸对序列的高效改变，结合位点之间区域的中点(midpoint)在距该核苷酸对的10,000 个核苷酸之内，优选地在1,000个核苷酸之内，或者500个核苷酸,或者200 个核苷酸,或者100个核苷酸,或者50个核苷酸,或者20个核苷酸,或者 10个核苷酸,或者5个核苷酸,或者2个核苷酸,或者1个核苷酸,或者就在感兴趣的核苷酸对。

在某些实施方案中，同源染色体可以用作供体DNA多核苷酸。因此，例如，杂合子中突变的修正可以通过工程化如下的融合蛋白实现，该融合蛋白结合并剪切一条染色体上的突变序列，但是不剪切同源染色体上的野生型序列。携带突变的染色体上的双链断裂会促进基于同源性的“基因转换”过程，其中来自同源染色体的野生型序列被拷贝到被剪切的染色体内，从而恢复两个拷贝的野生型序列。

还提供了可以提高靶向重组水平的方法和组合物，包括但不仅限于，使用额外的ZFP-功能结构域融合物以激活参与同源重组的基因的表达，例如 RAD52上位群的成员(例如Rad50,Rad51,Rad51B,RadSIC,RadSID,Rad52, Rad54,Rad54B,Mrell,XRCC2,XRCC3)，产物与前述基因产物相互作用的基因(例如BRCAl,BRCA2)，和/或NBSI复合体中的基因。参见例如Boyko等. (2006)Plant Physiology 141:488-497和LaFarge等.(2003)NucleicAcids Res 31(4):1148-1155。类似地，可以使用ZFP-功能结构域融合物，与本文公开的方法和组合物组合，来抑制参与非同源末端连接的基因的表达(例如Ku70/80, XRCC4,聚(ADP核糖)聚合酶,DNA连接酶4)。见例如Riha等.(2002) EMBO 21:2819-2826；Freisner等.(2003)Plant J.34:427-440；Chen等.(1994) European Journal of Biochemistry 224:135-142。使用锌指结合结构域和功能结构域之间的融合物来激活和抑制基因表达的方法在例如在共有的美国专利 6,534,261；6,824,978和6,933,113中被公开。其它的抑制方法包括使用靶向待抑制基因序列的反义寡核苷酸和/或小干扰RNA(siRNA或RNAi)。

本文公开的重组宿主的遗传操纵使用常规遗传技术在任何适合于遗传操纵的宿主细胞内实施。在一些实施方案中，本文讨论的重组宿主细胞可以是任何可用于遗传修饰和重组基因表达的生物体或微生物。在一些实施方案中，重组宿主可以是，但不仅限于，任何高等植物，同时包括双子叶植物和单子叶植物，和可消费植物，包括作物植物和油料植物。因此，任何植物物种或植物细胞均可选用，如下文中进一步描述的。

在一些实施方案中，包含根据本公开的***在被靶定的基因组座位内的供体DNA多核苷酸的植物(例如，植物宿主细胞)包括，但不仅限于：任何高等植物，包括双子叶植物和单子叶植物二者，特别是可消费植物 (consumable plant)，包括作物植物。这样的植物包括，例如但不仅限于：苜蓿；大豆；棉花；油菜(也称作芥花)；亚麻籽；玉米；水稻；臂形草属；小麦；红花；高粱；甜菜；向日葵；烟草；和草坪草。因此，可以选择任何植物物种或植物细胞。在实施方案中，本文所用的植物细胞和由其生长或衍生的植物包括，但不仅限于，可以从下列植物获得的细胞：油菜(Brassica napus)；印度芥子(Brassica juncea)；埃塞俄比亚芥(Brassica carinata)；萝卜(Brassica rapa)；甘蓝(Brassica oleracea)；大豆(Glycine max)；亚麻籽/亚麻(Linum usitatissimum)；玉米(也称作玉米(corn))(Zeamays)；红花(Carthamus tinctorius)；向日葵(Helianthus annuus)；烟草(Nicotianatabacum)；拟南芥，巴西坚果(Betholettia excelsa)；蓖麻子(Ricinus communis)；椰子(Cocus nucifera)；香菜(Coriandrum sativum)；棉花(Gossypium spp.)；花生(Arachishypogaea)；加州希蒙得木(Simmondsia chinensis)；油棕(Elaeis guineeis)；橄榄(Oleaeurpaea)；水稻(Oryza sativa)；笋瓜(Cucurbita maxima)；大麦(Hordeum vulgare)；甘蔗(Saccharum officinarum)；水稻(Oryza sativa)；小麦属(Triticum spp，包括硬粒小麦和普通小麦)；和浮萍(Lemnaceae sp.)。在一些实施方案中，一种植物物种内的遗传背景可以改变。

如本文所使用的“植物部分”包括植物的任何部分，包括但不仅限于，种子(包括成熟种子和未成熟种子)；植物切割体；植物细胞；植物细胞培养物；植物器官，花粉，胚，花，果，枝，叶，根，茎，外植体，等。植物细胞是植物的结构和生理单元，包括原生质体和细胞壁。植物细胞可以处于分离的单细胞或细胞聚集体的形式，例如易碎的愈伤组织，或培养细胞，或者可以是更高级有组织单元的一部分，例如，植物组织、植物器官、或植物。因此，植物细胞可以是原生质体，产生配子的细胞，或能够再生为完整植物的细胞或细胞集合。因此，为本公开的目的，种子，其包含多个植物细胞并能够再生成为整株植物，被认为是一种植物细胞。植物组织或植物器官可以是种子、原生质体、愈伤组织，或者被组织成一个结构或功能单元的任何其他组的植物细胞。植物特别有用的部分包括可收获的部分和可用于繁殖后代植物的部分。植物的可收获部分可以是植物的任何有用部分，例如，花、花粉、幼苗、块茎、叶、茎、果实、种子、根，等。可用于繁殖的植物部分包括，例如，种子、果实、插条、幼苗、块茎、根茎等。组织培养优选地能够再生具有上述近交植物生理学和形态学特征的植物，并能够再生具有和上述近交植物基本相同的基因型的植物。在一个实施方案中，这样的组织培养物中的可再生细胞是胚、原生质体、分生细胞、愈伤组织、花粉、叶、花药、根、根尖、丝、花、果仁、穗、穗轴、壳或茎。更进一步地，本公开的实施方案提供了从本公开实施方案的组织培养物再生的植物。

关于包含***在基因组座位内的供体DNA多核苷酸的植物的产生，用于植物转化的方法是本领域众所周知的。例如，已经开发了大量用于植物转化的方法，包括用于双子叶植物以及单子叶植物的生物和物理转化方案(例如，Goto-Fumiyuki等.,Nature Biotech17:282-286(1999)；Miki等.,Methods in Plant Molecular Biology andBiotechnology,Glick,B.R.和Thompson,J.E.编辑, CRC Press,Inc.,Boca Raton,pp.67-88(1993))。此外，包含基因表达盒的载体以及用于植物细胞或组织转化和植物的再生的体外培养方法，可以在Gruber 等.,Methods in Plant Molecular Biology andBiotechnology,Glick,B.R.和 Thompson,J.E.编辑,CRC Press,Inc.,Boca Raton,pp.89-119(1993)中获得。

有多种技术可用于将包含基因表达盒的DNA***在植物宿主细胞内。这些技术包括使用根癌土壤杆菌或发根土壤杆菌作为转化剂用卸甲的 T-DNA进行转化，磷酸钙转染，聚凝胺转化，原生质体融合，电穿孔，超声方法(例如，声致穿孔)，脂质体转化，显微注射，裸DNA，质粒载体，病毒载体，基因枪(微粒轰击)，碳化硅WHISKERS^TM介导的转化，气雾剂集束，或聚乙二醇介导的转化，以及其他可能的方法。

例如，包含基因表达盒的DNA构建体可以使用例如植物细胞原生质体的电穿孔和显微注射被直接引入到植物细胞的基因组DNA中，或者DNA 构建体可以使用基因枪方法，例如DNA微粒轰击被直接引入到植物组织中 (见例如Klein等.(1987)Nature 327:70-73)。其它用于植物细胞转化的方法包括通过碳化硅WHISKERS^TM介导的DNA摄取进行显微注射(Kaeppler等. (1990)Plant Cell Reporter 9:415-418)。作为备选，DNA构建体可以通过纳米颗粒转化引入到植物细胞内(见例如美国专利申请No.12/245,685，本申请通过提述并入其全部内容)。

一种已知的植物转化方法是微射粒介导的转化，其中DNA被携带在微射粒的表面上。在这种方法中，表达载体用生物射弹装置引入到植物组织中，该装置可以将微射粒加速到足以穿透植物细胞壁和细胞膜的速度。Sanford 等.,Part.Sci.Technol.5:27(1987),Sanford,J.C.,Trends Biotech.6:299(1988), Sanford,J.C.,Physiol.Plant 79:206(1990),Klein等.,Biotechnology 10:268 (1992)。

作为备选，基因转移和转化方法包括，但不仅限于，通过氯化钙沉淀、聚乙二醇(PEG)或电穿孔介导的DNA摄取(见Paszkowski等.(1984)EMBO J 3:2717-2722,Potrykus等.(1985)Molec.Gen.Genet.199:169-177；Fromm等. (1985)Proc.Nat.Acad.Sci.USA 82:5824-5828；和Shimamoto(1989)Nature 338:274-276)和植物组织电穿孔(D'Halluin等.(1992)Plant Cell 4:1495-1505) 进行原生质体转化。

一种广泛使用的用于将表达载体引入到植物中的方法是基于土壤杆菌的自然转化***。Horsch等.,Science 227:1229(1985)。根癌土壤杆菌和发根土壤杆菌是已知可用于遗传转化植物细胞的致病土壤细菌。根瘤土壤杆菌和发根土壤杆菌各自的Ti和Ri质粒携带有负责植物遗传转化的基因。Kado,C.I., Crit.Rev.Plant.Sci.10:1(1991)。关于土壤杆菌载体***和用于土壤杆菌介导的基因转移的方法的详细说明也可以在例如下列文献中获得：Gruber等,同上,Miki等,同上,Moloney等.,Plant Cell Reports 8:238(1989),和美国专利 No.4,940,838和5,464,763。

如果使用土壤杆菌进行转化，那么通常将待***的DNA克隆入特定的质粒中，或者是中间载体或者是二元载体。中间载体不能在土壤杆菌中复制自己。中间载体可以通过利用辅助质粒(结合物(conjugation))被转移到根癌土壤杆菌内。日本烟草超二元***是这种***的一个实例(综述参见，Komari 等(2006)收录于Methods in Molecular Biology(K.Wang,编辑)No.343；Agrobacterium Protocols(第2版，第1卷)Humana Press Inc.,Totowa,NJ,第 15-41页；和Komori等(2007)Plant Physiol.145:1155-60)。二元载体能够在大肠杆菌和土壤杆菌中复制自己。它们包含可选择标志物基因和由T-DNA 的左右边界区框定的接头或多接头。它们能够被直接转化到土壤杆菌中(Holsters,1978)。用作宿主细胞的土壤杆菌含有携带vir区域的质粒。Ti或 Ri质粒也包含转移T-DNA必需的vir区。vir区是将T-DNA转移到植物细胞中必需的。可以包含额外的T-DNA。

当使用二元T-DNA载体(Bevan(1984)Nuc.Acid Res.12:8711-8721)或共培养程序(Horsch等.(1985)Science 227:1229-1231)用细菌感染细胞时，根癌土壤杆菌宿主的毒力功能将指导含有构建体和邻接标记物的T-链***到植物细胞DNA中。一般地，使用土壤杆菌转化***对双子叶植物进行工程化 (Bevan等.(1982)Ann.Rev.Genet 16:357-384；Rogers等.(1986)Methods Enzymol.118:627-641)。土壤杆菌转化***也可用于将DNA转化、以及转移到单子叶植物和植物细胞中。参见，美国专利No.5,591,616；Hernalsteen等. (1984)EMBO J 3:3039-3041；Hooykass-Van Slogteren等.(1984)Nature 311:763-764；Grimsley等.(1987)Nature 325:1677-179；Boulton等.(1989) Plant Mol.Biol.12:31-40；andGould等.(1991)Plant Physiol.95:426-434。

在将包含基因表达盒的遗传构建体引入到植物细胞中之后，可以使植物细胞生长，当分化的组织，例如芽和根，出现时，便能够产生成熟的植物。在一些实施方案中，可以产生多个植物。用于再生植物的方法是本领域普通技术人员已知的，并可以在如下的文献中找到：Plant Cell and Tissue Culture, 1994,Vasil和Thorpe编辑.Kluwer AcademicPublishers和Plant Cell Culture Protocols(Methods in Molecular Biology 111,1999Hall编辑，Humana Press)。本文所述的遗传修饰植物可以在在发酵培养基中培养，或者在合适的培养基例如土壤中生长。在一些实施方案中，用于高等植物的合适生长培养基可以是任何植物生长培养基，包括但不仅限于，土壤、砂、任何其它可支持根生长的颗粒介质(例如蛭石、珍珠岩等)或水培养基，以及合适的光、水和优化高等植物生长的营养补充剂。

通过上述任何一种转化技术产生的转化植物细胞可以被培养从而再生具有转化基因型以及期望表型的整株植物。这样的再生技术依赖于组织培养生长培养基中某些植物激素的操作，通常依赖于已经和期望的核苷酸序列一起被引入的杀生物剂和/或除草剂标志物。从培养的原生质体再生植株在下列文献中有描述：Evans,等,"ProtoplastsIsolation and Culture"，收录于Handbook of Plant Cell Culture,124-176页,Macmillian Publishing Company,New York, 1983；和Binding,Regeneration ofPlants,Plant Protoplasts,21-73页,CRC Press,Boca Raton,1985。再生也可以从植物愈伤组织、外植体、器官、花粉、胚或其部分获得。这样的再生技术在Klee等(1987)Ann.Rev.ofPlant Phys. 38:467-486中有一般性的描述。

引入到植物细胞内的核酸可用于对基本上任何植物赋予期望的性状。多种多样的植物和植物细胞***可以使用本公开的核酸构建体和上述的各种转化方法工程化，以获得期望的生理和农艺学特征。在优选的实施方案中，用于工程化的植物和植物细胞包括，但不仅限于，单子叶植物和双子叶植物，例如作物，包括谷物(例如小麦、玉米、大米、小米、大麦)，水果作物(例如西红柿、苹果、梨、草莓、橘子)，饲料作物(例如苜蓿)，根类蔬菜作物(例如胡萝卜、马铃薯、甜菜、山药)，叶类蔬菜作物(例如莴苣、菠菜)；开花植物(例如矮牵牛、玫瑰、菊花)，针叶林和松树(例如松木冷杉、云杉)；用于植物修复的植物(例如重金属累积植物)；油料作物(例如向日葵、油菜籽)，和用于实验目的的植物(例如拟南芥)。因此，本公开的方法和组合物可以使用的植物范围很广，包括，但不仅限于，来自如下属的物种：芦笋属、燕麦属、芸苔属、柑桔属、西瓜属、辣椒属、南瓜属、胡萝卜属、飞蓬属、大豆属、棉属，大麦属、莴苣属、黑麦草属、番茄属、苹果属、木薯属、烟草属、诸葛菜属、稻属、鳄梨属、菜豆属、豌豆属、梨属、樱桃属、萝卜属、黑麦属、马铃薯属、高粱属、小麦属、葡萄属、豇豆属、和玉米属。

被转化的植物细胞、愈伤组织、组织和植物可以通过对工程化的植物材料进行选择或筛选存在于转化DNA上的标志物基因编码的性状加以鉴定和分离。例如，选择可以通过如下实施：将工程化的植物材料种植于含有抑制量抗生素或除草剂(转化的基因赋予对该抗生素或除草剂的抗性)的培养基上。进一步，被转化的植物和植物细胞也可以通过筛选任何可见的标志物基因(例如β-葡萄糖醛酸酶、荧光素酶，或gfp基因)的活性加以鉴定。这些选择和筛选方法是本领域技术人员众所周知的。

在将核酸***细胞的内容中，术语“引入/导入”包括转化到细胞内，以及例如在常规的育种技术中，将具有该序列的植物与另一种植物杂交，从而使第二种植物含有该异源序列。这些育种技术是本领域技术人员公知的。关于植物育种技术的讨论，见Poehlman(1995)Breeding Field Crops.AVI Publication Co.,Westport Conn,第4版。回交方法可用于将基因引入到植物中。这种技术已经被使用了几十年用于将性状导入植物。这种和其它植物育种方法的描述的实例可以参见，例如，Poelman，同上；和Plant Breeding Methodology,Neal Jensen编辑,John Wiley&Sons,Inc.(1988)。在一个典型的回交方案中，感兴趣的原始栽培种(轮回亲本)与携带待转移的感兴趣单个基因的第二植物(非轮回亲本)杂交。然后，将此次杂交产生的子代再次与轮回亲本杂交，并重复该过程直到获得转化植物，其中除了来自非轮回亲本的单个被转移基因之外，转化植物回收了轮回亲本基本上全部的期望形态和生理特征。

术语转基因“事件”是指通过转化和再生具有异源DNA(例如包含感兴趣基因的表达盒)的单个植物细胞产生的重组植物。术语“事件”是指包含异源DNA的原始转化体和/或转化体的后代。术语“事件”还指通过转化体与另一植物之间的有性异型杂交产生的后代。即使在与轮回亲本进行反复回交之后，来自被转化亲本的***DNA和侧翼DNA仍然存在于杂交后代的相同染色***置。通常，植物组织的转化可产生多个事件，其中每一个代表DNA 构建体***在植物细胞基因组的一个不同位置。根据转基因或其它期望特性的表达，选择特定的事件。在本主题公开的实施方案中，特定事件包括***在被靶定的基因组座位内的供体DNA多核苷酸。

“转基因”是指通过遗传操作被引入到生物体的基因组中以改变其基因型的基因。

“转基因植物”是指这样的植物，其一个或多个细胞含有包含基因表达盒的表达载体。术语“信使RNA(mRNA)”是指没有内含子并且可以被细胞翻译成蛋白质的RNA。

如本文所使用的，“***DNA”是指供体DNA多核苷酸内的异源DNA，其包含用于转化植物材料的基因表达盒，而“侧翼DNA”或“接点DNA”可以包括天然存在于生物(例如植物)体内的基因组DNA，或包括通过转化处理引入的外来(异源)DNA，其对于原始的***DNA分子是无关的，例如与转化事件相关的片段。如本文所使用的，“接点”或“接点区”或“侧翼序列”是指具有至少20,50,100,200,300,400,1000,1500,2000,2500,或5000个碱基对或者更多碱基对的序列，其位于原始外来***DNA分子的直接上游并与之邻接，或者位于其直接下游并与之邻接。

在一个实施方案中，本公开涉及通过产生扩增子的扩增反应鉴定靶基因组内供体DNA多核苷酸的存在的方法。检测到不存在扩增子是该基因组座位是否已被破坏的指示。在其它实施方案中，扩增子的存在是供体DNA多核苷酸已***在基因组座位内的指示。

各种测定法可以和本公开某些实施方案的扩增反应联合使用。下列技术可以在多种情况下使用，并且在一个实施方案中，可用于检测植物细胞中核酸分子和/或编码的多肽的存在。例如，该分子的存在可以通过该多种方法确定，包括使用序列的引物或探针。转基因可以在植物的一些组织中或者在一些发育阶段选择性表达，或者转基因可以在基本上所有植物组织中，基本上在其整个生命周期中表达。然而，也可以使用任何组合的表达模式。

对选定的核酸序列或靶核酸序列的扩增可以通过任何合适的方法实施。一般地参见Kwoh等.,Am.Biotechnol.Lab.8,14-25(1990)。合适扩增技术的实例包括，但不仅限于，聚合酶链式反应、连接酶链式反应、链置换扩增(一般地参见G.Walker等.,Proc.Natl.Acad.Sci.USA 89,392-396(1992)；G. Walker等.,Nucleic Acids Res.20,1691-1696(1992))，基于转录的扩增(见D. Kwoh等.,Proc.Natl.Acad Sci.USA 86,1173-1177(1989))，自主序列复制(或“3SR”)(见J.Guatelli等.,Proc.Natl.Acad.Sci.USA 87,1874-1878(1990))，Qβ复制酶***(见P.Lizardi等.,BioTechnology 6,1197-1202(1988))，基于核酸序列的扩增(或“NASBA”)(见R.Lewis,Genetic Engineering News 12(9),1 (1992))，修复链反应(或“RCR”)(见R.Lewis，同上)，和飞镖DNA扩增 (boomerangDNA amplification)(或“BDA”)(见R.Lewis，同上)。聚合酶链反应一般是优选的。

““扩增”是涉及模板特异性的核酸复制的一个特例。它与非特异性模板复制(即，依赖于模板但不依赖于特定模板的复制)相对。在这里，模板特异性与复制的保真性(即，合成正确的多核苷酸序列)和核苷酸(核糖或脱氧核糖) 特异性相区分。模板特异性经常以“靶”特异性为度量来描述。靶序列在这个意义上是“靶”：即试图从其他核酸中将它们挑选出来。扩增技术主要是为这种挑选而设计的。

如本文所使用的，术语“聚合酶链式反应”和“PCR”一般指用于增加基因组DNA混合物中靶序列区段的浓度而无需克隆或纯化的方法(美国专利No. 4,683,195；4,683,202；和4,965,188；本文通过提述并入其内容)。这种用于扩增靶序列的过程包括向含有期望靶序列的DNA混合物中引入过量的两种寡核苷酸引物，随后在DNA聚合酶的存在下进行精确的热循环序列。两个引物与双链靶序列中它们各自的链互补。为了实现扩增，将混合物变性，然后引物与靶分子中它们的互补序列退火。退火之后，引物被聚合酶延伸，从而形成一对新的互补链。变性、引物退火和聚合酶延伸的步骤可以重复许多次(即，变性、退火和延伸构成一个“循环”；可以有无数个“循环”)以获得高浓度的期望靶序列的扩增区段。期望靶序列的扩增区段的长度由引物彼此之间的相对位置确定，因此这个长度是一个可控的参数。由于该过程的重复性，该方法被称为“聚合酶链式反应”(下文中称为“PCR”)。因为靶序列的期望扩增区段成为混合物中的主要序列(在浓度方面)，所以它们称作“被PCR扩增”。

如本文所使用的，术语“多个”的意思是两个或多个，例如，3、4、5或更多个，包括10、20、50或更多个多核苷酸、核酸探针等。

术语“逆转录酶”或“RT-PCR”是指一类PCR，其中起始材料是mRNA。使用逆转录酶，起始的mRNA被酶促转变成互补的DNA或“cDNA”。然后，该 cDNA被用作“PCR”反应的“模板”。

在一个实施方案中，扩增反应被定量。在其它实施方案中，扩增反应用标识谱定量，其中标识谱选自下组：熔解温度或荧光标识谱。

本公开实施方案的核酸分子或其区段可以用作PCR扩增的引物。在实施PCR扩增中，在引物和模板之间可以忍受一定程度的错配。因此，示例性引物的突变、缺失和***(特别是5’-3’末端的核苷酸添加)也在本主题公开的范围之内。可以通过本领域普通技术人员已知的方法在给定的引物中产生突变、***和缺失。

分子信标已被描述用于序列检测。简要地说，FRET寡核苷酸探针被设计成与侧翼基因组和***物DNA接点重叠。FRET探针的独特结构导致它含有的二级结构中荧光部分和淬灭部分保持紧密相邻。FRET探针和PCR引物(一个引物在***物DNA序列中，另一个在侧翼基因组序列中)在热稳定聚合酶和dNTP的存在下进行循环。经过成功的PCR扩增之后，FRET探针与靶序列杂交的结果导致探针的二级结构被除去，荧光部分和淬灭部分在空间上分离。由成功的扩增和杂交所产生的荧光信号表明侧翼基因组/转基因***序列的存在。这种用于作为扩增反应进行检测的分子信标测定是本主题公开的一个实施方案。

水解探针测定，又称

(Life Technologies公司，Foster City,Calif.)，是一种检测和定量DNA序列的存在的方法。简要地说，FRET寡核苷酸探针被设计为具有转基因内的一段寡核苷酸和侧翼基因组序列中的一段寡核苷酸，用于事件特异性检测。FRET探针和PCR引物(一个引物位于***物DNA序列中，另一个位于侧翼基因组序列中)在热稳定聚合酶和 dNTP的存在下进行循环。FRET探针的杂交导致FRET探针上的荧光部分与淬灭部分切离，并从后者释放。由成功的扩增和杂交所产生的荧光信号表明侧翼基因组/转基因***序列的存在。这种用于作为扩增反应进行检测的分子信标测定是本主题公开的一个实施方案。

KASPar测定是一种检测和定量DNA序列的存在的方法。简要地说，使用一种称作

测定***的基于聚合酶链式反应(PCR)的测定法，对包含被靶定的基因组座位的基因组DNA样品进行筛选。在本主题公开的实施中使用的

测定能够使用含有多个引物的

PCR测定混合物。该PCR测定混合物中所用的引物可包括至少一个正向引物和至少一个反向引物。正向引物含有对应于供体DNA多核苷酸的特定区域的序列，反向引物含有对应于基因组序列的特定区域的序列。此外，在PCR测定混合物中使用的引物可以包括至少一种正向引物和至少一种反向引物。例如，

PCR测定混合物可以使用两个对应于两个不同等位基因的正向引物，和一个反向引物。其中一个正向引物含有对应于内源性基因组序列的特定区域的序列。第二个正向引物含有对应于供体DNA多核苷酸的特定区域的序列。反向引物含有对应于基因组序列的特定区域的序列。这种用于检测扩增反应的

测定是本主题公开的一个实施方案。

在一些实施方案中，荧光信号或荧光染料选自下组：HEX荧光染料，FAM 荧光染料，JOE荧光染料，TET荧光染料，Cy 3荧光染料，Cy 3.5荧光染料，Cy 5荧光染料，Cy 5.5荧光染料，Cy 7荧光染料，和ROX荧光染料。

在其他实施方案中，扩增反应使用合适的第二荧光DNA染料运行，该染料能够以可以通过流式细胞仪检测的浓度范围对细胞DNA进行染色，并且其具有可以通过实时定量热循环仪检测的荧光发射光谱。本领域的普通技术人员会意识到，其它核酸染料是已知的，并且不断会被鉴定出来。可以使用任何具有合适激发和发射光谱的合适核酸染料，例如

SYTOX

SYBR Green

和

在一个实施方案中，第二荧光DNA染料是

使用浓度小于10μM，小于4μM，或者小于2.7μM。

本发明的实施方案在下面的实施例中被进一步定义。应当理解，这些实施例仅是作为举例提供的。根据上面的讨论和下面的实施例，本领域的技术人员能够确定本发明的基本特征，并且在不背离其精神和范围的前提下，可以对本发明的实施方案进行各种改动和修饰，使之应用于各种用途和条件。因此，除了本文显示和描述的之外，本领域的技术人员鉴于前面的描述可以显见本发明实施方案的各种修饰。这些修饰也意图涵盖在附加权利要求的范围内。下面是作为举例提供的，并不意图对本发明的范围构成限制。

实施例

实施例1.玉米愈伤组织中被靶定的基因座的分析

基因组座位靶定：对先前在WO2009100188“METHODS FOR DETECTION OF CORNEVENT DAS-59132”(本申请并入其全部内容)中公开的玉米事件DAS-59132的基因组座位进行靶定，使用设计为特异性结合并剪切构成这一事件的基因组DNA的锌指核酸酶。维持所得的转化子，直至通过扩增反应对特定事件内的基因组座位的描述进行鉴定和表征的分析能够完成。

针对包含DAS-59132基因组座位的DNA序列的锌指蛋白的设计如先前所述。参见例如Urnov等.(2005)Nature 435:646-651。将DAS-59132锌指设计纳入到编码具有至少一个具有CCHC结构的指的蛋白质的载体。参见美国专利公开No.2008/0182332。具体地，每个蛋白中的最后一个指具有供识别螺旋用的CCHC骨架。将非标准的锌指编码序列通过一个四氨基酸接头和一个来自玉米的opaque-2核定位信号与IIS型限制酶FokI的核酸酶结构域(Wah等.(1998)Proc.Natl.Acad.Sci.USA 95:10564-10569的序列的氨基酸384-579) 融合，从而形成DAS-59132锌指核酸酶(ZFN)。双顺反子表达构建体中的融合蛋白利用如Shukla等.(2009)Nature 459:437-441所述的2A核糖体延迟信号(stuttering signal)的表达被相对强的组成型和异位启动子(如CsVMV启动子)所驱动。

使用一种先前已显示可鉴定活性核酸酶的基于出芽酵母的***对最佳 ZFN的剪切活性进行了验证。参见例如美国专利公开No.20090111119； Doyon等.(2008)NatBiotechnol.26:702–708；Geurts等.(2009)Science 325:433。在设计、产生并测试结合假定DAS-59132基因组多核苷酸靶位点的众多ZFN中，鉴定在体内具有高水平活性的优选ZFN，并选择用于进一步的实验。这些ZFN的特征是能够在植物中高效地结合并剪切DAS-59132基因组多核苷酸靶位点。

使用本领域公知的技能和技术设计和完成这样的质粒载体：该载体含有用所述酵母测定法鉴定的示例性锌指核酸酶的ZFN表达构建体。接着，将 opaque-2核定位信号::锌指核酸酶融合序列与互补的opaque-2核定位信号:: 锌指核酸酶融合序列配对。这样，每个构建体由单个开放阅读框构成，该开放阅读框包括2个opaque-2核定位信号::锌指核酸酶融合序列，它们被来自 Thosea asigna病毒的2A序列(Mattion等.(1996)J.Virol.70:8124-8127)分隔。ZFN编码序列的表达由高表达的组成型玉米泛素1启动子(Christensen等. (1992)Plant Mol.Biol.18(4):675-89)驱动，并且侧翼是玉米Per 53’polyA非编码区(美国专利NO.6,699,984)。

供体构建体被设计成整合到DAS-59132基因组座位的被ZFN剪切的基因组DNA中。这个单基因表达盒由水稻肌动蛋白1启动子(Os Act1启动子):: 膦丝菌素乙酰转移酶编码序列(PAT；美国专利No.7,838,733)::驱动，并由玉米脂肪酶3'非翻译区(ZmLip 3’UTR)终止。此外，供体质粒被设计成在靶PAT 基因的任一端上具有1kB序列(同源臂)，其与DAS-59132基因组座位中ZFN 切割位点的任一端上的序列同源。同源臂充当同源重组机制将转基因***到基因组ZFN切割位点内的基底(substrate)。各种基因元件被组装在高拷贝数的基于pUC的质粒中。

靶向整合：转基因事件被靶向到DAS-59132的内源基因组座位。如前所述的构建体包括供体序列(pDAB107855)和DAS-59132ZFN 6 (pDAB105906)。这两个质粒的共转化产生了854个转基因PAT事件，使用本主题公开的鉴定被靶定的基因组座位中供体DNA多核苷酸的存在的方法对它们进行了筛选。

将由12毫升细胞压积(packed cell volume)(PCV)的先前冻存的细胞系加 28mL条件化培养基构成的玉米愈伤组织细胞亚培养到装有80mL GN6液体培养基的500mL锥形烧瓶中，并放置在125rpm，28℃的摇床上。用相同的细胞系重复这个步骤2次，使得总共36mLPCV被分配在3个烧瓶中。 24小时后，除去GN6液体培养基，并用72mL GN6S/M渗透压培养基代替。将烧瓶在28℃黑暗温育30-35分钟，中速搅拌(125rpm)。在温育期间，通过向405mg无菌碳化硅晶须(WHISKERS^TM)中添加8.1mL GN6S/M液体培养基来制备50mg/mL的WHISKERS^TM(Advanced Composite Materials,LLC, Greer,SC)悬液。

在GN6S/M渗透压培养基中温育之后，将各个烧瓶中的内容物合并到一个250mL离心瓶中。当烧瓶中的所有细胞都沉淀到底部之后，将超出大约14mL GN6S/M液体的内容物体积吸出，并收集在无菌的1L烧瓶中备用。将WHISKERS^TM的预湿悬液(pre-wettedsuspension)在涡旋仪上以最大速度混合60秒，然后添加到所述离心瓶中。

在这个实施例中，向每个瓶添加pDAB107855(供体序列)和pDAB105906 (ZFN)质粒DNA。一旦添加了质粒DNA，立即将瓶放入一个经改良的RED DEVIL 5400^TM商用涂料混合机(Red Devil Equipment Co.,Plymouth,MN)中，并搅拌10秒。搅拌之后，将细胞、培养基、WHISKERS^TM与质粒DNA的鸡尾酒与125mL新鲜的GN6液体培养基一起添加到1L***内容，以减少渗透物(osmoticant)。让细胞在设定为125rpm的摇床上恢复2小时。使用与家用真空管路连接的玻璃盒收集器单元(glass cell collector unit)将6mL分散混悬液过滤到Whatman#4滤纸(5.5cm)上，使得每瓶获得60片滤纸。将滤纸置于60x 20mm的GN6固体培养基平板上，并在黑暗条件下28℃历时1 周。

DNA递送1周后，将滤纸转移到含有选择剂的60x 20mm GN6(1H)选择培养基平板上。将这些选择平板在黑暗下28℃温育1周。在黑暗中选择1 周之后，如下所述将组织包埋到新鲜培养基上：将每个平板上的1/2细胞刮取到含有3.0mL GN6琼脂糖培养基的试管中，并保持在37-38℃。

用刮刀将琼脂糖/组织混合物破碎，随后将3mL琼脂糖/组织混合物均匀地倾倒到含有GN6(1H)培养基的100x 25mm培养皿的表面上。为每个平板的两个半份重复这一过程。一旦所有组织被包埋，便将平板在黑暗条件下28 ℃温育至多至10周。将在这些选择条件下生长的推定的转化分离物从包埋平板上移出，并转移到60×20mm平板中的新鲜选择培养基上。如果在大约2周后仍有明显持续生长，则将事件视为对所施加的除草剂(选择剂)有抗性，随后收获一等份的细胞用于基因型分析。在这个实施例中，从被处理的瓶中回收了大量的事件。对这些事件进一步进行分子分析，以确认转基因整合在玉米事件DAS-59132的基因组座位内。

DNA提取：将愈伤组织样品收集在96孔收集板(Qiagen,Valencia,CA) 中，然后冷冻干燥48小时。使用KLECKO^TM组织粉碎机(Garcia Manufacturing, Visalia,CA)，在BIOSPRINT96AP1^TM裂解缓冲液(Qiagen)中用一个不锈钢珠破碎组织。组织浸软之后，使用BIOSPRINT96^TM提取机器人(Qiagen)用 BIOSPRINT96^TM植物试剂盒(Qiagen)以高通量格式分离基因组DNA。然后将基因组DNA的一个样品稀释到2ng/μl，随后实施qPCR反应以获得合适的 Cp(定量循环)得分，结果产生了标识谱。

DAS-59132基因座破坏测定：用DAS-59132-ZFN和供体质粒对Hi-II 愈伤组织细胞进行WHISKERS^TM介导的转化导致了靶向的和随机的转基因***。为了区分随机***事件和靶向事件群体，使用基因座破坏测定对所产生的全部854个事件进行初步筛选。这个测定确定了基因座内ZFN结合位点是保持完整还是被ZFN剪切或供体***所破坏。表明基因组座位内存在破坏是ZFN已经剪切内源DAS-59132靶位点的初步证据，并且指示供体 DNA分子的靶向***。设计引物以扩增包含ZFN识别位点的内源靶区域，

并建立样品以通过qPCR进行分析。完整区域的扩增(指示非靶向的事件)产生一个140个碱基对的扩增子，作为一个可检测的qPCR信号测得。供体分子的成功靶向整合导致该可检测的qPCR信号的破坏，并且显示为与对照相比较低的总体信号。

DAS-59132基因座破坏测定通过实时PCR实施，实时PCR使用

480***(Roche Applied Science,Indianapolis,IN)。使用

探针设计软件2.0设计该测定，使之监视DAS-59132基因座处的DAS-59132ZFN(25716/25717)结合序列(和内参基因IVF(Genbank登录号No:U16123.1|ZMU16123))。为了扩增，在含有0.4μM每种引物和0.2μM 每种探针(表1)的10μL多重反应体积中以1X终浓度制备

480探针主预混物(Roche Applied Science,Indianapolis, IN)。实施2步扩增反应，其中在55℃延伸30秒，并进行荧光采集。使用靶对参照的比值来实施破坏测定的分析。

表1:用于DAS-59132基因座破坏测定的寡核苷酸引物和探针序列

用该破坏测定对从精确转化产生的854个事件进行筛选，根据靶对参照信号的显著降低将其评定为被破坏。结果表明，854个测定事件中有63个在 DAS-59132基因座具有被破坏的信号，指示靶向基因***(图2)。尽管破坏测定提供了对被破坏的基因座的定量测量，但是这个测定无法将靶向***与剪切位点处由于易错修复造成的突变解析开来。开发了一种次级内-外PCR 测定，用来对事件进行平行筛选，以确保对所有事件的鲁棒而精确的评估。

DAS-59132基因座内-外PCR测定：对于通过破坏测定筛选的事件，用 DAS-59132基因座处的基因座特异性终点PCR测定再进行筛选。一个寡核苷酸引物被设计成与靶基因组DNA中ZFN剪切位点外部的区域退火，第二个寡核苷酸引物被设计成仅与供体DNA的转基因区域退火。引物被设计成分析DAS-59132基因座处的靶位点的5’和3’***物DNA接点区域。通过转化产生的许多事件是随机***，因此在内-外PCR过程中不被扩增，因为供体序列并不近邻靶序列(图3A)。由于引物被设计成仅扩增***在靶区域内的供体DNA和基因组DNA的区域，所以扩增是靶向转基因事件的结果(图3B)。这种PCR分析称作“内-外”PCR，确保获得了靶向基因***的全貌(complete picture)，因为引物被设计成同时靶向靶序列和被***的供体序列，并且5’和3’接点均被分析。PCR之后，通过电泳对扩增样品进行分析，并且在DAS-59132基因座的靶位点处具有转基因整合的样品会产生2kb和1.5kb 的两个扩增条带。这指示了转基因的5’和3’接点处有整合的靶序列。

内-外PCR扩增反应使用Takara Ex Taq HS kit^TM(Clontech Laboratories,Inc.,Mountain View,CA)实施。每个PCR反应以15或20μL终体积进行，含有1x Ex Taq缓冲液,200nM正向和反向引物,10-20ng基因组DNA模板,和终浓度为0.05单位/μL的Ex Taq HS聚合酶。对于实时内-外PCR，在PCR 反应预混物中含有终浓度为4μM或2.67μM的

染料(Invitrogen, Grand Island,NY)。最初，按照制造商推荐的浓度使用

绿色荧光染料，因为它先前已显示可提高整体测定的灵敏度，并对聚合酶反应的抑制低。这种染料产生更强的信号和更一致的结果，但是高通量***仍然有限制。背景荧光一直是问题，因为引物二聚体形成和非特异性引物退火(来自不纯的引物)会产生假阳性信号。因此，将在该测定中使用的浓度从10μM降低到4 μM或2.67μM。由于染料浓度的减少，标识谱可以为PCR测定提供可靠的检测和定量。

实时内-外PCR在ABI VIIA7PCR SYSTEM^TM(Life Technologies Corporation,Carlsbad,CA)上实施。最初变性之后，扩增程序包含40个98℃ 10秒、66℃ 30秒和68℃ 2分钟的循环，并进行荧光获取，随后实施熔解温度分析程序。扩增步骤之后，将反应在65℃保持30秒，在72℃ 10分钟，并最终保持在4℃。使用直接荧光信号和熔解温度谱二者进行样品分析。对实时***上鉴定的阳性样品进一步用标准凝胶迁移测定进行确认。

表2:用于DAS-59132基因座内-外测定(In Out Assay)的引物和探针序列

为了试图区分靶向***PCR扩增子与假阳性，设计了一个方案为所产生的每个PCR产物分配一个标识谱。将PCR扩增子的熔解温度谱与阳性对照进行比较，匹配的曲线可鉴定阳性内-外PCR产物(图4A和4B)。将使用包含3’和5’端二者熔解温度谱的标识谱与内-外PCR分析关联起来是一种新颖的分析方法，在鉴定基因组座位中的靶向供体DNA多核苷酸***事件时可产生更大的确信度。

对于破坏测定和DAS-59132基因座内-外PCR测定的结果，进一步通过 Southern印迹和测序进行确认(下一代测序的例行做法)。

这种新颖的测定法导致了一种鲁棒的分析过程，用于鉴定玉米ZFN剪切位点处的靶向的供体DNA多核苷酸***事件。使用这种新方法成功地靶定了内源基因组座位，并且成功地鉴定了被靶定的事件。总共提交了854个样品用于使用本公开的测定法进行分析。对所有假定事件进行了破坏测定，有63个事件显示破坏。对所有这些事件进行了内-外PCR，鉴定了8个阳性事件。结果，总共有8个事件被确认是靶向***物(图5)。

实施例2.玉米植物中被靶定的基因座的分析

产生了玉米转基因B104胚，其中DAS-59132基因座通过锌指核酸酶构建体pDAB105906和供体构建体pDAB104179被靶定。使用生物射弹转化法将这些构建体转化进入植物组织，如美国专利申请No.2011/0191899的实施例7所述，本申请通过提述并入其全部内容。通过除草剂膦丝菌素选择对推定的转化胚进行鉴定。

使用破坏测定对假定鉴定的转基因胚进行分析，以鉴定包含有***于靶基因组座位内的供体DNA多核苷酸的事件。该ZFN破坏测定使用上述方案和试剂实施。在没有被靶定或破坏的事件中，观察到的靶对参照的比值范围是0.4-0.6；而对于被破坏或者被靶定的样品，报告的范围是0.2-0.35(板与板之间有差异)(图6)。没有产生扩增子的靶向事件导致较低量的扩增产物，如图所示。

接着，使用如上所述的方案和试剂实施了基因座特异性内-外PCR。内- 外PCR的结果鉴定了在DAS-59132基因座中含有转基因***的特异事件。

总共提交了1,223个样品事件用于分析。对每个事件均完成了破坏测定，并鉴定了85个显示破坏的事件。对所有1,223个样品事件实施内-外PCR，并鉴定了11个阳性事件和2个部分阳性事件。实施Southern印迹和测序，以确认鉴定出的事件在DAS-59132基因组座位中包含全转基因***。

实施例3.玉米植物中被靶定的基因座的分析

产生了玉米转基因B104胚，其中通过锌指核酸酶和供体构建体靶定了工程化的着陆垫(landing pad)基因座(美国专利申请No.2011/0191899，本申请通过提述并入其全部内容)，锌指核酸酶和供体构建体是用生物射弹转化进入植物组织的。完成了多次转化以将供体构建体靶向到工程化的着陆垫基因座内。第一系列的转化用pDAB109714供体构建体和pDAB105941锌指核酸酶构建体完成。第二系列的转化用pDAB109715供体构建体和pDAB105943锌指核酸酶构建体完成。第三系列的转化用pDAB109716供体构建体和pDAB105942锌指核酸酶构建体完成。最后一个系列的转化用 pDAB109717供体构建体和pDAB105945锌指核酸酶构建体完成。通过除草剂膦丝菌素选择鉴定出推定的转化胚。

ELP基因座破坏测定：设计用以扩增含有ZFN识别位点的内源靶区域的引物，并建立样品进行qPCR分析。完整区域的扩增(其指示非靶向事件) 产生了一个193个碱基对的扩增子，作为一个可检测的qPCR信号测得。各个ELP事件内供体分子的成功靶向整合导致该可检测qPCR信号破坏，并显示与对照相比较低的总体信号。

ELP基因座破坏测定用实时PCR实施，实时PCR使用

480***(Roche Applied Science,Indianapolis,IN)。使用

探针设计软件2.0设计测定法，使之监视ELP基因座处的 ELP ZFN结合序列，和内参基因IVF。为了扩增，在含有0.4μM每种引物和0.2μM每种探针(表3)的10μL多重反应体积中以1X终浓度制备

480探针主预混物(Roche Applied Science,Indianapolis, IN)。实施2步扩增反应，在55℃延伸30秒，并进行荧光采集。利用靶对参照的比值实施对破坏测定的分析。

表3:用于ELP基因座破坏测定的引物和探针序列.ELP1和ELP2反应用IVF 引物和探针多重化，后两者的序列如表1所示。

用破坏测定对从精确转化产生的1738个事件进行筛选，并根据靶对参照信号相比的显著降低将其评分为“破坏”。结果表明，1738个测定事件中有158个在ELP基因座具有破坏信号，指示靶向基因***(图7)。尽管破坏测定提供了被破坏基因座的定量测量，但是这个测定无法将靶向***和剪切位点处由于易错修复造成的突变解析开来。因此，开发了一个次级内-外PCR 测定用于对事件进行平行筛选，以确保对所有事件的鲁棒而精确的评估。

ELP基因座内-外PCR测定：对通过破坏测定筛选的事件，还通过新开发的ELP基因座处的基因座特异性终点PCR测定进行了筛选。一个引物被设计成与靶基因组DNA中ZFN剪切位点外部的区域退火，第二个引物被设计成仅与供体DNA的转基因区域退火。引物被设计成分析ELP基因座处靶位点的5’和3’区域。因为引物被设计成仅扩增***在靶区域内的供体DNA 和基因组DNA的区域，所以扩增是靶向转基因事件的结果，5’和3’接点均被分析。

内-外PCR扩增反应使用TAKARA EX TAQ HS kit^TM(Clontech Laboratories,Inc.,Mountain View,CA)实施。每个PCR反应以15或20μL终体积实施，含有1x Ex Taq缓冲液,200nM正向和反向引物,10-20ng基因组 DNA模板,和终浓度为0.05单位/μL的Ex Taq HS聚合酶。对于实时内-外 PCR，在PCR反应混合物中含有终浓度为4μM或2.67μM的

染料(Invitrogen,Grand Island,NY)。

实时内-外PCR在ABI VIIA7PCR SYSTEM^TM(Life Technologies Corporation,Carlsbad,CA)上实施。最初变性之后，扩增程序包含40个98℃ 10秒,66℃ 30秒和68℃ 2分钟的循环，并进行荧光获取，随后实施熔解温度分析程序。在此之后，将反应在65℃保持30秒，在72℃保持10min，并最终保持在4℃。使用直接荧光信号和熔解温度谱二者进行样品分析。对实时***上鉴定的阳性样品，进一步用标准凝胶迁移测定进行确认。

表4:用于ELP基因座内-外测定的引物和探针序列.

为了试图区分PCR扩增子与假阳性，设计了一个方案为所产生的每个 PCR产物分配一个标识谱。将PCR扩增子的熔解温度谱与阳性对照进行比较，匹配的曲线可鉴定阳性的内-外PCR产物。这种使用包含3’和5’端二者的熔解温度谱的标识谱来关联内-外PCR分析的分析方法在鉴定靶向转基因***事件时可产生更大的确信度。

总共提交了1738个PAT阳性样品用于本项目。对所有事件进行了破坏测定和内-外PCR。结果表明，158/1738个事件对破坏呈阳性，46/1738个事件对3’和5’内-外PCR扩增反应均呈阳性。

实施例4.玉米植物中被靶定的基因座的分析

如美国专利申请No.2011/0191899先前所述地那样用一种工程化着陆垫基因构建体(pDAB105817或pDAB105818)转化玉米栽培种B104植株。获得了被转化的玉米植株并确认它们含有ELP。将4个ELP玉米品系 105817[1]-015.Sx001.Sx011,105818[1]-269.Sx001.Sx008, 105818[1]-271.Sx001.Sx005,和105818[2]-388.Sx001.Sx008与玉米栽培种 B104杂交以产生半合子。对于所得的后代植物，用编码eZFN1的eZFN质粒pDAB105941和相应的供体质粒pDAB104182、或者编码eZFN8的eZFN pDAB105948和供体pDAB104183进行共转染。转化通过使用PDS-1000 (Bio-Rad)按照制造商的使用说明对分离的胚胎射击一次来实现。总共轰击了 20,896个胚(每个靶品系大约5000个胚)，并选择双丙氨膦抗性：12,404个用 pDAB105941和其对应的供体进行共轰击，8,492个胚用pDAB105948和其对应的供体进行共轰击。

轰击之后，将胚培养在培养基中并使之生长成小植株。通过一种qPCR 鉴定转基因事件，该qPCR被开发用于筛选和检测pat转基因的存在。拷贝数的确定是通过比较未知样品的靶/参照(转化酶)数值(由LightCycler 480^TM输出)和已知拷贝数标准的靶/参照数值(1拷贝：半合子；2拷贝：纯合子)。总共614个再生植株存活，其中354个(或者58％)植株被鉴定为对pat基因的存在呈阳性，并保留用于进一步的分析。

ELP基因座破坏测定：设计了一个ZFN破坏测定用于监视整合ELP的变化。在非靶向ELP中，PCR引物MAS621和MAS622(表5)扩增出了包含 eZFN结合位点的214bp产物。在使用低延伸时间的qPCR时，ELP基因座处的eZFN结合位点中的整合(或修饰)会使扩增中断，导致qPCR反应不产生信号或者所产生的信号显著降低。还包括了一个扩增转化酶基因的对照qPCR反应作为内部控制参照。

为了扩增，在含有0.4μM每种引物和0.2μM每种探针的10μL多重反应体积中以1X终浓度制备

480探针主预混物(Roche Applied Science,Indianapolis,IN)。实施3步扩增反应，在95℃变性10秒，在60℃退火35秒，和在72℃进行荧光采集1秒。FAM荧光部分在465/510nm光密度下被激发，HEX则在533/580nm被激发。通过比较未知样品的靶/参照 (转化酶)数值(由LightCycler 480^TM输出)和已知单拷贝半合子的靶/参照数值来确定拷贝数。

为了区分随机***事件与ELP靶向事件，将354个通过pat qPCR筛选鉴定的样品进一步用破坏测定进行分析。该ELP破坏测定被设计为监视 eZFN剪切位点处的大***/缺失。在非靶向ELP中会扩增出包含eZFN结合位点的一个214bp的PCR产物，并产生强荧光信号。而eZFN结合位点中的整合(或修饰)会使扩增中断，导致qPCR反应不产生信号或者所产生的荧光信号显著降低。在354个pat阳性事件中，大约8％(28个事件)似乎被破坏(图8b)，提示潜在的靶定。

表5:用于破坏测定的引物和探针

内-外PCR：破坏测定鉴定了ELP上eZFN结合区内的变化。基因座中引物结合位点或随机***中的任何变异均可能指示由于ZFN剪切造成的基因座破坏。接着，使用内-外PCR对ELP基因座内供体***的存在进行验证。接点序列的两个末端均包含靶基因座和供体。一个引物被设计成与仅存在于靶品系中的一个预整合的ELP区退火，第二个引物被设计成只与仅存在于供体构建体内的供体DNA序列退火。通过PCR扩增指示了供体靶定到ELP 基因组座位内的结果。任何由随机***产生的事件都不会产生PCR扩增。

对于供体/ELP 5’接点内-外PCR，正向引物被设计成结合供体***物的 OsAct1区(5OsF3,SEQ ID NO:23ATTTCACTTTGGGCCACCTT)，而反向引物(5R3,SEQ ID NO:24AGGCTCCGTTTAAACTTGCTG)被设计成结合ELP 左臂内的靶品系特有的193bp序列。对于3’供体/ELP基因座接点内-外PCR，正向引物(3PAF1,SEQ ID NO:25ATGGTGGATGGCATGATGTT)被设计成结合供体***物的PATv6区，而反向引物(3R1,SEQ ID NO:26TGGAGGTTGACCATGCTAGG)被设计成结合ELP右臂内靶品系特有的192 bp序列。只有当正向和反向引物均结合到彼此非常靠近的序列时，才会产生扩增。供体序列的随机整合在使用上述PCR引物时不会被检测到。为了提高内-外PCR检测的通量，用绿色荧光核酸染料

完成熔解曲线分析。PCR扩增在LightCycler 480^TM实时PCR***上实施，使用15μl反应，其含有0.75单位的TaKaRa Ex Taq^TM DNA聚合酶(Takara Bio Inc.,Shiga,Japan),200nM dNTP,200nM每种正向和反向引物,2.67μM

和10 ng基因组DNA。扩增首先是95℃ 2分钟变性周期，然后30个98℃ 20秒、 60℃ 30秒和68℃ 90秒的循环，随后在97℃以0.11℃/s的变温速度进行熔解曲线分析。

PCR反应的结果导致对5’和3’侧翼末端二者的分析。供体靶向ELP事件在5’内-外PCR反应中产生一个1.1kb的片段，在3’内-外PCR反应中产生一个1.4kb片段。通过熔解曲线分析对PCR反应的结果进行确定，其根据扩增子的长度和组成产生不同的图形结果(图9)。短PCR扩增子通常显示单峰熔解温度(Tm)曲线，在图形显示时它显示为一个平线(flatline)并产生低水平的荧光信号。但是对于长扩增子(即，1-2kb的片段)，Tm谱似乎更加复杂，并产生多个峰(取决于扩增子的局部子序列)和产生高水平的荧光信号。有5个事件被鉴定同时对5’和3’PCR反应均呈阳性。4个靶品系均各自产生了在ELP基因组座位内***有供体的事件。对所有内-外PCR阳性物在凝胶上跑胶，结果与预期相同，它们仅显示一个PCR扩增子条带。

分子确认：实施了其他的分子检测方法以确认破坏测定和内-外PCR反应的结果不是假阳性。对5’和3’供体***物/ELP基因组座位接点进行了 Southern印迹分析和测序。结果证实，通过破坏测定和内-外PCR分析鉴定出的事件在ELP基因组座位内含有供体***物。

实施例5.玉米植物中被破坏基因座的分析

通过如美国专利公开No.20110191877先前所公开的植物杂交策略，将 ZFN引入到靶品系植物的基因组座位内。在玉米栽培种B104中分别产生了靶植物事件和切除子(excisor)植物事件。通过用构建体pDAB105816, pDAB105817,pDAB105818,pDAB105820,和pDAB105821转化产生了5个靶植物品系。这些构建体含有堆叠的转基因、aad-1可选择标志物基因、和含有eZF1和eZF8结合位点的ELP。接着，通过用构建体pDAB105828和 pDAB105825转化产生了2个切除子植物系。pDAB105828构建体含有被玉米泛素1启动子驱动的ZFN8，并以玉米Per53’UTR为终止。pDAB105825 构建体含有被玉米泛素1启动子驱动的ZFN1，并以玉米Per53’UTR为终止。两个切除子构建体还都含有pat可选择标志物。产生了转基因植物并通过分子确认测定加以确认。使植物自交以产生纯合后代。将所得纯合靶事件和切除子事件杂交以产生后代。对后代进行测定，以确定由亲本切除子事件提供的ZFN转基因是否会剪切由另一个亲本靶事件提供的ELP靶基因座。所有杂交的大部分以靶品系为母本，以切除子品系为父本。只有一个对照杂交以切除子品系为母本，以靶品系为父本。将靶植物和切除子植物杂交以产生后代，并通过在V3发育阶段施加Assure II^TM(喹禾灵)(184g ae/ha+1％COC)和Ignite^TM 280SL(草铵膦)(480gae/ha)对后代进行筛选。选择任何存活的后代用于进一步的分子分析，分子分析包括通过qPCR方法详细筛选 aad-1转基因的存在。使用qPCR测定以转化酶为参照基因对总共1902个样品进行了基因分型，考察aad-1基因座的存在。计算aad-1靶对参照的比值，并对已知的标准进行标准化，其中2、1或0的比值分别指示纯合、半合或空状态。1822个植物被确认为aad-1半合。

ZFN破坏测定：设计基于PCR的破坏测定用于间接测量ELP靶基因组座位的ZFN剪切活性。该测定的设计是使得荧光标记的探针位于ZFN功能完整性所需的间隔序列的顶部(图10)。eZFN1破坏测定的结果是检测到一个覆盖整个eZFN1结合位点序列的69bp片段。eZFN8破坏测定的结果是检测到一个位于eZFN8结合位点序列侧翼的109bp片段。这两个测定均使用由Life Technologies(Grand Island,NY)合成的MGB探针。当ZFN剪切ELP 基因组座位时，该剪切通过NHEJ被修复，导致基因组序列内纳入InDel，藉此对已被用于设计PCR引物的基因组序列进行修饰。结果，任何被设计为扩增和检测ELP基因组座位内的ZFN结合序列上的扩增子的PCR扩增反应均不会产生荧光信号(因为基因组序列将被删除或重排，因此引物不能结合这些基因组序列)。

用实时或qPCR使用

480***(Roche Applied Science,Indianapolis,IN)实施二重(Bi-plex)测定。实施对照反应，以转化酶为内源参照基因。为了扩增，在含有0.4μM每种引物和0.2μM每种探针(表6)的10μL 体积多重反应中以1X终浓度制备

480探针主预混物 (Roche Applied Science,Indianapolis,IN)。实施3步扩增反应，开始在95℃ 10 秒进行变性，在60℃ 35秒进行退火，和在72℃ 1秒进行荧光采集。破坏测定的分析使用靶对参照的比值实施，并相对于已知的纯合子进行标准化。 PCR测定的结果如图11所示。

表6:用于qPCR检测的引物.

为了确定ELP基因组座位的eZFN剪切率(cutting rate)，首先对植物杂交产生的F1叶样品分析接合性，然后用检测完整eZFN结合位点的qPCR 来测试其ELP破坏。如果ELP基因组座位在eZF结合位点上的DSB修复过程中招致了InDel，则qPCR测定中的可检测信号将丧失或降低。将标准化的ELP比值与它们的姊妹品系进行比较。如果比值为0-0.05，则认为它们已被ZFN剪切(经过不完美的修复)；如果比值为0.05-0.4，则将它们标记为“嵌合的”，表明不是ELP的所有拷贝均已被ZFN剪切；如果比值超过0.4，则它们被鉴定为未被ZFN剪切(也可能被剪切但经过完美的修复)。综合考虑剪切和嵌合评分，用破坏测定检测到的eZFN1活性为46.6％(1125个植物事件中的524个)，eZFN8活性为70.2％(697个植物事件中的489个)(表7)。Tukey Kramer检验显示，不同杂交之间的剪切频率存在显著差异。L2BG和切除子品系的组合被证明对于成功的剪切是至关重要的(p<0.0001)。

表7:5个ELP靶品系和切除子品系(excisor line)后代中的ZFN剪切活性

杂交	总计	切割	嵌合	无切割	切割率
						pDAB105821.1.295.1::pDAB105828.1.40.1	49	35	0	14	71.4％
pDAB105821.1.295.1::pDAB105828.1.35.1	3	2	0	1	66.7％
						pDAB105821.1.295.1::pDAB105825.1.91.1	7	3	2	2	71.4％

pDAB105821.1.295.1::pDAB105825.1.87.1	25	13	4	8	68.0％
						pDAB105821.1.295.1::pDAB105825.1.12.1	19	8	4	7	63.2％
pDAB105821.1.264.1::pDAB105828.1.40.1	70	63	0	7	90.0％
						pDAB105821.1.264.1::pDAB105828.1.35.1	37	30	0	7	81.1％
pDAB105821.1.264.1::pDAB105825.1.87.1	15	3	1	11	26.7％
						pDAB105821.1.264.1::pDAB105825.1.12.1	20	17	2	1	95.0％
pDAB105820.1.199.1::pDAB105828.1.35.1	77	55	0	22	71.4％
						pDAB105820.1.199.1::pDAB105825.1.91.1	21	16	2	3	85.7％
pDAB105820.1.199.1::pDAB105825.1.87.1	9	2	1	6	33.3％
						pDAB105828.1.40.1::pDAB105820.1.199.1	41	30	0	11	73.2％
pDAB105820.1.140.1::pDAB105828.1.40.1	16	15	0	1	93.8％
						pDAB105820.1.140.1::pDAB105828.1.35.1	25	8	0	17	32.0％
pDAB105820.1.140.1::pDAB105825.1.91.1	15	15	0	0	100.0％
						pDAB105820.1.140.1::pDAB105825.1.87.1	104	15	3	86	17.3％
pDAB105820.1.140.1::pDAB105825.1.12.1	44	5	3	36	18.2％
						pDAB105818.2.388.1::pDAB105828.1.40.1	58	52	0	6	89.7％
pDAB105818.2.388.1::pDAB105828.1.35.1	18	10	0	8	55.6％
						pDAB105818.2.388.1::pDAB105825.1.91.1	176	110	7	59	66.5％
pDAB105818.2.388.1::pDAB105825.1.87.1	19	5	3	11	42.1％
						pDAB105818.2.388.1::pDAB105825.1.12.1	2	2	0	0	100.0％
pDAB105818.1.269.1::pDAB105828.1.40.1	18	14	0	4	77.8％
						pDAB105818.1.269.1::pDAB105828.1.35.1	35	23	0	12	65.7％
pDAB105818.1.269.1::pDAB105825.1.91.1	152	29	13	110	27.6％
						pDAB105818.1.269.1::pDAB105825.1.87.1	98	21	14	63	35.7％
pDAB105818.1.269.1::pDAB105825.1.12.1	30	14	11	5	83.3％
						pDAB105817.1.81.1::pDAB105828.1.35.1	59	36	0	23	61.0％
pDAB105817.1.81.1::pDAB105825.1.91.1	24	0	0	24	0.0％
						pDAB105817.1.81.1::pDAB105825.1.87.1	97	17	8	72	25.8％
pDAB105817.1.81.1::pDAB105825.1.12.1	42	36	5	1	97.6％
						pDAB105817.1.6.1::pDAB105828.1.40.1	20	17	0	3	85.0％

pDAB105817.1.6.1::pDAB105828.1.35.1	15	3	0	12	20.0％
						pDAB105817.1.6.1::pDAB105825.1.91.1	52	49	1	2	96.2％
pDAB105816.2.496.1::pDAB105828.1.40.1	29	27	1	1	96.6％
						pDAB105816.2.496.1::pDAB105828.1.35.1	27	13	0	14	48.1％
pDAB105816.2.496.1::pDAB105825.1.91.1	7	2	1	4	42.9％
						pDAB105816.2.496.1::pDAB105825.1.87.1	16	5	0	11	31.3％
pDAB105816.2.496.1::pDAB105825.1.12.1	10	10	0	0	100.0％
						pDAB105816.2.447.1::pDAB105828.1.40.1	13	7	0	6	53.8％
pDAB105816.2.447.1::pDAB105828.1.35.1	61	39	0	22	63.9％
						pDAB105816.2.447.1::pDAB105825.1.87.1	82	12	5	65	20.7％
pDAB105821.1.309.1::pDAB105828.1.35.1	26	9	0	17	34.6％
						pDAB105821.1.309.1::pDAB105825.1.91.1	21	8	4	9	57.1％
pDAB105821.1.309.1::pDAB105825.1.87.1	10	4	1	5	50.0％
						pDAB105821.1.309.1::pDAB105825.1.12.1	8	8	0	0	100.0％

ZFN剪切的序列分析：为了确认基于qPCR的ELP破坏数据，选择后代杂交的代表性样品和2个以亲本靶品系为代表的阴性对照用于NGS扩增子深度测序。将高质量的读段与ELP构建体的参考序列进行比对，并鉴定了***和/或缺失(InDel)。正如预期，与参考序列相比，两个亲本系在ZFN剪切位点具有非常小百分比(<0.1％)的InDel，这最可能是由于PCR扩增和/或测序错误(图12)。qPCR和测序数据之间存在关联性。测序发现，4个基于 qPCR数据显示100％剪切效率的杂交具有91％或更高的经修饰ELP。总之， NGS深度扩增子测序数据与qPCR数据一致，并证明了该破坏测定方法是高度灵敏的。此外，ELP破坏测定还被证明是一种有效的用于评估植物中ZFN (或任何其它位点特异性核酸酶)的剪切活性的测定法。

尽管在某些实施方案中已经描述了本发明的多个方面，但是这些方面在本公开的精神和范围内可以进一步修改。因此，本申请意图涵盖使用其一般原理对本发明实施方案的改变、使用或修改。进一步，本申请意图涵盖对本公开的背离，只要这样的背离属于这些实施方案所涉及的领域的已知或者惯常实践，且落入所附权利要求的范围之内。

Claims

1.一种用于在通过位点特异性核酸酶介导的基因靶定所产生的转基因植物事件中鉴定***在被靶定的基因组座位内的外源供体DNA多核苷酸之存在的方法，包括：

a.在第一扩增反应中使用第一群寡核苷酸来扩增包含被靶定的植物基因组座位的基因组DNA样品，该群寡核苷酸在杂交条件下结合于该被靶定的基因组座位的近邻，藉此产生包含该被靶定的基因组座位的第一扩增子；

b.检测所述第一扩增子的存在或不存在，其中不存在该第一扩增子表明在该被靶定的基因组座位内存在所述供体DNA多核苷酸；

c.在第二扩增反应中使用第二群寡核苷酸来扩增所述基因组DNA样品，该群寡核苷酸在杂交条件下结合于所述被靶定的基因组座位的近邻和所述供体DNA多核苷酸的内部，藉此产生包含所述被靶定的基因组座位的至少一部分及所述供体DNA多核苷酸的至少一部分的第二扩增子；和

d.检测所述第二扩增子的存在或不存在，其中存在该第二扩增子表明在所述被靶定的基因组座位内存在所述供体DNA多核苷酸。

2.权利要求1的方法，该方法还包括：

a.定量所述第一扩增反应的结果；

b.定量所述第二扩增反应的结果；

c.对所述第一扩增反应和第二扩增反应的结果进行比较；和

d.确定所述被靶定的基因组座位内所述供体DNA多核苷酸的存在或不存在，其中如果不存在所述第一扩增子而存在所述第二扩增子，则确认该供体DNA多核苷酸***在该被靶定的基因组座位内。

3.权利要求2的方法，该方法进一步包括多重反应，其中所述第一扩增反应和第二扩增反应在单一试管或孔内运行。

4.权利要求2的方法，其中对所述第一扩增反应和第二扩增反应结果的定量包括为所述第一扩增反应和第二扩增反应之一或二者产生标识谱。

5.权利要求4的方法，其中该标识谱选自下组：熔解温度曲线标识谱和荧光标识谱。

6.权利要求4的方法，其中该标识谱是从插层性DNA染料产生的。

7.权利要求6的方法，其中所述插层性DNA染料包括花青染料。

8.权利要求7的方法，其中所述花青染料以小于4μM的浓度在扩增反应中使用。

9.权利要求7的方法，其中所述花青染料以小于2.7μM的浓度在扩增反应中使用。

10.权利要求4的方法，其中所述标识谱是从荧光染料产生的。

11.权利要求1的方法，该方法还包括：

a.选择在所述被靶定的基因组座位内包含所述供体DNA多核苷酸的转基因事件。

12.权利要求1的方法，其中所述基因组座位被位点特异性核酸酶切割。

13.权利要求12的方法，其中该核酸酶包括锌指核酸酶。

14.权利要求12的方法，其中该核酸酶包括TALEN或CRISPR核酸酶。

15.权利要求1的方法，其中所述扩增包括在聚合酶链式反应中扩增。

16.权利要求1的方法，其中所述第二扩增子包含所述供体DNA多核苷酸与所述被靶定的基因组座位的5’接点。

17.权利要求1的方法，其中所述第二扩增子包含所述供体DNA多核苷酸与所述被靶定的基因组座位的3’接点。

18.权利要求1的方法，其中所述供体DNA多核苷酸包括至少一个基因表达盒。

19.权利要求1的方法，其中所述第一群寡核苷酸或/和第二群寡核苷酸包含荧光染料。

20.权利要求19的方法，其中该荧光染料选自下组：HEX荧光染料，FAM荧光染料，JOE荧光染料，TET荧光染料，Cy 3荧光染料，Cy 3.5荧光染料，Cy 5荧光染料，Cy 5.5荧光染料，Cy7荧光染料，和ROX荧光染料。

21.一种用于鉴定通过位点特异性核酸酶介导的基因靶定导致的植物基因组座位的破坏的方法，包括：

a.在第一扩增反应中使用多个寡核苷酸来扩增包含被破坏的基因组座位的基因组DNA样品，所述多个寡核苷酸在杂交条件下结合于所述被破坏的基因组座位的近邻，藉此产生包含该被破坏的基因组座位的第一扩增子；和

b.检测该第一扩增子的存在或不存在，其中不存在该扩增子指示基因组座位的破坏。

22.权利要求21的方法，该方法还包括：

a.鉴定被破坏的基因组座位内供体***的存在；和

b.选择在被破坏的基因组座位内包含供体***的转基因事件。

23.权利要求21的方法，其中所述基因组座位被位点特异性核酸酶切割。

24.权利要求23的方法，其中该核酸酶包括锌指核酸酶。

25.权利要求23的方法，其中该核酸酶包括TALEN或CRISPR核酸酶。

26.权利要求21的方法，其中该扩增包括在聚合酶链式反应中扩增。

27.权利要求22的方法，其中该供体DNA多核苷酸包含至少一个基因表达盒。

28.权利要求21的方法，其中该多个寡核苷酸或者两者包含荧光染料。

29.权利要求28的方法，其中该荧光染料选自下组：HEX荧光染料，FAM荧光染料，JOE荧光染料，TET荧光染料，Cy 3荧光染料，Cy 3.5荧光染料，Cy 5荧光染料，Cy 5.5荧光染料，Cy7荧光染料，和ROX荧光染料。

30.一种用于从多个植物细胞中鉴定通过位点特异性核酸酶介导的基因靶定导致的基因组座位的破坏的方法，所述方法包括：

a.在第一扩增反应中使用多个寡核苷酸来扩增包含被破坏的基因组座位的基因组DNA样品，所述多个寡核苷酸在杂交条件下结合于被破坏的基因组座位的近邻，藉此产生包含该被破坏的基因组座位的第一扩增子；

b.对所述第一扩增反应的结果定量；

c.在第二扩增反应中使用多个寡核苷酸来扩增包含该被破坏的基因组座位的基因组DNA样品，所述多个寡核苷酸在杂交条件下结合于该被破坏的基因组座位的近邻，藉此产生包含该被破坏的基因组座位的第二扩增子；

d.对所述第二扩增反应的结果定量；和

e.比较所述第一扩增反应和第二扩增反应的量，其中该第一扩增反应的量与该第二扩增反应相比含有较低量的扩增产物，从而表明该第一扩增子样品中的基因组座位的破坏。

31.权利要求30的方法，其中对所述第一扩增反应和第二扩增反应的结果定量包括为所述第一扩增反应和第二扩增反应之一或二者产生标识谱。

32.权利要求31的方法，其中所述标识谱选自下组：熔解温度曲线标识谱和荧光标识谱。

33.权利要求32的方法，其中该标识谱是从插层性DNA染料产生的。

34.权利要求33的方法，其中该插层性DNA染料包括花青染料。

35.权利要求34的方法，其中该花青染料以小于4μM的浓度在扩增反应中使用。

36.权利要求34的方法，其中该花青染料以小于2.7μM的浓度在扩增反应中使用。

37.权利要求31的方法，其中该标识谱是从荧光染料产生的。

38.权利要求30的方法，该方法还包括：

a.鉴定被靶定的基因组座位内供体***的存在；和

b.选择在被靶定的基因组座位内包含供体***的转基因事件。

39.权利要求30的方法，其中所述基因组座位被位点特异性核酸酶切割。

40.权利要求39的方法，其中所述核酸酶包括锌指核酸酶。

41.权利要求39的方法，其中所述核酸酶包括TALEN或CRISPR核酸酶。

42.权利要求39的方法，其中所述扩增包括在聚合酶链式反应中扩增。

43.权利要求38的方法，其中所述供体DNA多核苷酸包含至少一个基因表达盒。

44.权利要求38的方法，其中所述多个寡核苷酸包含荧光染料。

45.权利要求44的方法，其中所述荧光染料选自下组：HEX荧光染料，FAM荧光染料，JOE荧光染料，TET荧光染料，Cy 3荧光染料，Cy 3.5荧光染料，Cy 5荧光染料，Cy 5.5荧光染料，Cy 7荧光染料，和ROX荧光染料。