CN1995384A

CN1995384A - 一种快速方便转基因***位点鉴定技术

Info

Publication number: CN1995384A
Application number: CN 200610023132
Authority: CN
Inventors: 王铸钢
Original assignee: Individual
Current assignee: Individual
Priority date: 2006-01-06
Filing date: 2006-01-06
Publication date: 2007-07-11

Abstract

本发明公开了一种确定转基因***位点的方法，其特点为通过限制性内切酶消化，接头连接和PCR等简单易行的步骤获得位于载体与接头之间的基因组DNA序列而确定转基因***位点。本发明的方法可用于确定外源基因整合位点及附近的基因组序列以及进行转基因表达与表型的因果关系分析等。

Description

一种快速方便转基因***位点鉴定技术

技术领域

本发明涉及生物技术领域，更具体地，本发明涉及一种转基因***位点鉴定方法。

背景技术

转基因技术自上世纪80年代出现以来，迅速在建立人类疾病的动物模型、基因功能的在体研究、基因工程育种、以及畜牧业生产、生物制药等方面获得了广泛应用。特别是人类基因组计划及众多模式生物基因组测序计划完成后，基因功能的研究即功能基因组学研究成为目前乃至本世纪医学和整个生命科学研究面临的最大机遇和挑战，转基因动物模型已成为在生物活体内***研究基因功能、转录表达调控、胚胎发育、人类疾病发病机制及筛选新药或新疗法最重要的技术手段之一，是功能基因组学研究不可或缺的技术支撑。

然而，小鼠转基因技术也存在巨大缺陷：转基因以近乎随机的方式整合在基因组中，转基因整合可能导致三种结果，一是转基因高表达，二是转基因受附近基因组结构和序列的影响而不表达或低表达，三是整合位点处的内源基因或其它功能元件被破坏导致功能缺失(据Palmiter对153个转基因小鼠系的统计，约7％的转基因小鼠系出现了***突变引起的肢体异常或纯合胚胎致死，估计未出现外观表型的***突变更为常见)。这些因素给基因功能研究、动物模型应用等造成极大干扰。

在转基因动物技术建立后的短短六年，全世界就产生了数千个转基因小鼠系。目前，估计世界上已产生转基因小鼠系数万个，仅新建的上海南方模式生物研究中心2002年就生产了二百余个转基因小鼠系。这是遗传学、医学、功能基因组学、乃至整个生命科学研究的巨大资源宝库。但是由于长期以来一直缺乏经济快速鉴定整合位点的方法，对这一宝贵资源的开发还十分有限。如果能精确确定转基因的整合位点及附近的基因组序列，建立相应的转基因整合位点数据库，将会对全基因组水平的基因表达调控机制研究、转基因表达与动物表型的因果关系分析、运用转基因动物模型进行药物开发和疾病治疗研究以及对因转基因整合导致失活的内源基因功能研究等方面产生巨大影响。

研究人员在转基因动物出现以后很快就对转基因整合位点予以了充分关注，各国研究人员对原核注射产生的转基因动物中转基因整合的拷贝数、转基因的串联方式、转基因与整合位点旁侧的基因组序列的关系进行了大量的研究，取得了一定成果。结果表明，绝大多数情况下转基因是多拷贝整合的，有时甚至高达数百拷贝；转基因主要以头尾(head-to-tail)相连的方式整合在基因组内的单一位点，仅在少数情况下，可出现多位点整合、转基因内部缺失或重排，偶尔会导致基因组序列重复、缺失和染色体易位等。然而这些研究未能建立经济快速鉴定转基因整合位点的方法并推广应用。尽管运用个体基因组文库筛选法、质粒回收法、反式PCR(inverse PCR)等获得了少量的转基因/基因组整合位点处的序列，但由于费时费力，或转基因多拷贝整合的特点，中间的拷贝会与末尾的拷贝竞争PCR，及整合后转基因序列变化的影响，给获得转基因/基因组整合位点处的序列造成很大困难。而且，当时基因组计划尚未实施，确定转基因的定位和被破坏的内源基因是十分烦琐也是十分困难的。这些限制致使相关研究在近几年几乎处于停滞状态。目前，国际上小鼠基因组测序计划已基本完成，使转基因整合位点的常规鉴定成为可能，现在唯一需要的是建立获得转基因/基因组结合处序列的简单方法，就可以建立相应数据库，充分开发转基因动物资源。

综上所述，本领域迫切需要开发一种快速方便鉴定转基因***位点的方法。

发明内容

本发明的目的是提供一种确定转基因***位点的方法。所述方法可操作性强，不受转基因多拷贝串联整合及转基因后序列发生变化的影响。

在本发明的第一方面，提供了一种确定转基因***位点的方法，包括步骤：

(a)对于待确定转基因***位点的基因组DNA，用限制性内切酶进行消化，从而获得消化后的基因组片段，然后在消化后的基因组片段两端连接接头，从而形成在两端带有接头的基因组片段；

(b)以载体序列特异性引物和接头序列特异性引物，对步骤(a)中两端带有接头的基因组片段进行PCR扩增，从而获得PCR产物，其中所述的PCR产物对应于位于载体与接头之间的基因组DNA序列；

(c)对步骤(b)中的PCR产物进行测序；

(d)根据步骤(c)的测序结果，确定转基因的***位点。

在另一优选例中，步骤(a)中所述的限制性内切酶选自下组：

(i).将基因组DNA切割为平均长度小于1kb片段的一种限制性内切酶；

(ii).数种限制性内切酶的混合物，其中所述的数种(2-10种)限制性内切酶是产生相同粘性末端的限制性内切酶，并且所述的混合物将基因组DNA切割为平均长度小于1kb片段；

(iii)数种限制性内切酶的混合物，其中所述的数种(2-10种)限制性内切酶是产生相同平头末端的限制性内切酶，并且所述的混合物将基因组DNA切割为平均长度小于1kb片段；

附加条件是，如果若选用的第一限制性内切酶E1可以切割载体序列，在步骤(b)与(c)之间加步骤(b′)：即在添加接头之后，用可切断位于两个E1间载体头尾相连部的第二限制性内切酶E2消化已加接头的连接产物。

在另一优选例中，所述的限制性内切酶选自下组：

●单一的在基因组中切割位点分布较多的Sau3AI、MspI、NdeII、AccII、AluI、HphI、MboII等识别位点序列为4个或5个碱基的限制性内切酶；

●切割后产生相同粘性末端的数种同尾酶的组合：如BamHI、BglII、BclI、MboI、XhoII联合酶切；NheI、XbaI、SpeI、AvrII的联合酶切；

●产生平末端的限制性内切酶的组合：如EcoRV、NruI、PmacI、XmnI、PshAI、BstZ17I、SmaI、SspI、PvuII等产生平末端的酶的组合。

在另一优选例中，所述的第二限制性内切酶E2的具有以下特征：

●是与第一限制性内切酶不同的限制性内切酶，

●可以切断两个E1间载体头尾相连部的限制性内切酶，

●不切割两个E1间载体/基因组接合部的载体序列。

在另一优选例中，E2可以选自PvuII、KpnI、BamHI、EcoRI、BglII等常用的限制性内切酶。

在另一优选例中，所用的限制性内切酶E2是PvuII和KpnI。

在另一优选例中，所述的接头具有以下特征：

a.接头是由两条单链DNA退火而成，退火后接头双链端形成能与方法1或2所用的限制性内切酶切割后产生的末端匹配的末端结构(如果酶切后产生粘性末端，接头双链端5′突出可与之形成碱基配对而退火，如果是平末端，则接头接头双链端也为平末端)；

b.接头中两条单链DNA长度不同，一条较长，其长度范围为40bp-100bp，在其单链区可以作为两条巢式引物的模板；而另一条较短，其长度范围为6-20bp，其5′端碱基磷酸化，3′端碱基氨基化；

c.接头序列单链区不能与限制性内切酶消化后转基因载体/基因组结合部的载体序列区任何一段序列相同。

在另一优选例中，所述的载体序列特异性引物具有以下特征：

●引物序列的选择以限制性内切酶消化后转基因载体/基因组结合部的载体序列为模板，

●引物序列可以与接头序列特异性引物配对用于PCR反应。

在另一优选例中，所述基因组DNA是哺乳动物的基因组DNA、或植物细胞的基因组DNA。

更佳地，所述的基因组DNA来自羊、牛、小鼠、大鼠、兔子、狗、猴的基因组。

在另一优选例中，在步骤(d)中，还包括：

(1)根据测序结果，确定转基因片段***后基因组结构有无变化(如缺失或重排)；或者

(2)进行转基因表达与表型的因果关系分析；或者

(3)进行转基因基因型的鉴定。

在另一优选例中，所述的转基因基因型鉴定包括步骤：

以转基因的基因组DNA为模板，用第一、第二和第三引物在同一体系中进行PCR扩增，

其中，第一引物的序列对应于转基因整合位点附近序列(载体侧翼)的序列；

第二引物的序列对应于整合位点另一侧野生型基因组的序列，并且第一引物和第二引物构成第一引物对；

第三引物的序列对应于载体序列，并且第一引物和第三引物构成第二引物对；

其中，根据以下标准判断基因型：

如果只出现第一引物对的扩增产物，就表明是野生型；

如果只出现第二引物对的扩增产物，就表明是转基因纯合型；

如果同时出现第一引物对的扩增产物和第二引物对的扩增产物，就表明是转基因杂合型(具体机制如图6所示)。

在另一优选例中，提供了一种用于本发明上述方法的转基因载体，其特征在于，所述的载体是具有SEQ ID NO：1所示序列的载体。

本发明的其它方面由于本文的公开内容，对本领域的技术人员而言是显而易见的。

附图说明

图1显示了本发明的一种通用的转基因载体。

图2显示了利用所述通用的转基因载体进行的转基因及整合位点鉴定的流程。

图3显示了PCR鉴定转基因整合位点的原理。

图4显示了pEGFP-PLAG1转基因质粒的结构。

图5显示了接头的示意图。

图6显示了转基因基因型鉴定的示意图。

具体实施方式

本发明人经过广泛而深入的研究，针对现有其它转基因整合位点鉴定方法易受转基因多拷贝串联整合及整合后序列改变的影响的局限，建立了一种简便易行的转基因整合位点鉴定的方法。

同时，本发明人还设计并利用一种通用载体及标准化方法，对近百个转基因小鼠系进行了整合位点鉴定，建立了整合位点明确的转基因小鼠资源库。

本发明提供一种快速方便转基因***位点鉴定方法，所述方法原理简单，可操作性强，不受转基因多拷贝串联整合及转基因后序列发生变化的影响，所述方法理论上能对所有类型转基因进行整合位点鉴定。利用这一方法可以满足人们在短时间内对大多数转基因进行整合位点鉴定的需要。

本发明还提供了所述方法的用途，尤其是建立整合位点明确的转基因小鼠资源库。

具体地，本发明采用的PCR鉴定转基因整合位点的原理见图3：转基因主要以多拷贝首尾相连的方式整合在基因组中。用内切酶E1酶切转基因小鼠基因组DNA，然后在片段两端连接特殊设计的接头；在普通的genome walking(基因组步移法)中，此时即可用载体特异性引物和接头引物PCR扩增获得未知序列，但由于转基因的多拷贝整合，中间拷贝的载体头尾相连部转基因DNA会竞争PCR而难以获得含转基因/基因组结合处序列的片段(图3A中左面所示)。

在本发明一种策略中，本发明人用内切酶E2(可切断位于两E1间载体头尾相连部)酶切已加接头的连接产物，从而使中间拷贝的载体头尾相连部转基因DNA不能进行PCR扩增，只有含转基因/基因组结合处序列的片段能扩增(图3A中右面所示)。

在本发明的另一种策略中，用一系列不切割载体DNA的产生平末端的限制性内切酶Ebs消化转基因基因组DNA，使酶切后转基因载体DNA侧翼(限制性酶切断端与载体之间)的DNA片段的平均长度足够短，便于用PCR的方法扩增，然后在消化后基因组片段两端连接接头，以载体特异性引物和接头引物扩增载体侧翼序列，通过控制PCR反应的延伸时间，则图3B中最下方所示的两种片段将被优先扩增。

更具体的，所述转基因***位点鉴定方法，选自以下两种策略：

策略1包括步骤：

a用限制性内切酶E1消化转基因基因组DNA，然后在消化后基因组片段两端连接接头；

b′用可切断位于两E1间载体头尾相连部的限制性内切酶E2消化已加接头的连接产物；

b以载体序列特异性引物和接头序列特异性引物进行PCR扩增位于载体与接头之间的基因组DNA片段。

策略2包括步骤：

a用一系列不切割载体DNA的产生平末端的限制性内切酶Ebs消化转基因基因组DNA，然后在消化后基因组片段两端连接接头；

将上述方法中所获得的PCR产物克隆、测序，将测序结果在Genebank(www.ncbi.nlm.nih.gov)和UCSC小鼠基因组序列数据库(www.genome.ucsc.edu)进行序列比对，确定转基因片段的***位点及附近的基因组序列，根据这些序列信息可以明确转基因***的基因位点、***后有无内源基因结构的破坏、***后是否引起附近基因组结构的改变(如缺失、重排)，将这些信息与小鼠系及其表型对应，建立转基因小鼠资源库，对于基因功能研究是宝贵的模式生物资源。

限制性内切酶

在本发明中，步骤(a)中所述的限制性内切酶的选用有以下特点：

a.在基因组中切割位点分布较多的从而可将基因组DNA切割为平均长度小于1kb的一种限制性内切酶，或几种产生平末端(或相同粘性末端)的限制性内切酶的联合；

b.若选用的限制性内切酶可以切割载体序列(命名其为E1，E1可以是一种酶或几种酶的联合，如a所述)，则在步骤(b)与(c)之间加步骤(b′)，即在添加接头之后，用可切断位于两个E1间载体头尾相连部的第二限制性内切酶E2消化已加接头的连接产物。

代表性的所述的限制性内切酶例子包括：单一的在基因组中切割位点分布较多的Sau3AI、MspI、NdeII、AccII、AluI、HphI、MboII等识别位点序列为4个或5个碱基的限制性内切酶；也可以是切割后产生相同粘性末端的几种同尾酶的组合：如BamHI、BglII、BclI、MboI、XhoII联合酶切，NheI、XbaI、SpeI、AvrII的联合酶切或是一组产生平末端的限制性内切酶的组合：如EcoRV、NruI、PmacI、XmnI、PshAI、BstZ17I、SmaI、SspI、PvuII等产生平末端的酶的合理组合。

第二限制性内切酶E2的选择符合以下几个特点：

a、第一限制性内切酶以外的限制性内切酶，

b、可以切断两个E1间载体头尾相连部的限制性内切酶，

c、不切割两个E1间载体/基因组接合部的载体序列

代表性的第二限制性内切酶E2可以选自PvuII、KpnI、BamHI、EcoRI、BglII等常用的限制性内切酶。

在另一优选例中，所用的限制性内切酶是PvuII和KpnI。

接头

可用于本发明的方法的所述接头具有以下特征：

a.接头是由两条单链DNA退火而成，如图5所示，退火后接头双链端形成能与方法1或2所用的限制性内切酶切割后产生的末端匹配的末端结构(如果酶切后产生粘性末端，接头双链端5′突出可与之形成碱基配对而退火，如果是平末端，则接头接头双链端也为平末端)

b.接头中两条单链DNA长度不同，一条较长，其长度范围为40bp-100bp，在其单链区可以作为两条巢式引物的模板；而另一条较短，其长度范围为6-20bp，其5′端碱基磷酸化，3′端碱基氨基化。

载体序列特异性引物

可用于本发明的载体序列特异性引物具有以下特征：

a引物序列的选择以限制性内切酶消化后转基因载体/基因组结合部的载体序列为模板，

b引物序列可以与接头序列特异性引物配对用于PCR反应

载体

可用于本发明的载体没有特别限制，可以是常规的转基因载体。代表性的载体包括(但并不限于)：pCDNA3.1、pEGFP-C1、pET系列载体、pCI-neo等常用的用于基因表达的质粒载体。

此外，根据上述原理及实施结果，本发明人提供了一种优化的转基因通用载体，该载体上有优化的E2限制性内切酶切位点KpnI和PvuII及优化的载体特异性引物序列区，使利用不同转基因载体获得转基因DNA后复杂多样的酶切和引物筛选变成单一化、标准化的过程，可大大提高整合位点鉴定效率。

具体地，本发明提供了利于整合位点鉴定的一种通用的转基因载体及利用此载体获得的转基因整合位点鉴定的标准化方法。所述的通用载体的结构如图1所示，其全序列为

ggtacctcat atgccaagta cgccccctat tgccaaaatg tcgtaacaac tccgccccgc 60

tgtacaagta ctcagatcTC GAGCTCAAGC TTCGAATTCC GGGATCCACC GGATCTAGAT 120

AACTGATCAT AATCAGCCAT ACCACATTTG TAGAGGTTTT ACTTGCTTTA AAAAACCTCC 180

CACACCTCCC CCTGAACCTG AAACATAAAA TGAATGCAAT TGTTGTTGTT AACTTGTTTA 240

TTGCAGCTTA TAATGGTTAC AAATAAAGCA ATAGCATCAC AAATTTCACA AATAAAGCAT 300

TTTTTTCACT GCATTCTAGT TGTGGTTTGT CCAAACTCAT CAATGTATCT TAACGCGTAA 360

ATTGTAAGCG TTAATATTTT GTTAAAATTC GCGTTAAATT TTTGTTAAAT CAGCTCATTT 420

TTTAACCAAT AGGCCGAAAT CGGCAAAATC CCTTATAAAT CAAAAGAATA GACCGAGATA 480

GGGTTGAGTG TTGTTCCAGT TTGGAACAAG AGTCCACTAT TAAAGAACGT GGACTCCAAC 540

GTCAAAGGGC GAAAAACCGT CTATCAGGGC GATGGCCCAC TACGTGAACC ATCACCCTAA 600

TCAAGTTTTT TGGGGTCGAG GTGCCGTAAA GCACTAAATC GGAACCCTAA AGGGAGCCCC 660

CGATTTAGAG CTTGACGGGG AAAGCCGGCG AACGTGGCGA GAAAGGAAGG GAAGAAAGCG 720

AAAGGAGCGG GCGCTAGGGC GCTGGCAAGT GTAGCGGTCA CGCTGCGCGT AACCACCACA 780

CCCGCCGCGC TTAATGCGCC GCTACAGGGC GCGTCAGGTG GCACTTTTCG GGGAAATGTG 840

CGCGGAACCC CTATTTGTTT ATTTTTCTAA ATACATTCAA ATATGTATCC GCTCATGAGA 900

CAATAACCCT GATAAATGCT TCAATAATAT TGAAAAAGGA AGAGTCCTGA GGCGGAAAGA 960

ACCAGCTGTG GAATGTGTGT CAGTTAGGGT GTGGAAagtc cccaggctcc ccagcagcgg 1020

ccgcgtcgac CGATGCCCTT GAGAGCCTTC AACCCAGTCA GCTCCTTCCG GTGGGCGCGG 1080

GGCATGACTA TCGTCGCCGC ACTTATGACT GTCTTCTTTA TCATGCAACT CGTAGGACAG 1140

GTGCCGGCAG CGCTCTTCCG CTTCCTCGCT CACTGACTCG CTGCGCTCGG TCGTTCGGCT 1200

GCGGCGAGCG GTATCAGCTC ACTCAAAGGC GGTAATACGG TTATCCACAG AATCAGGGGA 1260

TAACGCAGGA AAGAACATGT GAGCAAAAGG CCAGCAAAAG GCCAGGAACC GTAAAAAGGC 1320

CGCGTTGCTG GCGTTTTTCC ATAGGCTCCG CCCCCCTGAC GAGCATCACA AAAATCGACG 1380

CTCAAGTCAG AGGTGGCGAA ACCCGACAGG ACTATAAAGA TACCAGGCGT TTCCCCCTGG 1440

AAGCTCCCTC GTGCGCTCTC CTGTTCCGAC CCTGCCGCTT ACCGGATACC TGTCCGCCTT 1500

TCTCCCTTCG GGAAGCGTGG CGCTTTCTCA TAGCTCACGC TGTAGGTATC TCAGTTCGGT 1560

GTAGGTCGTT CGCTCCAAGC TGGGCTGTGT GCACGAACCC CCCGTTCAGC CCGACCGCTG 1620

CGCCTTATCC GGTAACTATC GTCTTGAGTC CAACCCGGTA AGACACGACT TATCGCCACT 1680

GGCAGCAGCC ACTGGTAACA GGATTAGCAG AGCGAGGTAT GTAGGCGGTG CTACAGAGTT 1740

CTTGAAGTGG TGGCCTAACT ACGGCTACAC TAGAAGAACA GTATTTGGTA TCTGCGCTCT 1800

GCTGAAGCCA GTTACCTTCG GAAAAAGAGT TGGTAGCTCT TGATCCGGCA AACAAACCAC 1860

CGCTGGTAGC GGTGGTTTTT TTGTTTGCAA GCAGCAGATT ACGCGCAGAA AAAAAGGATC 1920

TCAAGAAGAT CCTTTGATCT TTTCTACGGG GTCTGACGCT CAGTGGAACG AAAACTCACG 1980

TTAAGGGATT TTGGTCATGA GATTATCAAA AAGGATCTTC ACCTAGATCC TTTTAAATTA 2040

AAAATGAAGT TTTAAATCAA TCTAAAGTAT ATATGAGTAA ACTTGGTCTG ACAGTTACCA 2100

ATGCTTAATC AGTGAGGCAC CTATCTCAGC GATCTGTCTA TTTCGTTCAT CCATAGTTGC 2160

CTGACTCCCC GTCGTGTAGA TAACTACGAT ACGGGAGGGC TTACCATCTG GCCCCAGTGC 2220

TGCAATGATA CCGCGAGACC CACGCTCACC GGCTCCAGAT TTATCAGCAA TAAACCAGCC 2280

AGCCGGAAGG GCCGAGCGCA GAAGTGGTCC TGCAACTTTA TCCGCCTCCA TCCAGTCTAT 2340

TAATTGTTGC CGGGAAGCTA GAGTAAGTAG TTCGCCAGTT AATAGTTTGC GCAACGTTGT 2400

TGCCATTGCT ACAGGCATCG TGGTGTCACG CTCGTCGTTT GGTATGGCTT CATTCAGCTC 2460

CGGTTCCCAA CGATCAAGGC GAGTTACATG ATCCCCCATG TTGTGCAAAA AAGCGGTTAG 2520

CTCCTTCGGT CCTCCGATCG TTGTCAGAAG TAAGTTGGCC GCAGTGTTAT CACTCATGGT 2580

TATGGCAGCA CTGCATAATT CTCTTACTGT CATGCCATCC GTAAGATGCT TTTCTGTGAC 2640

TGGTGAGTAC TCAACCAAGT CATTCTGAGA ATAGTGTATG CGGCGACCGA GTTGCTCTTG 2700

CCCGGCGTCA ATACGGGATA ATACCGCGCC ACATAGCAGA ACTTTAAAAG TGCTCATCAT 2760

TGGAAAACGT TCTTCGGGGC GAAAACTCTC AAGGATCTTA CCGCTGTTGA GATCCAGTTC 2820

GATGTAACCC ACTCGTGCAC CCAACTGATC TTCAGCATCT TTTACTTTCA CCAGCGTTTC 2880

TGGGTGAGCA AAAACAGGAA GGCAAAATGC CGCAAAAAAG GGAATAAGGG CGACACGGAA 2940

ATGTTGAATA CTCATACTCT TCCTTTTTCA ATATTATTGA AGCATTTATC AGGGTTATTG 3000

TCTCATGAGC GGATACATAT TTGAATGTAT TTAGAAAAAT AAACAAATAG GGGTTCCGCG 3060

CACATTTCCC CGAAAAGTGC CACCTGACGC GCCCTGTAGC GGCGCATTAA GCGCGGCGGG 3120

TGTGGTGGTT ACGCGCAGCG TGACCGCTAC ACTTGCCAGC GCCCTAGCGC CCGCTCCTTT 3180

CGCTTTCTTC CCTTCCTTTC TCGCCACGTT CGCCGGCTTT CCCCGTCAAG CTCTAAATCG 3240

GGGGCTCCCT TTAGGGTTCC GATTTAGTGC TTTACGGCAC CTCGACCCCA AAAAACTTGA 3300

TTAGGGTGAT GGTTCACGTA GTGGGCCATC GCCCTGATAG ACGGTTTTTC GCCCTTTGAC 3360

GTTGGAGTCC ACGTTCTTTA ATAGTGGACT CTTGTTCCAA ACTGGAACAA CACTCAACCC 3420

TATCTCGGTC TATTCTTTTG ATTTATAAGG GATTTTGCCG ATTTCGGCCT ATTGGTTAAA 3480

AAATGAGCTG ATTTAACAAA AATTTAACGC GAATTTTAAC AAAATATTAA CGCTTACAAT 3540

TTGCCATTCG CCATTCAGGC TGCGCAACTG TTGGGAAGGG CGATCGGTGC GGGCCTCTTC 3600

GCTATTACGC CAGCCCAAGC TACCATGATA AGTAAGTAAT ATTAAGGTAC GGGAGGTACT 3660

TGGAGCGGCC GCAATAAAAT ATCTTTATTT TCATTACATC TGTGTGTTGG TTTTTTGTGT 3720

GAATCGATAG TACTAACATA CGCTCTCCAT CAAAACAAAA CGAAACAAAA CAAACTAGCA 3780

AAATAGGCTG TCCCCAGTGC AAGTGCAGGT GCCAGAACAT TTCTCTATCG ATA 3833

(SEQ ID NO：1)

其中，

7-32：AdaP6为载体5′端通用引物

33-58：AdaP5为载体5′端通用引物

74-102：MCS(多克隆位点区，启动子和目的基因克隆在这一区域)

110-160：SV40 early mRNA polyA(多聚腺苷酸加尾信号)

210-660：f1 single-strand DN A origin(f1单链DNA复制起点)

801-827：AdaP3为载体3′端通用引物

950-977：AdaP4为载体3′端通用引物

860-1017：SV40 early promoter(part)SV40早期启动子(部分)

1333：ColE1-derived plasmid replication origin(ColE1来源的质粒复制起点)

2095-2955：Ampr(氨苄青霉素抗性基因)

3087-3542：f1 single-strand DNA origin(f1单链DNA复制起点)

3673-3826：Synthetic poly(A)signal(多聚腺苷酸加尾信号)(参见图1描述载体的各个元件)。

利用所述载体的转基因及整合位点鉴定的标准化方法的步骤为：

a将启动子和目的基因克隆在这一载体的多克隆位点区(MCS)，以NotI酶切，回收两个NotI酶切位点之间的线性化片段用于转基因。

b用适当的方法的方法获得转基因生物或细胞后，按图2所示的流程进行整合位点鉴定。

本发明还提供了一种整合位点明确的转基因小鼠资源库，资源库中每一种转基因动物转基因定位及被破坏内源基因明确。

在本发明还提供了一种转基因动物基因型鉴定的方法，包括以下步骤：

a利用本发明上述方法获得转基因整合位点及其附近的基因组序列；

b根据转基因整合位点附近序列(载体侧翼)设计的引物1，根据整合位点另一侧野生型基因组序列设计引物2与引物1配对，根据载体序列设计引物3与引物1配对，以转基因基因组为模板，三引物在同一体系中进行PCR，则有三种结果分别代表三种基因型(见图6)。

本发明的主要优点在于：

(a)可以快速鉴定转基因的整合位点。

(b)准确性高。

(c)通用性好。

下面结合具体实施例，进一步阐述本发明。应理解，这些实施例仅用于说明本发明而不用于限制本发明的范围。下列实施例中未注明具体条件的实验方法，通常按照常规条件如Sambrook等人，分子克隆：实验室手册(New York：Cold Spring Harbor Laboratory Press，1989)中所述的条件，或按照制造厂商所建议的条件。

实施例1：pEGFP-PLAG1转基因小鼠整合位点鉴定(策略1)

pEGFP-PLAG1转基因质粒是将含PLAG1完整编码框及翻译起始密码前100余个碱基的片段克隆到pCMV-EGFP(购自Clontech)载体的EcoRI位点构建而成，其结构如图4所示。质粒经NsiI酶切后回收3.8kb的片段用于显微注射。

分析上述转基因载体片段序列中酶切位点分布情况，确定以Sau3AI作为限制性内切酶E1酶切转基因小鼠基因组，故设计合成以下接头DNA(两链退火后形成Sau3AI接头)：

接头1：5′-GTA ATA CGA CTC ACT ATA GGG CAC GCG TGGTCG ACG GCC CGG GCT GGT-3′(SEQ ID NO：2)

接头2：5′-PO₄-GATC ACC AGC CC-N₂H-3′(5′-OH用PO₄取代，3′-OH用N₂H取代)(SEQ ID NO：3)

以TE或水溶解至50pmol/μl，临用前各取5μl(等摩尔数)混合，80℃10分钟后自然降温到室温退火。

以Sau3AI消化5-10μg转基因小鼠基因组DNA，电泳观察酶切完全后，以酚：氯仿抽提，乙醇沉淀纯化后，DNA定量。取约0.5μg酶切回收后DNA与退火后的接头DNA按一定比例混合(摩尔数1∶50)，T₄DNA连接酶(Biolabs)连接过夜。70℃，15min灭活连接酶，以QIAGEN凝胶回收试剂盒纯化连接反应液，溶于灭菌水中。

根据转基因载体序列，PvuII为载体5′端限制性内切酶E2，BglI作为载体3′端限制性内切酶E2，建立两个酶切体系，分别以PvuII、BglI消化上述与接头连接后基因组DNA，以酚：氯仿抽提，乙醇沉淀纯化酶切反应液，溶于TE或灭菌水中。按如下方法进行巢式PCR，扩增载体两侧基因组片段。

根据两端接头序列设计引物：

adaP1：5′-GTA ATA CGA CTC ACT ATA GGG C-3′(SEQ ID NO：4)

adaP2：5′-ACT ATA GGG CAC GCG TGG T-3′(SEQ ID NO：5)

根据载体两端序列设计如下两对引物：

5out：5′-GGG GCG GAG TTG TTA CGA CAT TTT GG-3′(SEQ IDNO：6)

5in：5′-CAA TAG GGG GCG TAC TTG GCA TAT GA-3′(SEQID NO：7)

3out：5′-CAC CTC CCC CTG AAC CTG AAA CAT A-3′(SEQ IDNO：8)

3in：5′-CCC ACT ACG TGA ACC ATC ACC CTA A-3′(SEQ IDNO：9)

以上述纯化PvuII酶切反应液为模板，引物5out与adaP1配对进行第一轮PCR，扩增条件为：95℃3min变性后，94℃30s，65℃30s，72℃30s，30个循环后72℃延伸5min。以第一轮PCR反应液为模板，引物5in与adaP2配对进行第二轮PCR，扩增条件为：95℃3min变性后，94℃30s，66℃30s，72℃30s，30个循环后72℃延伸5min。电泳检测扩增条带，凝胶回收后测序或T-A克隆后测序获得载体5′一侧***位点序列。同理，以上述纯化BglI酶切反应液为模板，引物3out与adaP1配对进行第一轮PCR，引物3in与adaP2配对进行第二轮PCR，获得载体3′一侧***位点序列。

根据测序结果在Genbank(www.ncbi.nlm.nih.gov)和UCSC小鼠基因组序列数据库(www.genome.ucsc.edu)进行序列比对，确定转基因载体***位置及其侧翼序列。

实施例2：pEGFP-PLAG1转基因小鼠整合位点鉴定(策略2)

设计合成以下接头DNA(两链退火后形成平末端接头)：

接头1：5′-GTA ATA CGA CTC ACT ATA GGG CAC GCG TGGTCG ACG GCC CGG GCT GGT-3′(SEQ ID NO：10)

接头2：5′-PO₄-ACC AGC CC-N2H-3′(5′-OH用PO₄取代，3′-OH用N₂H取代)(SEQ ID NO：11)

分析如实施例1中图示的转基因载体序列，找出一系列不切割载体DNA的产生平末端的限制性内切酶EcoRV、NruI、PmacI、XmnI、PshAI、BstZ17I。

取5-10μg转基因小鼠基因组DNA，依次以EcoRV、NruI、PmacI、XmnI消化(即一种酶消化后65℃15min灭活酶，乙醇沉淀纯化后，换另一种酶切)，电泳观察酶切完全后，以酚：氯仿抽提，乙醇沉淀纯化后，DNA定量。取约0.5μg酶切回收后DNA与退火后的接头DNA按一定比例混合(摩尔数1∶50)，T₄DNALigase(Biolabs)连接过夜。70℃，15min灭活连接酶，以QIAGEN凝胶回收试剂盒纯化连接反应液，溶于TE或灭菌水中。

根据两端接头序列设计引物：

adaP1：5′-GTA ATA CGA CTC ACT ATA GGG C-3′(SEQ ID NO：12)

adaP2：5′-ACT ATA GGG CAC GCG TGG T-3′(SEQ ID NO：13)

根据载体两端序列设计如下两对引物：

5out2：5′-AGC GCT AGC GGA TCT GAC GGT TCA CTA A-3′(SEQ ID NO：14)

5in2：5′-GGA AAT CCC CGT GAG TCA AAC CGC TAT C-3′(SEQ ID NO：15)

3out2：5′-AAG TAC CAC CCT CCC ACG TTT CCA TCA A-3′(SEQ ID NO：16)

3in2：5′-GCT ACA GGG CGC GTC AGG TGG CAC TTT-3′(SEQ ID NO：17)

以上述纯化连接反应液为模板，引物5out2与adaP1配对，进行第一轮PCR，扩增条件为：95℃3min变性后，94℃30s，68℃30s，72℃30s，30个循环后72℃延伸5min。以第一轮PCR反应液为模板，引物5in2与adaP2配对进行第二轮PCR，扩增条件为：95℃3min变性后，94℃30s，68℃30s，72℃30s，30个循环后72℃延伸5min。电泳检测扩增条带，凝胶回收后测序或T-A克隆后测序获得载体5′一侧***位点序列。同理，以上述纯化BglI酶切反应液为模板，引物3out2与adaP1配对进行第一轮PCR，引物3in2与adaP2配对进行第二轮PCR，获得载体3′一侧***位点序列。

根据测序结果在Genbank(www.ncbi.nlm.nih.gov)和UCSC小鼠基因组序列数据库(www.genome.ucsc.edu)进行序列比对，确定***位置及其侧翼序列。

实施例3：利用通用载体Inte-vector建立转基因小鼠系及转基因小鼠整合位点鉴定

将IAP启动子和基因KIF18A3(第1到11外显子)cDNA序列克隆在通用载体Inte-vector(序列SEQ ID NO：1所示)的多克隆位点区的XhoI与BamHI位点间，完成转基因质粒构建，以NotI酶切，回收两个NotI酶切位点之间的线性化片段用于转基因。

按照实施例1所述方法以Sau3AI消化转基因小鼠基因组，纯化后与接头连接(同实施例1)

按照通用载体序列，PvuII为载体5′端限制性内切酶E2，KpnI为载体3′端限制性内切酶E2，建立两个酶切体系，分别以PvuII、KpnI消化上述与接头连接后基因组DNA，以酚：氯仿抽提，乙醇沉淀纯化酶切反应液，溶于TE或灭菌水中。按如下方法进行巢式PCR，扩增载体两侧基因组片段。

通用引物序列如下：

AdaP1：GTAATACGACTCACTATAGGGC(SEQ ID NO：18)

AdaP2：ACTATAGGGCACGCGTGGT(SEQ ID NO：19)

AdaP3：GCTACAGGGCGCGTCAGGTGGCACTTT(SEQ ID NO：20)

AdaP4：AGGCGGAAAGAACCAGCTGTGGAATGTG(SEQ ID NO：21)

AdaP5：GGGGCGGAGTTGTTACGACATTTTGG(SEQ ID NO：22)

AdaP6：CAATAGGGGGCGTACTTGGCATATGA(SEQ ID NO：23)

其中，AdaP3、AdaP4、AdaP5、AdaP6在载体中的相应位置见发明内容中通用载体图注。

以上述纯化PvuII酶切反应液为模板，引物AdaP5与adaP1配对，引物AdaP6与adaP2配对进行第二轮PCR，电泳检测扩增条带，凝胶回收后测序或T-A克隆后测序获得载体5′一侧***位点序列。同理，以上述纯化KpnI酶切反应液为模板，引物AdaP3与adaP1配对进行第一轮PCR，引物AdaP4与adaP2配对进行第二轮PCR，获得载体3′一侧***位点序列。

实施例4

在本实施例中，利用实施例1和2中所示的方法，对pEGFP-PLAG1转基因小鼠8个系的整合位点及***后破坏基因进行了鉴定。结果如下表1所示。

表1

L	Left	interrupted gene	Right
L	Left	interrupted gene	Right	14	N	chr4_13.39(67690518-67782196)exon＜4/4	chr4：67781883
21	Chr2：109437866	chr2_21.103(109472855-109482346)exon 1-4；Kif18a(p866)(109410187-109471194)exon 12-17；Kif18a(p571)(109410301-109440284)exon 12-12	Chr2：109488756	14	N	chr4_13.39(67690518-67782196)exon＜4/4	chr4：67781883
21	Chr2：109437866		Chr2：109488756	22	Chr2：4672958	E130319B15Rik(p433)(4636319-4719052)exon 6-6/9；E130319B15Rik(p141)(4668127-4720629)exon 3-3/6	Chr2：4688617
26	N	Lifr(6941287-7065942)exon＞5(6947560)，＜6/14(7030873)；chr15_1.108(6987375-7025196)exon＜3/8；chr15_1.107	Chr15：6994521	22	Chr2：4672958		Chr2：4688617
26	N		Chr15：6994521	29	chr5：71831803	Atp10d(71802993-71897767)exon3-4/12	Chr5：71834610
32	E.coli 12741		E.coli 8438	29	chr5：71831803	Atp10d(71802993-71897767)exon3-4/12	Chr5：71834610
32	E.coli 12741		E.coli 8438	39	chr8：82303037	chr8_16.123(82258542-82344945)	chr8：82306482
67	N	chr4_18.35(92616643-92781992)	Chr4：92750721	39	chr8：82303037	chr8_16.123(82258542-82344945)	chr8：82306482

L表示品系；

Left表示载体5′端***位点；

Right表示载体3′端如***位点；

Interrupted gene表示被破坏的内源基因。

其中，21系小鼠表现出雄性小鼠不育的表型，进一步研究表明此表型与内源基因kif18A功能破坏密切相关。

在本发明提及的所有文献都在本申请中引用作为参考，就如同每一篇文献被单独引用作为参考那样。此外应理解，在阅读了本发明的上述讲授内容之后，本领域技术人员可以对本发明作各种改动或修改，这些等价形式同样落于本申请所附权利要求书所限定的范围。

序列表

<110>王，铸刚

<120>一种快速方便转基因***位点鉴定技术

<130>059989

<160>23

<170>PatentIn version 3.3

<210>1

<211>3833

<212>DNA

<213>人工序列

<220>

<221>misc_feature

<223>载体

<400>1

ggtacctcat atgccaagta cgccccctat tgccaaaatg tcgtaacaac tccgccccgc 60

tgtacaagta ctcagatctc gagctcaagc ttcgaattcc gggatccacc ggatctagat 120

aactgatcat aatcagccat accacatttg tagaggtttt acttgcttta aaaaacctcc 180

cacacctccc cctgaacctg aaacataaaa tgaatgcaat tgttgttgtt aacttgttta 240

ttgcagctta taatggttac aaataaagca atagcatcac aaatttcaca aataaagcat 300

ttttttcact gcattctagt tgtggtttgt ccaaactcat caatgtatct taacgcgtaa 360

attgtaagcg ttaatatttt gttaaaattc gcgttaaatt tttgttaaat cagctcattt 420

tttaaccaat aggccgaaat cggcaaaatc ccttataaat caaaagaata gaccgagata 480

gggttgagtg ttgttccagt ttggaacaag agtccactat taaagaacgt ggactccaac 540

gtcaaagggc gaaaaaccgt ctatcagggc gatggcccac tacgtgaacc atcaccctaa 600

tcaagttttt tggggtcgag gtgccgtaaa gcactaaatc ggaaccctaa agggagcccc 660

cgatttagag cttgacgggg aaagccggcg aacgtggcga gaaaggaagg gaagaaagcg 720

aaaggagcgg gcgctagggc gctggcaagt gtagcggtca cgctgcgcgt aaccaccaca 780

cccgccgcgc ttaatgcgcc gctacagggc gcgtcaggtg gcacttttcg gggaaatgtg 840

cgcggaaccc ctatttgttt atttttctaa atacattcaa atatgtatcc gctcatgaga 900

caataaccct gataaatgct tcaataatat tgaaaaagga agagtcctga ggcggaaaga 960

accagctgtg gaatgtgtgt cagttagggt gtggaaagtc cccaggctcc ccagcagcgg 1020

ccgcgtcgac cgatgccctt gagagccttc aacccagtca gctccttccg gtgggcgcgg 1080

ggcatgacta tcgtcgccgc acttatgact gtcttcttta tcatgcaact cgtaggacag 1140

gtgccggcag cgctcttccg cttcctcgct cactgactcg ctgcgctcgg tcgttcggct 1200

gcggcgagcg gtatcagctc actcaaaggc ggtaatacgg ttatccacag aatcagggga 1260

taacgcagga aagaacatgt gagcaaaagg ccagcaaaag gccaggaacc gtaaaaaggc 1320

cgcgttgctg gcgtttttcc ataggctccg cccccctgac gagcatcaca aaaatcgacg 1380

ctcaagtcag aggtggcgaa acccgacagg actataaaga taccaggcgt ttccccctgg 1440

aagctccctc gtgcgctctc ctgttccgac cctgccgctt accggatacc tgtccgcctt 1500

tctcccttcg ggaagcgtgg cgctttctca tagctcacgc tgtaggtatc tcagttcggt 1560

gtaggtcgtt cgctccaagc tgggctgtgt gcacgaaccc cccgttcagc ccgaccgctg 1620

cgccttatcc ggtaactatc gtcttgagtc caacccggta agacacgact tatcgccact 1680

ggcagcagcc actggtaaca ggattagcag agcgaggtat gtaggcggtg ctacagagtt 1740

cttgaagtgg tggcctaact acggctacac tagaagaaca gtatttggta tctgcgctct 1800

gctgaagcca gttaccttcg gaaaaagagt tggtagctct tgatccggca aacaaaccac 1860

cgctggtagc ggtggttttt ttgtttgcaa gcagcagatt acgcgcagaa aaaaaggatc 1920

tcaagaagat cctttgatct tttctacggg gtctgacgct cagtggaacg aaaactcacg 1980

ttaagggatt ttggtcatga gattatcaaa aaggatcttc acctagatcc ttttaaatta 2040

aaaatgaagt tttaaatcaa tctaaagtat atatgagtaa acttggtctg acagttacca 2100

atgcttaatc agtgaggcac ctatctcagc gatctgtcta tttcgttcat ccatagttgc 2160

ctgactcccc gtcgtgtaga taactacgat acgggagggc ttaccatctg gccccagtgc 2220

tgcaatgata ccgcgagacc cacgctcacc ggctccagat ttatcagcaa taaaccagcc 2280

agccggaagg gccgagcgca gaagtggtcc tgcaacttta tccgcctcca tccagtctat 2340

taattgttgc cgggaagcta gagtaagtag ttcgccagtt aatagtttgc gcaacgttgt 2400

tgccattgct acaggcatcg tggtgtcacg ctcgtcgttt ggtatggctt cattcagctc 2460

cggttcccaa cgatcaaggc gagttacatg atcccccatg ttgtgcaaaa aagcggttag 2520

ctccttcggt cctccgatcg ttgtcagaag taagttggcc gcagtgttat cactcatggt 2580

tatggcagca ctgcataatt ctcttactgt catgccatcc gtaagatgct tttctgtgac 2640

tggtgagtac tcaaccaagt cattctgaga atagtgtatg cggcgaccga gttgctcttg 2700

cccggcgtca atacgggata ataccgcgcc acatagcaga actttaaaag tgctcatcat 2760

tggaaaacgt tcttcggggc gaaaactctc aaggatctta ccgctgttga gatccagttc 2820

gatgtaaccc actcgtgcac ccaactgatc ttcagcatct tttactttca ccagcgtttc 2880

tgggtgagca aaaacaggaa ggcaaaatgc cgcaaaaaag ggaataaggg cgacacggaa 2940

atgttgaata ctcatactct tcctttttca atattattga agcatttatc agggttattg 3000

tctcatgagc ggatacatat ttgaatgtat ttagaaaaat aaacaaatag gggttccgcg 3060

cacatttccc cgaaaagtgc cacctgacgc gccctgtagc ggcgcattaa gcgcggcggg 3120

tgtggtggtt acgcgcagcg tgaccgctac acttgccagc gccctagcgc ccgctccttt 3180

cgctttcttc ccttcctttc tcgccacgtt cgccggcttt ccccgtcaag ctctaaatcg 3240

ggggctccct ttagggttcc gatttagtgc tttacggcac ctcgacccca aaaaacttga 3300

ttagggtgat ggttcacgta gtgggccatc gccctgatag acggtttttc gccctttgac 3360

gttggagtcc acgttcttta atagtggact cttgttccaa actggaacaa cactcaaccc 3420

tatctcggtc tattcttttg atttataagg gattttgccg atttcggcct attggttaaa 3480

aaatgagctg atttaacaaa aatttaacgc gaattttaac aaaatattaa cgcttacaat 3540

ttgccattcg ccattcaggc tgcgcaactg ttgggaaggg cgatcggtgc gggcctcttc 3600

gctattacgc cagcccaagc taccatgata agtaagtaat attaaggtac gggaggtact 3660

tggagcggcc gcaataaaat atctttattt tcattacatc tgtgtgttgg ttttttgtgt 3720

gaatcgatag tactaacata cgctctccat caaaacaaaa cgaaacaaaa caaactagca 3780

aaataggctg tccccagtgc aagtgcaggt gccagaacat ttctctatcg ata 3833

<210>2

<211>48

<212>DNA

<213>人工序列

<220>

<221>misc_feature

<223>接头

<400>2

gtaatacgac tcactatagg gcacgcgtgg tcgacggccc gggctggt 48

<210>3

<211>12

<212>DNA

<213>人工序列

<220>

<221>misc_feature

<223>接头

<400>3

gatcaccagc cc 12

<210>4

<211>22

<212>DNA

<213>人工序列

<220>

<221>misc_feature

<223>引物

<400>4

gtaatacgac tcactatagg gc 22

<210>5

<211>19

<212>DNA

<213>人工序列

<220>

<221>misc_feature

<223>引物

<400>5

actatagggc acgcgtggt 19

<210>6

<211>26

<212>DNA

<213>人工序列

<220>

<221>misc_feature

<223>引物

<400>6

ggggcggagt tgttacgaca ttttgg 26

<210>7

<211>26

<212>DNA

<213>人工序列

<220>

<221>misc_feature

<223>引物

<400>7

caataggggg cgtacttggc atatga 26

<210>8

<211>25

<212>DNA

<213>人工序列

<220>

<221>misc_feature

<223>引物

<400>8

cacctccccc tgaacctgaa acata 25

<210>9

<211>25

<212>DNA

<213>人工序列

<220>

<221>misc_feature

<223>引物

<400>9

cccactacgt gaaccatcac cctaa 25

<210>10

<211>48

<212>DNA

<213>人工序列

<220>

<221>misc_feature

<223>接头

<400>10

gtaatacgac tcactatagg gcacgcgtgg tcgacggccc gggctggt 48

<210>11

<211>8

<212>DNA

<213>人工序列

<220>

<221>misc_feature

<223>接头

<400>11

accagccc 8

<210>12

<211>22

<212>DNA

<213>人工序列

<220>

<221>misc_feature

<223>引物

<400>12

gtaatacgac tcactatagg gc 22

<210>13

<211>19

<212>DNA

<213>人工序列

<220>

<221>misc_feature

<223>引物

<400>13

actatagggc acgcgtggt 19

<210>14

<211>28

<212>DNA

<213>人工序列

<220>

<221>misc_feature

<223>引物

<400>14

agcgctagcg gatctgacgg ttcactaa 28

<210>15

<211>28

<212>DNA

<213>人工序列

<220>

<221>misc_feature

<223>引物

<400>15

ggaaatcccc gtgagtcaaa ccgctatc 28

<210>16

<211>28

<212>DNA

<213>人工序列

<220>

<221>misc_feature

<223>引物

<400>16

aagtaccacc ctcccacgtt tccatcaa 28

<210>17

<211>27

<212>DNA

<213>人工序列

<220>

<22t>misc_feature

<223>引物

<400>17

gctacagggc gcgtcaggtg gcacttt 27

<210>18

<211>22

<212>DNA

<213>人工序列

<220>

<221>misc_feature

<223>引物

<400>18

gtaatacgac tcactatagg gc 22

<210>19

<211>19

<212>DNA

<213>人工序列

<220>

<221>misc_feature

<223>引物

<400>19

actatagggc acgcgtggt 19

<210>20

<211>27

<212>DNA

<213>人工序列

<220>

<221>misc_feature

<223>引物

<400>20

gctacagggc gcgtcaggtg gcacttt 27

<210>21

<211>28

<212>DNA

<213>人工序列

<220>

<221>misc_feature

<223>引物

<400>21

aggcggaaag aaccagctgt ggaatgtg 28

<210>22

<211>26

<212>DNA

<213>人工序列

<220>

<221>misc_feature

<223>引物

<400>22

ggggcggagt tgttacgaca ttttgg 26

<210>23

<211>26

<212>DNA

<213>人工序列

<220>

<221>misc_feature

<223>引物

<400>23

caataggggg cgtacttggc atatga 26

Claims

1.一种确定转基因***位点的方法，其特征在于，包括步骤：

(c)对步骤(b)中的PCR产物进行测序；

(d)根据步骤(c)的测序结果，确定转基因的***位点。

2.如权利要求1所述的方法，其特征在于，步骤(a)中所述的限制性内切酶选自下组：

3.如权利要求1所述的方法，其特征在于，所述的限制性内切酶选自下组：

●一种在基因组中识别位点序列为4个或5个碱基的限制性内切酶：

Sau3AI、MspI、NdeII、AccII、AluI、HphI、MboII；

●切割后产生相同粘性末端的数种同尾酶的组合：BamHI、BglII、BclI、MboI、XhoII的组合；NheI、XbaI、SpeI、AvrII的组合；

●产生平末端的数种限制性内切酶的组合：EcoRV、NruI、PmacI、XmnI、PshAI、BstZ17I、SmaI、SspI、PvuII等产生平末端的酶的组合。

4.如权利要求3所述的方法，其特征在于，所述的第二限制性内切酶E2的具有以下特征：

●是与第一限制性内切酶不同的限制性内切酶，

●可以切断两个E1间载体头尾相连部的限制性内切酶，

●不切割两个E1间载体/基因组接合部的载体序列。

5.如权利要求1所述的方法，其特征在于，所述的接头具有以下特征：

a.接头是由两条单链DNA退火而成，退火后接头双链端形成能与限制性内切酶切割后产生的末端匹配的末端结构；

6.如权利要求1所述的方法，其特征在于，所述的载体序列特异性引物具有以下特征：

●引物序列可以与接头序列特异性引物配对用于PCR反应。

7.如权利要求1所述的方法，其特征在于，所述基因组DNA是哺乳动物的基因组DNA、或植物细胞的基因组DNA。

8.如权利要求1所述的方法，其特征在于，在步骤(d)中，还包括：

(2)进行转基因表达与表型的因果关系分析；或者

(3)进行转基因基因型的鉴定。

9.如权利要求8所述的方法，其特征在于，所述的转基因基因型鉴定包括步骤：

其中，根据以下标准判断基因型：

如果只出现第一引物对的扩增产物，就表明是野生型；

如果同时出现第一引物对的扩增产物和第二引物对的扩增产物，就表明是转基因杂合型。

10.一种用于权利要求1所述的方法的转基因载体，其特征在于，所述的载体是具有SEQ ID NO：1所示序列的载体。