CN1995384A - 一种快速方便转基因***位点鉴定技术 - Google Patents

一种快速方便转基因***位点鉴定技术 Download PDF

Info

Publication number
CN1995384A
CN1995384A CN 200610023132 CN200610023132A CN1995384A CN 1995384 A CN1995384 A CN 1995384A CN 200610023132 CN200610023132 CN 200610023132 CN 200610023132 A CN200610023132 A CN 200610023132A CN 1995384 A CN1995384 A CN 1995384A
Authority
CN
China
Prior art keywords
sequence
primer
carrier
joint
restriction enzyme
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN 200610023132
Other languages
English (en)
Inventor
王铸钢
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Individual
Original Assignee
Individual
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Individual filed Critical Individual
Priority to CN 200610023132 priority Critical patent/CN1995384A/zh
Publication of CN1995384A publication Critical patent/CN1995384A/zh
Pending legal-status Critical Current

Links

Images

Landscapes

  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

本发明公开了一种确定转基因***位点的方法,其特点为通过限制性内切酶消化,接头连接和PCR等简单易行的步骤获得位于载体与接头之间的基因组DNA序列而确定转基因***位点。本发明的方法可用于确定外源基因整合位点及附近的基因组序列以及进行转基因表达与表型的因果关系分析等。

Description

一种快速方便转基因***位点鉴定技术
技术领域
本发明涉及生物技术领域,更具体地,本发明涉及一种转基因***位点鉴定方法。
背景技术
转基因技术自上世纪80年代出现以来,迅速在建立人类疾病的动物模型、基因功能的在体研究、基因工程育种、以及畜牧业生产、生物制药等方面获得了广泛应用。特别是人类基因组计划及众多模式生物基因组测序计划完成后,基因功能的研究即功能基因组学研究成为目前乃至本世纪医学和整个生命科学研究面临的最大机遇和挑战,转基因动物模型已成为在生物活体内***研究基因功能、转录表达调控、胚胎发育、人类疾病发病机制及筛选新药或新疗法最重要的技术手段之一,是功能基因组学研究不可或缺的技术支撑。
然而,小鼠转基因技术也存在巨大缺陷:转基因以近乎随机的方式整合在基因组中,转基因整合可能导致三种结果,一是转基因高表达,二是转基因受附近基因组结构和序列的影响而不表达或低表达,三是整合位点处的内源基因或其它功能元件被破坏导致功能缺失(据Palmiter对153个转基因小鼠系的统计,约7%的转基因小鼠系出现了***突变引起的肢体异常或纯合胚胎致死,估计未出现外观表型的***突变更为常见)。这些因素给基因功能研究、动物模型应用等造成极大干扰。
在转基因动物技术建立后的短短六年,全世界就产生了数千个转基因小鼠系。目前,估计世界上已产生转基因小鼠系数万个,仅新建的上海南方模式生物研究中心2002年就生产了二百余个转基因小鼠系。这是遗传学、医学、功能基因组学、乃至整个生命科学研究的巨大资源宝库。但是由于长期以来一直缺乏经济快速鉴定整合位点的方法,对这一宝贵资源的开发还十分有限。如果能精确确定转基因的整合位点及附近的基因组序列,建立相应的转基因整合位点数据库,将会对全基因组水平的基因表达调控机制研究、转基因表达与动物表型的因果关系分析、运用转基因动物模型进行药物开发和疾病治疗研究以及对因转基因整合导致失活的内源基因功能研究等方面产生巨大影响。
研究人员在转基因动物出现以后很快就对转基因整合位点予以了充分关注,各国研究人员对原核注射产生的转基因动物中转基因整合的拷贝数、转基因的串联方式、转基因与整合位点旁侧的基因组序列的关系进行了大量的研究,取得了一定成果。结果表明,绝大多数情况下转基因是多拷贝整合的,有时甚至高达数百拷贝;转基因主要以头尾(head-to-tail)相连的方式整合在基因组内的单一位点,仅在少数情况下,可出现多位点整合、转基因内部缺失或重排,偶尔会导致基因组序列重复、缺失和染色体易位等。然而这些研究未能建立经济快速鉴定转基因整合位点的方法并推广应用。尽管运用个体基因组文库筛选法、质粒回收法、反式PCR(inverse PCR)等获得了少量的转基因/基因组整合位点处的序列,但由于费时费力,或转基因多拷贝整合的特点,中间的拷贝会与末尾的拷贝竞争PCR,及整合后转基因序列变化的影响,给获得转基因/基因组整合位点处的序列造成很大困难。而且,当时基因组计划尚未实施,确定转基因的定位和被破坏的内源基因是十分烦琐也是十分困难的。这些限制致使相关研究在近几年几乎处于停滞状态。目前,国际上小鼠基因组测序计划已基本完成,使转基因整合位点的常规鉴定成为可能,现在唯一需要的是建立获得转基因/基因组结合处序列的简单方法,就可以建立相应数据库,充分开发转基因动物资源。
综上所述,本领域迫切需要开发一种快速方便鉴定转基因***位点的方法。
发明内容
本发明的目的是提供一种确定转基因***位点的方法。所述方法可操作性强,不受转基因多拷贝串联整合及转基因后序列发生变化的影响。
在本发明的第一方面,提供了一种确定转基因***位点的方法,包括步骤:
(a)对于待确定转基因***位点的基因组DNA,用限制性内切酶进行消化,从而获得消化后的基因组片段,然后在消化后的基因组片段两端连接接头,从而形成在两端带有接头的基因组片段;
(b)以载体序列特异性引物和接头序列特异性引物,对步骤(a)中两端带有接头的基因组片段进行PCR扩增,从而获得PCR产物,其中所述的PCR产物对应于位于载体与接头之间的基因组DNA序列;
(c)对步骤(b)中的PCR产物进行测序;
(d)根据步骤(c)的测序结果,确定转基因的***位点。
在另一优选例中,步骤(a)中所述的限制性内切酶选自下组:
(i).将基因组DNA切割为平均长度小于1kb片段的一种限制性内切酶;
(ii).数种限制性内切酶的混合物,其中所述的数种(2-10种)限制性内切酶是产生相同粘性末端的限制性内切酶,并且所述的混合物将基因组DNA切割为平均长度小于1kb片段;
(iii)数种限制性内切酶的混合物,其中所述的数种(2-10种)限制性内切酶是产生相同平头末端的限制性内切酶,并且所述的混合物将基因组DNA切割为平均长度小于1kb片段;
附加条件是,如果若选用的第一限制性内切酶E1可以切割载体序列,在步骤(b)与(c)之间加步骤(b′):即在添加接头之后,用可切断位于两个E1间载体头尾相连部的第二限制性内切酶E2消化已加接头的连接产物。
在另一优选例中,所述的限制性内切酶选自下组:
●单一的在基因组中切割位点分布较多的Sau3AI、MspI、NdeII、AccII、AluI、HphI、MboII等识别位点序列为4个或5个碱基的限制性内切酶;
●切割后产生相同粘性末端的数种同尾酶的组合:如BamHI、BglII、BclI、MboI、XhoII联合酶切;NheI、XbaI、SpeI、AvrII的联合酶切;
●产生平末端的限制性内切酶的组合:如EcoRV、NruI、PmacI、XmnI、PshAI、BstZ17I、SmaI、SspI、PvuII等产生平末端的酶的组合。
在另一优选例中,所述的第二限制性内切酶E2的具有以下特征:
●是与第一限制性内切酶不同的限制性内切酶,
●可以切断两个E1间载体头尾相连部的限制性内切酶,
●不切割两个E1间载体/基因组接合部的载体序列。
在另一优选例中,E2可以选自PvuII、KpnI、BamHI、EcoRI、BglII等常用的限制性内切酶。
在另一优选例中,所用的限制性内切酶E2是PvuII和KpnI。
在另一优选例中,所述的接头具有以下特征:
a.接头是由两条单链DNA退火而成,退火后接头双链端形成能与方法1或2所用的限制性内切酶切割后产生的末端匹配的末端结构(如果酶切后产生粘性末端,接头双链端5′突出可与之形成碱基配对而退火,如果是平末端,则接头接头双链端也为平末端);
b.接头中两条单链DNA长度不同,一条较长,其长度范围为40bp-100bp,在其单链区可以作为两条巢式引物的模板;而另一条较短,其长度范围为6-20bp,其5′端碱基磷酸化,3′端碱基氨基化;
c.接头序列单链区不能与限制性内切酶消化后转基因载体/基因组结合部的载体序列区任何一段序列相同。
在另一优选例中,所述的载体序列特异性引物具有以下特征:
●引物序列的选择以限制性内切酶消化后转基因载体/基因组结合部的载体序列为模板,
●引物序列可以与接头序列特异性引物配对用于PCR反应。
在另一优选例中,所述基因组DNA是哺乳动物的基因组DNA、或植物细胞的基因组DNA。
更佳地,所述的基因组DNA来自羊、牛、小鼠、大鼠、兔子、狗、猴的基因组。
在另一优选例中,在步骤(d)中,还包括:
(1)根据测序结果,确定转基因片段***后基因组结构有无变化(如缺失或重排);或者
(2)进行转基因表达与表型的因果关系分析;或者
(3)进行转基因基因型的鉴定。
在另一优选例中,所述的转基因基因型鉴定包括步骤:
以转基因的基因组DNA为模板,用第一、第二和第三引物在同一体系中进行PCR扩增,
其中,第一引物的序列对应于转基因整合位点附近序列(载体侧翼)的序列;
第二引物的序列对应于整合位点另一侧野生型基因组的序列,并且第一引物和第二引物构成第一引物对;
第三引物的序列对应于载体序列,并且第一引物和第三引物构成第二引物对;
其中,根据以下标准判断基因型:
如果只出现第一引物对的扩增产物,就表明是野生型;
如果只出现第二引物对的扩增产物,就表明是转基因纯合型;
如果同时出现第一引物对的扩增产物和第二引物对的扩增产物,就表明是转基因杂合型(具体机制如图6所示)。
在另一优选例中,提供了一种用于本发明上述方法的转基因载体,其特征在于,所述的载体是具有SEQ ID NO:1所示序列的载体。
本发明的其它方面由于本文的公开内容,对本领域的技术人员而言是显而易见的。
附图说明
图1显示了本发明的一种通用的转基因载体。
图2显示了利用所述通用的转基因载体进行的转基因及整合位点鉴定的流程。
图3显示了PCR鉴定转基因整合位点的原理。
图4显示了pEGFP-PLAG1转基因质粒的结构。
图5显示了接头的示意图。
图6显示了转基因基因型鉴定的示意图。
具体实施方式
本发明人经过广泛而深入的研究,针对现有其它转基因整合位点鉴定方法易受转基因多拷贝串联整合及整合后序列改变的影响的局限,建立了一种简便易行的转基因整合位点鉴定的方法。
同时,本发明人还设计并利用一种通用载体及标准化方法,对近百个转基因小鼠系进行了整合位点鉴定,建立了整合位点明确的转基因小鼠资源库。
本发明提供一种快速方便转基因***位点鉴定方法,所述方法原理简单,可操作性强,不受转基因多拷贝串联整合及转基因后序列发生变化的影响,所述方法理论上能对所有类型转基因进行整合位点鉴定。利用这一方法可以满足人们在短时间内对大多数转基因进行整合位点鉴定的需要。
本发明还提供了所述方法的用途,尤其是建立整合位点明确的转基因小鼠资源库。
具体地,本发明采用的PCR鉴定转基因整合位点的原理见图3:转基因主要以多拷贝首尾相连的方式整合在基因组中。用内切酶E1酶切转基因小鼠基因组DNA,然后在片段两端连接特殊设计的接头;在普通的genome walking(基因组步移法)中,此时即可用载体特异性引物和接头引物PCR扩增获得未知序列,但由于转基因的多拷贝整合,中间拷贝的载体头尾相连部转基因DNA会竞争PCR而难以获得含转基因/基因组结合处序列的片段(图3A中左面所示)。
在本发明一种策略中,本发明人用内切酶E2(可切断位于两E1间载体头尾相连部)酶切已加接头的连接产物,从而使中间拷贝的载体头尾相连部转基因DNA不能进行PCR扩增,只有含转基因/基因组结合处序列的片段能扩增(图3A中右面所示)。
在本发明的另一种策略中,用一系列不切割载体DNA的产生平末端的限制性内切酶Ebs消化转基因基因组DNA,使酶切后转基因载体DNA侧翼(限制性酶切断端与载体之间)的DNA片段的平均长度足够短,便于用PCR的方法扩增,然后在消化后基因组片段两端连接接头,以载体特异性引物和接头引物扩增载体侧翼序列,通过控制PCR反应的延伸时间,则图3B中最下方所示的两种片段将被优先扩增。
更具体的,所述转基因***位点鉴定方法,选自以下两种策略:
策略1包括步骤:
a用限制性内切酶E1消化转基因基因组DNA,然后在消化后基因组片段两端连接接头;
b′用可切断位于两E1间载体头尾相连部的限制性内切酶E2消化已加接头的连接产物;
b以载体序列特异性引物和接头序列特异性引物进行PCR扩增位于载体与接头之间的基因组DNA片段。
策略2包括步骤:
a用一系列不切割载体DNA的产生平末端的限制性内切酶Ebs消化转基因基因组DNA,然后在消化后基因组片段两端连接接头;
b以载体序列特异性引物和接头序列特异性引物进行PCR扩增位于载体与接头之间的基因组DNA片段。
将上述方法中所获得的PCR产物克隆、测序,将测序结果在Genebank(www.ncbi.nlm.nih.gov)和UCSC小鼠基因组序列数据库(www.genome.ucsc.edu)进行序列比对,确定转基因片段的***位点及附近的基因组序列,根据这些序列信息可以明确转基因***的基因位点、***后有无内源基因结构的破坏、***后是否引起附近基因组结构的改变(如缺失、重排),将这些信息与小鼠系及其表型对应,建立转基因小鼠资源库,对于基因功能研究是宝贵的模式生物资源。
限制性内切酶
在本发明中,步骤(a)中所述的限制性内切酶的选用有以下特点:
a.在基因组中切割位点分布较多的从而可将基因组DNA切割为平均长度小于1kb的一种限制性内切酶,或几种产生平末端(或相同粘性末端)的限制性内切酶的联合;
b.若选用的限制性内切酶可以切割载体序列(命名其为E1,E1可以是一种酶或几种酶的联合,如a所述),则在步骤(b)与(c)之间加步骤(b′),即在添加接头之后,用可切断位于两个E1间载体头尾相连部的第二限制性内切酶E2消化已加接头的连接产物。
代表性的所述的限制性内切酶例子包括:单一的在基因组中切割位点分布较多的Sau3AI、MspI、NdeII、AccII、AluI、HphI、MboII等识别位点序列为4个或5个碱基的限制性内切酶;也可以是切割后产生相同粘性末端的几种同尾酶的组合:如BamHI、BglII、BclI、MboI、XhoII联合酶切,NheI、XbaI、SpeI、AvrII的联合酶切或是一组产生平末端的限制性内切酶的组合:如EcoRV、NruI、PmacI、XmnI、PshAI、BstZ17I、SmaI、SspI、PvuII等产生平末端的酶的合理组合。
第二限制性内切酶E2的选择符合以下几个特点:
a、第一限制性内切酶以外的限制性内切酶,
b、可以切断两个E1间载体头尾相连部的限制性内切酶,
c、不切割两个E1间载体/基因组接合部的载体序列
代表性的第二限制性内切酶E2可以选自PvuII、KpnI、BamHI、EcoRI、BglII等常用的限制性内切酶。
在另一优选例中,所用的限制性内切酶是PvuII和KpnI。
接头
可用于本发明的方法的所述接头具有以下特征:
a.接头是由两条单链DNA退火而成,如图5所示,退火后接头双链端形成能与方法1或2所用的限制性内切酶切割后产生的末端匹配的末端结构(如果酶切后产生粘性末端,接头双链端5′突出可与之形成碱基配对而退火,如果是平末端,则接头接头双链端也为平末端)
b.接头中两条单链DNA长度不同,一条较长,其长度范围为40bp-100bp,在其单链区可以作为两条巢式引物的模板;而另一条较短,其长度范围为6-20bp,其5′端碱基磷酸化,3′端碱基氨基化。
c.接头序列单链区不能与限制性内切酶消化后转基因载体/基因组结合部的载体序列区任何一段序列相同。
载体序列特异性引物
可用于本发明的载体序列特异性引物具有以下特征:
a引物序列的选择以限制性内切酶消化后转基因载体/基因组结合部的载体序列为模板,
b引物序列可以与接头序列特异性引物配对用于PCR反应
在另一优选例中,所述基因组DNA是哺乳动物的基因组DNA、或植物细胞的基因组DNA。
载体
可用于本发明的载体没有特别限制,可以是常规的转基因载体。代表性的载体包括(但并不限于):pCDNA3.1、pEGFP-C1、pET系列载体、pCI-neo等常用的用于基因表达的质粒载体。
此外,根据上述原理及实施结果,本发明人提供了一种优化的转基因通用载体,该载体上有优化的E2限制性内切酶切位点KpnI和PvuII及优化的载体特异性引物序列区,使利用不同转基因载体获得转基因DNA后复杂多样的酶切和引物筛选变成单一化、标准化的过程,可大大提高整合位点鉴定效率。
具体地,本发明提供了利于整合位点鉴定的一种通用的转基因载体及利用此载体获得的转基因整合位点鉴定的标准化方法。所述的通用载体的结构如图1所示,其全序列为
ggtacctcat atgccaagta cgccccctat tgccaaaatg tcgtaacaac tccgccccgc   60
tgtacaagta ctcagatcTC GAGCTCAAGC TTCGAATTCC GGGATCCACC GGATCTAGAT  120
AACTGATCAT AATCAGCCAT ACCACATTTG TAGAGGTTTT ACTTGCTTTA AAAAACCTCC  180
CACACCTCCC CCTGAACCTG AAACATAAAA TGAATGCAAT TGTTGTTGTT AACTTGTTTA  240
TTGCAGCTTA TAATGGTTAC AAATAAAGCA ATAGCATCAC AAATTTCACA AATAAAGCAT  300
TTTTTTCACT GCATTCTAGT TGTGGTTTGT CCAAACTCAT CAATGTATCT TAACGCGTAA  360
ATTGTAAGCG TTAATATTTT GTTAAAATTC GCGTTAAATT TTTGTTAAAT CAGCTCATTT  420
TTTAACCAAT AGGCCGAAAT CGGCAAAATC CCTTATAAAT CAAAAGAATA GACCGAGATA  480
GGGTTGAGTG TTGTTCCAGT TTGGAACAAG AGTCCACTAT TAAAGAACGT GGACTCCAAC  540
GTCAAAGGGC GAAAAACCGT CTATCAGGGC GATGGCCCAC TACGTGAACC ATCACCCTAA  600
TCAAGTTTTT TGGGGTCGAG GTGCCGTAAA GCACTAAATC GGAACCCTAA AGGGAGCCCC  660
CGATTTAGAG CTTGACGGGG AAAGCCGGCG AACGTGGCGA GAAAGGAAGG GAAGAAAGCG  720
AAAGGAGCGG GCGCTAGGGC GCTGGCAAGT GTAGCGGTCA CGCTGCGCGT AACCACCACA  780
CCCGCCGCGC TTAATGCGCC GCTACAGGGC GCGTCAGGTG GCACTTTTCG GGGAAATGTG  840
CGCGGAACCC CTATTTGTTT ATTTTTCTAA ATACATTCAA ATATGTATCC GCTCATGAGA  900
CAATAACCCT GATAAATGCT TCAATAATAT TGAAAAAGGA AGAGTCCTGA GGCGGAAAGA  960
ACCAGCTGTG GAATGTGTGT CAGTTAGGGT GTGGAAagtc cccaggctcc ccagcagcgg 1020
ccgcgtcgac CGATGCCCTT GAGAGCCTTC AACCCAGTCA GCTCCTTCCG GTGGGCGCGG 1080
GGCATGACTA TCGTCGCCGC ACTTATGACT GTCTTCTTTA TCATGCAACT CGTAGGACAG 1140
GTGCCGGCAG CGCTCTTCCG CTTCCTCGCT CACTGACTCG CTGCGCTCGG TCGTTCGGCT 1200
GCGGCGAGCG GTATCAGCTC ACTCAAAGGC GGTAATACGG TTATCCACAG AATCAGGGGA 1260
TAACGCAGGA AAGAACATGT GAGCAAAAGG CCAGCAAAAG GCCAGGAACC GTAAAAAGGC 1320
CGCGTTGCTG GCGTTTTTCC ATAGGCTCCG CCCCCCTGAC GAGCATCACA AAAATCGACG 1380
CTCAAGTCAG AGGTGGCGAA ACCCGACAGG ACTATAAAGA TACCAGGCGT TTCCCCCTGG 1440
AAGCTCCCTC GTGCGCTCTC CTGTTCCGAC CCTGCCGCTT ACCGGATACC TGTCCGCCTT 1500
TCTCCCTTCG GGAAGCGTGG CGCTTTCTCA TAGCTCACGC TGTAGGTATC TCAGTTCGGT 1560
GTAGGTCGTT CGCTCCAAGC TGGGCTGTGT GCACGAACCC CCCGTTCAGC CCGACCGCTG 1620
CGCCTTATCC GGTAACTATC GTCTTGAGTC CAACCCGGTA AGACACGACT TATCGCCACT 1680
GGCAGCAGCC ACTGGTAACA GGATTAGCAG AGCGAGGTAT GTAGGCGGTG CTACAGAGTT 1740
CTTGAAGTGG TGGCCTAACT ACGGCTACAC TAGAAGAACA GTATTTGGTA TCTGCGCTCT 1800
GCTGAAGCCA GTTACCTTCG GAAAAAGAGT TGGTAGCTCT TGATCCGGCA AACAAACCAC 1860
CGCTGGTAGC GGTGGTTTTT TTGTTTGCAA GCAGCAGATT ACGCGCAGAA AAAAAGGATC 1920
TCAAGAAGAT CCTTTGATCT TTTCTACGGG GTCTGACGCT CAGTGGAACG AAAACTCACG 1980
TTAAGGGATT TTGGTCATGA GATTATCAAA AAGGATCTTC ACCTAGATCC TTTTAAATTA 2040
AAAATGAAGT TTTAAATCAA TCTAAAGTAT ATATGAGTAA ACTTGGTCTG ACAGTTACCA 2100
ATGCTTAATC AGTGAGGCAC CTATCTCAGC GATCTGTCTA TTTCGTTCAT CCATAGTTGC 2160
CTGACTCCCC GTCGTGTAGA TAACTACGAT ACGGGAGGGC TTACCATCTG GCCCCAGTGC 2220
TGCAATGATA CCGCGAGACC CACGCTCACC GGCTCCAGAT TTATCAGCAA TAAACCAGCC 2280
AGCCGGAAGG GCCGAGCGCA GAAGTGGTCC TGCAACTTTA TCCGCCTCCA TCCAGTCTAT 2340
TAATTGTTGC CGGGAAGCTA GAGTAAGTAG TTCGCCAGTT AATAGTTTGC GCAACGTTGT 2400
TGCCATTGCT ACAGGCATCG TGGTGTCACG CTCGTCGTTT GGTATGGCTT CATTCAGCTC 2460
CGGTTCCCAA CGATCAAGGC GAGTTACATG ATCCCCCATG TTGTGCAAAA AAGCGGTTAG 2520
CTCCTTCGGT CCTCCGATCG TTGTCAGAAG TAAGTTGGCC GCAGTGTTAT CACTCATGGT 2580
TATGGCAGCA CTGCATAATT CTCTTACTGT CATGCCATCC GTAAGATGCT TTTCTGTGAC 2640
TGGTGAGTAC TCAACCAAGT CATTCTGAGA ATAGTGTATG CGGCGACCGA GTTGCTCTTG 2700
CCCGGCGTCA ATACGGGATA ATACCGCGCC ACATAGCAGA ACTTTAAAAG TGCTCATCAT 2760
TGGAAAACGT TCTTCGGGGC GAAAACTCTC AAGGATCTTA CCGCTGTTGA GATCCAGTTC 2820
GATGTAACCC ACTCGTGCAC CCAACTGATC TTCAGCATCT TTTACTTTCA CCAGCGTTTC 2880
TGGGTGAGCA AAAACAGGAA GGCAAAATGC CGCAAAAAAG GGAATAAGGG CGACACGGAA 2940
ATGTTGAATA CTCATACTCT TCCTTTTTCA ATATTATTGA AGCATTTATC AGGGTTATTG 3000
TCTCATGAGC GGATACATAT TTGAATGTAT TTAGAAAAAT AAACAAATAG GGGTTCCGCG 3060
CACATTTCCC CGAAAAGTGC CACCTGACGC GCCCTGTAGC GGCGCATTAA GCGCGGCGGG 3120
TGTGGTGGTT ACGCGCAGCG TGACCGCTAC ACTTGCCAGC GCCCTAGCGC CCGCTCCTTT 3180
CGCTTTCTTC CCTTCCTTTC TCGCCACGTT CGCCGGCTTT CCCCGTCAAG CTCTAAATCG 3240
GGGGCTCCCT TTAGGGTTCC GATTTAGTGC TTTACGGCAC CTCGACCCCA AAAAACTTGA 3300
TTAGGGTGAT GGTTCACGTA GTGGGCCATC GCCCTGATAG ACGGTTTTTC GCCCTTTGAC 3360
GTTGGAGTCC ACGTTCTTTA ATAGTGGACT CTTGTTCCAA ACTGGAACAA CACTCAACCC 3420
TATCTCGGTC TATTCTTTTG ATTTATAAGG GATTTTGCCG ATTTCGGCCT ATTGGTTAAA 3480
AAATGAGCTG ATTTAACAAA AATTTAACGC GAATTTTAAC AAAATATTAA CGCTTACAAT 3540
TTGCCATTCG CCATTCAGGC TGCGCAACTG TTGGGAAGGG CGATCGGTGC GGGCCTCTTC 3600
GCTATTACGC CAGCCCAAGC TACCATGATA AGTAAGTAAT ATTAAGGTAC GGGAGGTACT 3660
TGGAGCGGCC GCAATAAAAT ATCTTTATTT TCATTACATC TGTGTGTTGG TTTTTTGTGT 3720
GAATCGATAG TACTAACATA CGCTCTCCAT CAAAACAAAA CGAAACAAAA CAAACTAGCA 3780
AAATAGGCTG TCCCCAGTGC AAGTGCAGGT GCCAGAACAT TTCTCTATCG ATA        3833
(SEQ ID NO:1)
其中,
7-32:AdaP6为载体5′端通用引物
33-58:AdaP5为载体5′端通用引物
74-102:MCS(多克隆位点区,启动子和目的基因克隆在这一区域)
110-160:SV40 early mRNA polyA(多聚腺苷酸加尾信号)
210-660:f1 single-strand DN A origin(f1单链DNA复制起点)
801-827:AdaP3为载体3′端通用引物
950-977:AdaP4为载体3′端通用引物
860-1017:SV40 early promoter(part)SV40早期启动子(部分)
1333:ColE1-derived plasmid replication origin(ColE1来源的质粒复制起点)
2095-2955:Ampr(氨苄青霉素抗性基因)
3087-3542:f1 single-strand DNA origin(f1单链DNA复制起点)
3673-3826:Synthetic poly(A)signal(多聚腺苷酸加尾信号)(参见图1描述载体的各个元件)。
利用所述载体的转基因及整合位点鉴定的标准化方法的步骤为:
a将启动子和目的基因克隆在这一载体的多克隆位点区(MCS),以NotI酶切,回收两个NotI酶切位点之间的线性化片段用于转基因。
b用适当的方法的方法获得转基因生物或细胞后,按图2所示的流程进行整合位点鉴定。
本发明还提供了一种整合位点明确的转基因小鼠资源库,资源库中每一种转基因动物转基因定位及被破坏内源基因明确。
在本发明还提供了一种转基因动物基因型鉴定的方法,包括以下步骤:
a利用本发明上述方法获得转基因整合位点及其附近的基因组序列;
b根据转基因整合位点附近序列(载体侧翼)设计的引物1,根据整合位点另一侧野生型基因组序列设计引物2与引物1配对,根据载体序列设计引物3与引物1配对,以转基因基因组为模板,三引物在同一体系中进行PCR,则有三种结果分别代表三种基因型(见图6)。
本发明的主要优点在于:
(a)可以快速鉴定转基因的整合位点。
(b)准确性高。
(c)通用性好。
下面结合具体实施例,进一步阐述本发明。应理解,这些实施例仅用于说明本发明而不用于限制本发明的范围。下列实施例中未注明具体条件的实验方法,通常按照常规条件如Sambrook等人,分子克隆:实验室手册(New York:Cold Spring Harbor Laboratory Press,1989)中所述的条件,或按照制造厂商所建议的条件。
实施例1:pEGFP-PLAG1转基因小鼠整合位点鉴定(策略1)
pEGFP-PLAG1转基因质粒是将含PLAG1完整编码框及翻译起始密码前100余个碱基的片段克隆到pCMV-EGFP(购自Clontech)载体的EcoRI位点构建而成,其结构如图4所示。质粒经NsiI酶切后回收3.8kb的片段用于显微注射。
分析上述转基因载体片段序列中酶切位点分布情况,确定以Sau3AI作为限制性内切酶E1酶切转基因小鼠基因组,故设计合成以下接头DNA(两链退火后形成Sau3AI接头):
接头1:5′-GTA ATA CGA CTC ACT ATA GGG CAC GCG TGGTCG ACG GCC CGG GCT GGT-3′(SEQ ID NO:2)
接头2:5′-PO4-GATC ACC AGC CC-N2H-3′(5′-OH用PO4取代,3′-OH用N2H取代)(SEQ ID NO:3)
以TE或水溶解至50pmol/μl,临用前各取5μl(等摩尔数)混合,80℃10分钟后自然降温到室温退火。
以Sau3AI消化5-10μg转基因小鼠基因组DNA,电泳观察酶切完全后,以酚:氯仿抽提,乙醇沉淀纯化后,DNA定量。取约0.5μg酶切回收后DNA与退火后的接头DNA按一定比例混合(摩尔数1∶50),T4DNA连接酶(Biolabs)连接过夜。70℃,15min灭活连接酶,以QIAGEN凝胶回收试剂盒纯化连接反应液,溶于灭菌水中。
根据转基因载体序列,PvuII为载体5′端限制性内切酶E2,BglI作为载体3′端限制性内切酶E2,建立两个酶切体系,分别以PvuII、BglI消化上述与接头连接后基因组DNA,以酚:氯仿抽提,乙醇沉淀纯化酶切反应液,溶于TE或灭菌水中。按如下方法进行巢式PCR,扩增载体两侧基因组片段。
根据两端接头序列设计引物:
adaP1:5′-GTA ATA CGA CTC ACT ATA GGG C-3′(SEQ ID NO:4)
adaP2:5′-ACT ATA GGG CAC GCG TGG T-3′(SEQ ID NO:5)
根据载体两端序列设计如下两对引物:
5out:5′-GGG GCG GAG TTG TTA CGA CAT TTT GG-3′(SEQ IDNO:6)
5in:5′-CAA TAG GGG GCG TAC TTG GCA TAT GA-3′(SEQID NO:7)
3out:5′-CAC CTC CCC CTG AAC CTG AAA CAT A-3′(SEQ IDNO:8)
3in:5′-CCC ACT ACG TGA ACC ATC ACC CTA A-3′(SEQ IDNO:9)
以上述纯化PvuII酶切反应液为模板,引物5out与adaP1配对进行第一轮PCR,扩增条件为:95℃3min变性后,94℃30s,65℃30s,72℃30s,30个循环后72℃延伸5min。以第一轮PCR反应液为模板,引物5in与adaP2配对进行第二轮PCR,扩增条件为:95℃3min变性后,94℃30s,66℃30s,72℃30s,30个循环后72℃延伸5min。电泳检测扩增条带,凝胶回收后测序或T-A克隆后测序获得载体5′一侧***位点序列。同理,以上述纯化BglI酶切反应液为模板,引物3out与adaP1配对进行第一轮PCR,引物3in与adaP2配对进行第二轮PCR,获得载体3′一侧***位点序列。
根据测序结果在Genbank(www.ncbi.nlm.nih.gov)和UCSC小鼠基因组序列数据库(www.genome.ucsc.edu)进行序列比对,确定转基因载体***位置及其侧翼序列。
实施例2:pEGFP-PLAG1转基因小鼠整合位点鉴定(策略2)
设计合成以下接头DNA(两链退火后形成平末端接头):
接头1:5′-GTA ATA CGA CTC ACT ATA GGG CAC GCG TGGTCG ACG GCC CGG GCT GGT-3′(SEQ ID NO:10)
接头2:5′-PO4-ACC AGC CC-N2H-3′(5′-OH用PO4取代,3′-OH用N2H取代)(SEQ ID NO:11)
以TE或水溶解至50pmol/μl,临用前各取5μl(等摩尔数)混合,80℃10分钟后自然降温到室温退火。
分析如实施例1中图示的转基因载体序列,找出一系列不切割载体DNA的产生平末端的限制性内切酶EcoRV、NruI、PmacI、XmnI、PshAI、BstZ17I。
取5-10μg转基因小鼠基因组DNA,依次以EcoRV、NruI、PmacI、XmnI消化(即一种酶消化后65℃15min灭活酶,乙醇沉淀纯化后,换另一种酶切),电泳观察酶切完全后,以酚:氯仿抽提,乙醇沉淀纯化后,DNA定量。取约0.5μg酶切回收后DNA与退火后的接头DNA按一定比例混合(摩尔数1∶50),T4DNALigase(Biolabs)连接过夜。70℃,15min灭活连接酶,以QIAGEN凝胶回收试剂盒纯化连接反应液,溶于TE或灭菌水中。
根据两端接头序列设计引物:
adaP1:5′-GTA ATA CGA CTC ACT ATA GGG C-3′(SEQ ID NO:12)
adaP2:5′-ACT ATA GGG CAC GCG TGG T-3′(SEQ ID NO:13)
根据载体两端序列设计如下两对引物:
5out2:5′-AGC GCT AGC GGA TCT GAC GGT TCA CTA A-3′(SEQ ID NO:14)
5in2:5′-GGA AAT CCC CGT GAG TCA AAC CGC TAT C-3′(SEQ ID NO:15)
3out2:5′-AAG TAC CAC CCT CCC ACG TTT CCA TCA A-3′(SEQ ID NO:16)
3in2:5′-GCT ACA GGG CGC GTC AGG TGG CAC TTT-3′(SEQ ID NO:17)
以上述纯化连接反应液为模板,引物5out2与adaP1配对,进行第一轮PCR,扩增条件为:95℃3min变性后,94℃30s,68℃30s,72℃30s,30个循环后72℃延伸5min。以第一轮PCR反应液为模板,引物5in2与adaP2配对进行第二轮PCR,扩增条件为:95℃3min变性后,94℃30s,68℃30s,72℃30s,30个循环后72℃延伸5min。电泳检测扩增条带,凝胶回收后测序或T-A克隆后测序获得载体5′一侧***位点序列。同理,以上述纯化BglI酶切反应液为模板,引物3out2与adaP1配对进行第一轮PCR,引物3in2与adaP2配对进行第二轮PCR,获得载体3′一侧***位点序列。
根据测序结果在Genbank(www.ncbi.nlm.nih.gov)和UCSC小鼠基因组序列数据库(www.genome.ucsc.edu)进行序列比对,确定***位置及其侧翼序列。
实施例3:利用通用载体Inte-vector建立转基因小鼠系及转基因小鼠整合位点鉴定
将IAP启动子和基因KIF18A3(第1到11外显子)cDNA序列克隆在通用载体Inte-vector(序列SEQ ID NO:1所示)的多克隆位点区的XhoI与BamHI位点间,完成转基因质粒构建,以NotI酶切,回收两个NotI酶切位点之间的线性化片段用于转基因。
按照实施例1所述方法以Sau3AI消化转基因小鼠基因组,纯化后与接头连接(同实施例1)
按照通用载体序列,PvuII为载体5′端限制性内切酶E2,KpnI为载体3′端限制性内切酶E2,建立两个酶切体系,分别以PvuII、KpnI消化上述与接头连接后基因组DNA,以酚:氯仿抽提,乙醇沉淀纯化酶切反应液,溶于TE或灭菌水中。按如下方法进行巢式PCR,扩增载体两侧基因组片段。
通用引物序列如下:
AdaP1:GTAATACGACTCACTATAGGGC(SEQ ID NO:18)
AdaP2:ACTATAGGGCACGCGTGGT(SEQ ID NO:19)
AdaP3:GCTACAGGGCGCGTCAGGTGGCACTTT(SEQ ID NO:20)
AdaP4:AGGCGGAAAGAACCAGCTGTGGAATGTG(SEQ ID NO:21)
AdaP5:GGGGCGGAGTTGTTACGACATTTTGG(SEQ ID NO:22)
AdaP6:CAATAGGGGGCGTACTTGGCATATGA(SEQ ID NO:23)
其中,AdaP3、AdaP4、AdaP5、AdaP6在载体中的相应位置见发明内容中通用载体图注。
以上述纯化PvuII酶切反应液为模板,引物AdaP5与adaP1配对,引物AdaP6与adaP2配对进行第二轮PCR,电泳检测扩增条带,凝胶回收后测序或T-A克隆后测序获得载体5′一侧***位点序列。同理,以上述纯化KpnI酶切反应液为模板,引物AdaP3与adaP1配对进行第一轮PCR,引物AdaP4与adaP2配对进行第二轮PCR,获得载体3′一侧***位点序列。
根据测序结果在Genbank(www.ncbi.nlm.nih.gov)和UCSC小鼠基因组序列数据库(www.genome.ucsc.edu)进行序列比对,确定***位置及其侧翼序列。
实施例4
在本实施例中,利用实施例1和2中所示的方法,对pEGFP-PLAG1转基因小鼠8个系的整合位点及***后破坏基因进行了鉴定。结果如下表1所示。
表1
 L  Left  interrupted gene  Right
 14  N  chr4_13.39(67690518-67782196)exon<4/4  chr4:67781883
 21  Chr2:109437866  chr2_21.103(109472855-109482346)exon 1-4;Kif18a(p866)(109410187-109471194)exon 12-17;Kif18a(p571)(109410301-109440284)exon 12-12  Chr2:109488756
 22  Chr2:4672958  E130319B15Rik(p433)(4636319-4719052)exon 6-6/9;E130319B15Rik(p141)(4668127-4720629)exon 3-3/6  Chr2:4688617
 26  N  Lifr(6941287-7065942)exon>5(6947560),<6/14(7030873);chr15_1.108(6987375-7025196)exon<3/8;chr15_1.107  Chr15:6994521
 29  chr5:71831803  Atp10d(71802993-71897767)exon3-4/12  Chr5:71834610
 32  E.coli 12741  E.coli 8438
 39  chr8:82303037  chr8_16.123(82258542-82344945)  chr8:82306482
 67  N  chr4_18.35(92616643-92781992)  Chr4:92750721
L表示品系;
Left表示载体5′端***位点;
Right表示载体3′端如***位点;
Interrupted gene表示被破坏的内源基因。
其中,21系小鼠表现出雄性小鼠不育的表型,进一步研究表明此表型与内源基因kif18A功能破坏密切相关。
在本发明提及的所有文献都在本申请中引用作为参考,就如同每一篇文献被单独引用作为参考那样。此外应理解,在阅读了本发明的上述讲授内容之后,本领域技术人员可以对本发明作各种改动或修改,这些等价形式同样落于本申请所附权利要求书所限定的范围。
序列表
<110>王,铸刚
<120>一种快速方便转基因***位点鉴定技术
<130>059989
<160>23
<170>PatentIn version 3.3
<210>1
<211>3833
<212>DNA
<213>人工序列
<220>
<221>misc_feature
<223>载体
<400>1
ggtacctcat atgccaagta cgccccctat tgccaaaatg tcgtaacaac tccgccccgc     60
tgtacaagta ctcagatctc gagctcaagc ttcgaattcc gggatccacc ggatctagat    120
aactgatcat aatcagccat accacatttg tagaggtttt acttgcttta aaaaacctcc    180
cacacctccc cctgaacctg aaacataaaa tgaatgcaat tgttgttgtt aacttgttta    240
ttgcagctta taatggttac aaataaagca atagcatcac aaatttcaca aataaagcat    300
ttttttcact gcattctagt tgtggtttgt ccaaactcat caatgtatct taacgcgtaa    360
attgtaagcg ttaatatttt gttaaaattc gcgttaaatt tttgttaaat cagctcattt    420
tttaaccaat aggccgaaat cggcaaaatc ccttataaat caaaagaata gaccgagata    480
gggttgagtg ttgttccagt ttggaacaag agtccactat taaagaacgt ggactccaac    540
gtcaaagggc gaaaaaccgt ctatcagggc gatggcccac tacgtgaacc atcaccctaa    600
tcaagttttt tggggtcgag gtgccgtaaa gcactaaatc ggaaccctaa agggagcccc    660
cgatttagag cttgacgggg aaagccggcg aacgtggcga gaaaggaagg gaagaaagcg    720
aaaggagcgg gcgctagggc gctggcaagt gtagcggtca cgctgcgcgt aaccaccaca    780
cccgccgcgc ttaatgcgcc gctacagggc gcgtcaggtg gcacttttcg gggaaatgtg    840
cgcggaaccc ctatttgttt atttttctaa atacattcaa atatgtatcc gctcatgaga    900
caataaccct gataaatgct tcaataatat tgaaaaagga agagtcctga ggcggaaaga    960
accagctgtg gaatgtgtgt cagttagggt gtggaaagtc cccaggctcc ccagcagcgg   1020
ccgcgtcgac cgatgccctt gagagccttc aacccagtca gctccttccg gtgggcgcgg   1080
ggcatgacta tcgtcgccgc acttatgact gtcttcttta tcatgcaact cgtaggacag   1140
gtgccggcag cgctcttccg cttcctcgct cactgactcg ctgcgctcgg tcgttcggct   1200
gcggcgagcg gtatcagctc actcaaaggc ggtaatacgg ttatccacag aatcagggga   1260
taacgcagga aagaacatgt gagcaaaagg ccagcaaaag gccaggaacc gtaaaaaggc   1320
cgcgttgctg gcgtttttcc ataggctccg cccccctgac gagcatcaca aaaatcgacg   1380
ctcaagtcag aggtggcgaa acccgacagg actataaaga taccaggcgt ttccccctgg   1440
aagctccctc gtgcgctctc ctgttccgac cctgccgctt accggatacc tgtccgcctt   1500
tctcccttcg ggaagcgtgg cgctttctca tagctcacgc tgtaggtatc tcagttcggt   1560
gtaggtcgtt cgctccaagc tgggctgtgt gcacgaaccc cccgttcagc ccgaccgctg   1620
cgccttatcc ggtaactatc gtcttgagtc caacccggta agacacgact tatcgccact   1680
ggcagcagcc actggtaaca ggattagcag agcgaggtat gtaggcggtg ctacagagtt   1740
cttgaagtgg tggcctaact acggctacac tagaagaaca gtatttggta tctgcgctct   1800
gctgaagcca gttaccttcg gaaaaagagt tggtagctct tgatccggca aacaaaccac   1860
cgctggtagc ggtggttttt ttgtttgcaa gcagcagatt acgcgcagaa aaaaaggatc   1920
tcaagaagat cctttgatct tttctacggg gtctgacgct cagtggaacg aaaactcacg   1980
ttaagggatt ttggtcatga gattatcaaa aaggatcttc acctagatcc ttttaaatta   2040
aaaatgaagt tttaaatcaa tctaaagtat atatgagtaa acttggtctg acagttacca   2100
atgcttaatc agtgaggcac ctatctcagc gatctgtcta tttcgttcat ccatagttgc   2160
ctgactcccc gtcgtgtaga taactacgat acgggagggc ttaccatctg gccccagtgc   2220
tgcaatgata ccgcgagacc cacgctcacc ggctccagat ttatcagcaa taaaccagcc   2280
agccggaagg gccgagcgca gaagtggtcc tgcaacttta tccgcctcca tccagtctat   2340
taattgttgc cgggaagcta gagtaagtag ttcgccagtt aatagtttgc gcaacgttgt   2400
tgccattgct acaggcatcg tggtgtcacg ctcgtcgttt ggtatggctt cattcagctc   2460
cggttcccaa cgatcaaggc gagttacatg atcccccatg ttgtgcaaaa aagcggttag   2520
ctccttcggt cctccgatcg ttgtcagaag taagttggcc gcagtgttat cactcatggt   2580
tatggcagca ctgcataatt ctcttactgt catgccatcc gtaagatgct tttctgtgac   2640
tggtgagtac tcaaccaagt cattctgaga atagtgtatg cggcgaccga gttgctcttg   2700
cccggcgtca atacgggata ataccgcgcc acatagcaga actttaaaag tgctcatcat   2760
tggaaaacgt tcttcggggc gaaaactctc aaggatctta ccgctgttga gatccagttc   2820
gatgtaaccc actcgtgcac ccaactgatc ttcagcatct tttactttca ccagcgtttc   2880
tgggtgagca aaaacaggaa ggcaaaatgc cgcaaaaaag ggaataaggg cgacacggaa   2940
atgttgaata ctcatactct tcctttttca atattattga agcatttatc agggttattg   3000
tctcatgagc ggatacatat ttgaatgtat ttagaaaaat aaacaaatag gggttccgcg   3060
cacatttccc cgaaaagtgc cacctgacgc gccctgtagc ggcgcattaa gcgcggcggg   3120
tgtggtggtt acgcgcagcg tgaccgctac acttgccagc gccctagcgc ccgctccttt   3180
cgctttcttc ccttcctttc tcgccacgtt cgccggcttt ccccgtcaag ctctaaatcg   3240
ggggctccct ttagggttcc gatttagtgc tttacggcac ctcgacccca aaaaacttga   3300
ttagggtgat ggttcacgta gtgggccatc gccctgatag acggtttttc gccctttgac   3360
gttggagtcc acgttcttta atagtggact cttgttccaa actggaacaa cactcaaccc   3420
tatctcggtc tattcttttg atttataagg gattttgccg atttcggcct attggttaaa   3480
aaatgagctg atttaacaaa aatttaacgc gaattttaac aaaatattaa cgcttacaat   3540
ttgccattcg ccattcaggc tgcgcaactg ttgggaaggg cgatcggtgc gggcctcttc   3600
gctattacgc cagcccaagc taccatgata agtaagtaat attaaggtac gggaggtact   3660
tggagcggcc gcaataaaat atctttattt tcattacatc tgtgtgttgg ttttttgtgt   3720
gaatcgatag tactaacata cgctctccat caaaacaaaa cgaaacaaaa caaactagca   3780
aaataggctg tccccagtgc aagtgcaggt gccagaacat ttctctatcg ata          3833
<210>2
<211>48
<212>DNA
<213>人工序列
<220>
<221>misc_feature
<223>接头
<400>2
gtaatacgac tcactatagg gcacgcgtgg tcgacggccc gggctggt                  48
<210>3
<211>12
<212>DNA
<213>人工序列
<220>
<221>misc_feature
<223>接头
<400>3
gatcaccagc cc                                                         12
<210>4
<211>22
<212>DNA
<213>人工序列
<220>
<221>misc_feature
<223>引物
<400>4
gtaatacgac tcactatagg gc                                              22
<210>5
<211>19
<212>DNA
<213>人工序列
<220>
<221>misc_feature
<223>引物
<400>5
actatagggc acgcgtggt                              19
<210>6
<211>26
<212>DNA
<213>人工序列
<220>
<221>misc_feature
<223>引物
<400>6
ggggcggagt tgttacgaca ttttgg                      26
<210>7
<211>26
<212>DNA
<213>人工序列
<220>
<221>misc_feature
<223>引物
<400>7
caataggggg cgtacttggc atatga                      26
<210>8
<211>25
<212>DNA
<213>人工序列
<220>
<221>misc_feature
<223>引物
<400>8
cacctccccc tgaacctgaa acata                       25
<210>9
<211>25
<212>DNA
<213>人工序列
<220>
<221>misc_feature
<223>引物
<400>9
cccactacgt gaaccatcac cctaa                       25
<210>10
<211>48
<212>DNA
<213>人工序列
<220>
<221>misc_feature
<223>接头
<400>10
gtaatacgac tcactatagg gcacgcgtgg tcgacggccc gggctggt    48
<210>11
<211>8
<212>DNA
<213>人工序列
<220>
<221>misc_feature
<223>接头
<400>11
accagccc                                                 8
<210>12
<211>22
<212>DNA
<213>人工序列
<220>
<221>misc_feature
<223>引物
<400>12
gtaatacgac tcactatagg gc                                22
<210>13
<211>19
<212>DNA
<213>人工序列
<220>
<221>misc_feature
<223>引物
<400>13
actatagggc acgcgtggt                                    19
<210>14
<211>28
<212>DNA
<213>人工序列
<220>
<221>misc_feature
<223>引物
<400>14
agcgctagcg gatctgacgg ttcactaa                          28
<210>15
<211>28
<212>DNA
<213>人工序列
<220>
<221>misc_feature
<223>引物
<400>15
ggaaatcccc gtgagtcaaa ccgctatc                28
<210>16
<211>28
<212>DNA
<213>人工序列
<220>
<221>misc_feature
<223>引物
<400>16
aagtaccacc ctcccacgtt tccatcaa                28
<210>17
<211>27
<212>DNA
<213>人工序列
<220>
<22t>misc_feature
<223>引物
<400>17
gctacagggc gcgtcaggtg gcacttt                 27
<210>18
<211>22
<212>DNA
<213>人工序列
<220>
<221>misc_feature
<223>引物
<400>18
gtaatacgac tcactatagg gc                      22
<210>19
<211>19
<212>DNA
<213>人工序列
<220>
<221>misc_feature
<223>引物
<400>19
actatagggc acgcgtggt                          19
<210>20
<211>27
<212>DNA
<213>人工序列
<220>
<221>misc_feature
<223>引物
<400>20
gctacagggc gcgtcaggtg gcacttt               27
<210>21
<211>28
<212>DNA
<213>人工序列
<220>
<221>misc_feature
<223>引物
<400>21
aggcggaaag aaccagctgt ggaatgtg             28
<210>22
<211>26
<212>DNA
<213>人工序列
<220>
<221>misc_feature
<223>引物
<400>22
ggggcggagt tgttacgaca ttttgg               26
<210>23
<211>26
<212>DNA
<213>人工序列
<220>
<221>misc_feature
<223>引物
<400>23
caataggggg cgtacttggc atatga               26

Claims (10)

1.一种确定转基因***位点的方法,其特征在于,包括步骤:
(a)对于待确定转基因***位点的基因组DNA,用限制性内切酶进行消化,从而获得消化后的基因组片段,然后在消化后的基因组片段两端连接接头,从而形成在两端带有接头的基因组片段;
(b)以载体序列特异性引物和接头序列特异性引物,对步骤(a)中两端带有接头的基因组片段进行PCR扩增,从而获得PCR产物,其中所述的PCR产物对应于位于载体与接头之间的基因组DNA序列;
(c)对步骤(b)中的PCR产物进行测序;
(d)根据步骤(c)的测序结果,确定转基因的***位点。
2.如权利要求1所述的方法,其特征在于,步骤(a)中所述的限制性内切酶选自下组:
(i).将基因组DNA切割为平均长度小于1kb片段的一种限制性内切酶;
(ii).数种限制性内切酶的混合物,其中所述的数种(2-10种)限制性内切酶是产生相同粘性末端的限制性内切酶,并且所述的混合物将基因组DNA切割为平均长度小于1kb片段;
(iii)数种限制性内切酶的混合物,其中所述的数种(2-10种)限制性内切酶是产生相同平头末端的限制性内切酶,并且所述的混合物将基因组DNA切割为平均长度小于1kb片段;
附加条件是,如果若选用的第一限制性内切酶E1可以切割载体序列,在步骤(b)与(c)之间加步骤(b′):即在添加接头之后,用可切断位于两个E1间载体头尾相连部的第二限制性内切酶E2消化已加接头的连接产物。
3.如权利要求1所述的方法,其特征在于,所述的限制性内切酶选自下组:
●一种在基因组中识别位点序列为4个或5个碱基的限制性内切酶:
Sau3AI、MspI、NdeII、AccII、AluI、HphI、MboII;
●切割后产生相同粘性末端的数种同尾酶的组合:BamHI、BglII、BclI、MboI、XhoII的组合;NheI、XbaI、SpeI、AvrII的组合;
●产生平末端的数种限制性内切酶的组合:EcoRV、NruI、PmacI、XmnI、PshAI、BstZ17I、SmaI、SspI、PvuII等产生平末端的酶的组合。
4.如权利要求3所述的方法,其特征在于,所述的第二限制性内切酶E2的具有以下特征:
●是与第一限制性内切酶不同的限制性内切酶,
●可以切断两个E1间载体头尾相连部的限制性内切酶,
●不切割两个E1间载体/基因组接合部的载体序列。
5.如权利要求1所述的方法,其特征在于,所述的接头具有以下特征:
a.接头是由两条单链DNA退火而成,退火后接头双链端形成能与限制性内切酶切割后产生的末端匹配的末端结构;
b.接头中两条单链DNA长度不同,一条较长,其长度范围为40bp-100bp,在其单链区可以作为两条巢式引物的模板;而另一条较短,其长度范围为6-20bp,其5′端碱基磷酸化,3′端碱基氨基化;
c.接头序列单链区不能与限制性内切酶消化后转基因载体/基因组结合部的载体序列区任何一段序列相同。
6.如权利要求1所述的方法,其特征在于,所述的载体序列特异性引物具有以下特征:
●引物序列的选择以限制性内切酶消化后转基因载体/基因组结合部的载体序列为模板,
●引物序列可以与接头序列特异性引物配对用于PCR反应。
7.如权利要求1所述的方法,其特征在于,所述基因组DNA是哺乳动物的基因组DNA、或植物细胞的基因组DNA。
8.如权利要求1所述的方法,其特征在于,在步骤(d)中,还包括:
(1)根据测序结果,确定转基因片段***后基因组结构有无变化(如缺失或重排);或者
(2)进行转基因表达与表型的因果关系分析;或者
(3)进行转基因基因型的鉴定。
9.如权利要求8所述的方法,其特征在于,所述的转基因基因型鉴定包括步骤:
以转基因的基因组DNA为模板,用第一、第二和第三引物在同一体系中进行PCR扩增,
其中,第一引物的序列对应于转基因整合位点附近序列(载体侧翼)的序列;
第二引物的序列对应于整合位点另一侧野生型基因组的序列,并且第一引物和第二引物构成第一引物对;
第三引物的序列对应于载体序列,并且第一引物和第三引物构成第二引物对;
其中,根据以下标准判断基因型:
如果只出现第一引物对的扩增产物,就表明是野生型;
如果只出现第二引物对的扩增产物,就表明是转基因纯合型;
如果同时出现第一引物对的扩增产物和第二引物对的扩增产物,就表明是转基因杂合型。
10.一种用于权利要求1所述的方法的转基因载体,其特征在于,所述的载体是具有SEQ ID NO:1所示序列的载体。
CN 200610023132 2006-01-06 2006-01-06 一种快速方便转基因***位点鉴定技术 Pending CN1995384A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN 200610023132 CN1995384A (zh) 2006-01-06 2006-01-06 一种快速方便转基因***位点鉴定技术

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN 200610023132 CN1995384A (zh) 2006-01-06 2006-01-06 一种快速方便转基因***位点鉴定技术

Publications (1)

Publication Number Publication Date
CN1995384A true CN1995384A (zh) 2007-07-11

Family

ID=38250586

Family Applications (1)

Application Number Title Priority Date Filing Date
CN 200610023132 Pending CN1995384A (zh) 2006-01-06 2006-01-06 一种快速方便转基因***位点鉴定技术

Country Status (1)

Country Link
CN (1) CN1995384A (zh)

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101956003A (zh) * 2010-08-12 2011-01-26 东北农业大学 猪基因组中外源基因整合位点的检测方法
CN102753686A (zh) * 2009-12-14 2012-10-24 丰田自动车株式会社 Dna微阵列中的探针设计方法、具有利用该方法设计的探针的dna微阵列
CN102939389A (zh) * 2009-12-17 2013-02-20 基因组研究有限公司 基于体细胞获得性重排的诊断方法
CN103320522A (zh) * 2013-07-16 2013-09-25 深圳华大基因研究院 确定人***样本基因组中hpv整合位点的方法和***
CN107419021A (zh) * 2017-08-15 2017-12-01 天津农学院 一种小麦外源基因***位点的鉴定方法
CN108034706A (zh) * 2018-01-16 2018-05-15 浙江大学 利用重测序技术快速确定转基因株系***位点的方法
CN109554447A (zh) * 2018-12-19 2019-04-02 武汉波睿达生物科技有限公司 慢病毒载体在car-t细胞中的整合位点分析方法及引物
CN111961707A (zh) * 2020-10-14 2020-11-20 苏州贝康医疗器械有限公司 一种核酸文库构建方法及其在植入前胚胎染色体结构异常分析中的应用

Cited By (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102753686A (zh) * 2009-12-14 2012-10-24 丰田自动车株式会社 Dna微阵列中的探针设计方法、具有利用该方法设计的探针的dna微阵列
CN102753686B (zh) * 2009-12-14 2015-09-09 丰田自动车株式会社 Dna微阵列中的探针设计方法、具有利用该方法设计的探针的dna微阵列
US10214769B2 (en) 2009-12-14 2019-02-26 Toyota Jidosha Kabushiki Kaisha Method for designing probe in DNA microarray, and DNA microarray provided with probe designed thereby
CN102939389B (zh) * 2009-12-17 2016-11-16 基因组研究有限公司 基于体细胞获得性重排的诊断方法
CN102939389A (zh) * 2009-12-17 2013-02-20 基因组研究有限公司 基于体细胞获得性重排的诊断方法
CN101956003A (zh) * 2010-08-12 2011-01-26 东北农业大学 猪基因组中外源基因整合位点的检测方法
CN103320522A (zh) * 2013-07-16 2013-09-25 深圳华大基因研究院 确定人***样本基因组中hpv整合位点的方法和***
US9695483B2 (en) 2013-07-16 2017-07-04 Bgi Biotechnology (Wuhan) Co., Ltd. Method of determining HPV integration site in genome of human tissue sample, system and use thereof
CN103320522B (zh) * 2013-07-16 2016-03-30 深圳华大基因研究院 确定人***样本基因组中hpv整合位点的方法和***
CN107419021A (zh) * 2017-08-15 2017-12-01 天津农学院 一种小麦外源基因***位点的鉴定方法
CN108034706A (zh) * 2018-01-16 2018-05-15 浙江大学 利用重测序技术快速确定转基因株系***位点的方法
CN109554447A (zh) * 2018-12-19 2019-04-02 武汉波睿达生物科技有限公司 慢病毒载体在car-t细胞中的整合位点分析方法及引物
CN111961707A (zh) * 2020-10-14 2020-11-20 苏州贝康医疗器械有限公司 一种核酸文库构建方法及其在植入前胚胎染色体结构异常分析中的应用
CN111961707B (zh) * 2020-10-14 2021-01-15 苏州贝康医疗器械有限公司 一种核酸文库构建方法及其在植入前胚胎染色体结构异常分析中的应用

Similar Documents

Publication Publication Date Title
CN1995384A (zh) 一种快速方便转基因***位点鉴定技术
CN104342410B (zh) 一种酮还原酶突变体及其制备方法
CN104342411B (zh) 活性增强的酮还原酶突变体、编码序列及其制备方法
CN104342412B (zh) 用于生产(s)-4-氯-3-羟基丁酸乙酯的酮还原酶突变体
CN113584134B (zh) 一种基于CRISPR-Cas9的等温核酸检测***及其方法和应用
CN104342406B (zh) 热稳定性增强的甲酸脱氢酶突变体及其制备方法
CN104694452B (zh) 一种高产普鲁兰酶的重组枯草芽孢杆菌及其构建方法
US20030124523A1 (en) Organic compounds
CN112522205B (zh) 一种过表达血管紧张素转换酶2的细胞系及其制备方法与应用
US20040101520A1 (en) Recombination method
KR20130078265A (ko) 감염력이 있는 구제역바이러스 O형 cDNA 클론 및 클론의 전체염기서열
CN101492685A (zh) 一种重组表达载体的基因序列及其构建方法
CN109097392A (zh) 一种基于PiggyBac载体的Her2-CAR-T***构建方法
CN113846019B (zh) 一种海洋微拟球藻靶向表观基因组遗传调控方法
CN115161251A (zh) 一种根瘤菌hh103的多基因突变体及应用
Takahashi et al. A plasmid that improves the efficiency of foreign gene expression by intracellular T7 RNA polymerase
CN107828876B (zh) 可共价结合底物的标签蛋白在clip中的应用
CN113755518A (zh) 一种构建重组解脂耶氏酵母的方法与应用
CN114085868A (zh) 一种打靶载体、重组Huh7细胞系及构建方法和应用
KR20130048562A (ko) Mis18α 유전자 넉아웃 생쥐모델 및 그의 제조방법
US20040154046A1 (en) Gfp expression vector localized in mitochondria
US20030145343A1 (en) Transgenic animals expressing human p25
KR102422842B1 (ko) 크리스퍼 간섭을 이용한 rna 번역 조절용 조성물
CN113025651B (zh) 靶向HBV核心启动子的药物筛选细胞模型、Triciribine及结构类似物新应用
CN113528450B (zh) 一种水稻原生质体高效生物素标记体系的建立及应用

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C02 Deemed withdrawal of patent application after publication (patent law 2001)
WD01 Invention patent application deemed withdrawn after publication