CN100347298C - 鱼类肌肉生长抑素mstn基因克隆及其基因打靶载体构建 - Google Patents
鱼类肌肉生长抑素mstn基因克隆及其基因打靶载体构建 Download PDFInfo
- Publication number
- CN100347298C CN100347298C CNB2005101047684A CN200510104768A CN100347298C CN 100347298 C CN100347298 C CN 100347298C CN B2005101047684 A CNB2005101047684 A CN B2005101047684A CN 200510104768 A CN200510104768 A CN 200510104768A CN 100347298 C CN100347298 C CN 100347298C
- Authority
- CN
- China
- Prior art keywords
- gene
- mstn
- sequence
- fish
- neo
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Landscapes
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
- Enzymes And Modification Thereof (AREA)
Abstract
一种鱼类肌肉生长抑素MSTN基因及其基因打靶载体,它的方法是分离克隆了花鲈MSTN基因,其全长为4873bp,包括3个外显子,2个内含子,5’调控序列和非翻译区以及3’非翻译区。根据测定出的花鲈MSTN基因序列,设计引物,扩增得到该基因的一个3.2KB的长片段和一个1.5KB的短片段,将这两个片段依次连接到pBSII+KS载体上,获得重组载体p+MSTN3.2+MSTN1.5,然后将正选择标记基因neo片段连接到上述MSTN基因长片段和短片段的中间,形成p+MSTN3.2+MSTN1.5+neo的重组载体;最后将负选择标记基因SVTK-tk片段连接到上述长片段的侧翼,最后获得p+MSTN3.2+MSTN1.5+neo+tk的基因打靶载体。本发明克隆了鱼类MSTN全长基因,并首次构建了鱼类MSTN基因打靶载体,可用于各种鱼类MSTN基因克隆及基因打靶载体的构建,在鱼类基因工程育种上具有重要应用价值。
Description
所属技术领域:
本发明属于生物技术领域中的鱼类基因工程技术,是一种能在鱼类遗传改良中应用的鱼类肌肉生长抑制基因及其基因打靶载体。
背景技术:
肌肉生长抑素基因(myostatin,MSTN)是1997年发现的转录生长因子(TGF-β)家族的一个成员(McPherron,等,1997,美国Johns Hopkins大学),对骨骼肌的发育和生长具有负调控作用,该基因缺失会导致骨骼肌增生(McPherron,等,1997;Grobet等,2003,比利时Liège大学)。在小鼠上研究发现,通过基因敲除使MSTN基因C端生物活性区缺失的小鼠骨骼肌比普通野生小鼠增加了2-3倍。随后,McPherron等(1997)发现双肌牛中该基因发生突变,导致双肌牛肌肉产量比普通牛增加了30%。由于MSTN基因对肌肉生长具有负调控作用,因此受到广泛关注,大量的哺乳动物特别是家畜的MSTN基因已被克隆出来,MSTN基因的功能及应用研究也在大量进行,目前,MSTN基因相关研究已成为分子生物学领域的研究热点。
在鱼类,到目前为止,仅有少数几种鱼类的MSTN基因被克隆,包括沟鲶(Kocabas等,2002,美国奥本大学);金鲷(Maccatrozzo等,2001,意大利Padova大学);罗非鱼(Rodgers等,2001,美国JohnsHopkins大学)和虹鳟(Rescan等,2001法国鱼类生理实验室)。研究表明,鱼类MSTN基因的结构和哺乳动物MSTN结构相似,都是由3个外显子和2个内含子所组成,外显子和内含子的边界处通过严格的AT-GC连接,C末端是该基因的功能区,具有高度的保守性,在此蛋白生物活性区域有一个4个氨基酸组成的RXXR的蛋白水解酶加工位点,MSTN基因成熟区通过其中9个保守的半胱氨基酸形成二硫键,C末端的“半胱氨酸”结构在所有TGF-β超家族中是保守的,对于MSTN基因的功能活性具有重要作用。体外表达分析显示鱼类的MSTN基因表达不同于哺乳类MSTN基因。目前在斑马鱼上通过反义核酸技术MSTN1转录本表明,敲除的胚胎发育明显加快,通过表型观察发现MSTN1敲除的斑马鱼身体尺寸增加,受精后20小时的敲除MSTN1胚胎在尺寸上和对照组受精后30小时的胚胎大小相似。通过双链RNA干涉技术沉默MSTN转录本,表型观察发现,沉默MSTN基因的斑马鱼成体肌肉含量增加了39%-45%,导致了过度生长。尽管反义核酸技术和双链RNA干涉技术都证实了MSTN基因的功能,但反义核酸技术和双链RNA干涉技术都无法产生稳定突变的鱼类品系,如果通过基因打靶技术将某种鱼类的MSTN基因定点突变,产生稳定遗传的敲除MSTN的转基因鱼,将会提高鱼的肌肉产量和品质。但有关鱼类MSTN基因同源重组载体构建及其定点突变方面,目前国内外未见报道。
发明内容:
本发明的目的是为了克隆鱼类MSTN基因组基因、弄清鱼类MSTN基因的结构以及构建鱼类MSTN基因打靶载体,为鱼类MSTN基因的功能分析及通过基因打靶途径提高鱼的肌肉含量和品质提供基因材料和技术方法。本发明其技术内容如下:
一、花鲈生长抑素(MSTN)基因的克隆:包括:1、基因组DNA序列的获得,2、蛋白氨基酸序列推测和分析,3、基因组结构的分析;二、MSTN基因打靶载体的构建:包括:1、同源长片段和短片段的扩增和连接,2、正选择标记基因neo片段的连接,3、负选择标记基因SVTK-tk基因的连接。
一、鱼类生长抑素(MSTN)全长基因的克隆
鱼类生长抑素(MSTN)基因的克隆:包括:基因组DNA序列的获得、蛋白氨基酸序列的推测和分析、基因组结构的分析。
1.基因组DNA序列的获得:用DNAStar软件对GenBank中其它几种鱼类的cDNA序列和DNA序列比对,根据其保守性很高的区域设计了三对简并引物,扩增并获得了整个MSTN基因组编码区序列,再通过已获得的花鲈MSTN序列,设计特异引物,通过基因组步移技术扩增出花鲈MSTN基因的5’和3’非编码序列,得到了全长的基因组序列。
2.蛋白氨基酸序列的推测和分析:根据外显子和内含子交界处的特征GT...AG,分析基因各外显子和内含子位置,用EditSeq软件分析ORF阅读框和推测蛋白质序列,用BioEdit软件对蛋白质序列进行比对分析。将推测的蛋白质序列与美国GENBANK序列数据库中其他物种的MSTN蛋白序列进行比对,用BLASTX程序算出同源性。
3、基因组结构的分析:将基因组DNA序列和蛋白序列与美国GENBANK序列数据库中已存的DNA序列进行比对,结构分析表明该基因组DNA全长4873bp,包括三个外显子(分别为378bp、366bp、381bp),二个内含子(454bp、758bp)及1170bp的5’非翻译区,1366bp的3’非翻译区。在5’非翻译区上发现了一个TATA框和7个肌肉特异性的E框。
二、MSTN基因打靶载体的构建
MSTN基因打靶载体的构建采用正-负选择策略设计同源重组打靶载体。包括长片段和短片段的扩增、长片段和短片段的连接;正选择基因neo的连接;负选择基因tk基因的连接。最终成功的构建了花鲈MSTN同源重组基因打靶载体。
1.同源长片段和短片段的扩增和连接:
根据测定出的花鲈MSTN全长基因组的序列,设计一对含有适当酶切位点(XbaI和BamHI)的特异引物,扩增得到一个3.2KB的长片段;再设计一对含有酶切位点(BamHI和SalI)的特异引物,扩增得到一个1.5KB的短片段。这两个片段用相应的酶切,纯化后,依次连接到相应酶切的pBSII+KS载体上,经筛选、酶切鉴定获得重组载体p+MSTN3.2+MSTN1.5,进一步经测序证实为正确连接。
2.正选择标记基因neo片段的连接
应用SVTK-neo基因表达盒作为正选择基因引入打靶载体,即将neo基因通过BamHI酶切,连接***到长片段和短片段之间,经筛选、酶切鉴定获得p+MSTN3.2+MSTN1.5+neo的重组载体。
3.负选择标记基因SVTK-tk基因的连接:
应用SVTK-tk基因表达盒作为负选择基因引入打靶载体,即将tk基因通过XbaI酶切,连接***到长片段的侧翼,经筛选、酶切鉴定获得p+MSTN3.2+MSTN1.5+neo+tk的重组载体,如图2所示。
本发明与已有技术对比其特点是:本发明克隆了鱼类MSTN全长基因,包括5‘端调控序列和3’端序列;弄清了该基因的全部序列及结构特征,并首次构建了鱼类MSTN基因打靶载体。可以用于鱼类基因打靶实验。本发明的技术方法可在其它鱼类上进行应用。
附图说明:
图1:花鲈MSTN基因和推导的氨基酸序列
其中5’和3’非翻译区以及内含子序列用小写字母表示;外显子和推定的氨基酸用大写字母表示,氨基酸位于相应的密码子下面,下划线部分为微卫星重复序列,TATA框和肌肉特异性E-框用黑体加下划线表示。
图2:花鲈MSTN基因打靶载体
具体实施方式:
下面以花鲈MSTN基因的克隆和基因打靶载体构建为例,结合附图,对本发明的技术内容进行详细说明。
本发明其技术内容如下:一、花鲈生长抑素(MSTN)基因的克隆:基因组DNA序列的扩增、蛋白氨基酸序列的推测及比对、基因组结构的分析。二、MSTN基因打靶载体的构建:包括MSTN基因的结构分析、同源长片段和短片段的克隆和连接;正选择标记基因neo片段的连接;负选择标记基因tk基因的连接。
一、花鲈生长抑素(MSTN)基因的克隆:
1.DNA序列的扩增和克隆:用设计的三对引物(SP-MSTN1:5’-AATCCAAACCCAGTCCAGTCGC-3’,5’-ATCAGGCGGGAGATTTGCAGGA-3’;SP-MSTN2:5’-CTGCAAATCTCCCGCCTGATGCC-3’,5’-TCTTGCCGTAGATGATCTGCTC-3;SP-MSTN3:5’-TGAAGACTTTGGCTGGGACTGGAT-3’,5’-CTTGAGGATTCCTGGTTTCACT-3’)特异扩增出了花鲈MSTN基因的3个扩增片段,回收纯化后,连接测序,通过3个片段的重叠部分,将3个片段拼接起来,获得了整个编码区的序列,再根据已测序的序列,设计了一对特异性的引物AP1:5’-CGCCTCTTGGTCGCTCAAAACTACTG-3’和AP2:5’-CCACATCCTTGTTGTCATCTCCCAGCACG-3’,通过基因组步移技术扩出5’非翻译区,另一对特异性的引物S1:5’-TGGACCGTTGTGGATGCTCTTGAGTTG-3’和S2:5’-CAGAACACGGTGCAATAGAACCAGAGTAG-3’扩出了3’非翻译区,获得了一个全长为4873bp的花鲈基因组序列(图1),具有完整的编码阅读框,起始密码子和终止密码子。
2.蛋白氨基酸序列的推测及比对:根据已经扩增的基因组序列,设计一对引物SPMSTN-5’:5’-GCATCTGTCTCAGATTGTGCTGTATC-3’和SPMSTN-3’:5’-TCAAGAGCATCCACAACGGTCCAC-3’,扩增并测序了花鲈整个编码的cDNA序列,推测出MSTN编码的蛋白氨基酸序列,同时也证实了以上克隆的基因组序列的正确性。将cDNA和基因组DNA的序列与美国GENBANK序列数据库中已存的DNA序列进行比对,用BLASTN和BLASTX程序计算我们获得的cDNA克隆片段与GENBANK序列数据库中已存的DNA序列的同源性。通过分析蛋白氨基酸序列,在C末端发现了9个保守的半胱氨基酸残基和一个RVRR(与RXXR相匹配)的蛋白酶解加工位点。这9个保守的半胱氨基酸残基提供二硫键形成位点,对于MSTN蛋白活性功能的形成具有重要的作用。
3.DNA序列分析:通过外显子和内含子交界处的特征GT...AG,以及GenBank中其他物种MSTN基因序列的特征,分析花鲈MSTN基因,结构分析表明该基因组DNA全长4873bp,包括三个外显子(分别为378bp、366bp、381bp),二个内含子(454bp、758bp)及1170bp的5’非翻译区,1366bp的3’非翻译区。在5’非翻译区上发现了一个TATA框和7个肌肉特异性的E框。
二、MSTN基因打靶载体的构建:
1、同源长片段和短片段的克隆和连接:设计了二对引物,MSTN-N1:5`-ATC
GGATCCATCATTGGCGGTTCATCAGTCCCT和MSTN-C1:5`-ATC
GGTGGGTGTGCGGGTACTTCTG扩增了一个3.2KB的长片段,并在5’端引入BamHI酶切位点,在3’末端引入XbaI酶切位点和一段终止序列。基因打靶载体引物设计:另一对引物MSTN-N2:5`-ATC
GTCGACGTCTCCCATCAACATGCTCTAC和MSTN-C2:5`-ATC
CTCCTAATGGAAACAATGGCAT-3’扩增了一个1.5KB的长片段,在其5’端引入SalI酶切位点,在3’末端引入BamHI酶切位点和一段终止序列(引入的酶切位点用单横线表示,终止序列用双横线表示)。克隆获得了预期大小的长片段和短片段,通过相应的酶切长片段和短片段以及pBSII+KS,将长片段和短片段依次连接到载体上,形成了p+MSTN3.2+MSTN1.5质粒载体,并测序证实了MSTN长片段和短片段为正确的连接。
2、正选择标记基因neo片段的连接:
应用SVTK-neo基因表达盒作为正选择基因引入打靶载体,即用BamHI酶切正选择基因NEO基因以及已构建p+MSTN3.2+MSTN1.5质粒载体,将neo基因连接到p+MSTN3.2+MSTN1.5质粒载体上,形成了p+MSTN3.2+MSTN1.5+neo的质粒载体,经酶切鉴定为正确***的载体,体外扩增,提取质粒。
3、负选择标记基因SVTK-TK基因的连接:
应用SVTK-tk基因表达盒作为负选择基因引入打靶载体,即用XbaI酶切负选择基因tk基因以及已构建p+MSTN3.2+MSTN1.5+neo质粒载体,将tk基因连接到p+MSTN3.2+MSTN1.5+neo的质粒载体上,最终形成了完整的MSTN正-负选择同源重组基因打靶载体p+MSTN3.2+MSTN1.5+neo+tk的质粒,经酶切鉴定为正确***的载体,体外扩增,提取质粒。经纯化并用适合的酶将质粒线性化后即可用于基因打靶实验。
序列表
<110>中国水产科学院黄海水产研究所
<120>鱼类肌肉生长抑素(MSTN)基因
<130>PatentIn version 3.1
<160>1
<170>PatentIn version 3.1
<210>1
<211>4873
<212>DNA
<213>sea perch
<221>5′UTR
<222>(1)..(1170)
<221>exon 1
<222>(1171)..(1548)
<221>Intron 1
<222>(1549)..(2002)
<221>exon 2
<222>(2003)..(2368)
<221>Intron 2
<222>(2369)..(3126)
<221>exon 3
<222>(3127)..(3507)
<221>3′UTR
<222>(3508)..(4873)
<400>1
gattactata gggcacgcgt ggtcgacggc ccgggctggt ctgtttgtcc agatgtctgt 60
ctgtctggcc tttgatcatt ggcggttcat cagtccctgt gtgggctgct gtcaccggtg 120
ttttcagact gccacgcgtg gacgtcacac gtgggggagg taaaataaaa aaaaataaaa 180
ataaacgggc tctgtaaaat gatccaactt gtcaggttca gggtcactaa catgactctt 240
ggctgactgg aaagtgtttg atttttccca gtcttcagat cgtcaggtcg ccatgtcgcc 300
gctgtgctgc aggtgatggc ctccctgacg agagtgatgt cagcttacca cacgatggca 360
ctgtcttctc atgtgctaca accagatttg accagcaagg atttggacaa gtcctggaat 420
aaggactttt ctttattttt gctgtttttt gaataataat tatttccagt tttgactgat 480
cagcttctca gaggggaacc tggtctgacg ggacgacacc tccagaagga cttgacttca 540
ctgaataaaa ctgtaactct tagggttttt ttccctcaag gattaaatgt atttccacaa 600
ccatgcagac acagttgcat ccatgtacct gtcaccacag acagttcatg tttggtgggc 660
tgcctgcagt ctcattttaa agtgtattct ttattcacag cacaaagtat acatgacacc 720
gcctatctat agcttttatt tcctaatacg caggataaat gctacattgt ttggttttaa 780
taagttgcta taaattgaag cccatcagac tgttccatag gacagacagt ctggtctgcg 840
cctctgcgct cattgcgcga tcactgtaag aaaagtgaat ttctccatct gtggacacgc 900
tcagcacatg ctcacagcct ctaccccttt atggtttgac aacgagaaaa agttttcatg 960
tcagtcggtt aaaattcatt gttccctgtc cagccaatca tagtttttga cgacacaaaa 1020
gaggctaaag ttggagtata aaaaggtgtg cgctaataaa gtatgatgcc tatcagtgtg 1080
ggacattaat ccaaacccag ttcagccgcg cacaggtcca gcacacacca agggatcttt 1140
tttcaaacca aacttcacac cttagagaca atg cgt ctg tct cag att gtg ctg 1194
Met Arg Leu Ser Gln Ile Val Leu
1 5
tat ctg agc ttg ctg att gct ttg ggt cca gta gtt ttg agc gac caa 1242
Tyr Leu Ser Leu Leu Ile Ala Leu Gly Pro Val Val Leu Ser Asp Gln
10 15 20
gag gcg cac cag cag ccg tcc gcc tcc agc ccc gtg gac acg gag cag 1290
Glu Ala His Gln Gln Pro Ser Ala Ser Ser Pro Val Asp Thr Glu Gln
25 30 35 40
tgc gcc acc tgc gag gtc cgg cag cag atc aaa acc atg cga tta aac 1338
Cys Ala Thr Cys Glu Val Arg Gln Gln Ile Lys Thr Met Arg Leu Asn
45 50 55
gcg atc aaa tct cag att ctg agc aaa ctg cgg atg aaa gaa gct ccc 1386
Ala Ile Lys Ser Gln Ile Leu Ser Lys Leu Arg Met Lys Glu Ala Pro
60 65 70
aat atc agc cga gat atc gtg aag cag ctc ctg ccc aag gcg ccg ccg 1434
Asn Ile Ser Arg Asp Ile Val Lys Gln Leu Leu Pro Lys Ala Pro Pro
75 80 85
ctg cag cag ctt ctc gac cag tac gac gtg ctg gga gat gac aac aag 1482
Leu Gln Gln Leu Leu Asp Gln Tyr Asp Val Leu Gly Asp Asp Asn Lys
90 95 100
gat gtg gtc atg gag gag gac gac gag cac gcc atc acg gag aca ata 1530
Asp Val Val Met Glu Glu Asp Asp Glu His Ala Ile Thr Glu Thr Ile
105 110 115 120
atg atg atg gcc act gaa gtaagttttt atttcgcttt gttttctgga 1578
Met Met Met Ala Thr Glu
125
cgacgaaaag gaagcgctca gacgtctcca aactaggctt ttacgcacgg ggcagagcgc 1638
acgagagggg agggaggtgg gggggggcgc tttattttga caacatgtag ctttaccagc 1698
tcttgatatt ggaaatgtag atataccaac atcaccaaca tgtatacggt gtatgtgtgg 1758
gtcggtgcat ttcggcagat cagcgcgcct ggtgattacg cgcacggttt gtaaggtttt 1818
ctaaacgtta ttagcccact tccagagatc aaatgtcgtg tcagggatgt ttaatgacac 1878
cagtttattt cggtctgtaa atttcaatcg cacatggtca gtatacggag aacatagaga 1938
accttctctc tctctctctc tctctccctc tctctctctc cctctctctc tctctccagc 1998
cgag tcc gtc gtc cag gtg gat ggg gaa cca agc tgc tgc ttc ttc tcg 2047
Ser Val Val Gln Val Asp Gly Glu Pro Ser Cys Cys Phe Phe Ser
130 135 140
ttc act caa aag ttc cag gcc agt cgc ata gtc cgg gct cag ctc tgg 2095
Phe Thr Gln Lys Phe Gln Ala Ser Arg Ile Val Arg Aia Gln Leu Trp
145 150 155
gtg cat ctg cgc ccg tcg gag gag gcg acc acg gtg ttc ctg caa atc 2143
Val His Leu Arg Pro Ser Glu Glu Ala Thr Thr Val Phe Leu Gln Ile
160 165 170
tcc cgc ctg atg ccg gtc aca gac ggg agc ggg cac ata cgc atc cgc 2191
Ser Arg Leu Met Pro Val Thr Asp Gly Ser Gly His Ile Arg Ile Arg
175 180 185
tcc ctg aag atc gac gtg aat gcc ggg gtc agc tct tgg caa agt ata 2239
Ser Leu Lys Ile Asp Val Asn Ala Gly Val Ser Ser Trp Gln Ser Ile
190 195 200 205
gac gtc aag caa gtg ttg act gtg tgg ctg cgg cag ccg gag acc aac 2287
Asp Val Lys Gln Val Leu Thr Val Trp Leu Arg Gln Pro Glu Thr Asn
210 215 220
tgg ggc atc gag att aac gcc ttc gat tcg agg gga aat gac ttg gcc 2335
Trp Gly Ile Glu Ile Asn Ala Phe Asp Ser Arg Gly Asn Asp Leu Ala
225 230 235
gtg acc tcc gcg gag cca gga gag gaa gga ctg gtgagctgaa cctttatttt 2388
Val Thr Ser Ala Glu Pro Gly Glu Glu Gly Leu
240 245
acattaaacc gaaaccttgt ggtcttaggg ttagttcatt atccgggact cctgtcctaa 2448
tcaatatgac tgtaagtata agatgattat aagaactgga ccatcctgta agaaacaaaa 2508
aatattttca cacccccagt gtctaattag gtttaaaaca gtattttgga ttatctgctg 2568
tactgtactg gagccttcca gaggttttag tgtgcagaga ggctttgcag agtcagcagg 2628
tggttaaaca ttcctgcaat caagatttaa gacttttgaa agcgattaat caacacagac 2688
tccatgtagg cgcacacctg catttggagc aatgcccagt ctacaataac cccaaatcaa 2748
actgcttgat tacataaaag ttcacctgcc ccacattcct taaagtattc tgtgtgactg 2808
tgcaaatcag agtaattgcc tgcacacaca cacatacaca cacactgcta ctatcaatga 2868
caagcactta tcatgcggct caaatactgg cactgggctc tgaggcaatt agaataccta 2928
gatggctgtg gttaaccaac cgtcagatga ttcaatttct gtaaaactca aagtttcata 2988
atattatcgt gccatgtttg aaaaccagct gccacaaggt cgagggcacc ggagatgtaa 3048
accgaatgct gtcatccgcc tcctttttgc aaaaccagct atttctccaa agtgttcaca 3108
cgctgtttgt cattgcag caa gcg ttc atg gag gtg aag gtc tcg gag ggc 3159
Gln Ala Phe Met Glu Val Lys Val Ser Glu Gly
250 255
ccc aag cgt gcc agg aga gac tcg ggc ctg gac tgt gac gag aac tct 3207
Pro Lys Arg Ala Arg Arg Asp Ser Gly Leu Asp Cys Asp Glu Asn Ser
260 265 270 275
cca gag tcc cgg tgc tgc cgc tat ccg ctc act gtg gac ttt gaa act 3255
Pro Glu Ser Arg Cys Cys Arg Tyr Pro Leu Thr Val Asp Phe Glu Thr
280 285 290
ttg gct ggg act gga tta ttg ccc caa agc ggc tac aag gcc aac tat 3303
Leu Ala Gly Thr Gly Leu Leu Pro Gln Ser Gly Tyr Lys Ala Asn Tyr
295 300 305
tgc tcc ggg gag tgt gag tac atg cac ttg cag aag tac ccg cac acc 3351
Cys Ser Gly Glu Cys Glu Tyr Met His Leu Gln Lys Tyr Pro His Thr
310 315 320
cac ctg gtg aac aag gcc aac ccc aga ggg acc gcg ggc ccc tgc tgt 3399
His Leu Val Asn Lys Ala Asn Pro Arg Gly Thr Ala Gly pro Cys Cys
325 330 335
acc cct acc aag atg tct ccc atc aac atg ctc tac ttt aac cga aaa 3447
Thr Pro Thr Lys Met Ser pro Ile Asn Met Leu Tyr Phe Asn Arg Lys
340 345 350 355
gag cag atc atc tac ggc aag atc ccc tcc atg gtg gtg gac cgt tgt 3495
Glu Gln Ile Ile Tyr Gly Lys Ile Pro Ser Met Val Val Asp Arg Cys
360 365 370
gga tgc tct tga gttgggtcgg agaccctggc gagggagagg ggaggacgga 3547
Gly Cys Ser
ggggctgcgg cccagtccgg cctccaactt cagacttttt gacacaacca atccaccagt 3607
tccagtgctt tcctgcagaa cacggtgcaa tagaaccaga gtagaggcca caaacagccc 3667
gaccttcccg cagggcagcg ctttcacaac cggcatagca cttttttttt tctctcctcc 3727
agtgaaatct tagccaaaga ggcttgaagt cagatggatg caggaacaca catacacaca 3787
catgctggac cttggagtga atgtagacag aaattatcaa agttatccaa aaactttctt 3847
tctccttttg tctcggtgtt ctgtgctctg tccatttata caaacatgcc gacagattat 3907
actcgtacgc catctactcc actccactcc attcgtagcc aacatacaag ctattacact 3967
ttctgctaag ctatatgttt gtgataatca tttttcaaga tatgttttca gagtgaaacc 4027
aggaatcctc atggactttt tgaaagggct tggaaaaaca cagctggaga ctctttggag 4087
tgatacatca cactggtgga acatgcgtta gtacacataa atttcatagg aggcgatgag 4147
gagatgaaat ctggctgcac ggggaacccc ttagtcaccg ccacttcact actgcaattt 4207
ataaaaccca gctgaaattt gcaacattaa ttcatttgga aaatctgaca cacgtcgtta 4267
tctttcctgt atcagatcaa actttaagtg ctaatttgtg gggttttttt attaacaatt 4327
ctgagagcgt gggagtaaaa tcctacatgc aggtggtgac gtggtagtcg atcactccgg 4387
agatcccatg gaggcacaaa tgttccgcca gggcgaagta ccactttagg tcttgacagg 4447
tctccatgta ctacatgcca tacattcacg caacaacata cccaaactga ggagcacttc 4507
gtgcttggtc ataatctcca ctatccaaca aaaacagcct gacctgcccg atacacttga 4567
attattctga ttgtaaattc acattactgg acagaaggac ttgaactgaa ggcacaatga 4627
atgcagccta caaatgaaaa atgtgtttaa gacagaggaa actggattgt cgaggtgaat 4687
gaatgttgag atcatgctta aactctgtct tacaaacaac acagtttgca ctatggcaca 4747
ccaatagaaa gaattggttg ctacaaaagt tgtaaaaact gattttgata tgtttgctaa 4807
tttgtattgt atacatatgc cattgtttcc attaggagtt gcctttctaa accactgttg 4867
gtaata 4873
Claims (2)
1、一种鱼类花鲈肌肉生长抑素MSTN基因的克隆方法,其特征在于它的克隆方法,包括:1)、基因组DNA序列的获得,2)、蛋白氨基酸序列推测和分析,3)、基因组结构的分析;
1)、基因组DNA序列的获得:用DNAStar软件对GenBank中其它几种鱼类的cDNA序列和DNA序列比对,根据其保守性很高的区域设计了三对简并引物,从花鲈基因组DNA中扩增并获得了肌肉生长抑素MSTN编码区序列,再通过已获得的MSTN编码区序列,设计特异引物,通过基因组步移技术扩增出MSTN基因的5’和3’非编码序列,得到了MSTN基因的全长基因组序列,所述的鱼类花鲈肌肉生长抑素MSTN基因序列是:
gattactatagggcacgcgtggtcgacggcccgggctggtctgtttgtc
cagatgtctgtctgtctggcctttgatcattggcggttcatcagtccctgt 100
E-box
gtgggctgctgtcaccggtgttttcagactgccacgcgtggacgtca
cacgtgggggaggtaaaataaaaaaaaataaaaataaacgggctctgtaaaat 200
E-box
gatccaacttgtcaggttcagggtcactaacatgactcttggctgactggaaagtgtttgatttttcccagtcttcagatcgtcaggtcgccatgtcgcc 300
gctgtgctg
caggtgatggcctccctgacgagagtgatgtcagcttaccacacgatggcactgtcttct
catgtgctacaaccagatttgaccagcaagg 400
E-box E-box
atttggacaagtcctggaataaggacttttctttatttttgctgttttttgaataataattatttccagttttgactgatcagcttctcagaggggaacc 500
tggtctgacgggacgacacctccagaaggacttgacttcactgaataaaactgtaactcttagggtttttttccctcaaggattaaatgtatttccacaa 600
ccatgcagaca
cagttgcatccatgtacctgtcaccacagacagttcatgtttggtgggctgcctgcagtctcattttaaagtgtattctttattcacag 700
E-box
cacaaagtatacatgacaccgcctatctatagcttttatttcctaatacgcaggataaatgctacattgtttggttttaataagttgctataaattgaag 800
cccatcagactgttccataggacagacagtctggtctgcgcctctgcgctcattgcgcgatcactgtaagaaaagtgaatttctc
catctgtggacacgc 900
E-box
tcag
cacatgctcacagcctctacccctttatggtttgacaacgagaaaaagttttcatgtcagtcggttaaaattcattgttccctgtccagccaatca 1000
E-box
tagtttttgacgacacaaaagaggctaaagttggag
tataaaaaggtgtgcgctaataaagtatgatgcctatcagtgtgggacattaatccaaacccag 1100
TATA box
ttcagccgcgcacaggtccagcacacaccaagggatcttttttcaaaccaaacttcacaccttagagacaATGCATCTGTCTCAGATTGTGCTGTATCTG 1200
M H L S Q I V L Y L 10
AGCTTGCTGATTGCTTTGGGTCCAGTAGTTTTGAGCGACCAAGAGGCGCACCAGCAGCCGTCCGCCTCCAGCCCCGTGGACACGGAGCAGTGCGCCACCT 1300
S L L I A L G P V V L S D Q E A H Q Q P S A S S P V D T E Q C A T 43
GCGAGGTCCGGCAGCAGATCAAAACCATGCGATTAAACGCGATCAAATCTCAGATTCTGAGCAAACTGCGGATGAAAGAAGCTCCCAATATCAGCCGAGA 1400
C E V R Q Q I K T M R L N A I K S Q I L S K L R M K E A P N I S R D 77
TATCGTGAAGCAGCTCCTGCCCAAGGCGCCGCCGCTGCAGCAGCTTCTCGACCAGTACGACGTGCTGGGAGATGACAACAAGGATGTGGTCATGGAGGAG 1500
I V K Q L L P K A P P L Q Q L L D Q Y D V L G D D N K D V V M E E 110
GACGACGAGCACGCCATCACGGAGACAATAATGATGATGGCCACTGAAgtaagtttttatttcgctttgttttctggacgacgaaaaggaagcgctcaga 1600
D D E H A I T E T I M M M A T E 126
cgtctccaaactaggcttttacgcacggggcagagcgcacgagaggggagggaggtgggggggggcgctttattttgacaacatgtagctttaccagctc 1700
ttgatattggaaatgtagatataccaacatcaccaacatgtatacggtgtatgtgtgggtcggtgcatttcggcagatcagcgcgcctggtgattacgcg 1800
cacggtttgtaaggttttctaaacgttattagcccacttccagagatcaaatgtcgtgtcagggatgtttaatgacaccagtttatttcggtctgtaaat 1900
ttcaatcgcacatggtcagtatacggagaacatagagaacct
tctctctctctctctctctctccctctctctctctccctctctctctctctccagccg 2000
agTCCGTCGTCCAGGTGGATGGGGAACCAAGCTGCTGCTTCTTCTCGTTCACTCAAAAGTTCCAGGCCAGTCGCATAGTCCGGGCTCAGCTCTGGGTGCA 2100
S V V Q V D G E P S C C F F S F T Q K F Q A S R I V R A Q L W V H 159
TCTGCGCCCGTCGGAGGAGGCGACCACGGTGTTCCTGCAAATCTCCCGCCTGATGCCGGTCACAGACGGGAGCGGGCACATACGCATCCGCTCCCTGAAG 2200
L R P S E E A T T V F L Q I S R L M P V T D G S G H I R I R S L K 192
ATCGACGTGAATGCCGGGGTCAGCTCTTGGCAAAGTATAGACGTCAAGCAAGTGTTGACTGTGTGGCTGCGGCAGCCGGAGACCAACTGGGGCATCGAGA 2300
I D V N A G V S S W Q S I D V K Q V L T V W L R Q P E T N W G I E 225
TTAACGCCTTCGATTCGAGGGGAAATGACTTGGCCGTGACCTCCGCGGAGCCAGGAGAGGAAGGACTGgtgagcgaacctttattttacattaaaccga 2400
I N A F D S R G N D L A V T S A E P G E E G L 248
aaccttgtggtcttagggatagttcattatccgggactcctgtcctaatcaatatgactgtaagtataagatgattataagaactggaccatcctgtaag 2500
aaacaaaaaatattttcacacccccagtgtctaattaggtttaaaacagtattttggattatctgctgtactgtactggagccttccagaggttttagtg 2600
tgcagagaggctttgcagagtcagcaggtggttaaacattcctgcaatcaagatttaagacttttgaaagcgattaatcaacacagactccatgtaggcg 2700
tacacctgcatttggagcaatgcccagtctacaataaccccaaatcaaactgcttgattacataaaagttcacctgccccacattccttaaagtattctg 2800
tgtgactgtgcaaatcagagtaattgcctg
cacacacacacatacacacacactgctactatcaatgacaagcacttatcatgcggctcaaatatggtta 2900
ctggcactgggctctgaggcaattagaatacctagatggctgaccaaccgtcagatgattcaatttctgtaaaactcaaagtttcataatattatcgtgc 3000
catgtttgaaaaccagctgccacaaggtcgagggcaccggagatgtaaaccgaatgctgtcatccgcctcctttttgcaaaaccagctatttctccaaag 3100
tgttcacacgctgtttgtcattgcagCAAGCGTTCATGGAGGTGAAGGTCTCGGAGGGCCCCAAGCGTGCCAGGAGAGACTCGGGCCTGGACTGTGACGA 3200
Q A F M E V K V S E G P K R A R R D S G L D C D E 273
GAACTCTCCAGAGTCCCGGTGCTGCCGCTATCCGCTCACTGTGGACTTTGAAACTTTGGCTGGGACTGGATTATTGCCCCAAAGCGGCTACAAGGCCAAC 3300
N S P E S R C C R Y P L T V D F E T L A G T G L L P Q S G Y K A N 306
TATTGCTCCGGGGAGTGTGAGTACATGCACTTGCAGAAGTACCCGCACACCCACCTGGTGAACAAGGCCAACCCCAGAGGGACCGCGGGCCCCTGCTGTA 3400
Y C S G E C E Y M H L Q K Y P H T H L V N K A N P R G T A G P C C 339
CCCCTACCAAGATGTCTCCCATCAACATGCTCTACTTTAACCGAAAAGAGCAGATCATCTACGGCAAGATCCCCTCCATGGTGGTGGACCGTTGTGGATG 3500
T P T K M S P I N M L Y F N R K E Q I I Y G K I P S M V V D R C G C 373
CTCTTGAgttgggtcggagaccctggcgagggagaggggaggacggaggggctgcggcccagtccggcctccaacttcagactttttgacacaaccaatc 3600
S ★ 374
caccagttccagtgctttcctgcagaacacggtgcaatagaaccagagtagaggccacaaacagcccgaccttcccgcagggcagcgctttcacaaccgg 3700
catagcacttttttttttctctcctccagtgaaatcttagccaaagaggcttgaagtcagatggatgcagga
acacacatacacacacatgctggacctt 3800
ggagtgaatgtagacagaaattatcaaagttatccaaaaactttctttctccttttgtctcggtgttctgtgctctgtccatttatacaaacatgccgac 3900
agattatactcgtacgccatctactccactccactccattcgtagccaacatacaagctattacactttctgctaagctatatgtttgtgataatcattt 4000
ttcaagatatgttttcagagtgaaaccaggaatcctcatggactttttgaaagggcttggaaaaacacagctggagactctttggagtgatacatcacac 4100
tggtggaacatgcgttagtacacataaatttcataggaggcgatgaggagatgaaatctggctgcacggggaaccccttagtcaccgccacttcactact 4200
gcaatttataaaacccagctgaaatttgcaacattaattcatttggaaaatctgacacacgtcgttatctttcctgtatcagatcaaactttaagtgcta 4300
atttgtggggtttttttattaacaattctgagagcgtgggagtaaaatcctacatgcaggtggtgacgtggtagtcgatcactccggagatcccatggag 4400
gcacaaatgttccgccagggcgaagtaccactttaggtcttgacaggtctccatgtactacatgccatacattcacgcaacaacatacccaaactgagga 4500
gcacttcgtgcttggtcataatctccactatccaacaaaaacagcctgacctgcccgatacacttgaattattctgattgtaaattcacattactggaca 4600
gaaggacttgaactgaaggcacaatgaatgcagcctacaaatgaaaaatgtgtttaagacagaggaaactggattgtcgaggtgaatgaatgttgagatc 4700
ttgcttaaactctgtcttacaaacaacacagtttgcactatggcacaccaatagaaagaattggttgctacaaaagttgtaaaaactgattttgatatgt 4800
ttgctaatttgtattgtatacatatgccattgtttccattaggagttgcctttctaaaccactgttggtaata 4873
2)、蛋白氨基酸序列的推测和分析:根据外显子和内含子交界处的特征GT...AG,分析基因各外显子和内含子位置,用EditSeq软件分析ORF阅读框和推测蛋白质序列,用BioEdit软件对蛋白质序列进行比对分析;将推测的蛋白质序列与美国GENBANK序列数据库中其他物种的MSTN蛋白序列进行比对,用BLASTX程序算出同源性;
3)、基因组结构的分析:将基因组DNA序列和蛋白序列与美国GENBANK序列数据库中已存的DNA序列进行比对,结构分析表明该基因组DNA全长4873bp,包括长度分别为378bp、366bp、381bp的三个外显子,长度分别为454bp和758bp的二个内含子及1170bp的5’非翻译区和1366bp的3’非翻译区;在5’非翻译区上发现了一个TATA框和7个肌肉特异性的E框。
2.一种构建权利要求1中所述的鱼类花鲈肌肉生长抑素MSTN基因打靶载体的方法,其特征在于它的打靶载体的构建方法,包括:1)、同源长片段和短片段的扩增和连接,2)、正选择标记基因neo片段的连接,3)、负选择标记基因SVTK-tk基因的连接;
1)、同源长片段和短片段的扩增和连接:
根据鱼类花鲈肌肉生长抑素MSTN基因的序列,设计一对含有适当酶切位点XbaI和BamHI的特异引物,扩增得到一个3.2KB的长片段,再设计一对含有酶切位点BamHI和SalI的特异引物,扩增得到一个1.5KB的短片段;这两个片段用相应的酶切,纯化后,依次连接到相应酶切的pBSII+KS载体上,经筛选、酶切鉴定获得重组载体p+MSTN3.2+MSTN1.5,进一步经测序证实为正确连接;
2)、正选择标记基因neo片段的连接:
应用SVTK-neo基因表达盒作为正选择基因引入打靶载体,即将neo基因通过BamHI酶切,连接***到长片段和短片段之间,经筛选、酶切鉴定获得p+MSTN3.2+MSTN1.5+neo的重组载体;
3)、负选择标记基因SVTK-tk基因的连接:
应用SVTK-tk基因表达盒作为负选择基因引入打靶载体,即将tk基因通过XbaI酶切,连接***到长片段的侧翼,经筛选、酶切鉴定获得p+MSTN3.2+MSTN1.5+neo+tk的重组载体。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CNB2005101047684A CN100347298C (zh) | 2005-12-30 | 2005-12-30 | 鱼类肌肉生长抑素mstn基因克隆及其基因打靶载体构建 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CNB2005101047684A CN100347298C (zh) | 2005-12-30 | 2005-12-30 | 鱼类肌肉生长抑素mstn基因克隆及其基因打靶载体构建 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN1831136A CN1831136A (zh) | 2006-09-13 |
CN100347298C true CN100347298C (zh) | 2007-11-07 |
Family
ID=36993634
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CNB2005101047684A Expired - Fee Related CN100347298C (zh) | 2005-12-30 | 2005-12-30 | 鱼类肌肉生长抑素mstn基因克隆及其基因打靶载体构建 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN100347298C (zh) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103805694B (zh) * | 2013-12-05 | 2015-09-09 | 上海市水产研究所 | 用于检测菊黄东方鲀生长速度的引物对及方法 |
CN112342215B (zh) * | 2020-11-11 | 2024-03-26 | 江苏省淡水水产研究所 | 一种靶向敲除斑点叉尾鮰mstna基因的sgRNA序列及其筛选方法 |
CN112899283A (zh) * | 2021-03-03 | 2021-06-04 | 中国水产科学研究院南海水产研究所 | 一种与黄鳍棘鲷快速生长相关的snp位点、其筛选方法及应用 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2002085306A2 (en) * | 2001-04-24 | 2002-10-31 | The Johns Hopkins University | Use of follistatin to increase muscle mass |
WO2004044145A2 (en) * | 2002-11-06 | 2004-05-27 | Auburn University | Compositions and methods for enhancing disease resistance in fish |
CN1597955A (zh) * | 2004-09-24 | 2005-03-23 | 中山大学 | 三种石斑鱼生长抑素基因及其应用 |
-
2005
- 2005-12-30 CN CNB2005101047684A patent/CN100347298C/zh not_active Expired - Fee Related
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2002085306A2 (en) * | 2001-04-24 | 2002-10-31 | The Johns Hopkins University | Use of follistatin to increase muscle mass |
WO2004044145A2 (en) * | 2002-11-06 | 2004-05-27 | Auburn University | Compositions and methods for enhancing disease resistance in fish |
CN1597955A (zh) * | 2004-09-24 | 2005-03-23 | 中山大学 | 三种石斑鱼生长抑素基因及其应用 |
Non-Patent Citations (2)
Title |
---|
肌生成抑制素基因研究进展 李树伟,欧阳红生,王小霞.动物医学进展,第25卷第4期 2005 * |
肌肉生成抑制素基因的研究进展 王彦波,周绪霞,许梓荣.免疫学杂志,第20卷第3期 2004 * |
Also Published As
Publication number | Publication date |
---|---|
CN1831136A (zh) | 2006-09-13 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN1185256C (zh) | 水稻分蘖控制基因moc1及其应用 | |
CN1923850A (zh) | 水稻叶形控制基因sll1及其应用 | |
CN100347298C (zh) | 鱼类肌肉生长抑素mstn基因克隆及其基因打靶载体构建 | |
CN1844377A (zh) | 柱花草9-顺式环氧类胡萝卜素双加氧酶及其编码基因与应用 | |
CN1769457A (zh) | 蝴蝶兰pPI15编码序列及其应用 | |
CN1844143A (zh) | 一种植物耐盐相关蛋白及其编码基因与应用 | |
CN1276080C (zh) | 鱼类基因原位修饰育种的方法 | |
CN1295340C (zh) | 一种建立多形性腺瘤小鼠模型的方法 | |
CN1247612C (zh) | 水稻OsGLR1基因及其应用 | |
CN1239704C (zh) | 与植物耐盐性及抗旱性相关的基因及其编码蛋白与应用 | |
CN1218959C (zh) | 一种水稻乙烯受体类蛋白及其编码基因与应用 | |
CN1850856A (zh) | 一种植物抗逆性相关蛋白及其编码基因与应用 | |
CN1239706C (zh) | 一种植物耐低磷基因及其编码蛋白与应用 | |
CN1257271C (zh) | 丝氨酸蛋白酶及其编码序列 | |
CN1291020C (zh) | 小麦TaGI1基因及其克隆与应用 | |
CN1208462C (zh) | 一个人类锌指蛋白家族新基因znf325 | |
CN1621523A (zh) | 棉花腺苷酸核糖基化作用因子1基因及其启动子 | |
CN1712527A (zh) | 大豆二酰甘油酰基转移酶及其编码基因与应用 | |
CN101063131A (zh) | 花鲈凝集素基因序列 | |
CN1327479A (zh) | 提高基因表达水平的新的dna片段 | |
CN101054583A (zh) | 斑节对虾细胞周期蛋白b的基因序列 | |
CN1238382C (zh) | 中华绒螯蟹蜕皮抑制激素1蛋白 | |
CN1216908C (zh) | 拟南芥bud1基因及其应用 | |
CN1266273C (zh) | 一种调控小鼠孤儿核受体的启动子及其用途 | |
CN1923276A (zh) | NFκB信号通路的重要调控蛋白PAK7 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
C17 | Cessation of patent right | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20071107 Termination date: 20100201 |