CN1279167C - 猪脂肪细胞定向和分化因子1的基因序列 - Google Patents

猪脂肪细胞定向和分化因子1的基因序列 Download PDF

Info

Publication number
CN1279167C
CN1279167C CN 200410017860 CN200410017860A CN1279167C CN 1279167 C CN1279167 C CN 1279167C CN 200410017860 CN200410017860 CN 200410017860 CN 200410017860 A CN200410017860 A CN 200410017860A CN 1279167 C CN1279167 C CN 1279167C
Authority
CN
China
Prior art keywords
order
gene
sequence
protein
pig
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN 200410017860
Other languages
English (en)
Other versions
CN1563380A (zh
Inventor
潘玉春
李长龙
孟和
赵威
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shanghai Jiaotong University
Original Assignee
Shanghai Jiaotong University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shanghai Jiaotong University filed Critical Shanghai Jiaotong University
Priority to CN 200410017860 priority Critical patent/CN1279167C/zh
Publication of CN1563380A publication Critical patent/CN1563380A/zh
Application granted granted Critical
Publication of CN1279167C publication Critical patent/CN1279167C/zh
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Landscapes

  • Peptides Or Proteins (AREA)

Abstract

一种用于基因工程技术领域的猪脂肪细胞定向和分化因子1的基因序列,从猪的脾脏细胞总RNA中扩增出的ADD1基因,其cDNA序列和编码蛋白的氨基酸序列,该基因全长3830bp,开放阅读框11bp-3453bp区段,编码有1151个氨基酸的蛋白质,其3’端非编码序列长10bp,5’端非编码序列长366bp,在蛋白质序列的320-380处有螺旋-环-螺旋的核心结构。本发明的一方面可以通过制备该基因的蛋白,用于研究该基因在猪脂肪细胞分化和调节体内胆固醇水平等过程中的作用。另一方面可以通过标记辅助选择(MAS)的方法对瘦肉型猪和低胆固醇型猪的生产和育种中发挥指导性作用。

Description

猪脂肪细胞定向和分化因子1的基因序列
技术领域
本发明涉及的是用于基因工程技术领域的一种蛋白编码序列,特别是一种猪脂肪细胞定向和分化因子1的基因序列。
技术背景
脂肪性状是动物体生长发育和肉质性状的主要指标之一,关系到动物生产中的诸如:瘦肉率、生长速度、饲料转化率、肌内脂肪等众多经济性状。在长期的生产实践中,人们早已发现脂肪含量不同的动物产品价格上有很大的差异。人们的消费习惯已经从喜食肥肉转移到爱吃瘦肉,这样使得肥胖的个体在动物生产的过程中的经济效益下降。脂肪对于动物生产中已经成为一种副产品。它降低了饲料转化率,同时降低了动物生产过程的经济效益。脂肪性状在过去的几十年的育种过程中已经取得了很大的进步。随着分子生物学理论和技术的飞速发展,给我们提供另外一种方法来改良动物的遗传基础。1950年发现的肥胖基因(obese,ob),1998年发现的黑素皮质激素受体4基因(Melanocortin-4 receptor,MC4R)都对脂肪性状有一定的影响。
摄入过多胆固醇与心脏病有直接联系,是导致动脉硬化及心脏病的最主要原因。心脏病、动脉硬化和中风等心血管疾病导致死亡的人数每年大约有100万,平均每天达到了2500人!而动物性食品中胆固醇含量很高,食入过多的动物性食品会导致上述疾病的发生。健康的、低胆固醇的鸡蛋已经问世,但是怎样生产低胆固醇的猪肉还没有进一步的研究。毫无疑问,健康的、低胆固醇猪肉都会带来巨大的经济效益和社会效益。脂肪细胞定向和分化因子1(Adipocyte Detetmination andDifferentiation factor-1,ADD1)基因又称固醇调节元件结合蛋白1(SterolRegulatory Element Binding proteins-1 SREBP1)基因,编码脂肪细胞定向和分化因子1,ADD1是脂肪细胞分化过程中一种重要的核转录因子,同过氧化物酶体增殖蛋白激活受体(PPARγ)和CCAAT元件增强结合蛋白(C/EBPs)共同控制脂肪细胞的分化过程。另外,ADD1还可以通过固醇调节元件来调节动物体内的胆固醇水平。
在对现有技术文献的分析中,虽然“Comparative Biochemistry and PhysiologyPart B,1999,28:307-318”对DD1基因对脂肪细胞的分化和定向作用的功能已经做了充分肯定,特别是ADD1基因对调节其他与脂肪沉积的相关基因功能的确定使人们在脂肪沉积方面的应用取得了长足进步。但至今尚未发现ADD1基因序列中有多态现象,也不能进行突变位点的基因型与性状讲的连锁分析以及进行标记辅助选择。
发明内容
本发明的目的在于克服现有技术中的不足,提供一种猪脂肪细胞定向和分化因子1的基因序列。本发明所公开的猪的脂肪细胞定向和分化因子1的cDNA序列、氨基酸序列,对猪ADD1基因蛋白编码序列在脂肪细胞分化过程中的调节作用作出了具体说明,使其一方面可以通过制备该基因的蛋白,用于该基因在猪脂肪细胞分化和调节体内胆固醇水平,另一方面可以通过标记辅助选择(MAS)的方法对瘦肉型猪和低胆固醇型猪的生产和育种中发挥指导性作用。
本发明是通过以下技术方案实现的,本发明的是从猪的脾脏细胞总RNA中扩增出的ADD1基因,其cDNA序列和编码蛋白的氨基酸序列(如下),该基因全长3830bp,开放阅读框11bp-3453bp区段,编码有1151个氨基酸的蛋白质,其3’端非编码序列长10bp,5’端非编码序列长366bp。在蛋白质序列的320-380处有螺旋-环-螺旋(Helix-Loop-Helix,HLH)的核心结构。
在GenBank中搜寻同源序列同已知的两个ADD1基因的部分序列同源性是99.9%,即GenBank AY307771和99.1%,即GenBank AF102873,同人的序列同源性82.9%,即GenBank_NM 004176,同鼠的同源性是72.8%,即GenBank U09103,同鸡的同源性是65.4%,即GenBank AY029224,相对AF103873,在全长序列的1022位g-a、1034位t-c、108位a-g有突变,相对AY307771,532位a-g、625位c-t有突变,600位c-t突变导致氨基酸序列产成Leu-Pro的突变。以上突变位点均有可能在标记辅助选择中应用。
ADD1基因的cDNA序列如下:
CGCCGGCGCC ATGGACGAGC CGCCCTTCAC AGAGGCAGCC TTGGAGCAGG CGCTGGCCGA  60
GCCATGCGAG CTGGACGCGG CGCTGCTGAC CGACATCGAA GACATGCTTC AGCTCATCAA  120
CAACCAAGAC AGCGACTTCC CCGGCCTGTT CGACGCGCCC TACGCTGGCG TTGCAGGAGG  180
CACGGACCCC ACCAGTCCTG ATGCCAGCTC CCCAGGCAGC CCGACGCCGC CTCCTTCCAC  240
CATGAGCTCC CCGCTTGAAG GCTTCCTGGG GGGGGCCAGG ACGCCGCCAC CGCCCCCCGT  300
GTCCCCAACC CAGCCTGCAC CCACCCCGCT GAAGATGTAC CCGTCGGTGC CTGCCTTCTC  360
GCCTGGGCCG GGCATCAAGG AGGAGCCAGT GCCACTGACC ATCCTGCAGC CCCCCACCCC  420
ACAGCCCCTG TCTGGGGCTC TCCTGCCCCA GAGCCTTCCA GCCCTCGCCC CTCCGCAGTT  480
GAGCCCTGCC CCCGTGTTGG GCTACCCCAG CCCTCCTGGA AGCTTCTCCT CGGCGACCCC  540
TCCAGGGAGC ACCTCACAGA CGCTGCCTGG CCTGCCGCTG GCCTCTCTGC CCGGGGTCCT  600
GCCCGTCTCC GTGCACACCC AGGTTCAAAG TGCGGCCCCC CAGCAGCTGT TGACAGCCAC  660
GGCCACCCCC GTGGTGTCCC CTGGAACAAC CACTGTGACC TCGCAGATCC AGCAGGTCCC  720
GGTCCTGCTG CAGCCCCACT TCATCAAGGC GGACTCCCTG CTCCTGACGA CCATGAAAAC  780
AGACATGGGG ACCCCTGTGA AGGCGGCGGG CATCGGCTCC CTGGCCCCTG GCACAGCCGT  840
GCAGGCAGCA CCTTTGCAGA CCCTGGTGAG CGGCGGGACC ATCCTGGCGA CGGTGCCTCT  900
GGTAGTGGAC ACTGACAAGC TGCCCATCAA CCGCCTGGCA GCTGGGGGCA AAGCCCTGAG  960
CTCAGGCCAG AGCCGTGGTG AGAAGCGGAC GGCTCACAAT GCCATCGAGA AACGCTACCG  1020
CTCCTCCATC AATGACAAGA TCATCGAGCT CAAGGACCTG GTGGTGGGCA CGGAGGCGAA  1080
GCTGAATAAA TCCGCCGTCT TGCGCAAGGC CATCGACTAC ATCCGCTTCC TTCAGCAGAG  1140
CAACCAGAAG CTCAAGCAGG AGAACCTGAG TCTGCGGACT GCTGCCCACA AAAGCAAGTC  1200
TCTGAAGGAC CTGGTGTCCT GCAGCAGCGG AGGCCGCACC GACGTGCCCA TGGAGGGTGT  1260
GAAGCCGGAG GTGGTAGACA CCCTTAGCCC GCCCCCCTCC GACGCCGGCT CGCCCTCCCA  1320
GAGCAGCCCC TTGTCCCTCG GCAGCAGGGG CAGCAGCAGC GGTGGCAGTG GCAGTGACTC  1380
AGAGCCCGAC AGCCCGGTTT TTGAGGACAG CCAGATGAAG CCAGAGCAGC TGCCGGCCCC  1440
CCACGGCCGG GGCATGCTGG ACCGCTCCCG CCTGGCCCTG TGCGTGCTCG TCTTCCTCTG  1500
TCTCTCCTGC AACCCCTTGG CCTCACTGAT GGGCAGCTGG GCTCTCCCTG GCCCCTCCGA  1560
TGCCACCAGC GCCTACCACG GGCCCTGGCG CAGCGTACTG GGCGCTGAGG GCAGAGATGG  1620
CCCTGGCTGG GTCCTGTGGC TGCTGCCCCC GCTGGTCTGG CTGACGAATG GGCTGCTGGT  1680
GCTGCTCTTC TTGGCGCTTC TCTTTGTCTA TGGAGAGCCG GTCACGCGGC CCCACTCGGA  1740
TCCAGCTGTG CGCTTCTGGA GGCATCGCAA GCAGGCCGAC CTGGACCTGG CCCGGGGGGA  1800
CTTCGCCCAG GCTGCCCAGC AGCTGTGGCT GGCCCTGCGG GCGCTGGGCC GGCCCCTGCC  1860
CACCTCCCAC CTGGACCTGG CCTGCAGCCT GCTCTGGAAC CTCATCCGCC ACCTGCTGCA  1920
GCGTCTCTGG GTGGGCCGCT GGCTGGCGGG CCGGGCCGGG GGCCTGCGGA GGGACAGCGC  1980
CCTGGAGGCG GACACCCGCA CCAGCGCCTG TGACGCGGCC CTCGTCTACC ACAAGCTGCA  2040
CCAGCTGCAC ACCATGGGGA AGTACCCAGG CGGGCACCTC GATGCCGCCA ACCTGGCGCT  2100
GAGTGCCCTG AACCTGGCGG AGTGTGCGGG TGATGCCCTG TCCGTGGCCG TGCTGGCGGA  2160
GGTCTATGTG GCCGCTGCCC TGCGAGTCAA GACCAGTCTC CCCCGGGCCT TGCACTTTCT  2220
GACCCGCTTC TTCCTGAGTA GCGCCCGCCA GGCCTGCCTG GCACAAAGCG GCTCGGTGCC  2280
TGTTGCCATG CAGTGGCTCT GCCACCCTGT GGGCCACCGT TTCTTCGTGG ATGGGGACTG  2340
GGCCGTGTGC GGTGCCCCCC GGGACAGCTT GTACAGCGTG GCTGGGAACC CAGTGGACCC  2400
CCTGGCCCAG GTGACTCAGT TGTTCCGTGA ACACCTCTTG GAGCAAGCCC TGCATTGCGT  2460
GGCCCAGCCC AGCCCCGGCC CTGGATCAGC TGATGGGGAC AGGGAATTCT CAGAGGCCCT  2420
CGGGTTCCTG CAGCTGCTCA ACAGCTGTTG TGACACAGCC GGGGCTCCTG CCTGCAGCTT  2580
CTCCATTGCC TCCAGCACAG CCGCCACGGC CGGCACAGAC CCGGTCGCCA AGTGGTGGGC  2640
CTCGCTGACG GCTGTGGTGA CCCACTGGCT GGGGCGGGAC GAGGAGGCGG CCGAGCGGCT  2700
GTACCCGCTG GTGGAGCACC TGCCCCGCGC CCTGCAGGAG TCCGAGAGAC CCCTGCCCAG  2760
GGCAGCTCTG CACTCCTTCA AGGCCGCCCG GGCCCTGCTG GGCCGCGGGA AGGCAGAGTC  2820
TGGCTCAGCC AGCCTGGCCA TGTGTGAGAA GGCCAGTGGG TACCTGCAGG ACAGCCTGGC  2880
CGCCACGCCA GCCGGCAGCT CCATTGACAA GGCCATGCAG CTGCTCCTGT GTGACCTGCT  2940
CCTTGTGGCG CGCACCAGCC TGTGGCAGCG GCAGAAGCCG CCCCCACCCT CCCAGGCCTC  3000
GCAGGGCTCG AGCAGCGGGG CCCAGGCCTC TGCGCTCGAG CTGCGCGGCT TCCAGAGGGA  3060
CCTGAGTGGC CTGAGGCGCC TGGCGCAGAG CTTCCGGCCT GCCATGCGGA GGGTGTTCCT  3120
CCATGAGGCC ACCGCCAGGC TGATGGCCGG GGCCAGCCCC GCGCGGACGC ACCAGCTCCT  3180
GGACCGCAGT CTGAGGAGGA GGGCGGGCCC CTGCGGCAGA GGAGGCGCGG CGGCCGCGGC  3240
GGCGGCGGAG CTGGAACCGC GGCCCACGCG GCGGGAGCAG GCCGAGGCCC TGCTGCTCGC  3300
CTCCTGCTAC CTGCCGCCCG GCTTCCTGTC GGCGCCGGGG CAGCGCGTGG GCATGCTGGC  3360
CGAGGCGGCG CGCACGCTCG AGAAGCTCGG CGACCGCCGG CTGCTGCACG ACTGCCAGCA  3420
GATGCTCATG CGCCTGGGCG GCGGGACCAC CGTGACCTCC AGCTAGACCC CTGCGGGCGG  3480
CCCAGCCCCA GCGACCCCGT CTCAGTCTCG ACGGCCGAGG GCAGCTCTGG AGCCCCGGCC  3540
CCCGGCTCGC CGGCGGAGTG CCCGGTCCCT GGGGGTATGG AGACGCGGGG CCCGGCGTTG  3600
ACGGGGCCGT CCAGCCCGCA CCCCGGGTCG ACGAGCGGCC GCCAGGGTGG TGCTGGCCTC  3660
TGGTGGCCGG CCGAGGGATT GCCGGGGCCT GGCGGCCGCC AGGTGCCTCC CATTCCACCC  3720
ACTGGCAGCC ACTCCGCGGC TTTCCCTCTC TGTCCAGGGG GAGGAAAGGG GTGCGTTTCA  3780
CTGGGCCGAG GGGCCGGCTT GGCCTTCCTT GCCGCCGGGC GCCTCCTTCC             3830
ADD1基因编码蛋白的氨基酸序列如下:
MDEPPFTEAA LEQALAEPCE LDAALLTDIE DMLQLINNQD SDFPGLFDAP YAGVAGGTDP  60
TSPDASSPGS PTPPPSTMSS PLEGFLGGAR TPPPPPVSPT QPAPTPLKMY PSVPAFSPGP  120
GIKEEPVPLT ILQPPTPQPL SGALLPQSLP ALAPPQLSPA PVLGYPSPPG SFSSATPPGS  180
TSQTLPGLPL ASLPGVLPVS VHTQVQSAAP QQLLTATATP VVSPGTTTVT SQIQQVPVLL  240
QPHFIKADSL LLTTMKTDMG TPVKAAGIGS LAPGTAVQAA PLQTLVSGGT ILATVPLVVD  300
TDKLPINRLA AGGKALSSGQ SRGEKRTAHN AIEKRYRSSI NDKIIELKDL VVGTEAKLNK  360
SAVLRKAIDY IRFLQQSNQK LKQENLSLRT AAHKSKSLKD LVSCSSGGRT DVPMEGVKPE  420
VVDTLSPPPS DAGSPSQSSP LSLGSRGSSS GGSGSDSEPD SPVFEDSQMK PEQLPAPHGR  480
GMLDRSRLAL CVLVFLCLSC NPLASLMGSW ALPGPSDATS AYHGPWRSVL GAEGRDGPGW  540
VLWLLPPLVW LTNGLLVLLF LALLFVYGEP VTRPHSDPAV RFWRHRKQAD LDLARGDFAQ  600
AAQQLWLALR ALGRPLPTSH LDLACSLLWN LIRHLLQRLW VGRWLAGRAG GLRRDSALEA  660
DTRTSACDAA LVYHKLHQLH TMGKYPGGHL DAANLALSAL NLAECAGDAL SVAVLAEVYV  720
AAALRVKTSL PRALHFLTRF FLSSARQACL AQSGSVPVAM QWLCHPVGHR FFVDGDWAVC  780
GAPRDSLYSV AGNPVDPLAQ VTQLFREHLL EQALHCVAQP SPGPGSADGD REFSEALGFL  840
QLLNSCCDTA GAPACSFSIA SSTAATAGTD PVAKWWASLT AVVTHWLGRD EEAAERLYPL  900
VEHLPRALQE SERPLPRAAL HSFKAARALL GRGKAESGSA SLAMCEKASG YLQDSLAATP  960
AGSSIDKAMQ LLLCDLLLVA RTSLWQRQKP PPPSQASQGS SSGAQASALE LRGFQRDLSG  1020
LRRLAQSFRP AMRRVFLHEA TARLMAGASP ARTHQLLDRS LRRRAGPCGR GGAAAAAAAE  1080
LEPRPTRREQ AEALLLASCY LPPGFLSAPG QRVGMLAEAA RTLEKLGDRR LLHDCQQMLM  1140
RLGGGTTVTS S                                                       1151
本发明具有实质性特点和显著进步,目前,在猪ADD1基因的研究中只有部分的cDNA序列(GenBank AY307771和AF102873)。发明首次克隆出全长cDNA序列。本发明的一方面可以通过制备该基因的蛋白,用于研究该基因在猪脂肪细胞分化和调节体内胆固醇水平等过程中的作用。另一方面可以通过标记辅助选择(MAS)的方法对瘦肉型猪和低胆固醇型猪的生产和育种中发挥指导性作用。
附图说明
图1为猪脾脏组织总RNA琼脂糖电泳图
图中28S和18S RNA亮度之比大约为2,说明组织总RNA未被降解,可以进行反转录。
图2用脾脏组织总RNA的反转录为模板进行PCR反应产物的琼脂糖电泳图
经过凝胶成像***分析,片断大小为750bp。
图3猪同其它物种的ADD1基因(SREBF1基因)和SREBF2基因间编码序列间的聚类分析图。
图4为借助rpsBlast软件分析得到螺旋-环-螺旋(Helix-Loop-Helix,HLH)核心结构的三维图。
具体实施方式
下面结合具体实施例对本发明进一步描述:这些实施例仅用于说明本发明而不用于限制本发明的范围。下列实施例中未注明具体条件的实验方法,通常按照常规条件,例如Sambrook等分子克隆:实验室手册(New York:Cold Spring Harbor LaboratoryPress,1989)中所述的条件,或按照制造厂商所建议的条件。
实施例1
猪ADD1基因的克隆
1.组织分离(Isolation)
从屠宰场采集猪新鲜的脾脏组织(品种为“梅山猪”)迅速放入液氮中冷冻保存,并且将其带回实验室,放入-70℃保存,准备提取组织总RNA。
2.总RNA的分离(Total RNA isolation)
(1)提取RNA的准备工作
玻璃制品用0.1M的NaOH浸泡过夜,用自来水反复冲洗,再用蒸馏水冲洗2遍,180℃烘烤4小时。
匀浆器、电泳槽用3%的双氧水浸泡20-30分钟,再用0.1%的DEPC水冲洗。由于未灭活的DEPC对PCR反应有影响,可用0.5%的SDS处理。
Tip头、EP管用0.1%的DEPC水浸泡过夜,高压灭菌使DEPC失活。
双蒸水和溶液用DEPC处理,即每100ml水或溶液加0.1mlDEPC液,室温放置过夜,高压灭菌30分钟使DEPC失活。
(2)组织总RNA提取
取100mg在液氮冻存组织样加入有1ml Trizol(trizal reagent,invitrogen BRL,USA)在匀浆器中匀浆。4℃ 12000转/分钟离心10分钟。吸取上清液,15-30℃温育5分钟。加0.2ml氯仿,盖上盖子,用手剧烈震荡15秒。15-30℃温育2-3分钟。4℃12000转/分钟离心15分钟。吸取上清液,加0.8ml异丙醇,混合均匀。15-30℃温育10分钟,4℃ 12000转/分钟离心10分钟,离心管底部白色沉淀即为RNA。倒掉上清,加1ml 75%乙醇洗涤RNA,4℃7500转/分钟10分钟。自然干燥或真空干燥RNA.溶于水(RNase free)中分装,-80℃保存。
(3)组织总RNA的鉴定
通过分光光度计上测定RNA含量并且用琼脂糖电泳分析RNA的质量,具体方法如下:
电泳槽用RNA清洗液(100mM NaOH,1mM EDTA)浸泡4-5小时,再用DEPC处理过的水反复冲洗数次后倒入1×TBE待用。琼脂糖凝胶用1×TBE配制。在10ul上样缓冲液(2×TBE,13%菲可,0.1%溴酚兰,7M尿素)中加入1ul以上组织总RNA,65℃变性10分钟后立即放入冰水中2-3分钟。点样于琼脂糖凝胶中电泳。
3.全长cDNA的克隆(Cloning of Full-length cDNA)
根据猪的已知部分的cDNA(GenBank AY307771)设计反转录引物(5’-ACCGTCGCCAGGAT-3’)和PCR下游引物(5’-CAGGGAGTCCGCCTTGAT-3’),根据人和鼠的氨基酸保守序列设计PCR上游引物(5’-CGCCGGCGCCATGGACGAGC-3’)利用同源性基因克隆原理,采用RT-PCR同5’-RACE(TaKaRa试剂盒)相结合的方法进行cDNA全长克隆,分三个阶段进行:
(1)cDNA的合成
利用脾脏组织总RNA 5ug按照TaKaRa 5’-RACE试剂盒配置反应液和进行PCR反应。
(2)杂合链RAN的分解
利用第一步反应液按照TaKaRa 5’-RACE试剂盒配置反应液,用Rnase H 30℃消化1小时,消化杂合链中的RNA后,将单链DNA稀释备用。
(3)PCR反应
用稀释过的第二步的反应液为模板进行PCR反应。PCR[BP001(SEQ ID NO.1)+BP002(SEQ ID NO.2)]。其反应参数为:95℃预变性5min,95℃变性30s,56℃退火30s,72℃延伸1min,35个循环,72℃延伸10min,4℃10min.得到760bp的DNA片断,其中有276bp同猪的已知片断同源性高达98.91%
(4)测序
将PCR产物回收后同PMD 18-T Vector(TaKaRa)相连接,转化到感受态的大肠杆菌JM109中。经过菌株PCR和双酶切鉴定后的菌株在LB培养基37℃培养过夜,送交测序。测序结果经过拼接后共760bp。
实施例2
猪ADD1基因的序列分析和同源型比较
1、猪ADD1基因的序列分析
将cDNA序列中CDS部分用primer priemer 5.0软件翻译成氨基酸序列后在http://www.ncbi.nlm.nih.gov/Structure/cdd/wrpsb.cgi上用rpsBlast软件进行结构预测。发现在氨基酸序列的320-380处有螺旋-环-螺旋(Helix-Loop-Helix,HLH)的核心结构(见附图4)。
2、猪ADD1基因序列的同源性分析
将该基因氨基酸序列和碱基序列在http://www.ncbi.nlm.nih.gov/BLAST/BLAST/Blast.cgi上分别用Blastn和Blastp软件进行同源性分析。结果发现该基因的碱基序列和氨基酸序列同人及鼠的ADD1基因有高度同源性。
3、***发生树的构建
用DNAMAN软件将不同物种的ADD1基因和SREBP2基因(SREBPs家族中另外一个基因)序列来绘制***发生树。结果发现在猪ADD1基因同哺乳动物人、狗和鼠基因间同源性较高,而同鸡的同源性只有66%。在SREBPs基因家族中两个基因间同源性有51%。(见附图3)结果表明实验所得到的序列为目标序列。
在同原有猪的序列的同源性比较中发现了6处突变位点。同AF103873比较中发现,在全长序列的1022位g-a、1034位t-c、108位a-g的突变。同AY307771比较中发现532位a-g、625位c-t的突变,600位c-t突变导致Leu-Pro的突变。以上突变位点均有可能在标记辅助选择中应用。
                                            表1
同AF103873
   Query:994  tcacaatgccatcgagaaacgctaccgctcctccatcaatgacaagatcatcgagctcaa 1053
               |||||||||||||||||| ||||||||||| |||||||||||||||||||||||||||||
AF103873:301  tcacaatgccatcgagaagcgctaccgctcttccatcaatgacaagatcatcgagctcaa 360
   Query:1054 ggacctggtggtgggcacggaggcgaagctgaataaatccgccgtcttgcgcaaggccat 1113
               ||||||||||||||||||||||||||| ||||||||||||||||||||||||||||||||
AF103873:361  ggacctggtggtgggcacggaggcgaaactgaataaatccgccgtcttgcgcaaggccat 420
同AY307771
   Query:485  cctgcccccgtgttgggctaccccagccctcctggaagcttctcctcggcgacccctcca 544
               ||||||||||||||||||||||||||||||||||||||||||||||| ||||||||||||
AY307771   1   cctgcccccgtgttgggctaccccagccctcctggaagcttctcctcagcgacccctcca 60
   Query:545  gggagcacctcacagacgctgcctggcctgccgctggcctctctgcccggggtcctgccc 604
               ||||||||||||||||||||||||||||||||||||||||||||||||||||||| ||||
AY307771:61   gggagcacctcacagacgctgcctggcctgccgctggcctctctgcccggggtcccgccc 120
   Query:605  gtctccgtgcacacccaggttcaaagtgcggccccccagcagctgttgacagccacggcc 664
               |||||||||||||||||||| |||||||||||||||||||||||||||||||||||||||
AY307771:121  gtctccgtgcacacccaggtccaaagtgcggccccccagcagctgttgacagccacggcc 180
   Query:猪脂肪细胞分化和定向因子1的核酸序列
本发明涉及的序列及记号分列如下:
(1)SEQ ID NO.1的信息
   (i)序列特征:
      (A)长度:14bp
      (B)类型:核苷酸
      (C)链性:单链
      (D)拓扑结构:线性
   (ii).分子类型:寡核苷酸
   (iii).序列描述:SEQ ID NO.1
   ACCGTCGCCAGGAT
(2)SEQ ID NO.2的信息
   (i)序列特征:
      (A)长度:20bp
      (B)类型:核苷酸
      (C)链性:单链
      (D)拓扑结构:线性
   (ii).分子类型:寡核苷酸
   (iii).序列描述:SEQ ID NO.2
   CGCCGGCGCCATGGACGAGC
(3)SEQ ID NO.3的信息
   (i)序列特征:
      (A)长度:18bp
      (B)类型:核苷酸
      (C)链性:单链
      (D)拓扑结构:线性
  (ii).分子类型:寡核苷酸
  (iii).序列描述:SEQ ID NO.3
  CAGGGAGTCCGCCTTGAT
(4)SEQ ID NO.4的信息
<110>上海交通大学
<120>猪ADD1基因蛋白编码序列
<140>
<141>2004-01-6
<160>3
<170>PatentIn version 3.1
<210>1
<211>3830
<212>DNA
<213>猪Sus scrofa ADD1蛋白
<400>1
CGCCGGCGCC ATGGACGAGC CGCCCTTCAC AGAGGCAGCC TTGGAGCAGG CGCTGGCCGA    60
GCCATGCGAG CTGGACGCGG CGCTGCTGAC CGACATCGAA GACATGCTTC AGCTCATCAA    120
CAACCAAGAC AGCGACTTCC CCGGCCTGTT CGACGCGCCC TACGCTGGCG TTGCAGGAGG    180
CACGGACCCC ACCAGTCCTG ATGCCAGCTC CCCAGGCAGC CCGACGCCGC CTCCTTCCAC    240
CATGAGCTCC CCGCTTGAAG GCTTCCTGGG GGGGGCCAGG ACGCCGCCAC CGCCCCCCGT    300
GTCCCCAACC CAGCCTGCAC CCACCCCGCT GAAGATGTAC CCGTCGGTGC CTGCCTTCTC    360
GCCTGGGCCG GGCATCAAGG AGGAGCCAGT GCCACTGACC ATCCTGCAGC CCCCCACCCC    420
ACAGCCCCTG TCTGGGGCTC TCCTGCCCCA GAGCCTTCCA GCCCTCGCCC CTCCGCAGTT    480
GAGCCCTGCC CCCGTGTTGG GCTACCCCAG CCCTCCTGGA AGCTTCTCCT CGGCGACCCC    540
TCCAGGGAGC ACCTCACAGA CGCTGCCTGG CCTGCCGCTG GCCTCTCTGC CCGGGGTCCT    600
GCCCGTCTCC GTGCACACCC AGGTTCAAAG TGCGGCCCCC CAGCAGCTGT TGACAGCCAC    660
GGCCACCCCC GTGGTGTCCC CTGGAACAAC CACTGTGACC TCGCAGATCC AGCAGGTCCC    720
GGTCCTGCTG CAGCCCCACT TCATCAAGGC GGACTCCCTG CTCCTGACGA CCATGAAAAC    780
AGACATGGGG ACCCCTGTGA AGGCGGCGGG CATCGGCTCC CTGGCCCCTG GCACAGCCGT    840
GCAGGCAGCA CCTTTGCAGA CCCTGGTGAG CGGCGGGACC ATCCTGGCGA CGGTGCCTCT    900
GGTAGTGGAC ACTGACAAGC TGCCCATCAA CCGCCTGGCA GCTGGGGGCA AAGCCCTGAG    960
CTCAGGCCAG AGCCGTGGTG AGAAGCGGAC GGCTCACAAT GCCATCGAGA AACGCTACCG    1020
CTCCTCCATC AATGACAAGA TCATCGAGCT CAAGGACCTG GTGGTGGGCA CGGAGGCGAA    1080
GCTGAATAAA TCCGCCGTCT TGCGCAAGGC CATCGACTAC ATCCGCTTCC TTCAGCAGAG    1140
CAACCAGAAG CTCAAGCAGG AGAACCTGAG TCTGCGGACT GCTGCCCACA AAAGCAAGTC    1200
TCTGAAGGAC CTGGTGTCCT GCAGCAGCGG AGGCCGCACC GACGTGCCCA TGGAGGGTGT    1260
GAAGCCGGAG GTGGTAGACA CCCTTAGCCC GCCCCCCTCC GACGCCGGCT CGCCCTCCCA    1320
GAGCAGCCCC TTGTCCCTCG GCAGCAGGGG CAGCAGCAGC GGTGGCAGTG GCAGTGACTC    1380
AGAGCCCGAC AGCCCGGTTT TTGAGGACAG CCAGATGAAG CCAGAGCAGC TGCCGGCCCC    1440
CCACGGCCGG GGCATGCTGG ACCGCTCCCG CCTGGCCCTG TGCGTGCTCG TCTTCCTCTG    1500
TCTCTCCTGC AACCCCTTGG CCTCACTGAT GGGCAGCTGG GCTCTCCCTG GCCCCTCCGA    1560
TGCCACCAGC GCCTACCACG GGCCCTGGCG CAGCGTACTG GGCGCTGAGG GCAGAGATGG    1620
CCCTGGCTGG GTCCTGTGGC TGCTGCCCCC GCTGGTCTGG CTGACGAATG GGCTGCTGGT    1680
GCTGCTCTTC TTGGCGCTTC TCTTTGTCTA TGGAGAGCCG GTCACGCGGC CCCACTCGGA    1740
TCCAGCTGTG CGCTTCTGGA GGCATCGCAA GCAGGCCGAC CTGGACCTGG CCCGGGGGGA    1800
CTTCGCCCAG GCTGCCCAGC AGCTGTGGCT GGCCCTGCGG GCGCTGGGCC GGCCCCTGCC    1860
CACCTCCCAC CTGGACCTGG CCTGCAGCCT GCTCTGGAAC CTCATCCGCC ACCTGCTGCA    1920
GCGTCTCTGG GTGGGCCGCT GGCTGGCGGG CCGGGCCGGG GGCCTGCGGA GGGACAGCGC    1980
CCTGGAGGCG GACACCCGCA CCAGCGCCTG TGACGCGGCC CTCGTCTACC ACAAGCTGCA    2040
CCAGCTGCAC ACCATGGGGA AGTACCCAGG CGGGCACCTC GATGCCGCCA ACCTGGCGCT    2100
GAGTGCCCTG AACCTGGCGG AGTGTGCGGG TGATGCCCTG TCCGTGGCCG TGCTGGCGGA    2160
GGTCTATGTG GCCGCTGCCC TGCGAGTCAA GACCAGTCTC CCCCGGGCCT TGCACTTTCT    2220
GACCCGCTTC TTCCTGAGTA GCGCCCGCCA GGCCTGCCTG GCACAAAGCG GCTCGGTGCC    2280
TGTTGCCATG CAGTGGCTCT GCCACCCTGT GGGCCACCGT TTCTTCGTGG ATGGGGACTG    2340
GGCCGTGTGC GGTGCCCCCC GGGACAGCTT GTACAGCGTG GCTGGGAACC CAGTGGACCC    2400
CCTGGCCCAG GTGACTCAGT TGTTCCGTGA ACACCTCTTG GAGCAAGCCC TGCATTGCGT    2460
GGCCCAGCCC AGCCCCGGCC CTGGATCAGC TGATGGGGAC AGGGAATTCT CAGAGGCCCT    2420
CGGGTTCCTG CAGCTGCTCA ACAGCTGTTG TGACACAGCC GGGGCTCCTG CCTGCAGCTT    2580
CTCCATTGCC TCCAGCACAG CCGCCACGGC CGGCACAGAC CCGGTCGCCA AGTGGTGGGC    2640
CTCGCTGACG GCTGTGGTGA CCCACTGGCT GGGGCGGGAC GAGGAGGCGG CCGAGCGGCT    2700
GTACCCGCTG GTGGAGCACC TGCCCCGCGC CCTGCAGGAG TCCGAGAGAC CCCTGCCCAG    2760
GGCAGCTCTG CACTCCTTCA AGGCCGCCCG GGCCCTGCTG GGCCGCGGGA AGGCAGAGTC    2820
TGGCTCAGCC AGCCTGGCCA TGTGTGAGAA GGCCAGTGGG TACCTGCAGG ACAGCCTGGC    2880
CGCCACGCCA GCCGGCAGCT CCATTGACAA GGCCATGCAG CTGCTCCTGT GTGACCTGCT    2940
CCTTGTGGCG CGCACCAGCC TGTGGCAGCG GCAGAAGCCG CCCCCACCCT CCCAGGCCTC    3000
GCAGGGCTCG AGCAGCGGGG CCCAGGCCTC TGCGCTCGAG CTGCGCGGCT TCCAGAGGGA    3060
CCTGAGTGGC CTGAGGCGCC TGGCGCAGAG CTTCCGGCCT GCCATGCGGA GGGTGTTCCT    3120
CCATGAGGCC ACCGCCAGGC TGATGGCCGG GGCCAGCCCC GCGCGGACGC ACCAGCTCCT    3180
GGACCGCAGT CTGAGGAGGA GGGCGGGCCC CTGCGGCAGA GGAGGCGCGG CGGCCGCGGC    3240
GGCGGCGGAG CTGGAACCGC GGCCCACGCG GCGGGAGCAG GCCGAGGCCC TGCTGCTCGC    3300
CTCCTGCTAC CTGCCGCCCG GCTTCCTGTC GGCGCCGGGG CAGCGCGTGG GCATGCTGGC    3360
CGAGGCGGCG CGCACGCTCG AGAAGCTCGG CGACCGCCGG CTGCTGCACG ACTGCCAGCA    3420
GATGCTCATG CGCCTGGGCG GCGGGACCAC CGTGACCTCC AGCTAGACCC CTGCGGGCGG    3480
CCCAGCCCCA GCGACCCCGT CTCAGTCTCG ACGGCCGAGG GCAGCTCTGG AGCCCCGGCC    3540
CCCGGCTCGC CGGCGGAGTG CCCGGTCCCT GGGGGTATGG AGACGCGGGG CCCGGCGTTG    3600
ACGGGGCCGT CCAGCCCGCA CCCCGGGTCG ACGAGCGGCC GCCAGGGTGG TGCTGGCCTC    3660
TGGTGGCCGG CCGAGGGATT GCCGGGGCCT GGCGGCCGCC AGGTGCCTCC CATTCCACCC    3720
ACTGGCAGCC ACTCCGCGGC TTTCCCTCTC TGTCCAGGGG GAGGAAAGGG GTGCGTTTCA    3780
CTGGGCCGAG GGGCCGGCTT GGCCTTCCTT GCCGCCGGGC GCCTCCTTCC               3830
<210>2
<211>1151
<212>PRT
<213>猪Sus scrofa ADD1蛋白
<400>2
MDEPPFTEAA LEQALAEPCE LDAALLTDIE DMLQLINNQD SDFPGLFDAP YAGVAGGTDP    60
TSPDASSPGS PTPPPSTMSS PLEGFLGGAR TPPPPPVSPT QPAPTPLKMY PSVPAFSPGP    120
GIKEEPVPLT ILQPPTPQPL SGALLPQSLP ALAPPQLSPA PVLGYPSPPG SFSSATPPGS    180
TSQTLPGLPL ASLPGVLPVS VHTQVQSAAP QQLLTATATP VVSPGTTTVT SQIQQVPVLL    240
QPHFIKADSL LLTTMKTDMG TPVKAAGIGS LAPGTAVQAA PLQTLVSGGT ILATVPLVVD    300
TDKLPINRLA AGGKALSSGQ SRGEKRTAHN AIEKRYRSSI NDKIIELKDL VVGTEAKLNK    360
SAVLRKAIDY IRFLQQSNQK LKQENLSLRT AAHKSKSLKD LVSCSSGGRT DVPMEGVKPE    420
VVDTLSPPPS DAGSPSQSSP LSLGSRGSSS GGSGSDSEPD SPVFEDSQMK PEQLPAPHGR    480
GMLDRSRLAL CVLVFLCLSC NPLASLMGSW ALPGPSDATS AYHGPWRSVL GAEGRDGPGW    540
VLWLLPPLVW LTNGLLVLLF LALLFVYGEP VTRPHSDPAV RFWRHRKQAD LDLARGDFAQ    600
AAQQLWLALR ALGRPLPTSH LDLACSLLWN LIRHLLQRLW VGRWLAGRAG GLRRDSALEA    660
DTRTSACDAA LVYHKLHQLH TMGKYPGGHL DAANLALSAL NLAECAGDAL SVAVLAEVYV    720
AAALRVKTSL PRALHFLTRF FLSSARQACL AQSGSVPVAM QWLCHPVGHR FFVDGDWAVC    780
GAPRDSLYSV AGNPVDPLAQ VTQLFREHLL EQALHCVAQP SPGPGSADGD REFSEALGFL    840
QLLNSCCDTA GAPACSFSIA SSTAATAGTD PVAKWWASLT AVVTHWLGRD EEAAERLYPL    900
VEHLPRALQE SERPLPRAAL HSFKAARALL GRGKAESGSA SLAMCEKASG YLQDSLAATP    960
AGSSIDKAMQ LLLCDLLLVA RTSLWQRQKP PPPSQASQGS SSGAQASALE LRGFQRDLSG    1020
LRRLAQSFRP AMRRVFLHEA TARLMAGASP ARTHQLLDRS LRRRAGPCGR GGAAAAAAAE    1080
LEPRPTRREQ AEALLLASCY LPPGFLSAPG QRVGMLAEAA RTLEKLGDRR LLHDCQQMLM    1140
RLGGGTTVTS S                                                         1151

Claims (2)

1、一种猪脂肪细胞定向和分化因子1的基因序列,其特征在于,SEQ ID NO.4中核苷酸序列1-3830位的核苷酸序列构成。
2、一种编码权利要求1所述的猪脂肪细胞定向和分化因子1的氨基酸序列,其特征是,SEQ ID NO.4中1-1151位的氨基酸序列构成。
CN 200410017860 2004-04-22 2004-04-22 猪脂肪细胞定向和分化因子1的基因序列 Expired - Fee Related CN1279167C (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN 200410017860 CN1279167C (zh) 2004-04-22 2004-04-22 猪脂肪细胞定向和分化因子1的基因序列

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN 200410017860 CN1279167C (zh) 2004-04-22 2004-04-22 猪脂肪细胞定向和分化因子1的基因序列

Publications (2)

Publication Number Publication Date
CN1563380A CN1563380A (zh) 2005-01-12
CN1279167C true CN1279167C (zh) 2006-10-11

Family

ID=34479199

Family Applications (1)

Application Number Title Priority Date Filing Date
CN 200410017860 Expired - Fee Related CN1279167C (zh) 2004-04-22 2004-04-22 猪脂肪细胞定向和分化因子1的基因序列

Country Status (1)

Country Link
CN (1) CN1279167C (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102031304A (zh) * 2010-11-04 2011-04-27 徐州师范大学 一种黄牛add1基因单核苷酸多态性及其检测方法

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102031304A (zh) * 2010-11-04 2011-04-27 徐州师范大学 一种黄牛add1基因单核苷酸多态性及其检测方法
CN102031304B (zh) * 2010-11-04 2012-07-04 徐州师范大学 一种黄牛add1基因单核苷酸多态性及其检测方法

Also Published As

Publication number Publication date
CN1563380A (zh) 2005-01-12

Similar Documents

Publication Publication Date Title
CN1170941C (zh) 人bmp-7启动子以及用其探测骨相关物质的方法
CN1807623A (zh) 一个细胞周期正向调控基因及其编码蛋白与应用
CN1279167C (zh) 猪脂肪细胞定向和分化因子1的基因序列
CN1206359C (zh) 含有携带剪接受体的基因工程细胞非编码序列的高效逆转录病毒载体
CN1757732A (zh) 编码甘薯八氢番茄红素合成酶的cDNA序列
CN101062942A (zh) 来源于烟曲霉的与活性氧杀伤相关蛋白及其编码基因
CN1295340C (zh) 一种建立多形性腺瘤小鼠模型的方法
CN101054583A (zh) 斑节对虾细胞周期蛋白b的基因序列
CN1301266C (zh) 小麦的高分子量谷蛋白亚基及其编码基因与应用
CN1687414A (zh) 猪解耦联蛋白3的基因组基因及其应用
CN100344759C (zh) 小麦脱水应答转录因子DREB基因cDNA序列
CN1563379A (zh) 猪5羟色胺4受体b亚型的基因序列
CN1908171A (zh) 水稻胚乳直链淀粉含量控制基因du1及其应用
CN1563386A (zh) 棉花甲硫氨酸亚砜还原酶蛋白编码序列
CN1280415C (zh) 小麦抗病基因Lr-L1及其应用
CN1600861A (zh) 棉花乙烯响应元件绑定因子蛋白编码序列
CN1699567A (zh) 猪核受体辅激活因子1基因的蛋白编码序列
CN1225556C (zh) 编码人成骨蛋白-1的重组核酸及其用途
CN1928084A (zh) 斑节对虾热休克蛋白90的基因的核苷酸及氨基酸序列
CN1266273C (zh) 一种调控小鼠孤儿核受体的启动子及其用途
CN1740319A (zh) 牙鲆myostatin基因序列
CN1528889A (zh) 大白菜9-顺式-环氧类胡萝卜素双氧酶蛋白编码序列
CN1712532A (zh) 猪单胺氧化酶b蛋白编码序列
CN1182245C (zh) 短指和身高相关基因
CN1305901C (zh) 肿瘤转移相关蛋白及其编码基因

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
C17 Cessation of patent right
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20061011