CN1279167C

CN1279167C - 猪脂肪细胞定向和分化因子1的基因序列

Info

Publication number: CN1279167C
Application number: CN 200410017860
Authority: CN
Inventors: 潘玉春; 李长龙; 孟和; 赵威
Original assignee: Shanghai Jiaotong University
Current assignee: Shanghai Jiaotong University
Priority date: 2004-04-22
Filing date: 2004-04-22
Publication date: 2006-10-11
Anticipated expiration: 2024-04-22
Also published as: CN1563380A

Abstract

一种用于基因工程技术领域的猪脂肪细胞定向和分化因子1的基因序列，从猪的脾脏细胞总RNA中扩增出的ADD1基因，其cDNA序列和编码蛋白的氨基酸序列，该基因全长3830bp，开放阅读框11bp-3453bp区段，编码有1151个氨基酸的蛋白质，其3’端非编码序列长10bp，5’端非编码序列长366bp，在蛋白质序列的320-380处有螺旋-环-螺旋的核心结构。本发明的一方面可以通过制备该基因的蛋白，用于研究该基因在猪脂肪细胞分化和调节体内胆固醇水平等过程中的作用。另一方面可以通过标记辅助选择(MAS)的方法对瘦肉型猪和低胆固醇型猪的生产和育种中发挥指导性作用。

Description

猪脂肪细胞定向和分化因子1的基因序列

技术领域

本发明涉及的是用于基因工程技术领域的一种蛋白编码序列，特别是一种猪脂肪细胞定向和分化因子1的基因序列。

技术背景

脂肪性状是动物体生长发育和肉质性状的主要指标之一，关系到动物生产中的诸如：瘦肉率、生长速度、饲料转化率、肌内脂肪等众多经济性状。在长期的生产实践中，人们早已发现脂肪含量不同的动物产品价格上有很大的差异。人们的消费习惯已经从喜食肥肉转移到爱吃瘦肉，这样使得肥胖的个体在动物生产的过程中的经济效益下降。脂肪对于动物生产中已经成为一种副产品。它降低了饲料转化率，同时降低了动物生产过程的经济效益。脂肪性状在过去的几十年的育种过程中已经取得了很大的进步。随着分子生物学理论和技术的飞速发展，给我们提供另外一种方法来改良动物的遗传基础。1950年发现的肥胖基因(obese，ob)，1998年发现的黑素皮质激素受体4基因(Melanocortin-4 receptor，MC4R)都对脂肪性状有一定的影响。

摄入过多胆固醇与心脏病有直接联系，是导致动脉硬化及心脏病的最主要原因。心脏病、动脉硬化和中风等心血管疾病导致死亡的人数每年大约有100万，平均每天达到了2500人！而动物性食品中胆固醇含量很高，食入过多的动物性食品会导致上述疾病的发生。健康的、低胆固醇的鸡蛋已经问世，但是怎样生产低胆固醇的猪肉还没有进一步的研究。毫无疑问，健康的、低胆固醇猪肉都会带来巨大的经济效益和社会效益。脂肪细胞定向和分化因子1(Adipocyte Detetmination andDifferentiation factor-1，ADD1)基因又称固醇调节元件结合蛋白1(SterolRegulatory Element Binding proteins-1 SREBP1)基因，编码脂肪细胞定向和分化因子1，ADD1是脂肪细胞分化过程中一种重要的核转录因子，同过氧化物酶体增殖蛋白激活受体(PPARγ)和CCAAT元件增强结合蛋白(C/EBPs)共同控制脂肪细胞的分化过程。另外，ADD1还可以通过固醇调节元件来调节动物体内的胆固醇水平。

在对现有技术文献的分析中，虽然“Comparative Biochemistry and PhysiologyPart B，1999，28：307-318”对DD1基因对脂肪细胞的分化和定向作用的功能已经做了充分肯定，特别是ADD1基因对调节其他与脂肪沉积的相关基因功能的确定使人们在脂肪沉积方面的应用取得了长足进步。但至今尚未发现ADD1基因序列中有多态现象，也不能进行突变位点的基因型与性状讲的连锁分析以及进行标记辅助选择。

发明内容

本发明的目的在于克服现有技术中的不足，提供一种猪脂肪细胞定向和分化因子1的基因序列。本发明所公开的猪的脂肪细胞定向和分化因子1的cDNA序列、氨基酸序列，对猪ADD1基因蛋白编码序列在脂肪细胞分化过程中的调节作用作出了具体说明，使其一方面可以通过制备该基因的蛋白，用于该基因在猪脂肪细胞分化和调节体内胆固醇水平，另一方面可以通过标记辅助选择(MAS)的方法对瘦肉型猪和低胆固醇型猪的生产和育种中发挥指导性作用。

本发明是通过以下技术方案实现的，本发明的是从猪的脾脏细胞总RNA中扩增出的ADD1基因，其cDNA序列和编码蛋白的氨基酸序列(如下)，该基因全长3830bp，开放阅读框11bp-3453bp区段，编码有1151个氨基酸的蛋白质，其3’端非编码序列长10bp，5’端非编码序列长366bp。在蛋白质序列的320-380处有螺旋-环-螺旋(Helix-Loop-Helix，HLH)的核心结构。

在GenBank中搜寻同源序列同已知的两个ADD1基因的部分序列同源性是99.9％，即GenBank AY307771和99.1％，即GenBank AF102873，同人的序列同源性82.9％，即GenBank_NM 004176，同鼠的同源性是72.8％，即GenBank U09103，同鸡的同源性是65.4％，即GenBank AY029224，相对AF103873，在全长序列的1022位g-a、1034位t-c、108位a-g有突变，相对AY307771，532位a-g、625位c-t有突变，600位c-t突变导致氨基酸序列产成Leu-Pro的突变。以上突变位点均有可能在标记辅助选择中应用。

ADD1基因的cDNA序列如下：

CGCCGGCGCC ATGGACGAGC CGCCCTTCAC AGAGGCAGCC TTGGAGCAGG CGCTGGCCGA 60

GCCATGCGAG CTGGACGCGG CGCTGCTGAC CGACATCGAA GACATGCTTC AGCTCATCAA 120

CAACCAAGAC AGCGACTTCC CCGGCCTGTT CGACGCGCCC TACGCTGGCG TTGCAGGAGG 180

CACGGACCCC ACCAGTCCTG ATGCCAGCTC CCCAGGCAGC CCGACGCCGC CTCCTTCCAC 240

CATGAGCTCC CCGCTTGAAG GCTTCCTGGG GGGGGCCAGG ACGCCGCCAC CGCCCCCCGT 300

GTCCCCAACC CAGCCTGCAC CCACCCCGCT GAAGATGTAC CCGTCGGTGC CTGCCTTCTC 360

GCCTGGGCCG GGCATCAAGG AGGAGCCAGT GCCACTGACC ATCCTGCAGC CCCCCACCCC 420

ACAGCCCCTG TCTGGGGCTC TCCTGCCCCA GAGCCTTCCA GCCCTCGCCC CTCCGCAGTT 480

GAGCCCTGCC CCCGTGTTGG GCTACCCCAG CCCTCCTGGA AGCTTCTCCT CGGCGACCCC 540

TCCAGGGAGC ACCTCACAGA CGCTGCCTGG CCTGCCGCTG GCCTCTCTGC CCGGGGTCCT 600

GCCCGTCTCC GTGCACACCC AGGTTCAAAG TGCGGCCCCC CAGCAGCTGT TGACAGCCAC 660

GGCCACCCCC GTGGTGTCCC CTGGAACAAC CACTGTGACC TCGCAGATCC AGCAGGTCCC 720

GGTCCTGCTG CAGCCCCACT TCATCAAGGC GGACTCCCTG CTCCTGACGA CCATGAAAAC 780

AGACATGGGG ACCCCTGTGA AGGCGGCGGG CATCGGCTCC CTGGCCCCTG GCACAGCCGT 840

GCAGGCAGCA CCTTTGCAGA CCCTGGTGAG CGGCGGGACC ATCCTGGCGA CGGTGCCTCT 900

GGTAGTGGAC ACTGACAAGC TGCCCATCAA CCGCCTGGCA GCTGGGGGCA AAGCCCTGAG 960

CTCAGGCCAG AGCCGTGGTG AGAAGCGGAC GGCTCACAAT GCCATCGAGA AACGCTACCG 1020

CTCCTCCATC AATGACAAGA TCATCGAGCT CAAGGACCTG GTGGTGGGCA CGGAGGCGAA 1080

GCTGAATAAA TCCGCCGTCT TGCGCAAGGC CATCGACTAC ATCCGCTTCC TTCAGCAGAG 1140

CAACCAGAAG CTCAAGCAGG AGAACCTGAG TCTGCGGACT GCTGCCCACA AAAGCAAGTC 1200

TCTGAAGGAC CTGGTGTCCT GCAGCAGCGG AGGCCGCACC GACGTGCCCA TGGAGGGTGT 1260

GAAGCCGGAG GTGGTAGACA CCCTTAGCCC GCCCCCCTCC GACGCCGGCT CGCCCTCCCA 1320

GAGCAGCCCC TTGTCCCTCG GCAGCAGGGG CAGCAGCAGC GGTGGCAGTG GCAGTGACTC 1380

AGAGCCCGAC AGCCCGGTTT TTGAGGACAG CCAGATGAAG CCAGAGCAGC TGCCGGCCCC 1440

CCACGGCCGG GGCATGCTGG ACCGCTCCCG CCTGGCCCTG TGCGTGCTCG TCTTCCTCTG 1500

TCTCTCCTGC AACCCCTTGG CCTCACTGAT GGGCAGCTGG GCTCTCCCTG GCCCCTCCGA 1560

TGCCACCAGC GCCTACCACG GGCCCTGGCG CAGCGTACTG GGCGCTGAGG GCAGAGATGG 1620

CCCTGGCTGG GTCCTGTGGC TGCTGCCCCC GCTGGTCTGG CTGACGAATG GGCTGCTGGT 1680

GCTGCTCTTC TTGGCGCTTC TCTTTGTCTA TGGAGAGCCG GTCACGCGGC CCCACTCGGA 1740

TCCAGCTGTG CGCTTCTGGA GGCATCGCAA GCAGGCCGAC CTGGACCTGG CCCGGGGGGA 1800

CTTCGCCCAG GCTGCCCAGC AGCTGTGGCT GGCCCTGCGG GCGCTGGGCC GGCCCCTGCC 1860

CACCTCCCAC CTGGACCTGG CCTGCAGCCT GCTCTGGAAC CTCATCCGCC ACCTGCTGCA 1920

GCGTCTCTGG GTGGGCCGCT GGCTGGCGGG CCGGGCCGGG GGCCTGCGGA GGGACAGCGC 1980

CCTGGAGGCG GACACCCGCA CCAGCGCCTG TGACGCGGCC CTCGTCTACC ACAAGCTGCA 2040

CCAGCTGCAC ACCATGGGGA AGTACCCAGG CGGGCACCTC GATGCCGCCA ACCTGGCGCT 2100

GAGTGCCCTG AACCTGGCGG AGTGTGCGGG TGATGCCCTG TCCGTGGCCG TGCTGGCGGA 2160

GGTCTATGTG GCCGCTGCCC TGCGAGTCAA GACCAGTCTC CCCCGGGCCT TGCACTTTCT 2220

GACCCGCTTC TTCCTGAGTA GCGCCCGCCA GGCCTGCCTG GCACAAAGCG GCTCGGTGCC 2280

TGTTGCCATG CAGTGGCTCT GCCACCCTGT GGGCCACCGT TTCTTCGTGG ATGGGGACTG 2340

GGCCGTGTGC GGTGCCCCCC GGGACAGCTT GTACAGCGTG GCTGGGAACC CAGTGGACCC 2400

CCTGGCCCAG GTGACTCAGT TGTTCCGTGA ACACCTCTTG GAGCAAGCCC TGCATTGCGT 2460

GGCCCAGCCC AGCCCCGGCC CTGGATCAGC TGATGGGGAC AGGGAATTCT CAGAGGCCCT 2420

CGGGTTCCTG CAGCTGCTCA ACAGCTGTTG TGACACAGCC GGGGCTCCTG CCTGCAGCTT 2580

CTCCATTGCC TCCAGCACAG CCGCCACGGC CGGCACAGAC CCGGTCGCCA AGTGGTGGGC 2640

CTCGCTGACG GCTGTGGTGA CCCACTGGCT GGGGCGGGAC GAGGAGGCGG CCGAGCGGCT 2700

GTACCCGCTG GTGGAGCACC TGCCCCGCGC CCTGCAGGAG TCCGAGAGAC CCCTGCCCAG 2760

GGCAGCTCTG CACTCCTTCA AGGCCGCCCG GGCCCTGCTG GGCCGCGGGA AGGCAGAGTC 2820

TGGCTCAGCC AGCCTGGCCA TGTGTGAGAA GGCCAGTGGG TACCTGCAGG ACAGCCTGGC 2880

CGCCACGCCA GCCGGCAGCT CCATTGACAA GGCCATGCAG CTGCTCCTGT GTGACCTGCT 2940

CCTTGTGGCG CGCACCAGCC TGTGGCAGCG GCAGAAGCCG CCCCCACCCT CCCAGGCCTC 3000

GCAGGGCTCG AGCAGCGGGG CCCAGGCCTC TGCGCTCGAG CTGCGCGGCT TCCAGAGGGA 3060

CCTGAGTGGC CTGAGGCGCC TGGCGCAGAG CTTCCGGCCT GCCATGCGGA GGGTGTTCCT 3120

CCATGAGGCC ACCGCCAGGC TGATGGCCGG GGCCAGCCCC GCGCGGACGC ACCAGCTCCT 3180

GGACCGCAGT CTGAGGAGGA GGGCGGGCCC CTGCGGCAGA GGAGGCGCGG CGGCCGCGGC 3240

GGCGGCGGAG CTGGAACCGC GGCCCACGCG GCGGGAGCAG GCCGAGGCCC TGCTGCTCGC 3300

CTCCTGCTAC CTGCCGCCCG GCTTCCTGTC GGCGCCGGGG CAGCGCGTGG GCATGCTGGC 3360

CGAGGCGGCG CGCACGCTCG AGAAGCTCGG CGACCGCCGG CTGCTGCACG ACTGCCAGCA 3420

GATGCTCATG CGCCTGGGCG GCGGGACCAC CGTGACCTCC AGCTAGACCC CTGCGGGCGG 3480

CCCAGCCCCA GCGACCCCGT CTCAGTCTCG ACGGCCGAGG GCAGCTCTGG AGCCCCGGCC 3540

CCCGGCTCGC CGGCGGAGTG CCCGGTCCCT GGGGGTATGG AGACGCGGGG CCCGGCGTTG 3600

ACGGGGCCGT CCAGCCCGCA CCCCGGGTCG ACGAGCGGCC GCCAGGGTGG TGCTGGCCTC 3660

TGGTGGCCGG CCGAGGGATT GCCGGGGCCT GGCGGCCGCC AGGTGCCTCC CATTCCACCC 3720

ACTGGCAGCC ACTCCGCGGC TTTCCCTCTC TGTCCAGGGG GAGGAAAGGG GTGCGTTTCA 3780

CTGGGCCGAG GGGCCGGCTT GGCCTTCCTT GCCGCCGGGC GCCTCCTTCC 3830

ADD1基因编码蛋白的氨基酸序列如下：

MDEPPFTEAA LEQALAEPCE LDAALLTDIE DMLQLINNQD SDFPGLFDAP YAGVAGGTDP 60

TSPDASSPGS PTPPPSTMSS PLEGFLGGAR TPPPPPVSPT QPAPTPLKMY PSVPAFSPGP 120

GIKEEPVPLT ILQPPTPQPL SGALLPQSLP ALAPPQLSPA PVLGYPSPPG SFSSATPPGS 180

TSQTLPGLPL ASLPGVLPVS VHTQVQSAAP QQLLTATATP VVSPGTTTVT SQIQQVPVLL 240

QPHFIKADSL LLTTMKTDMG TPVKAAGIGS LAPGTAVQAA PLQTLVSGGT ILATVPLVVD 300

TDKLPINRLA AGGKALSSGQ SRGEKRTAHN AIEKRYRSSI NDKIIELKDL VVGTEAKLNK 360

SAVLRKAIDY IRFLQQSNQK LKQENLSLRT AAHKSKSLKD LVSCSSGGRT DVPMEGVKPE 420

VVDTLSPPPS DAGSPSQSSP LSLGSRGSSS GGSGSDSEPD SPVFEDSQMK PEQLPAPHGR 480

GMLDRSRLAL CVLVFLCLSC NPLASLMGSW ALPGPSDATS AYHGPWRSVL GAEGRDGPGW 540

VLWLLPPLVW LTNGLLVLLF LALLFVYGEP VTRPHSDPAV RFWRHRKQAD LDLARGDFAQ 600

AAQQLWLALR ALGRPLPTSH LDLACSLLWN LIRHLLQRLW VGRWLAGRAG GLRRDSALEA 660

DTRTSACDAA LVYHKLHQLH TMGKYPGGHL DAANLALSAL NLAECAGDAL SVAVLAEVYV 720

AAALRVKTSL PRALHFLTRF FLSSARQACL AQSGSVPVAM QWLCHPVGHR FFVDGDWAVC 780

GAPRDSLYSV AGNPVDPLAQ VTQLFREHLL EQALHCVAQP SPGPGSADGD REFSEALGFL 840

QLLNSCCDTA GAPACSFSIA SSTAATAGTD PVAKWWASLT AVVTHWLGRD EEAAERLYPL 900

VEHLPRALQE SERPLPRAAL HSFKAARALL GRGKAESGSA SLAMCEKASG YLQDSLAATP 960

AGSSIDKAMQ LLLCDLLLVA RTSLWQRQKP PPPSQASQGS SSGAQASALE LRGFQRDLSG 1020

LRRLAQSFRP AMRRVFLHEA TARLMAGASP ARTHQLLDRS LRRRAGPCGR GGAAAAAAAE 1080

LEPRPTRREQ AEALLLASCY LPPGFLSAPG QRVGMLAEAA RTLEKLGDRR LLHDCQQMLM 1140

RLGGGTTVTS S 1151

本发明具有实质性特点和显著进步，目前，在猪ADD1基因的研究中只有部分的cDNA序列(GenBank AY307771和AF102873)。发明首次克隆出全长cDNA序列。本发明的一方面可以通过制备该基因的蛋白，用于研究该基因在猪脂肪细胞分化和调节体内胆固醇水平等过程中的作用。另一方面可以通过标记辅助选择(MAS)的方法对瘦肉型猪和低胆固醇型猪的生产和育种中发挥指导性作用。

附图说明

图1为猪脾脏组织总RNA琼脂糖电泳图

图中28S和18S RNA亮度之比大约为2，说明组织总RNA未被降解，可以进行反转录。

图2用脾脏组织总RNA的反转录为模板进行PCR反应产物的琼脂糖电泳图

经过凝胶成像***分析，片断大小为750bp。

图3猪同其它物种的ADD1基因(SREBF1基因)和SREBF2基因间编码序列间的聚类分析图。

图4为借助rpsBlast软件分析得到螺旋-环-螺旋(Helix-Loop-Helix，HLH)核心结构的三维图。

具体实施方式

下面结合具体实施例对本发明进一步描述：这些实施例仅用于说明本发明而不用于限制本发明的范围。下列实施例中未注明具体条件的实验方法，通常按照常规条件，例如Sambrook等分子克隆：实验室手册(New York：Cold Spring Harbor LaboratoryPress，1989)中所述的条件，或按照制造厂商所建议的条件。

实施例1

猪ADD1基因的克隆

1.组织分离(Isolation)

从屠宰场采集猪新鲜的脾脏组织(品种为“梅山猪”)迅速放入液氮中冷冻保存，并且将其带回实验室，放入-70℃保存，准备提取组织总RNA。

2.总RNA的分离(Total RNA isolation)

(1)提取RNA的准备工作

玻璃制品用0.1M的NaOH浸泡过夜，用自来水反复冲洗，再用蒸馏水冲洗2遍，180℃烘烤4小时。

匀浆器、电泳槽用3％的双氧水浸泡20-30分钟，再用0.1％的DEPC水冲洗。由于未灭活的DEPC对PCR反应有影响，可用0.5％的SDS处理。

Tip头、EP管用0.1％的DEPC水浸泡过夜，高压灭菌使DEPC失活。

双蒸水和溶液用DEPC处理，即每100ml水或溶液加0.1mlDEPC液，室温放置过夜，高压灭菌30分钟使DEPC失活。

(2)组织总RNA提取

取100mg在液氮冻存组织样加入有1ml Trizol(trizal reagent，invitrogen BRL，USA)在匀浆器中匀浆。4℃ 12000转/分钟离心10分钟。吸取上清液，15-30℃温育5分钟。加0.2ml氯仿，盖上盖子，用手剧烈震荡15秒。15-30℃温育2-3分钟。4℃12000转/分钟离心15分钟。吸取上清液，加0.8ml异丙醇，混合均匀。15-30℃温育10分钟，4℃ 12000转/分钟离心10分钟，离心管底部白色沉淀即为RNA。倒掉上清，加1ml 75％乙醇洗涤RNA，4℃7500转/分钟10分钟。自然干燥或真空干燥RNA.溶于水(RNase free)中分装，-80℃保存。

(3)组织总RNA的鉴定

通过分光光度计上测定RNA含量并且用琼脂糖电泳分析RNA的质量，具体方法如下：

电泳槽用RNA清洗液(100mM NaOH，1mM EDTA)浸泡4-5小时，再用DEPC处理过的水反复冲洗数次后倒入1×TBE待用。琼脂糖凝胶用1×TBE配制。在10ul上样缓冲液(2×TBE，13％菲可，0.1％溴酚兰，7M尿素)中加入1ul以上组织总RNA，65℃变性10分钟后立即放入冰水中2-3分钟。点样于琼脂糖凝胶中电泳。

3.全长cDNA的克隆(Cloning of Full-length cDNA)

根据猪的已知部分的cDNA(GenBank AY307771)设计反转录引物(5’-ACCGTCGCCAGGAT-3’)和PCR下游引物(5’-CAGGGAGTCCGCCTTGAT-3’)，根据人和鼠的氨基酸保守序列设计PCR上游引物(5’-CGCCGGCGCCATGGACGAGC-3’)利用同源性基因克隆原理，采用RT-PCR同5’-RACE(TaKaRa试剂盒)相结合的方法进行cDNA全长克隆，分三个阶段进行：

(1)cDNA的合成

利用脾脏组织总RNA 5ug按照TaKaRa 5’-RACE试剂盒配置反应液和进行PCR反应。

(2)杂合链RAN的分解

利用第一步反应液按照TaKaRa 5’-RACE试剂盒配置反应液，用Rnase H 30℃消化1小时，消化杂合链中的RNA后，将单链DNA稀释备用。

(3)PCR反应

用稀释过的第二步的反应液为模板进行PCR反应。PCR[BP001(SEQ ID NO.1)+BP002(SEQ ID NO.2)]。其反应参数为：95℃预变性5min，95℃变性30s，56℃退火30s，72℃延伸1min，35个循环，72℃延伸10min，4℃10min.得到760bp的DNA片断，其中有276bp同猪的已知片断同源性高达98.91％

(4)测序

将PCR产物回收后同PMD 18-T Vector(TaKaRa)相连接，转化到感受态的大肠杆菌JM109中。经过菌株PCR和双酶切鉴定后的菌株在LB培养基37℃培养过夜，送交测序。测序结果经过拼接后共760bp。

实施例2

猪ADD1基因的序列分析和同源型比较

1、猪ADD1基因的序列分析

将cDNA序列中CDS部分用primer priemer 5.0软件翻译成氨基酸序列后在http://www.ncbi.nlm.nih.gov/Structure/cdd/wrpsb.cgi上用rpsBlast软件进行结构预测。发现在氨基酸序列的320-380处有螺旋-环-螺旋(Helix-Loop-Helix，HLH)的核心结构(见附图4)。

2、猪ADD1基因序列的同源性分析

将该基因氨基酸序列和碱基序列在http://www.ncbi.nlm.nih.gov/BLAST/BLAST/Blast.cgi上分别用Blastn和Blastp软件进行同源性分析。结果发现该基因的碱基序列和氨基酸序列同人及鼠的ADD1基因有高度同源性。

3、***发生树的构建

用DNAMAN软件将不同物种的ADD1基因和SREBP2基因(SREBPs家族中另外一个基因)序列来绘制***发生树。结果发现在猪ADD1基因同哺乳动物人、狗和鼠基因间同源性较高，而同鸡的同源性只有66％。在SREBPs基因家族中两个基因间同源性有51％。(见附图3)结果表明实验所得到的序列为目标序列。

在同原有猪的序列的同源性比较中发现了6处突变位点。同AF103873比较中发现，在全长序列的1022位g-a、1034位t-c、108位a-g的突变。同AY307771比较中发现532位a-g、625位c-t的突变，600位c-t突变导致Leu-Pro的突变。以上突变位点均有可能在标记辅助选择中应用。

表1

同AF103873

Query：994 tcacaatgccatcgagaaacgctaccgctcctccatcaatgacaagatcatcgagctcaa 1053

|||||||||||||||||| ||||||||||| |||||||||||||||||||||||||||||

AF103873：301 tcacaatgccatcgagaagcgctaccgctcttccatcaatgacaagatcatcgagctcaa 360

Query：1054 ggacctggtggtgggcacggaggcgaagctgaataaatccgccgtcttgcgcaaggccat 1113

||||||||||||||||||||||||||| ||||||||||||||||||||||||||||||||

AF103873：361 ggacctggtggtgggcacggaggcgaaactgaataaatccgccgtcttgcgcaaggccat 420

同AY307771

Query：485 cctgcccccgtgttgggctaccccagccctcctggaagcttctcctcggcgacccctcca 544

||||||||||||||||||||||||||||||||||||||||||||||| ||||||||||||

AY307771 1 cctgcccccgtgttgggctaccccagccctcctggaagcttctcctcagcgacccctcca 60

Query：545 gggagcacctcacagacgctgcctggcctgccgctggcctctctgcccggggtcctgccc 604

||||||||||||||||||||||||||||||||||||||||||||||||||||||| ||||

AY307771：61 gggagcacctcacagacgctgcctggcctgccgctggcctctctgcccggggtcccgccc 120

Query：605 gtctccgtgcacacccaggttcaaagtgcggccccccagcagctgttgacagccacggcc 664

|||||||||||||||||||| |||||||||||||||||||||||||||||||||||||||

AY307771：121 gtctccgtgcacacccaggtccaaagtgcggccccccagcagctgttgacagccacggcc 180

Query：猪脂肪细胞分化和定向因子1的核酸序列

本发明涉及的序列及记号分列如下：

(1)SEQ ID NO.1的信息

(i)序列特征：

(A)长度：14bp

(B)类型：核苷酸

(C)链性：单链

(D)拓扑结构：线性

(ii).分子类型：寡核苷酸

(iii).序列描述：SEQ ID NO.1

ACCGTCGCCAGGAT

(2)SEQ ID NO.2的信息

(i)序列特征：

(A)长度：20bp

(B)类型：核苷酸

(C)链性：单链

(D)拓扑结构：线性

(ii).分子类型：寡核苷酸

(iii).序列描述：SEQ ID NO.2

CGCCGGCGCCATGGACGAGC

(3)SEQ ID NO.3的信息

(i)序列特征：

(A)长度：18bp

(B)类型：核苷酸

(C)链性：单链

(D)拓扑结构：线性

(ii).分子类型：寡核苷酸

(iii).序列描述：SEQ ID NO.3

CAGGGAGTCCGCCTTGAT

(4)SEQ ID NO.4的信息

<110>上海交通大学

<120>猪ADD1基因蛋白编码序列

<140>

<141>2004-01-6

<160>3

<170>PatentIn version 3.1

<210>1

<211>3830

<212>DNA

<213>猪Sus scrofa ADD1蛋白

<400>1

CGCCGGCGCC ATGGACGAGC CGCCCTTCAC AGAGGCAGCC TTGGAGCAGG CGCTGGCCGA 60

GCCATGCGAG CTGGACGCGG CGCTGCTGAC CGACATCGAA GACATGCTTC AGCTCATCAA 120

CAACCAAGAC AGCGACTTCC CCGGCCTGTT CGACGCGCCC TACGCTGGCG TTGCAGGAGG 180

CACGGACCCC ACCAGTCCTG ATGCCAGCTC CCCAGGCAGC CCGACGCCGC CTCCTTCCAC 240

CATGAGCTCC CCGCTTGAAG GCTTCCTGGG GGGGGCCAGG ACGCCGCCAC CGCCCCCCGT 300

GTCCCCAACC CAGCCTGCAC CCACCCCGCT GAAGATGTAC CCGTCGGTGC CTGCCTTCTC 360

GCCTGGGCCG GGCATCAAGG AGGAGCCAGT GCCACTGACC ATCCTGCAGC CCCCCACCCC 420

ACAGCCCCTG TCTGGGGCTC TCCTGCCCCA GAGCCTTCCA GCCCTCGCCC CTCCGCAGTT 480

GAGCCCTGCC CCCGTGTTGG GCTACCCCAG CCCTCCTGGA AGCTTCTCCT CGGCGACCCC 540

TCCAGGGAGC ACCTCACAGA CGCTGCCTGG CCTGCCGCTG GCCTCTCTGC CCGGGGTCCT 600

GCCCGTCTCC GTGCACACCC AGGTTCAAAG TGCGGCCCCC CAGCAGCTGT TGACAGCCAC 660

GGCCACCCCC GTGGTGTCCC CTGGAACAAC CACTGTGACC TCGCAGATCC AGCAGGTCCC 720

GGTCCTGCTG CAGCCCCACT TCATCAAGGC GGACTCCCTG CTCCTGACGA CCATGAAAAC 780

AGACATGGGG ACCCCTGTGA AGGCGGCGGG CATCGGCTCC CTGGCCCCTG GCACAGCCGT 840

GCAGGCAGCA CCTTTGCAGA CCCTGGTGAG CGGCGGGACC ATCCTGGCGA CGGTGCCTCT 900

GGTAGTGGAC ACTGACAAGC TGCCCATCAA CCGCCTGGCA GCTGGGGGCA AAGCCCTGAG 960

CTCAGGCCAG AGCCGTGGTG AGAAGCGGAC GGCTCACAAT GCCATCGAGA AACGCTACCG 1020

CTCCTCCATC AATGACAAGA TCATCGAGCT CAAGGACCTG GTGGTGGGCA CGGAGGCGAA 1080

GCTGAATAAA TCCGCCGTCT TGCGCAAGGC CATCGACTAC ATCCGCTTCC TTCAGCAGAG 1140

CAACCAGAAG CTCAAGCAGG AGAACCTGAG TCTGCGGACT GCTGCCCACA AAAGCAAGTC 1200

TCTGAAGGAC CTGGTGTCCT GCAGCAGCGG AGGCCGCACC GACGTGCCCA TGGAGGGTGT 1260

GAAGCCGGAG GTGGTAGACA CCCTTAGCCC GCCCCCCTCC GACGCCGGCT CGCCCTCCCA 1320

GAGCAGCCCC TTGTCCCTCG GCAGCAGGGG CAGCAGCAGC GGTGGCAGTG GCAGTGACTC 1380

AGAGCCCGAC AGCCCGGTTT TTGAGGACAG CCAGATGAAG CCAGAGCAGC TGCCGGCCCC 1440

CCACGGCCGG GGCATGCTGG ACCGCTCCCG CCTGGCCCTG TGCGTGCTCG TCTTCCTCTG 1500

TCTCTCCTGC AACCCCTTGG CCTCACTGAT GGGCAGCTGG GCTCTCCCTG GCCCCTCCGA 1560

TGCCACCAGC GCCTACCACG GGCCCTGGCG CAGCGTACTG GGCGCTGAGG GCAGAGATGG 1620

CCCTGGCTGG GTCCTGTGGC TGCTGCCCCC GCTGGTCTGG CTGACGAATG GGCTGCTGGT 1680

GCTGCTCTTC TTGGCGCTTC TCTTTGTCTA TGGAGAGCCG GTCACGCGGC CCCACTCGGA 1740

TCCAGCTGTG CGCTTCTGGA GGCATCGCAA GCAGGCCGAC CTGGACCTGG CCCGGGGGGA 1800

CTTCGCCCAG GCTGCCCAGC AGCTGTGGCT GGCCCTGCGG GCGCTGGGCC GGCCCCTGCC 1860

CACCTCCCAC CTGGACCTGG CCTGCAGCCT GCTCTGGAAC CTCATCCGCC ACCTGCTGCA 1920

GCGTCTCTGG GTGGGCCGCT GGCTGGCGGG CCGGGCCGGG GGCCTGCGGA GGGACAGCGC 1980

CCTGGAGGCG GACACCCGCA CCAGCGCCTG TGACGCGGCC CTCGTCTACC ACAAGCTGCA 2040

CCAGCTGCAC ACCATGGGGA AGTACCCAGG CGGGCACCTC GATGCCGCCA ACCTGGCGCT 2100

GAGTGCCCTG AACCTGGCGG AGTGTGCGGG TGATGCCCTG TCCGTGGCCG TGCTGGCGGA 2160

GGTCTATGTG GCCGCTGCCC TGCGAGTCAA GACCAGTCTC CCCCGGGCCT TGCACTTTCT 2220

GACCCGCTTC TTCCTGAGTA GCGCCCGCCA GGCCTGCCTG GCACAAAGCG GCTCGGTGCC 2280

TGTTGCCATG CAGTGGCTCT GCCACCCTGT GGGCCACCGT TTCTTCGTGG ATGGGGACTG 2340

GGCCGTGTGC GGTGCCCCCC GGGACAGCTT GTACAGCGTG GCTGGGAACC CAGTGGACCC 2400

CCTGGCCCAG GTGACTCAGT TGTTCCGTGA ACACCTCTTG GAGCAAGCCC TGCATTGCGT 2460

GGCCCAGCCC AGCCCCGGCC CTGGATCAGC TGATGGGGAC AGGGAATTCT CAGAGGCCCT 2420

CGGGTTCCTG CAGCTGCTCA ACAGCTGTTG TGACACAGCC GGGGCTCCTG CCTGCAGCTT 2580

CTCCATTGCC TCCAGCACAG CCGCCACGGC CGGCACAGAC CCGGTCGCCA AGTGGTGGGC 2640

CTCGCTGACG GCTGTGGTGA CCCACTGGCT GGGGCGGGAC GAGGAGGCGG CCGAGCGGCT 2700

GTACCCGCTG GTGGAGCACC TGCCCCGCGC CCTGCAGGAG TCCGAGAGAC CCCTGCCCAG 2760

GGCAGCTCTG CACTCCTTCA AGGCCGCCCG GGCCCTGCTG GGCCGCGGGA AGGCAGAGTC 2820

TGGCTCAGCC AGCCTGGCCA TGTGTGAGAA GGCCAGTGGG TACCTGCAGG ACAGCCTGGC 2880

CGCCACGCCA GCCGGCAGCT CCATTGACAA GGCCATGCAG CTGCTCCTGT GTGACCTGCT 2940

CCTTGTGGCG CGCACCAGCC TGTGGCAGCG GCAGAAGCCG CCCCCACCCT CCCAGGCCTC 3000

GCAGGGCTCG AGCAGCGGGG CCCAGGCCTC TGCGCTCGAG CTGCGCGGCT TCCAGAGGGA 3060

CCTGAGTGGC CTGAGGCGCC TGGCGCAGAG CTTCCGGCCT GCCATGCGGA GGGTGTTCCT 3120

CCATGAGGCC ACCGCCAGGC TGATGGCCGG GGCCAGCCCC GCGCGGACGC ACCAGCTCCT 3180

GGACCGCAGT CTGAGGAGGA GGGCGGGCCC CTGCGGCAGA GGAGGCGCGG CGGCCGCGGC 3240

GGCGGCGGAG CTGGAACCGC GGCCCACGCG GCGGGAGCAG GCCGAGGCCC TGCTGCTCGC 3300

CTCCTGCTAC CTGCCGCCCG GCTTCCTGTC GGCGCCGGGG CAGCGCGTGG GCATGCTGGC 3360

CGAGGCGGCG CGCACGCTCG AGAAGCTCGG CGACCGCCGG CTGCTGCACG ACTGCCAGCA 3420

GATGCTCATG CGCCTGGGCG GCGGGACCAC CGTGACCTCC AGCTAGACCC CTGCGGGCGG 3480

CCCAGCCCCA GCGACCCCGT CTCAGTCTCG ACGGCCGAGG GCAGCTCTGG AGCCCCGGCC 3540

CCCGGCTCGC CGGCGGAGTG CCCGGTCCCT GGGGGTATGG AGACGCGGGG CCCGGCGTTG 3600

ACGGGGCCGT CCAGCCCGCA CCCCGGGTCG ACGAGCGGCC GCCAGGGTGG TGCTGGCCTC 3660

TGGTGGCCGG CCGAGGGATT GCCGGGGCCT GGCGGCCGCC AGGTGCCTCC CATTCCACCC 3720

ACTGGCAGCC ACTCCGCGGC TTTCCCTCTC TGTCCAGGGG GAGGAAAGGG GTGCGTTTCA 3780

CTGGGCCGAG GGGCCGGCTT GGCCTTCCTT GCCGCCGGGC GCCTCCTTCC 3830

<210>2

<211>1151

<212>PRT

<213>猪Sus scrofa ADD1蛋白

<400>2

MDEPPFTEAA LEQALAEPCE LDAALLTDIE DMLQLINNQD SDFPGLFDAP YAGVAGGTDP 60

TSPDASSPGS PTPPPSTMSS PLEGFLGGAR TPPPPPVSPT QPAPTPLKMY PSVPAFSPGP 120

GIKEEPVPLT ILQPPTPQPL SGALLPQSLP ALAPPQLSPA PVLGYPSPPG SFSSATPPGS 180

TSQTLPGLPL ASLPGVLPVS VHTQVQSAAP QQLLTATATP VVSPGTTTVT SQIQQVPVLL 240

QPHFIKADSL LLTTMKTDMG TPVKAAGIGS LAPGTAVQAA PLQTLVSGGT ILATVPLVVD 300

TDKLPINRLA AGGKALSSGQ SRGEKRTAHN AIEKRYRSSI NDKIIELKDL VVGTEAKLNK 360

SAVLRKAIDY IRFLQQSNQK LKQENLSLRT AAHKSKSLKD LVSCSSGGRT DVPMEGVKPE 420

VVDTLSPPPS DAGSPSQSSP LSLGSRGSSS GGSGSDSEPD SPVFEDSQMK PEQLPAPHGR 480

GMLDRSRLAL CVLVFLCLSC NPLASLMGSW ALPGPSDATS AYHGPWRSVL GAEGRDGPGW 540

VLWLLPPLVW LTNGLLVLLF LALLFVYGEP VTRPHSDPAV RFWRHRKQAD LDLARGDFAQ 600

AAQQLWLALR ALGRPLPTSH LDLACSLLWN LIRHLLQRLW VGRWLAGRAG GLRRDSALEA 660

DTRTSACDAA LVYHKLHQLH TMGKYPGGHL DAANLALSAL NLAECAGDAL SVAVLAEVYV 720

AAALRVKTSL PRALHFLTRF FLSSARQACL AQSGSVPVAM QWLCHPVGHR FFVDGDWAVC 780

GAPRDSLYSV AGNPVDPLAQ VTQLFREHLL EQALHCVAQP SPGPGSADGD REFSEALGFL 840

QLLNSCCDTA GAPACSFSIA SSTAATAGTD PVAKWWASLT AVVTHWLGRD EEAAERLYPL 900

VEHLPRALQE SERPLPRAAL HSFKAARALL GRGKAESGSA SLAMCEKASG YLQDSLAATP 960

AGSSIDKAMQ LLLCDLLLVA RTSLWQRQKP PPPSQASQGS SSGAQASALE LRGFQRDLSG 1020

LRRLAQSFRP AMRRVFLHEA TARLMAGASP ARTHQLLDRS LRRRAGPCGR GGAAAAAAAE 1080

LEPRPTRREQ AEALLLASCY LPPGFLSAPG QRVGMLAEAA RTLEKLGDRR LLHDCQQMLM 1140

RLGGGTTVTS S 1151

Claims

1、一种猪脂肪细胞定向和分化因子1的基因序列，其特征在于，SEQ ID NO.4中核苷酸序列1-3830位的核苷酸序列构成。

2、一种编码权利要求1所述的猪脂肪细胞定向和分化因子1的氨基酸序列，其特征是，SEQ ID NO.4中1-1151位的氨基酸序列构成。