CN103014001A - 双峰驼肌球蛋白基因、重组蛋白及其克隆方法 - Google Patents

双峰驼肌球蛋白基因、重组蛋白及其克隆方法 Download PDF

Info

Publication number
CN103014001A
CN103014001A CN 201210478250 CN201210478250A CN103014001A CN 103014001 A CN103014001 A CN 103014001A CN 201210478250 CN201210478250 CN 201210478250 CN 201210478250 A CN201210478250 A CN 201210478250A CN 103014001 A CN103014001 A CN 103014001A
Authority
CN
China
Prior art keywords
glu
lys
leu
ala
myosin
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN 201210478250
Other languages
English (en)
Inventor
陈钢粮
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
XINJIANG WANGYUAN CAMEL MILK INDUSTRIAL Co Ltd
Original Assignee
XINJIANG WANGYUAN CAMEL MILK INDUSTRIAL Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by XINJIANG WANGYUAN CAMEL MILK INDUSTRIAL Co Ltd filed Critical XINJIANG WANGYUAN CAMEL MILK INDUSTRIAL Co Ltd
Priority to CN 201210478250 priority Critical patent/CN103014001A/zh
Publication of CN103014001A publication Critical patent/CN103014001A/zh
Pending legal-status Critical Current

Links

Images

Landscapes

  • Peptides Or Proteins (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)

Abstract

本发明涉及基因工程技术领域,是一种双峰驼肌球蛋白基因、重组蛋白及其克隆方法,该双峰驼肌球蛋白基因,其特征在于该基因的核苷酸序列具有SEQIDNO.1所示的序列,该肌球蛋白的氨基酸序列为SEQIDNO:2。对包括SEQIDNO.1在内的九个物种的九条肌球蛋白基因的氨基酸序列构建了***发生树,结果发现:双峰驼与牛、人的肌球蛋白亲缘关系最近,与大熊猫的亲缘关系最远。同时,本发明研究双峰驼的肌球蛋白序列及进化树可以直观的表现出双峰驼肌球蛋白序列与其他物种此蛋白序列的差异,对研究双峰驼及其他物种以及人类的耐力运动提供一定的理论依据促进运动生理学的发展。

Description

双峰驼肌球蛋白基因、重组蛋白及其克隆方法
技术领域
本发明涉及基因工程技术领域,是一种双峰驼肌球蛋白基因、重组蛋白及其克隆方法。
背景技术
肌球蛋白 (myosin) 肌原纤维粗丝的组成单位。存在于平滑肌中。在肌肉运动中起重要作用。其分子形状如豆芽状,由两条重链和多条轻链构成。两条重链的大部分相互螺旋形地缠绕为杆状,构成豆芽状的杆,重链的剩余部分与轻链一起,构成豆芽的瓣。被激活后,具有活性的、能分解ATP的ATP酶。其分子量约为51万。在粗丝中,都是分子的头朝向粗丝的两端,呈纵向线性缔合排列。
肌球蛋白是由森特·吉奥尔吉(A·Szent-Gyrgyi,1942)分离出来的,但是相当于现在所说的肌动球蛋白物质是库恩(W.Khne,1859)最初从蛙抽提出来的,并被命名为肌球蛋白。肌球蛋白的ATP酶活性是由苏联的V.A.Engelhardt夫妇(1939)发现的。
肌球蛋白作为细胞骨架的分子马达,是一种多功能蛋白质,其主要功能是为肌肉收缩提供力。纤丝滑动学说(sliding filament theory)认为肌肉收缩是由于肌动蛋白细丝与肌球蛋白丝相互滑动的结果。在肌肉收缩过程中,粗丝和细丝本身的长度都不发生改变,当纤丝滑动时,肌球蛋白的头部与肌动蛋白的分子发生接触、转动,最后脱离的连续过程,其结果使细丝进行相对的滑动。
1986年 Spudic h实验室首次建立体外模拟滑动体系, 测试肌球蛋白与肌动蛋白相互滑动产生的力。在 1994年 F iner等人成功地用双光钳进行单分子运动测试, 这样就可以在单分子水平上进行肌丝滑动研究以及测试其产生力量的大小,从而对肌球蛋白进行了更深入的研究。2005年,EI-Mounayri等比较了不善运动的人、 经常参加运动的人和优秀的越野滑雪选手股外肌单根肌纤维MHC 组成,研究发现,与经常参加运动和优秀的越野选手相比, 不善运动人的肌纤维以Ⅰ型和Ⅱa 型 MHC为主, 另外还含有比例相对较高的 (约 20%) Ⅱb 型MHC 和Ⅱa/Ⅱb 共存型 MHC;经常参加运动的人股外肌含有Ⅰ型 MHC 的纤维明显增加,含有Ⅱb 以及Ⅱa/Ⅱb 共存型 MHC 的纤维明显减少。
有“沙漠之舟”之称的骆驼由于沙漠地面极为松软,限制了骆驼的狂奔疾驰,而沙漠食物的匮乏以及水源的奇缺,又使骆驼不得不具有较快的行走速度和持久的耐力。长期自然选择的结果,使骆驼的体形结构又比其他动物特殊,其颈部较长,呈“乙”字形,有利于保持身体平衡;体躯较短,前腿长,支持面小而重心高,便于躯体的前移和迈出较大的步伐;后肢短而呈刀状,具有较强的推动力和耐久力。
由于骆驼同其他动物相比有持久的耐力,可以适应沙漠中食物的匮乏及水源的奇缺,肌球蛋白是肌肉运动中非常重要的一种蛋白,所以研究骆驼的肌球蛋白有非常重要的意义。
发明内容
本发明提供了一种双峰驼肌球蛋白基因、重组蛋白及其克隆方法,肌球蛋白作为细胞骨架的分子马达,是一种多功能蛋白质,其主要功能是为肌肉收缩提供力,通过利用该双峰驼肌球蛋白的基因编码序列构建***发生树,可以直观的表现出双峰驼肌球蛋白序列与其他物种肌球蛋白序列的差异,对研究双峰驼及其他物种以及人类的耐力运动提供一定的理论依据促进运动生理学的发展。
本发明的技术方案之一是通过以下措施来实现的:一种双峰驼肌球蛋白基因,该基因的核苷酸序列具有SEQ ID NO.1所示的序列。
下面是对上述发明技术方案之一的进一步优化或/和改进:
上述基因的核苷酸序列具有SEQ ID NO.1中21-5939位的序列。
本发明的技术方案之二是通过以下措施来实现的:一种含有双峰驼肌球蛋白基因的重组蛋白。
下面是对上述发明技术方案之二的进一步优化或/和改进:
上述重组蛋白的氨基酸序列具有SEQ ID NO.2所示的序列。
上述重组蛋白为具有SEQ ID NO:2所示的氨基酸序列的多肽、或其保守性变异多肽、或其活性片段,或其活性衍生物。
上述重组蛋白通过设计一对引物从双峰驼肌球蛋白中得到双峰驼肌球蛋白基因,该引物对的核苷酸序列信息如下:
反引物,SEQ ID NO.4(反向):5’- ATGGGCAAGC TGCTCCAGCA GC -3’,
正引物,SEQ ID NO.3(正向):5’- CTGGCTGCTG GAGCAGCTTG CC -3’。
本发明的技术方案之三是通过以下措施来实现的:一种双峰驼肌球蛋白基因的克隆方法,其特征在于按下述步骤进行:
第一步,总RNA提取,采取双峰驼组织样品后,对组织样品进行组织总RNA提取;
第二步,引物设计及合成,引物对的核苷酸序列信息如下:
正引物,SEQ ID NO.3(正向):5’- ATGGGCAAGC TGCTCCAGCA GC -3’,
反引物,SEQ ID NO.4(反向):5’- CTGGCTGCTG GAGCAGCTTG CC -3’;
第三步,RT-PCR扩增,利用反转录试剂盒对组织样品中的蛋白基因进行反转录,并对待扩增的DNA片段进行RT-PCR扩增;
第四步,蛋白基因的克隆,首先对PCR扩增的DNA片段进行回收,然后将回收的DNA片段同T载体连接形成感受态细胞,将感受态细胞进行转化培养成单菌落,取少量该单菌落进行PCR扩增,对扩增后的单菌落鉴别T载体上是否含有目的DNA片段,若有目的DNA片段,将单菌落放入培养基中进行过夜培养,最后对质粒进行回收。
本发明双峰驼肌球蛋白基因是一种在肌肉运动中起重要作用的蛋白的基因,与骆驼能适应沙漠中食物的匮乏以及水源的奇缺,有较快的行走速度和持久的耐力有很大关系,是非常重要的一种蛋白质,同时,本发明研究双峰驼的肌球蛋白序列及进化树可以直观的表现出双峰驼肌球蛋白序列与其他物种此蛋白序列的差异,为以后研究双峰驼及其他物种中的耐力研究提供实验数据,对研究双峰驼及其他物种以及人类的耐力运动提供一定的理论依据促进运动生理学的发展。因此本发明具有很大的应用价值。
附图说明
图1. 双峰驼肌球蛋白基因RT-PCR产物电泳图
图2. 构建***发生树所用肌球蛋白氨基酸同源性比较
图3. 不同物种肌球蛋白氨基酸序列***进化树
具体实施方式
本发明不受下述实施例的限制,可根据本发明的技术方案与实际情况来确定具体的实施方式。
下面结合实施例及附图对本发明作进一步描述:
实施例1,一种双峰驼肌球蛋白基因,该基因的核苷酸序列具有SEQ ID NO.1所示的序列。该序列是肌原纤维粗丝的组成单位,存在于平滑肌中,在肌肉运动中起重要作用的蛋白的基因,本发明中的双峰驼肌球蛋白基因的核苷酸序列是通过以双峰驼肝脏组织中总RNA为模板,参考人、鼠、牛等物种的肌球蛋白基因的同源序列设计引物,进行反转录PCR而获得的基因核苷酸序列SEQ ID NO.1。
可根据实际需要,对上述双峰驼肌球蛋白基因作进一步优化或/和改进:
双峰驼肌球蛋白基因的核苷酸序列具有SEQ ID NO.1中21-5939位所示的序列。在SEQ ID NO.1中,RT-PCR产物长度为5953bp,电泳结果见附图1, 其中21-23位为起始密码子ATG,5937-5939位为终止密码子TGA,21-5939位为编码蛋白质区域(CDS)。
实施例2,一种双峰驼肌球蛋白基因的重组蛋白。
可根据实际需要,对上述双峰驼肌球蛋白基因的重组蛋白作进一步优化或/和改进:
重组蛋白的氨基酸序列具有SEQ ID NO:2所示的序列。将双峰驼肌球蛋白基因核苷酸序列中的编码序列(CDS)按通用密码子翻译成的重组蛋白的氨基酸序列见SEQ ID NO.2。
重组蛋白为具有SEQ ID NO:2所示的氨基酸序列的多肽、或其保守性变异多肽、或其活性片段,或其活性衍生物。
通过设计一对引物从双峰驼肌球蛋白中得到双峰驼肌球蛋白基因,该引物对的核苷酸序列信息如下:
反引物,SEQ ID NO.4(反向):5’- ATGGGCAAGC TGCTCCAGCA GC -3’,
正引物,SEQ ID NO.3(正向):5’- CTGGCTGCTG GAGCAGCTTG CC -3’。
实施例3,一种双峰驼肌球蛋白基因的克隆方法,按下述步骤进行:
第一步,总RNA提取
1.     组织分离(Isolation)
从内蒙古阿拉善盟采得双峰驼,快速屠宰并取肝脏样,将组织样迅速放入液氮中冷冻后于-70℃保存,拿回实验室准备提取组织总RNA;
2. 总RNA的分离(Total RNA isolation)
(1) 提取RNA的准备工作
玻璃制品用0.1M的NaOH浸泡过夜,用自来水反复冲洗,再用蒸馏水冲洗2遍,180℃烘烤4小时。
匀浆器、电泳槽用3%的双氧水浸泡20-30分钟,再用0.1%的DEPC水冲洗,由于未灭活的DEPC对PCR反应有影响,可用0.5%的SDS处理。
 Tip头、EP管用0.1%的DEPC水浸泡过夜,高压灭菌使DEPC失活。
双蒸水和溶液用DEPC处理,即每100ml水或溶液加0.1mlDEPC液,室温放置过夜,高压灭菌30分钟DEPC失活。
(2)组织总RNA提取
取100mg在液氮中冻存的组织样放入有1ml Trizol(trizal reagent, invitrogen BRL, USA)的匀浆器管中匀浆。4℃ 12000g离心10分钟,吸取上清液,15-30℃温育5分钟,加0.2ml氯仿,盖上盖子,用手剧烈震荡15秒,15-30℃温育2-3分钟,4℃ 12000g离心15分钟。吸取上清液,加0.8ml异丙醇,混合均匀。15-30℃温育10分钟,4℃ 12000g离心10分钟,离心管底部白色沉淀即为RNA。倒掉上清,加1ml 75%乙醇洗涤RNA,4℃ 7500g离心10分钟,自然干燥或真空干燥RNA。溶于水(RNase free)中分装,-70℃保存。
(3)组织总RNA的鉴定
通过分光光度计上测定RNA含量并且用琼脂糖电泳分析RNA的质量,具体方法如下:电泳槽用RNA清洗液(100mM NaOH,1mM EDTA)浸泡4-5小时,再用DEPC处理过的水反复冲洗数次后倒入1×TBE待用,琼脂糖凝胶用1×TBE配制。在10ul上样缓冲液(2×TBE,13%菲可,0.1%溴酚兰,7M 尿素)中加入1ul以上组织总RNA,65℃变性10分钟后立即放入冰水中2-3分钟,点样于琼脂糖凝胶中电泳。
第二步,引物设计及合成 
根据GenBanK发表的人(Accession No: CAD91136.1)、鼠(Accession No: EDL10431.1)、牛(Accession No: NP_001179691.1)等物种的溶菌酶基因mRNA序列ORF侧翼同源序列,设计如下引物用于以双峰驼溶菌酶cDNA为模版的PCR扩增,以获得双峰驼溶菌酶基因cDNA序列。引物用Primer Premier 5.0自行设计,由上海桑尼生物科技有限公司合成,该引物对的核苷酸序列分别为SEQ ID NO:3(正向)和SEQ ID NO:4(反向),序列信息如下:
SEQ ID NO.3(正向):5’- ATGGGCAAGCTGCTCCAGCAGC -3’
SEQ ID NO.4(反向):5’- CTGGCTGCTGGAGCAGCTTGCC -3’
第三步,RT-PCR扩增
按大连宝生物反转录试剂盒(BcaBEST RNA PCR Kit Ver.1.1)要求进行反转录。反转录反应液组成:10ul 2×Bca 1st Buffer,4ul 25Mm MgSO4,1ul dNTP Mixture,0.5ul Rnase Inhibitor (40U/ul),1ul BcaBEST Polymerase(22U/ul),1ul Oligo dT Primer,1ul RNA Sample,1.5ul Rnase Free dH2O,总体系为20 ul。反转录反应条件:65℃1分钟,30℃5分钟(15分钟-30分钟内匀速升温),65℃25分钟,98℃5分钟,5℃5分钟。PCR扩增条件:97℃ 变性5分钟;95℃30秒→55℃30秒→72℃1分钟,如此进行30次循环;72℃延伸10分钟,4℃保存。
第四步,蛋白基因的克隆 
1、PCR扩增片段的回收:片段回收按上海华舜小量胶回收试剂盒说明进行,操作过程如下:尽可能小的割下含DNA的琼脂糖块,放入1.5mlEP管中。按每100mg琼脂糖加入300ulS1液的比例加S1液,50℃水浴10分钟。将溶化的琼脂糖液移入吸附柱,10000g离心1分钟,倒掉管中液体。在吸附柱中加入500ul W1液,10000g离心15秒。倒掉管中液体,在吸附柱中加入500ul W1液,静置1分钟后,10000g离心15秒,倒掉管中液体。离心1分钟,将吸附柱放入一个干净的1.5mlEP管中,在吸附膜中央加入30ulT1液,静置1分钟后,10000g离心1分钟, EP管中液体即为回收的DNA。
2、回收片段同T载体的连接:连接用TaKaRa pMD18-T Vector试剂盒,操作过程如下:在EP管中制备下列连接反应液:pMD 18-T Vector(50ng/ul) 0.5ul,DNA 20-40ng,Solution 1 5ul,加dH2O至10ul。将上述反应液在16℃反应30分钟(过夜也可以),产物用于转化感受态细胞。
3、质粒的转化:从—70℃冰箱中取出保存的感受态细胞,冰浴助溶。100ul感受态细胞加入10ul连接产物,冰浴30分钟。42℃水浴热应激90秒钟,立即置入冰浴中2分钟。加400ul液体LB培养基,37℃复活50分钟。取100ul铺于LB平板上,平板含0.1%(V/V)的氨苄青霉Amp (100mg/ml),37℃恒温培养10-15小时。
4、转化菌落的PCR鉴定与培养:用记号笔标记转化培养的单菌落,用灭菌的牙签蘸取单菌落。将牙签头放入在加有PCR反应液(不含模板)的EP管中晃动,使单菌落充当模板。用获得该片段的PCR条件进行扩增,PCR产物同Marker一起进行琼脂糖凝胶电泳,鉴别T载体上是否含有目的片段,若得到目的片段,可用灭菌枪头挑取在平板上的与之对应的单菌落,放入40 ml LB液体培养基中,先在液体中加入0.1%(V/V)的青霉素钠(100mg/ml),37℃过夜摇菌培养,用于质粒回收。
5、质粒的回收:质粒回收用上海华舜小量质粒抽提纯化试剂盒,操作步骤如下:将转化培养的菌液加入1.5mlEP管中,4000转/分钟离心,倒掉液体获细菌沉淀。细菌沉淀不够时可再加一次菌液离心。在细菌沉淀中加入250ulP1液,振荡悬浮。加入250ulP2液,温和摇匀,室温静置4分钟。加入350ulP3液,温和摇匀。离心10分钟,将上清液小心移入吸附柱,离心15秒,倒掉液体。在吸附柱中加入500ulW1,离心15秒,倒掉液体。在吸附柱中加入500ulW1,静置1分钟,离心15秒,倒掉液体。离心1分钟,将吸附柱放入一个干净的1.5mlEP管中,在吸附膜中央加入25-30ulT1液,静置1分钟后,离心1分钟,EP管中液体即为回收的质粒。
6、质粒的酶切鉴定:为了证明回收质粒确为***目的片段的重组质粒,采用双酶切法鉴定。本研究具体操作如下:根据TaKaRa pMD18-T Vector图,选择内切酶Bam HⅠ和Hin d Ⅲ,保证目的片段中无这两种酶的切点。组成如下酶切反应体系:Bam HⅠ1ul,Hin d Ⅲ 1ul,10×K Buffer 2ul,DNA ≤1ul,加dH2O至 20ul。30℃反应3小时,琼脂糖凝胶电泳检测。
实施例4,重组质粒的测序:取20ul重组质粒于EP管中,封口膜密封,交生物技术公司测序。
实施例5,双峰驼肌球蛋白基因序列信息与生物信息学分析和***发生树构建
1、双峰驼肌球蛋白的序列信息与生物信息学分析
本发明新的双峰驼嗅觉感受器CDS的长度为5953 bp,详细序列见SEQ ID NO:1。根据全长CDS推导出双峰驼嗅觉感受器的氨基酸序列,共1972个氨基酸残基,详见SEQ ID NO:2,在线预测(http://www.expasy.ch/tools/pi_tool.html)结果显示,其分子量为227223.04 道尔顿,等电点(pI)为5.63。
2、肌球蛋白基因编码序列***发生树构建
在GenBank上搜索并获得人、鼠等八种物种的八条肌球蛋白基因的编码蛋白序列,加上本发明获得的SEQ ID NO.2序列,利用分子生物学软件MEGA4构建了***发生树(见附图3)。结果显示:双峰驼肌球蛋白基因同牛、人的亲缘关系最近。与大熊猫的亲缘关系最远。
双峰驼的肌球蛋白核苷酸序列与其他物种的肌球蛋白氨基酸序列相似性评价:
在SEQ ID NO.1,双峰驼肌球蛋白基因编码1972个氨基酸。双峰驼和人、鼠、牛等动物用Clustal X 中对齐的肌球蛋白基因编码氨基酸序列同源性比较结果见附图2。其氨基酸序列与人、鼠、牛等物种肌球蛋白氨基酸序列相似性见表一。
序列表:
<110> 新疆旺源驼奶实业有限公司
<120>  双峰驼肌球蛋白的蛋白编码序列
<160>  4     
<210>  1
<211>  5953
<212>  DNA
<213>  阿拉善盟双峰驼
<400>  1
Figure 357765DEST_PATH_IMAGE001
gaccgaccaa gaccatcact atgagttcag accaggaaat ggctgtcttt ggggaggctg        60
ctccttacct ccgaaagtct gaaaaggagc gcatcgaggc ccagaatagg ccctttgatg       120
ccaagacatc agtctttgtg gctgagccca aggaatcctt tgtcaaaggg acgatccaga       180
gcagagaagg agggaaagtg acggtgaaga ccgaaggagg agcgactctg acagtgaaag       240
atgaccaagt ctaccccatg aaccctccca aatttgacaa gatcgaggac atggccatga       300
tgacccacct gcacgagcca ggagtgctgt acaacctcaa agagcgttac gcagcctgga       360
tgatctacac ctactcgggc ctgttctgcg tcaccgtcaa cccctacaag tggctgccgg       420
tgtacaaccc cgaggtggtg acggcctaca gaggcaaaaa gcgccaggag gccccgcccc       480
acatcttctc catctctgac aatgcctatc agttcatgct gactgaccga gagaatcagt       540
caatcctgat caccggagaa tccggggctg ggaagacggt gaacacgaag cgtgtcatcc       600
agtactttgc aacaattgca gttactgggg agaagaagaa ggaggaatct ggcaaaatgc       660
aggggactct ggaagatcag atcatcagtg ccaaccccct actggaggcc tttggcaacg       720
ccaagaccgt gaggaatgac aactcctctc gctttggtaa attcatcaga atccactttg       780
gcactacagg aaaactggct tctgctgata ttgaaacata tctgctggag aagtctagag       840
ttactttcca gcttaaagct gaaaggagct atcatatttt ttaccagatc acatcaaaca       900
ggaagccaga actaattgaa atgcttctga ttaccaccaa cccatatgat tacccattcg       960
tcagtcaagg ggagatcagt gtgcccagca ttgatgatca ggaagaactg atagcgacag      1020
atagtgccat tgatattttg ggctttacta atgaagagaa ggtctccatc tacaagctca      1080
cgggggctgt gatgcactat ggaaacttga agttcaagca aaagcaacgt gaggagcaag      1140
cagagccaga tggcactgaa gttgctgaca aggcagccta cctccagagt ctgaactctg      1200
ctgacctgct caaagccctc tgctttccca gggtcaaggt cggcaacgaa ttcgtcacca      1260
aaggccagac tgtagagcag gtgaccaatg cggtgggtgc tctggccaga gctgtctacg      1320
agaagatgtt cctgtggatg gtcacccgca tcaaccagca gctggacacc aagcagcccc      1380
ggcagtactt catcggggtc ttggacatcg ctggctttga gatctttgat ttcaacagcc      1440
tggagcagct gtgcatcaac ttcaccaacg agaaactgca acagtttttc aaccaccaca      1500
tgttcgtgct ggagcaggag gagtacaaga aggagggcat tgagtggacg ttcatcgact      1560
tcgggatgga cttggctgcc tgcatcgagc tcatcgagaa gcctatgggc atcttctcca      1620
tcctggaaga ggagtgcatg ttccccaagg ccacagacat ctccttcaag aacaagctct      1680
atgagcagca tcttggaaag tctgccaact tccagaagcc caaggttacc aaaggcaagc      1740
ccgaggccca cttctccctg attcactacg cgggcgtggt gaactacaac attattggct      1800
ggctggacaa gaacaaggac cccctgaacg acaccgtggt cgggctgtac cagaagtcag      1860
cattgaagac tctggctctc ctcttctctg gaagagaaac tgaagcagag tctgttggaa      1920
agaaaggtgg taagaagaag ggttcttcct tccagaccgt gtctgctctc ttcagggaga      1980
atttgaacaa gctgatgacc aacctgagga gcactcaccc tcactttgta cggtgcatca      2040
tccccaatga aaccaaaact cccggggcca tggagcatga actggtcctg caccagctgc      2100
gctgtaacgg agtgctggag ggcatccgca tctgcaggaa gggcttcccc agcaggatcc      2160
tctatgcaga cttcaaacag agatacaagg tattaaatgc aagtgccatc cctgaaggac      2220
agttcattga cagcaagaag gcttctgaga agctccttgg gtccatcgac attgaccaca      2280
cccagtacaa attcggtcac accaaggtct ttttcaaagc tggtcttctg gggctcctag      2340
aggagatgcg agatgagaag ctggcccagc tgatgacccg aacccaggcc aggtgcagag      2400
ggttcttggc aagagtggag taccagaaga tggtggagag caggtgcaga gggttcttgg      2460
caagagtgga gtaccagaag atggtggaga ggagggagtc catcttctgc attcagtaca      2520
acatccgagc cttcatgaac gtcaagcact ggccctggat gaaactgttc ttcaagatca      2580
agcccctcct caagagtgcg gagaccgaga aggagatggc caccatgaag gaagagttcc      2640
agaaaactaa agacgaactt gccaagtcag aagcaaaaag gaaggaactg gaagaaaaaa      2700
tggtgtcact gttgaaagaa aaaaatgact tgcagctcca ggttcagtct gaagctgaag      2760
gcttggctga tgcagaggaa agatgtgacc agttgatcaa aaccaaaatc cacctggagg      2820
ccaagatcaa ggaggtgact gagagagctg aggatgagga agagatcaac gctgagctga      2880
cggccaagaa gaggaagctg gaggacgaat gttcagagct gaagaaagac atagatgacc      2940
ttgagctgac actggccaag gttgaaaagg aaaagcatgc tacagagaac aaggtgaaaa      3000
acctcacaga agagatggca ggactggatg aagtcatagc taagctgacc aaggagaaga      3060
aggccctcca ggaggcccac cagcagaccc tggatgacct acaggcagaa gaggacaaag      3120
tcaacaccct gaccaaagct aaaaccaagc tagagcagca agtggatgac cttgaaggat      3180
ccttggagca agaaaagaaa cttcgcatgg atctagagag ggccaagagg aaacttgaag      3240
gtgacctcaa gttggcccaa gagtccataa tggacattga aaatgaaaaa caacaacttg      3300
atgaaaagct caaaaagaaa gagtttgaaa ttggaaattt gcaaagcaag attgaagatg      3360
aacaagcact tggcattcaa ctgcagaaga agatcaaaga gctgcaagcc cgcatcgagg      3420
agctggagga ggatagcaat acgtcctgca gagctgtcca tggagacgcc cgcacagagg      3480
agctggagga agaggtcgaa gcagagcaca acctcagagc caagatcgag aagcagcgcg      3540
cggatctggc ccgggaactg gaggagatca gcgagcggct ggaagaagcc ggtggggcga      3600
cttcagccca gatcgagatg aacaagaagc gggaggccga gttccagaaa atgcgccggg      3660
acctggagga ggccaccctg cagcacgagg ccacggcggc cgcgctgagg aagaagcacg      3720
cggacagcgt ggccgagctg ggggagcaga tcgacaacct gcagagggtc aagcagaagc      3780
tggagaagga gaagagtgag atgaagatgg agatcgatga cctggccagc aatgtagaaa      3840
caatctctaa agccaaggga aacctagaga agatgtgccg cactctggag gaccaagtga      3900
gtgaactgaa atcgaaggag gaagagcagc agcggctgat caatgacctg acagctcaga      3960
gggcacgctt gcagaccgaa tctggtgaat tttcacgtca gctagatgaa aaggaaactc      4020
tggtgtctca gttatcaagg ggcaaacaag catttactca acagattgag gaattaaaga      4080
ggcagcttga agaggagata aaggccaaga acgccctggc ccacgccctg cagtcctccc      4140
gccacgactg cgacctgctg cgggaacagt acgaggagga gcaggaatcc aaggccgagc      4200
tgcagagggc gatgtccaag gccaacacgg aggtggccca gtggaggacc aaatacgaga      4260
cggacgccat ccagcgcacg gaggagctgg aggaggccaa gaagaagctg gcccagcgtc      4320
tgcaggctgc tgaggagcac gtggaagctg tgaatgccaa gtgcgcctcc cttgagaaga      4380
ccaagcagcg gctccagaat gaggttgagg acctcatgct ggatgtggag aggacaaacg      4440
cagcctgcgc ggccctggac aaaaagcaaa ggaacttcga caaggtcctg gcagaatgga      4500
aacagaagta tgaggaaacc catgccgagc tggaggcctc ccagaaggag gctcgctcgc      4560
ttggcactga gctgttcaag atgaagaatg cctacgagga gtccctggat cagctagaaa      4620
ctttgaaacg agagaacaaa aacttgcagc aggagatttc tgacctcacg gagcagattg      4680
cagaaggagg gaaacgtatc cacgaactgg agaaaataaa gaagcaagtg gaacaagaga      4740
agtctgaact tcaggctgct ttagaggaag cagaggcatc tcttgaacat gaagagggta      4800
agatcttgcg catccagctg gagttgaacc aagtcaagtc tgagattgac agaaaaattg      4860
ctgaaaagga tgaggaaatt gaccagctga agaggaacca cgttagagtc gtcgagtcaa      4920
tgcagagtat gctggatgct gagatcagga gcagaaatga tgccatcaga ctcaagaaga      4980
agatggaggg agacctcaat gaaatggaaa tccagctgaa ccatgccaac cgcatggctg      5040
ctgaagccct gaggaactac aggaacaccc aaagcatcct caaggacacc cagctacacc      5100
tggacgatgc tctccggggc caggaggacc tgaaggagca gctggccatg gtggagcgca      5160
gagccaacct gctgcaggcc gagattgagg agctgcgggc ctccctggag cagacggaga      5220
ggagcaggaa aatcgcagaa caggagctcc tggacgccag tgagcgcgtc cagctgctgc      5280
acacccagaa caccagccta atcaacacca agaagaagct ggagacagac atctcccaac      5340
tccagggaga gatggaggac attctccagg aagctcgcaa cgcagaagag aaggccaaga      5400
aggccatcac tgacgcggcc atgatggccg aggagctgaa gaaggagcag gacaccagcg      5460
cccacctgga gcggatgaag aagaacatgg aacagacggt gaaggacctg cagaaccgcc      5520
tggacgaggc tgagcagctg gccctgaagg gcgggaagaa gcagatccag aagctggagg      5580
ccagggtacg tgagctggaa ggagaggttg agagtgagca aaagcgtaac gtggaagccg      5640
tcaagggcct gcgcaaacat gagaggagag tgaaggaact cacctaccag acggaagaag      5700
atcggaaaaa tattctcagg cttcaagacc tggtagataa acttcaggca aaagtgaaat      5760
cttacaagag acaagctgag gaggctgagg aacaatccaa tacaaatcta tctaaattcc      5820
gcaaactcca gcatgaactg gaggaagccg aggagagggc tgacattgct gaatcccagg      5880
Figure 544027DEST_PATH_IMAGE002
tcaacaagct gcgggtgaag agccgggagg ttcacacgaa agtcataagt gaagagtgaa      5940
tttttatcaa tta                                                         5953
<210>  2
<211>  1972
<212>  PRT
<213>  阿拉善盟双峰驼
<400>  2
Met Ser Ser Asp Gln Glu Met Ala Val Phe Gly Glu Ala Ala Pro Tyr 
1               5                   10                  15      
Leu Arg Lys Ser Glu Lys Glu Arg Ile Glu Ala Gln Asn Arg Pro Phe 
            20                  25                  30          
Asp Ala Lys Thr Ser Val Phe Val Ala Glu Pro Lys Glu Ser Phe Val 
        35                  40                  45              
Lys Gly Thr Ile Gln Ser Arg Glu Gly Gly Lys Val Thr Val Lys Thr 
    50                  55                  60                  
Glu Gly Gly Ala Thr Leu Thr Val Lys Asp Asp Gln Val Tyr Pro Met 
65                  70                  75                  80  
Asn Pro Pro Lys Phe Asp Lys Ile Glu Asp Met Ala Met Met Thr His 
                85                  90                  95      
Leu His Glu Pro Gly Val Leu Tyr Asn Leu Lys Glu Arg Tyr Ala Ala 
            100                 105                 110         
Trp Met Ile Tyr Thr Tyr Ser Gly Leu Phe Cys Val Thr Val Asn Pro 
        115                 120                 125             
Tyr Lys Trp Leu Pro Val Tyr Asn Pro Glu Val Val Thr Ala Tyr Arg 
    130                 135                 140                 
Gly Lys Lys Arg Gln Glu Ala Pro Pro His Ile Phe Ser Ile Ser Asp 
145                150                 155                 160  
Asn Ala Tyr Gln Phe Met Leu Thr Asp Arg Glu Asn Gln Ser Ile Leu 
                165                 170                 175     
Ile Thr Gly Glu Ser Gly Ala Gly Lys Thr Val Asn Thr Lys Arg Val 
            180                 185                 190         
Ile Gln Tyr Phe Ala Thr Ile Ala Val Thr Gly Glu Lys Lys Lys Glu 
        195                 200                 205             
Glu Ser Gly Lys Met Gln Gly Thr Leu Glu Asp Gln Ile Ile Ser Ala 
    210                 215                 220                 
Asn Pro Leu Leu Glu Ala Phe Gly Asn Ala Lys Thr Val Arg Asn Asp 
225                 230                 235                 240 
Asn Ser Ser Arg Phe Gly Lys Phe Ile Arg Ile His Phe Gly Thr Thr 
                245                 250                 255     
Gly Lys Leu Ala Ser Ala Asp Ile Glu Thr Tyr Leu Leu Glu Lys Ser 
            260                 265                 270         
Arg Val Thr Phe Gln Leu Lys Ala Glu Arg Ser Tyr His Ile Phe Tyr 
        275                 280                 285             
Gln Ile Thr Ser Asn Arg Lys Pro Glu Leu Ile Glu Met Leu Leu Ile 
    290                 295                 300                 
Thr Thr Asn Pro Tyr Asp Tyr Pro Phe Val Ser Gln Gly Glu Ile Ser 
305                 310                 315                 320 
Val Pro Ser Ile Asp Asp Gln Glu Glu Leu Ile Ala Thr Asp Ser Ala 
                325                 330                 335     
Ile Asp Ile Leu Gly Phe Thr Asn Glu Glu Lys Val Ser Ile Tyr Lys 
            340                 345                 350         
Leu Thr Gly Ala Val Met His Tyr Gly Asn Leu Lys Phe Lys Gln Lys 
        355                 360                 365             
Gln Arg Glu Glu Gln Ala Glu Pro Asp Gly Thr Glu Val Ala Asp Lys 
    370                 375                 380                 
Ala Ala Tyr Leu Gln Ser Leu Asn Ser Ala Asp Leu Leu Lys Ala Leu 
385                 390                 395                 400 
Cys Phe Pro Arg Val Lys Val Gly Asn Glu Phe Val Thr Lys Gly Gln 
                405                 410                 415     
Thr Val Glu Gln Val Thr Asn Ala Val Gly Ala Leu Ala Arg Ala Val 
            420                 425                 430         
Tyr Glu Lys Met Phe Leu Trp Met Val Thr Arg Ile Asn Gln Gln Leu 
        435                 440                 445             
Asp Thr Lys Gln Pro Arg Gln Tyr Phe Ile Gly Val Leu Asp Ile Ala 
    450                 455                 460                 
Gly Phe Glu Ile Phe Asp Phe Asn Ser Leu Glu Gln Leu Cys Ile Asn 
465                 470                 475                 480 
Phe Thr Asn Glu Lys Leu Gln Gln Phe Phe Asn His His Met Phe Val 
                485                 490                 495     
Leu Glu Gln Glu Glu Tyr Lys Lys Glu Gly Ile Glu Trp Thr Phe Ile 
            500                 505                 510         
Asp Phe Gly Met Asp Leu Ala Ala Cys Ile Glu Leu Ile Glu Lys Pro 
        515                 520                 525             
Met Gly Ile Phe Ser Ile Leu Glu Glu Glu Cys Met Phe Pro Lys Ala 
    530                 535                 540                 
Thr Asp Ile Ser Phe Lys Asn Lys Leu Tyr Glu Gln His Leu Gly Lys 
545                 550                 555                 560 
Ser Ala Asn Phe Gln Lys Pro Lys Val Thr Lys Gly Lys Pro Glu Ala 
                565                 570                 575     
His Phe Ser Leu Ile His Tyr Ala Gly Val Val Asn Tyr Asn Ile Ile 
            580                 585                 590         
Gly Trp Leu Asp Lys Asn Lys Asp Pro Leu Asn Asp Thr Val Val Gly 
        595                 600                 605             
Leu Tyr Gln Lys Ser Ala Leu Lys Thr Leu Ala Leu Leu Phe Ser Gly 
    610                 615                 620                 
Arg Glu Thr Glu Ala Glu Ser Val Gly Lys Lys Gly Gly Lys Lys Lys 
625                 630                 635                 640 
Gly Ser Ser Phe Gln Thr Val Ser Ala Leu Phe Arg Glu Asn Leu Asn 
                645                 650                 655     
Lys Leu Met Thr Asn Leu Arg Ser Thr His Pro His Phe Val Arg Cys 
            660                 665                 670         
Ile Ile Pro Asn Glu Thr Lys Thr Pro Gly Ala Met Glu His Glu Leu 
        675                 680                 685             
Val Leu His Gln Leu Arg Cys Asn Gly Val Leu Glu Gly Ile Arg Ile 
    690                 695                 700                 
Cys Arg Lys Gly Phe Pro Ser Arg Ile Leu Tyr Ala Asp Phe Lys Gln 
705                 710                 715                 720 
Arg Tyr Lys Val Leu Asn Ala Ser Ala Ile Pro Glu Gly Gln Phe Ile 
                725                 730                 735     
Asp Ser Lys Lys Ala Ser Glu Lys Leu Leu Gly Ser Ile Asp Ile Asp 
            740                 745                 750         
His Thr Gln Tyr Lys Phe Gly His Thr Lys Val Phe Phe Lys Ala Gly 
        755                 760                 765             
Leu Leu Gly Leu Leu Glu Glu Met Arg Asp Glu Lys Leu Ala Gln Leu 
    770                 775                 780                 
Met Thr Arg Thr Gln Ala Arg Cys Arg Gly Phe Leu Ala Arg Val Glu 
785                 790                 795                 800 
Tyr Gln Lys Met Val Glu Ser Arg Cys Arg Gly Phe Leu Ala Arg Val 
                805                 810                 815     
Glu Tyr Gln Lys Met Val Glu Arg Arg Glu Ser Ile Phe Cys Ile Gln 
            820                 825                 830         
Tyr Asn Ile Arg Ala Phe Met Asn Val Lys His Trp Pro Trp Met Lys 
        835                 840                 845             
Leu Phe Phe Lys Ile Lys Pro Leu Leu Lys Ser Ala Glu Thr Glu Lys 
    850                 855                 860                 
Glu Met Ala Thr Met Lys Glu Glu Phe Gln Lys Thr Lys Asp Glu Leu 
865                 870                 875                 880 
Ala Lys Ser Glu Ala Lys Arg Lys Glu Leu Glu Glu Lys Met Val Ser 
                885                 890                 895     
Leu Leu Lys Glu Lys Asn Asp Leu Gln Leu Gln Val Gln Ser Glu Ala 
            900                 905                 910         
Glu Gly Leu Ala Asp Ala Glu Glu Arg Cys Asp Gln Leu Ile Lys Thr 
        915                 920                 925             
Lys Ile His Leu Glu Ala Lys Ile Lys Glu Val Thr Glu Arg Ala Glu 
    930                 935                 940                 
Asp Glu Glu Glu Ile Asn Ala Glu Leu Thr Ala Lys Lys Arg Lys Leu 
945                 950                 955                 960 
Glu Asp Glu Cys Ser Glu Leu Lys Lys Asp Ile Asp Asp Leu Glu Leu 
                965                 970                 975     
Thr Leu Ala Lys Val Glu Lys Glu Lys His Ala Thr Glu Asn Lys Val 
            980                 985                 990         
Lys Asn Leu Thr Glu Glu Met Ala Gly Leu Asp Glu Val Ile Ala Lys 
        995                1000                1005            
Leu Thr Lys Glu Lys Lys Ala Leu Gln Glu Ala His Gln Gln Thr Leu 
    1010                1015                1020               
Asp Asp Leu Gln Ala Glu Glu Asp Lys Val Asn Thr Leu Thr Lys Ala 
1025                1030                1035                1040
Lys Thr Lys Leu Glu Gln Gln Val Asp Asp Leu Glu Gly Ser Leu Glu 
                1045                1050                1055    
Gln Glu Lys Lys Leu Arg Met Asp Leu Glu Arg Ala Lys Arg Lys Leu 
            1060                1065                1070        
Glu Gly Asp Leu Lys Leu Ala Gln Glu Ser Ile Met Asp Ile Glu Asn 
        1075                1080                1085            
Glu Lys Gln Gln Leu Asp Glu Lys Leu Lys Lys Lys Glu Phe Glu Ile 
    1090                1095                1100                
Gly Asn Leu Gln Ser Lys Ile Glu Asp Glu Gln Ala Leu Gly Ile Gln 
1105                1110                1115                1120
Leu Gln Lys Lys Ile Lys Glu Leu Gln Ala Arg Ile Glu Glu Leu Glu 
                1125                1130                1135    
Glu Asp Ser Asn Thr Ser Cys Arg Ala Val His Gly Asp Ala Arg Thr 
            1140                1145                1150        
Glu Glu Leu Glu Glu Glu Val Glu Ala Glu His Asn Leu Arg Ala Lys 
        1155                1160                1165            
Ile Glu Lys Gln Arg Ala Asp Leu Ala Arg Glu Leu Glu Glu Ile Ser 
    1170                1175                1180                
Glu Arg Leu Glu Glu Ala Gly Gly Ala Thr Ser Ala Gln Ile Glu Met 
1185                1190               1195                1200
Asn Lys Lys Arg Glu Ala Glu Phe Gln Lys Met Arg Arg Asp Leu Glu 
                1205                1210                1215    
Glu Ala Thr Leu Gln His Glu Ala Thr Ala Ala Ala Leu Arg Lys Lys 
            1220                1225                1230        
His Ala Asp Ser Val Ala Glu Leu Gly Glu Gln Ile Asp Asn Leu Gln 
        1235                1240                1245            
Arg Val Lys Gln Lys Leu Glu Lys Glu Lys Ser Glu Met Lys Met Glu 
    1250                1255                1260                
Ile Asp Asp Leu Ala Ser Asn Val Glu Thr Ile Ser Lys Ala Lys Gly 
1265                1270                1275                1280 
Asn Leu Glu Lys Met Cys Arg Thr Leu Glu Asp Gln Val Ser Glu Leu 
                1285                1290                1295    
Lys Ser Lys Glu Glu Glu Gln Gln Arg Leu Ile Asn Asp Leu Thr Ala 
            1300                1305                1310        
Gln Arg Ala Arg Leu Gln Thr Glu Ser Gly Glu Phe Ser Arg Gln Leu 
        1315                1320                1325            
Asp Glu Lys Glu Thr Leu Val Ser Gln Leu Ser Arg Gly Lys Gln Ala 
    1330                1335                1340                
Phe Thr Gln Gln Ile Glu Glu Leu Lys Arg Gln Leu Glu Glu Glu Ile 
1345                1350                1355                1360
Lys Ala Lys Asn Ala Leu Ala His Ala Leu Gln Ser Ser Arg His Asp 
                1365                1370                1375    
Cys Asp Leu Leu Arg Glu Gln Tyr Glu Glu Glu Gln Glu Ser Lys Ala 
            1380                1385                1390        
Glu Leu Gln Arg Ala Met Ser Lys Ala Asn Thr Glu Val Ala Gln Trp 
        1395                1400               1405            
Arg Thr Lys Tyr Glu Thr Asp Ala Ile Gln Arg Thr Glu Glu Leu Glu 
    1410                1415                1420                
Glu Ala Lys Lys Lys Leu Ala Gln Arg Leu Gln Ala Ala Glu Glu His 
1425                1430                1435                1440
Val Glu Ala Val Asn Ala Lys Cys Ala Ser Leu Glu Lys Thr Lys Gln 
                1445                1450               1455     
Arg Leu Gln Asn Glu Val Glu Asp Leu Met Leu Asp Val Glu Arg Thr 
            1460                1465                1470        
Asn Ala Ala Cys Ala Ala Leu Asp Lys Lys Gln Arg Asn Phe Asp Lys 
        1475                1480                1485            
Val Leu Ala Glu Trp Lys Gln Lys Tyr Glu Glu Thr His Ala Glu Leu 
    1490                1495                1500                
Glu Ala Ser Gln Lys Glu Ala Arg Ser Leu Gly Thr Glu Leu Phe Lys 
1505                1510                1515                1520
Met Lys Asn Ala Tyr Glu Glu Ser Leu Asp Gln Leu Glu Thr Leu Lys 
                1525                1530                1535    
Arg Glu Asn Lys Asn Leu Gln Gln Glu Ile Ser Asp Leu Thr Glu Gln 
            1540                1545                1550        
Ile Ala Glu Gly Gly Lys Arg Ile His Glu Leu Glu Lys Ile Lys Lys 
        1555                1560                1565            
Gln Val Glu Gln Glu Lys Ser Glu Leu Gln Ala Ala Leu Glu Glu Ala 
    1570                1575                1580                
Glu Ala Ser Leu Glu His Glu Glu Gly Lys Ile Leu Arg Ile Gln Leu 
1585                1590                1595                1600
Glu Leu Asn Gln Val Lys Ser Glu Ile Asp Arg Lys Ile Ala Glu Lys 
                1605                1610                1615    
Asp Glu Glu Ile Asp Gln Leu Lys Arg Asn His Val Arg Val Val Glu 
            1620                1625                1630        
Ser Met Gln Ser Met Leu Asp Ala Glu Ile Arg Ser Arg Asn Asp Ala 
        1635                1640                1645            
Ile Arg Leu Lys Lys Lys Met Glu Gly Asp Leu Asn Glu Met Glu Ile 
    1650                1655                1660                
Gln Leu Asn His Ala Asn Arg Met Ala Ala Glu Ala Leu Arg Asn Tyr 
1665                1670                1675                1680
Arg Asn Thr Gln Ser Ile Leu Lys Asp Thr Gln Leu His Leu Asp Asp 
                1685                1690                1695    
Ala Leu Arg Gly Gln Glu Asp Leu Lys Glu Gln Leu Ala Met Val Glu 
            1700                1705                1710        
Arg Arg Ala Asn Leu Leu Gln Ala Glu Ile Glu Glu Leu Arg Ala Ser 
        1715                1720                1725            
Leu Glu Gln Thr Glu Arg Ser Arg Lys Ile Ala Glu Gln Glu Leu Leu 
    1730                1735                1740                
Asp Ala Ser Glu Arg Val Gln Leu Leu His Thr Gln Asn Thr Ser Leu 
1745                1750                1755                1760
Ile Asn Thr Lys Lys Lys Leu Glu Thr Asp Ile Ser Gln Leu Gln Gly 
                1765                1770                1775    
Glu Met Glu Asp Ile Leu Gln Glu Ala Arg Asn Ala Glu Glu Lys Ala 
            1780                1785                1790        
Lys Lys Ala Ile Thr Asp Ala Ala Met Met Ala Glu Glu Leu Lys Lys 
        1795                1800                1805            
Glu Gln Asp Thr Ser Ala His Leu Glu Arg Met Lys Lys Asn Met Glu 
    1810                1815                1820                
Gln Thr Val Lys Asp Leu Gln Asn Arg Leu Asp Glu Ala Glu Gln Leu 
1825                1830                1835                1840
Ala Leu Lys Gly Gly Lys Lys Gln Ile Gln Lys Leu Glu Ala Arg Val 
                1845                1850                1855    
Arg Glu Leu Glu Gly Glu Val Glu Ser Glu Gln Lys Arg Asn Val Glu 
            1860                1865                1870        
Ala Val Lys Gly Leu Arg Lys His Glu Arg Arg Val Lys Glu Leu Thr 
        1875                1880                1885            
Tyr Gln Thr Glu Glu Asp Arg Lys Asn Ile Leu Arg Leu Gln Asp Leu 
    1890                1895                1900                
Val Asp Lys Leu Gln Ala Lys Val Lys Ser Tyr Lys Arg Gln Ala Glu 
1905                1910                1915                1920
Glu Ala Glu Glu Gln Ser Asn Thr Asn Leu Ser Lys Phe Arg Lys Leu 
                1925                1930                1935    
Gln His Glu Leu Glu Glu Ala Glu Glu Arg Ala Asp Ile Ala Glu Ser 
            1940                1945                1950        
Gln Val Asn Lys Leu Arg Val Lys Ser Arg Glu Val His Thr Lys Val 
        1955                1960                1965            
Ile Ser Glu Glu
    1970
<210>  3
<211>  22
<212>  DNA
<213>  人工
<400>  3
atgggcaagc tgctccagca gc                                              22
<210>  4
<211>  22
<212>  DNA
<213>  人工
<400>  4
ctggctgctg gagcagcttg cc                                       22

Claims (8)

1.一种双峰驼肌球蛋白基因,其特征在于该基因的核苷酸序列具有SEQ ID NO.1所示的序列。
2.根据权利要求1所述的双峰驼肌球蛋白基因,其特征在于该基因的核苷酸序列具有SEQ ID NO.1中21-5939位的序列。
3.一种含有权利要求1或2所述的双峰驼肌球蛋白基因的重组蛋白。
4.根据权利要求3所述的重组蛋白,其特征在于该重组蛋白的氨基酸序列具有SEQ ID NO.2所示的序列。
5.根据权利要求3或4所述的重组蛋白,其特征在于该重组蛋白为具有SEQ ID NO.2所示的氨基酸序列的多肽、或其保守性变异多肽、或其活性片段,或其活性衍生物。
6.根据权利要求3或4所述的重组蛋白,其特征在于通过设计一对引物从双峰驼肌球蛋白中得到双峰驼肌球蛋白基因,该引物对的核苷酸序列信息如下:
正引物,SEQ ID NO.3(正向):5’- ATGGGCAAGC TGCTCCAGCA GC -3’,
反引物,SEQ ID NO.4(反向):5’- CTGGCTGCTG GAGCAGCTTG CC -3’。
7.根据权利要求5所述的重组蛋白,其特征在于通过设计一对引物从双峰驼肌球蛋白中得到双峰驼肌球蛋白基因,该引物对的核苷酸序列信息如下:
正引物,SEQ ID NO.3(正向):5’- ATGGGCAAGC TGCTCCAGCA GC -3’,
反引物,SEQ ID NO.4(反向):5’- CTGGCTGCTG GAGCAGCTTG CC -3’。
8.一种根据权利要求1或2所述的双峰驼肌球蛋白基因的克隆方法,其特征在于按下述步骤进行:
第一步,总RNA提取,采取双峰驼组织样品后,对组织样品进行组织总RNA提取;
第二步,引物设计及合成,引物对的核苷酸序列信息如下:
正引物,SEQ ID NO.3(正向):5’- ATGGGCAAGC TGCTCCAGCA GC -3’,
反引物,SEQ ID NO.4(反向):5’- CTGGCTGCTG GAGCAGCTTG CC -3’;
第三步,RT-PCR扩增,利用反转录试剂盒对组织样品中的蛋白基因进行反转录,并对待扩增的DNA片段进行RT-PCR扩增;
第四步,蛋白基因的克隆,首先对PCR扩增的DNA片段进行回收,然后将回收的DNA片段同T载体连接形成感受态细胞,将感受态细胞进行转化培养成单菌落,取少量该单菌落进行PCR扩增,对扩增后的单菌落鉴别T载体上是否含有目的DNA片段,若有目的DNA片段,将单菌落放入培养基中进行过夜培养,最后对质粒进行回收。
CN 201210478250 2012-11-22 2012-11-22 双峰驼肌球蛋白基因、重组蛋白及其克隆方法 Pending CN103014001A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN 201210478250 CN103014001A (zh) 2012-11-22 2012-11-22 双峰驼肌球蛋白基因、重组蛋白及其克隆方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN 201210478250 CN103014001A (zh) 2012-11-22 2012-11-22 双峰驼肌球蛋白基因、重组蛋白及其克隆方法

Publications (1)

Publication Number Publication Date
CN103014001A true CN103014001A (zh) 2013-04-03

Family

ID=47963116

Family Applications (1)

Application Number Title Priority Date Filing Date
CN 201210478250 Pending CN103014001A (zh) 2012-11-22 2012-11-22 双峰驼肌球蛋白基因、重组蛋白及其克隆方法

Country Status (1)

Country Link
CN (1) CN103014001A (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104152459A (zh) * 2014-08-19 2014-11-19 新疆旺源驼奶实业有限公司 编码双峰驼肌球蛋白的核苷酸序列、双峰驼肌球蛋白及应用
CN104152460A (zh) * 2014-08-19 2014-11-19 新疆旺源驼奶实业有限公司 编码双峰驼形成通道的整合膜蛋白28的核苷酸序列及其应用
CN104178501A (zh) * 2014-08-19 2014-12-03 新疆旺源驼奶实业有限公司 编码双峰驼细胞色素p450的核苷酸序列、双峰驼细胞色素p450及其应用

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104152459A (zh) * 2014-08-19 2014-11-19 新疆旺源驼奶实业有限公司 编码双峰驼肌球蛋白的核苷酸序列、双峰驼肌球蛋白及应用
CN104152460A (zh) * 2014-08-19 2014-11-19 新疆旺源驼奶实业有限公司 编码双峰驼形成通道的整合膜蛋白28的核苷酸序列及其应用
CN104178501A (zh) * 2014-08-19 2014-12-03 新疆旺源驼奶实业有限公司 编码双峰驼细胞色素p450的核苷酸序列、双峰驼细胞色素p450及其应用

Similar Documents

Publication Publication Date Title
Soto et al. Identification and preliminary characterization of two cDNAs encoding unique carbonic anhydrases from the marine alga Emiliania huxleyi
CN102993291A (zh) 双峰驼角蛋白、编码基因及其获取方法
WO2003076575A2 (en) The complete genome and protein sequence of the hyperthermophile methanopyrus kandleri av19 and monophyly of archael methanogens and methods of use thereof
CN103014001A (zh) 双峰驼肌球蛋白基因、重组蛋白及其克隆方法
CN103014007A (zh) 双峰驼α-乳白蛋白基因、重组蛋白及其克隆方法
Pung et al. Ohanin, a novel protein from king cobra venom: its cDNA and genomic organization
Oikawa et al. Two types of differentially photo-regulated nuclear genes that encode σ factors for chloroplast RNA polymerase in the red alga Cyanidium caldarium strain RK-1
Bruderer et al. Cloning and characterization of the gene encoding pyruvate phosphate dikinase from Giardia duodenalis
Jaso-Friedmann et al. The antigen receptor (NCCRP-1) on catfish and zebrafish nonspecific cytotoxic cells belongs to a new gene family characterized by an F-box-associated domain
CN109486825B (zh) 曼氏无针乌贼Spef1及其用途
CN104480079B (zh) 一种发形霞水母超氧化物歧化酶及其编码基因与应用
Tendeng et al. A novel H-NS-like protein from an antarctic psychrophilic bacterium reveals a crucial role for the N-terminal domain in thermal stability
Takai et al. Primary structure of the biotin‐binding site of chicken liver acetyl‐CoA carboxylase
CN103014006A (zh) 双峰驼乳铁蛋白基因、重组蛋白及其克隆方法
CN103014026A (zh) 双峰驼过氧化氢酶蛋白基因、重组蛋白及其克隆方法
CN103014009A (zh) 双峰驼ucp2蛋白基因、重组蛋白及其克隆方法
CN104152459A (zh) 编码双峰驼肌球蛋白的核苷酸序列、双峰驼肌球蛋白及应用
CN104178501A (zh) 编码双峰驼细胞色素p450的核苷酸序列、双峰驼细胞色素p450及其应用
CN104726466A (zh) 牛樟芝Biotin蛋白基因及其克隆和测序方法
CN108642063A (zh) 剑麻pgip基因及其应用
Zheng et al. Molecular cloning and tissue-specific expression of the heart-type fatty acid-binding protein (H-FABP)
CN103014004A (zh) 双峰驼血型糖蛋白基因、重组蛋白及其克隆方法
CN110551738A (zh) 厚壳贻贝IRAK-b基因及其用途
CN103014005A (zh) 双峰驼a-fabp蛋白基因、重组蛋白及其克隆方法
CN103014002A (zh) 双峰驼PPARγ蛋白基因、重组蛋白及其克隆方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C12 Rejection of a patent application after its publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20130403