CN1155614C - 具有抑制癌细胞生长功能的新的人蛋白及其编码序列 - Google Patents

具有抑制癌细胞生长功能的新的人蛋白及其编码序列 Download PDF

Info

Publication number
CN1155614C
CN1155614C CNB001259008A CN00125900A CN1155614C CN 1155614 C CN1155614 C CN 1155614C CN B001259008 A CNB001259008 A CN B001259008A CN 00125900 A CN00125900 A CN 00125900A CN 1155614 C CN1155614 C CN 1155614C
Authority
CN
China
Prior art keywords
seq
leu
ser
ctg
gag
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CNB001259008A
Other languages
English (en)
Other versions
CN1351079A (zh
Inventor
顾健人
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shanghai Cancer Institute
Original Assignee
Shanghai Cancer Institute
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shanghai Cancer Institute filed Critical Shanghai Cancer Institute
Priority to CNB001259008A priority Critical patent/CN1155614C/zh
Publication of CN1351079A publication Critical patent/CN1351079A/zh
Application granted granted Critical
Publication of CN1155614C publication Critical patent/CN1155614C/zh
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Medicines That Contain Protein Lipid Enzymes And Other Medicines (AREA)
  • Peptides Or Proteins (AREA)

Abstract

本发明公开了一类新的具有抑癌功能的人蛋白,编码此多肽的多核苷酸和经重组技术产生该多肽的方法。本发明还公开了此多肽用于治疗多种疾病如癌症等的方法。本发明还公开了抗此多肽的拮抗剂及其治疗作用。本发明还公开了编码这类新的具有抑癌功能的人蛋白的多核苷酸的用途。

Description

具有抑制癌细胞生长功能的新的人蛋白及其编码序列
本发明属于生物技术领域,具体地说,本发明涉及新的编码具有抑癌功能的人蛋白的多核苷酸,以及此多核苷酸编码的多肽。本发明还涉及此多核苷酸和多肽的用途和制备。
人基因组学研究目前是国际上的热点,除人染色体DNA大规模测序,表达序列测序(EST)的方法外,还缺少从功能开始的筛选具有功能基因的高通量的方法。
癌症是危害人类健康的主要疾病之一。为了有效地治疗和预防肿瘤,目前人们已越来越关注肿瘤的基因治疗。因此,本领域迫切需要开发研究具有抑癌功能的人蛋白及其激动剂/抑制剂。
本发明的目的是提供一类新的具有抑癌功能的人蛋白多肽以及其片段、类似物和衍生物。
本发明的另一目的是提供编码这些多肽的多核苷酸。
本发明的另一目的是提供生产这些多肽的方法以及该多肽和编码序列的用途。
在本发明的第一方面,提供新颖的分离出的具有抑癌功能的蛋白多肽,它包含具有选自下组的氨基酸序列的多肽:SEQ ID NO:2、SEQ ID NO:5、SEQ ID NO:8、SEQ IDNO:11、SEQ ID NO:14、SEQ ID NO:17、SEQ ID NO:20;或其保守性变异多肽、或其活性片段、或其活性衍生物。
较佳地,该多肽是具有选自下组的氨基酸序列的多肽:SEQ ID NO:2、SEQ ID NO:5、SEQ ID NO:8、SEQ ID NO:11、SEQ ID NO:14、SEQ ID NO:17、SEQ ID NO:20。
在本发明的第二方面,提供了一种分离的多核苷酸,它包含一核苷酸序列,该核苷酸序列与选自下组的一种核苷酸序列有至少85%相同性:(a)编码上述的具有抑癌功能的蛋白多肽的多核苷酸;(b)与多核苷酸(a)互补的多核苷酸。较佳地,该多核苷酸编码的多肽具有选自下组的氨基酸序列:SEQ D NO:2、SEQ ID NO:5、SEQ ID NO:8、SEQ IDNO:11、SEQ ID NO:14、SEQ ID NO:17、SEQ ID NO:20。更佳地,该多核苷酸的序列选自下组:SEQ ID NO:3、SEQ ID NO:6、SEQ ID NO:9、SEQ ID NO:12、SEQ ID NO:15、SEQ ID NO:18、SEQ ID NO:21的编码区序列或全长序列。
在本发明的第三方面,提供了含有上述多核苷酸的载体,以及被该载体转化或转导的宿主细胞或者被上述多核苷酸直接转化或转导的宿主细胞。
在本发明的第四方面,提供了制备具有抑癌功能的蛋白活性的多肽的制备方法,该方法包含:(a)在适合表达具有抑癌功能的蛋白的条件下,培养上述被转化或转导的宿主细胞;(b)从培养物中分离出具有抑癌功能的蛋白活性的多肽。
在本发明的第五方面,提供了与上述的具有抑癌功能的蛋白多肽特异性结合的抗体。还提供了可用于检测的核酸分子,它含有上述的多核苷酸中连续10个核苷酸至全长核苷酸,较佳地它含有连续的约10-800个核苷酸。
在本发明的第六方面,提供了一种药物组合物,它含有安全有效量的本发明的具有抑癌功能的蛋白多肽以及药学上可接受的载体。这些药物组合物可治疗癌症以及细胞异常增殖等病症。
本发明的其它方面由于本文的技术的公开,对本领域的技术人员而言是显而易见的。
本发明采用大规模cDNA克隆转染癌细胞,在获得具有抑癌作用的基础上,经测序证明为新的基因,进一步得到全长cDNA克隆。DNA转染试验证明,本发明的具有抑癌功能的蛋白对癌细胞(肝癌细胞)具有抑制克隆形成的作用,其抑制率在50%或50%以上。
如本文所用,“分离的”是指物质从其原始环境中分离出来(如果是天然的物质,原始环境即是天然环境)。如活体细胞内的天然状态下的多聚核苷酸和多肽是没有分离纯化的,但同样的多聚核苷酸或多肽如从天然状态中同存在的其他物质中分开,则为分离纯化的。
如本文所用,“分离的具有抑癌功能的蛋白或多肽”是指具有抑癌功能的蛋白多肽基本上不含天然与其相关的其它蛋白、脂类、糖类或其它物质。本领域的技术人员能用标准的蛋白质纯化技术纯化具有抑癌功能的蛋白。基本上纯的多肽在非还原聚丙烯酰胺凝胶上能产生单一的主带。具有抑癌功能的蛋白多肽的纯度能用氨基酸序列分析。
本发明的多肽可以是重组多肽、天然多肽、合成多肽,优选重组多肽。本发明的多肽可以是天然纯化的产物,或是化学合成的产物,或使用重组技术从原核或真核宿主(例如,细菌、酵母、高等植物、昆虫和哺乳动物细胞)中产生。根据重组生产方案所用的宿主,本发明的多肽可以是糖基化的,或可以是非糖基化的。本发明的多肽还可包括或不包括起始的甲硫氨酸残基。
本发明还包括具有抑癌功能的人蛋白的片段、衍生物和类似物。如本文所用,术语“片段”、“衍生物”和“类似物”是指基本上保持本发明的天然具有抑癌功能的人蛋白相同的生物学功能或活性的多肽。本发明的多肽片段、衍生物或类似物可以是(i)有一个或多个保守或非保守性氨基酸残基(优选保守性氨基酸残基)被取代的多肽,而这样的取代的氨基酸残基可以是也可以不是由遗传密码编码的,或(ii)在一个或多个氨基酸残基中具有取代基团的多肽,或(iii)成熟多肽与另一个化合物(比如延长多肽半衰期的化合物,例如聚乙二醇)融合所形成的多肽,或(iv)附加的氨基酸序列融合到此多肽序列而形成的多肽(如前导序列或分泌序列或用来纯化此多肽的序列或蛋白原序列)。根据本文的教导,这些片段、衍生物和类似物属于本领域熟练技术人员公知的范围。
本发明的多核苷酸可以是DNA形式或RNA形式。DNA形式包括cDNA、基因组DNA或人工合成的DNA。DNA可以是单链的或是双链的。DNA可以是编码链或非编码链。以PP8153蛋白(在本申请中,蛋白质的命名采用其克隆编号)为例,编码成熟多肽的编码区序列可以与SEQ ID NO:3所示的编码区序列相同或者是简并的变异体。如本文所用,“简并的变异体”在本发明中是指编码具有SEQ ID NO:2的蛋白质,但与SEQ IDNO:3所示的编码区序列有差别的核酸序列。以PP8332蛋白(在本申请中,蛋白质的命名采用其克隆编号)为例,编码成熟多肽的编码区序列可以与SEQ ID NO:6所示的编码区序列相同或者是简并的变异体。如本文所用,“简并的变异体”在本发明中是指编码具有SEQ ID NO:5的蛋白质,但与SEQ ID NO:6所示的编码区序列有差别的核酸序列。对于其他具有抑癌功能的蛋白,可依此类推。对于其他具有抑癌功能的蛋白,可依此类推。
编码成熟多肽的多核苷酸包括:只编码成熟多肽的编码序列;成熟多肽的编码序列和各种附加编码序列;成熟多肽的编码序列(和任选的附加编码序列)以及非编码序列。
术语“编码多肽的多核苷酸”可以是包括编码此多肽的多核苷酸,也可以是还包括附加编码和/或非编码序列的多核苷酸。
本发明还涉及上述多核苷酸的变异体,其编码与本发明有相同的氨基酸序列的多肽或多肽的片段、类似物和衍生物。此多核苷酸的变异体可以是天然发生的等位变异体或非天然发生的变异体。这些核苷酸变异体包括取代变异体、缺失变异体和***变异体。如本领域所知的,等位变异体是一个多核苷酸的替换形式,它可能是一个或多个核苷酸的取代、缺失或***,但不会从实质上改变其编码的多肽的功能。
本发明还涉及与上述的序列杂交且两个序列之间具有至少50%,较佳地至少70%,更佳地至少80%相同性的多核苷酸。本发明特别涉及在严格条件下与本发明所述多核苷酸可杂交的多核苷酸。在本发明中,“严格条件”是指:(1)在较低离子强度和较高温度下的杂交和洗脱,如0.2×SSC,0.1%SDS,60℃;或(2)杂交时加有变性剂,如50%(v/v)甲酰胺,0.1%小牛血清/0.1%Ficoll,42℃等;或(3)仅在两条序列之间的相同性至少在95%以上,更好是97%以上时才发生杂交。并且,可杂交的多核苷酸编码的多肽与SEQ IDNO:2所示的成熟多肽有相同的生物学功能(以PP8153蛋白为例)和活性。
本发明还涉及与上述的序列杂交的核酸片段。如本文所用,“核酸片段”的长度至少含15个核苷酸,较好是至少30个核苷酸,更好是至少50个核苷酸,最好是至少100个核苷酸以上。核酸片段可用于核酸的扩增技术(如PCR)以确定和/或分离编码具有抑癌功能的蛋白的多聚核苷酸。
本发明中的多肽和多核苷酸优选以分离的形式提供,更佳地被纯化至均质。
本发明的DNA序列能用几种方法获得。例如,用本领域熟知的杂交技术分离DNA。这些技术包括但不局限于:1)用探针与基因组或cDNA文库杂交以检出同源性核苷酸序列,和2)表达文库的抗体筛选以检出具有共同结构特征的克隆的DNA片段。
编码具有抑癌功能的蛋白的特异DNA片段序列产生也能用下列方法获得:1)从基因组DNA分离双链DNA序列;2)化学合成DNA序列以获得所需多肽的双链DNA 。
上述提到的方法中,分离基因组DNA最不常用。当需要的多肽产物的整个氨基酸序列已知时,DNA序列的直接化学合成是经常选用的方法。如果所需的氨基酸的整个序列不清楚时,DNA序列的直接化学合成是不可能的,选用的方法是cDNA序列的分离。分离感兴趣的cDNA的标准方法是从高表达该基因的供体细胞分离mRNA并进行逆转录,形成质粒或噬菌体cDNA文库。提取mRNA的方法已有多种成熟的技术,试剂盒也可从商业途径获得(Qiagene)。而构建cDNA文库也是通常的方法(Sambrook,et al.,Molecular Cloning,A Laboratory Manual,Cold Spring Harbor Laboratory.New York,1989)。还可得到商业供应的cDNA文库,如Clontech公司的不同cDNA文库。当结合使用聚合酶反应技术时,即使极少的表达产物也能克隆。
可用常规方法从这些cDNA文库中筛选本发明的基因。这些方法包括(但不限于):(1)DNA-DNA或DNA-RNA杂交;(2)标志基因的功能出现或丧失;(3)测定具有抑癌功能的蛋白的转录本的水平;(4)通过免疫学技术或测定生物学活性,来检测基因表达的蛋白产物。上述方法可单用,也可多种方法联合应用。
在第(1)种方法中,杂交所用的探针是与本发明的多核苷酸的任何一部分同源,其长度至少15个核苷酸,较好是至少30个核苷酸,更好是至少50个核苷酸,最好是至少100个核苷酸。此外,探针的长度通常在2kb之内,较佳地为1kb之内。此处所用的探针通常是在本发明的基因DNA序列信息的基础上化学合成的DNA序列。本发明的基因本身或者片段当然可以用作探针。DNA探针的标记可用放射性同位素,荧光素或酶(如碱性磷酸酶)等。
在第(4)种方法中,检测具有抑癌功能的蛋白基因表达的蛋白产物可用免疫学技术如Western印迹法,放射免疫沉淀法,酶联免疫吸附法(ELISA)等。
应用PCR技术扩增DNA/RNA的方法(Saiki,et al.Science 1985;230:1350-1354)被优选用于获得本发明的基因。特别是很难从文库中得到全长的cDNA时,可优选使用RACE法(RACE-cDNA末端快速扩增法),用于PCR的引物可根据本文所公开的本发明的序列信息适当地选择,并可用常规方法合成。可用常规方法如通过凝胶电泳分离和纯化扩增的DNA/RNA片段。
如上所述得到的本发明的基因,或者各种DNA片段等的核苷酸序列的测定可用常规方法如双脱氧链终止法(Sanger et al.PNAS,1977,74:5463-5467)。这类核苷酸序列测定也可用商业测序试剂盒等。为了获得全长的cDNA序列,测序需反复进行。有时需要测定多个克隆的cDNA序列,才能拼接成全长的cDNA序列。
本发明也涉及包含本发明的多核苷酸的载体,以及用本发明的载体或具有抑癌功能的蛋白编码序列经基因工程产生的宿主细胞,以及经重组技术产生本发明所述多肽的方法。
通过常规的重组DNA技术(Science,1984;224:1431),可利用本发明的多聚核苷酸序列可用来表达或生产重组的具有抑癌功能的蛋白多肽。一般来说有以下步骤:
(1).用本发明的编码具有抑癌功能的人蛋白的多核苷酸(或变异体),或用含有该多核苷酸的重组表达载体转化或转导合适的宿主细胞;
(2).在合适的培养基中培养的宿主细胞;
(3).从培养基或细胞中分离、纯化蛋白质。
本发明中,具有抑癌功能的人蛋白多核苷酸序列可***到重组表达载体中。术语“重组表达载体”指本领域熟知的细菌质粒、噬菌体、酵母质粒、植物细胞病毒、哺乳动物细胞病毒如腺病毒、逆转录病毒或其他载体。在本发明中适用的载体包括但不限于:在细菌中表达的基于T7的表达载体(Rosenberg,et al.Gene,1987,56:125);在哺乳动物细胞中表达的pMSXND表达载体(Lee and Nathans,J Bio Chem.263:3521,1988)和在昆虫细胞中表达的来源于杆状病毒的载体。总之,只要能在宿主体内复制和稳定,任何质粒和载体都可以用。表达载体的一个重要特征是通常含有复制起点、启动子、标记基因和翻译控制元件。
本领域的技术人员熟知的方法能用于构建含具有抑癌功能的人蛋白编码DNA序列和合适的转录/翻译控制信号的表达载体。这些方法包括体外重组DNA技术、DNA合成技术、体内重组技术等(Sambroook,et al.Molecular Cloning,a Laboratory Manual,coldSpring Harbor Laboratory.New York,1989)。所述的DNA序列可有效连接到表达载体中的适当启动子上,以指导mRNA合成。这些启动子的代表性例子有:大肠杆菌的lac或trp启动子;λ噬菌体PL启动子;真核启动子包括CMV立即早期启动子、HSV胸苷激酶启动子、早期和晚期SV40启动子、反转录病毒的LTRs和其他一些已知的可控制基因在原核或真核细胞或其病毒中表达的启动子。表达载体还包括翻译起始用的核糖体结合位点和转录终止子。
此外,表达载体优选地包含一个或多个选择性标记基因,以提供用于选择转化的宿主细胞的表型性状,如真核细胞培养用的二氢叶酸还原酶、新霉素抗性以及绿色荧光蛋白(GFP),或用于大肠杆菌的四环素或氨苄青霉素抗性。
包含上述的适当DNA序列以及适当启动子或者控制序列的载体,可以用于转化适当的宿主细胞,以使其能够表达蛋白质。
宿主细胞可以是原核细胞,如细菌细胞;或是低等真核细胞,如酵母细胞;或是高等真核细胞,如哺乳动物细胞。代表性例子有:大肠杆菌,链霉菌属;鼠伤寒沙门氏菌的细菌细胞;真菌细胞如酵母;植物细胞;果蝇S2或Sf9的昆虫细胞;CHO、COS或Bowes黑素瘤细胞的动物细胞等。
本发明的多核苷酸在高等真核细胞中表达时,如果在载体中***增强子序列时将会使转录得到增强。增强子是DNA的顺式作用因子,通常大约有10到300个碱基对,作用于启动子以增强基因的转录。可举的例子包括在复制起始点晚期一侧的100到270个碱基对的SV40增强子、在复制起始点晚期一侧的多瘤增强子以及腺病毒增强子等。
本领域一般技术人员都清楚如何选择适当的载体、启动子、增强子和宿主细胞。
用重组DNA转化宿主细胞可用本领域技术人员熟知的常规技术进行。当宿主为原核生物如大肠杆菌时,能吸收DNA的感受态细胞可在指数生长期后收获,用CaCl2法处理,所用的步骤在本领域众所周知。可供选择的是用MgCl2。如果需要,转化也可用电穿孔的方法进行。当宿主是真核生物,可选用如下的DNA转染方法:磷酸钙共沉淀法,常规机械方法如显微注射、电穿孔、脂质体包装等。
获得的转化子可以用常规方法培养,表达本发明的基因所编码的多肽。根据所用的宿主细胞,培养中所用的培养基可选自各种常规培养基。在适于宿主细胞生长的条件下进行培养。当宿主细胞生长到适当的细胞密度后,用合适的方法(如温度转换或化学诱导)诱导选择的启动子,将细胞再培养一段时间。
在上面的方法中的重组多肽可包被于细胞内、细胞外或在细胞膜上表达或分泌到细胞外。如果需要,可利用其物理的、化学的和其它特性通过各种分离方法分离和纯化重组的蛋白。这些方法是本领域技术人员所熟知的。这些方法的例子包括但并不限于:常规的复性处理、用蛋白沉淀剂处理(盐析方法)、离心、渗透破菌、超处理、超离心、分子筛层析(凝胶过滤)、吸附层析、离子交换层析、高效液相层析(HPLC)和其它各种液相层析技术及这些方法的结合。
重组的具有抑癌功能的人蛋白或多肽有多方面的用途。这些用途包括(但不限于):直接做为药物治疗具有抑癌功能的蛋白功能低下或丧失所致的疾病,和用于筛选促进或对抗具有抑癌功能的蛋白功能的抗体、多肽或其它配体。例如,抗体可用于激活或抑制具有抑癌功能的人蛋白的功能。用表达的重组具有抑癌功能的人蛋白筛选多肽库可用于寻找有治疗价值的能抑制或刺激具有抑癌功能的人蛋白功能的多肽分子。
本发明也提供了筛选药物以鉴定提高(激动剂)或阻遏(拮抗剂)具有抑癌功能的人蛋白的药剂的方法。激动剂提高具有抑癌功能的人蛋白刺激细胞增殖等生物功能,而拮抗剂阻止和治疗与细胞过度增殖有关的紊乱如各种癌症。例如,能在药物的存在下,将哺乳动物细胞或表达具有抑癌功能的人蛋白的膜制剂与标记的具有抑癌功能的人蛋白一起培养。然后测定药物提高或阻遏此相互作用的能力。
具有抑癌功能的人蛋白的拮抗剂包括筛选出的抗体、化合物、受体缺失物和类似物等。具有抑癌功能的人蛋白的拮抗剂可以与具有抑癌功能的人蛋白结合并消除其功能,或是抑制具有抑癌功能的人蛋白的产生,或是与多肽的活性位点结合使多肽不能发挥生物学功能。具有抑癌功能的人蛋白的拮抗剂可用于治疗用途。
在筛选作为拮抗剂的化合物时,可以将具有抑癌功能的蛋白加入生物分析测定中,通过测定化合物影响具有抑癌功能的蛋白和其受体之间的相互作用来确定化合物是否是拮抗剂。用上述筛选化合物的同样方法,可以筛选出起拮抗剂作用的受体缺失物和类似物。
本发明的多肽可直接用于疾病治疗,例如,各种恶性肿瘤、和细胞异常增殖等。
本发明的多肽,及其片段、衍生物、类似物或它们的细胞可以用来作为抗原以生产抗体。这些抗体可以是多克隆或单克隆抗体。多克隆抗体可以通过将此多肽直接注射动物的方法得到。制备单克隆抗体的技术包括杂交瘤技术,三瘤技术,人B-细胞杂交瘤技术,EBV-杂交瘤技术等。
可以将本发明的多肽和拮抗剂与合适的药物载体组合后使用。这些载体可以是水、葡萄糖、乙醇、盐类、缓冲液、甘油以及它们的组合。组合物包含安全有效量的多肽或拮抗剂以及不影响药物效果的载体和赋形剂。这些组合物可以作为药物用于疾病治疗。
本发明还提供含有一种或多种容器的药盒或试剂盒,容器中装有一种或多种本发明的药用组合物成分。与这些容器一起,可以有由制造、使用或销售药品或生物制品的政府管理机构所给出的指示性提示,该提示反映出生产、使用或销售的政府管理机构许可其在人体上施用。此外,本发明的多肽可以与其它的治疗化合物结合使用。
药物组合物可以以方便的方式给药,如通过局部、静脉内、腹膜内、肌内、皮下、鼻内或皮内的给药途径。具有抑癌功能的蛋白以有效地治疗和/或预防具体的适应症的量来给药。施用于患者的具有抑癌功能的蛋白的量和剂量范围将取决于许多因素,如给药方式、待治疗者的健康条件和诊断医生的判断。
具有抑癌功能的人蛋白的多聚核苷酸也可用于多种治疗目的。基因治疗技术可用于治疗由于具有抑癌功能的蛋白的无表达或异常/无活性的具有抑癌功能的蛋白的表达所致的细胞增殖、发育或代谢异常。重组的基因治疗载体(如病毒载体)可设计成表达变异的具有抑癌功能的蛋白,以抑制内源性的具有抑癌功能的蛋白活性。例如,一种变异的具有抑癌功能的蛋白可以是缩短的、缺失了信号传导功能域的具有抑癌功能的蛋白,虽可与下游的底物结合,但缺乏信号传导活性。因此重组的基因治疗载体可用于治疗具有抑癌功能的蛋白表达或活性异常所致的疾病。来源于病毒的表达载体如逆转录病毒、腺病毒、腺病毒相关病毒、单纯疱疹病毒、细小病毒等可用于将具有抑癌功能的蛋白基因转移至细胞内。构建携带具有抑癌功能的蛋白基因的重组病毒载体的方法可见于已有文献(Sambrook,et al.)。另外重组具有抑癌功能的人蛋白基因可包装到脂质体中转移至细胞内。
抑制具有抑癌功能的人蛋白mRNA的寡聚核苷酸(包括反义RNA和DNA)以及核酶也在本发明的范围之内。核酶是一种能特异性分解特定RNA的酶样RNA分子,其作用机制是核酶分子与互补的靶RNA特异性杂交后进行核酸内切作用。反义的RNA和DNA及核酶可用已有的任何RNA或DNA合成技术获得,如固相磷酸酰胺化学合成法合成寡核苷酸的技术已广泛应用。反义RNA分子可通过编码该RNA的DNA序列在体外或体内转录获得。这种DNA序列已整合到载体的RNA聚合酶启动子的下游。为了增加核酸分子的稳定性,可用多种方法对其进行修饰,如增加两侧的序列长度,核糖核苷之间的连接应用磷酸硫酯键或肽键而非磷酸二酯键。
多聚核苷酸导入组织或细胞内的方法包括:将多聚核苷酸直接注入到体内组织中;或在体外通过载体(如病毒、噬菌体或质粒等)先将多聚核苷酸导入细胞中,再将细胞移植到体内等。
本发明的多肽还可用作肽谱分析,例如,多肽可用物理的、化学或酶进行特异性切割,并进行一维或二维或三维的凝胶电泳分析。
本发明还提供了针对具有抑癌功能的人蛋白抗原决定簇的抗体。这些抗体包括(但不限于):多克隆抗体、单克隆抗体、嵌合抗体、单链抗体、Fab片段和Fab表达文库产生的片段。
抗具有抑癌功能的人蛋白的抗体可用于免疫组织化学技术中,检测活检标本中的具有抑癌功能的人蛋白。
与具有抑癌功能的人蛋白结合的单克隆抗体也可用放射性同位素标记,注入体内可跟踪其位置和分布。这种放射性标记的抗体可作为一种非创伤性诊断方法用于肿瘤细胞的定位和判断是否有转移。
本发明中的抗体可用于治疗或预防与具有抑癌功能的人蛋白相关的疾病。给予适当剂量的抗体可以刺激或阻断具有抑癌功能的人蛋白的产生或活性。
抗体也可用于设计针对体内某一特殊部位的免疫毒素。如具有抑癌功能的人蛋白高亲和性的单克隆抗体可与细菌或植物毒素(如白喉毒素,蓖麻蛋白,红豆碱等)共价结合。一种通常的方法是用巯基交联剂如SPDP,攻击抗体的氨基,通过二硫键的交换,将毒素结合于抗体上,这种杂交抗体可用于杀灭具有抑癌功能的人蛋白阳性的细胞。
多克隆抗体的生产可用具有抑癌功能的人蛋白或多肽免疫动物,如家兔,小鼠,大鼠等。多种佐剂可用于增强免疫反应,包括但不限于弗氏佐剂等。
具有抑癌功能的人蛋白单克隆抗体可用杂交瘤技术生产(Kohler and Milstein.Nature,1975,256:495-497)。将人恒定区和非人源的可变区结合的嵌合抗体可用已有的技术生产(Morrison et al,PNAS,1985,81:6851)。而已有的生产单链抗体的技术(U.S.PatNo.4946778)也可用于生产抗具有抑癌功能的人蛋白的单链抗体。
能与具有抑癌功能的人蛋白结合的多肽分子可通过筛选由各种可能组合的氨基酸结合于固相物组成的随机多肽库而获得。筛选时,必须对具有抑癌功能的人蛋白分子进行标记。
本发明还涉及定量和定位检测具有抑癌功能的人蛋白水平的诊断试验方法。这些试验是本领域所熟知的,且包括FISH测定和放射免疫测定。试验中所检测的具有抑癌功能的人蛋白水平,可以用作解释具有抑癌功能的人蛋白在各种疾病中的重要性和用于诊断具有抑癌功能的蛋白起作用的疾病。
具有抑癌功能的蛋白的多聚核苷酸可用于具有抑癌功能的蛋白相关疾病的诊断和治疗。在诊断方面,具有抑癌功能的蛋白的多聚核苷酸可用于检测具有抑癌功能的蛋白的表达与否或在疾病状态下具有抑癌功能的蛋白的异常表达。如具有抑癌功能的蛋白DNA序列可用于对活检标本的杂交以判断具有抑癌功能的蛋白的表达异常。杂交技术包括Southern印迹法,Northern印迹法、原位杂交等。这些技术方法都是公开的成熟技术,相关的试剂盒都可从商业途径得到。本发明的多核苷酸的一部分或全部可作为探针固定在微阵列(Microarray)或DNA芯片(又称为“基因芯片”)上,用于分析组织中基因的差异表达分析和基因诊断。用具有抑癌功能的蛋白特异的引物进行RNA-聚合酶链反应(RT-PCR)体外扩增也可检测具有抑癌功能的蛋白的转录产物。
检测具有抑癌功能的蛋白基因的突变也可用于诊断具有抑癌功能的蛋白相关的疾病。具有抑癌功能的蛋白突变的形式包括与正常野生型具有抑癌功能的蛋白DNA序列相比的点突变、易位、缺失、重组和其它任何异常等。可用已有的技术如Southern印迹法、DNA序列分析、PCR和原位杂交检测突变。另外,突变有可能影响蛋白的表达,因此用Northern印迹法、Western印迹法可间接判断基因有无突变。
本发明的序列对染色体鉴定也是有价值的。该序列会特异性地针对某条人染色体具***置且并可以与其杂交。目前,需要鉴定染色体上的各基因的具***点。现在,只有很少的基于实际序列数据(重复多态性)的染色体标记物可用于标记染色***置。根据本发明,为了将这些序列与疾病相关基因相关联,其重要的第一步就是将这些DNA序列定位于染色体上。
简而言之,根据eDNA制备PCR引物(优选15-35bp),可以将序列定位于染色体上。然后,将这些引物用于PCR筛选含各条人染色体的体细胞杂合细胞。只有那些含有相应于引物的人基因的杂合细胞会产生扩增的片段。
体细胞杂合细胞的PCR定位法,是将DNA定位到具体染色体的快捷方法。使用本发明的的寡核苷酸引物,通过类似方法,可利用一组来自特定染色体的片段或大量基因组克隆而实现亚定位。可用于染色体定位的其它类似策略包括原位杂交、用标记的流式分选的染色体预筛选和杂交预选,从而构建染色体特异的cDNA库。
将cDNA克隆与中期染色体进行荧光原位杂交(FISH),可以在一个步骤中精确地进行染色体定位。此技术的综述,参见Verma等,Human Chromosomes:a Manual of BasicTechniques,Pergamon Press,New York(1988)。
一旦序列被定位到准确的染色***置,此序列在染色体上的物理位置就可以与基因图数据相关联。这些数据可见于例如,V.Mckusick,Mendelian Inheritance in Man(可通过与Johns Hopkins University Welch Medical Library联机获得)。然后可通过连锁分析,确定基因与业已定位到染色体区域上的疾病之间的关系。
接着,需要测定患病和未患病个体间的cDNA或基因组序列差异。如果在一些或所有的患病个体中观察到某突变,而该突变在任何正常个体中未观察到,则该突变可能是疾病的病因。比较患病和未患病个体,通常涉及首先寻找染色体中结构的变化,如从染色体水平可见的或用基于cDNA序列的PCR可检测的缺失或易位。根据目前的物理作图和基因定位技术的分辨能力,被精确定位至与疾病有关的染色体区域的cDNA,可以是50至500个潜在致病基因间之一种(假定1兆碱基作图分辨能力和每20kb对应于一个基因)。
本发明的具有抑癌功能的蛋白核苷酸全长序列或其片段通常可以用PCR扩增法、重组法或人工合成的方法获得。对于PCR扩增法,可根据本发明所公开的有关核苷酸序列,尤其是开放阅读框序列来设计引物,并用市售的cDNA库或按本领域技术人员已知的常规方法所制备的cDNA库作为模板,扩增而得有关序列。当序列较长时,常常需要进行两次或多次PCR扩增,然后再将各次扩增出的片段按正确次序拼接在一起。
一旦获得了有关的序列,就可以用重组法来大批量地获得有关序列。这通常是将其克隆入载体,再转入细胞,然后通过常规方法从增殖后的宿主细胞中分离得到有关序列。
此外,还可用人工合成的方法来合成有关序列,尤其是片段长度较短时。通常,通过先合成多个小片段,然后再进行连接可获得序列很长的片段。
目前,已经可以完全通过化学合成来编码本发明蛋白(或其片段,或其衍生物)的DNA序列。然后可将该DNA序列引入本领域中的各种DNA分子(如载体)和细胞中。此外,还可通过化学合成将突变引入本发明蛋白序列中。
此外,由于本发明的具有抑癌功能的蛋白具有源自人的天然氨基酸序列,因此,与来源于其他物种的同族蛋白相比,预计在施用于人时将具有更高的活性和/或更低的副作用(例如在人体内的免疫原性更低或没有)。
下面结合具体实施例,进一步阐述本发明。应理解,这些实施例仅用于说明本发明而不用于限制本发明的范围。下列实施例中未注明具体条件的实验方法,通常按照常规条件如Sambrook等人,  分子克隆:实验室手册(New York:Cold Spring Harbor LaboratoryPress,1989)中所述的条件,或按照制造厂商所建议的条件。
实施例1:cDNA基因的获得及对癌细胞克隆形成的抑制作用
SP2114a来自于从GIBCO BRL公司购得的肝cDNA文库(目录号:10422-012),PP8153,PP8332,PP9177,PP9445,PP10199和PP10226是通过用常规方法构建人胎盘cDNA文库获得的。取3、6、10月龄的胎盘组织,用Trizol试剂(GIBCOBRL公司)按厂方说明书提取总RNA,用mRNA提纯试剂盒(Pharmacia公司)提取mRNA。用pCMV-script TMXR cDNA文库构建试剂盒(Stratagene公司)构建上述mRNA的cDNA文库。其中反转录酶改用MMLV-RT-Superscript II(GIBCO BRL),反转录反应在42℃进行。转化XL 10-Gold感受细胞,获得了1×106 cfu/μg cDNA滴度的cDNA文库。第一轮随机挑取cDNA克隆,其后以高丰度cDNA克隆和已证明有抑癌细胞生长功能的cDNA克隆为探针,杂交筛选cDNA文库,挑取弱阳性及阴性克隆。用Qiagen 96孔板质粒抽提试剂盒,按厂家说明书进行质粒DNA的提取。质粒DNA和空载体同时转染肝癌细胞系7721。100ng DNA酒精沉淀干燥后,加6μl H2O溶解,待转染。每份DNA样品中加0.74μl脂质体及9.3μl无血清培液,混匀后,室温放置10分钟。每管中加150μl无血清培液,均分加入3孔生长于96孔板的7721细胞中,37℃放置2小时,每孔再加50μl无血清培液,37℃24小时。每孔换100μl全培液,37℃24小时,换含G418的全培液100μl,37℃24~48小时,边观察,边换G418浓度不等的培液。约2~3次后,直到镜检细胞有克隆形成,计数。发现以上克隆有抑制细胞克隆形成作用,结果如下表所示。
                 cDNA克隆转染细胞(7721)克隆形成情况
  cDNA克隆名称     cDNA克隆数(三个重复)   空载体克隆数(三个重复)
    PP8153PP8332PP9177PP9445PP10199PP10226SP2114a        2    0    18    3    516   11   156    1    95    2    26    1    34    6    5       26    29    3012    13    1548    38    3548    38    3548    38    3548    38    3538    42    40
对上述cDNA克隆采用双脱氧终止法,在ABI377 DNA自动测序仪上测定其一端近500bp的核苷酸序列。分析后,确定为新基因克隆,进行另一端测序,仍未获得全长cDNA序列,设计引物,再次进行测序,直到获得全长序列(SEQ ID NO:1、4、7、10、13、16、19)。
实施例2:从胎盘cDNA中PCR获得全长基因:
取3、6、10月龄的胎盘组织,用Trizol试剂(GIBCO BRL公司)按厂方说明书提取总RNA,用mRNA提纯试剂盒(Pharmacia公司)提取mRNA。用MMLV-RT-Superscript II(GIBCO BRL),反转录酶在42℃进行反转录反应,获得胎盘cDNA。利用各个基因的转异引物(如下表所示),按97℃3分钟、1个循环;94℃30秒→60℃30秒→72℃1分钟,共35个循环;72℃ 10分钟,1个循环,进行PCR扩增,获得含有完整开放阅读框序列的各蛋白基因的扩增产物。扩增产物经测序验证,与实施例1测得的序列相符,随后用常规技术将扩增产物转入宿主细胞,从而获得重组蛋白。(注:对于SP2114a,可使用从GIBCO BRL公司购得的肝cDNA文库(目录号:10422-012)作为模板)。
                      基因特异引物
克隆名称  特异引物1(5′→3′)  特异引物2(5′→3′)
PP8153PP8332PP9177PP9445PP10199PP10226SP2114a  CGGAGGTTCTAGTGTCGGAGTTTCAGACCTGTTCCAAGGGCAGAGGAGCATCCCGTCTACACCAAATGAGGGACATGGAAGCAGTACTCCATGGTGCAGAAATGCACCCTGTTTTGAGAGACCACTTCCACCAGAGACACA  GGACTGCTACCCATCCTGAACTCTGCCTCCACTCACACTGGCTAGCCAGCTCTGTGGAGTCCAAGCCTGACTCTCTTTGCGTTTGCTCCCAGCTGTCTTCAGATCAACTTGAGGCCAGGAGCAAGGTTTCTTCAACTGGC
实施例3:cDNA克隆序列分析
1.PP8153
A:核苷酸序列(SEQ ID NO:1)长度:2349bp
   1  GTGGAAGTAG AAGGCGGTGG CTGAGGCGGT TCCGGAGGTT CTAGTGTCGG AGTTGGGTGC
  61  AGGCAGGTGC CATGGGCCCG CTTGAGGCAC ACTGAGGGGA CGCGGGGCTG GGCCATGGCC
 121  GGCGCTCGGG CCGCCGCCGC CGCTGCCTCG GCGGGGTCCT CGGCCTCTTC AGGCAACCAG
 181  CCGCCTCAGG AGCTGGGGCT TGGGGAGCTG CTGGAGGAGT TCTCCCGGAC TCAGTACCGG
 241  GCCAAGGATG GCAGCGGGAC CGGCGGCTCT AAGGTTGAGC GCATTGAGAA GAGATGTCTG
 301  GAGCTGTTTG GCCGAGACTA CTGTTTCAGC GTGATTCCAA ACACGAATGG GGATATCTGT
 361  GGCCACTATC CCCGGCACAT CGTGTTCCTG GAGTATGAGA GTTCTGAGAA GGAGAAAGAC
 421  ACGTTTGAGA GTACCGTACA GGTGAGCAAG TTGCAAGACC TCATCCACCG CAGCAAGATG
 481  GCCCGGTGCA GAGGACGGTT TGTCTGCCCA GTAATCCTGT TCAAGGGCAA GCACATTTGC
 541  AGGTCGGCCA CACTGGCTGG ATGGGGAGAG CTGTATGGAC GCTCAGGCTA CAACTATTTT
 601  TTCTCAGGGG GTGCAGATGA TGCCTGGGCA GATGTGGAGG ACGTCACGGA GGAGGACTGT
 661  GCTCTTCGAA GTGGTGACAC GCATCTTTTT GATAAGGTCA GAGGCTATGA CATCAAGCTG
 721  CTTCGATACC TGTCAGTCAA ATACATCTGT GACCTGATGG TGGAGAACAA GAAGGTGAAG
 781  TTTGGCATGA ATGTAACCTC CTCTGAGAAG GTGGACAAAG CCCAGCGCTA TGCCGACTTC
 841  ACTCTCCTCT CCATCCCGTA TCCAGGCTGT GAATTTTTCA AGGAATATAA AGATCGGGAT
 901  TACATGGCAG AAGGGCTCAT ATTTAACTGG AAGCAGGACT ACGTTGATGC CCCATTGAGC
 961  ATCCCCGACT TCCTGACTCA CTCTCTGAAC ATTGACTGGA GCCAGTATCA GTGTTGGGAT
1021  CTGGTGCAAC AAACACAAAA CTACCTGAAG CTGCTGCTTT CCTTAGTTAA CAGTGATGAT
1081  GACAGCGGGC TGCTGGTACA CTGTATCTCA GGCTGGGATC GGACCCCCCT CTTCATCTCC
1141  CTCCTGCGCC TTTCCTTGTG GGCTGATGGG CTCATCCACA CGTCCCTGAA GCCCACTGAG
1201  ATCCTCTACC TCACTGTGGC CTATGACTGG TTCCTCTTCG GGCACATGTT GGTAGATCGG
1261  CTCAGCAAAG GGGAGGAGAT TTTCTTCTTC TGCTTCAATT TTTTGAAGCA TATTACCTCC
1321  GAGGAGTTCT CTGCTCTGAA GACCCAGAGG AGGAAGAGTT TGCCAGCCCG GGATGGAGGC
1381  TTCACCCTGG AAGACATCTG CATGCTGAGA CGAAAGGACC GTGGCAGCAC CACCAGCCTT
1441  GGCAGCGACT TCTCCCTGGT CATGGAGAGT TCCCCAGGAG CCACTGGGAG CTTCACCTAT
1501  GAAGGCCGTG GAGCTGGTCC CAGCAGGAGC GCCAACTCAG GCAGCTTGAA GGAAGAGCCA
1561  CTCATCCTCT CCACAGAGTG TCCTCTGGAA CCGGCCACAA CCCTCAGAGG ACCGCTTGCC
1621  TTCCCAGCAG GGGCTGGCGG AAGCCAGGTC TTCCAGCTCC TCTTCCTCAA ACCATTCTGA
1681  TAACTTTTTC AGGATGGGTA GCAGTCCCCT GGAGGTCCCC AAACCCAGGC TTGCAGCCCT
1741  GAGTGATCGA GAGACTCGGC TGCAGGAGGT GCGCTCAGCC TTCTTGGCTG CGTACAGCAG
1801  CACAGTGGGG CTTCGGGCAG TAGCCCCCAG TCCTTCCGGT GCCATCGGGG GCCTGCTGGA
1861  GCAATTTGCC CGTGGTGTTG GACTCCGGAG CATCAGCAGC AATGCCTTGT GAAGAAGCCA
1921  GCCCATGACA TTTTCCTGCT CCTCTCTCAG CTGAGCCCTT AGCAGAGAAT CAAAGCCATG
1981  CCTGGCCGAA GGGGTACTTC CAGGTCAGGG GAAATTTCAG TCCCCCATCT CCATCATGAA
2041  CATGGCAGCC CCAAAGCTGA GCAAGGCCAA AGACAGGGTT TTCCAACCCC CAGCCTCTTG
2101  ACTGGTGACC ACCACCCCTT CTTGTCACTG TCTCCCACCC ACCCCATCTT TGCTGGGATT
2161  CCCATCAACT CTCAGAACTG TGTGGGGTTT CCCTGGGGCC TTGTGGAAGC CATGACTTCA
2221  CAAAGACCCT ACCTGTCAGT TCTTGTTTCT GGGGAGGAGG GATCACCTGC ACTGAGAATG
2281  AGGCAGTTTG ACACAGATCA CAAAATAAAA TCAAAGTCTT TTTGAATAGC CAAAAAAAAA
2341  AAAAAAAAA
B:氨基酸序列(SEQ ID NO:2)  长度:521个氨基酸
  1  MAGARAAAAA ASAGSSASSG NQPPQELGLG ELLEEFSRTQ YRAKDGSGTG GSKVERIEKR
 61  CLELFGRDYC FSVIPNTNGD ICGHYPRHIV FLEYESSEKE KDTFESTVQV SKLQDLIHRS
121  KMARCRGRFV CPVILFKGKH ICRSATLAGW GELYGRSGYN YFFSGGADDA WADVEDVTEE
181  DCALRSGDTH LFDKVRGYDI KLLRYLSVKY ICDLMVENKK VKFGMNVTSS EKVDKAQRYA
241  DFTLLSIPYP GCEFFKEYKD RDYMAEGLIF NWKQDYVDAP LSIPDFLTHS LNIDWSQYQC
301  WDLVQQTQNY LKLLLSLVNS DDDSGLLVHC ISGWDRTPLF ISLLRLSLWA DGLIHTSLKP
361  TEILYLTVAY DWFLFGHMLV DRLSKGEEIF FFCFNFLKHI TSEEFSALKT QRRKSLPARD
421  GGFTLEDICM LRRKDRGSTT SLGSDFSLVM ESSPGATGSF TYEGRGAGPS RSANSGSLKE
481  EPLILSTECP LEPATTLRGP LAFPAGAGGS QVFQLLFLKP F
C.核苷酸及氨基酸组合序列(SEQ ID NO:3)
克隆号:PP8153
起始编码子:115ATG      终止编码子:1678TGA
蛋白质分子量:58350.05
  1  GTG GAA GTA GAA GGC GGT GGC TGA GGC GGT TCC GGA GGT TCT AGT GTC     48
 49  GGA GTT GGG TGC AGG CAG GTG CCA TGG GCC CGC TTG AGG CAC ACT GAG     96
 97  GGG ACG CGG GGC TGG GCC ATG GCC GGC GCT CGG GCC GCC GCC GCC GCT    144
  1                          Met Ala Gly Ala Arg Ala Ala Ala Ala Ala     10
145  GCC TCG GCG GGG TCC TCG GCC TCT TCA GGC AAC CAG CCG CCT CAG GAG    192
 11  Ala Ser Ala Gly Ser Ser Ala Ser Ser Gly Asn Gln Pro Pro Gln Glu     26
193  CTG GGG CTT GGG GAG CTG CTG GAG GAG TTC TCC CGG ACT CAG TAC CGG    240
 27  Leu Gly Leu Gly Glu Leu Leu Glu Glu Phe Ser Arg Thr Gln Tyr Arg     42
241  GCC AAG GAT GGC AGC GGG ACC GGC GGC TCT AAG GTT GAG CGC ATT GAG    288
  43  Ala Lys Asp Gly Ser Gly Thr Gly Gly Ser Lys Val Glu Arg Ile Glu      58
 289  AAG AGA TGT CTG GAG CTG TTT GGC CGA GAC TAC TGT TTC AGC GTG ATT     336
  59  Lys Arg Cys Leu Glu Leu Phe Gly Arg Asp Tyr Cys Phe Ser Val Ile      74
 337  CCA AAC ACG AAT GGG GAT ATC TGT GGC CAC TAT CCC CGG CAC ATC GTG     384
  75  Pro Asn Thr Asn Gly Asp Ile Cys Gly His Tyr Pro Arg His Ile Val      90
 385  TTC CTG GAG TAT GAG AGT TCT GAG AAG GAG AAA GAC ACG TTT GAG AGT     432
  91  Phe Leu Glu Tyr Glu Ser Ser Glu Lys Glu Lys Asp Thr Phe Glu Ser     106
 433  ACC GTA CAG GTG AGC AAG TTG CAA GAC CTC ATC CAC CGC AGC AAG ATG     480
 107  Thr Val Gln Val Ser Lys Leu Gln Asp Leu Ile His Arg Ser Lys Met     122
 481  GCC CGG TGC AGA GGA CGG TTT GTC TGC CCA GTA ATC CTG TTC AAG GGC     528
 123  Ala Arg Cys Arg Gly Arg Phe Val Cys Pro Val Ile Leu Phe Lys Gly     138
 529  AAG CAC ATT TGC AGG TCG GCC ACA CTG GCT GGA TGG GGA GAG CTG TAT     576
 139  Lys His Ile Cys Arg Ser Ala Thr Leu Ala Gly Trp Gly Glu Leu Tyr     154
 577  GGA CGC TCA GGC TAC AAC TAT TTT TTC TCA GGG GGT GCA GAT GAT GCC     624
 155  Gly Arg Ser Gly Tyr Asn Tyr Phe Phe Ser Gly Gly Ala Asp Asp Ala     170
 625  TGG GCA GAT GTG GAG GAC GTC ACG GAG GAG GAC TGT GCT CTT CGA AGT     672
 171  Trp Ala Asp Val Glu Asp Val Thr Glu Glu Asp Cys Ala Leu Arg Ser     186
 673  GGT GAC ACG CAT CTT TTT GAT AAG GTC AGA GGC TAT GAC ATC AAG CTG     720
 187  Gly Asp Thr His Leu Phe Asp Lys Val Arg Gly Tyr Asp Ile Lys Leu     202
 721  CTT CGA TAC CTG TCA GTC AAA TAC ATC TGT GAC CTG ATG GTG GAG AAC     768
 203  Leu Arg Tyr Leu Ser Val Lys Tyr Ile Cys Asp Leu Met Val Glu Asn     218
 769  AAG AAG GTG AAG TTT GGC ATG AAT GTA ACC TCC TCT GAG AAG GTG GAC     816
 219  Lys Lys Val Lys Phe Gly Met Asn Val Thr Ser Ser Glu Lys Val Asp     234
 817  AAA GCC CAG CGC TAT GCC GAC TTC ACT CTC CTC TCC ATC CCG TAT CCA     864
 235  Lys Ala Gln Arg Tyr Ala Asp Phe Thr Leu Leu Ser Ile Pro Tyr Pro     250
 865  GGC TGT GAA TTT TTC AAG GAA TAT AAA GAT CGG GAT TAC ATG GCA GAA     912
 251  Gly Cys Glu Phe Phe Lys Glu Tyr Lys Asp Arg Asp Tyr Met Ala Glu     266
 913  GGG CTC ATA TTT AAC TGG AAG CAG GAC TAC GTT GAT GCC CCA TTG AGC     960
 267  Gly Leu Ile Phe Asn Trp Lys Gln Asp Tyr Val Asp Ala Pro Leu Ser     282
 961  ATC CCC GAC TTC CTG ACT CAC TCT CTG AAC ATT GAC TGG AGC CAG TAT    1008
 283  Ile Pro Asp Phe Leu Thr His Ser Leu Asn Ile Asp Trp Ser Gln Tyr     298
1009  CAG TGT TGG GAT CTG GTG CAA CAA ACA CAA AAC TAC CTG AAG CTG CTG    1056
 299  Gln Cys Trp Asp Leu Val Gln Gln Thr Gln Asn Tyr Leu Lys Leu Leu     314
1057  CTT TCC TTA GTT AAC AGT GAT GAT GAC AGC GGG CTG CTG GTA CAC TGT    1104
 315  Leu Ser Leu Val Asn Ser Asp Asp Asp Ser Gly Leu Leu Val His Cys     330
1105  ATC TCA GGC TGG GAT CGG ACC CCC CTC TTC ATC TCC CTC CTG CGC CTT    1152
 331  Ile Ser Gly Trp Asp Arg Thr Pro Leu Phe Ile Ser Leu Leu Arg Leu     346
1153  TCC TTG TGG GCT GAT GGG CTC ATC CAC ACG TCC CTG AAG CCC ACT GAG    1200
 347  Ser Leu Trp Ala Asp Gly Leu Ile His Thr Ser Leu Lys Pro Thr Glu     362
1201  ATC CTC TAC CTC ACT GTG GCC TAT GAC TGG TTC CTC TTC GGG CAC ATG    1248
 363  Ile Leu Tyr Leu Thr Val Ala Tyr Asp Trp Phe Leu Phe Gly His Met     378
1249  TTG GTA GAT CGG CTC AGC AAA GGG GAG GAG ATT TTC TTC TTC TGC TTC    1296
 379  Leu Val Asp Arg Leu Ser Lys Gly Glu Glu Ile Phe Phe Phe Cys Phe     394
1297  AAT TTT TTG AAG CAT ATT ACC TCC GAG GAG TTC TCT GCT CTG AAG ACC    1344
 395  Asn Phe Leu Lys His Ile Thr Ser Glu Glu Phe Ser Ala Leu Lys Thr     410
1345  CAG AGG AGG AAG AGT TTG CCA GCC CGG GAT GGA GGC TTC ACC CTG GAA    1392
 411  Gln Arg Arg Lys Ser Leu Pro Ala Arg Asp Gly Gly Phe Thr Leu Glu     426
1393  GAC ATC TGC ATG CTG AGA CGA AAG GAC CGT GGC AGC ACC ACC AGC CTT    1440
 427  Asp Ile Cys Met Leu Arg Arg Lys Asp Arg Gly Ser Thr Thr Ser Leu     442
1441  GGC AGC GAC TTC TCC CTG GTC ATG GAG AGT TCC CCA GGA GCC ACT GGG    1488
 443  Gly Ser Asp Phe Ser Leu Val Met Glu Ser Ser Pro Gly Ala Thr Gly     458
1489  AGC TTC ACC TAT GAA GGC CGT GGA GCT GGT CCC AGC AGG AGC GCC AAC    1536
 459  Ser Phe Thr Tyr Glu Gly Arg Gly Ala Gly Pro Ser Arg Ser Ala Asn     474
1537  TCA GGC AGC TTG AAG GAA GAG CCA CTC ATC CTC TCC ACA GAG TGT CCT    1584
 475  Ser Gly Ser Leu Lys Glu Glu Pro Leu Ile Leu Ser Thr Glu Cys Pro     490
1585  CTG GAA CCG GCC ACA ACC CTC AGA GGA CCG CTT GCC TTC CCA GCA GGG    1632
 491  Leu Glu Pro Ala Thr Thr Leu Arg Gly Pro Leu Ala Phe Pro Ala Gly     506
1633  GCT GGC GGA AGC CAG GTC TTC CAG CTC CTC TTC CTC AAA CCA TTC TGA    1680
 507  Ala Gly Gly Ser Gln Val Phe Gln Leu Leu Phe Leu Lys Pro Phe ***     522
1681  TAA CTT TTT CAG GAT GGG TAG CAG TCC CCT GGA GGT CCC CAA ACC CAG    1728
1729  GCT TGC AGC CCT GAG TGA TCG AGA GAC TCG GCT GCA GGA GGT GCG CTC    1776
1777  AGC CTT CTT GGC TGC GTA CAG CAG CAC AGT GGG GCT TCG GGC AGT AGC    1824
1825  CCC CAG TCC TTC CGG TGC CAT CGG GGG CCT GCT GGA GCA ATT TGC CCG    1872
1873  TGG TGT TGG ACT CCG GAG CAT CAG CAG CAA TGC CTT GTG AAG AAG CCA    1920
1921  GCC CAT GAC ATT TTC CTG CTC CTC TCT CAG CTG AGC CCT TAG CAG AGA    1968
1969  ATC AAA GCC ATG CCT GGC CGA AGG GGT ACT TCC AGG TCA GGG GAA ATT    2016
2017  TCA GTC CCC CAT CTC CAT CAT GAA CAT GGC AGC CCC AAA GCT GAG CAA    2064
2065  GGC CAA AGA CAG GGT TTT CCA ACC CCC AGC CTC TTG ACT GGT GAC CAC    2112
2113  CAC CCC TTC TTG TCA CTG TCT CCC ACC CAC CCC ATC TTT GCT GGG ATT    2160
2161  CCC ATC AAC TCT CAG AAC TGT GTG GGG TTT CCC TGG GGC CTT GTG GAA    2208
2209  GCC ATG ACT TCA CAA AGA CCC TAC CTG TCA GTT CTT GTT TCT GGG GAG    2256
2257  GAG GGA TCA CCT GCA CTG AGA ATG AGG CAG TTT GAC ACA GAT CAC AAA    2304
2305  ATA AAA TCA AAG TCT TTT TGA ATA GCC AAA AAA AAA AAA AAA AAA        2349
2.PP8332
A:核苷酸序列(SEQ ID NO:4)长度:1771bp
   1  GCCTGGGGCG TCCCCGCGAA GCCTGGGCCT GTCAGGCGGT TCCGTCCGGG TCTCGGCCAC
  61  CGTCGAGTTC CGTCGAGTTC CGTCCCGGCC CTGCTCACAG CAGCGCCCTC GGAGCGCCCA
 121  GCACCTGCGG CCGGCCAGGC AGCGCGATCC TGCGGCGTCT GGCCATCCCG AATGCTATGG
 181  CCGCCGTCGC CGTCTTGCGG GCCTTCGGGG CAAGTGGGCC CATGTGTCTC CGGCGCGGCC
 241  CCTGGGCCCA GCTCCCCGCC CGCTTCTGCA GCCGGGACCC GGCCGGGGCG GGGCGGCGGG
 301  AGTCGGAGCC GCGGCCCACC AGCGCGCGGC AGCTGGACGG CATAAGGAAC ATCGTCTTGA
 361  GCAATCCCAA GAAGAGGAAC ACGTTGTCAC TTGCAATGCT GAAATCTCTC CAAAGTGACA
 421  TTCTTCATGA CGCTGACAGC AACGATCTGA AAGTCATTAT CATCTCGGCT GAGGGGCCTG
 481  TGTTTTCTTC TGGGCATGAC TTAAAGGAGC TGACAGAGGA GCAAGGCCGT GATTACCATG
 541  CCGAAGTATT TCAGACCTGT TCCAAGGGTC TCGCTCTGTC GCCCAGGCTG GATTACAGTG
 601  GCATGATCTC GGCTCACTGC AACCTCTGCC TCCCGGGTTC AAGCAATTCT CCTGCCTCAG
 661  CCTCCTGAGT AGCTGGGACT ACAGGTCATG ATGCACATCC GGAACCACCC CGTCCCCGTC
 721  ATTGCCATGG TCAATGGCCT GGCCACGGCT GCCGGCTGTC AACTGGTTGC CAGCTGCGAC
 781  ATTGCCGTGG CGAGCGACAA GTCCTCTTTT GCCACTCCTG GGGTGAACGT CGGGCTCTTC
 841  TGTTCTACCC CTGGGGTTGC CTTGGCAAGA GCAGTGCCTA GAAAGGTGGC CTTGGAGATG
 901  CTCTTTACTG GTGAGCCCAT TTCTGCCCAG GAGGCCCTGC TCCACGGGCT GCTTAGCAAG
 961  GTGGTGCCAG AGGCGGAGCT GCAGGAGGAG ACCATGCGGA TCGCTAGGAA GATCGCATCG
1021  CTGAGCCGTC CGGTGGTGTC CCTGGGCAAA GCCACCTTCT ACAAGCAGCT GCCCCAGGAC
1081  CTGGGGACGG CTTACTACCT CACCTCCCAG GCCATGGTGG ACAACCTGGC CCTGCGGGAC
1141  GGGCAGGAGG GCATCACGGC CTTCCTCCAG AAGAGAAAAC CTGTCTGGTC ACACGAGCCA
1201  GTGTGAGTGG AGGCAGAGGA GTGAGGCCCA CGGGCAGCGC CCAGGAGCCC ACCTTCCCCT
1261  CTGGCCCAGC CACCACTGCC TCTCAGCTTC AACAGGTGAC AGGCTGCTTT CGTGACTTGA
1321  TATTGGTGTC ATAGCATTTG GCCTACATTA AAAGCCACAA TTTCATGGGG AAAGGACAAA
1381  ATGGAGAGTG ACTGAGGTGC TGACCTCAGT GCAAGGCTGG TGAACCCTGC AGCGGGCCAG
1441  CTATGGTGGG AAGCCTGGCA TTTGGGGTGC TCCTTGCAAC GTCTTAAGCA AGCGACCCCC
1501  CTGACATAGC AAAAGGTGGC AACCCATGGA GGCAGAAAGA AGGACGCCAG CCTGACCCTT
1561  ATCTTGAAAC GTCCTAAGCA GAGTTAATCC TGGCTGCTCA GGAGAGGCGA CACATTTCAA
1621  ATCTCCACGA GATATTCTCC ACACAGAAAA TCTTCTTGAT TCTATAGAGA CTTAATCATG
1681  CCTATGGCTT TGAATAATCT TATGTGATTT AAATAAATTA AATCTTTATA GAGACTGGAA
1741  AAAAAAAAAA AAAAAAAAAA AAAAAAAAAA A
B:氨基酸序列(SEQ ID NO:5)长度:172个氨基酸
  1  MMHIRNHPVP VIAMVNGLAT AAGCQLVASC DIAVASDKSS FATPGVNVGL FCSTPGVALA
 61  RAVPRKVALE MLFTGEPISA QEALLHGLLS KVVPEAELQE ETMRIARKIA SLSRPVVSLG
121  KATFYKQLPQ DLGTAYYLTS QAMVDNLALR DGQEGITAFL QKRKPVWSHE PV
C.核苷酸及氨基酸组合序列(SEQ ID NO:6)
克隆号:PP8332
起始编码子:688ATG      终止编码子:1204TGA
蛋白质分子量:18409.48
  1  GCC TGG GGC GTC CCC GCG AAG CCT GGG CCT GTC AGG CGG TTC CGT CCG     48
 49  GGT CTC GGC CAC CGT CGA GTT CCG TCG AGT TCC GTC CCG GCC CTG CTC     96
 97  ACA GCA GCG CCC TCG GAG CGC CGA GCA CCT GCG GCC GGC CAG GCA GCG    144
145  CGA TCC TGC GGC GTC TGG CCA TCC CGA ATG CTA TGG CCG CCG TCG CCG    192
193  TCT TGC GGG CCT TCG GGG CAA GTG GGC CCA TGT GTC TCC GGC GCG GCC    240
241  CCT GGG CCC AGC TCC CCG CCC GCT TCT GCA GCC GGG ACC CGG CCG GGG    288
289  CGG GGC GGC GGG AGT CGG AGC CGC GGC CCA CCA GCG CGC GGC AGC TGG    336
 337  ACG GCA TAA GGA ACA TCG TCT TGA GCA ATC CCA AGA AGA GGA ACA CGT     384
 385  TGT CAC TTG CAA TGC TGA AAT CTC TCC AAA GTG ACA TTC TTC ATG ACG     432
 433  CTG ACA GCA ACG ATC TGA AAG TCA TTA TCA TCT CGG CTG AGG GGC CTG     480
 481  TGT TTT CTT CTG GGC ATG ACT TAA AGG AGC TGA CAG AGG AGC AAG GCC     528
 529  GTG ATT ACC ATG CCG AAG TAT TTC AGA CCT GTT CCA AGG GTC TCG CTC     576
 577  TGT CGC CCA GGC TGG ATT ACA GTG GCA TGA TCT CGG CTC ACT GCA ACC     624
 625  TCT GCC TCC CGG GTT CAA GCA ATT CTC CTG CCT CAG CCT CCT GAG TAG     672
 673  CTG GGA CTA CAG GTC ATG ATG CAC ATC CGG AAC CAC CCC GTC CCC GTC     720
   1                      Met Met His Ile Arg Asn His Pro Val Pro Val      11
 721  ATT GCC ATG GTC AAT GGC CTG GCC ACG GCT GCC GGC TGT CAA CTG GTT     768
  12  Ile Ala Met Val Asn Gly Leu Ala Thr Ala Ala Gly Cys Gln Leu Val      27
 769  GCC AGC TGC GAC ATT GCC GTG GCG AGC GAC AAG TCC TCT TTT GCC ACT     816
  28  Ala Ser Cys Asp Ile Ala Val Ala Ser Asp Lys Ser Ser Phe Ala Thr      43
 817  CCT GGG GTG AAC GTC GGG CTC TTC TGT TCT ACC CCT GGG GTT GCC TTG     864
  44  Pro Gly Val Asn Val Gly Leu Phe Cys Ser Thr Pro Gly Val Ala Leu      59
 865  GCA AGA GCA GTG CCT AGA AAG GTG GCC TTG GAG ATG CTC TTT ACT GGT     912
  60  Ala Arg Ala Val Pro Arg Lys Val Ala Leu Glu Met Leu Phe Thr Gly      75
 913  GAG CCC ATT TCT GCC CAG GAG GCC CTG CTC CAC GGG CTG CTT AGC AAG     960
  76  Glu Pro Ile Ser Ala Gln Glu Ala Leu Leu His Gly Leu Leu Ser Lys      91
 961  GTG GTG CCA GAG GCG GAG CTG CAG GAG GAG ACC ATG CGG ATC GCT AGG    1008
  92  Val Val Pro Glu Ala Glu Leu Gln Glu Glu Thr Met Arg Ile Ala Arg     107
1009  AAG ATC GCA TCG CTG AGC CGT CCG GTG GTG TCC CTG GGC AAA GCC ACC    1056
 108  Lys Ile Ala Ser Leu Ser Arg Pro Val Val Ser Leu Gly Lys Ala Thr     123
1057  TTC TAC AAG CAG CTG CCC CAG GAC CTG GGG ACG GCT TAC TAC CTC ACC    1104
 124  Phe Tyr Lys Gln Leu Pro Gln Asp Leu Gly Thr Ala Tyr Tyr Leu Thr     139
1105  TCC CAG GCC ATG GTG GAC AAC CTG GCC CTG CGG GAC GGG CAG GAG GGC    1152
 140  Ser Gln Ala Met Val Asp Asn Leu Ala Leu Arg Asp Gly Gln Glu Gly     155
1153  ATC ACG GCC TTC CTC CAG AAG AGA AAA CCT GTC TGG TCA CAC GAG CCA    1200
 156  Ile Thr Ala Phe Leu Gln Lys Arg Lys Pro Val Trp Ser His Glu Pro     171
1201  GTG TGA GTG GAG GCA GAG GAG TGA GGC CCA CGG GCA GCG CCC AGG AGC    1248
 172  Val ***                                                             173
1249  CCA CCT TCC CCT CTG GCC CAG CCA CCA CTG CCT CTC AGC TTC AAC AGG    1296
1297  TGA CAG GCT GCT TTC GTG ACT TGA TAT TGG TGT CAT AGC ATT TGG CCT    1344
1345  ACA TTA AAA GCC ACA ATT TCA TGG GGA AAG GAC AAA ATG GAG AGT GAC    1392
1393  TGA GGT GCT GAC CTC AGT GCA AGG CTG GTG AAC CCT GCA GCG GGC CAG    1440
1441  CTA TGG TGG GAA GCC TGG CAT TTG GGG TGC TCC TTG CAA CGT CTT AAG    1488
1489  CAA GCG ACC CCC CTG ACA TAG CAA AAG GTG GCA ACC CAT GGA GGC AGA    1536
1537  AAG AAG GAC GCC AGC CTG ACC CTT ATC TTG AAA CGT CCT AAG CAG AGT    1584
1585  TAA TCC TGG CTG CTC AGG AGA GGC GAC ACA TTT CAA ATC TCC ACG AGA    1632
1633  TAT TCT CCA CAC AGA AAA TCT TCT TGA TTC TAT AGA GAC TTA ATC ATG    1680
1681  CCT ATG GCT TTG AAT AAT CTT ATG TGA TTT AAA TAA ATT AAA TCT TTA    1728
1729  TAG AGA CTG GAA AAA AAA AAA AAA AAA AAA AAA AAA AAA AAA A          1771
3.PP9177
A:核苷酸序列(SEQ ID NO:7)长度:2160bp
   1  GCGTCTGCCA GCCGGCTTGG CTAGCGCGCG GCGGCCGTGG CTAAGGCTGC TACGAAGCGA
  61  GCTTGGGAGG AGCAGCGGCC TGCGGGGCAG AGGAGCATCC CGTCTACCAG GTCCCAAGCG
 121  GCCGTGGCCC GCGGGTCATG GCCAAAGGAG AAGGCGCCGA GAGCGGCTCC GCGGCGGGGC
 181  TGCTACCCAC CAGCATCCTC CAAAGCACTG AACGCCCGGC CCAGGTGAAG AAAGAACCGA
 241  AAAAGAAGAA ACAACAGTTG TCTGTTTGCA ACAAGCTTTG CTATGCACTT GGGGGAGCCC
 301  CCTACCAGGT GACGGGCTGT GCCCTGGGTT TCTTCCTTCA GATCTACCTA TTGGATGTGG
 361  CTCAGGTGGG CCCTTTCTCT GCCTCCATCA TCCTGTTTGT GGGCCGAGCC TGGGATGCCA
 421  TCACAGACCC CCTGGTGGGC CTCTGCATCA GCAAATCCCC CTGGACCTGC CTGGGTCGCC
 481  TTATGCCCTG GATCATCTTC TCCACGCCCC TGGCCGTCAT TGCCTACTTC CTCATCTGGT
 541  TCGTGCCCGA CTTCCCACAC GGCCAGACCT ATTGGTACCT GCTTTTCTAT TGCCTCTTTG
 601  AAACAATGGT CACGTGTTTC CATGTTCCCT ACTCGGCTCT CACCATGTTC ATCAGCACCG
 661  AGCAGACTGA GCGGGATTCT GCCACCGCCT ATCGGATGAC TGTGGAAGTG CTGGGCACAG
 721  TGCTGGGCAC GGCGATCCAG GGACAAATCG TGGGCCAAGC AGACACGCCT TGTTTCCAGG
 781  ACCTCAATAG CTCTACAGTA GCTTCACAAA GTGCCAACCA TACACATGGC ACCACCTCAC
 841  ACAGGGAAAC GCAAAAGGCA TACCTGCTGG CAGCGGGGGT CATTGTCTGT ATCTATATAA
 901  TCTGTGCTGT CATCCTGATC CTGGGCGTGC GGGAGCAGAG AGAACCCTAT GAAGCCCAGC
 961  AGTCTGAGCC AATCGCCTAC TTCCGGGGCC TACGGCTGGT CATGAGCCAC GGCCCATACA
1021  TCAAACTTAT TACTGGCTTC CTCTTCACCT CCTTGGCTTT CATGCTGGTG GAGGGGAACT
1081  TTGTCTTGTT TTGCACCTAC ACCTTGGGCT TCCGCAATGA ATTCCAGAAT CTACTCCTGG
1141  CCATCATGCT CTCGGCCACT TTAACCATTC CCATCTGGCA GTGGTTCTTG ACCCGGTTTG
1201  GCAAGAAGAC AGCTGTATAT GTTGGGATCT CATCAGCAGT GCCATTTCTC ATCTTGGTGG
1261  CCCTCATGGA GAGTAACCTC ATCATTACAT ATGCGGTAGC TGTGGCAGCT GGCATCAGTG
1321  TGGCAGCTGC CTTCTTACTA CCCTGGTCCA TGCTGCCTGA TGTCATTGAC GACTTCCATC
1381  TGAAGCAGCC CCACTTCCAT GGAACCGAGC CCATCTTCTT CTCCTTCTAT GTCTTCTTCA
1441  CCAAGTTTGC CTCTGGAGTG TCACTGGGCA TTTCTACCCT CAGTCTGGAC TTTGCAGGGT
1501  ACCAGACCCG TGGCTGCTCG CAGCCGGAAC GTGTCAAGTT TACACTGAAC ATGCTCGTGA
1561  CCATGGCTCC CATAGTTCTC ATCCTGCTGG GCCTGCTGCT CTTCAAAATG TACCCCATTG
1621  ATGAGGAGAG GCGGCGGCAG AATAAGAAGG CCCTGCAGGC ACTGAGGGAC GAGGCCAGCA
1681  GCTCTGGCTG CTCAGAAACA GACTCCACAG AGCTGGCTAG CATCCTCTAG GGCCCGCCAC
1741  GTTGCCCGAA GCCACCATGC AGAAGGCCAC AGAAGGGATC AGGACCTGTC TGCCGGCTTG
1801  CTGAGCAGCT GGACTGCAGG TGCTAGGAAG GGAACTGAAG ACTCAAGGAG GTGGCCCAGG
1861  ACACTTGCTG TGCTCACTGT GGGGCCGGCT GCTCTGTGGC CTCCTGCCTC CCCTCTGCCT
1921  GCCTGTGGGG CCAAGCCCTG GGGCTGCCAC TGTGAATATG CCAAGGACTG ATCGGGCCTA
1981  GCCCGGAACA CTAATGTAGA AACCTTTTTT TTACAGAGCC TAATTAATAA CTTAATGACT
2041  GTGTACATAG CAATGTGTGT GTATGTATAT GTCTGTGAGC TATTAATGTT ATTAATTTTC
2101  ATAAAAGCTG GAAAGCAAAA AAAAAAAAAA AAAAAAAAAA AAAAAAAAAA AAAAAAAAAA
B:氨基酸序列(SEQ ID NO:8)长度:530个氨基酸
  1  MAKGEGAESG SAAGLLPTSI LQSTERPAQV KKEPKKKKQQ LSVCNKLCYA LGGAPYQVTG
 61  CALGFFLQIY LLDVAQVGPF SASIILFVGR AWDAITDPLV GLCISKSPWT CLGRLMPWII
121  FSTPLAVIAY FLIWFVPDFP HGQTYWYLLF YCLFETMVTC FHVPYSALTM FISTEQTERD
181  SATAYRMTVE VLGTVLGTAI QGQIVGQADT PCFQDLNSST VASQSANHTH GTTSHRETQK
241  AYLLAAGVIV CIYIICAVIL ILGVREQREP YEAQQSEPIA YFRGLRLVMS HGPYIKLITG
301  FLFTSLAFML VEGNFVLFCT YTLGFRNEFQ NLLLAIMLSA TLTIPIWQWF LTRFGKKTAV
361  YVGISSAVPF LILVALMESN LIITYAVAVA AGISVAAAFL LPWSMLPDVI DDFHLKQPHF
421  HGTEPIFFSF YVFFTKFASG VSLGISTLSL DFAGYQTRGC SQPERVKFTL NMLVTMAPIV
481  LILLGLLLFK MYPIDEERRR QNKKALQALR DEASSSGCSE TDSTELASIL
C.核苷酸及氨基酸组合序列(SEQ ID NO:9)
克隆号:PP9177
起始编码子:138ATG      终止编码子:1728TAG
蛋白质分子量:58620.36
  1   GC GTC TGC CAG CCG GCT TGG CTA GCG CGC GGC GGC CGT GGC TAA GGC     47
 48  TGC TAC GAA GCG AGC TTG GGA GGA GCA GCG GCC TGC GGG GCA GAG GAG     95
 96  CAT CCC GTC TAC CAG GTC CCA AGC GGC CGT GGC CCG CGG GTC ATG GCC    143
  1                                                          Met Ala      2
144  AAA GGA GAA GGC GCC GAG AGC GGC TCC GCG GCG GGG CTG GTA CCC ACC    191
  3  Lys Gly Glu Gly Ala Glu Ser Gly Ser Ala Ala Gly Leu Leu Pro Thr     18
192  AGC ATC CTC CAA AGC ACT GAA CGC CCG GCC CAG GTG AAG AAA GAA CCG    239
 19  Ser Ile Leu Gln Ser Thr Glu Arg Pro Ala Gln Val Lys Lys Glu Pro     34
240  AAA AAG AAG AAA CAA CAG TTG TCT GTT TGC AAC AAG CTT TGC TAT GCA    287
 35  Lys Lys Lys Lys Gln Gln Leu Ser Val Cys Asn Lys Leu Cys Tyr Ala     50
288  CTT GGG GGA GCC CCC TAC CAG GTG ACG GGC TGT GCC CTG GGT TTC TTC    335
 51  Leu Gly Gly Ala Pro Tyr Gln Val Thr Gly Cys Ala Leu Gly Phe Phe     66
336  CTT CAG ATC TAC CTA TTG GAT GTG GCT CAG GTG GGC CCT TTC TCT GCC    383
 67  Leu Gln Ile Tyr Leu Leu Asp Val Ala Gln Val Gly Pro Phe Ser Ala     82
384  TCC ATC ATC CTG TTT GTG GGC CGA GCC TGG GAT GCC ATC ACA GAC CCC    431
 83  Ser Ile Ile Leu Phe Val Gly Arg Ala Trp Asp Ala Ile Thr Asp Pro     98
432  CTG GTG GGC CTC TGC ATC AGC AAA TCC CCC TGG ACC TGC CTG GGT CGC    479
 99  Leu Val Gly Leu Cys Ile Ser Lys Ser Pro Trp Thr Cys Leu Gly Arg    114
480  CTT ATG CCC TGG ATC ATC TTC TCC ACG CCC CTG GCC GTC ATT GCC TAC    527
115  Leu Met Pro Trp Ile Ile Phe Ser Thr Pro Leu Ala Val Ile Ala Tyr    130
528  TTC CTC ATC TGG TTC GTG CCC GAC TTC CCA CAC GGC CAG ACC TAT TGG    575
131  Phe Leu Ile Trp Phe Val Pro Asp Phe Pro His Gly Gln Thr Tyr Trp    146
576  TAC CTG CTT TTC TAT TGC CTC TTT GAA ACA ATG GTC ACG TGT TTC CAT    623
147  Tyr Leu Leu Phe Tyr Cys Leu Phe Glu Thr Met Val Thr Cys Phe His    162
624  GTT CCC TAC TCG GCT CTC ACC ATG TTC ATC AGC ACC GAG CAG ACT GAG    671
163  Val Pro Tyr Ser Ala Leu Thr Met Phe Ile Ser Thr Glu Gln Thr Glu    178
672  CGG GAT TCT GCC ACC GCC TAT CGG ATG ACT GTG GAA GTG CTG GGC ACA    719
179  Arg Asp Ser Ala Thr Ala Tyr Arg Met Thr Val Glu Val Leu Gly Thr    194
720  GTG CTG GGC ACG GCG ATC CAG GGA CAA ATC GTG GGC CAA GCA GAC ACG    767
195  Val Leu Gly Thr Ala Ile Gln Gly Gln Ile Val Gly Gln Ala Asp Thr    210
 768  CCT TGT TTC CAG GAC CTC AAT AGC TCT ACA GTA GCT TCA CAA AGT GCC     815
 211  Pro Cys Phe Gln Asp Leu Asn Ser Ser Thr Val Ala Ser Gln Ser Ala     226
 816  AAC CAT ACA CAT GGC ACC ACC TCA CAC AGG GAA ACG CAA AAG GCA TAC     863
 227  Asn His Thr His Gly Thr Thr Ser His Arg Glu Thr Gln Lys Ala Tyr     242
 864  CTG CTG GCA GCG GGG GTC ATT GTC TGT ATC TAT ATA ATC TGT GCT GTC     911
 243  Leu Leu Ala Ala Gly Val Ile Val Cys Ile Tyr Ile Ile Cys Ala Val     258
 912  ATC CTG ATC CTG GGC GTG CGG GAG CAG AGA GAA CCC TAT GAA GCC CAG     959
 259  Ile Leu Ile Leu Gly Val Arg Glu Gln Arg Glu Pro Tyr Glu Ala Gln     274
 960  CAG TCT GAG CCA ATC GCC TAC TTC CGG GGC CTA CGG CTG GTC ATG AGC    1007
 275  Gln Ser Glu Pro Ile Ala Tyr Phe Arg Gly Leu Arg Leu Val Met Ser     290
1008  CAC GGC CCA TAC ATC AAA CTT ATT ACT GGC TTC CTC TTC ACC TCC TTG    1055
 291  His Gly Pro Tyr Ile Lys Leu Ile Thr Gly Phe Leu Phe Thr Ser Leu     306
1056  GCT TTC ATG CTG GTG GAG GGG AAC TTT GTC TTG TTT TGC ACC TAC ACC    1103
 307  Ala Phe Met Leu Val Glu Gly Asn Phe Val Leu Phe Cys Thr Tyr Thr     322
1104  TTG GGC TTC CGC AAT GAA TTC CAG AAT CTA CTC CTG GCC ATC ATG CTC    1151
 323  Leu Gly Phe Arg Asn Glu Phe Gln Asn Leu Leu Leu Ala Ile Met Leu     338
1152  TCG GCC ACT TTA ACC ATT CCC ATC TGG CAG TGG TTC TTG ACC CGG TTT    1199
 339  Ser Ala Thr Leu Thr Ile Pro Ile Trp Gln Trp Phe Leu Thr Arg Phe     354
1200  GGC AAG AAG ACA GCT GTA TAT GTT GGG ATC TCA TCA GCA GTG CCA TTT    1247
 355  Gly Lys Lys Thr Ala Val Tyr Val Gly Ile Ser Ser Ala Val Pro Phe     370
1248  CTC ATC TTG GTG GCC CTC ATG GAG AGT AAC CTC ATC ATT ACA TAT GCG    1295
 371  Leu Ile Leu Val Ala Leu Met Glu Ser Asn Leu Ile Ile Thr Tyr Ala     386
1296  GTA GCT GTG GCA GCT GGC ATC AGT GTG GCA GCT GCC TTC TTA CTA CCC    1343
 387  Val Ala Val Ala Ala Gly Ile Ser Val Ala Ala Ala Phe Leu Leu Pro     402
1344  TGG TCC ATG CTG CCT GAT GTC ATT GAC GAC TTC CAT CTG AAG CAG CCC    1391
 403  Trp Ser Met Leu Pro Asp Val Ile Asp Asp Phe His Leu Lys Gln Pro     418
1392  CAC TTC CAT GGA ACC GAG CCC ATC TTC TTC TCC TTC TAT GTC TTC TTC    1439
 419  His Phe His Gly Thr Glu Pro Ile Phe Phe Ser Phe Tyr Val Phe Phe     434
1440  ACC AAG TTT GCC TCT GGA GTG TCA CTG GGC ATT TCT ACC CTC AGT CTG    1487
 435  Thr Lys Phe Ala Ser Gly Val Ser Leu Gly Ile Ser Thr Leu Ser Leu     450
1488  GAC TTT GCA GGG TAC CAG ACC CGT GGC TGC TCG CAG CCG GAA CGT GTC    1535
 451  Asp Phe Ala Gly Tyr Gln Thr Arg Gly Cys Ser Gln Pro Glu Arg Val     466
1536  AAG TTT ACA CTG AAC ATG CTC GTG ACC ATG GCT CCC ATA GTT CTC ATC    1583
 467  Lys Phe Thr Leu Asn Met Leu Val Thr Met Ala Pro Ile Val Leu Ile     482
1584  CTG CTG GGC CTG CTG CTC TTC AAA ATG TAC CCC ATT GAT GAG GAG AGG    1631
 483  Leu Leu Gly Leu Leu Leu Phe Lys Met Tyr Pro Ile Asp Glu Glu Arg     498
1632  CGG CGG CAG AAT AAG AAG GCC CTG CAG GCA CTG AGG GAC GAG GCC AGC    1679
 499  Arg Arg Gln Asn Lys Lys Ala Leu Gln Ala Leu Arg Asp Glu Ala Ser     514
1680  AGC TCT GGC TGC TCA GAA AGA GAG TCG AGA GAG GTG GCT AGC ATC CTC    1727
 515  Ser Ser Gly Cys Ser Glu Thr Asp Ser Thr Glu Leu Ala Ser Ile Leu     530
1728  TAG GGC CCG CCA CGT TGC CCG AAG CCA CCA TGC AGA AGG CCA CAG AAG    1775
 531  ***                                                                 531
1776  GGA TCA GGA CCT GTC TGC CGG CTT GCT GAG CAG CTG GAC TGC AGG TGC    1823
1824  TAG GAA GGG AAC TGA AGA CTC AAG GAG GTG GCC CAG GAC ACT TGC TGT    1871
1872  GCT CAC TGT GGG GCC GGC TGC TCT GTG GCC TCC TGC CTC CCC TCT GCC    1919
1920  TGC CTG TGG GGC CAA GCC CTG GGG CTG CCA CTG TGA ATA TGC CAA GGA    1967
1968  CTG ATC GGG CCT AGC CCG GAA CAC TAA TGT AGA AAC CTT TTT TTT ACA    2015
2016  GAG CCT AAT TAA TAA CTT AAT GAC TGT GTA CAT AGC AAT GTG TGT GTA    2063
2064  TGT ATA TGT CTG TGA GCT ATT AAT GTT ATT AAT TTT CAT AAA AGC TGG    2111
2112  AAA GCA AAA AAA AAA AAA AAA AAA AAA AAA AAA AAA AAA AAA AAA AAA    2159
2160  A                                                                  2160
4.PP9445
A:核苷酸序列(SEQ ID NO:10)长度:1831bp
   1  GCCGCCGCGG AGCGAGGTTG ACTGGAGAGA GCGCCTGGGC GCAGAAGGGT TAACGGGCCA
  61  CCGGGGGCTC GCAGAGCAGG AGGGTGCTCT CGGACGGTGT GTCCCCCACT GCACTCCTGA
 121  ACTTGGAGGA CAGGGTCGCC GCGAGGGACG CAGGTGGGTG CCCTTGATCC AGCTCAGCCC
 181  GATGGCAGAA GAGGTTGACA AAAAAGAAAG ACACCTGTTG GGGTGGCCTG CCAGACCCAG
 241  GAGTGGAGGG CTCTGTGAGG GCCCGGGAAT TCGGACTCAG GACAGGGATT CTCCATGGCT
 301  AGGCCCAGAA ACACAGGGTC CAACCACTCT CCAGCAGGGA GACCTGGGGG TGAAGGGGTG
 361  AGCCCTGCGC AGGTCTCTGT TCCTTGGTCT TCACTGGGCA GTGTGGAGAG GTGTGGCCAG
 421  GAGGAGCCCG CGTTTGTCCA GACCAGGGTC TACTCTGGCA CCAGAGTGAC CACCTCTGAC
 481  CTCTCCTTTC CTCGTCCTGG GCCGGGAACG ACACCAAATG AGGGACATGG AAAGGGCTGG
 541  AGTAACAAGA GTCAGGCAGA GCCTGAAGAC TTGGGTGGAA CATGGGCCCT TCTCTGGAGA
 601  TCCTGGCCTC CCCCGTTCAG TCAGGGTGGA GTTGCTGACC TTAGTGGCCG GCCCAGCCAG
 661  GGGAAGGAGT GGCCATCGGC AACCCCCACC CCAACCCCAA TCCCTGAGGC GCCCGCTCTG
 721  GCTCAGCCAC TCTGACCCCT CCCTCAAATT CCGAACCCTA GGTCTCAGGG AGGGCAGTGG
 781  GGCTGAGTGT CTGCCCCCAG GCACATTCCT ACCCTTCTCT TGGTCATTTT CTGCCCCAGA
 841  GCTGGCCCAC CTCAGCAATG CGAGGGCTCC CTGGATTCCT CTCCCGGGTG CCTTTCAGAT
 901  CCAACAGAAA CAGATTTTTT TTTTCCTGGA AAGCAGAACT AAGAGTGGGA TGAGGAGCAG
 961  GGGTGGGAAG GACTCAAAGT GAGAAGAAGG GGGCAAAGAG AGTCAGGCTT GGTGGCTGGG
1021  GTGGCTTCCA AGCCTCACTT CTCCAGTGTT CAAAGCTGAA CTTCAGATGG ACTTCCCGGC
1081  TCTTCAGAAT GAGAGGCCTG TGGCTGGGGC ATGAGGCAGC CCCGGCTGCA CCTCTCCTTC
1141  CCGCTTCCCC AGCTGGTAGA GACGCACAGG AAACAAGCCC TCACTGAACC AACTCCAGAT
1201  GCTGGCACCC AGAGTGGGTG TTACATTGCC GGCTTCTTCT CTAGAGATTA AACCGTCAAC
1261  CCATTTAGCT TATCCCTTGG CCAAAAAGTG TATGAGATGT GCCTGGATGT TCCCTAAAGA
1321  GCTTATCTAA GAAGGGAAGA GAAAGCCGGG AGGCAAGTAG GACAGAGAGA TGACTGGGGA
1381  AGGTCTTGTG TCTGGAAGAC CCAAGGAAGG GGCTTCTGGT GGGTCCTCAG AGAGAGTGTC
1441  TGGCGCATCC TCAGTGGAGC CTTCCTCCTC TACTTTCTAG GCACCTCTGG GAGGGCAGGA
1501  GTGGGAGCAG ATGACAACCA TTTTAGAAGG AGCCCTCTGG CTGGGTGCGG TGGCTCACAC
1561  CTGTCATCCC AGCACTTTGG GAGGCCAAGG CAGGAGAAGC GCTTGAGGCC TGGAGTTCAA
1621  GACCAGCCTG TGCAATTTAG CTGGATCCCA TCTCCACCAA AAAATACCAA AATTAGCTGG
1681  GTGTGGTGGT GCACGCATGT AGTCCCACCT ACTCAGGAGG CTGAGGAAGG AGAGCCTGTG
1741  AGTTTGAGGC TGCAATGAGC TTTGGTGGCA CCACTGCCCT CCAGCCTGGA TGACAGAGTG
1801  AGATCTCCAT CTCAAAAAAA AAAAAAAAAA A
B:氨基酸序列(SEQ ID NO:11)长度:154个氨基酸
 1  MRDMERAGVT RVRQSLKTWV EHGPFSGDPG LPRSVRVELL TLVAGPARGR SGHRQPPPQP
61  QSLRRPLWLS HSDPSLKFRT LGLREGSGAE CLPPGTFLPF SWSFSAPELA HLSNARAPWI121  PLPGAFQIQQ KQIFFFLESR TKSGMRSRGG KDSK
C.核苷酸及氨基酸组合序列(SEQ ID NO:12)
克隆号:PP9445
起始编码子:518ATG      终止编码子:980TGA
蛋白质分子量:17150.75
  1    G CCG CCG CGG AGC GAG GTT GAC TGG AGA GAG CGC CTG GGC GCA GAA     46
 47  GGG TTA ACG GGC CAC CGG GGG CTC GCA GAG CAG GAG GGT GCT CTC GGA     94
 95  CGG TGT GTC CCC CAC TGC ACT CCT GAA CTT GGA GGA CAG GGT CGC CGC    142
143  GAG GGA CGC AGG TGG GTG CCC TTG ATC CAG CTC AGC CCG ATG GCA GAA    190
191  GAG GTT GAC AAA AAA GAA AGA CAC CTG TTG GGG TGG CCT GCC AGA CCC    238
239  AGG AGT GGA GGG CTC TGT GAG GGC CCG GGA ATT CGG ACT CAG GAC AGG    286
287  GAT TCT CCA TGG CTA GGC CCA GAA ACA CAG GGT CCA ACC ACT CTC CAG    334
335  CAG GGA GAC CTG GGG GTG AAG GGG TGA GCC CTG CGC AGG TCT CTG TTC    382
383  CTT GGT CTT CAC TGG GCA GTG TGG AGA GGT GTG GCC AGG AGG AGC CCG    430
431  CGT TTG TCC AGA CCA GGG TCT ACT CTG GCA CCA GAG TGA CCA CCT CTG    478
479  ACC TCT CCT TTC CTC GTC CTG GGC CGG GAA CGA CAC CAA ATG AGG GAC    526
  1                                                      Met Arg Asp      3
527  ATG GAA AGG GCT GGA GTA ACA AGA GTC AGG CAG AGC CTG AAG ACT TGG    574
  4  Met Glu Arg Ala Gly Val Thr Arg Val Arg Gln Ser Leu Lys Thr Trp     19
575  GTG GAA CAT GGG CCC TTC TCT GGA GAT CCT GGC CTC CCC CGT TCA GTC    622
 20  Val Glu His Gly Pro Phe Ser Gly Asp Pro Gly Leu Pro Arg Ser Val     35
623  AGG GTG GAG TTG CTG ACC TTA GTG GCC GGC CCA GCC AGG GGA AGG AGT    670
 36  Arg Val Glu Leu Leu Thr Leu Val Ala Gly Pro Ala Arg Gly Arg Ser     51
671  GGC CAT CGG CAA CCC CCA CCC CAA CCC CAA TCC CTG AGG CGC CCG CTC    718
 52  Gly His Arg Gln Pro Pro Pro Gln Pro Gln Ser Leu Arg Arg Pro Leu     67
719  TGG CTC AGC CAC TCT GAC CCC TCC CTC AAA TTC CGA ACC CTA GGT CTC    766
 68  Trp Leu Ser His Ser Asp Pro Ser Leu Lys Phe Arg Thr Leu Gly Leu     83
767  AGG GAG GGC AGT GGG GCT GAG TGT CTG CCC CCA GGC ACA TTC CTA CCC    814
 84  Arg Glu Gly Ser Gly Ala Glu Cys Leu Pro Pro Gly Thr Phe Leu Pro     99
815  TTC TCT TGG TCA TTT TCT GCC CCA GAG CTG GCC CAC CTC AGC AAT GCG    862
100  Phe Ser Trp Ser Phe Ser Ala Pro Glu Leu Ala His Leu Ser Asn Ala    115
863  AGG GCT CCC TGG ATT CCT CTC CCG GGT GCC TTT CAG ATC CAA CAG AAA    910
116  Arg Ala Pro Trp Ile Pro Leu Pro Gly Ala Phe Gln Ile Gln Gln Lys    131
 911  CAG ATT TTT TTT TTC CTG GAA AGC AGA ACT AAG AGT GGG ATG AGG AGC     958
 132  Gln Ile Phe Phe Phe Leu Glu Ser Arg Thr Lys Ser Gly Met Arg Ser     147
 959  AGG GGT GGG AAG GAC TCA AAG TGA GAA GAA GGG GGC AAA GAG AGT CAG    1006
 148  Arg Gly Gly Lys Asp Ser Lys ***                                     155
1007  GCT TGG TGG CTG GGG TGG CTT CCA AGC CTC ACT TCT CCA GTG TTC AAA    1054
1055  GCT GAA CTT CAG ATG GAC TTC CCG GCT CTT CAG AAT GAG AGG CCT GTG    1102
1103  GCT GGG GCA TGA GGC AGC CCC GGC TGC ACC TCT CCT TCC CGC TTC CCC    1150
1151  AGC TGG TAG AGA CGC ACA GGA AAC AAG CCC TCA CTG AAC CAA CTC CAG    1198
1199  ATG CTG GCA CCC AGA GTG GGT GTT ACA TTG CCG GCT TCT TCT CTA GAG    1246
1247  ATT AAA CCG TCA ACC CAT TTA GCT TAT CCC TTG GCC AAA AAG TGT ATG    1294
1295  AGA TGT GCC TGG ATG TTC CCT AAA GAG CTT ATC TAA GAA GGG AAG AGA    1342
1343  AAG CCG GGA GGC AAG TAG GAC AGA GAG ATG ACT GGG GAA GGT CTT GTG    1390
1391  TCT GGA AGA CCC AAG GAA GGG GCT TCT GGT GGG TCC TCA GAG AGA GTG    1438
1439  TCT GGC GCA TCC TCA GTG GAG CCT TCC TCC TCT ACT TTC TAG GCA CCT    1486
1487  CTG GGA GGG CAG GAG TGG GAG CAG ATG ACA ACC ATT TTA GAA GGA GCC    1534
1535  CTC TGG CTG GGT GCG GTG GCT CAC ACC TGT CAT CCC AGC ACT TTG GGA    1582
1583  GGC CAA GGC AGG AGA AGC GCT TGA GGC CTG GAG TTC AAG ACC AGC CTG    1630
1631  TGC AAT TTA GCT GGA TCC CAT CTC CAC CAA AAA ATA CCA AAA TTA GCT    1678
1679  GGG TGT GGT GGT GCA CGC ATG TAG TCC CAC CTA CTC AGG AGG CTG AGG    1726
1727  AAG GAG AGC CTG TGA GTT TGA GGC TGC AAT GAG CTT TGG TGG CAC CAC    1774
1775  TGC CCT CCA GCC TGG ATG ACA GAG TGA GAT CTC CAT CTC AAA AAA AAA    1822
1823  AAA AAA AAA                                                        1831
5.PP10199
A:核苷酸序列(SEQ ID NO:13)长度:1739bp
   1  GTTCCAGAGC CACTTTTAAG ATTCTTCAAT TCCAAATGCA TGTCTTTTTT TAAAAAAAAG
  61  AAAGAAAGAA AAATAAGTTT CTAATATTAG AGAAGTACAG CCCTGAATTG GGTTTTGTGT
 121  CCACTGCTGG ACCCCATGAG GGCCAGGTGG AGTGGACCTC TGCAGCCCCA GTTGTGTGCA
 181  CTCTCTGTTT GGTGCAAATT CCAGTTTGCT GGTTCTCAAT AGCAAGACCA GCCTGAGACC
 241  ACCTGTCCTG CTCTTCCCAT GAGAGGGCCG AATGCTCCCA GCCTCCATGC CATGTCCTGT
 301  TCCTGGGGTC CTGGGGGTCA TTGCAGCCTG TATGTGCTTC CTCCAGCCAG GGTGATCATC
 361  GGGTGCCCCA GTGAGCCCCA GCACTGAGGG TCAGCCCCAG GCACTGTCAA AGGTGAGAGC
 421  TCAGAGGCTG TGCCCAGAAA GAGAGGTGGG CCCTGCCTGC CCTGGACGGA GGGAGAGAGG
 481  CTTCTCAGAG CCCGAGGCAT GAACCCTCAG GTGGGTCGTG GCCATAGTCA GATGATGGCT
 541  GCTGGTGAGC TCAGTGACCA GGCGTCTTCA GGCAGCTCAT AAGTTTGAGA GGACACAGCC
 601  TAAGGGAGGT TTGCTGGGGA GTAGCCCCAC TTCCACCCTG AATAGACAAG AGATGGTAAA
 661  GCAGGTACCC AGCACTTAGT GCTTTCTTGG GGATATCGCG TGGGTCCCCG GGGGCCTGGG
 721  TGCCCGAAGT GCCGCAGTAC TCCATGGTGC AGAGAGCTTG CTCCTGTGGA GGAAGTGTCT
 781  ATGTGGTCCC CAGCTCCTCT GTCTGCCTGT CCACTGAGGG GCACCCATGG CTCAGCAGAA
 841  GGGCTATTCT TGGGGTTCCC GGTCCTCCTC CAGCCCCGCT AATCTGTGTA GGCCTCAAGT
 901  GCTGTGTGTT TGTAAGCATT GTCATCCACA GTCCTATTGT ACGAGCTGGT TCACCCGCAG
 961  CTCTGAGCTG CTCTCCAGCC CCAGCCCTTT CTTCCTGTGC CCCTACCCCC GCTGGGATGA
1021  CTCTCCTCAC CCTCCCTGGG GCGACAACCG CCCTGTCTGT AATGAGTGGC AGTCCCAAGC
1081  TTCCTGACTG GCTTCCGCAG CTCTCTGACT CCCCTAAACA AGGCCTCAGG GACTCCACAT
1141  CCAAATTAAG GCGGCACCTG GTGGCAGGTT GGCATTTTCC GGTGTCCTAT CTATGAAAGA
1201  CAGGAAGACA GCTGGGAGCA AACTCCCCTG GGCCAGACTC TTGGAAACAT AAAGGCTTGG
1261  GTGCCCAGCT GGGGACCGGG AGAAAGTCTA AAACACGGGA CTGGGCCAAG GACCCCACAG
1321  GTCCCTGTCT CATTAGGTCC CCTGAAACGT GTGGAAGCTA AAATGGCATT CACGTGATTC
1381  TTGATCATTT AACAGTGGAT TCTGATCTGA TACTACACTG AGAAGTGCCC CTGGGCCGGG
1441  CGCGGTGGCT CACGCCTGTA ATCCCAGCAC TTTGGGAGGC CGAGGCGGGC GGATCACAAG
1501  GAGATTGAGA CCATCCTGGC TAACACGGTG AAACCCTGTC TCTACTAAAA ATACAAAAAA
1561  TTAGCCAGGC ATGGTGGCAG GCGCCTCTAG TACTAGCTAC TCGGGAGGCT GAGGCAGGAG
1621  AATGGTGTGA ACCCGGGAGG CGGAACTTGC AGTGAGCCAA GATTGTGCCA CTGCACTCTA
1681  GCATGGGCGA CAGAGCAAGA CTCAGTCTCA AAAAAAAAAA AAAAAAAAAA AAAAAAAAA
B:氨基酸序列(SEQ ID NO:14)长度:150个氨基酸
  1  MVQRACSCGG SVYVVPSSSV CLSTEGHPWL SRRAILGVPG PPPAPLICVG LKCCVFVSIV
 61  IHSPIVRAGS PAALSCSPAP ALSSCAPTPA GMTLLTLPGA TTALSVMSGS PKLPDWLPQL
121  SDSPKQGLRD STSKLRRHLV AGWHFPVSYL
C.核苷酸及氨基酸组合序列(SEQ ID NO:15)
克隆号:PP10199
起始编码子:744ATG      终止编码子:1194TGA
蛋白质分子量:15496.34
   1   GT TCC AGA GCC ACT TTT AAG ATT CTT CAA TTC CAA ATG CAT GTC TTT      47
  48  TTT TAA AAA AAA GAA AGA AAG AAA AAT AAG TTT CTA ATA TTA GAG AAG      95
  96  TAC AGC CCT GAA TTG GGT TTT GTG TCC ACT GCT GGA CCC CAT GAG GGC     143
 144  CAG GTG GAG TGG ACC TCT GCA GCC CCA GTT GTG TGC ACT CTC TGT TTG     191
 192  GTG CAA ATT CCA GTT TGC TGG TTC TCA ATA GCA AGA CCA GCC TGA GAC     239
 240  CAC CTG TCC TGC TCT TCC CAT GAG AGG GCC GAA TGC TCC CAG CCT CCA     287
 288  TGC CAT GTC CTG TTC CTG GGG TCC TGG GGG TCA TTG CAG CCT GTA TGT     335
 336  GCT TCC TCC AGC CAG GGT GAT CAT CGG GTG CCC CAG TGA GCC CCA GCA     383
 384  CTG AGG GTC AGC CCC AGG CAC TGT CAA AGG TGA GAG CTC AGA GGC TGT     431
 432  GCC CAG AAA GAG AGG TGG GCC CTG CCT GCC CTG GAC GGA GGG AGA GAG     479
 480  GCT TCT CAG AGC CCG AGG CAT GAA CCC TCA GGT GGG TCG TGG CCA TAG     527
 528  TCA GAT GAT GGC TGC TGG TGA GCT CAG TGA CCA GGC GTC TTC AGG CAG     575
 576  CTC ATA AGT TTG AGA GGA CAC AGC CTA AGG GAG GTT TGC TGG GGA GTA     623
 624  GCC CCA CTT CCA CCC TGA ATA GAC AAG AGA TGG TAA AGC AGG TAC CCA     671
 672  GCA CTT AGT GCT TTC TTG GGG ATA TCG CGT GGG TCC CCG GGG GCC TGG     719
 720  GTG CCC GAA GTG CCG CAG TAC TCC ATG GTG CAG AGA GCT TGC TCC TGT     767
   1                                  Met Val Gln Arg Ala Cys Ser Cys       8
 768  GGA GGA AGT GTC TAT GTG GTC CCC AGC TCC TCT GTC TGC CTG TCC ACT     815
   9  Gly Gly Ser Val Tyr Val Val Pro Ser Ser Ser Val Cys Leu Ser Thr      24
 816  GAG GGG CAC CCA TGG CTC AGC AGA AGG GCT ATT CTT GGG GTT CCC GGT     863
 25   Glu Gly His Pro Trp Leu Ser Arg Arg Ala Ile Leu Gly Val Pro Gly      40
 864  CCT CCT CCA GCC CCG CTA ATC TGT GTA GGC CTC AAG TGC TGT GTG TTT     911
  41  Pro Pro Pro Ala Pro Leu Ile Cys Val Gly Leu Lys Cys Cys Val Phe      56
 912  GTA AGC ATT GTC ATC CAC AGT CCT ATT GTA CGA GCT GGT TCA CCC GCA     959
  57  Val Ser Ile Val Ile His Ser Pro Ile Val Arg Ala Gly Ser Pro Ala      72
 960  GCT CTG AGC TGC TCT CCA GCC CCA GCC CTT TCT TCC TGT GCC CCT ACC    1007
  73  Ala Leu Ser Cys Ser Pro Ala Pro Ala Leu Ser Ser Cys Ala Pro Thr      88
1008  CCC GCT GGG ATG ACT CTC CTC ACC CTC CCT GGG GCG ACA ACC GCC CTG    1055
  89  Pro Ala Gly Met Thr Leu Leu Thr Leu Pro Gly Ala Thr Thr Ala Leu     104
1056  TCT GTA ATG AGT GGC AGT CCC AAG CTT CCT GAC TGG CTT CCG CAG CTC    1103
 105  Ser Val Met Ser Gly Ser Pro Lys Leu Pro Asp Trp Leu Pro Gln Leu     120
1104  TCT GAC TCC CCT AAA CAA GGC CTC AGG GAC TCC ACA TCC AAA TTA AGG    1151
 121  Ser Asp Ser Pro Lys Gln Gly Leu Arg Asp Ser Thr Ser Lys Leu Arg     136
1152  CGG CAC CTG GTG GCA GGT TGG CAT TTT CCG GTG TCC TAT CTA TGA AAG    1199
 137  Arg His Leu Val Ala Gly Trp His Phe Pro Val Ser Tyr Leu ***         151
1200  ACA GGA AGA CAG CTG GGA GCA AAC TCC CCT GGG CCA GAC TCT TGG AAA    1247
1248  CAT AAA GGC TTG GGT GCC CAG CTG GGG ACC GGG AGA AAG TCT AAA ACA    1295
1296  CGG GAC TGG GCC AAG GAC CCC ACA GGT CCC TGT CTC ATT AGG TCC CCT    1343
1344  GAA ACG TGT GGA AGC TAA AAT GGC ATT CAC GTG ATT CTT GAT CAT TTA    1391
1392  ACA GTG GAT TCT GAT CTG ATA CTA CAC TGA GAA GTG CCC CTG GGC CGG    1439
1440  GCG CGG TGG CTC ACG CCT GTA ATC CCA GCA CTT TGG GAG GCC GAG GCG    1487
1488  GGC GGA TCA CAA GGA GAT TGA GAC CAT CCT GGC TAA CAC GGT GAA ACC    1535
1536  CTG TCT CTA CTA AAA ATA CAA AAA ATT AGC CAG GCA TGG TGG CAG GCG    1583
1584  CCT CTA GTA CTA GCT ACT CGG GAG GCT GAG GCA GGA GAA TGG TGT GAA    1631
1632  CCC GGG AGG CGG AAC TTG CAG TGA GCC AAG ATT GTG CCA CTG CAC TCT    1679
1680  AGC ATG GGC GAC AGA GCA AGA CTC AGT CTC AAA AAA AAA AAA AAA AAA    1727
1728  AAA AAA AAA AAA                                                    1739
6.PP10226
A:核苷酸序列(SEQ ID NO:16)长度:1012bp
  1  GTGAGAGAGG GGTTTGGAAA TACCAGACTA TAATTGTGGA TTTGTCCATT ACTCCTTTCA
 61  GTTCTAGCAG TTTTTGCTTC TTGTGTTTTG AAGCTCTGTT ATTTGATAAA AATTTTTAGA
121  ATTTTTAATG TTTATTTTAG AATGTATAAA ATTTTAGAAT TTATATGGAT AAATTGAATC
181  CTCTATCATT ATAACATTAT GTTCTTTATG CCTGTAATAT TTTTTGCTGC AAAATCTACT
241  GTCTTAAATA ATATAGACAC AACAGCCTGA TTAGTGTTTG CATAGTACAT CTTCCCCTTC
301  TTCCATTGTT TTACATTTAG CCTATTTGTG CTTTAAAAAA ATTTAAGTAC CTATATTGTA
361  GGCAGCATAG AGTTGGATCT TGTTTTATTA ATGCACCCTG TTTTGAGAGA GAGAGAGAGA
421  GAGACAGAGA CAGAGACACA GAGAGAGAGT GTGAGCGAGC AAAAGAGATT TATTCTGGTT
481  TTTTTTTGTT TGTTTTTGAG ATGGAGTCTT GCTCTCTTGC TCAGGCTGGA GTGCAGTGGC
541  GCAATCTCAG CTCACTGCAA CCTCCACCTC CTGGGTTCAA GTTATTCTCC TGTCTCAGCC
601  TCCCAAGTAG CTGGGACTAC AGGCCTGTGC CACCATGCCC GGCTACGTTT TGTATTTTTA
661  GTACAGACGG TGTTTCACCA TGTTGGCCAG GCTGGTCTCA AACTCCTGGC CTCAAGTTGA
721  TCTGCTGGCC TCACGCCTGT AATCCTAGTA CTTTGGGAGG CCGAGGCGGG CGGATCTCGA
781  GTTCAGGAGA TCGACCATCC TGGCTAACAC GGTGAAACCT CGTCTCTACT AAAAATACAA
841  AAAATTAGCC GGGCATGGTG GTGGGCACCC GTAGTCCCAG CTACTTGGGA GGCTGAGGCA
901  GGAGAATGGC ATGAATCCAG TAGGCGGAGC TTGCAGTGAG CCAAGATCAC GCCACTGCAC
961  TCCAGCCTGG GTGACAGAGC GAGACTTTGT CTCAAAAAAA AAAAAAAAAA AA
B:氨基酸序列(SEQ ID NO:17)长度:109个氨基酸
 1  MHPVLRERER ETETETQRES VSEQKRFILV FFCLFLRWSL ALLLRLECSG AISAHCNLHL
61  LGSSYSPVSA SQVAGTTGLC HHARLRFVFL VQTVFHHVGQ AGLKLLASS
C.核苷酸及氨基酸组合序列(SEQ ID NO:18)
克隆号:PP10226
起始编码子:391ATG      终止编码子:718TGA
蛋白质分子量:12262.59
   1  GTG AGA GAG GGG TTT GGA AAT ACC AGA CTA TAA TTG TGG ATT TGT CCA      48
  49  TTA CTC CTT TCA GTT CTA GCA GTT TTT GCT TCT TGT GTT TTG AAG CTC      96
  97  TGT TAT TTG ATA AAA ATT TTT AGA ATT TTT AAT GTT TAT TTT AGA ATG     144
 145  TAT AAA ATT TTA GAA TTT ATA TGG ATA AAT TGA ATC CTC TAT CAT TAT     192
 193  AAC ATT ATG TTC TTT ATG CCT GTA ATA TTT TTT GCT GCA AAA TCT ACT     240
 241  GTC TTA AAT AAT ATA GAC ACA ACA GCC TGA TTA GTG TTT GCA TAG TAC     288
 289  ATC TTC CCC TTC TTC CAT TGT TTT ACA TTT AGC CTA TTT GTG CTT TAA     336
 337  AAA AAT TTA AGT ACC TAT ATT GTA GGC AGC ATA GAG TTG GAT CTT GTT     384
 385  TTA TTA ATG CAC CCT GTT TTG AGA GAG AGA GAG AGA GAG ACA GAG ACA     432
   1          Met His Pro Val Leu Arg Glu Arg Glu Arg Glu Thr Glu Thr      14
 433  GAG ACA CAG AGA GAG AGT GTG AGC GAG CAA AAG AGA TTT ATT CTG GTT     480
  15  Glu Thr Gln Arg Glu Ser Val Ser Glu Gln Lys Arg Phe Ile Leu Val      30
 481  TTT TTT TGT TTG TTT TTG AGA TGG AGT CTT GCT CTC TTG CTC AGG CTG     528
  31  Phe Phe Cys Leu Phe Leu Arg Trp Ser Leu Ala Leu Leu Leu Arg Leu      46
 529  GAG TGC AGT GGC GCA ATC TCA GCT CAC TGC AAC CTC CAC CTC CTG GGT     576
  47  Glu Cys Ser Gly Ala Ile Ser Ala His Cys Asn Leu His Leu Leu Gly      62
 577  TCA AGT TAT TCT CCT GTC TCA GCC TCC CAA GTA GCT GGG ACT ACA GGC     624
  63  Ser Ser Tyr Ser Pro Val Ser Ala Ser Gln Val Ala Gly Thr Thr Gly      78
 625  CTG TGC CAC CAT GCC CGG CTA CGT TTT GTA TTT TTA GTA CAG ACG GTG     672
  79  Leu Cys His His Ala Arg Leu Arg Phe Val Phe Leu Val Gln Thr Val      94
 673  TTT CAC CAT GTT GGC CAG GCT GGT CTC AAA CTC CTG GCC TCA AGT TGA     720
  95  Phe His His Val Gly Gln Ala Gly Leu Lys Leu Leu Ala Ser Ser ***     110
 721  TCT GCT GGC CTC ACG CCT GTA ATC CTA GTA CTT TGG GAG GCC GAG GCG     768
 769  GGC GGA TCT CGA GTT CAG GAG ATC GAC CAT CCT GGC TAA CAC GGT GAA     816
 817  ACC TCG TCT CTA CTA AAA ATA CAA AAA ATT AGC CGG GCA TGG TGG TGG     864
 865  GCA CCC GTA GTC CCA GCT ACT TGG GAG GCT GAG GCA GGA GAA TGG CAT     912
 913  GAA TCC AGT AGG CGG AGC TTG CAG TGA GCC AAG ATC ACG CCA CTG CAC     960
 961  TCC AGC CTG GGT GAC AGA GCG AGA CTT TGT CTC AAA AAA AAA AAA AAA    1008
1009  AAA A                                                              1012
7.SP2114a
A:核苷酸序列(SEQ ID NO:19)长度:2546bp
  1  GGCCAGTCAA GATGGCCGCC GCTGGGTGAG GCAAGCTGGC GCGCCGCGGG GGCGTCTGGG
 61  AGTTGTAGTT CGGGACGGCG GGCTGACGCA CTTCGCCGCC GGCCGACGGG CGCCATTGTG
121  CGGCGCGCGC CGGGACTCTG CCCACTTCCA CCAGAGACAC ATTGAGAAGG AGGAAACTAT
181  GGCCTCCAGG CTTCCGACGG CCTGGTCCTG TGAACCAGAG ACCTTTGAAG ATGTAACACT
241  GGGTTTTACC CCGGAAGAGT GGGGACTGCT GGACCTCAAA CAGAAGTCCC TGTACAGGGA
301  AGTGATGCTG GAGAACTACA GGAACCTGGT CTCAGTGGAA CATCAGCTTT CCAAACCAGA
361  TGTGGTATCT CAGTTAGAGG AGGCAGAAGA TTTCTGGCCA GTGGAGAGAG GAATTCCTCA
421  AGACACCATT CCTGAGTATC CTGAGCTCCA GCTGGACCCT AAATTGGATC CTCTTCCTGC
481  TGAGAGTCCC CTAATGAACA TTGAGGTTGT TGAGGTCCTC ACACTGAACC AGGAGGTGGC
 541  TGGTCCCCGG AATGCCCAGA TCCAGGCCCT ATATGCTGAA GATGGAAGCC TGAGTGCAGA
 601  TGCCCCCAGT GAGCAGATCC AACAGCAGGG CAAGCATCCA GGTGACCCTG AGGCCGCGCG
 661  CCAGAGGTTC CGGCAGTTCC GTTATAAGGA CATGACAGGT CCCCGGGAGG CCCTGGACCA
 721  GCTCCGAGAG CTGTGTCACC AGTGGCTACA GCCTAAGGCA CGCTCCAAGG AGCAGATCCT
 781  GGAGCTGCTG GTGCTGGAGC AGTTCCTAGG TACACTGCCT GTGAAGCTCC GGACATGGGT
 841  GGAATCGCAG CACCCAGAGA ACTGCCAAGA GGTGGTGGCC CTGGTAGAGG GTGTGACCTG
 901  GATGTCTGAG GAGGAAGTAC TTCCTGCAGG ACAACCTGCC GAGGGCACCA CCTGCTGCCT
 961  CGAGGTCACT GCCCAGCAGG AGGAGAAGCA GGAGGATGCA GCCATCTGCC CAGTGACAGT
1021  GCTCCCTGAG GAGCCAGTGA CCTTCCAGGA TGTGGCTGTG GACTTCAGCC GGGAGGAGTG
1081  GGGGCTGCTG GGCCCGACAC AGAGGACCGA GTACCGCGAT GTGATGCTGG AGACCTTTGG
1141  GCACCTGGTC TCTGTGGGGT GGGAGACTAC ACTGGAAAAT AAAGAGTTAG CTCCAAATTC
1201  TGACATTCCT GAGGAAGAAC CAGCCCCCAG CCTGAAAGTA CAAGAATCCT CAAGGGATTG
1261  TGCCTTGTCC TCTACATTAG AAGATACCTT GCAGGGTGGG GTCCAGGAAG TCCAAGACAC
1321  AGTGTTGAAG CAGATGGAGT CTGCTCAGGA AAAAGACCTT CCTCAGAAGA AGCACTTTGA
1381  CAACCGTGAG TCCCAGGCAA ACAGTGGTGC TCTTGACACA AACCAAGTTT CGCTCCAGAA
1441  AATTGACAAC CCTGAGTCCC AGGCAAACAG TGGCGCTCTT GACACAAACC AAGTTTTGCT
1501  CCACAAAATT CCTCCTAGAA AACGATTGCG CAAACGTGAC TCACAAGTTA AAAGTATGAA
1561  ACATAATTCA CGTGTAAAAA TTCATCAGAA GAGCTGTGAA AGGCAAAAGG CCAAGGAAGG
1621  CAATGGTTGT AGGAAAACCT TCAGTCGGAG TACTAAACAG ATTACGTTTA TAAGAATTCA
1681  CAAGGGGAGC CAAGTTTGCC GATGCAGTGA ATGTGGTAAA ATATTCCGGA ACCCAAGATA
1741  CTTTTCTGTG CATAAGAAAA TCCATACCGG AGAGAGGCCC TATGTGTGTC AAGACTGTGG
1801  GAAAGGATTT GTTCAGAGCT CTTCCCTCAC ACAGCATCAG AGAGTTCATT CTGGAGAGAG
1861  ACCATTTGAA TGTCAGGAGT GTGGGAGGAC CTTCAATGAT CGCTCAGCCA TCTCCCAGCA
1921  CCTGAGGACT CACACTGGCG CTAAGCCCTA CAAGTGTCAG GACTGTGGAA AAGCCTTCCG
1981  CCAGAGTTCC CACCTCATCA GACATCAGAG GACTCACACC GGGGAGCGCC CATATGCATG
2041  CAACAAATGT GGAAAGGCCT TCACCCAGAG CTCACACCTT ATTGGGCACC AGAGAACCCA
2101  CAATAGGACA AAGCGAAAGA AGAAACAGCC TACCTCATAG CTCTCAAGCC AGTTGAAGAA
2161  ACCTTGCCTT TTCAGCTTGA CCCTGCAATA TAACATGCAC AGGCCTGCTT GTGAATCAGG
2221  ACTGAATGTG AAAGGGAAGT ATTGAGTGAG GACATTCCCA AAACCAAAGG ACAACTGAGG
2281  AGACTGCCCA GCACATAATG AATAAATAAG AAAATGAGTG AGGAGTTATT AACATCATTT
2341  GGAAAAAAGA TTTCCCATTC ACTTGATATT GTTTGTTCAC TCATTTAGTC ATTAAAAGTG
2401  AGATTAATAA AATCTGAAAA TGTTATATAA TAACTTTAAA AAGCCAGGTA ATTAATAATC
2461  TGCACTGATA TTACATCCAC AGTACCACAG TATTTATGTG TATGAATTAA GGATTAAAAG
2521  ATAATGTGGA TAAAAAAAAA AAAAAA
B:氨基酸序列(SEQ ID NO:20)长度:653个氨基酸
  1  MASRLPTAWS CEPETFEDVT LGFTPEEWGL LDLKQKSLYR EVMLENYRNL VSVEHQLSKP
 61  DVVSQLEEAE DFWPVERGIP QDTIPEYPEL QLDPKLDPLP AESPLMNIEV VEVLTLNQEV
121  AGPRNAQIQA LYAEDGSLSA DAPSEQIQQQ GKHPGDPEAA RQRFRQFRYK DMTGPREALD
181  QLRELCHQWL QPKARSKEQI LELLVLEQFL GTLPVKLRTW VESQHPENCQ EVVALVEGVT
241  WMSEEEVLPA GQPAEGTTCC LEVTAQQEEK QEDAAICPVT VLPEEPVTFQ DVAVDFSREE
301  WGLLGPTQRT EYRDVMLETF GHLVSVGWET TLENKELAPN SDIPEEEPAP SLKVQESSRD
361  CALSSTLEDT LQGGVQEVQD TVLKQMESAQ EKDLPQKKHF DNRESQANSG ALDTNQVSLQ
421  KIDNPESQAN SGALDTNQVL LHKIPPRKRL RKRDSQVKSM KHNSRVKIHQ KSCERQKAKE
481  GNGCRKTFSR STKQITFIRI HKGSQVCRCS ECGKIFRNPR YFSVHKKIHT GERPYVCQDC
541  GKGFVQSSSL TQHQRVHSGE RPFECQECGR TFNDRSAISQ HLRTHTGAKP YKCQDCGKAF
601  RQSSHLIRHQ RTHTGERPYA CNKCGKAFTQ SSHLIGHQRT HNRTKRKKKQ PTS
C.核苷酸及氨基酸组合序列(SEQ ID NO:21)
克隆号:SP2114a
起始编码子:179ATG      终止编码子:2138TAG
蛋白质分子量:74247.90
  1    G GCC AGT CAA GAT GGC CGC CGC TGG GTG AGG CAA GCT GGC GCG CCG     46
 47  CGG GGG CGT CTG GGA GTT GTA GTT CGG GAC GGC GGG CTG ACG CAC TTC     94
 95  GCC GCC GGC CGA CGG GCG CCA TTG TGC GGC GCG CGC CGG GAC TCT GCC    142
143  CAC TTC CAC CAG AGA CAC ATT GAG AAG GAG GAA ACT ATG GCC TCC AGG    190
  1                                                  Met Ala Ser Arg      4
191  CTT CCG ACG GCC TGG TCC TGT GAA CCA GAG ACC TTT GAA GAT GTA ACA    238
  5  Leu Pro Thr Ala Trp Ser Cys Glu Pro Glu Thr Phe Glu Asp Val Thr     20
239  CTG GGT TTT ACC CCG GAA GAG TGG GGA CTG CTG GAC CTC AAA CAG AAG    286
 21  Leu Gly Phe Thr Pro Glu Glu Trp Gly Leu Leu Asp Leu Lys Gln Lys     36
287  TCC CTG TAC AGG GAA GTG ATG CTG GAG AAC TAC AGG AAC CTG GTC TCA    334
 37  Ser Leu Tyr Arg Glu Val Met Leu Glu Asn Tyr Arg Asn Leu Val Ser     52
335  GTG GAA CAT CAG CTT TCC AAA CCA GAT GTG GTA TCT CAG TTA GAG GAG    382
 53  Val Glu His Gln Leu Ser Lys Pro Asp Val Val Ser Gln Leu Glu Glu     68
383  GCA GAA GAT TTC TGG CCA GTG GAG AGA GGA ATT CCT CAA GAC ACC ATT    430
 69  Ala Glu Asp Phe Trp Pro Val Glu Arg Gly Ile Pro Gln Asp Thr Ile     84
431  CCT GAG TAT CCT GAG CTC CAG CTG GAC CCT AAA TTG GAT CCT CTT CCT    478
 85  Pro Glu Tyr Pro Glu Leu Gln Leu Asp Pro Lys Leu Asp Pro Leu Pro    100
479  GCT GAG AGT CCC CTA ATG AAC ATT GAG GTT GTT GAG GTC CTC ACA CTG    526
101  Ala Glu Ser Pro Leu Met Asn Ile Glu Val Val Glu Val Leu Thr Leu    116
527  AAC CAG GAG GTG GCT GGT CCC CGG AAT GCC CAG ATC CAG GCC CTA TAT    574
117  Asn Gln Glu Val Ala Gly Pro Arg Asn Ala Gln Ile Gln Ala Leu Tyr    132
575  GCT GAA GAT GGA AGC CTG AGT GCA GAT GCC CCC AGT GAG CAG ATC CAA    622
133  Ala Glu Asp Gly Ser Leu Ser Ala Asp Ala Pro Ser Glu Gln Ile Gln    148
623  CAG CAG GGC AAG CAT CCA GGT GAC CCT GAG GCC GCG CGC CAG AGG TTC    670
149  Gln Gln Gly Lys His Pro Gly Asp Pro Glu Ala Ala Arg Gln Arg Phe    164
671  CGG CAG TTC CGT TAT AAG GAC ATG ACA GGT CCC CGG GAG GCC CTG GAC    718
165  Arg Gln Phe Arg Tyr Lys Asp Met Thr Gly Pro Arg Glu Ala Leu Asp    180
719  CAG CTC CGA GAG CTG TGT CAC CAG TGG CTA CAG CCT AAG GCA CGC TCC    766
181  Gln Leu Arg Glu Leu Cys His Gln Trp Leu Gln Pro Lys Ala Arg Ser    196
767  AAG GAG CAG ATC CTG GAG CTG CTG GTG CTG GAG CAG TTC CTA GGT ACA    814
197  Lys Glu Gln Ile Leu Glu Leu Leu Val Leu Glu Gln Phe Leu Gly Thr    212
815  CTG CCT GTG AAG CTC CGG ACA TGG GTG GAA TCG CAG CAC CCA GAG AAC    862
213  Leu Pro Val Lys Leu Arg Thr Trp Val Glu Ser Gln His Pro Glu Asn    228
863  TGC CAA GAG GTG GTG GCC CTG GTA GAG GGT GTG ACC TGG ATG TCT GAG    910
 229  Cys Gln Glu Val Val Ala Leu Val Glu Gly Val Thr Trp Met Ser Glu     244
 911  GAG GAA GTA CTT CCT GCA GGA CAA CCT GCC GAG GGC ACC ACC TGC TGC     958
 245  Glu Glu Val Leu Pro Ala Gly Gln Pro Ala Glu Gly Thr Thr Cys Cys     260
 959  CTC GAG GTC ACT GCC CAG CAG GAG GAG AAG CAG GAG GAT GCA GCC ATC    1006
 261  Leu Glu Val Thr Ala Gln Gln Glu Glu Lys Gln Glu Asp Ala Ala Ile     276
1007  TGC CCA GTG ACA GTG CTC CCT GAG GAG CCA GTG ACC TTC CAG GAT GTG    1054
 277  Cys Pro Val Thr Val Leu Pro Glu Glu Pro Val Thr Phe Gln Asp Val     292
1055  GCT GTG GAC TTC AGC CGG GAG GAG TGG GGG CTG CTG GGC CCG ACA CAG    1102
 293  Ala Val Asp Phe Ser Arg Glu Glu Trp Gly Leu Leu Gly Pro Thr Gln     308
1103  AGG ACC GAG TAC CGC GAT GTG ATG CTG GAG ACC TTT GGG CAC CTG GTC    1150
 309  Arg Thr Glu Tyr Arg Asp Val Met Leu Glu Thr Phe Gly His Leu Val     324
1151  TCT GTG GGG TGG GAG ACT ACA CTG GAA AAT AAA GAG TTA GCT CCA AAT    1198
 325  Ser Val Gly Trp Glu Thr Thr Leu Glu Asn Lys Glu Leu Ala Pro Asn     340
1199  TCT GAC ATT CCT GAG GAA GAA CCA GCC CCC AGC CTG AAA GTA CAA GAA    1246
 341  Ser Asp Ile Pro Glu Glu Glu Pro Ala Pro Ser Leu Lys Val Gln Glu     356
1247  TCC TCA AGG GAT TGT GCC TTG TCC TCT ACA TTA GAA GAT ACC TTG CAG    1294
 357  Ser Ser Arg Asp Cys Ala Leu Ser Ser Thr Leu Glu Asp Thr Leu Gln     372
1295  GGT GGG GTC CAG GAA GTC CAA GAC ACA GTG TTG AAG CAG ATG GAG TCT    1342
 373  Gly Gly Val Gln Glu Val Gln Asp Thr Val Leu Lys Gln Met Glu Ser     388
1343  GCT CAG GAA AAA GAC CTT CCT CAG AAG AAG CAC TTT GAC AAC CGT GAG    1390
 389  Ala Gln Glu Lys Asp Leu Pro Gln Lys Lys His Phe Asp Asn Arg Glu     404
1391  TCC CAG GCA AAC AGT GGT GCT CTT GAC ACA AAC CAA GTT TCG CTC CAG    1438
 405  Ser Gln Ala Asn Ser Gly Ala Leu Asp Thr Asn Gln Val Ser Leu Gln     420
1439  AAA ATT GAC AAC CCT GAG TCC CAG GCA AAC AGT GGC GCT CTT GAC ACA    1486
 421  Lys Ile Asp Asn Pro Glu Ser Gln Ala Asn Ser Gly Ala Leu Asp Thr     436
1487  AAC CAA GTT TTG CTC CAC AAA ATT CCT CCT AGA AAA CGA TTG CGC AAA    1534
 437  Asn Gln Val Leu Leu His Lys Ile Pro Pro Arg Lys Arg Leu Arg Lys     452
1535  CGT GAC TCA CAA GTT AAA AGT ATG AAA CAT AAT TCA CGT GTA AAA ATT    1582
 453  Arg Asp Ser Gln Val Lys Ser Met Lys His Asn Ser Arg Val Lys Ile     468
1583  CAT CAG AAG AGC TGT GAA AGG CAA AAG GCC AAG GAA GGC AAT GGT TGT    1630
 469  His Gln Lys Ser Cys Glu Arg Gln Lys Ala Lys Glu Gly Asn Gly Cys     484
1631  AGG AAA ACC TTC AGT CGG AGT AGT AAA CAG ATT ACG TTT ATA AGA ATT    1678
 485  Arg Lys Thr Phe Ser Arg Ser Thr Lys Gln Ile Thr Phe Ile Arg Ile     500
1679  CAC AAG GGG AGC CAA GTT TGC CGA TGC AGT GAA TGT GGT AAA ATA TTC    1726
 501  His Lys Gly Ser Gln Val Cys Arg Cys Ser Glu Cys Gly Lys Ile Phe     516
1727  CGG AAC CCA AGA TAC TTT TCT GTG CAT AAG AAA ATC CAT ACC GGA GAG    1774
 517  Arg Asn Pro Arg Tyr Phe Ser Val His Lys Lys Ile His Thr Gly Glu     532
1775  AGG CCC TAT GTG TGT CAA GAC TGT GGG AAA GGA TTT GTT CAG AGC TCT    1822
 533  Arg Pro Tyr Val Cys Gln Asp Cys Gly Lys Gly Phe Val Gln Ser Ser     548
1823  TCC CTC ACA CAG CAT CAG AGA GTT CAT TCT GGA GAG AGA CCA TTT GAA    1870
 549  Ser Leu Thr Gln His Gln Arg Val His Ser Gly Glu Arg Pro Phe Glu     564
1871  TGT CAG GAG TGT GGG AGG ACC TTC AAT GAT CGC TCA GCC ATC TCC CAG    1918
 565  Cys Gln Glu Cys Gly Arg Thr Phe Asn Asp Arg Ser Ala Ile Ser Gln     580
1919  CAC CTG AGG ACT CAC ACT GGC GCT AAG CCC TAC AAG TGT CAG GAC TGT    1966
 581  His Leu Arg Thr His Thr Gly Ala Lys Pro Tyr Lys Cys Gln Asp Cys     596
1967  GGA AAA GCC TTC CGC CAG AGT TCC CAC CTC ATC AGA CAT CAG AGG ACT    2014
 597  Gly Lys Ala Phe Arg Gln Ser Ser His Leu Ile Arg His Gln Arg Thr     612
2015  CAC ACC GGG GAG CGC CCA TAT GCA TGC AAC AAA TGT GGA AAG GCC TTC    2062
 613  His Thr Gly Glu Arg Pro Tyr Ala Cys Asn Lys Cys Gly Lys Ala Phe     628
2063  ACC CAG AGC TCA CAC CTT ATT GGG CAC CAG AGA ACC CAC AAT AGG ACA    2110
 629  Thr Gln Ser Ser His Leu Ile Gly His Gln Arg Thr His Asn Arg Thr     644
2111  AAG CGA AAG AAG AAA CAG CCT ACC TCA TAG CTC TCA AGC CAG TTG AAG    2158
 645  Lys Arg Lys Lys Lys Gln Pro Thr Ser ***                             654
2159  AAA CCT TGC CTT TTC AGC TTG ACC CTG CAA TAT AAC ATG CAC AGG CCT    2206
2207  GCT TGT GAA TCA GGA CTG AAT GTG AAA GGG AAG TAT TGA GTG AGG ACA    2254
2255  TTC CCA AAA CCA AAG GAC AAC TGA GGA GAC TGC CCA GCA CAT AAT GAA    2302
2303  TAA ATA AGA AAA TGA GTG AGG AGT TAT TAA CAT CAT TTG GAA AAA AGA    2350
2351  TTT CCC ATT CAC TTG ATA TTG TTT GTT CAC TCA TTT AGT CAT TAA AAG    2398
2399  TGA GAT TAA TAA AAT CTG AAA ATG TTA TAT AAT AAC TTT AAA AAG CCA    2446
2447  GGT AAT TAA TAA TCT GCA CTG ATA TTA CAT CCA CAG TAC CAC AGT ATT    2494
2495  TAT GTG TAT GAA TTA AGG ATT AAA AGA TAA TGT GGA TAA AAA AAA AAA    2542
2543  AAA A                                                              2546
在本发明提及的所有文献都在本申请中引用作为参考,就如同每一篇文献被单独引用作为参考那样。此外应理解,在阅读了本发明的上述讲授内容之后,本领域技术人员可以对本发明作各种改动或修改,这些等价形式同样落于本申请所附权利要求书所限定的范围。

Claims (10)

1.一种分离的具有抑癌功能的人蛋白,其特征在于,它包含具有选自下组的氨基酸序列的多肽:SEQ ID NO:2、SEQ ID NO:5、SEQ ID NO:8、SEQ ID NO:11、SEQ ID NO:14、SEQ ID NO:17、SEQ ID NO:20。
2.如权利要求1所述的蛋白,其特征在于,该蛋白的氨基酸序列选自下组:SEQ ID NO:2、SEQ ID NO:5、SEQ ID NO:8、SEQ ID NO:11、SEQ ID NO:14、SEQ ID NO:17、SEQ ID NO:20。
3.一种分离的多核苷酸,其特征在于,它包含一核苷酸序列,该核苷酸序列选自下组:
(a)编码如权利要求1所述蛋白的多核苷酸;
(b)与多核苷酸(a)互补的多核苷酸。
4.如权利要求3所述的多核苷酸,其特征在于,该多核苷酸的序列选自下组:
SEQ ID NO:3、SEQ ID NO:6、SEQ ID NO:9、SEQ ID NO:12、SEQ ID NO:15、SEQ ID NO:18、SEQ ID NO:21的编码区序列。
5.如权利要求3所述的多核苷酸,其特征在于,该多核苷酸的序列选自下组:
SEQ ID NO:3、SEQ ID NO:6、SEQ ID NO:9、SEQ ID NO:12、SEQ ID NO:15、SEQ ID NO:18、SEQ ID NO:21的全长序列。
6.一种载体,其特征在于,它含有权利要求3所述的多核苷酸。
7.一种遗传工程化的宿主细胞,其特征在于,它是选自下组的一种宿主细胞:
(a)用权利要求6所述的载体转化或转导的宿主细胞;
(b)用权利要求3所述的多核苷酸转化或转导的宿主细胞。
8.一种具有抑癌功能的人蛋白活性的多肽的制备方法,其特征在于,该方法包含:
(a)在适合表达具有抑癌功能的人蛋白的条件下,培养权利要求7所述的宿主细胞;
(b)从培养物中分离出具有抑癌功能的人蛋白活性的多肽。
9.一种能与具有抑癌功能的人蛋白特异性结合的抗体,其中所述的具有抑癌功能的人蛋白具有选自下组的氨基酸序列:SEQ ID NO:2、SEQ ID NO:8、SEQ ID NO:11、SEQ IDNO:14、SEQ ID NO:17。
10.一种药物组合物,其特征在于,它含有安全有效量的权利要求1所述的蛋白以及药学上可接受的载体。
CNB001259008A 2000-10-31 2000-10-31 具有抑制癌细胞生长功能的新的人蛋白及其编码序列 Expired - Fee Related CN1155614C (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CNB001259008A CN1155614C (zh) 2000-10-31 2000-10-31 具有抑制癌细胞生长功能的新的人蛋白及其编码序列

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CNB001259008A CN1155614C (zh) 2000-10-31 2000-10-31 具有抑制癌细胞生长功能的新的人蛋白及其编码序列

Publications (2)

Publication Number Publication Date
CN1351079A CN1351079A (zh) 2002-05-29
CN1155614C true CN1155614C (zh) 2004-06-30

Family

ID=4591681

Family Applications (1)

Application Number Title Priority Date Filing Date
CNB001259008A Expired - Fee Related CN1155614C (zh) 2000-10-31 2000-10-31 具有抑制癌细胞生长功能的新的人蛋白及其编码序列

Country Status (1)

Country Link
CN (1) CN1155614C (zh)

Also Published As

Publication number Publication date
CN1351079A (zh) 2002-05-29

Similar Documents

Publication Publication Date Title
CN1170850C (zh) 人血管生成素样蛋白和编码序列及其用途
CN1169954C (zh) 编码具有抑制癌细胞生长功能的人蛋白的多核苷酸
CN1155614C (zh) 具有抑制癌细胞生长功能的新的人蛋白及其编码序列
CN1209373C (zh) 具有抑制癌细胞生长功能的新的人蛋白及其编码序列
CN1169958C (zh) 编码具有抑制癌细胞生长功能的人蛋白的多核苷酸
CN1170848C (zh) 新的人肝癌相关蛋白及其编码序列
CN1194010C (zh) 具有抑制癌细胞生长功能的人蛋白及基编码序列
CN1177864C (zh) 在肝癌组织中具有表达差异的新的人蛋白及其编码序列
CN1199998C (zh) 具有抑制癌细胞生长功能的新的人蛋白及其编码序列
CN1177048C (zh) 编码具有抑制癌细胞生长功能的人蛋白的多核苷酸
CN1194989C (zh) 具有抑制癌细胞生长功能的新的人蛋白及其编码序列
CN1155615C (zh) 具有抑制癌细胞生长功能的新的人蛋白及其编码序列
CN1177049C (zh) 编码具有抑制癌细胞生长功能的人蛋白的多核苷酸
CN1160370C (zh) 新的人细胞周期控制相关蛋白及其编码序列
CN1166686C (zh) 具有抑制癌细胞生长功能的人蛋白及其编码序列
CN1155616C (zh) 具有促进癌细胞生长功能的新的人蛋白及其编码序列
CN1193040C (zh) 具有抑制癌细胞生长功能的人蛋白及其编码序列
CN1209374C (zh) 具有促进3t3细胞转化功能的新的人蛋白及其编码序列
CN1190446C (zh) 具有促进小鼠nih/3t3细胞转化功能的新的人蛋白及其编码序列
CN1199997C (zh) 具有促进小鼠nih/3t3细胞转化功能的新的人蛋白及其编码序列
CN1169955C (zh) 编码具有抑制癌细胞生长功能的人蛋白的多核苷酸
CN1199996C (zh) 具有抑制癌细胞生长功能的新的人蛋白及其编码序列
CN1199994C (zh) 具有抑制癌细胞生长功能的新的人蛋白及其编码序列
CN1169831C (zh) 具有抑制癌细胞生长功能的新的人蛋白及其编码序列
CN1199999C (zh) 具有促进3t3细胞转化功能的新的人蛋白及其编码序列

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
C19 Lapse of patent right due to non-payment of the annual fee
CF01 Termination of patent right due to non-payment of annual fee