CN1155614C - 具有抑制癌细胞生长功能的新的人蛋白及其编码序列 - Google Patents
具有抑制癌细胞生长功能的新的人蛋白及其编码序列 Download PDFInfo
- Publication number
- CN1155614C CN1155614C CNB001259008A CN00125900A CN1155614C CN 1155614 C CN1155614 C CN 1155614C CN B001259008 A CNB001259008 A CN B001259008A CN 00125900 A CN00125900 A CN 00125900A CN 1155614 C CN1155614 C CN 1155614C
- Authority
- CN
- China
- Prior art keywords
- seq
- leu
- ser
- ctg
- gag
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Landscapes
- Medicines That Contain Protein Lipid Enzymes And Other Medicines (AREA)
- Peptides Or Proteins (AREA)
Abstract
本发明公开了一类新的具有抑癌功能的人蛋白,编码此多肽的多核苷酸和经重组技术产生该多肽的方法。本发明还公开了此多肽用于治疗多种疾病如癌症等的方法。本发明还公开了抗此多肽的拮抗剂及其治疗作用。本发明还公开了编码这类新的具有抑癌功能的人蛋白的多核苷酸的用途。
Description
本发明属于生物技术领域,具体地说,本发明涉及新的编码具有抑癌功能的人蛋白的多核苷酸,以及此多核苷酸编码的多肽。本发明还涉及此多核苷酸和多肽的用途和制备。
人基因组学研究目前是国际上的热点,除人染色体DNA大规模测序,表达序列测序(EST)的方法外,还缺少从功能开始的筛选具有功能基因的高通量的方法。
癌症是危害人类健康的主要疾病之一。为了有效地治疗和预防肿瘤,目前人们已越来越关注肿瘤的基因治疗。因此,本领域迫切需要开发研究具有抑癌功能的人蛋白及其激动剂/抑制剂。
本发明的目的是提供一类新的具有抑癌功能的人蛋白多肽以及其片段、类似物和衍生物。
本发明的另一目的是提供编码这些多肽的多核苷酸。
本发明的另一目的是提供生产这些多肽的方法以及该多肽和编码序列的用途。
在本发明的第一方面,提供新颖的分离出的具有抑癌功能的蛋白多肽,它包含具有选自下组的氨基酸序列的多肽:SEQ ID NO:2、SEQ ID NO:5、SEQ ID NO:8、SEQ IDNO:11、SEQ ID NO:14、SEQ ID NO:17、SEQ ID NO:20;或其保守性变异多肽、或其活性片段、或其活性衍生物。
较佳地,该多肽是具有选自下组的氨基酸序列的多肽:SEQ ID NO:2、SEQ ID NO:5、SEQ ID NO:8、SEQ ID NO:11、SEQ ID NO:14、SEQ ID NO:17、SEQ ID NO:20。
在本发明的第二方面,提供了一种分离的多核苷酸,它包含一核苷酸序列,该核苷酸序列与选自下组的一种核苷酸序列有至少85%相同性:(a)编码上述的具有抑癌功能的蛋白多肽的多核苷酸;(b)与多核苷酸(a)互补的多核苷酸。较佳地,该多核苷酸编码的多肽具有选自下组的氨基酸序列:SEQ D NO:2、SEQ ID NO:5、SEQ ID NO:8、SEQ IDNO:11、SEQ ID NO:14、SEQ ID NO:17、SEQ ID NO:20。更佳地,该多核苷酸的序列选自下组:SEQ ID NO:3、SEQ ID NO:6、SEQ ID NO:9、SEQ ID NO:12、SEQ ID NO:15、SEQ ID NO:18、SEQ ID NO:21的编码区序列或全长序列。
在本发明的第三方面,提供了含有上述多核苷酸的载体,以及被该载体转化或转导的宿主细胞或者被上述多核苷酸直接转化或转导的宿主细胞。
在本发明的第四方面,提供了制备具有抑癌功能的蛋白活性的多肽的制备方法,该方法包含:(a)在适合表达具有抑癌功能的蛋白的条件下,培养上述被转化或转导的宿主细胞;(b)从培养物中分离出具有抑癌功能的蛋白活性的多肽。
在本发明的第五方面,提供了与上述的具有抑癌功能的蛋白多肽特异性结合的抗体。还提供了可用于检测的核酸分子,它含有上述的多核苷酸中连续10个核苷酸至全长核苷酸,较佳地它含有连续的约10-800个核苷酸。
在本发明的第六方面,提供了一种药物组合物,它含有安全有效量的本发明的具有抑癌功能的蛋白多肽以及药学上可接受的载体。这些药物组合物可治疗癌症以及细胞异常增殖等病症。
本发明的其它方面由于本文的技术的公开,对本领域的技术人员而言是显而易见的。
本发明采用大规模cDNA克隆转染癌细胞,在获得具有抑癌作用的基础上,经测序证明为新的基因,进一步得到全长cDNA克隆。DNA转染试验证明,本发明的具有抑癌功能的蛋白对癌细胞(肝癌细胞)具有抑制克隆形成的作用,其抑制率在50%或50%以上。
如本文所用,“分离的”是指物质从其原始环境中分离出来(如果是天然的物质,原始环境即是天然环境)。如活体细胞内的天然状态下的多聚核苷酸和多肽是没有分离纯化的,但同样的多聚核苷酸或多肽如从天然状态中同存在的其他物质中分开,则为分离纯化的。
如本文所用,“分离的具有抑癌功能的蛋白或多肽”是指具有抑癌功能的蛋白多肽基本上不含天然与其相关的其它蛋白、脂类、糖类或其它物质。本领域的技术人员能用标准的蛋白质纯化技术纯化具有抑癌功能的蛋白。基本上纯的多肽在非还原聚丙烯酰胺凝胶上能产生单一的主带。具有抑癌功能的蛋白多肽的纯度能用氨基酸序列分析。
本发明的多肽可以是重组多肽、天然多肽、合成多肽,优选重组多肽。本发明的多肽可以是天然纯化的产物,或是化学合成的产物,或使用重组技术从原核或真核宿主(例如,细菌、酵母、高等植物、昆虫和哺乳动物细胞)中产生。根据重组生产方案所用的宿主,本发明的多肽可以是糖基化的,或可以是非糖基化的。本发明的多肽还可包括或不包括起始的甲硫氨酸残基。
本发明还包括具有抑癌功能的人蛋白的片段、衍生物和类似物。如本文所用,术语“片段”、“衍生物”和“类似物”是指基本上保持本发明的天然具有抑癌功能的人蛋白相同的生物学功能或活性的多肽。本发明的多肽片段、衍生物或类似物可以是(i)有一个或多个保守或非保守性氨基酸残基(优选保守性氨基酸残基)被取代的多肽,而这样的取代的氨基酸残基可以是也可以不是由遗传密码编码的,或(ii)在一个或多个氨基酸残基中具有取代基团的多肽,或(iii)成熟多肽与另一个化合物(比如延长多肽半衰期的化合物,例如聚乙二醇)融合所形成的多肽,或(iv)附加的氨基酸序列融合到此多肽序列而形成的多肽(如前导序列或分泌序列或用来纯化此多肽的序列或蛋白原序列)。根据本文的教导,这些片段、衍生物和类似物属于本领域熟练技术人员公知的范围。
本发明的多核苷酸可以是DNA形式或RNA形式。DNA形式包括cDNA、基因组DNA或人工合成的DNA。DNA可以是单链的或是双链的。DNA可以是编码链或非编码链。以PP8153蛋白(在本申请中,蛋白质的命名采用其克隆编号)为例,编码成熟多肽的编码区序列可以与SEQ ID NO:3所示的编码区序列相同或者是简并的变异体。如本文所用,“简并的变异体”在本发明中是指编码具有SEQ ID NO:2的蛋白质,但与SEQ IDNO:3所示的编码区序列有差别的核酸序列。以PP8332蛋白(在本申请中,蛋白质的命名采用其克隆编号)为例,编码成熟多肽的编码区序列可以与SEQ ID NO:6所示的编码区序列相同或者是简并的变异体。如本文所用,“简并的变异体”在本发明中是指编码具有SEQ ID NO:5的蛋白质,但与SEQ ID NO:6所示的编码区序列有差别的核酸序列。对于其他具有抑癌功能的蛋白,可依此类推。对于其他具有抑癌功能的蛋白,可依此类推。
编码成熟多肽的多核苷酸包括:只编码成熟多肽的编码序列;成熟多肽的编码序列和各种附加编码序列;成熟多肽的编码序列(和任选的附加编码序列)以及非编码序列。
术语“编码多肽的多核苷酸”可以是包括编码此多肽的多核苷酸,也可以是还包括附加编码和/或非编码序列的多核苷酸。
本发明还涉及上述多核苷酸的变异体,其编码与本发明有相同的氨基酸序列的多肽或多肽的片段、类似物和衍生物。此多核苷酸的变异体可以是天然发生的等位变异体或非天然发生的变异体。这些核苷酸变异体包括取代变异体、缺失变异体和***变异体。如本领域所知的,等位变异体是一个多核苷酸的替换形式,它可能是一个或多个核苷酸的取代、缺失或***,但不会从实质上改变其编码的多肽的功能。
本发明还涉及与上述的序列杂交且两个序列之间具有至少50%,较佳地至少70%,更佳地至少80%相同性的多核苷酸。本发明特别涉及在严格条件下与本发明所述多核苷酸可杂交的多核苷酸。在本发明中,“严格条件”是指:(1)在较低离子强度和较高温度下的杂交和洗脱,如0.2×SSC,0.1%SDS,60℃;或(2)杂交时加有变性剂,如50%(v/v)甲酰胺,0.1%小牛血清/0.1%Ficoll,42℃等;或(3)仅在两条序列之间的相同性至少在95%以上,更好是97%以上时才发生杂交。并且,可杂交的多核苷酸编码的多肽与SEQ IDNO:2所示的成熟多肽有相同的生物学功能(以PP8153蛋白为例)和活性。
本发明还涉及与上述的序列杂交的核酸片段。如本文所用,“核酸片段”的长度至少含15个核苷酸,较好是至少30个核苷酸,更好是至少50个核苷酸,最好是至少100个核苷酸以上。核酸片段可用于核酸的扩增技术(如PCR)以确定和/或分离编码具有抑癌功能的蛋白的多聚核苷酸。
本发明中的多肽和多核苷酸优选以分离的形式提供,更佳地被纯化至均质。
本发明的DNA序列能用几种方法获得。例如,用本领域熟知的杂交技术分离DNA。这些技术包括但不局限于:1)用探针与基因组或cDNA文库杂交以检出同源性核苷酸序列,和2)表达文库的抗体筛选以检出具有共同结构特征的克隆的DNA片段。
编码具有抑癌功能的蛋白的特异DNA片段序列产生也能用下列方法获得:1)从基因组DNA分离双链DNA序列;2)化学合成DNA序列以获得所需多肽的双链DNA 。
上述提到的方法中,分离基因组DNA最不常用。当需要的多肽产物的整个氨基酸序列已知时,DNA序列的直接化学合成是经常选用的方法。如果所需的氨基酸的整个序列不清楚时,DNA序列的直接化学合成是不可能的,选用的方法是cDNA序列的分离。分离感兴趣的cDNA的标准方法是从高表达该基因的供体细胞分离mRNA并进行逆转录,形成质粒或噬菌体cDNA文库。提取mRNA的方法已有多种成熟的技术,试剂盒也可从商业途径获得(Qiagene)。而构建cDNA文库也是通常的方法(Sambrook,et al.,Molecular Cloning,A Laboratory Manual,Cold Spring Harbor Laboratory.New York,1989)。还可得到商业供应的cDNA文库,如Clontech公司的不同cDNA文库。当结合使用聚合酶反应技术时,即使极少的表达产物也能克隆。
可用常规方法从这些cDNA文库中筛选本发明的基因。这些方法包括(但不限于):(1)DNA-DNA或DNA-RNA杂交;(2)标志基因的功能出现或丧失;(3)测定具有抑癌功能的蛋白的转录本的水平;(4)通过免疫学技术或测定生物学活性,来检测基因表达的蛋白产物。上述方法可单用,也可多种方法联合应用。
在第(1)种方法中,杂交所用的探针是与本发明的多核苷酸的任何一部分同源,其长度至少15个核苷酸,较好是至少30个核苷酸,更好是至少50个核苷酸,最好是至少100个核苷酸。此外,探针的长度通常在2kb之内,较佳地为1kb之内。此处所用的探针通常是在本发明的基因DNA序列信息的基础上化学合成的DNA序列。本发明的基因本身或者片段当然可以用作探针。DNA探针的标记可用放射性同位素,荧光素或酶(如碱性磷酸酶)等。
在第(4)种方法中,检测具有抑癌功能的蛋白基因表达的蛋白产物可用免疫学技术如Western印迹法,放射免疫沉淀法,酶联免疫吸附法(ELISA)等。
应用PCR技术扩增DNA/RNA的方法(Saiki,et al.Science 1985;230:1350-1354)被优选用于获得本发明的基因。特别是很难从文库中得到全长的cDNA时,可优选使用RACE法(RACE-cDNA末端快速扩增法),用于PCR的引物可根据本文所公开的本发明的序列信息适当地选择,并可用常规方法合成。可用常规方法如通过凝胶电泳分离和纯化扩增的DNA/RNA片段。
如上所述得到的本发明的基因,或者各种DNA片段等的核苷酸序列的测定可用常规方法如双脱氧链终止法(Sanger et al.PNAS,1977,74:5463-5467)。这类核苷酸序列测定也可用商业测序试剂盒等。为了获得全长的cDNA序列,测序需反复进行。有时需要测定多个克隆的cDNA序列,才能拼接成全长的cDNA序列。
本发明也涉及包含本发明的多核苷酸的载体,以及用本发明的载体或具有抑癌功能的蛋白编码序列经基因工程产生的宿主细胞,以及经重组技术产生本发明所述多肽的方法。
通过常规的重组DNA技术(Science,1984;224:1431),可利用本发明的多聚核苷酸序列可用来表达或生产重组的具有抑癌功能的蛋白多肽。一般来说有以下步骤:
(1).用本发明的编码具有抑癌功能的人蛋白的多核苷酸(或变异体),或用含有该多核苷酸的重组表达载体转化或转导合适的宿主细胞;
(2).在合适的培养基中培养的宿主细胞;
(3).从培养基或细胞中分离、纯化蛋白质。
本发明中,具有抑癌功能的人蛋白多核苷酸序列可***到重组表达载体中。术语“重组表达载体”指本领域熟知的细菌质粒、噬菌体、酵母质粒、植物细胞病毒、哺乳动物细胞病毒如腺病毒、逆转录病毒或其他载体。在本发明中适用的载体包括但不限于:在细菌中表达的基于T7的表达载体(Rosenberg,et al.Gene,1987,56:125);在哺乳动物细胞中表达的pMSXND表达载体(Lee and Nathans,J Bio Chem.263:3521,1988)和在昆虫细胞中表达的来源于杆状病毒的载体。总之,只要能在宿主体内复制和稳定,任何质粒和载体都可以用。表达载体的一个重要特征是通常含有复制起点、启动子、标记基因和翻译控制元件。
本领域的技术人员熟知的方法能用于构建含具有抑癌功能的人蛋白编码DNA序列和合适的转录/翻译控制信号的表达载体。这些方法包括体外重组DNA技术、DNA合成技术、体内重组技术等(Sambroook,et al.Molecular Cloning,a Laboratory Manual,coldSpring Harbor Laboratory.New York,1989)。所述的DNA序列可有效连接到表达载体中的适当启动子上,以指导mRNA合成。这些启动子的代表性例子有:大肠杆菌的lac或trp启动子;λ噬菌体PL启动子;真核启动子包括CMV立即早期启动子、HSV胸苷激酶启动子、早期和晚期SV40启动子、反转录病毒的LTRs和其他一些已知的可控制基因在原核或真核细胞或其病毒中表达的启动子。表达载体还包括翻译起始用的核糖体结合位点和转录终止子。
此外,表达载体优选地包含一个或多个选择性标记基因,以提供用于选择转化的宿主细胞的表型性状,如真核细胞培养用的二氢叶酸还原酶、新霉素抗性以及绿色荧光蛋白(GFP),或用于大肠杆菌的四环素或氨苄青霉素抗性。
包含上述的适当DNA序列以及适当启动子或者控制序列的载体,可以用于转化适当的宿主细胞,以使其能够表达蛋白质。
宿主细胞可以是原核细胞,如细菌细胞;或是低等真核细胞,如酵母细胞;或是高等真核细胞,如哺乳动物细胞。代表性例子有:大肠杆菌,链霉菌属;鼠伤寒沙门氏菌的细菌细胞;真菌细胞如酵母;植物细胞;果蝇S2或Sf9的昆虫细胞;CHO、COS或Bowes黑素瘤细胞的动物细胞等。
本发明的多核苷酸在高等真核细胞中表达时,如果在载体中***增强子序列时将会使转录得到增强。增强子是DNA的顺式作用因子,通常大约有10到300个碱基对,作用于启动子以增强基因的转录。可举的例子包括在复制起始点晚期一侧的100到270个碱基对的SV40增强子、在复制起始点晚期一侧的多瘤增强子以及腺病毒增强子等。
本领域一般技术人员都清楚如何选择适当的载体、启动子、增强子和宿主细胞。
用重组DNA转化宿主细胞可用本领域技术人员熟知的常规技术进行。当宿主为原核生物如大肠杆菌时,能吸收DNA的感受态细胞可在指数生长期后收获,用CaCl2法处理,所用的步骤在本领域众所周知。可供选择的是用MgCl2。如果需要,转化也可用电穿孔的方法进行。当宿主是真核生物,可选用如下的DNA转染方法:磷酸钙共沉淀法,常规机械方法如显微注射、电穿孔、脂质体包装等。
获得的转化子可以用常规方法培养,表达本发明的基因所编码的多肽。根据所用的宿主细胞,培养中所用的培养基可选自各种常规培养基。在适于宿主细胞生长的条件下进行培养。当宿主细胞生长到适当的细胞密度后,用合适的方法(如温度转换或化学诱导)诱导选择的启动子,将细胞再培养一段时间。
在上面的方法中的重组多肽可包被于细胞内、细胞外或在细胞膜上表达或分泌到细胞外。如果需要,可利用其物理的、化学的和其它特性通过各种分离方法分离和纯化重组的蛋白。这些方法是本领域技术人员所熟知的。这些方法的例子包括但并不限于:常规的复性处理、用蛋白沉淀剂处理(盐析方法)、离心、渗透破菌、超处理、超离心、分子筛层析(凝胶过滤)、吸附层析、离子交换层析、高效液相层析(HPLC)和其它各种液相层析技术及这些方法的结合。
重组的具有抑癌功能的人蛋白或多肽有多方面的用途。这些用途包括(但不限于):直接做为药物治疗具有抑癌功能的蛋白功能低下或丧失所致的疾病,和用于筛选促进或对抗具有抑癌功能的蛋白功能的抗体、多肽或其它配体。例如,抗体可用于激活或抑制具有抑癌功能的人蛋白的功能。用表达的重组具有抑癌功能的人蛋白筛选多肽库可用于寻找有治疗价值的能抑制或刺激具有抑癌功能的人蛋白功能的多肽分子。
本发明也提供了筛选药物以鉴定提高(激动剂)或阻遏(拮抗剂)具有抑癌功能的人蛋白的药剂的方法。激动剂提高具有抑癌功能的人蛋白刺激细胞增殖等生物功能,而拮抗剂阻止和治疗与细胞过度增殖有关的紊乱如各种癌症。例如,能在药物的存在下,将哺乳动物细胞或表达具有抑癌功能的人蛋白的膜制剂与标记的具有抑癌功能的人蛋白一起培养。然后测定药物提高或阻遏此相互作用的能力。
具有抑癌功能的人蛋白的拮抗剂包括筛选出的抗体、化合物、受体缺失物和类似物等。具有抑癌功能的人蛋白的拮抗剂可以与具有抑癌功能的人蛋白结合并消除其功能,或是抑制具有抑癌功能的人蛋白的产生,或是与多肽的活性位点结合使多肽不能发挥生物学功能。具有抑癌功能的人蛋白的拮抗剂可用于治疗用途。
在筛选作为拮抗剂的化合物时,可以将具有抑癌功能的蛋白加入生物分析测定中,通过测定化合物影响具有抑癌功能的蛋白和其受体之间的相互作用来确定化合物是否是拮抗剂。用上述筛选化合物的同样方法,可以筛选出起拮抗剂作用的受体缺失物和类似物。
本发明的多肽可直接用于疾病治疗,例如,各种恶性肿瘤、和细胞异常增殖等。
本发明的多肽,及其片段、衍生物、类似物或它们的细胞可以用来作为抗原以生产抗体。这些抗体可以是多克隆或单克隆抗体。多克隆抗体可以通过将此多肽直接注射动物的方法得到。制备单克隆抗体的技术包括杂交瘤技术,三瘤技术,人B-细胞杂交瘤技术,EBV-杂交瘤技术等。
可以将本发明的多肽和拮抗剂与合适的药物载体组合后使用。这些载体可以是水、葡萄糖、乙醇、盐类、缓冲液、甘油以及它们的组合。组合物包含安全有效量的多肽或拮抗剂以及不影响药物效果的载体和赋形剂。这些组合物可以作为药物用于疾病治疗。
本发明还提供含有一种或多种容器的药盒或试剂盒,容器中装有一种或多种本发明的药用组合物成分。与这些容器一起,可以有由制造、使用或销售药品或生物制品的政府管理机构所给出的指示性提示,该提示反映出生产、使用或销售的政府管理机构许可其在人体上施用。此外,本发明的多肽可以与其它的治疗化合物结合使用。
药物组合物可以以方便的方式给药,如通过局部、静脉内、腹膜内、肌内、皮下、鼻内或皮内的给药途径。具有抑癌功能的蛋白以有效地治疗和/或预防具体的适应症的量来给药。施用于患者的具有抑癌功能的蛋白的量和剂量范围将取决于许多因素,如给药方式、待治疗者的健康条件和诊断医生的判断。
具有抑癌功能的人蛋白的多聚核苷酸也可用于多种治疗目的。基因治疗技术可用于治疗由于具有抑癌功能的蛋白的无表达或异常/无活性的具有抑癌功能的蛋白的表达所致的细胞增殖、发育或代谢异常。重组的基因治疗载体(如病毒载体)可设计成表达变异的具有抑癌功能的蛋白,以抑制内源性的具有抑癌功能的蛋白活性。例如,一种变异的具有抑癌功能的蛋白可以是缩短的、缺失了信号传导功能域的具有抑癌功能的蛋白,虽可与下游的底物结合,但缺乏信号传导活性。因此重组的基因治疗载体可用于治疗具有抑癌功能的蛋白表达或活性异常所致的疾病。来源于病毒的表达载体如逆转录病毒、腺病毒、腺病毒相关病毒、单纯疱疹病毒、细小病毒等可用于将具有抑癌功能的蛋白基因转移至细胞内。构建携带具有抑癌功能的蛋白基因的重组病毒载体的方法可见于已有文献(Sambrook,et al.)。另外重组具有抑癌功能的人蛋白基因可包装到脂质体中转移至细胞内。
抑制具有抑癌功能的人蛋白mRNA的寡聚核苷酸(包括反义RNA和DNA)以及核酶也在本发明的范围之内。核酶是一种能特异性分解特定RNA的酶样RNA分子,其作用机制是核酶分子与互补的靶RNA特异性杂交后进行核酸内切作用。反义的RNA和DNA及核酶可用已有的任何RNA或DNA合成技术获得,如固相磷酸酰胺化学合成法合成寡核苷酸的技术已广泛应用。反义RNA分子可通过编码该RNA的DNA序列在体外或体内转录获得。这种DNA序列已整合到载体的RNA聚合酶启动子的下游。为了增加核酸分子的稳定性,可用多种方法对其进行修饰,如增加两侧的序列长度,核糖核苷之间的连接应用磷酸硫酯键或肽键而非磷酸二酯键。
多聚核苷酸导入组织或细胞内的方法包括:将多聚核苷酸直接注入到体内组织中;或在体外通过载体(如病毒、噬菌体或质粒等)先将多聚核苷酸导入细胞中,再将细胞移植到体内等。
本发明的多肽还可用作肽谱分析,例如,多肽可用物理的、化学或酶进行特异性切割,并进行一维或二维或三维的凝胶电泳分析。
本发明还提供了针对具有抑癌功能的人蛋白抗原决定簇的抗体。这些抗体包括(但不限于):多克隆抗体、单克隆抗体、嵌合抗体、单链抗体、Fab片段和Fab表达文库产生的片段。
抗具有抑癌功能的人蛋白的抗体可用于免疫组织化学技术中,检测活检标本中的具有抑癌功能的人蛋白。
与具有抑癌功能的人蛋白结合的单克隆抗体也可用放射性同位素标记,注入体内可跟踪其位置和分布。这种放射性标记的抗体可作为一种非创伤性诊断方法用于肿瘤细胞的定位和判断是否有转移。
本发明中的抗体可用于治疗或预防与具有抑癌功能的人蛋白相关的疾病。给予适当剂量的抗体可以刺激或阻断具有抑癌功能的人蛋白的产生或活性。
抗体也可用于设计针对体内某一特殊部位的免疫毒素。如具有抑癌功能的人蛋白高亲和性的单克隆抗体可与细菌或植物毒素(如白喉毒素,蓖麻蛋白,红豆碱等)共价结合。一种通常的方法是用巯基交联剂如SPDP,攻击抗体的氨基,通过二硫键的交换,将毒素结合于抗体上,这种杂交抗体可用于杀灭具有抑癌功能的人蛋白阳性的细胞。
多克隆抗体的生产可用具有抑癌功能的人蛋白或多肽免疫动物,如家兔,小鼠,大鼠等。多种佐剂可用于增强免疫反应,包括但不限于弗氏佐剂等。
具有抑癌功能的人蛋白单克隆抗体可用杂交瘤技术生产(Kohler and Milstein.Nature,1975,256:495-497)。将人恒定区和非人源的可变区结合的嵌合抗体可用已有的技术生产(Morrison et al,PNAS,1985,81:6851)。而已有的生产单链抗体的技术(U.S.PatNo.4946778)也可用于生产抗具有抑癌功能的人蛋白的单链抗体。
能与具有抑癌功能的人蛋白结合的多肽分子可通过筛选由各种可能组合的氨基酸结合于固相物组成的随机多肽库而获得。筛选时,必须对具有抑癌功能的人蛋白分子进行标记。
本发明还涉及定量和定位检测具有抑癌功能的人蛋白水平的诊断试验方法。这些试验是本领域所熟知的,且包括FISH测定和放射免疫测定。试验中所检测的具有抑癌功能的人蛋白水平,可以用作解释具有抑癌功能的人蛋白在各种疾病中的重要性和用于诊断具有抑癌功能的蛋白起作用的疾病。
具有抑癌功能的蛋白的多聚核苷酸可用于具有抑癌功能的蛋白相关疾病的诊断和治疗。在诊断方面,具有抑癌功能的蛋白的多聚核苷酸可用于检测具有抑癌功能的蛋白的表达与否或在疾病状态下具有抑癌功能的蛋白的异常表达。如具有抑癌功能的蛋白DNA序列可用于对活检标本的杂交以判断具有抑癌功能的蛋白的表达异常。杂交技术包括Southern印迹法,Northern印迹法、原位杂交等。这些技术方法都是公开的成熟技术,相关的试剂盒都可从商业途径得到。本发明的多核苷酸的一部分或全部可作为探针固定在微阵列(Microarray)或DNA芯片(又称为“基因芯片”)上,用于分析组织中基因的差异表达分析和基因诊断。用具有抑癌功能的蛋白特异的引物进行RNA-聚合酶链反应(RT-PCR)体外扩增也可检测具有抑癌功能的蛋白的转录产物。
检测具有抑癌功能的蛋白基因的突变也可用于诊断具有抑癌功能的蛋白相关的疾病。具有抑癌功能的蛋白突变的形式包括与正常野生型具有抑癌功能的蛋白DNA序列相比的点突变、易位、缺失、重组和其它任何异常等。可用已有的技术如Southern印迹法、DNA序列分析、PCR和原位杂交检测突变。另外,突变有可能影响蛋白的表达,因此用Northern印迹法、Western印迹法可间接判断基因有无突变。
本发明的序列对染色体鉴定也是有价值的。该序列会特异性地针对某条人染色体具***置且并可以与其杂交。目前,需要鉴定染色体上的各基因的具***点。现在,只有很少的基于实际序列数据(重复多态性)的染色体标记物可用于标记染色***置。根据本发明,为了将这些序列与疾病相关基因相关联,其重要的第一步就是将这些DNA序列定位于染色体上。
简而言之,根据eDNA制备PCR引物(优选15-35bp),可以将序列定位于染色体上。然后,将这些引物用于PCR筛选含各条人染色体的体细胞杂合细胞。只有那些含有相应于引物的人基因的杂合细胞会产生扩增的片段。
体细胞杂合细胞的PCR定位法,是将DNA定位到具体染色体的快捷方法。使用本发明的的寡核苷酸引物,通过类似方法,可利用一组来自特定染色体的片段或大量基因组克隆而实现亚定位。可用于染色体定位的其它类似策略包括原位杂交、用标记的流式分选的染色体预筛选和杂交预选,从而构建染色体特异的cDNA库。
将cDNA克隆与中期染色体进行荧光原位杂交(FISH),可以在一个步骤中精确地进行染色体定位。此技术的综述,参见Verma等,Human Chromosomes:a Manual of BasicTechniques,Pergamon Press,New York(1988)。
一旦序列被定位到准确的染色***置,此序列在染色体上的物理位置就可以与基因图数据相关联。这些数据可见于例如,V.Mckusick,Mendelian Inheritance in Man(可通过与Johns Hopkins University Welch Medical Library联机获得)。然后可通过连锁分析,确定基因与业已定位到染色体区域上的疾病之间的关系。
接着,需要测定患病和未患病个体间的cDNA或基因组序列差异。如果在一些或所有的患病个体中观察到某突变,而该突变在任何正常个体中未观察到,则该突变可能是疾病的病因。比较患病和未患病个体,通常涉及首先寻找染色体中结构的变化,如从染色体水平可见的或用基于cDNA序列的PCR可检测的缺失或易位。根据目前的物理作图和基因定位技术的分辨能力,被精确定位至与疾病有关的染色体区域的cDNA,可以是50至500个潜在致病基因间之一种(假定1兆碱基作图分辨能力和每20kb对应于一个基因)。
本发明的具有抑癌功能的蛋白核苷酸全长序列或其片段通常可以用PCR扩增法、重组法或人工合成的方法获得。对于PCR扩增法,可根据本发明所公开的有关核苷酸序列,尤其是开放阅读框序列来设计引物,并用市售的cDNA库或按本领域技术人员已知的常规方法所制备的cDNA库作为模板,扩增而得有关序列。当序列较长时,常常需要进行两次或多次PCR扩增,然后再将各次扩增出的片段按正确次序拼接在一起。
一旦获得了有关的序列,就可以用重组法来大批量地获得有关序列。这通常是将其克隆入载体,再转入细胞,然后通过常规方法从增殖后的宿主细胞中分离得到有关序列。
此外,还可用人工合成的方法来合成有关序列,尤其是片段长度较短时。通常,通过先合成多个小片段,然后再进行连接可获得序列很长的片段。
目前,已经可以完全通过化学合成来编码本发明蛋白(或其片段,或其衍生物)的DNA序列。然后可将该DNA序列引入本领域中的各种DNA分子(如载体)和细胞中。此外,还可通过化学合成将突变引入本发明蛋白序列中。
此外,由于本发明的具有抑癌功能的蛋白具有源自人的天然氨基酸序列,因此,与来源于其他物种的同族蛋白相比,预计在施用于人时将具有更高的活性和/或更低的副作用(例如在人体内的免疫原性更低或没有)。
下面结合具体实施例,进一步阐述本发明。应理解,这些实施例仅用于说明本发明而不用于限制本发明的范围。下列实施例中未注明具体条件的实验方法,通常按照常规条件如Sambrook等人, 分子克隆:实验室手册(New York:Cold Spring Harbor LaboratoryPress,1989)中所述的条件,或按照制造厂商所建议的条件。
实施例1:cDNA基因的获得及对癌细胞克隆形成的抑制作用
SP2114a来自于从GIBCO BRL公司购得的肝cDNA文库(目录号:10422-012),PP8153,PP8332,PP9177,PP9445,PP10199和PP10226是通过用常规方法构建人胎盘cDNA文库获得的。取3、6、10月龄的胎盘组织,用Trizol试剂(GIBCOBRL公司)按厂方说明书提取总RNA,用mRNA提纯试剂盒(Pharmacia公司)提取mRNA。用pCMV-script TMXR cDNA文库构建试剂盒(Stratagene公司)构建上述mRNA的cDNA文库。其中反转录酶改用MMLV-RT-Superscript II(GIBCO BRL),反转录反应在42℃进行。转化XL 10-Gold感受细胞,获得了1×106 cfu/μg cDNA滴度的cDNA文库。第一轮随机挑取cDNA克隆,其后以高丰度cDNA克隆和已证明有抑癌细胞生长功能的cDNA克隆为探针,杂交筛选cDNA文库,挑取弱阳性及阴性克隆。用Qiagen 96孔板质粒抽提试剂盒,按厂家说明书进行质粒DNA的提取。质粒DNA和空载体同时转染肝癌细胞系7721。100ng DNA酒精沉淀干燥后,加6μl H2O溶解,待转染。每份DNA样品中加0.74μl脂质体及9.3μl无血清培液,混匀后,室温放置10分钟。每管中加150μl无血清培液,均分加入3孔生长于96孔板的7721细胞中,37℃放置2小时,每孔再加50μl无血清培液,37℃24小时。每孔换100μl全培液,37℃24小时,换含G418的全培液100μl,37℃24~48小时,边观察,边换G418浓度不等的培液。约2~3次后,直到镜检细胞有克隆形成,计数。发现以上克隆有抑制细胞克隆形成作用,结果如下表所示。
cDNA克隆转染细胞(7721)克隆形成情况
cDNA克隆名称 | cDNA克隆数(三个重复) | 空载体克隆数(三个重复) |
PP8153PP8332PP9177PP9445PP10199PP10226SP2114a | 2 0 18 3 516 11 156 1 95 2 26 1 34 6 5 | 26 29 3012 13 1548 38 3548 38 3548 38 3548 38 3538 42 40 |
对上述cDNA克隆采用双脱氧终止法,在ABI377 DNA自动测序仪上测定其一端近500bp的核苷酸序列。分析后,确定为新基因克隆,进行另一端测序,仍未获得全长cDNA序列,设计引物,再次进行测序,直到获得全长序列(SEQ ID NO:1、4、7、10、13、16、19)。
实施例2:从胎盘cDNA中PCR获得全长基因:
取3、6、10月龄的胎盘组织,用Trizol试剂(GIBCO BRL公司)按厂方说明书提取总RNA,用mRNA提纯试剂盒(Pharmacia公司)提取mRNA。用MMLV-RT-Superscript II(GIBCO BRL),反转录酶在42℃进行反转录反应,获得胎盘cDNA。利用各个基因的转异引物(如下表所示),按97℃3分钟、1个循环;94℃30秒→60℃30秒→72℃1分钟,共35个循环;72℃ 10分钟,1个循环,进行PCR扩增,获得含有完整开放阅读框序列的各蛋白基因的扩增产物。扩增产物经测序验证,与实施例1测得的序列相符,随后用常规技术将扩增产物转入宿主细胞,从而获得重组蛋白。(注:对于SP2114a,可使用从GIBCO BRL公司购得的肝cDNA文库(目录号:10422-012)作为模板)。
基因特异引物
克隆名称 | 特异引物1(5′→3′) | 特异引物2(5′→3′) |
PP8153PP8332PP9177PP9445PP10199PP10226SP2114a | CGGAGGTTCTAGTGTCGGAGTTTCAGACCTGTTCCAAGGGCAGAGGAGCATCCCGTCTACACCAAATGAGGGACATGGAAGCAGTACTCCATGGTGCAGAAATGCACCCTGTTTTGAGAGACCACTTCCACCAGAGACACA | GGACTGCTACCCATCCTGAACTCTGCCTCCACTCACACTGGCTAGCCAGCTCTGTGGAGTCCAAGCCTGACTCTCTTTGCGTTTGCTCCCAGCTGTCTTCAGATCAACTTGAGGCCAGGAGCAAGGTTTCTTCAACTGGC |
实施例3:cDNA克隆序列分析
1.PP8153
A:核苷酸序列(SEQ ID NO:1)长度:2349bp
1 GTGGAAGTAG AAGGCGGTGG CTGAGGCGGT TCCGGAGGTT CTAGTGTCGG AGTTGGGTGC
61 AGGCAGGTGC CATGGGCCCG CTTGAGGCAC ACTGAGGGGA CGCGGGGCTG GGCCATGGCC
121 GGCGCTCGGG CCGCCGCCGC CGCTGCCTCG GCGGGGTCCT CGGCCTCTTC AGGCAACCAG
181 CCGCCTCAGG AGCTGGGGCT TGGGGAGCTG CTGGAGGAGT TCTCCCGGAC TCAGTACCGG
241 GCCAAGGATG GCAGCGGGAC CGGCGGCTCT AAGGTTGAGC GCATTGAGAA GAGATGTCTG
301 GAGCTGTTTG GCCGAGACTA CTGTTTCAGC GTGATTCCAA ACACGAATGG GGATATCTGT
361 GGCCACTATC CCCGGCACAT CGTGTTCCTG GAGTATGAGA GTTCTGAGAA GGAGAAAGAC
421 ACGTTTGAGA GTACCGTACA GGTGAGCAAG TTGCAAGACC TCATCCACCG CAGCAAGATG
481 GCCCGGTGCA GAGGACGGTT TGTCTGCCCA GTAATCCTGT TCAAGGGCAA GCACATTTGC
541 AGGTCGGCCA CACTGGCTGG ATGGGGAGAG CTGTATGGAC GCTCAGGCTA CAACTATTTT
601 TTCTCAGGGG GTGCAGATGA TGCCTGGGCA GATGTGGAGG ACGTCACGGA GGAGGACTGT
661 GCTCTTCGAA GTGGTGACAC GCATCTTTTT GATAAGGTCA GAGGCTATGA CATCAAGCTG
721 CTTCGATACC TGTCAGTCAA ATACATCTGT GACCTGATGG TGGAGAACAA GAAGGTGAAG
781 TTTGGCATGA ATGTAACCTC CTCTGAGAAG GTGGACAAAG CCCAGCGCTA TGCCGACTTC
841 ACTCTCCTCT CCATCCCGTA TCCAGGCTGT GAATTTTTCA AGGAATATAA AGATCGGGAT
901 TACATGGCAG AAGGGCTCAT ATTTAACTGG AAGCAGGACT ACGTTGATGC CCCATTGAGC
961 ATCCCCGACT TCCTGACTCA CTCTCTGAAC ATTGACTGGA GCCAGTATCA GTGTTGGGAT
1021 CTGGTGCAAC AAACACAAAA CTACCTGAAG CTGCTGCTTT CCTTAGTTAA CAGTGATGAT
1081 GACAGCGGGC TGCTGGTACA CTGTATCTCA GGCTGGGATC GGACCCCCCT CTTCATCTCC
1141 CTCCTGCGCC TTTCCTTGTG GGCTGATGGG CTCATCCACA CGTCCCTGAA GCCCACTGAG
1201 ATCCTCTACC TCACTGTGGC CTATGACTGG TTCCTCTTCG GGCACATGTT GGTAGATCGG
1261 CTCAGCAAAG GGGAGGAGAT TTTCTTCTTC TGCTTCAATT TTTTGAAGCA TATTACCTCC
1321 GAGGAGTTCT CTGCTCTGAA GACCCAGAGG AGGAAGAGTT TGCCAGCCCG GGATGGAGGC
1381 TTCACCCTGG AAGACATCTG CATGCTGAGA CGAAAGGACC GTGGCAGCAC CACCAGCCTT
1441 GGCAGCGACT TCTCCCTGGT CATGGAGAGT TCCCCAGGAG CCACTGGGAG CTTCACCTAT
1501 GAAGGCCGTG GAGCTGGTCC CAGCAGGAGC GCCAACTCAG GCAGCTTGAA GGAAGAGCCA
1561 CTCATCCTCT CCACAGAGTG TCCTCTGGAA CCGGCCACAA CCCTCAGAGG ACCGCTTGCC
1621 TTCCCAGCAG GGGCTGGCGG AAGCCAGGTC TTCCAGCTCC TCTTCCTCAA ACCATTCTGA
1681 TAACTTTTTC AGGATGGGTA GCAGTCCCCT GGAGGTCCCC AAACCCAGGC TTGCAGCCCT
1741 GAGTGATCGA GAGACTCGGC TGCAGGAGGT GCGCTCAGCC TTCTTGGCTG CGTACAGCAG
1801 CACAGTGGGG CTTCGGGCAG TAGCCCCCAG TCCTTCCGGT GCCATCGGGG GCCTGCTGGA
1861 GCAATTTGCC CGTGGTGTTG GACTCCGGAG CATCAGCAGC AATGCCTTGT GAAGAAGCCA
1921 GCCCATGACA TTTTCCTGCT CCTCTCTCAG CTGAGCCCTT AGCAGAGAAT CAAAGCCATG
1981 CCTGGCCGAA GGGGTACTTC CAGGTCAGGG GAAATTTCAG TCCCCCATCT CCATCATGAA
2041 CATGGCAGCC CCAAAGCTGA GCAAGGCCAA AGACAGGGTT TTCCAACCCC CAGCCTCTTG
2101 ACTGGTGACC ACCACCCCTT CTTGTCACTG TCTCCCACCC ACCCCATCTT TGCTGGGATT
2161 CCCATCAACT CTCAGAACTG TGTGGGGTTT CCCTGGGGCC TTGTGGAAGC CATGACTTCA
2221 CAAAGACCCT ACCTGTCAGT TCTTGTTTCT GGGGAGGAGG GATCACCTGC ACTGAGAATG
2281 AGGCAGTTTG ACACAGATCA CAAAATAAAA TCAAAGTCTT TTTGAATAGC CAAAAAAAAA
2341 AAAAAAAAA
B:氨基酸序列(SEQ ID NO:2) 长度:521个氨基酸
1 MAGARAAAAA ASAGSSASSG NQPPQELGLG ELLEEFSRTQ YRAKDGSGTG GSKVERIEKR
61 CLELFGRDYC FSVIPNTNGD ICGHYPRHIV FLEYESSEKE KDTFESTVQV SKLQDLIHRS
121 KMARCRGRFV CPVILFKGKH ICRSATLAGW GELYGRSGYN YFFSGGADDA WADVEDVTEE
181 DCALRSGDTH LFDKVRGYDI KLLRYLSVKY ICDLMVENKK VKFGMNVTSS EKVDKAQRYA
241 DFTLLSIPYP GCEFFKEYKD RDYMAEGLIF NWKQDYVDAP LSIPDFLTHS LNIDWSQYQC
301 WDLVQQTQNY LKLLLSLVNS DDDSGLLVHC ISGWDRTPLF ISLLRLSLWA DGLIHTSLKP
361 TEILYLTVAY DWFLFGHMLV DRLSKGEEIF FFCFNFLKHI TSEEFSALKT QRRKSLPARD
421 GGFTLEDICM LRRKDRGSTT SLGSDFSLVM ESSPGATGSF TYEGRGAGPS RSANSGSLKE
481 EPLILSTECP LEPATTLRGP LAFPAGAGGS QVFQLLFLKP F
C.核苷酸及氨基酸组合序列(SEQ ID NO:3)
克隆号:PP8153
起始编码子:115ATG 终止编码子:1678TGA
蛋白质分子量:58350.05
1 GTG GAA GTA GAA GGC GGT GGC TGA GGC GGT TCC GGA GGT TCT AGT GTC 48
49 GGA GTT GGG TGC AGG CAG GTG CCA TGG GCC CGC TTG AGG CAC ACT GAG 96
97 GGG ACG CGG GGC TGG GCC ATG GCC GGC GCT CGG GCC GCC GCC GCC GCT 144
1 Met Ala Gly Ala Arg Ala Ala Ala Ala Ala 10
145 GCC TCG GCG GGG TCC TCG GCC TCT TCA GGC AAC CAG CCG CCT CAG GAG 192
11 Ala Ser Ala Gly Ser Ser Ala Ser Ser Gly Asn Gln Pro Pro Gln Glu 26
193 CTG GGG CTT GGG GAG CTG CTG GAG GAG TTC TCC CGG ACT CAG TAC CGG 240
27 Leu Gly Leu Gly Glu Leu Leu Glu Glu Phe Ser Arg Thr Gln Tyr Arg 42
241 GCC AAG GAT GGC AGC GGG ACC GGC GGC TCT AAG GTT GAG CGC ATT GAG 288
43 Ala Lys Asp Gly Ser Gly Thr Gly Gly Ser Lys Val Glu Arg Ile Glu 58
289 AAG AGA TGT CTG GAG CTG TTT GGC CGA GAC TAC TGT TTC AGC GTG ATT 336
59 Lys Arg Cys Leu Glu Leu Phe Gly Arg Asp Tyr Cys Phe Ser Val Ile 74
337 CCA AAC ACG AAT GGG GAT ATC TGT GGC CAC TAT CCC CGG CAC ATC GTG 384
75 Pro Asn Thr Asn Gly Asp Ile Cys Gly His Tyr Pro Arg His Ile Val 90
385 TTC CTG GAG TAT GAG AGT TCT GAG AAG GAG AAA GAC ACG TTT GAG AGT 432
91 Phe Leu Glu Tyr Glu Ser Ser Glu Lys Glu Lys Asp Thr Phe Glu Ser 106
433 ACC GTA CAG GTG AGC AAG TTG CAA GAC CTC ATC CAC CGC AGC AAG ATG 480
107 Thr Val Gln Val Ser Lys Leu Gln Asp Leu Ile His Arg Ser Lys Met 122
481 GCC CGG TGC AGA GGA CGG TTT GTC TGC CCA GTA ATC CTG TTC AAG GGC 528
123 Ala Arg Cys Arg Gly Arg Phe Val Cys Pro Val Ile Leu Phe Lys Gly 138
529 AAG CAC ATT TGC AGG TCG GCC ACA CTG GCT GGA TGG GGA GAG CTG TAT 576
139 Lys His Ile Cys Arg Ser Ala Thr Leu Ala Gly Trp Gly Glu Leu Tyr 154
577 GGA CGC TCA GGC TAC AAC TAT TTT TTC TCA GGG GGT GCA GAT GAT GCC 624
155 Gly Arg Ser Gly Tyr Asn Tyr Phe Phe Ser Gly Gly Ala Asp Asp Ala 170
625 TGG GCA GAT GTG GAG GAC GTC ACG GAG GAG GAC TGT GCT CTT CGA AGT 672
171 Trp Ala Asp Val Glu Asp Val Thr Glu Glu Asp Cys Ala Leu Arg Ser 186
673 GGT GAC ACG CAT CTT TTT GAT AAG GTC AGA GGC TAT GAC ATC AAG CTG 720
187 Gly Asp Thr His Leu Phe Asp Lys Val Arg Gly Tyr Asp Ile Lys Leu 202
721 CTT CGA TAC CTG TCA GTC AAA TAC ATC TGT GAC CTG ATG GTG GAG AAC 768
203 Leu Arg Tyr Leu Ser Val Lys Tyr Ile Cys Asp Leu Met Val Glu Asn 218
769 AAG AAG GTG AAG TTT GGC ATG AAT GTA ACC TCC TCT GAG AAG GTG GAC 816
219 Lys Lys Val Lys Phe Gly Met Asn Val Thr Ser Ser Glu Lys Val Asp 234
817 AAA GCC CAG CGC TAT GCC GAC TTC ACT CTC CTC TCC ATC CCG TAT CCA 864
235 Lys Ala Gln Arg Tyr Ala Asp Phe Thr Leu Leu Ser Ile Pro Tyr Pro 250
865 GGC TGT GAA TTT TTC AAG GAA TAT AAA GAT CGG GAT TAC ATG GCA GAA 912
251 Gly Cys Glu Phe Phe Lys Glu Tyr Lys Asp Arg Asp Tyr Met Ala Glu 266
913 GGG CTC ATA TTT AAC TGG AAG CAG GAC TAC GTT GAT GCC CCA TTG AGC 960
267 Gly Leu Ile Phe Asn Trp Lys Gln Asp Tyr Val Asp Ala Pro Leu Ser 282
961 ATC CCC GAC TTC CTG ACT CAC TCT CTG AAC ATT GAC TGG AGC CAG TAT 1008
283 Ile Pro Asp Phe Leu Thr His Ser Leu Asn Ile Asp Trp Ser Gln Tyr 298
1009 CAG TGT TGG GAT CTG GTG CAA CAA ACA CAA AAC TAC CTG AAG CTG CTG 1056
299 Gln Cys Trp Asp Leu Val Gln Gln Thr Gln Asn Tyr Leu Lys Leu Leu 314
1057 CTT TCC TTA GTT AAC AGT GAT GAT GAC AGC GGG CTG CTG GTA CAC TGT 1104
315 Leu Ser Leu Val Asn Ser Asp Asp Asp Ser Gly Leu Leu Val His Cys 330
1105 ATC TCA GGC TGG GAT CGG ACC CCC CTC TTC ATC TCC CTC CTG CGC CTT 1152
331 Ile Ser Gly Trp Asp Arg Thr Pro Leu Phe Ile Ser Leu Leu Arg Leu 346
1153 TCC TTG TGG GCT GAT GGG CTC ATC CAC ACG TCC CTG AAG CCC ACT GAG 1200
347 Ser Leu Trp Ala Asp Gly Leu Ile His Thr Ser Leu Lys Pro Thr Glu 362
1201 ATC CTC TAC CTC ACT GTG GCC TAT GAC TGG TTC CTC TTC GGG CAC ATG 1248
363 Ile Leu Tyr Leu Thr Val Ala Tyr Asp Trp Phe Leu Phe Gly His Met 378
1249 TTG GTA GAT CGG CTC AGC AAA GGG GAG GAG ATT TTC TTC TTC TGC TTC 1296
379 Leu Val Asp Arg Leu Ser Lys Gly Glu Glu Ile Phe Phe Phe Cys Phe 394
1297 AAT TTT TTG AAG CAT ATT ACC TCC GAG GAG TTC TCT GCT CTG AAG ACC 1344
395 Asn Phe Leu Lys His Ile Thr Ser Glu Glu Phe Ser Ala Leu Lys Thr 410
1345 CAG AGG AGG AAG AGT TTG CCA GCC CGG GAT GGA GGC TTC ACC CTG GAA 1392
411 Gln Arg Arg Lys Ser Leu Pro Ala Arg Asp Gly Gly Phe Thr Leu Glu 426
1393 GAC ATC TGC ATG CTG AGA CGA AAG GAC CGT GGC AGC ACC ACC AGC CTT 1440
427 Asp Ile Cys Met Leu Arg Arg Lys Asp Arg Gly Ser Thr Thr Ser Leu 442
1441 GGC AGC GAC TTC TCC CTG GTC ATG GAG AGT TCC CCA GGA GCC ACT GGG 1488
443 Gly Ser Asp Phe Ser Leu Val Met Glu Ser Ser Pro Gly Ala Thr Gly 458
1489 AGC TTC ACC TAT GAA GGC CGT GGA GCT GGT CCC AGC AGG AGC GCC AAC 1536
459 Ser Phe Thr Tyr Glu Gly Arg Gly Ala Gly Pro Ser Arg Ser Ala Asn 474
1537 TCA GGC AGC TTG AAG GAA GAG CCA CTC ATC CTC TCC ACA GAG TGT CCT 1584
475 Ser Gly Ser Leu Lys Glu Glu Pro Leu Ile Leu Ser Thr Glu Cys Pro 490
1585 CTG GAA CCG GCC ACA ACC CTC AGA GGA CCG CTT GCC TTC CCA GCA GGG 1632
491 Leu Glu Pro Ala Thr Thr Leu Arg Gly Pro Leu Ala Phe Pro Ala Gly 506
1633 GCT GGC GGA AGC CAG GTC TTC CAG CTC CTC TTC CTC AAA CCA TTC TGA 1680
507 Ala Gly Gly Ser Gln Val Phe Gln Leu Leu Phe Leu Lys Pro Phe *** 522
1681 TAA CTT TTT CAG GAT GGG TAG CAG TCC CCT GGA GGT CCC CAA ACC CAG 1728
1729 GCT TGC AGC CCT GAG TGA TCG AGA GAC TCG GCT GCA GGA GGT GCG CTC 1776
1777 AGC CTT CTT GGC TGC GTA CAG CAG CAC AGT GGG GCT TCG GGC AGT AGC 1824
1825 CCC CAG TCC TTC CGG TGC CAT CGG GGG CCT GCT GGA GCA ATT TGC CCG 1872
1873 TGG TGT TGG ACT CCG GAG CAT CAG CAG CAA TGC CTT GTG AAG AAG CCA 1920
1921 GCC CAT GAC ATT TTC CTG CTC CTC TCT CAG CTG AGC CCT TAG CAG AGA 1968
1969 ATC AAA GCC ATG CCT GGC CGA AGG GGT ACT TCC AGG TCA GGG GAA ATT 2016
2017 TCA GTC CCC CAT CTC CAT CAT GAA CAT GGC AGC CCC AAA GCT GAG CAA 2064
2065 GGC CAA AGA CAG GGT TTT CCA ACC CCC AGC CTC TTG ACT GGT GAC CAC 2112
2113 CAC CCC TTC TTG TCA CTG TCT CCC ACC CAC CCC ATC TTT GCT GGG ATT 2160
2161 CCC ATC AAC TCT CAG AAC TGT GTG GGG TTT CCC TGG GGC CTT GTG GAA 2208
2209 GCC ATG ACT TCA CAA AGA CCC TAC CTG TCA GTT CTT GTT TCT GGG GAG 2256
2257 GAG GGA TCA CCT GCA CTG AGA ATG AGG CAG TTT GAC ACA GAT CAC AAA 2304
2305 ATA AAA TCA AAG TCT TTT TGA ATA GCC AAA AAA AAA AAA AAA AAA 2349
2.PP8332
A:核苷酸序列(SEQ ID NO:4)长度:1771bp
1 GCCTGGGGCG TCCCCGCGAA GCCTGGGCCT GTCAGGCGGT TCCGTCCGGG TCTCGGCCAC
61 CGTCGAGTTC CGTCGAGTTC CGTCCCGGCC CTGCTCACAG CAGCGCCCTC GGAGCGCCCA
121 GCACCTGCGG CCGGCCAGGC AGCGCGATCC TGCGGCGTCT GGCCATCCCG AATGCTATGG
181 CCGCCGTCGC CGTCTTGCGG GCCTTCGGGG CAAGTGGGCC CATGTGTCTC CGGCGCGGCC
241 CCTGGGCCCA GCTCCCCGCC CGCTTCTGCA GCCGGGACCC GGCCGGGGCG GGGCGGCGGG
301 AGTCGGAGCC GCGGCCCACC AGCGCGCGGC AGCTGGACGG CATAAGGAAC ATCGTCTTGA
361 GCAATCCCAA GAAGAGGAAC ACGTTGTCAC TTGCAATGCT GAAATCTCTC CAAAGTGACA
421 TTCTTCATGA CGCTGACAGC AACGATCTGA AAGTCATTAT CATCTCGGCT GAGGGGCCTG
481 TGTTTTCTTC TGGGCATGAC TTAAAGGAGC TGACAGAGGA GCAAGGCCGT GATTACCATG
541 CCGAAGTATT TCAGACCTGT TCCAAGGGTC TCGCTCTGTC GCCCAGGCTG GATTACAGTG
601 GCATGATCTC GGCTCACTGC AACCTCTGCC TCCCGGGTTC AAGCAATTCT CCTGCCTCAG
661 CCTCCTGAGT AGCTGGGACT ACAGGTCATG ATGCACATCC GGAACCACCC CGTCCCCGTC
721 ATTGCCATGG TCAATGGCCT GGCCACGGCT GCCGGCTGTC AACTGGTTGC CAGCTGCGAC
781 ATTGCCGTGG CGAGCGACAA GTCCTCTTTT GCCACTCCTG GGGTGAACGT CGGGCTCTTC
841 TGTTCTACCC CTGGGGTTGC CTTGGCAAGA GCAGTGCCTA GAAAGGTGGC CTTGGAGATG
901 CTCTTTACTG GTGAGCCCAT TTCTGCCCAG GAGGCCCTGC TCCACGGGCT GCTTAGCAAG
961 GTGGTGCCAG AGGCGGAGCT GCAGGAGGAG ACCATGCGGA TCGCTAGGAA GATCGCATCG
1021 CTGAGCCGTC CGGTGGTGTC CCTGGGCAAA GCCACCTTCT ACAAGCAGCT GCCCCAGGAC
1081 CTGGGGACGG CTTACTACCT CACCTCCCAG GCCATGGTGG ACAACCTGGC CCTGCGGGAC
1141 GGGCAGGAGG GCATCACGGC CTTCCTCCAG AAGAGAAAAC CTGTCTGGTC ACACGAGCCA
1201 GTGTGAGTGG AGGCAGAGGA GTGAGGCCCA CGGGCAGCGC CCAGGAGCCC ACCTTCCCCT
1261 CTGGCCCAGC CACCACTGCC TCTCAGCTTC AACAGGTGAC AGGCTGCTTT CGTGACTTGA
1321 TATTGGTGTC ATAGCATTTG GCCTACATTA AAAGCCACAA TTTCATGGGG AAAGGACAAA
1381 ATGGAGAGTG ACTGAGGTGC TGACCTCAGT GCAAGGCTGG TGAACCCTGC AGCGGGCCAG
1441 CTATGGTGGG AAGCCTGGCA TTTGGGGTGC TCCTTGCAAC GTCTTAAGCA AGCGACCCCC
1501 CTGACATAGC AAAAGGTGGC AACCCATGGA GGCAGAAAGA AGGACGCCAG CCTGACCCTT
1561 ATCTTGAAAC GTCCTAAGCA GAGTTAATCC TGGCTGCTCA GGAGAGGCGA CACATTTCAA
1621 ATCTCCACGA GATATTCTCC ACACAGAAAA TCTTCTTGAT TCTATAGAGA CTTAATCATG
1681 CCTATGGCTT TGAATAATCT TATGTGATTT AAATAAATTA AATCTTTATA GAGACTGGAA
1741 AAAAAAAAAA AAAAAAAAAA AAAAAAAAAA A
B:氨基酸序列(SEQ ID NO:5)长度:172个氨基酸
1 MMHIRNHPVP VIAMVNGLAT AAGCQLVASC DIAVASDKSS FATPGVNVGL FCSTPGVALA
61 RAVPRKVALE MLFTGEPISA QEALLHGLLS KVVPEAELQE ETMRIARKIA SLSRPVVSLG
121 KATFYKQLPQ DLGTAYYLTS QAMVDNLALR DGQEGITAFL QKRKPVWSHE PV
C.核苷酸及氨基酸组合序列(SEQ ID NO:6)
克隆号:PP8332
起始编码子:688ATG 终止编码子:1204TGA
蛋白质分子量:18409.48
1 GCC TGG GGC GTC CCC GCG AAG CCT GGG CCT GTC AGG CGG TTC CGT CCG 48
49 GGT CTC GGC CAC CGT CGA GTT CCG TCG AGT TCC GTC CCG GCC CTG CTC 96
97 ACA GCA GCG CCC TCG GAG CGC CGA GCA CCT GCG GCC GGC CAG GCA GCG 144
145 CGA TCC TGC GGC GTC TGG CCA TCC CGA ATG CTA TGG CCG CCG TCG CCG 192
193 TCT TGC GGG CCT TCG GGG CAA GTG GGC CCA TGT GTC TCC GGC GCG GCC 240
241 CCT GGG CCC AGC TCC CCG CCC GCT TCT GCA GCC GGG ACC CGG CCG GGG 288
289 CGG GGC GGC GGG AGT CGG AGC CGC GGC CCA CCA GCG CGC GGC AGC TGG 336
337 ACG GCA TAA GGA ACA TCG TCT TGA GCA ATC CCA AGA AGA GGA ACA CGT 384
385 TGT CAC TTG CAA TGC TGA AAT CTC TCC AAA GTG ACA TTC TTC ATG ACG 432
433 CTG ACA GCA ACG ATC TGA AAG TCA TTA TCA TCT CGG CTG AGG GGC CTG 480
481 TGT TTT CTT CTG GGC ATG ACT TAA AGG AGC TGA CAG AGG AGC AAG GCC 528
529 GTG ATT ACC ATG CCG AAG TAT TTC AGA CCT GTT CCA AGG GTC TCG CTC 576
577 TGT CGC CCA GGC TGG ATT ACA GTG GCA TGA TCT CGG CTC ACT GCA ACC 624
625 TCT GCC TCC CGG GTT CAA GCA ATT CTC CTG CCT CAG CCT CCT GAG TAG 672
673 CTG GGA CTA CAG GTC ATG ATG CAC ATC CGG AAC CAC CCC GTC CCC GTC 720
1 Met Met His Ile Arg Asn His Pro Val Pro Val 11
721 ATT GCC ATG GTC AAT GGC CTG GCC ACG GCT GCC GGC TGT CAA CTG GTT 768
12 Ile Ala Met Val Asn Gly Leu Ala Thr Ala Ala Gly Cys Gln Leu Val 27
769 GCC AGC TGC GAC ATT GCC GTG GCG AGC GAC AAG TCC TCT TTT GCC ACT 816
28 Ala Ser Cys Asp Ile Ala Val Ala Ser Asp Lys Ser Ser Phe Ala Thr 43
817 CCT GGG GTG AAC GTC GGG CTC TTC TGT TCT ACC CCT GGG GTT GCC TTG 864
44 Pro Gly Val Asn Val Gly Leu Phe Cys Ser Thr Pro Gly Val Ala Leu 59
865 GCA AGA GCA GTG CCT AGA AAG GTG GCC TTG GAG ATG CTC TTT ACT GGT 912
60 Ala Arg Ala Val Pro Arg Lys Val Ala Leu Glu Met Leu Phe Thr Gly 75
913 GAG CCC ATT TCT GCC CAG GAG GCC CTG CTC CAC GGG CTG CTT AGC AAG 960
76 Glu Pro Ile Ser Ala Gln Glu Ala Leu Leu His Gly Leu Leu Ser Lys 91
961 GTG GTG CCA GAG GCG GAG CTG CAG GAG GAG ACC ATG CGG ATC GCT AGG 1008
92 Val Val Pro Glu Ala Glu Leu Gln Glu Glu Thr Met Arg Ile Ala Arg 107
1009 AAG ATC GCA TCG CTG AGC CGT CCG GTG GTG TCC CTG GGC AAA GCC ACC 1056
108 Lys Ile Ala Ser Leu Ser Arg Pro Val Val Ser Leu Gly Lys Ala Thr 123
1057 TTC TAC AAG CAG CTG CCC CAG GAC CTG GGG ACG GCT TAC TAC CTC ACC 1104
124 Phe Tyr Lys Gln Leu Pro Gln Asp Leu Gly Thr Ala Tyr Tyr Leu Thr 139
1105 TCC CAG GCC ATG GTG GAC AAC CTG GCC CTG CGG GAC GGG CAG GAG GGC 1152
140 Ser Gln Ala Met Val Asp Asn Leu Ala Leu Arg Asp Gly Gln Glu Gly 155
1153 ATC ACG GCC TTC CTC CAG AAG AGA AAA CCT GTC TGG TCA CAC GAG CCA 1200
156 Ile Thr Ala Phe Leu Gln Lys Arg Lys Pro Val Trp Ser His Glu Pro 171
1201 GTG TGA GTG GAG GCA GAG GAG TGA GGC CCA CGG GCA GCG CCC AGG AGC 1248
172 Val *** 173
1249 CCA CCT TCC CCT CTG GCC CAG CCA CCA CTG CCT CTC AGC TTC AAC AGG 1296
1297 TGA CAG GCT GCT TTC GTG ACT TGA TAT TGG TGT CAT AGC ATT TGG CCT 1344
1345 ACA TTA AAA GCC ACA ATT TCA TGG GGA AAG GAC AAA ATG GAG AGT GAC 1392
1393 TGA GGT GCT GAC CTC AGT GCA AGG CTG GTG AAC CCT GCA GCG GGC CAG 1440
1441 CTA TGG TGG GAA GCC TGG CAT TTG GGG TGC TCC TTG CAA CGT CTT AAG 1488
1489 CAA GCG ACC CCC CTG ACA TAG CAA AAG GTG GCA ACC CAT GGA GGC AGA 1536
1537 AAG AAG GAC GCC AGC CTG ACC CTT ATC TTG AAA CGT CCT AAG CAG AGT 1584
1585 TAA TCC TGG CTG CTC AGG AGA GGC GAC ACA TTT CAA ATC TCC ACG AGA 1632
1633 TAT TCT CCA CAC AGA AAA TCT TCT TGA TTC TAT AGA GAC TTA ATC ATG 1680
1681 CCT ATG GCT TTG AAT AAT CTT ATG TGA TTT AAA TAA ATT AAA TCT TTA 1728
1729 TAG AGA CTG GAA AAA AAA AAA AAA AAA AAA AAA AAA AAA AAA A 1771
3.PP9177
A:核苷酸序列(SEQ ID NO:7)长度:2160bp
1 GCGTCTGCCA GCCGGCTTGG CTAGCGCGCG GCGGCCGTGG CTAAGGCTGC TACGAAGCGA
61 GCTTGGGAGG AGCAGCGGCC TGCGGGGCAG AGGAGCATCC CGTCTACCAG GTCCCAAGCG
121 GCCGTGGCCC GCGGGTCATG GCCAAAGGAG AAGGCGCCGA GAGCGGCTCC GCGGCGGGGC
181 TGCTACCCAC CAGCATCCTC CAAAGCACTG AACGCCCGGC CCAGGTGAAG AAAGAACCGA
241 AAAAGAAGAA ACAACAGTTG TCTGTTTGCA ACAAGCTTTG CTATGCACTT GGGGGAGCCC
301 CCTACCAGGT GACGGGCTGT GCCCTGGGTT TCTTCCTTCA GATCTACCTA TTGGATGTGG
361 CTCAGGTGGG CCCTTTCTCT GCCTCCATCA TCCTGTTTGT GGGCCGAGCC TGGGATGCCA
421 TCACAGACCC CCTGGTGGGC CTCTGCATCA GCAAATCCCC CTGGACCTGC CTGGGTCGCC
481 TTATGCCCTG GATCATCTTC TCCACGCCCC TGGCCGTCAT TGCCTACTTC CTCATCTGGT
541 TCGTGCCCGA CTTCCCACAC GGCCAGACCT ATTGGTACCT GCTTTTCTAT TGCCTCTTTG
601 AAACAATGGT CACGTGTTTC CATGTTCCCT ACTCGGCTCT CACCATGTTC ATCAGCACCG
661 AGCAGACTGA GCGGGATTCT GCCACCGCCT ATCGGATGAC TGTGGAAGTG CTGGGCACAG
721 TGCTGGGCAC GGCGATCCAG GGACAAATCG TGGGCCAAGC AGACACGCCT TGTTTCCAGG
781 ACCTCAATAG CTCTACAGTA GCTTCACAAA GTGCCAACCA TACACATGGC ACCACCTCAC
841 ACAGGGAAAC GCAAAAGGCA TACCTGCTGG CAGCGGGGGT CATTGTCTGT ATCTATATAA
901 TCTGTGCTGT CATCCTGATC CTGGGCGTGC GGGAGCAGAG AGAACCCTAT GAAGCCCAGC
961 AGTCTGAGCC AATCGCCTAC TTCCGGGGCC TACGGCTGGT CATGAGCCAC GGCCCATACA
1021 TCAAACTTAT TACTGGCTTC CTCTTCACCT CCTTGGCTTT CATGCTGGTG GAGGGGAACT
1081 TTGTCTTGTT TTGCACCTAC ACCTTGGGCT TCCGCAATGA ATTCCAGAAT CTACTCCTGG
1141 CCATCATGCT CTCGGCCACT TTAACCATTC CCATCTGGCA GTGGTTCTTG ACCCGGTTTG
1201 GCAAGAAGAC AGCTGTATAT GTTGGGATCT CATCAGCAGT GCCATTTCTC ATCTTGGTGG
1261 CCCTCATGGA GAGTAACCTC ATCATTACAT ATGCGGTAGC TGTGGCAGCT GGCATCAGTG
1321 TGGCAGCTGC CTTCTTACTA CCCTGGTCCA TGCTGCCTGA TGTCATTGAC GACTTCCATC
1381 TGAAGCAGCC CCACTTCCAT GGAACCGAGC CCATCTTCTT CTCCTTCTAT GTCTTCTTCA
1441 CCAAGTTTGC CTCTGGAGTG TCACTGGGCA TTTCTACCCT CAGTCTGGAC TTTGCAGGGT
1501 ACCAGACCCG TGGCTGCTCG CAGCCGGAAC GTGTCAAGTT TACACTGAAC ATGCTCGTGA
1561 CCATGGCTCC CATAGTTCTC ATCCTGCTGG GCCTGCTGCT CTTCAAAATG TACCCCATTG
1621 ATGAGGAGAG GCGGCGGCAG AATAAGAAGG CCCTGCAGGC ACTGAGGGAC GAGGCCAGCA
1681 GCTCTGGCTG CTCAGAAACA GACTCCACAG AGCTGGCTAG CATCCTCTAG GGCCCGCCAC
1741 GTTGCCCGAA GCCACCATGC AGAAGGCCAC AGAAGGGATC AGGACCTGTC TGCCGGCTTG
1801 CTGAGCAGCT GGACTGCAGG TGCTAGGAAG GGAACTGAAG ACTCAAGGAG GTGGCCCAGG
1861 ACACTTGCTG TGCTCACTGT GGGGCCGGCT GCTCTGTGGC CTCCTGCCTC CCCTCTGCCT
1921 GCCTGTGGGG CCAAGCCCTG GGGCTGCCAC TGTGAATATG CCAAGGACTG ATCGGGCCTA
1981 GCCCGGAACA CTAATGTAGA AACCTTTTTT TTACAGAGCC TAATTAATAA CTTAATGACT
2041 GTGTACATAG CAATGTGTGT GTATGTATAT GTCTGTGAGC TATTAATGTT ATTAATTTTC
2101 ATAAAAGCTG GAAAGCAAAA AAAAAAAAAA AAAAAAAAAA AAAAAAAAAA AAAAAAAAAA
B:氨基酸序列(SEQ ID NO:8)长度:530个氨基酸
1 MAKGEGAESG SAAGLLPTSI LQSTERPAQV KKEPKKKKQQ LSVCNKLCYA LGGAPYQVTG
61 CALGFFLQIY LLDVAQVGPF SASIILFVGR AWDAITDPLV GLCISKSPWT CLGRLMPWII
121 FSTPLAVIAY FLIWFVPDFP HGQTYWYLLF YCLFETMVTC FHVPYSALTM FISTEQTERD
181 SATAYRMTVE VLGTVLGTAI QGQIVGQADT PCFQDLNSST VASQSANHTH GTTSHRETQK
241 AYLLAAGVIV CIYIICAVIL ILGVREQREP YEAQQSEPIA YFRGLRLVMS HGPYIKLITG
301 FLFTSLAFML VEGNFVLFCT YTLGFRNEFQ NLLLAIMLSA TLTIPIWQWF LTRFGKKTAV
361 YVGISSAVPF LILVALMESN LIITYAVAVA AGISVAAAFL LPWSMLPDVI DDFHLKQPHF
421 HGTEPIFFSF YVFFTKFASG VSLGISTLSL DFAGYQTRGC SQPERVKFTL NMLVTMAPIV
481 LILLGLLLFK MYPIDEERRR QNKKALQALR DEASSSGCSE TDSTELASIL
C.核苷酸及氨基酸组合序列(SEQ ID NO:9)
克隆号:PP9177
起始编码子:138ATG 终止编码子:1728TAG
蛋白质分子量:58620.36
1 GC GTC TGC CAG CCG GCT TGG CTA GCG CGC GGC GGC CGT GGC TAA GGC 47
48 TGC TAC GAA GCG AGC TTG GGA GGA GCA GCG GCC TGC GGG GCA GAG GAG 95
96 CAT CCC GTC TAC CAG GTC CCA AGC GGC CGT GGC CCG CGG GTC ATG GCC 143
1 Met Ala 2
144 AAA GGA GAA GGC GCC GAG AGC GGC TCC GCG GCG GGG CTG GTA CCC ACC 191
3 Lys Gly Glu Gly Ala Glu Ser Gly Ser Ala Ala Gly Leu Leu Pro Thr 18
192 AGC ATC CTC CAA AGC ACT GAA CGC CCG GCC CAG GTG AAG AAA GAA CCG 239
19 Ser Ile Leu Gln Ser Thr Glu Arg Pro Ala Gln Val Lys Lys Glu Pro 34
240 AAA AAG AAG AAA CAA CAG TTG TCT GTT TGC AAC AAG CTT TGC TAT GCA 287
35 Lys Lys Lys Lys Gln Gln Leu Ser Val Cys Asn Lys Leu Cys Tyr Ala 50
288 CTT GGG GGA GCC CCC TAC CAG GTG ACG GGC TGT GCC CTG GGT TTC TTC 335
51 Leu Gly Gly Ala Pro Tyr Gln Val Thr Gly Cys Ala Leu Gly Phe Phe 66
336 CTT CAG ATC TAC CTA TTG GAT GTG GCT CAG GTG GGC CCT TTC TCT GCC 383
67 Leu Gln Ile Tyr Leu Leu Asp Val Ala Gln Val Gly Pro Phe Ser Ala 82
384 TCC ATC ATC CTG TTT GTG GGC CGA GCC TGG GAT GCC ATC ACA GAC CCC 431
83 Ser Ile Ile Leu Phe Val Gly Arg Ala Trp Asp Ala Ile Thr Asp Pro 98
432 CTG GTG GGC CTC TGC ATC AGC AAA TCC CCC TGG ACC TGC CTG GGT CGC 479
99 Leu Val Gly Leu Cys Ile Ser Lys Ser Pro Trp Thr Cys Leu Gly Arg 114
480 CTT ATG CCC TGG ATC ATC TTC TCC ACG CCC CTG GCC GTC ATT GCC TAC 527
115 Leu Met Pro Trp Ile Ile Phe Ser Thr Pro Leu Ala Val Ile Ala Tyr 130
528 TTC CTC ATC TGG TTC GTG CCC GAC TTC CCA CAC GGC CAG ACC TAT TGG 575
131 Phe Leu Ile Trp Phe Val Pro Asp Phe Pro His Gly Gln Thr Tyr Trp 146
576 TAC CTG CTT TTC TAT TGC CTC TTT GAA ACA ATG GTC ACG TGT TTC CAT 623
147 Tyr Leu Leu Phe Tyr Cys Leu Phe Glu Thr Met Val Thr Cys Phe His 162
624 GTT CCC TAC TCG GCT CTC ACC ATG TTC ATC AGC ACC GAG CAG ACT GAG 671
163 Val Pro Tyr Ser Ala Leu Thr Met Phe Ile Ser Thr Glu Gln Thr Glu 178
672 CGG GAT TCT GCC ACC GCC TAT CGG ATG ACT GTG GAA GTG CTG GGC ACA 719
179 Arg Asp Ser Ala Thr Ala Tyr Arg Met Thr Val Glu Val Leu Gly Thr 194
720 GTG CTG GGC ACG GCG ATC CAG GGA CAA ATC GTG GGC CAA GCA GAC ACG 767
195 Val Leu Gly Thr Ala Ile Gln Gly Gln Ile Val Gly Gln Ala Asp Thr 210
768 CCT TGT TTC CAG GAC CTC AAT AGC TCT ACA GTA GCT TCA CAA AGT GCC 815
211 Pro Cys Phe Gln Asp Leu Asn Ser Ser Thr Val Ala Ser Gln Ser Ala 226
816 AAC CAT ACA CAT GGC ACC ACC TCA CAC AGG GAA ACG CAA AAG GCA TAC 863
227 Asn His Thr His Gly Thr Thr Ser His Arg Glu Thr Gln Lys Ala Tyr 242
864 CTG CTG GCA GCG GGG GTC ATT GTC TGT ATC TAT ATA ATC TGT GCT GTC 911
243 Leu Leu Ala Ala Gly Val Ile Val Cys Ile Tyr Ile Ile Cys Ala Val 258
912 ATC CTG ATC CTG GGC GTG CGG GAG CAG AGA GAA CCC TAT GAA GCC CAG 959
259 Ile Leu Ile Leu Gly Val Arg Glu Gln Arg Glu Pro Tyr Glu Ala Gln 274
960 CAG TCT GAG CCA ATC GCC TAC TTC CGG GGC CTA CGG CTG GTC ATG AGC 1007
275 Gln Ser Glu Pro Ile Ala Tyr Phe Arg Gly Leu Arg Leu Val Met Ser 290
1008 CAC GGC CCA TAC ATC AAA CTT ATT ACT GGC TTC CTC TTC ACC TCC TTG 1055
291 His Gly Pro Tyr Ile Lys Leu Ile Thr Gly Phe Leu Phe Thr Ser Leu 306
1056 GCT TTC ATG CTG GTG GAG GGG AAC TTT GTC TTG TTT TGC ACC TAC ACC 1103
307 Ala Phe Met Leu Val Glu Gly Asn Phe Val Leu Phe Cys Thr Tyr Thr 322
1104 TTG GGC TTC CGC AAT GAA TTC CAG AAT CTA CTC CTG GCC ATC ATG CTC 1151
323 Leu Gly Phe Arg Asn Glu Phe Gln Asn Leu Leu Leu Ala Ile Met Leu 338
1152 TCG GCC ACT TTA ACC ATT CCC ATC TGG CAG TGG TTC TTG ACC CGG TTT 1199
339 Ser Ala Thr Leu Thr Ile Pro Ile Trp Gln Trp Phe Leu Thr Arg Phe 354
1200 GGC AAG AAG ACA GCT GTA TAT GTT GGG ATC TCA TCA GCA GTG CCA TTT 1247
355 Gly Lys Lys Thr Ala Val Tyr Val Gly Ile Ser Ser Ala Val Pro Phe 370
1248 CTC ATC TTG GTG GCC CTC ATG GAG AGT AAC CTC ATC ATT ACA TAT GCG 1295
371 Leu Ile Leu Val Ala Leu Met Glu Ser Asn Leu Ile Ile Thr Tyr Ala 386
1296 GTA GCT GTG GCA GCT GGC ATC AGT GTG GCA GCT GCC TTC TTA CTA CCC 1343
387 Val Ala Val Ala Ala Gly Ile Ser Val Ala Ala Ala Phe Leu Leu Pro 402
1344 TGG TCC ATG CTG CCT GAT GTC ATT GAC GAC TTC CAT CTG AAG CAG CCC 1391
403 Trp Ser Met Leu Pro Asp Val Ile Asp Asp Phe His Leu Lys Gln Pro 418
1392 CAC TTC CAT GGA ACC GAG CCC ATC TTC TTC TCC TTC TAT GTC TTC TTC 1439
419 His Phe His Gly Thr Glu Pro Ile Phe Phe Ser Phe Tyr Val Phe Phe 434
1440 ACC AAG TTT GCC TCT GGA GTG TCA CTG GGC ATT TCT ACC CTC AGT CTG 1487
435 Thr Lys Phe Ala Ser Gly Val Ser Leu Gly Ile Ser Thr Leu Ser Leu 450
1488 GAC TTT GCA GGG TAC CAG ACC CGT GGC TGC TCG CAG CCG GAA CGT GTC 1535
451 Asp Phe Ala Gly Tyr Gln Thr Arg Gly Cys Ser Gln Pro Glu Arg Val 466
1536 AAG TTT ACA CTG AAC ATG CTC GTG ACC ATG GCT CCC ATA GTT CTC ATC 1583
467 Lys Phe Thr Leu Asn Met Leu Val Thr Met Ala Pro Ile Val Leu Ile 482
1584 CTG CTG GGC CTG CTG CTC TTC AAA ATG TAC CCC ATT GAT GAG GAG AGG 1631
483 Leu Leu Gly Leu Leu Leu Phe Lys Met Tyr Pro Ile Asp Glu Glu Arg 498
1632 CGG CGG CAG AAT AAG AAG GCC CTG CAG GCA CTG AGG GAC GAG GCC AGC 1679
499 Arg Arg Gln Asn Lys Lys Ala Leu Gln Ala Leu Arg Asp Glu Ala Ser 514
1680 AGC TCT GGC TGC TCA GAA AGA GAG TCG AGA GAG GTG GCT AGC ATC CTC 1727
515 Ser Ser Gly Cys Ser Glu Thr Asp Ser Thr Glu Leu Ala Ser Ile Leu 530
1728 TAG GGC CCG CCA CGT TGC CCG AAG CCA CCA TGC AGA AGG CCA CAG AAG 1775
531 *** 531
1776 GGA TCA GGA CCT GTC TGC CGG CTT GCT GAG CAG CTG GAC TGC AGG TGC 1823
1824 TAG GAA GGG AAC TGA AGA CTC AAG GAG GTG GCC CAG GAC ACT TGC TGT 1871
1872 GCT CAC TGT GGG GCC GGC TGC TCT GTG GCC TCC TGC CTC CCC TCT GCC 1919
1920 TGC CTG TGG GGC CAA GCC CTG GGG CTG CCA CTG TGA ATA TGC CAA GGA 1967
1968 CTG ATC GGG CCT AGC CCG GAA CAC TAA TGT AGA AAC CTT TTT TTT ACA 2015
2016 GAG CCT AAT TAA TAA CTT AAT GAC TGT GTA CAT AGC AAT GTG TGT GTA 2063
2064 TGT ATA TGT CTG TGA GCT ATT AAT GTT ATT AAT TTT CAT AAA AGC TGG 2111
2112 AAA GCA AAA AAA AAA AAA AAA AAA AAA AAA AAA AAA AAA AAA AAA AAA 2159
2160 A 2160
4.PP9445
A:核苷酸序列(SEQ ID NO:10)长度:1831bp
1 GCCGCCGCGG AGCGAGGTTG ACTGGAGAGA GCGCCTGGGC GCAGAAGGGT TAACGGGCCA
61 CCGGGGGCTC GCAGAGCAGG AGGGTGCTCT CGGACGGTGT GTCCCCCACT GCACTCCTGA
121 ACTTGGAGGA CAGGGTCGCC GCGAGGGACG CAGGTGGGTG CCCTTGATCC AGCTCAGCCC
181 GATGGCAGAA GAGGTTGACA AAAAAGAAAG ACACCTGTTG GGGTGGCCTG CCAGACCCAG
241 GAGTGGAGGG CTCTGTGAGG GCCCGGGAAT TCGGACTCAG GACAGGGATT CTCCATGGCT
301 AGGCCCAGAA ACACAGGGTC CAACCACTCT CCAGCAGGGA GACCTGGGGG TGAAGGGGTG
361 AGCCCTGCGC AGGTCTCTGT TCCTTGGTCT TCACTGGGCA GTGTGGAGAG GTGTGGCCAG
421 GAGGAGCCCG CGTTTGTCCA GACCAGGGTC TACTCTGGCA CCAGAGTGAC CACCTCTGAC
481 CTCTCCTTTC CTCGTCCTGG GCCGGGAACG ACACCAAATG AGGGACATGG AAAGGGCTGG
541 AGTAACAAGA GTCAGGCAGA GCCTGAAGAC TTGGGTGGAA CATGGGCCCT TCTCTGGAGA
601 TCCTGGCCTC CCCCGTTCAG TCAGGGTGGA GTTGCTGACC TTAGTGGCCG GCCCAGCCAG
661 GGGAAGGAGT GGCCATCGGC AACCCCCACC CCAACCCCAA TCCCTGAGGC GCCCGCTCTG
721 GCTCAGCCAC TCTGACCCCT CCCTCAAATT CCGAACCCTA GGTCTCAGGG AGGGCAGTGG
781 GGCTGAGTGT CTGCCCCCAG GCACATTCCT ACCCTTCTCT TGGTCATTTT CTGCCCCAGA
841 GCTGGCCCAC CTCAGCAATG CGAGGGCTCC CTGGATTCCT CTCCCGGGTG CCTTTCAGAT
901 CCAACAGAAA CAGATTTTTT TTTTCCTGGA AAGCAGAACT AAGAGTGGGA TGAGGAGCAG
961 GGGTGGGAAG GACTCAAAGT GAGAAGAAGG GGGCAAAGAG AGTCAGGCTT GGTGGCTGGG
1021 GTGGCTTCCA AGCCTCACTT CTCCAGTGTT CAAAGCTGAA CTTCAGATGG ACTTCCCGGC
1081 TCTTCAGAAT GAGAGGCCTG TGGCTGGGGC ATGAGGCAGC CCCGGCTGCA CCTCTCCTTC
1141 CCGCTTCCCC AGCTGGTAGA GACGCACAGG AAACAAGCCC TCACTGAACC AACTCCAGAT
1201 GCTGGCACCC AGAGTGGGTG TTACATTGCC GGCTTCTTCT CTAGAGATTA AACCGTCAAC
1261 CCATTTAGCT TATCCCTTGG CCAAAAAGTG TATGAGATGT GCCTGGATGT TCCCTAAAGA
1321 GCTTATCTAA GAAGGGAAGA GAAAGCCGGG AGGCAAGTAG GACAGAGAGA TGACTGGGGA
1381 AGGTCTTGTG TCTGGAAGAC CCAAGGAAGG GGCTTCTGGT GGGTCCTCAG AGAGAGTGTC
1441 TGGCGCATCC TCAGTGGAGC CTTCCTCCTC TACTTTCTAG GCACCTCTGG GAGGGCAGGA
1501 GTGGGAGCAG ATGACAACCA TTTTAGAAGG AGCCCTCTGG CTGGGTGCGG TGGCTCACAC
1561 CTGTCATCCC AGCACTTTGG GAGGCCAAGG CAGGAGAAGC GCTTGAGGCC TGGAGTTCAA
1621 GACCAGCCTG TGCAATTTAG CTGGATCCCA TCTCCACCAA AAAATACCAA AATTAGCTGG
1681 GTGTGGTGGT GCACGCATGT AGTCCCACCT ACTCAGGAGG CTGAGGAAGG AGAGCCTGTG
1741 AGTTTGAGGC TGCAATGAGC TTTGGTGGCA CCACTGCCCT CCAGCCTGGA TGACAGAGTG
1801 AGATCTCCAT CTCAAAAAAA AAAAAAAAAA A
B:氨基酸序列(SEQ ID NO:11)长度:154个氨基酸
1 MRDMERAGVT RVRQSLKTWV EHGPFSGDPG LPRSVRVELL TLVAGPARGR SGHRQPPPQP
61 QSLRRPLWLS HSDPSLKFRT LGLREGSGAE CLPPGTFLPF SWSFSAPELA HLSNARAPWI121 PLPGAFQIQQ KQIFFFLESR TKSGMRSRGG KDSK
C.核苷酸及氨基酸组合序列(SEQ ID NO:12)
克隆号:PP9445
起始编码子:518ATG 终止编码子:980TGA
蛋白质分子量:17150.75
1 G CCG CCG CGG AGC GAG GTT GAC TGG AGA GAG CGC CTG GGC GCA GAA 46
47 GGG TTA ACG GGC CAC CGG GGG CTC GCA GAG CAG GAG GGT GCT CTC GGA 94
95 CGG TGT GTC CCC CAC TGC ACT CCT GAA CTT GGA GGA CAG GGT CGC CGC 142
143 GAG GGA CGC AGG TGG GTG CCC TTG ATC CAG CTC AGC CCG ATG GCA GAA 190
191 GAG GTT GAC AAA AAA GAA AGA CAC CTG TTG GGG TGG CCT GCC AGA CCC 238
239 AGG AGT GGA GGG CTC TGT GAG GGC CCG GGA ATT CGG ACT CAG GAC AGG 286
287 GAT TCT CCA TGG CTA GGC CCA GAA ACA CAG GGT CCA ACC ACT CTC CAG 334
335 CAG GGA GAC CTG GGG GTG AAG GGG TGA GCC CTG CGC AGG TCT CTG TTC 382
383 CTT GGT CTT CAC TGG GCA GTG TGG AGA GGT GTG GCC AGG AGG AGC CCG 430
431 CGT TTG TCC AGA CCA GGG TCT ACT CTG GCA CCA GAG TGA CCA CCT CTG 478
479 ACC TCT CCT TTC CTC GTC CTG GGC CGG GAA CGA CAC CAA ATG AGG GAC 526
1 Met Arg Asp 3
527 ATG GAA AGG GCT GGA GTA ACA AGA GTC AGG CAG AGC CTG AAG ACT TGG 574
4 Met Glu Arg Ala Gly Val Thr Arg Val Arg Gln Ser Leu Lys Thr Trp 19
575 GTG GAA CAT GGG CCC TTC TCT GGA GAT CCT GGC CTC CCC CGT TCA GTC 622
20 Val Glu His Gly Pro Phe Ser Gly Asp Pro Gly Leu Pro Arg Ser Val 35
623 AGG GTG GAG TTG CTG ACC TTA GTG GCC GGC CCA GCC AGG GGA AGG AGT 670
36 Arg Val Glu Leu Leu Thr Leu Val Ala Gly Pro Ala Arg Gly Arg Ser 51
671 GGC CAT CGG CAA CCC CCA CCC CAA CCC CAA TCC CTG AGG CGC CCG CTC 718
52 Gly His Arg Gln Pro Pro Pro Gln Pro Gln Ser Leu Arg Arg Pro Leu 67
719 TGG CTC AGC CAC TCT GAC CCC TCC CTC AAA TTC CGA ACC CTA GGT CTC 766
68 Trp Leu Ser His Ser Asp Pro Ser Leu Lys Phe Arg Thr Leu Gly Leu 83
767 AGG GAG GGC AGT GGG GCT GAG TGT CTG CCC CCA GGC ACA TTC CTA CCC 814
84 Arg Glu Gly Ser Gly Ala Glu Cys Leu Pro Pro Gly Thr Phe Leu Pro 99
815 TTC TCT TGG TCA TTT TCT GCC CCA GAG CTG GCC CAC CTC AGC AAT GCG 862
100 Phe Ser Trp Ser Phe Ser Ala Pro Glu Leu Ala His Leu Ser Asn Ala 115
863 AGG GCT CCC TGG ATT CCT CTC CCG GGT GCC TTT CAG ATC CAA CAG AAA 910
116 Arg Ala Pro Trp Ile Pro Leu Pro Gly Ala Phe Gln Ile Gln Gln Lys 131
911 CAG ATT TTT TTT TTC CTG GAA AGC AGA ACT AAG AGT GGG ATG AGG AGC 958
132 Gln Ile Phe Phe Phe Leu Glu Ser Arg Thr Lys Ser Gly Met Arg Ser 147
959 AGG GGT GGG AAG GAC TCA AAG TGA GAA GAA GGG GGC AAA GAG AGT CAG 1006
148 Arg Gly Gly Lys Asp Ser Lys *** 155
1007 GCT TGG TGG CTG GGG TGG CTT CCA AGC CTC ACT TCT CCA GTG TTC AAA 1054
1055 GCT GAA CTT CAG ATG GAC TTC CCG GCT CTT CAG AAT GAG AGG CCT GTG 1102
1103 GCT GGG GCA TGA GGC AGC CCC GGC TGC ACC TCT CCT TCC CGC TTC CCC 1150
1151 AGC TGG TAG AGA CGC ACA GGA AAC AAG CCC TCA CTG AAC CAA CTC CAG 1198
1199 ATG CTG GCA CCC AGA GTG GGT GTT ACA TTG CCG GCT TCT TCT CTA GAG 1246
1247 ATT AAA CCG TCA ACC CAT TTA GCT TAT CCC TTG GCC AAA AAG TGT ATG 1294
1295 AGA TGT GCC TGG ATG TTC CCT AAA GAG CTT ATC TAA GAA GGG AAG AGA 1342
1343 AAG CCG GGA GGC AAG TAG GAC AGA GAG ATG ACT GGG GAA GGT CTT GTG 1390
1391 TCT GGA AGA CCC AAG GAA GGG GCT TCT GGT GGG TCC TCA GAG AGA GTG 1438
1439 TCT GGC GCA TCC TCA GTG GAG CCT TCC TCC TCT ACT TTC TAG GCA CCT 1486
1487 CTG GGA GGG CAG GAG TGG GAG CAG ATG ACA ACC ATT TTA GAA GGA GCC 1534
1535 CTC TGG CTG GGT GCG GTG GCT CAC ACC TGT CAT CCC AGC ACT TTG GGA 1582
1583 GGC CAA GGC AGG AGA AGC GCT TGA GGC CTG GAG TTC AAG ACC AGC CTG 1630
1631 TGC AAT TTA GCT GGA TCC CAT CTC CAC CAA AAA ATA CCA AAA TTA GCT 1678
1679 GGG TGT GGT GGT GCA CGC ATG TAG TCC CAC CTA CTC AGG AGG CTG AGG 1726
1727 AAG GAG AGC CTG TGA GTT TGA GGC TGC AAT GAG CTT TGG TGG CAC CAC 1774
1775 TGC CCT CCA GCC TGG ATG ACA GAG TGA GAT CTC CAT CTC AAA AAA AAA 1822
1823 AAA AAA AAA 1831
5.PP10199
A:核苷酸序列(SEQ ID NO:13)长度:1739bp
1 GTTCCAGAGC CACTTTTAAG ATTCTTCAAT TCCAAATGCA TGTCTTTTTT TAAAAAAAAG
61 AAAGAAAGAA AAATAAGTTT CTAATATTAG AGAAGTACAG CCCTGAATTG GGTTTTGTGT
121 CCACTGCTGG ACCCCATGAG GGCCAGGTGG AGTGGACCTC TGCAGCCCCA GTTGTGTGCA
181 CTCTCTGTTT GGTGCAAATT CCAGTTTGCT GGTTCTCAAT AGCAAGACCA GCCTGAGACC
241 ACCTGTCCTG CTCTTCCCAT GAGAGGGCCG AATGCTCCCA GCCTCCATGC CATGTCCTGT
301 TCCTGGGGTC CTGGGGGTCA TTGCAGCCTG TATGTGCTTC CTCCAGCCAG GGTGATCATC
361 GGGTGCCCCA GTGAGCCCCA GCACTGAGGG TCAGCCCCAG GCACTGTCAA AGGTGAGAGC
421 TCAGAGGCTG TGCCCAGAAA GAGAGGTGGG CCCTGCCTGC CCTGGACGGA GGGAGAGAGG
481 CTTCTCAGAG CCCGAGGCAT GAACCCTCAG GTGGGTCGTG GCCATAGTCA GATGATGGCT
541 GCTGGTGAGC TCAGTGACCA GGCGTCTTCA GGCAGCTCAT AAGTTTGAGA GGACACAGCC
601 TAAGGGAGGT TTGCTGGGGA GTAGCCCCAC TTCCACCCTG AATAGACAAG AGATGGTAAA
661 GCAGGTACCC AGCACTTAGT GCTTTCTTGG GGATATCGCG TGGGTCCCCG GGGGCCTGGG
721 TGCCCGAAGT GCCGCAGTAC TCCATGGTGC AGAGAGCTTG CTCCTGTGGA GGAAGTGTCT
781 ATGTGGTCCC CAGCTCCTCT GTCTGCCTGT CCACTGAGGG GCACCCATGG CTCAGCAGAA
841 GGGCTATTCT TGGGGTTCCC GGTCCTCCTC CAGCCCCGCT AATCTGTGTA GGCCTCAAGT
901 GCTGTGTGTT TGTAAGCATT GTCATCCACA GTCCTATTGT ACGAGCTGGT TCACCCGCAG
961 CTCTGAGCTG CTCTCCAGCC CCAGCCCTTT CTTCCTGTGC CCCTACCCCC GCTGGGATGA
1021 CTCTCCTCAC CCTCCCTGGG GCGACAACCG CCCTGTCTGT AATGAGTGGC AGTCCCAAGC
1081 TTCCTGACTG GCTTCCGCAG CTCTCTGACT CCCCTAAACA AGGCCTCAGG GACTCCACAT
1141 CCAAATTAAG GCGGCACCTG GTGGCAGGTT GGCATTTTCC GGTGTCCTAT CTATGAAAGA
1201 CAGGAAGACA GCTGGGAGCA AACTCCCCTG GGCCAGACTC TTGGAAACAT AAAGGCTTGG
1261 GTGCCCAGCT GGGGACCGGG AGAAAGTCTA AAACACGGGA CTGGGCCAAG GACCCCACAG
1321 GTCCCTGTCT CATTAGGTCC CCTGAAACGT GTGGAAGCTA AAATGGCATT CACGTGATTC
1381 TTGATCATTT AACAGTGGAT TCTGATCTGA TACTACACTG AGAAGTGCCC CTGGGCCGGG
1441 CGCGGTGGCT CACGCCTGTA ATCCCAGCAC TTTGGGAGGC CGAGGCGGGC GGATCACAAG
1501 GAGATTGAGA CCATCCTGGC TAACACGGTG AAACCCTGTC TCTACTAAAA ATACAAAAAA
1561 TTAGCCAGGC ATGGTGGCAG GCGCCTCTAG TACTAGCTAC TCGGGAGGCT GAGGCAGGAG
1621 AATGGTGTGA ACCCGGGAGG CGGAACTTGC AGTGAGCCAA GATTGTGCCA CTGCACTCTA
1681 GCATGGGCGA CAGAGCAAGA CTCAGTCTCA AAAAAAAAAA AAAAAAAAAA AAAAAAAAA
B:氨基酸序列(SEQ ID NO:14)长度:150个氨基酸
1 MVQRACSCGG SVYVVPSSSV CLSTEGHPWL SRRAILGVPG PPPAPLICVG LKCCVFVSIV
61 IHSPIVRAGS PAALSCSPAP ALSSCAPTPA GMTLLTLPGA TTALSVMSGS PKLPDWLPQL
121 SDSPKQGLRD STSKLRRHLV AGWHFPVSYL
C.核苷酸及氨基酸组合序列(SEQ ID NO:15)
克隆号:PP10199
起始编码子:744ATG 终止编码子:1194TGA
蛋白质分子量:15496.34
1 GT TCC AGA GCC ACT TTT AAG ATT CTT CAA TTC CAA ATG CAT GTC TTT 47
48 TTT TAA AAA AAA GAA AGA AAG AAA AAT AAG TTT CTA ATA TTA GAG AAG 95
96 TAC AGC CCT GAA TTG GGT TTT GTG TCC ACT GCT GGA CCC CAT GAG GGC 143
144 CAG GTG GAG TGG ACC TCT GCA GCC CCA GTT GTG TGC ACT CTC TGT TTG 191
192 GTG CAA ATT CCA GTT TGC TGG TTC TCA ATA GCA AGA CCA GCC TGA GAC 239
240 CAC CTG TCC TGC TCT TCC CAT GAG AGG GCC GAA TGC TCC CAG CCT CCA 287
288 TGC CAT GTC CTG TTC CTG GGG TCC TGG GGG TCA TTG CAG CCT GTA TGT 335
336 GCT TCC TCC AGC CAG GGT GAT CAT CGG GTG CCC CAG TGA GCC CCA GCA 383
384 CTG AGG GTC AGC CCC AGG CAC TGT CAA AGG TGA GAG CTC AGA GGC TGT 431
432 GCC CAG AAA GAG AGG TGG GCC CTG CCT GCC CTG GAC GGA GGG AGA GAG 479
480 GCT TCT CAG AGC CCG AGG CAT GAA CCC TCA GGT GGG TCG TGG CCA TAG 527
528 TCA GAT GAT GGC TGC TGG TGA GCT CAG TGA CCA GGC GTC TTC AGG CAG 575
576 CTC ATA AGT TTG AGA GGA CAC AGC CTA AGG GAG GTT TGC TGG GGA GTA 623
624 GCC CCA CTT CCA CCC TGA ATA GAC AAG AGA TGG TAA AGC AGG TAC CCA 671
672 GCA CTT AGT GCT TTC TTG GGG ATA TCG CGT GGG TCC CCG GGG GCC TGG 719
720 GTG CCC GAA GTG CCG CAG TAC TCC ATG GTG CAG AGA GCT TGC TCC TGT 767
1 Met Val Gln Arg Ala Cys Ser Cys 8
768 GGA GGA AGT GTC TAT GTG GTC CCC AGC TCC TCT GTC TGC CTG TCC ACT 815
9 Gly Gly Ser Val Tyr Val Val Pro Ser Ser Ser Val Cys Leu Ser Thr 24
816 GAG GGG CAC CCA TGG CTC AGC AGA AGG GCT ATT CTT GGG GTT CCC GGT 863
25 Glu Gly His Pro Trp Leu Ser Arg Arg Ala Ile Leu Gly Val Pro Gly 40
864 CCT CCT CCA GCC CCG CTA ATC TGT GTA GGC CTC AAG TGC TGT GTG TTT 911
41 Pro Pro Pro Ala Pro Leu Ile Cys Val Gly Leu Lys Cys Cys Val Phe 56
912 GTA AGC ATT GTC ATC CAC AGT CCT ATT GTA CGA GCT GGT TCA CCC GCA 959
57 Val Ser Ile Val Ile His Ser Pro Ile Val Arg Ala Gly Ser Pro Ala 72
960 GCT CTG AGC TGC TCT CCA GCC CCA GCC CTT TCT TCC TGT GCC CCT ACC 1007
73 Ala Leu Ser Cys Ser Pro Ala Pro Ala Leu Ser Ser Cys Ala Pro Thr 88
1008 CCC GCT GGG ATG ACT CTC CTC ACC CTC CCT GGG GCG ACA ACC GCC CTG 1055
89 Pro Ala Gly Met Thr Leu Leu Thr Leu Pro Gly Ala Thr Thr Ala Leu 104
1056 TCT GTA ATG AGT GGC AGT CCC AAG CTT CCT GAC TGG CTT CCG CAG CTC 1103
105 Ser Val Met Ser Gly Ser Pro Lys Leu Pro Asp Trp Leu Pro Gln Leu 120
1104 TCT GAC TCC CCT AAA CAA GGC CTC AGG GAC TCC ACA TCC AAA TTA AGG 1151
121 Ser Asp Ser Pro Lys Gln Gly Leu Arg Asp Ser Thr Ser Lys Leu Arg 136
1152 CGG CAC CTG GTG GCA GGT TGG CAT TTT CCG GTG TCC TAT CTA TGA AAG 1199
137 Arg His Leu Val Ala Gly Trp His Phe Pro Val Ser Tyr Leu *** 151
1200 ACA GGA AGA CAG CTG GGA GCA AAC TCC CCT GGG CCA GAC TCT TGG AAA 1247
1248 CAT AAA GGC TTG GGT GCC CAG CTG GGG ACC GGG AGA AAG TCT AAA ACA 1295
1296 CGG GAC TGG GCC AAG GAC CCC ACA GGT CCC TGT CTC ATT AGG TCC CCT 1343
1344 GAA ACG TGT GGA AGC TAA AAT GGC ATT CAC GTG ATT CTT GAT CAT TTA 1391
1392 ACA GTG GAT TCT GAT CTG ATA CTA CAC TGA GAA GTG CCC CTG GGC CGG 1439
1440 GCG CGG TGG CTC ACG CCT GTA ATC CCA GCA CTT TGG GAG GCC GAG GCG 1487
1488 GGC GGA TCA CAA GGA GAT TGA GAC CAT CCT GGC TAA CAC GGT GAA ACC 1535
1536 CTG TCT CTA CTA AAA ATA CAA AAA ATT AGC CAG GCA TGG TGG CAG GCG 1583
1584 CCT CTA GTA CTA GCT ACT CGG GAG GCT GAG GCA GGA GAA TGG TGT GAA 1631
1632 CCC GGG AGG CGG AAC TTG CAG TGA GCC AAG ATT GTG CCA CTG CAC TCT 1679
1680 AGC ATG GGC GAC AGA GCA AGA CTC AGT CTC AAA AAA AAA AAA AAA AAA 1727
1728 AAA AAA AAA AAA 1739
6.PP10226
A:核苷酸序列(SEQ ID NO:16)长度:1012bp
1 GTGAGAGAGG GGTTTGGAAA TACCAGACTA TAATTGTGGA TTTGTCCATT ACTCCTTTCA
61 GTTCTAGCAG TTTTTGCTTC TTGTGTTTTG AAGCTCTGTT ATTTGATAAA AATTTTTAGA
121 ATTTTTAATG TTTATTTTAG AATGTATAAA ATTTTAGAAT TTATATGGAT AAATTGAATC
181 CTCTATCATT ATAACATTAT GTTCTTTATG CCTGTAATAT TTTTTGCTGC AAAATCTACT
241 GTCTTAAATA ATATAGACAC AACAGCCTGA TTAGTGTTTG CATAGTACAT CTTCCCCTTC
301 TTCCATTGTT TTACATTTAG CCTATTTGTG CTTTAAAAAA ATTTAAGTAC CTATATTGTA
361 GGCAGCATAG AGTTGGATCT TGTTTTATTA ATGCACCCTG TTTTGAGAGA GAGAGAGAGA
421 GAGACAGAGA CAGAGACACA GAGAGAGAGT GTGAGCGAGC AAAAGAGATT TATTCTGGTT
481 TTTTTTTGTT TGTTTTTGAG ATGGAGTCTT GCTCTCTTGC TCAGGCTGGA GTGCAGTGGC
541 GCAATCTCAG CTCACTGCAA CCTCCACCTC CTGGGTTCAA GTTATTCTCC TGTCTCAGCC
601 TCCCAAGTAG CTGGGACTAC AGGCCTGTGC CACCATGCCC GGCTACGTTT TGTATTTTTA
661 GTACAGACGG TGTTTCACCA TGTTGGCCAG GCTGGTCTCA AACTCCTGGC CTCAAGTTGA
721 TCTGCTGGCC TCACGCCTGT AATCCTAGTA CTTTGGGAGG CCGAGGCGGG CGGATCTCGA
781 GTTCAGGAGA TCGACCATCC TGGCTAACAC GGTGAAACCT CGTCTCTACT AAAAATACAA
841 AAAATTAGCC GGGCATGGTG GTGGGCACCC GTAGTCCCAG CTACTTGGGA GGCTGAGGCA
901 GGAGAATGGC ATGAATCCAG TAGGCGGAGC TTGCAGTGAG CCAAGATCAC GCCACTGCAC
961 TCCAGCCTGG GTGACAGAGC GAGACTTTGT CTCAAAAAAA AAAAAAAAAA AA
B:氨基酸序列(SEQ ID NO:17)长度:109个氨基酸
1 MHPVLRERER ETETETQRES VSEQKRFILV FFCLFLRWSL ALLLRLECSG AISAHCNLHL
61 LGSSYSPVSA SQVAGTTGLC HHARLRFVFL VQTVFHHVGQ AGLKLLASS
C.核苷酸及氨基酸组合序列(SEQ ID NO:18)
克隆号:PP10226
起始编码子:391ATG 终止编码子:718TGA
蛋白质分子量:12262.59
1 GTG AGA GAG GGG TTT GGA AAT ACC AGA CTA TAA TTG TGG ATT TGT CCA 48
49 TTA CTC CTT TCA GTT CTA GCA GTT TTT GCT TCT TGT GTT TTG AAG CTC 96
97 TGT TAT TTG ATA AAA ATT TTT AGA ATT TTT AAT GTT TAT TTT AGA ATG 144
145 TAT AAA ATT TTA GAA TTT ATA TGG ATA AAT TGA ATC CTC TAT CAT TAT 192
193 AAC ATT ATG TTC TTT ATG CCT GTA ATA TTT TTT GCT GCA AAA TCT ACT 240
241 GTC TTA AAT AAT ATA GAC ACA ACA GCC TGA TTA GTG TTT GCA TAG TAC 288
289 ATC TTC CCC TTC TTC CAT TGT TTT ACA TTT AGC CTA TTT GTG CTT TAA 336
337 AAA AAT TTA AGT ACC TAT ATT GTA GGC AGC ATA GAG TTG GAT CTT GTT 384
385 TTA TTA ATG CAC CCT GTT TTG AGA GAG AGA GAG AGA GAG ACA GAG ACA 432
1 Met His Pro Val Leu Arg Glu Arg Glu Arg Glu Thr Glu Thr 14
433 GAG ACA CAG AGA GAG AGT GTG AGC GAG CAA AAG AGA TTT ATT CTG GTT 480
15 Glu Thr Gln Arg Glu Ser Val Ser Glu Gln Lys Arg Phe Ile Leu Val 30
481 TTT TTT TGT TTG TTT TTG AGA TGG AGT CTT GCT CTC TTG CTC AGG CTG 528
31 Phe Phe Cys Leu Phe Leu Arg Trp Ser Leu Ala Leu Leu Leu Arg Leu 46
529 GAG TGC AGT GGC GCA ATC TCA GCT CAC TGC AAC CTC CAC CTC CTG GGT 576
47 Glu Cys Ser Gly Ala Ile Ser Ala His Cys Asn Leu His Leu Leu Gly 62
577 TCA AGT TAT TCT CCT GTC TCA GCC TCC CAA GTA GCT GGG ACT ACA GGC 624
63 Ser Ser Tyr Ser Pro Val Ser Ala Ser Gln Val Ala Gly Thr Thr Gly 78
625 CTG TGC CAC CAT GCC CGG CTA CGT TTT GTA TTT TTA GTA CAG ACG GTG 672
79 Leu Cys His His Ala Arg Leu Arg Phe Val Phe Leu Val Gln Thr Val 94
673 TTT CAC CAT GTT GGC CAG GCT GGT CTC AAA CTC CTG GCC TCA AGT TGA 720
95 Phe His His Val Gly Gln Ala Gly Leu Lys Leu Leu Ala Ser Ser *** 110
721 TCT GCT GGC CTC ACG CCT GTA ATC CTA GTA CTT TGG GAG GCC GAG GCG 768
769 GGC GGA TCT CGA GTT CAG GAG ATC GAC CAT CCT GGC TAA CAC GGT GAA 816
817 ACC TCG TCT CTA CTA AAA ATA CAA AAA ATT AGC CGG GCA TGG TGG TGG 864
865 GCA CCC GTA GTC CCA GCT ACT TGG GAG GCT GAG GCA GGA GAA TGG CAT 912
913 GAA TCC AGT AGG CGG AGC TTG CAG TGA GCC AAG ATC ACG CCA CTG CAC 960
961 TCC AGC CTG GGT GAC AGA GCG AGA CTT TGT CTC AAA AAA AAA AAA AAA 1008
1009 AAA A 1012
7.SP2114a
A:核苷酸序列(SEQ ID NO:19)长度:2546bp
1 GGCCAGTCAA GATGGCCGCC GCTGGGTGAG GCAAGCTGGC GCGCCGCGGG GGCGTCTGGG
61 AGTTGTAGTT CGGGACGGCG GGCTGACGCA CTTCGCCGCC GGCCGACGGG CGCCATTGTG
121 CGGCGCGCGC CGGGACTCTG CCCACTTCCA CCAGAGACAC ATTGAGAAGG AGGAAACTAT
181 GGCCTCCAGG CTTCCGACGG CCTGGTCCTG TGAACCAGAG ACCTTTGAAG ATGTAACACT
241 GGGTTTTACC CCGGAAGAGT GGGGACTGCT GGACCTCAAA CAGAAGTCCC TGTACAGGGA
301 AGTGATGCTG GAGAACTACA GGAACCTGGT CTCAGTGGAA CATCAGCTTT CCAAACCAGA
361 TGTGGTATCT CAGTTAGAGG AGGCAGAAGA TTTCTGGCCA GTGGAGAGAG GAATTCCTCA
421 AGACACCATT CCTGAGTATC CTGAGCTCCA GCTGGACCCT AAATTGGATC CTCTTCCTGC
481 TGAGAGTCCC CTAATGAACA TTGAGGTTGT TGAGGTCCTC ACACTGAACC AGGAGGTGGC
541 TGGTCCCCGG AATGCCCAGA TCCAGGCCCT ATATGCTGAA GATGGAAGCC TGAGTGCAGA
601 TGCCCCCAGT GAGCAGATCC AACAGCAGGG CAAGCATCCA GGTGACCCTG AGGCCGCGCG
661 CCAGAGGTTC CGGCAGTTCC GTTATAAGGA CATGACAGGT CCCCGGGAGG CCCTGGACCA
721 GCTCCGAGAG CTGTGTCACC AGTGGCTACA GCCTAAGGCA CGCTCCAAGG AGCAGATCCT
781 GGAGCTGCTG GTGCTGGAGC AGTTCCTAGG TACACTGCCT GTGAAGCTCC GGACATGGGT
841 GGAATCGCAG CACCCAGAGA ACTGCCAAGA GGTGGTGGCC CTGGTAGAGG GTGTGACCTG
901 GATGTCTGAG GAGGAAGTAC TTCCTGCAGG ACAACCTGCC GAGGGCACCA CCTGCTGCCT
961 CGAGGTCACT GCCCAGCAGG AGGAGAAGCA GGAGGATGCA GCCATCTGCC CAGTGACAGT
1021 GCTCCCTGAG GAGCCAGTGA CCTTCCAGGA TGTGGCTGTG GACTTCAGCC GGGAGGAGTG
1081 GGGGCTGCTG GGCCCGACAC AGAGGACCGA GTACCGCGAT GTGATGCTGG AGACCTTTGG
1141 GCACCTGGTC TCTGTGGGGT GGGAGACTAC ACTGGAAAAT AAAGAGTTAG CTCCAAATTC
1201 TGACATTCCT GAGGAAGAAC CAGCCCCCAG CCTGAAAGTA CAAGAATCCT CAAGGGATTG
1261 TGCCTTGTCC TCTACATTAG AAGATACCTT GCAGGGTGGG GTCCAGGAAG TCCAAGACAC
1321 AGTGTTGAAG CAGATGGAGT CTGCTCAGGA AAAAGACCTT CCTCAGAAGA AGCACTTTGA
1381 CAACCGTGAG TCCCAGGCAA ACAGTGGTGC TCTTGACACA AACCAAGTTT CGCTCCAGAA
1441 AATTGACAAC CCTGAGTCCC AGGCAAACAG TGGCGCTCTT GACACAAACC AAGTTTTGCT
1501 CCACAAAATT CCTCCTAGAA AACGATTGCG CAAACGTGAC TCACAAGTTA AAAGTATGAA
1561 ACATAATTCA CGTGTAAAAA TTCATCAGAA GAGCTGTGAA AGGCAAAAGG CCAAGGAAGG
1621 CAATGGTTGT AGGAAAACCT TCAGTCGGAG TACTAAACAG ATTACGTTTA TAAGAATTCA
1681 CAAGGGGAGC CAAGTTTGCC GATGCAGTGA ATGTGGTAAA ATATTCCGGA ACCCAAGATA
1741 CTTTTCTGTG CATAAGAAAA TCCATACCGG AGAGAGGCCC TATGTGTGTC AAGACTGTGG
1801 GAAAGGATTT GTTCAGAGCT CTTCCCTCAC ACAGCATCAG AGAGTTCATT CTGGAGAGAG
1861 ACCATTTGAA TGTCAGGAGT GTGGGAGGAC CTTCAATGAT CGCTCAGCCA TCTCCCAGCA
1921 CCTGAGGACT CACACTGGCG CTAAGCCCTA CAAGTGTCAG GACTGTGGAA AAGCCTTCCG
1981 CCAGAGTTCC CACCTCATCA GACATCAGAG GACTCACACC GGGGAGCGCC CATATGCATG
2041 CAACAAATGT GGAAAGGCCT TCACCCAGAG CTCACACCTT ATTGGGCACC AGAGAACCCA
2101 CAATAGGACA AAGCGAAAGA AGAAACAGCC TACCTCATAG CTCTCAAGCC AGTTGAAGAA
2161 ACCTTGCCTT TTCAGCTTGA CCCTGCAATA TAACATGCAC AGGCCTGCTT GTGAATCAGG
2221 ACTGAATGTG AAAGGGAAGT ATTGAGTGAG GACATTCCCA AAACCAAAGG ACAACTGAGG
2281 AGACTGCCCA GCACATAATG AATAAATAAG AAAATGAGTG AGGAGTTATT AACATCATTT
2341 GGAAAAAAGA TTTCCCATTC ACTTGATATT GTTTGTTCAC TCATTTAGTC ATTAAAAGTG
2401 AGATTAATAA AATCTGAAAA TGTTATATAA TAACTTTAAA AAGCCAGGTA ATTAATAATC
2461 TGCACTGATA TTACATCCAC AGTACCACAG TATTTATGTG TATGAATTAA GGATTAAAAG
2521 ATAATGTGGA TAAAAAAAAA AAAAAA
B:氨基酸序列(SEQ ID NO:20)长度:653个氨基酸
1 MASRLPTAWS CEPETFEDVT LGFTPEEWGL LDLKQKSLYR EVMLENYRNL VSVEHQLSKP
61 DVVSQLEEAE DFWPVERGIP QDTIPEYPEL QLDPKLDPLP AESPLMNIEV VEVLTLNQEV
121 AGPRNAQIQA LYAEDGSLSA DAPSEQIQQQ GKHPGDPEAA RQRFRQFRYK DMTGPREALD
181 QLRELCHQWL QPKARSKEQI LELLVLEQFL GTLPVKLRTW VESQHPENCQ EVVALVEGVT
241 WMSEEEVLPA GQPAEGTTCC LEVTAQQEEK QEDAAICPVT VLPEEPVTFQ DVAVDFSREE
301 WGLLGPTQRT EYRDVMLETF GHLVSVGWET TLENKELAPN SDIPEEEPAP SLKVQESSRD
361 CALSSTLEDT LQGGVQEVQD TVLKQMESAQ EKDLPQKKHF DNRESQANSG ALDTNQVSLQ
421 KIDNPESQAN SGALDTNQVL LHKIPPRKRL RKRDSQVKSM KHNSRVKIHQ KSCERQKAKE
481 GNGCRKTFSR STKQITFIRI HKGSQVCRCS ECGKIFRNPR YFSVHKKIHT GERPYVCQDC
541 GKGFVQSSSL TQHQRVHSGE RPFECQECGR TFNDRSAISQ HLRTHTGAKP YKCQDCGKAF
601 RQSSHLIRHQ RTHTGERPYA CNKCGKAFTQ SSHLIGHQRT HNRTKRKKKQ PTS
C.核苷酸及氨基酸组合序列(SEQ ID NO:21)
克隆号:SP2114a
起始编码子:179ATG 终止编码子:2138TAG
蛋白质分子量:74247.90
1 G GCC AGT CAA GAT GGC CGC CGC TGG GTG AGG CAA GCT GGC GCG CCG 46
47 CGG GGG CGT CTG GGA GTT GTA GTT CGG GAC GGC GGG CTG ACG CAC TTC 94
95 GCC GCC GGC CGA CGG GCG CCA TTG TGC GGC GCG CGC CGG GAC TCT GCC 142
143 CAC TTC CAC CAG AGA CAC ATT GAG AAG GAG GAA ACT ATG GCC TCC AGG 190
1 Met Ala Ser Arg 4
191 CTT CCG ACG GCC TGG TCC TGT GAA CCA GAG ACC TTT GAA GAT GTA ACA 238
5 Leu Pro Thr Ala Trp Ser Cys Glu Pro Glu Thr Phe Glu Asp Val Thr 20
239 CTG GGT TTT ACC CCG GAA GAG TGG GGA CTG CTG GAC CTC AAA CAG AAG 286
21 Leu Gly Phe Thr Pro Glu Glu Trp Gly Leu Leu Asp Leu Lys Gln Lys 36
287 TCC CTG TAC AGG GAA GTG ATG CTG GAG AAC TAC AGG AAC CTG GTC TCA 334
37 Ser Leu Tyr Arg Glu Val Met Leu Glu Asn Tyr Arg Asn Leu Val Ser 52
335 GTG GAA CAT CAG CTT TCC AAA CCA GAT GTG GTA TCT CAG TTA GAG GAG 382
53 Val Glu His Gln Leu Ser Lys Pro Asp Val Val Ser Gln Leu Glu Glu 68
383 GCA GAA GAT TTC TGG CCA GTG GAG AGA GGA ATT CCT CAA GAC ACC ATT 430
69 Ala Glu Asp Phe Trp Pro Val Glu Arg Gly Ile Pro Gln Asp Thr Ile 84
431 CCT GAG TAT CCT GAG CTC CAG CTG GAC CCT AAA TTG GAT CCT CTT CCT 478
85 Pro Glu Tyr Pro Glu Leu Gln Leu Asp Pro Lys Leu Asp Pro Leu Pro 100
479 GCT GAG AGT CCC CTA ATG AAC ATT GAG GTT GTT GAG GTC CTC ACA CTG 526
101 Ala Glu Ser Pro Leu Met Asn Ile Glu Val Val Glu Val Leu Thr Leu 116
527 AAC CAG GAG GTG GCT GGT CCC CGG AAT GCC CAG ATC CAG GCC CTA TAT 574
117 Asn Gln Glu Val Ala Gly Pro Arg Asn Ala Gln Ile Gln Ala Leu Tyr 132
575 GCT GAA GAT GGA AGC CTG AGT GCA GAT GCC CCC AGT GAG CAG ATC CAA 622
133 Ala Glu Asp Gly Ser Leu Ser Ala Asp Ala Pro Ser Glu Gln Ile Gln 148
623 CAG CAG GGC AAG CAT CCA GGT GAC CCT GAG GCC GCG CGC CAG AGG TTC 670
149 Gln Gln Gly Lys His Pro Gly Asp Pro Glu Ala Ala Arg Gln Arg Phe 164
671 CGG CAG TTC CGT TAT AAG GAC ATG ACA GGT CCC CGG GAG GCC CTG GAC 718
165 Arg Gln Phe Arg Tyr Lys Asp Met Thr Gly Pro Arg Glu Ala Leu Asp 180
719 CAG CTC CGA GAG CTG TGT CAC CAG TGG CTA CAG CCT AAG GCA CGC TCC 766
181 Gln Leu Arg Glu Leu Cys His Gln Trp Leu Gln Pro Lys Ala Arg Ser 196
767 AAG GAG CAG ATC CTG GAG CTG CTG GTG CTG GAG CAG TTC CTA GGT ACA 814
197 Lys Glu Gln Ile Leu Glu Leu Leu Val Leu Glu Gln Phe Leu Gly Thr 212
815 CTG CCT GTG AAG CTC CGG ACA TGG GTG GAA TCG CAG CAC CCA GAG AAC 862
213 Leu Pro Val Lys Leu Arg Thr Trp Val Glu Ser Gln His Pro Glu Asn 228
863 TGC CAA GAG GTG GTG GCC CTG GTA GAG GGT GTG ACC TGG ATG TCT GAG 910
229 Cys Gln Glu Val Val Ala Leu Val Glu Gly Val Thr Trp Met Ser Glu 244
911 GAG GAA GTA CTT CCT GCA GGA CAA CCT GCC GAG GGC ACC ACC TGC TGC 958
245 Glu Glu Val Leu Pro Ala Gly Gln Pro Ala Glu Gly Thr Thr Cys Cys 260
959 CTC GAG GTC ACT GCC CAG CAG GAG GAG AAG CAG GAG GAT GCA GCC ATC 1006
261 Leu Glu Val Thr Ala Gln Gln Glu Glu Lys Gln Glu Asp Ala Ala Ile 276
1007 TGC CCA GTG ACA GTG CTC CCT GAG GAG CCA GTG ACC TTC CAG GAT GTG 1054
277 Cys Pro Val Thr Val Leu Pro Glu Glu Pro Val Thr Phe Gln Asp Val 292
1055 GCT GTG GAC TTC AGC CGG GAG GAG TGG GGG CTG CTG GGC CCG ACA CAG 1102
293 Ala Val Asp Phe Ser Arg Glu Glu Trp Gly Leu Leu Gly Pro Thr Gln 308
1103 AGG ACC GAG TAC CGC GAT GTG ATG CTG GAG ACC TTT GGG CAC CTG GTC 1150
309 Arg Thr Glu Tyr Arg Asp Val Met Leu Glu Thr Phe Gly His Leu Val 324
1151 TCT GTG GGG TGG GAG ACT ACA CTG GAA AAT AAA GAG TTA GCT CCA AAT 1198
325 Ser Val Gly Trp Glu Thr Thr Leu Glu Asn Lys Glu Leu Ala Pro Asn 340
1199 TCT GAC ATT CCT GAG GAA GAA CCA GCC CCC AGC CTG AAA GTA CAA GAA 1246
341 Ser Asp Ile Pro Glu Glu Glu Pro Ala Pro Ser Leu Lys Val Gln Glu 356
1247 TCC TCA AGG GAT TGT GCC TTG TCC TCT ACA TTA GAA GAT ACC TTG CAG 1294
357 Ser Ser Arg Asp Cys Ala Leu Ser Ser Thr Leu Glu Asp Thr Leu Gln 372
1295 GGT GGG GTC CAG GAA GTC CAA GAC ACA GTG TTG AAG CAG ATG GAG TCT 1342
373 Gly Gly Val Gln Glu Val Gln Asp Thr Val Leu Lys Gln Met Glu Ser 388
1343 GCT CAG GAA AAA GAC CTT CCT CAG AAG AAG CAC TTT GAC AAC CGT GAG 1390
389 Ala Gln Glu Lys Asp Leu Pro Gln Lys Lys His Phe Asp Asn Arg Glu 404
1391 TCC CAG GCA AAC AGT GGT GCT CTT GAC ACA AAC CAA GTT TCG CTC CAG 1438
405 Ser Gln Ala Asn Ser Gly Ala Leu Asp Thr Asn Gln Val Ser Leu Gln 420
1439 AAA ATT GAC AAC CCT GAG TCC CAG GCA AAC AGT GGC GCT CTT GAC ACA 1486
421 Lys Ile Asp Asn Pro Glu Ser Gln Ala Asn Ser Gly Ala Leu Asp Thr 436
1487 AAC CAA GTT TTG CTC CAC AAA ATT CCT CCT AGA AAA CGA TTG CGC AAA 1534
437 Asn Gln Val Leu Leu His Lys Ile Pro Pro Arg Lys Arg Leu Arg Lys 452
1535 CGT GAC TCA CAA GTT AAA AGT ATG AAA CAT AAT TCA CGT GTA AAA ATT 1582
453 Arg Asp Ser Gln Val Lys Ser Met Lys His Asn Ser Arg Val Lys Ile 468
1583 CAT CAG AAG AGC TGT GAA AGG CAA AAG GCC AAG GAA GGC AAT GGT TGT 1630
469 His Gln Lys Ser Cys Glu Arg Gln Lys Ala Lys Glu Gly Asn Gly Cys 484
1631 AGG AAA ACC TTC AGT CGG AGT AGT AAA CAG ATT ACG TTT ATA AGA ATT 1678
485 Arg Lys Thr Phe Ser Arg Ser Thr Lys Gln Ile Thr Phe Ile Arg Ile 500
1679 CAC AAG GGG AGC CAA GTT TGC CGA TGC AGT GAA TGT GGT AAA ATA TTC 1726
501 His Lys Gly Ser Gln Val Cys Arg Cys Ser Glu Cys Gly Lys Ile Phe 516
1727 CGG AAC CCA AGA TAC TTT TCT GTG CAT AAG AAA ATC CAT ACC GGA GAG 1774
517 Arg Asn Pro Arg Tyr Phe Ser Val His Lys Lys Ile His Thr Gly Glu 532
1775 AGG CCC TAT GTG TGT CAA GAC TGT GGG AAA GGA TTT GTT CAG AGC TCT 1822
533 Arg Pro Tyr Val Cys Gln Asp Cys Gly Lys Gly Phe Val Gln Ser Ser 548
1823 TCC CTC ACA CAG CAT CAG AGA GTT CAT TCT GGA GAG AGA CCA TTT GAA 1870
549 Ser Leu Thr Gln His Gln Arg Val His Ser Gly Glu Arg Pro Phe Glu 564
1871 TGT CAG GAG TGT GGG AGG ACC TTC AAT GAT CGC TCA GCC ATC TCC CAG 1918
565 Cys Gln Glu Cys Gly Arg Thr Phe Asn Asp Arg Ser Ala Ile Ser Gln 580
1919 CAC CTG AGG ACT CAC ACT GGC GCT AAG CCC TAC AAG TGT CAG GAC TGT 1966
581 His Leu Arg Thr His Thr Gly Ala Lys Pro Tyr Lys Cys Gln Asp Cys 596
1967 GGA AAA GCC TTC CGC CAG AGT TCC CAC CTC ATC AGA CAT CAG AGG ACT 2014
597 Gly Lys Ala Phe Arg Gln Ser Ser His Leu Ile Arg His Gln Arg Thr 612
2015 CAC ACC GGG GAG CGC CCA TAT GCA TGC AAC AAA TGT GGA AAG GCC TTC 2062
613 His Thr Gly Glu Arg Pro Tyr Ala Cys Asn Lys Cys Gly Lys Ala Phe 628
2063 ACC CAG AGC TCA CAC CTT ATT GGG CAC CAG AGA ACC CAC AAT AGG ACA 2110
629 Thr Gln Ser Ser His Leu Ile Gly His Gln Arg Thr His Asn Arg Thr 644
2111 AAG CGA AAG AAG AAA CAG CCT ACC TCA TAG CTC TCA AGC CAG TTG AAG 2158
645 Lys Arg Lys Lys Lys Gln Pro Thr Ser *** 654
2159 AAA CCT TGC CTT TTC AGC TTG ACC CTG CAA TAT AAC ATG CAC AGG CCT 2206
2207 GCT TGT GAA TCA GGA CTG AAT GTG AAA GGG AAG TAT TGA GTG AGG ACA 2254
2255 TTC CCA AAA CCA AAG GAC AAC TGA GGA GAC TGC CCA GCA CAT AAT GAA 2302
2303 TAA ATA AGA AAA TGA GTG AGG AGT TAT TAA CAT CAT TTG GAA AAA AGA 2350
2351 TTT CCC ATT CAC TTG ATA TTG TTT GTT CAC TCA TTT AGT CAT TAA AAG 2398
2399 TGA GAT TAA TAA AAT CTG AAA ATG TTA TAT AAT AAC TTT AAA AAG CCA 2446
2447 GGT AAT TAA TAA TCT GCA CTG ATA TTA CAT CCA CAG TAC CAC AGT ATT 2494
2495 TAT GTG TAT GAA TTA AGG ATT AAA AGA TAA TGT GGA TAA AAA AAA AAA 2542
2543 AAA A 2546
在本发明提及的所有文献都在本申请中引用作为参考,就如同每一篇文献被单独引用作为参考那样。此外应理解,在阅读了本发明的上述讲授内容之后,本领域技术人员可以对本发明作各种改动或修改,这些等价形式同样落于本申请所附权利要求书所限定的范围。
Claims (10)
1.一种分离的具有抑癌功能的人蛋白,其特征在于,它包含具有选自下组的氨基酸序列的多肽:SEQ ID NO:2、SEQ ID NO:5、SEQ ID NO:8、SEQ ID NO:11、SEQ ID NO:14、SEQ ID NO:17、SEQ ID NO:20。
2.如权利要求1所述的蛋白,其特征在于,该蛋白的氨基酸序列选自下组:SEQ ID NO:2、SEQ ID NO:5、SEQ ID NO:8、SEQ ID NO:11、SEQ ID NO:14、SEQ ID NO:17、SEQ ID NO:20。
3.一种分离的多核苷酸,其特征在于,它包含一核苷酸序列,该核苷酸序列选自下组:
(a)编码如权利要求1所述蛋白的多核苷酸;
(b)与多核苷酸(a)互补的多核苷酸。
4.如权利要求3所述的多核苷酸,其特征在于,该多核苷酸的序列选自下组:
SEQ ID NO:3、SEQ ID NO:6、SEQ ID NO:9、SEQ ID NO:12、SEQ ID NO:15、SEQ ID NO:18、SEQ ID NO:21的编码区序列。
5.如权利要求3所述的多核苷酸,其特征在于,该多核苷酸的序列选自下组:
SEQ ID NO:3、SEQ ID NO:6、SEQ ID NO:9、SEQ ID NO:12、SEQ ID NO:15、SEQ ID NO:18、SEQ ID NO:21的全长序列。
6.一种载体,其特征在于,它含有权利要求3所述的多核苷酸。
7.一种遗传工程化的宿主细胞,其特征在于,它是选自下组的一种宿主细胞:
(a)用权利要求6所述的载体转化或转导的宿主细胞;
(b)用权利要求3所述的多核苷酸转化或转导的宿主细胞。
8.一种具有抑癌功能的人蛋白活性的多肽的制备方法,其特征在于,该方法包含:
(a)在适合表达具有抑癌功能的人蛋白的条件下,培养权利要求7所述的宿主细胞;
(b)从培养物中分离出具有抑癌功能的人蛋白活性的多肽。
9.一种能与具有抑癌功能的人蛋白特异性结合的抗体,其中所述的具有抑癌功能的人蛋白具有选自下组的氨基酸序列:SEQ ID NO:2、SEQ ID NO:8、SEQ ID NO:11、SEQ IDNO:14、SEQ ID NO:17。
10.一种药物组合物,其特征在于,它含有安全有效量的权利要求1所述的蛋白以及药学上可接受的载体。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CNB001259008A CN1155614C (zh) | 2000-10-31 | 2000-10-31 | 具有抑制癌细胞生长功能的新的人蛋白及其编码序列 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CNB001259008A CN1155614C (zh) | 2000-10-31 | 2000-10-31 | 具有抑制癌细胞生长功能的新的人蛋白及其编码序列 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN1351079A CN1351079A (zh) | 2002-05-29 |
CN1155614C true CN1155614C (zh) | 2004-06-30 |
Family
ID=4591681
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CNB001259008A Expired - Fee Related CN1155614C (zh) | 2000-10-31 | 2000-10-31 | 具有抑制癌细胞生长功能的新的人蛋白及其编码序列 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN1155614C (zh) |
-
2000
- 2000-10-31 CN CNB001259008A patent/CN1155614C/zh not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
CN1351079A (zh) | 2002-05-29 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN1170850C (zh) | 人血管生成素样蛋白和编码序列及其用途 | |
CN1169954C (zh) | 编码具有抑制癌细胞生长功能的人蛋白的多核苷酸 | |
CN1155614C (zh) | 具有抑制癌细胞生长功能的新的人蛋白及其编码序列 | |
CN1209373C (zh) | 具有抑制癌细胞生长功能的新的人蛋白及其编码序列 | |
CN1169958C (zh) | 编码具有抑制癌细胞生长功能的人蛋白的多核苷酸 | |
CN1170848C (zh) | 新的人肝癌相关蛋白及其编码序列 | |
CN1194010C (zh) | 具有抑制癌细胞生长功能的人蛋白及基编码序列 | |
CN1177864C (zh) | 在肝癌组织中具有表达差异的新的人蛋白及其编码序列 | |
CN1199998C (zh) | 具有抑制癌细胞生长功能的新的人蛋白及其编码序列 | |
CN1177048C (zh) | 编码具有抑制癌细胞生长功能的人蛋白的多核苷酸 | |
CN1194989C (zh) | 具有抑制癌细胞生长功能的新的人蛋白及其编码序列 | |
CN1155615C (zh) | 具有抑制癌细胞生长功能的新的人蛋白及其编码序列 | |
CN1177049C (zh) | 编码具有抑制癌细胞生长功能的人蛋白的多核苷酸 | |
CN1160370C (zh) | 新的人细胞周期控制相关蛋白及其编码序列 | |
CN1166686C (zh) | 具有抑制癌细胞生长功能的人蛋白及其编码序列 | |
CN1155616C (zh) | 具有促进癌细胞生长功能的新的人蛋白及其编码序列 | |
CN1193040C (zh) | 具有抑制癌细胞生长功能的人蛋白及其编码序列 | |
CN1209374C (zh) | 具有促进3t3细胞转化功能的新的人蛋白及其编码序列 | |
CN1190446C (zh) | 具有促进小鼠nih/3t3细胞转化功能的新的人蛋白及其编码序列 | |
CN1199997C (zh) | 具有促进小鼠nih/3t3细胞转化功能的新的人蛋白及其编码序列 | |
CN1169955C (zh) | 编码具有抑制癌细胞生长功能的人蛋白的多核苷酸 | |
CN1199996C (zh) | 具有抑制癌细胞生长功能的新的人蛋白及其编码序列 | |
CN1199994C (zh) | 具有抑制癌细胞生长功能的新的人蛋白及其编码序列 | |
CN1169831C (zh) | 具有抑制癌细胞生长功能的新的人蛋白及其编码序列 | |
CN1199999C (zh) | 具有促进3t3细胞转化功能的新的人蛋白及其编码序列 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
C19 | Lapse of patent right due to non-payment of the annual fee | ||
CF01 | Termination of patent right due to non-payment of annual fee |